JP2020154513A - Apparatus, method and program for determination - Google Patents
Apparatus, method and program for determination Download PDFInfo
- Publication number
- JP2020154513A JP2020154513A JP2019050865A JP2019050865A JP2020154513A JP 2020154513 A JP2020154513 A JP 2020154513A JP 2019050865 A JP2019050865 A JP 2019050865A JP 2019050865 A JP2019050865 A JP 2019050865A JP 2020154513 A JP2020154513 A JP 2020154513A
- Authority
- JP
- Japan
- Prior art keywords
- classes
- classifiers
- data
- input data
- class
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
本発明は、判定装置、判定方法及び判定プログラムに関する。 The present invention relates to a determination device, a determination method, and a determination program.
従来、入力データを2以上のクラスに分類する分類器が用いられている。分類器として、例えば、決定木やロジスティック回帰、サポートベクターマシン等が知られている。 Conventionally, a classifier that classifies input data into two or more classes has been used. As a classifier, for example, a decision tree, logistic regression, a support vector machine, and the like are known.
下記非特許文献1は、サポートベクターマシンの解説記事である。
The following Non-Patent
分類器は、単体で用いた場合、共通の特徴を有するデータの分類が困難な場合がある。そのため、複数の分類器を階層的に用いてデータの分類を行うことがあるが、階層毎に適切な分類器を設定する必要があり、データに関する知見を有しなければ適切な分類器を設定することが困難な場合がある。 When the classifier is used alone, it may be difficult to classify data having common characteristics. Therefore, data may be classified using multiple classifiers hierarchically, but it is necessary to set an appropriate classifier for each layer, and if you do not have knowledge about the data, set an appropriate classifier. It can be difficult to do.
そこで、本発明は、データに関する知見を有しなくても、データがいずれのクラスに属するかをより精度良く判定することのできる判定装置、判定方法及び判定プログラムを提供する。 Therefore, the present invention provides a determination device, a determination method, and a determination program capable of more accurately determining which class the data belongs to without having knowledge about the data.
本発明の一態様に係る判定装置は、入力データを複数のクラスのうちの2以上のクラスに分類する値をそれぞれ出力する複数の分類器と、複数の分類器の複数の出力値をそれぞれ閾値と比較して、複数の分類器ごとに、2以上のクラスのうちいずれか1つに投票又は2以上のクラス全てに投票若しくは2以上のクラスいずれにも投票しない投票部と、複数のクラスごとの得票数に基づいて、入力データが複数のクラスのうちいずれに分類されるか判定する判定部と、を備える。 The determination device according to one aspect of the present invention has a plurality of classifiers that output values for classifying input data into two or more classes among a plurality of classes, and a plurality of output values of the plurality of classifiers as threshold values. In comparison with multiple classifiers, a voting department that votes for any one of two or more classes, votes for all two or more classes, or does not vote for any of two or more classes, and for each of multiple classes It is provided with a determination unit for determining which of a plurality of classes the input data is classified based on the number of votes obtained.
この態様によれば、入力データが2以上のクラスのうちいずれか1つに属すると確定できない場合に、2以上のクラス全てに投票若しくは2以上のクラスいずれにも投票しないことで、誤分類を防止して、入力データがいずれのクラスに属するかをより精度良く判定することができる。 According to this aspect, if it cannot be determined that the input data belongs to any one of the two or more classes, the misclassification is made by voting for all the two or more classes or not voting for either of the two or more classes. By preventing this, it is possible to more accurately determine which class the input data belongs to.
上記態様において、入力データは、時系列データであり、複数の分類器は、時系列データの複数の時点における値をそれぞれ2以上のクラスに分類する複数の出力値を出力してもよい。 In the above aspect, the input data is time series data, and the plurality of classifiers may output a plurality of output values for classifying the values of the time series data at a plurality of time points into two or more classes.
この態様によれば、時系列データの複数の時点における値に関する分類器の出力値を用いて投票を行い、時系列データが2以上のクラスのうちいずれに分類されるか判定することができる。 According to this aspect, voting can be performed using the output values of the classifier regarding the values of the time series data at a plurality of time points, and it can be determined which of the two or more classes the time series data is classified into.
上記態様において、投票部は、得票数が上位所定割合であるクラスが2以上ある場合に、当該2以上のクラスに対応する出力値を出力した分類器を抽出し、抽出した分類器それぞれの出力値を閾値と比較して、2以上のクラスのうちいずれか1つに再投票又は2以上のクラス全てに再投票若しくは2以上のクラスいずれにも再投票せず、判定部は、再投票された複数のクラスごとの得票数に基づいて、入力データが複数のクラスのうちいずれに分類されるか判定してもよい。 In the above aspect, when there are two or more classes in which the number of votes obtained is a high-ranking predetermined ratio, the voting unit extracts a classifier that outputs an output value corresponding to the two or more classes, and outputs each of the extracted classifiers. The value is compared to the threshold and the verdict is revoted without revoting any one of the two or more classes, revoting all of the two or more classes, or revoting any of the two or more classes. Based on the number of votes obtained for each of the plurality of classes, it may be determined which of the plurality of classes the input data is classified into.
この態様によれば、得票数が上位所定割合であるクラスが2以上あり、入力データが当該クラスのうちいずれに分類されるか確定できない場合に、当該クラスに対応する出力値を出力した分類器によって再投票を行い、入力データがいずれのクラスに属するかをより精度良く判定することができる。 According to this aspect, when there are two or more classes in which the number of votes obtained is a high-ranking predetermined ratio and it is not possible to determine which of the classes the input data is classified into, the classifier that outputs the output value corresponding to the class. It is possible to re-vote by and more accurately determine which class the input data belongs to.
上記態様において、複数の分類器は、2以上のクラスそれぞれについて1の代表データを含む学習データを用いて学習された複数のサポートベクターマシンを含んでもよい。 In the above embodiment, the plurality of classifiers may include a plurality of support vector machines trained using training data including one representative data for each of two or more classes.
この態様によれば、各クラスについて少なくとも1つの学習データを用意することで、複数の分類器を構築することができる。 According to this aspect, a plurality of classifiers can be constructed by preparing at least one learning data for each class.
上記態様において、閾値は、複数の分類器毎に設定されていてもよい。 In the above aspect, the threshold value may be set for each of a plurality of classifiers.
この態様によれば、複数の分類器により用いられる特徴空間に適した閾値を設定することができ、入力データがいずれのクラスに属するかをより精度良く判定することができる。 According to this aspect, it is possible to set a threshold value suitable for the feature space used by a plurality of classifiers, and it is possible to more accurately determine which class the input data belongs to.
上記態様において、閾値は、学習データを用いて複数の分類器の学習処理を行う場合に、複数の分類器が誤分類した学習データに関する出力値に基づいて設定されていてもよい。 In the above aspect, the threshold value may be set based on the output value of the learning data misclassified by the plurality of classifiers when the learning process of the plurality of classifiers is performed using the learning data.
この態様によれば、複数の分類器が誤分類し得るデータを、2以上のクラスのうちいずれか1つに属すると確定できないデータとして扱うことができ、入力データがいずれのクラスに属するかをより精度良く判定することができる。 According to this aspect, data that can be misclassified by a plurality of classifiers can be treated as data that cannot be determined if it belongs to any one of two or more classes, and which class the input data belongs to can be determined. The judgment can be made more accurately.
本発明の他の態様に係る判定方法は、判定装置に、複数の分類器によって、入力データを複数のクラスのうちの2以上のクラスに分類する値をそれぞれ出力することと、複数の分類器の複数の出力値をそれぞれ閾値と比較して、複数の分類器ごとに、2以上のクラスのうちいずれか1つに投票又は2以上のクラス全てに投票若しくは2以上のクラスいずれにも投票しないことと、複数の分類器ごとの得票数に基づいて、入力データが複数のクラスのうちいずれに分類されるか判定することと、を実行させる判定方法。 The determination method according to another aspect of the present invention is to output to the determination device a value for classifying the input data into two or more classes out of a plurality of classes by a plurality of classifiers, and a plurality of classifiers. Compare multiple output values of each with the threshold, and vote for any one of two or more classes, vote for all two or more classes, or vote for none of two or more classes for each classifier. A determination method for executing the determination of which of a plurality of classes the input data is classified based on the number of votes obtained for each of a plurality of classifiers.
この態様によれば、入力データが2以上のクラスのうちいずれか1つに属すると確定できない場合に、2以上のクラス全てに投票若しくは2以上のクラスいずれにも投票しないことで、誤分類を防止して、入力データがいずれのクラスに属するかをより精度良く判定することができる。 According to this aspect, if it cannot be determined that the input data belongs to any one of the two or more classes, the misclassification is made by voting for all the two or more classes or not voting for either of the two or more classes. By preventing this, it is possible to more accurately determine which class the input data belongs to.
本発明の他の態様に係る判定プログラムは、判定装置に、複数の分類器によって、入力データを複数のクラスのうちの2以上のクラスに分類する値をそれぞれ出力することと、複数の分類器の複数の出力値をそれぞれ閾値と比較して、複数の分類器ごとに、2以上のクラスのうちいずれか1つに投票又は2以上のクラス全てに投票若しくは2以上のクラスいずれにも投票しないことと、複数のクラスごとの得票数に基づいて、入力データが複数のクラスのうちいずれに分類されるか判定することと、を実行させる判定プログラム。 The determination program according to another aspect of the present invention outputs to the determination device a value for classifying the input data into two or more classes out of a plurality of classes by a plurality of classifiers, and a plurality of classifiers. Compare multiple output values of each with the threshold, and for each of the multiple classifiers, vote for any one of the two or more classes, vote for all the two or more classes, or do not vote for any of the two or more classes. A determination program that executes the determination of which of the plurality of classes the input data is classified based on the number of votes obtained for each of the plurality of classes.
この態様によれば、入力データが2以上のクラスのうちいずれか1つに属すると確定できない場合に、2以上のクラス全てに投票若しくは2以上のクラスいずれにも投票しないことで、誤分類を防止して、入力データがいずれのクラスに属するかをより精度良く判定することができる。 According to this aspect, if it cannot be determined that the input data belongs to any one of the two or more classes, the misclassification is made by voting for all the two or more classes or not voting for either of the two or more classes. By preventing this, it is possible to more accurately determine which class the input data belongs to.
本発明によれば、データに関する知見を有しなくても、データがいずれのクラスに属するかをより精度良く判定することのできる判定装置、判定方法及び判定プログラムを提供することができる。 According to the present invention, it is possible to provide a determination device, a determination method, and a determination program capable of more accurately determining which class the data belongs to without having knowledge about the data.
添付図面を参照して、本発明の実施形態について説明する。なお、各図において、同一の符号を付したものは、同一又は同様の構成を有する。 Embodiments of the present invention will be described with reference to the accompanying drawings. In each figure, those having the same reference numerals have the same or similar configurations.
図1は、本発明の実施形態に係る判定装置10の機能ブロックを示す図である。判定装置10は、複数の分類器11と、投票部12と、スイッチ13と、判定部14と、分岐部15とを備える。
FIG. 1 is a diagram showing a functional block of the
複数の分類器11は、入力データ(Data input)を複数のクラスのうち2以上のクラスに分類する値をそれぞれ出力する。本実施形態では、複数の分類器11は、2以上のクラスそれぞれについて1の代表データを含む学習データを用いて学習された複数のサポートベクターマシンを含む。本例では、入力データが第1クラスから第9クラスのいずれに属するか判定する場合、すなわち複数のクラスが第1クラスから第9クラスである場合について説明する。
The plurality of
本実施形態では、複数の分類器11は、入力データが第1クラス(Class1)に属するか、第2クラス(Class2)に属するか、そのいずれでもないか分類する第1サポートベクターマシン(SVM Classifier Class1 vs Class2)を含む。同様に、複数の分類器11は、入力データが第1クラス(Class1)に属するか、第3クラス(Class3)に属するか、そのいずれでもないか分類する第2サポートベクターマシン(SVM Classifier Class1 vs Class3)を含む。また、複数の分類器11は、入力データが第1クラス(Class1)に属するか、第4クラス(Class4)に属するか、そのいずれでもないか分類する第3サポートベクターマシン(SVM Classifier Class1 vs Class4)を含む。以降、同様に、複数の分類器11は、第4サポートベクターマシンから第35サポートベクターマシンを含み、最後に、複数の分類器11は、入力データが第8クラス(Class8)に属するか、第9クラス(Class9)に属するか、そのいずれでもないか分類する第36サポートベクターマシン(SVM Classifier Class8 vs Class8)を含む。
In the present embodiment, the plurality of
なお、本実施形態では、複数の分類器11それぞれによって、入力データがクラスAに属するかクラスBに属するかの分類を行う場合について説明するが、複数の分類器11は、入力データがあるクラスに属するか、それ以外のクラスに属するか分類するものであってもよい。
In this embodiment, a case where the input data belongs to the class A or the class B is classified by each of the plurality of
複数の分類器11をサポートベクターマシンで構成することで、各クラスについて少なくとも1つの学習データを用意することで、複数の分類器を構築することができる。もっとも、複数の分類器11は、任意の2値分類器で構成されてよく、ロジスティック回帰、決定木又は回帰木を用いた分類器を含んでもよい。
By configuring the plurality of
投票部12は、複数の分類器11の複数の出力値をそれぞれ閾値と比較して、複数の分類器11ごとに、2以上のクラスのうちいずれか1つに投票又は2以上のクラス全てに投票若しくは2以上のクラスいずれにも投票しない。具体的には、投票部12は、第1サポートベクターマシンの出力値f(x)を閾値Th1+(x)及びTh1-(x)と比較して、f(x)>Th1+(x)であれば第1クラス(Class1)に投票し、f(x)<Th1-(x)であれば第2クラス(Class2)に投票し、Th1+(x)≧f(x)≧Th1-(x)であれば第1クラス(Class1)及び第2クラス(Class2)に投票する。また、投票部12は、第2サポートベクターマシンの出力値f(x)を閾値Th2+(x)及びTh2-(x)と比較して、f(x)>Th2+(x)であれば第1クラス(Class1)に投票し、f(x)<Th2-(x)であれば第3クラス(Class3)に投票し、Th2+(x)≧f(x)≧Th2-(x)であれば第1クラス(Class1)及び第3クラス(Class3)に投票する。同様に、投票部12は、第3サポートベクターマシンの出力値f(x)を閾値Th3+(x)及びTh3-(x)と比較して、f(x)>Th3+(x)であれば第1クラス(Class1)に投票し、f(x)<Th3-(x)であれば第4クラス(Class4)に投票し、Th3+(x)≧f(x)≧Th3-(x)であれば第1クラス(Class1)及び第4クラス(Class4)に投票する。さらに、投票部12は、第36サポートベクターマシンの出力値f(x)を閾値Th36+(x)及びTh36-(x)と比較して、f(x)>Th36+(x)であれば第8クラス(Class8)に投票し、f(x)<Th36-(x)であれば第9クラス(Class9)に投票し、Th36+(x)≧f(x)≧Th36-(x)であれば第8クラス(Class8)及び第9クラス(Class9)に投票する。
The
なお、本実施形態では、入力データが2以上のクラスのうちいずれか1つに属すると確定できない場合に、2以上のクラス全てに投票することとしているが、2以上のクラスいずれにも投票しないという処理であってもよい。例えば、投票部12は、第1サポートベクターマシンの出力値f(x)を閾値Th1+(x)及びTh1-(x)と比較して、f(x)>Th1+(x)であれば第1クラス(Class1)に投票し、f(x)<Th1-(x)であれば第2クラス(Class2)に投票し、Th1+(x)≧f(x)≧Th1-(x)であればいずれにも投票しないという処理を行ってもよい。
In the present embodiment, when it cannot be determined that the input data belongs to any one of the two or more classes, all the two or more classes are voted, but none of the two or more classes is voted. It may be the process. For example,
スイッチ13は、後述する再投票処理の際に、抽出された分類器に関する投票を判定部14に伝え、それ以外の分類器に関する投票を遮断する。初回の投票時には、スイッチ13は、全ての分類器についてオンであってよい。
The
判定部14は、複数のクラスごとの得票数に基づいて、入力データが複数のクラスのうちいずれに分類されるか判定する。判定部14は、複数の分類器11に関する投票の得票数を合計して複数のクラスごとの得票数を算出し、入力データが、最多投票数を得たクラスに分類されると判定してよい。ただし、得票数が上位所定割合であるクラスが2以上ある場合、後述する再投票処理が行われてよい。ここで、上位所定割合は、例えば上位5%であったり、上位1%であったりしてよい。
The
分岐部15は、得票数に基づいて、入力データが複数のクラスのうちいずれに分類されるか判定された場合(ケース2)、特定されたクラス(Identified class)を出力する。また、分岐部15は、得票数が上位所定割合であるクラスが2以上ある場合(ケース1)、スイッチ13のオン・オフを制御して、得票数が上位所定割合である2以上のクラスに対応する出力値を出力した分類器を抽出してよい。
The branching
本実施形態に係る判定装置10は、入力データが2以上のクラスのうちいずれか1つに属すると確定できない場合に、2以上のクラス全てに投票若しくは2以上のクラスいずれにも投票しないことで、誤分類を防止して、入力データがいずれのクラスに属するかをより精度良く判定することができる。
When the
図1に示すように、閾値は、複数の分類器11毎に設定されていてよい。複数の分類器11毎に閾値を設定することで、複数の分類器11により用いられる特徴空間に適した閾値を設定することができ、入力データがいずれのクラスに属するかをより精度良く判定することができる。
As shown in FIG. 1, the threshold value may be set for each of the plurality of
なお、複数の分類器11には、リサンプリングや各次元の数値に対する規格化等を入力データに施してフォーマット化したデータが入力されてよい。もっとも、複数の分類器11には、入力データが直接入力されてもよい。
Note that the plurality of
図2は、本実施形態に係る判定装置10の物理的構成を示す図である。判定装置10は、演算部に相当するCPU(Central Processing Unit)10aと、記憶部に相当するRAM(Random Access Memory)10bと、記憶部に相当するROM(Read only Memory)10cと、通信部10dと、入力部10eと、表示部10fと、を有する。これらの各構成は、バスを介して相互にデータ送受信可能に接続される。なお、本例では判定装置10が一台のコンピュータで構成される場合について説明するが、判定装置10は、複数のコンピュータが組み合わされて実現されてもよい。また、図2で示す構成は一例であり、判定装置10はこれら以外の構成を有してもよいし、これらの構成のうち一部を有しなくてもよい。
FIG. 2 is a diagram showing a physical configuration of the
CPU10aは、RAM10b又はROM10cに記憶されたプログラムの実行に関する制御やデータの演算、加工を行う制御部である。CPU10aは、入力データが複数のクラスのうちいずれに分類されるか判定するプログラム(判定プログラム)を実行する演算部である。CPU10aは、入力部10eや通信部10dから種々のデータを受け取り、データの演算結果を表示部10fに表示したり、RAM10bやROM10cに格納したりする。
The
RAM10bは、記憶部のうちデータの書き換えが可能なものであり、例えば半導体記憶素子で構成されてよい。RAM10bは、CPU10aが実行するプログラム、学習データといったデータを記憶してよい。なお、これらは例示であって、RAM10bには、これら以外のデータが記憶されていてもよいし、これらの一部が記憶されていなくてもよい。
The
ROM10cは、記憶部のうちデータの読み出しが可能なものであり、例えば半導体記憶素子で構成されてよい。ROM10cは、例えば判定プログラムや、書き換えが行われないデータを記憶してよい。
The
通信部10dは、判定装置10を他の機器に接続するインターフェースである。通信部10dは、インターネット等の通信ネットワークに接続されてよい。
The communication unit 10d is an interface for connecting the
入力部10eは、ユーザからデータの入力を受け付けるものであり、例えば、キーボード及びタッチパネルを含んでよい。
The
表示部10fは、CPU10aによる演算結果を視覚的に表示するものであり、例えば、LCD(Liquid Crystal Display)により構成されてよい。表示部10fは、例えば、分類器の学習結果を表示してよい。
The
判定プログラムは、RAM10bやROM10c等のコンピュータによって読み取り可能な記憶媒体に記憶されて提供されてもよいし、通信部10dにより接続される通信ネットワークを介して提供されてもよい。判定装置10では、CPU10aが判定プログラムを実行することにより、複数の分類器11、投票部12、スイッチ13、判定部14及び分岐部15等の様々な動作が実現される。なお、これらの物理的な構成は例示であって、必ずしも独立した構成でなくてもよい。例えば、判定装置10は、CPU10aとRAM10bやROM10cが一体化したLSI(Large-Scale Integration)を備えていてもよい。
The determination program may be stored in a storage medium readable by a computer such as
図3は、本実施形態に係る学習装置により実行される閾値設定処理の概要を示す図である。ここで、学習装置は、判定装置10と別対のコンピュータで構成されてよいが、判定装置10と一体で構成されてもよい。本実施形態において、入力データは、時系列データであり、複数の分類器11は、時系列データの複数の時点における値をそれぞれ2以上のクラスに分類する複数の出力値を出力する。図3では、ある分類器11にクラスAに属する時系列データを入力した場合の出力値f(x)を示した第1グラフG1と、同じ分類器11にクラスBに属する時系列データを入力した場合の出力値f(x)を示した第2グラフG2と、それらの出力値に基づいて設定された閾値Thi+(x),Thj-(x)を示す第3グラフG3と、を図示している。なお、入力データは、時系列データに限定されず、任意の次元のデータであってよい。
FIG. 3 is a diagram showing an outline of the threshold value setting process executed by the learning device according to the present embodiment. Here, the learning device may be configured by a computer paired with the
第1グラフG1及び第2グラフG2に示すように、時系列データは、所定の時間間隔でサンプリングされて分類器11に入力され、その出力値f(x)が得られる。なお、第1グラフG1、第2グラフG2及び第3グラフG3では、横軸にデータ番号を示しており、データ番号は、時系列データを所定の時間間隔で分割した場合に時系列順に付された連続番号である。
As shown in the first graph G1 and the second graph G2, the time series data is sampled at a predetermined time interval and input to the
判定装置10は、時系列データを所定の時間間隔でサンプリングした値を分類器11によってそれぞれ分類し、その出力値を閾値と比較して投票処理を行い、得票数に基づいて、時系列データが全体としていずれのクラスに属するか判定する。このように、時系列データの複数の時点における値に関する分類器11の出力値を用いて投票を行い、時系列データが2以上のクラスのうちいずれに分類されるか判定することができる。
The
第1グラフG1及び第2グラフG2において、出力値f(x)が負の場合がクラスAに対応し、出力値f(x)が正の場合がクラスBに対応している。そのため、第1グラフG1では、データ点P1が誤ってクラスBと判定されるデータとなっている。また、第2グラフG2では、データ点P2が誤ってクラスAと判定されるデータとなっている。 In the first graph G1 and the second graph G2, when the output value f (x) is negative, it corresponds to class A, and when the output value f (x) is positive, it corresponds to class B. Therefore, in the first graph G1, the data point P1 is erroneously determined to be class B. Further, in the second graph G2, the data point P2 is erroneously determined to be class A.
閾値を設定する学習装置は、誤判定されたデータ点P1の値を閾値Thi+(x)に設定し、誤判定されたデータ点P2の値を閾値Thj-(x)に設定してよい。ここで、i及びjは、データ番号を表す。また、学習装置は、誤判定しなかったデータ点について、閾値を0に設定してよい。このように、学習装置は、データ点毎に閾値を設定してよい。もっとも、学習装置は、複数のデータ点に共通の閾値を設定してもよい。例えば、学習装置は、データ点P1の最大値及びデータ点P2の最小値を共通の閾値に設定してもよい。その場合、Thi+(x)は、全てのiについてデータ点P1の最大値となり、Thj-(x)は、全てのjについてデータ点P2の最小値となる。 The learning device that sets the threshold value may set the value of the erroneously determined data point P1 to the threshold value Thi + (x) and set the value of the erroneously determined data point P2 to the threshold value Thj − (x). Here, i and j represent data numbers. Further, the learning device may set the threshold value to 0 for the data points that have not been erroneously determined. In this way, the learning device may set a threshold value for each data point. However, the learning device may set a common threshold value for a plurality of data points. For example, the learning device may set the maximum value of the data point P1 and the minimum value of the data point P2 to a common threshold value. In that case, Thi + (x) becomes the maximum value of the data point P1 for all i, Thj - (x) is a minimum value of the data point P2 for all j.
本実施形態において、閾値は、学習データを用いて複数の分類器11の学習処理を行う場合に、複数の分類器11が誤分類した学習データに関する出力値に基づいて設定されている。本例の場合、複数の分類器11が誤分類した学習データは、データ点P1及びデータ点P2である。このようにして、複数の分類器11が誤分類し得るデータを、2以上のクラスのうちいずれか1つに属すると確定できないデータとして扱うことができ、入力データがいずれのクラスに属するかをより精度良く判定することができる。
In the present embodiment, the threshold value is set based on the output value related to the learning data misclassified by the plurality of
図4は、本実施形態に係る学習装置により実行される学習処理及び閾値設定処理のフローチャートである。学習処理において、学習装置は、はじめに、リファレンス波形の選定を行う(S1)。リファレンス波形の選定は、予め収集した時系列データの中から、特定のクラスを代表するデータを選定することで行われてよい。 FIG. 4 is a flowchart of the learning process and the threshold value setting process executed by the learning device according to the present embodiment. In the learning process, the learning device first selects a reference waveform (S1). The reference waveform may be selected by selecting data representing a specific class from the time series data collected in advance.
次に、学習装置は、リファレンス波形の学習フォーマット化を行い(S2)、フォーマット化したリファレンス波形を学習データD1として記憶する。学習フォーマット化は、公知のデータ前処理を適用することで行われてよい。例えば、学習フォーマット化は、リサンプリングや各次元の数値に対する規格化等をリファレンス波形に施すことで行ってよい。 Next, the learning device performs learning formatting of the reference waveform (S2), and stores the formatted reference waveform as learning data D1. The learning formatting may be performed by applying a known data preprocessing. For example, learning formatting may be performed by applying resampling, normalization for numerical values of each dimension, or the like to the reference waveform.
最後に、学習装置は、SVM(Support Vector Machine)の機械学習を行い(S3)、生成された学習モデルD2を記憶する。ここで、サポートベクターマシンの機械学習は、マージン最大化を行うようにサポートベクターを選ぶ公知の学習処理によって行われてよい。また、学習モデルD2は、複数の分類器11を含んでよい。
Finally, the learning device performs machine learning of SVM (Support Vector Machine) (S3) and stores the generated learning model D2. Here, the machine learning of the support vector machine may be performed by a known learning process that selects the support vector so as to maximize the margin. Further, the learning model D2 may include a plurality of
閾値設定処理において、学習装置は、はじめに、学習モデルによって学習データを分類する(S4)。ここで、学習データD1及び学習モデルD2が参照される。 In the threshold setting process, the learning device first classifies the learning data according to the learning model (S4). Here, the learning data D1 and the learning model D2 are referred to.
そして、学習装置は、学習モデルによる分類結果が正しいか確認する(S5)。分類結果の正誤は、学習データD1とあわせて生成された正答値D3を参照して確認される。学習装置は、誤分類時の学習モデルの出力値D4を記憶し、その最大値及び最小値によって閾値D5を設定する。以上により、学習処理及び閾値設定処理が終了する。 Then, the learning device confirms whether the classification result by the learning model is correct (S5). The correctness of the classification result is confirmed by referring to the correct answer value D3 generated together with the learning data D1. The learning device stores the output value D4 of the learning model at the time of misclassification, and sets the threshold value D5 according to the maximum value and the minimum value thereof. As a result, the learning process and the threshold setting process are completed.
図5は、本実施形態に係る判定装置10により実行される投票処理のフローチャートである。はじめに、判定装置10は、時系列データを分割した値xを取得する(S10)。そして、判定装置10は、複数の分類器11に値xを入力し、その出力値がThi+(x)≧f(x)≧Thi-(x)を満たすか否かを判定する(S11)。
FIG. 5 is a flowchart of a voting process executed by the
出力値がThi+(x)≧f(x)≧Thi-(x)を満たす場合(S11:YES)、判定装置10は、クラスA及びBに投票する。すなわち、2以上のクラス全てに投票する。
Output value Thi + (x) ≧ f ( x) ≧ Thi - if satisfying (x) (S11: YES) , the
一方、出力値がThi+(x)≧f(x)≧Thi-(x)を満たさない場合(S11:NO)、判定装置10は、出力値がf(x)>Thi+(x)を満たすか否かを判定する(S13)。出力値がf(x)>Thi+(x)を満たす場合(S13:YES)、判定装置10は、クラスAに投票する。一方、出力値がf(x)>Thi+(x)を満たさない場合(S13:No)、すなわち出力値がThi-(x)>f(x)を満たす場合、判定装置10は、クラスBに投票する(S15)。
On the other hand, the output value Thi + (x) ≧ f ( x) ≧ Thi - is not satisfied (x) (S11: NO) , the
その後、判定装置10は、投票処理を全ての分類器11について完了したか否かを判定し(S16)、全ての分類器11について投票処理が完了していない場合(S16:NO)、処理S11〜S15を残りの分類器11について実行する。
After that, the
一方、投票処理を全ての分類器11について完了した場合(S16:YES)、判定装置10は、時系列データを分割して得られる全データについて投票処理が完了したか否かを判定し(S17)、全データについて投票処理が完了していない場合(S17:NO)、処理S11〜S16を残りのデータについて実行する。
On the other hand, when the voting process is completed for all the classifiers 11 (S16: YES), the
一方、全データについて投票処理が完了した場合(S17:YES)、判定装置10は、クラス毎に得票数を合算する(S18)。以降、次図に示す判定処理に続く。
On the other hand, when the voting process for all the data is completed (S17: YES), the
図6は、本実施形態に係る判定装置10により実行される判定処理のフローチャートである。判定装置10は、投票が一回目であるか否かを判定する(S20)。投票が一回目である場合(S20:YES)、判定装置10は、得票数が上位所定割合であるクラスが2以上あるか否かを判定する(S21)。得票数が上位所定割合であるクラスが2以上ない場合(S21:NO)、判定装置10は、得票数最多のクラスを判定結果として出力する(S22)。一方、得票数が上位所定割合であるクラスが2以上ある場合(S21:YES)、判定装置10は、当該2以上のクラスに対応する出力値を出力した分類器11を抽出する(S23)。そして、抽出した分類器11について、図5に示す処理S10〜S18を実行し、再投票処理を行う。
FIG. 6 is a flowchart of the determination process executed by the
判定装置10の投票部12は、得票数が上位所定割合であるクラスが2以上ある場合に、当該2以上のクラスに対応する出力値を出力した分類器11を抽出し、抽出した分類器11それぞれの出力値を閾値と比較して、2以上のクラスのうちいずれか1つに再投票又は2以上のクラス全てに再投票若しくは2以上のクラスいずれにも再投票せず、判定部14は、再投票された複数のクラスごとの得票数に基づいて、入力データが複数のクラスのうちいずれに分類されるか判定してよい。このようにして、得票数が上位所定割合であるクラスが2以上あり、入力データが当該クラスのうちいずれに分類されるか確定できない場合に、当該クラスに対応する出力値を出力した分類器11によって再投票を行い、入力データがいずれのクラスに属するかをより精度良く判定することができる。
The
投票が一回目でない場合(S20:NO)、すなわち再投票の場合、判定装置10は、得票数が上位所定割合であるクラスが前回投票と同一であるか否かを判定する(S24)。得票数が上位所定割合であるクラスが前回投票と同一でない場合(S24:NO)、判定装置10は、再投票の得票数について、処理S21〜S23を実行する。
When the vote is not the first time (S20: NO), that is, when the vote is re-voted, the
一方、得票数が上位所定割合であるクラスが前回投票と同一である場合(S24:YES)、判定装置10は、各クラスの学習データと入力データの差分の総和を算出する(S25)。そして、判定装置10は、得票数が上位所定割合であるクラスについて差分の総和が等しいか否かを判定する(S26)。差分の総和が等しくない場合(S26:NO)、判定装置10は、差分の総和が小さいクラスを判定結果として出力する(S27)。一方、差分の総和が等しい場合(S26:YES)、判定装置10は、得票数が上位所定割合である2以上のクラスのうち順番が若いクラスを判定結果として出力する(S28)。以上により、判定処理が終了する。
On the other hand, when the class in which the number of votes obtained is the highest predetermined ratio is the same as the previous vote (S24: YES), the
以上説明した実施形態は、本発明の理解を容易にするためのものであり、本発明を限定して解釈するためのものではない。実施形態が備える各要素並びにその配置、材料、条件、形状及びサイズ等は、例示したものに限定されるわけではなく適宜変更することができる。また、異なる実施形態で示した構成同士を部分的に置換し又は組み合わせることが可能である。 The embodiments described above are for facilitating the understanding of the present invention, and are not for limiting and interpreting the present invention. Each element included in the embodiment and its arrangement, material, condition, shape, size, etc. are not limited to those exemplified, and can be changed as appropriate. In addition, the configurations shown in different embodiments can be partially replaced or combined.
10…判定装置、10a…CPU、10b…RAM、10c…ROM、10d…通信部、10e…入力部、10f…表示部、11…分類器、12…投票部、13…スイッチ、14…判定部、15…分岐部 10 ... Judgment device, 10a ... CPU, 10b ... RAM, 10c ... ROM, 10d ... Communication unit, 10e ... Input unit, 10f ... Display unit, 11 ... Classifier, 12 ... Voting unit, 13 ... Switch, 14 ... Judgment unit , 15 ... Branch
Claims (8)
前記複数の分類器の複数の出力値をそれぞれ閾値と比較して、前記複数の分類器ごとに、前記2以上のクラスのうちいずれか1つに投票又は前記2以上のクラス全てに投票若しくは前記2以上のクラスいずれにも投票しない投票部と、
前記複数のクラスごとの得票数に基づいて、前記入力データが前記複数のクラスのうちいずれに分類されるか判定する判定部と、
を備える判定装置。 Multiple classifiers that output values that classify input data into two or more classes out of multiple classes,
The plurality of output values of the plurality of classifiers are compared with the threshold values, and each of the plurality of classifiers is voted for any one of the two or more classes, or for all of the two or more classes, or the above. A voting department that does not vote for any of two or more classes,
A determination unit that determines which of the plurality of classes the input data is classified based on the number of votes obtained for each of the plurality of classes.
Judgment device including.
前記複数の分類器は、前記時系列データの複数の時点における値をそれぞれ前記2以上のクラスに分類する複数の出力値を出力する、
請求項1に記載の判定装置。 The input data is time series data and
The plurality of classifiers output a plurality of output values that classify the values of the time series data at a plurality of time points into the two or more classes.
The determination device according to claim 1.
前記判定部は、前記再投票された前記複数のクラスごとの得票数に基づいて、前記入力データが前記複数のクラスのうちいずれに分類されるか判定する、
請求項1又は2に記載の判定装置。 When there are two or more classes in which the number of votes obtained is a high-ranking predetermined ratio, the voting unit extracts a classifier that outputs an output value corresponding to the two or more classes, and outputs the output value of each of the extracted classifiers. Compared to the threshold, do not re-vote any one of the two or more classes, re-vote all of the two or more classes, or re-vote either of the two or more classes.
The determination unit determines which of the plurality of classes the input data is classified based on the number of votes obtained for each of the plurality of classes that have been re-voted.
The determination device according to claim 1 or 2.
請求項1から3のいずれか一項に記載の判定装置。 The plurality of classifiers include a plurality of support vector machines trained using training data including one representative data for each of the two or more classes.
The determination device according to any one of claims 1 to 3.
請求項1から4のいずれか一項に記載の判定装置。 The threshold value is set for each of the plurality of classifiers.
The determination device according to any one of claims 1 to 4.
請求項1から5のいずれか一項に記載の判定装置。 The threshold value is set based on the output value of the learning data misclassified by the plurality of classifiers when the learning process of the plurality of classifiers is performed using the training data.
The determination device according to any one of claims 1 to 5.
複数の分類器によって、入力データを複数のクラスのうちの2以上のクラスに分類する値をそれぞれ出力することと、
前記複数の分類器の複数の出力値をそれぞれ閾値と比較して、前記複数の分類器ごとに、前記2以上のクラスのうちいずれか1つに投票又は前記2以上のクラス全てに投票若しくは前記2以上のクラスいずれにも投票しないことと、
前記複数のクラスごとの得票数に基づいて、前記入力データが前記複数のクラスのうちいずれに分類されるか判定することと、
を実行させる判定方法。 For the judgment device,
Outputting values that classify input data into two or more classes out of multiple classes by multiple classifiers, and
The plurality of output values of the plurality of classifiers are compared with the threshold values, and each of the plurality of classifiers is voted for any one of the two or more classes, or for all of the two or more classes, or the above. Do not vote for any of the two or more classes
Based on the number of votes obtained for each of the plurality of classes, it is determined which of the plurality of classes the input data is classified into.
Judgment method to execute.
複数の分類器によって、入力データを複数のクラスのうちの2以上のクラスに分類する値をそれぞれ出力することと、
前記複数の分類器の複数の出力値をそれぞれ閾値と比較して、前記複数の分類器ごとに、前記2以上のクラスのうちいずれか1つに投票又は前記2以上のクラス全てに投票若しくは前記2以上のクラスいずれにも投票しないことと、
前記複数のクラスごとの得票数に基づいて、前記入力データが前記複数のクラスのうちいずれに分類されるか判定することと、
を実行させる判定プログラム。 For the judgment device,
Outputting values that classify input data into two or more classes out of multiple classes by multiple classifiers, and
The plurality of output values of the plurality of classifiers are compared with the threshold values, and each of the plurality of classifiers is voted for any one of the two or more classes, or for all of the two or more classes, or the above. Do not vote for any of the two or more classes
Based on the number of votes obtained for each of the plurality of classes, it is determined which of the plurality of classes the input data is classified into.
Judgment program to execute.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019050865A JP2020154513A (en) | 2019-03-19 | 2019-03-19 | Apparatus, method and program for determination |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019050865A JP2020154513A (en) | 2019-03-19 | 2019-03-19 | Apparatus, method and program for determination |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2020154513A true JP2020154513A (en) | 2020-09-24 |
Family
ID=72559119
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019050865A Pending JP2020154513A (en) | 2019-03-19 | 2019-03-19 | Apparatus, method and program for determination |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2020154513A (en) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010272053A (en) * | 2009-05-25 | 2010-12-02 | Victor Co Of Japan Ltd | Data classifier creation device, data classification device, data classifier creation method, data classification method, data classifier creation program, and data classification program |
JP2018510013A (en) * | 2015-03-31 | 2018-04-12 | コーニンクレッカ フィリップス エヌ ヴェKoninklijke Philips N.V. | Automatic detection / classification of ECG cable replacement for different ECG guidance systems |
-
2019
- 2019-03-19 JP JP2019050865A patent/JP2020154513A/en active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010272053A (en) * | 2009-05-25 | 2010-12-02 | Victor Co Of Japan Ltd | Data classifier creation device, data classification device, data classifier creation method, data classification method, data classifier creation program, and data classification program |
JP2018510013A (en) * | 2015-03-31 | 2018-04-12 | コーニンクレッカ フィリップス エヌ ヴェKoninklijke Philips N.V. | Automatic detection / classification of ECG cable replacement for different ECG guidance systems |
Non-Patent Citations (2)
Title |
---|
中台慎二、登内敏夫: "サポートベクターマシンを用いた事例ベース障害検出", 電子情報通信学会技術研究報告, vol. 第108巻,第288号, JPN6020006736, 6 November 2008 (2008-11-06), JP, pages 1 - 6, ISSN: 0004437513 * |
杉山将, イラストで学ぶ機械学習 最小二乗法による識別モデル学習を中心に, vol. 第1刷, JPN6021002982, 20 September 2013 (2013-09-20), pages 066 - 074, ISSN: 0004437512 * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Derrac et al. | Analyzing convergence performance of evolutionary algorithms: A statistical approach | |
Bilalli et al. | Intelligent assistance for data pre-processing | |
Mantas et al. | Analysis of Credal-C4. 5 for classification in noisy domains | |
Carrizosa et al. | A nested heuristic for parameter tuning in support vector machines | |
KR102337070B1 (en) | Method and system for building training database using automatic anomaly detection and automatic labeling technology | |
Liu et al. | Granular computing-based approach of rule learning for binary classification | |
Jatav | An algorithm for predictive data mining approach in medical diagnosis | |
JPWO2018079225A1 (en) | Automatic prediction system, automatic prediction method, and automatic prediction program | |
Langone et al. | Kernel spectral clustering for community detection in complex networks | |
JP2021096775A (en) | Learning method, learning program, and information processing device | |
US20210004698A1 (en) | Prediction method, prediction apparatus, and computer-readable recording medium | |
Rodriguez et al. | Multi-objective information retrieval-based NSGA-II optimization for requirements traceability recovery | |
JP2020154513A (en) | Apparatus, method and program for determination | |
Abellán et al. | An experimental study about simple decision trees for bagging ensemble on datasets with classification noise | |
Cano et al. | Training set selection for monotonic ordinal classification | |
US20230115697A1 (en) | Non-transitory computer-readable storage medium for storing prediction program, prediction method, and prediction apparatus | |
Ribeiro et al. | Multi-objective support vector machines ensemble generation for water quality monitoring | |
Verbeeck et al. | Multi-objective optimization with surrogate trees | |
Kar et al. | Estimation of raw silk quality using rough set theory | |
Li et al. | An incremental decision tree for mining multilabel data | |
Daud et al. | Scalable link prediction in twitter using self-configured framework | |
Piantoni et al. | Impact of base partitions on multi-objective and traditional ensemble clustering algorithms | |
Nguyen et al. | Early in-trouble student identification based on temporal educational data clustering | |
Cruz-Reyes et al. | Simplification of decision rules for recommendation of projects in a public project portfolio | |
Chen | Research on teaching methods of teachers’ ideological education based on large data |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20190319 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20200217 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20200221 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200420 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20200812 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20201112 |
|
C60 | Trial request (containing other claim documents, opposition documents) |
Free format text: JAPANESE INTERMEDIATE CODE: C60 Effective date: 20201112 |
|
C11 | Written invitation by the commissioner to file amendments |
Free format text: JAPANESE INTERMEDIATE CODE: C11 Effective date: 20201125 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20201225 |
|
C21 | Notice of transfer of a case for reconsideration by examiners before appeal proceedings |
Free format text: JAPANESE INTERMEDIATE CODE: C21 Effective date: 20210105 |
|
A912 | Re-examination (zenchi) completed and case transferred to appeal board |
Free format text: JAPANESE INTERMEDIATE CODE: A912 Effective date: 20210205 |
|
C211 | Notice of termination of reconsideration by examiners before appeal proceedings |
Free format text: JAPANESE INTERMEDIATE CODE: C211 Effective date: 20210209 |
|
C22 | Notice of designation (change) of administrative judge |
Free format text: JAPANESE INTERMEDIATE CODE: C22 Effective date: 20210308 |
|
C22 | Notice of designation (change) of administrative judge |
Free format text: JAPANESE INTERMEDIATE CODE: C22 Effective date: 20210405 |
|
C13 | Notice of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: C13 Effective date: 20210810 |
|
C23 | Notice of termination of proceedings |
Free format text: JAPANESE INTERMEDIATE CODE: C23 Effective date: 20211101 |
|
C03 | Trial/appeal decision taken |
Free format text: JAPANESE INTERMEDIATE CODE: C03 Effective date: 20211201 |
|
C30A | Notification sent |
Free format text: JAPANESE INTERMEDIATE CODE: C3012 Effective date: 20211201 |