JP6846369B2 - Programs, devices and methods for classifying unknown multidimensional vector data groups - Google Patents
Programs, devices and methods for classifying unknown multidimensional vector data groups Download PDFInfo
- Publication number
- JP6846369B2 JP6846369B2 JP2018024404A JP2018024404A JP6846369B2 JP 6846369 B2 JP6846369 B2 JP 6846369B2 JP 2018024404 A JP2018024404 A JP 2018024404A JP 2018024404 A JP2018024404 A JP 2018024404A JP 6846369 B2 JP6846369 B2 JP 6846369B2
- Authority
- JP
- Japan
- Prior art keywords
- vector data
- multidimensional vector
- classification
- class
- clusters
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
本発明は、複数次元のベクトルデータ群をクラス分類する技術に関する。 The present invention relates to a technique for classifying a multidimensional vector data group.
近年、IoT(Internet of Things)用のセンサの小型化及び高精度化に伴って、サーバは、ネットワークを介して大量のセンサデータを収集することができる。また、ニューラルネットワークの普及に伴って、それらビッグデータも容易に分析することができる。更に、これまで人手に基づく各種モニタリング業務も、システムによって自動化され、一元的に管理されてきている。例えば人の行き来が困難な地域(山間部や、インフラ設備(橋や鉄塔、柵等)、野生動物監視)であっても、環境センサを配置することによって、遠隔からのリモート監視も可能となってきている。 In recent years, with the miniaturization and high accuracy of sensors for IoT (Internet of Things), a server can collect a large amount of sensor data via a network. Moreover, with the spread of neural networks, such big data can be easily analyzed. Furthermore, various manual monitoring operations have been automated and centrally managed by the system. For example, even in areas where it is difficult for people to come and go (mountains, infrastructure equipment (bridges, steel towers, fences, etc.), wildlife monitoring), remote monitoring is possible by arranging environmental sensors. It's coming.
一方で、ビッグデータの分析という観点からは、センサデータ自体が統一的なフォーマットで構成されていない。そのために、ニューラルネットワークを用いたとしても、分析結果の信頼性の確保が難しく、データの共有化が進みにくいという問題もある。特に、センサデータが多種多様且つ大量になってくるほど、多数次元のベクトルデータを正常状態と異常状態とに分類することは難しくなる。 On the other hand, from the viewpoint of big data analysis, the sensor data itself is not composed in a unified format. Therefore, even if a neural network is used, there is a problem that it is difficult to secure the reliability of the analysis result and it is difficult to promote data sharing. In particular, as the amount of sensor data becomes diverse and large, it becomes difficult to classify multidimensional vector data into a normal state and an abnormal state.
従来、機械設備に設置されたセンサからセンサデータを取得し、異常予兆の有無を診断する技術がある(例えば特許文献1参照)。この技術によれば、正常期間のセンサデータの時系列的な波形から正常モデルを学習し、運転期間のセンサデータを正常モデルと比較して、機械設備の異常予兆の有無を診断する。正常モデルは、統計的分類手法のクラスタリングによって、正常期間のセンサデータから生成されたクラスタによって構成される。クラスタとは、多次元ベクトル空間における中心及び半径で特定される領域である。 Conventionally, there is a technique of acquiring sensor data from a sensor installed in mechanical equipment and diagnosing the presence or absence of an abnormality sign (see, for example, Patent Document 1). According to this technique, a normal model is learned from the time-series waveform of the sensor data in the normal period, and the sensor data in the operating period is compared with the normal model to diagnose the presence or absence of a sign of abnormality in machinery and equipment. The normal model is composed of clusters generated from sensor data during the normal period by clustering of statistical classification methods. A cluster is a region specified by a center and a radius in a multidimensional vector space.
図1は、未知のビッグデータの分析における課題を表す説明図である。 FIG. 1 is an explanatory diagram showing a problem in analysis of unknown big data.
図1によれば、特許文献1に記載の技術も同様に、正常期間におけるセンサデータから事前学習を必要するものである。そのために、多種多様且つ大量であって未知の多数次元のベクトルデータを、事前学習なしに分類することは困難であった。
また、クラスタリングによってクラスタに分類して学習しているが、クラスタ数を予め指定しなければならない。このクラスタ数は、学習モデルの精度にも影響を与えるものであるために、未知のデータに対して予めクラスタ数を決定することは極めて難しい。
According to FIG. 1, the technique described in
In addition, although learning is performed by classifying into clusters by clustering, the number of clusters must be specified in advance. Since this number of clusters also affects the accuracy of the learning model, it is extremely difficult to determine the number of clusters in advance for unknown data.
そこで、本発明は、事前学習なしに、未知の複数次元のベクトルデータ群をクラス分類することができるプログラム、装置及び方法を提供することを目的とする。 Therefore, an object of the present invention is to provide a program, an apparatus, and a method capable of classifying an unknown multidimensional vector data group without prior learning.
本発明によれば、複数次元のベクトルデータ群をクラス分類する装置に搭載されたコンピュータを機能させるプログラムであって、
複数次元のベクトルデータ群をクラスタリングすることによって、クラスタ数kを推定するクラスタ数推定手段と、
複数次元のベクトルデータを、出力層をクラスタ数kとするニューラルネットワークに入力し、k個のクラス毎の分類確率を出力するクラス分類手段と、
クラス分類手段によって最も高い分類確率となるクラスのラベルを、当該複数次元のベクトルデータに付与することによって、教師データを生成する教師データ生成手段と
してコンピュータを機能させることを特徴とする。
According to the present invention, it is a program for operating a computer mounted on a device for classifying a group of multidimensional vector data.
A cluster number estimation means that estimates the number of clusters k by clustering a multidimensional vector data group,
A class classification means that inputs multidimensional vector data into a neural network whose output layer is the number of clusters k and outputs the classification probability for each k class .
By assigning a label of the class having the highest classification probability by the classification means to the vector data of the plurality of dimensions, the computer functions as a teacher data generation means for generating teacher data. And.
本発明のプログラムにおける他の実施形態によれば、
クラスタ数推定手段は、DBSCAN(Density-Based Spatial Clustering of Applications with Noise)に基づくものである
ようにコンピュータを機能させることも好ましい。
According to other embodiments in the program of the present invention
It is also preferable to make the computer function so that the cluster number estimation means is based on DBSCAN (Density-Based Spatial Clustering of Applications with Noise).
本発明のプログラムにおける他の実施形態によれば、
クラス分類手段は、ニューラルネットワークにおける出力層の活性化関数として、ソフトマックス関数を用いて、合計確率1とするクラス毎の分類確率を出力する
ようにコンピュータを機能させることも好ましい。
According to other embodiments in the program of the present invention
It is also preferable that the classification means uses a softmax function as an activation function of the output layer in the neural network and causes the computer to output the classification probability for each class having a total probability of 1.
本発明のプログラムにおける他の実施形態によれば、
クラスタ数推定手段の前段にあって、複数次元のベクトルデータ群を次元圧縮する次元圧縮手段を更に有し、
次元圧縮手段から出力された低次元ベクトルデータ群を、クラスタ数推定手段へ入力する
ようにコンピュータを機能させることも好ましい。
According to other embodiments in the program of the present invention
In front of the cluster number estimation means, it further has a dimensional compression means for dimensionally compressing a multidimensional vector data group.
It is also preferable to make the computer function so as to input the low-dimensional vector data group output from the dimensional compression means to the cluster number estimation means.
本発明のプログラムにおける他の実施形態によれば、
次元圧縮手段は、t−SNE(t-Distributed Stochastic Neighbor Embedding)に基づくものであり、
低次元ベクトルデータ群は、2次元又は3次元のベクトルデータ群である
ようにコンピュータを機能させることも好ましい。
According to other embodiments in the program of the present invention
The dimensional compression means is based on t-SNE (t-Distributed Stochastic Neighbor Embedding).
It is also preferable to make the computer function so that the low-dimensional vector data group is a two-dimensional or three-dimensional vector data group.
本発明のプログラムにおける他の実施形態によれば、
複数次元のベクトルデータ群は、複数のセンサから出力されたベクトルデータを混在させたものである
ようにコンピュータを機能させることも好ましい。
According to other embodiments in the program of the present invention
It is also preferable to make the computer function so that the multidimensional vector data group is a mixture of vector data output from a plurality of sensors.
本発明によれば、複数次元のベクトルデータ群をクラス分類する装置であって、
複数次元のベクトルデータ群をクラスタリングすることによって、クラスタ数kを推定するクラスタ数推定手段と、
複数次元のベクトルデータを、出力層をクラスタ数kとするニューラルネットワークに入力し、k個のクラス毎の分類確率を出力するクラス分類手段と、
クラス分類手段によって最も高い分類確率となるクラスのラベルを、当該複数次元のベクトルデータに付与することによって、教師データを生成する教師データ生成手段と
を有することを特徴とする。
According to the present invention, it is an apparatus for classifying a group of multidimensional vector data.
A cluster number estimation means that estimates the number of clusters k by clustering a multidimensional vector data group,
A class classification means that inputs multidimensional vector data into a neural network whose output layer is the number of clusters k and outputs the classification probability for each k class .
It is characterized by having a teacher data generation means for generating teacher data by assigning a label of the class having the highest classification probability by the classification means to the vector data of the plurality of dimensions.
本発明によれば、複数次元のベクトルデータ群を入力する装置のクラス分類方法であって、
装置は、
複数次元のベクトルデータ群をクラスタリングすることによって、クラスタ数kを推定する第1のステップと、
複数次元のベクトルデータを、出力層をクラスタ数kとするニューラルネットワークに入力し、k個のクラス毎の分類確率を出力する第2のステップと、
第2のステップによって最も高い分類確率となるクラスのラベルを、当該複数次元のベクトルデータに付与することによって、教師データを生成する第3のステップと
を実行することを特徴とする。
According to the present invention, it is a classification method of a device for inputting a multidimensional vector data group.
The device is
The first step of estimating the number of clusters k by clustering a multidimensional vector data group,
The second step of inputting multidimensional vector data into a neural network whose output layer is the number of clusters k and outputting the classification probabilities for each of k classes ,
By assigning the label of the class having the highest classification probability by the second step to the multidimensional vector data, the third step and the third step of generating the teacher data are executed. ..
本発明のプログラム、装置及び方法によれば、事前学習なしに、未知の複数次元のベクトルデータ群をクラス分類することができる。 According to the program, apparatus and method of the present invention, an unknown multidimensional vector data group can be classified without prior learning.
以下では、本発明の実施の形態について、図面を用いて詳細に説明する。 Hereinafter, embodiments of the present invention will be described in detail with reference to the drawings.
図2は、本発明における分析装置の機能構成図である。 FIG. 2 is a functional configuration diagram of the analyzer according to the present invention.
分析装置1は、未知の複数次元のベクトルデータ群をクラス分類するものである。図2によれば、分析装置1は、ベクトルデータ群蓄積部100と、次元圧縮部101と、クラスタ数推定部11と、クラス分類部12と、教師データ生成部13とを有する。これら機能構成部は、装置に搭載されたコンピュータを機能させるプログラムを実行することによって実現される。また、これら機能構成部の処理の流れは、ベクトルデータ群のクラス分類方法としても理解できる。
The
[ベクトルデータ群蓄積部100]
ベクトルデータ群蓄積部100は、未知の複数次元のベクトルデータ群を蓄積している。「複数次元」とは、複数のセンサから出力されたベクトルデータを混在させたものであることを意味する。
複数次元のベクトルデータ群としては、例えば動体センサ(加速度センサや地磁気センサなど)、生体センサ(心拍センサなど)、環境センサ(温湿度センサ、気圧センサ、圧力センサなど)、光センサ(超音波センサや赤外線センサなど)、音響センサのような様々なベクトルデータを混在させることができる。本発明によれば、それらベクトルデータ群を時系列に取得することができれば、正常時と異常時とを大まかに判定することができる。
[Vector data group storage unit 100]
The vector data
The multidimensional vector data group includes, for example, a moving body sensor (acceleration sensor, geomagnetic sensor, etc.), a biological sensor (heartbeat sensor, etc.), an environmental sensor (temperature / humidity sensor, pressure sensor, pressure sensor, etc.), and an optical sensor (ultrasonic sensor, etc.). And infrared sensors), various vector data such as acoustic sensors can be mixed. According to the present invention, if these vector data groups can be acquired in a time series, it is possible to roughly determine a normal time and an abnormal time.
[次元圧縮部101]
次元圧縮部101は、オプション的なものであって、クラスタ数推定部11の前段にあって、複数次元のベクトルデータ群を次元圧縮する。次元圧縮部101は、次元圧縮した低次元ベクトルデータ群を、クラスタ数推定部11へ出力する。ここでの低次元ベクトルデータ群とは、2〜3次元程度のベクトルデータ群を意味する。
[Dimension compression unit 101]
The
図3は、次元圧縮部を表す説明図である。 FIG. 3 is an explanatory diagram showing a dimensional compression unit.
次元圧縮部101は、t−SNE(t-Distributed Stochastic Neighbor Embedding)に基づくものである(例えば非特許文献1参照)。これは、2点間の「近さ」を確率分布で表現する手法である。
pj|i:平均xiに従うガウス分布についてxjが抽出される確率密度
σi 2:平均xiのガウス分布の分散(異なる2点の類似度のみを表す)
pi|i=0
t−SNEでは、分布間の距離を測る指標として、カルバック・ライブラー・ダイバージェンス(Kullback-Leibler-divergence)を用いる。
p i | i = 0
In t-SNE, Kullback-Leibler-divergence is used as an index for measuring the distance between distributions.
図4は、クラスタ推定部及びクラス分類部を表す説明図である。 FIG. 4 is an explanatory diagram showing a cluster estimation unit and a classification unit.
[クラスタ数推定部11]
クラスタ数推定部11は、複数次元のベクトルデータ群をクラスタリングすることによって、クラスタ数kを推定する。
クラスタ数推定部11は、DBSCAN(Density-Based Spatial Clustering of Applications with Noise)に基づくものである。DBSCANは、クラスタ数を予め設定する必要がないために、クラスタ数を未知として、ベクトルデータ群の分類が可能となる。
[Cluster number estimation unit 11]
The cluster
The cluster
DBSCANは、密度ベースのクラスタリング方法であり、以下の2つのパラメータを用いる。
距離の閾値 :ε(Eps-neighborhood of a point)
対象個数の閾値:minPts(a minimum number of points)
データの点を、以下の3つの種類に分類する。
コア点 :半径ε以内に少なくともminPts個の隣接点を持つ点
到達可能点:半径ε以内にminPts個ほどは隣接点がないが、
半径ε以内にCore pointsを持つ点
外れ値 :半径ε以内に隣接点がない点
コア点の集まりからクラスタを作成し、到達可能点を各クラスタに割り当てる。
即ち、DBSCANは、ある空間に点集合が与えられたとき、高い密度領域にある点同士をグループとしてまとめて、低い密度領域にある点を外れ値とする。
そして、クラスタ数推定部11は、DBSCANによって、最適なクラスタ数kを推定し、それをクラス分類部12へ出力する。
DBSCAN is a density-based clustering method that uses the following two parameters.
Distance threshold: ε (Eps-neighborhood of a point)
Target number threshold: minPts (a minimum number of points)
Data points are classified into the following three types.
Core points: Points with at least minPts of adjacent points within a radius of ε Reachable points: There are not as many adjacent points as there are minPts within a radius of ε,
Outliers with Core points within radius ε: Points with no adjacent points within radius ε Create a cluster from a collection of core points and assign reachable points to each cluster.
That is, in DBSCAN, when a set of points is given to a certain space, the points in the high density region are grouped together, and the points in the low density region are set as outliers.
Then, the cluster
[クラス分類部12]
クラス分類部12は、複数次元のベクトルデータを、出力層をクラスタ数kとするニューラルネットワークに入力し、k個のクラス毎の分類確率を出力する。クラスタ数kは、クラスタ数推定部11によって推定されたものである。
[Class classification unit 12]
The
クラス分類部12は、全結合型のニューラルネットワークにおける出力層の活性化関数として、ソフトマックス関数を用いて、合計確率1とするクラス毎の分類確率を出力する。
The
ニューラルネットワークとは、生体の脳における特性を計算機上のシミュレーションによって表現することを目指した数学モデルをいう。シナプスの結合によってネットワークを形成した人工ニューロン(ユニット)が、学習によってシナプスの結合強度を変化させ、問題解決能力を持つようなモデル全般をいう。 A neural network is a mathematical model that aims to express the characteristics of a living body in the brain by computer simulation. It refers to a general model in which artificial neurons (units) that form a network by synaptic connection change the synaptic connection strength by learning and have problem-solving ability.
図4によれば、順伝播型の畳み込みニューラルネットワーク(Convolutional Neural Network, CNN)として、入力層(input layer)と、中間層(hidden layer)と、出力層(output layer)との3つの層から構成され、入力層から出力層へ向けて一方向に伝播する。中間層は、グラフ状に複数の層から構成するものであってもよい。各層は、複数のユニット(ニューロン)を持ち、前方層のユニットから後方層のユニットへつなぐ関数のパラメータを、「重み(weight)」と称す。学習とは、この関数のパラメータとして、適切な「重み」を算出することにある。 According to FIG. 4, as a forward propagation type convolutional neural network (CNN), there are three layers, an input layer, a hidden layer, and an output layer. It is configured and propagates in one direction from the input layer to the output layer. The intermediate layer may be composed of a plurality of layers in a graph shape. Each layer has multiple units (neurons), and the parameter of the function that connects the unit in the anterior layer to the unit in the posterior layer is called "weight". Learning is to calculate an appropriate "weight" as a parameter of this function.
本発明のニューラルネットワークは、分類問題(データがどのクラスに属するかを判別)としてソフトマックス関数を適用する。出力層が全部でk個あるとして、m番目の出力ymを、以下のように表す。
ym=exp(xm)/Σi=1 kexp(xi)
exp(x):exを表す指数関数(eは2.7182・・・のネイピア数)
xm:入力信号
The neural network of the present invention applies a softmax function as a classification problem (determining which class the data belongs to). As the output layer is k pieces in total, the m-th output y m, expressed as follows.
y m = exp (x m) / Σ i = 1 k exp (x i)
exp (x): exponential function representing the e x (e Napier number of 2.7182 ...)
x m : Input signal
ソフトマックス関数の出力は、全ての入力信号から矢印による結びつきがある。出力の各ニューロンが全ての入力信号xmから影響を受ける。
また、ソフトマックス関数の出力の総和は1となり、その性質によりソフトマックス関数の出力を「確率」として解釈することができる。この確率の結果から、どのクラスに属するかと判断することができる。
ソフトマックス関数により判別されたクラスは、未知の複数センサデータのクラスとなる。
The output of the softmax function is linked by arrows from all input signals. Each output neuron is affected by all input signals x m.
Further, the total output of the softmax function is 1, and the output of the softmax function can be interpreted as a "probability" due to its nature. From the result of this probability, it can be determined which class it belongs to.
The class determined by the softmax function is an unknown class of multiple sensor data.
但し、本発明によれば、クラス分類手法として、教師有り学習のサポートベクターマシン(Support Vector Machine)のようなパターン認識モデルは使用しない。本発明によれば、教師無し学習としてクラス分類するためである。 However, according to the present invention, a pattern recognition model such as a support vector machine for supervised learning is not used as a classification method. This is because according to the present invention, the learning is classified as unsupervised learning.
[教師データ生成部13]
教師データ生成部13は、クラス分類部12によって最も高い分類確率となるクラスのラベルを、当該複数次元のベクトルデータに付与することによって、教師データを生成する。その教師データは、教師データ蓄積部に蓄積することによって、教師有り学習モデルへ適用することもできる。
[Teacher data generation unit 13]
The teacher
以上、詳細に説明したように、本発明のプログラム、装置及び方法によれば、事前学習なしに、未知の複数次元のベクトルデータ群をクラス分類することができる。 As described in detail above, according to the program, apparatus and method of the present invention, an unknown multidimensional vector data group can be classified without prior learning.
本発明によれば、汎用的に、多種多様且つ大量であって未知の多数次元のベクトルデータを、事前学習なしに分類することができる。また、クラスタリングの際に、学習モデルの精度にも影響を与えるクラスタ数kを予め指定する必要もない。この点も、未知の多数次元のベクトルデータに対する分類に適する。 According to the present invention, it is possible to generally classify a wide variety of large amounts of unknown multidimensional vector data without prior learning. Further, at the time of clustering, it is not necessary to specify in advance the number of clusters k, which also affects the accuracy of the learning model. This point is also suitable for classification of unknown multidimensional vector data.
更に、本発明によれば、未知の複数次元のベクトルデータ群をクラス分類することができるので、多種多様なセンサデータを混在させることもできる。
例えば動体センサをインフラ設備(例えば橋や鉄塔、柵等)に設置して、そのセンサデータ群を、例えば正常状態と異常状態とに大まかに分類することもできる。
また、例えば動体センサや生体センサを人や動物に装着することによって、そのセンサデータ群を、例えば人や動物の行動把握(走る、歩く、静止等)に分類することもできる。
更に、例えば環境センサや光センサ、音響センサを、既存の機械設備に装着することによって、そのセンサデータ群を、例えば正常状態と異常状態とに大まかに分類することもできる。
Further, according to the present invention, unknown multidimensional vector data groups can be classified into classes, so that a wide variety of sensor data can be mixed.
For example, a moving body sensor can be installed in infrastructure equipment (for example, a bridge, a steel tower, a fence, etc.), and the sensor data group can be roughly classified into, for example, a normal state and an abnormal state.
Further, for example, by attaching a moving body sensor or a biological sensor to a person or an animal, the sensor data group can be classified into, for example, grasping the behavior of the person or the animal (running, walking, resting, etc.).
Further, for example, by mounting an environmental sensor, an optical sensor, or an acoustic sensor on an existing machine or equipment, the sensor data group can be roughly classified into, for example, a normal state and an abnormal state.
前述した本発明の種々の実施形態について、本発明の技術思想及び見地の範囲の種々の変更、修正及び省略は、当業者によれば容易に行うことができる。前述の説明はあくまで例であって、何ら制約しようとするものではない。本発明は、特許請求の範囲及びその均等物として限定するものにのみ制約される。 With respect to the various embodiments of the present invention described above, various changes, modifications and omissions within the scope of the technical idea and viewpoint of the present invention can be easily made by those skilled in the art. The above explanation is just an example and does not attempt to restrict anything. The present invention is limited only to the scope of claims and their equivalents.
1 分析装置
100 ベクトルデータ群蓄積部
101 次元圧縮部
11 クラスタ数推定部
12 クラス分類部
13 教師データ生成部
1
Claims (8)
複数次元のベクトルデータ群をクラスタリングすることによって、クラスタ数kを推定するクラスタ数推定手段と、
複数次元のベクトルデータを、出力層をクラスタ数kとするニューラルネットワークに入力し、k個のクラス毎の分類確率を出力するクラス分類手段と、
前記クラス分類手段によって最も高い分類確率となるクラスのラベルを、当該複数次元のベクトルデータに付与することによって、教師データを生成する教師データ生成手段と
してコンピュータを機能させることを特徴とするプログラム。 A program that operates a computer installed in a device that classifies a group of multidimensional vector data.
A cluster number estimation means that estimates the number of clusters k by clustering a multidimensional vector data group,
A class classification means that inputs multidimensional vector data into a neural network whose output layer is the number of clusters k and outputs the classification probability for each k class .
By assigning the label of the class having the highest classification probability by the classification means to the vector data of the plurality of dimensions, the computer can function as the teacher data generation means for generating the teacher data. Characteristic program.
ようにコンピュータを機能させることを特徴とする請求項1に記載のプログラム。 The program according to claim 1, wherein the cluster number estimation means causes a computer to function so as to be based on DBSCAN (Density-Based Spatial Clustering of Applications with Noise).
ようにコンピュータを機能させることを特徴とする請求項1又は2に記載のプログラム。 The class classification means uses a softmax function as an activation function of an output layer in the neural network, and causes a computer to function so as to output a classification probability for each class having a total probability of 1. Item 2. The program according to item 1 or 2.
前記次元圧縮手段から出力された低次元ベクトルデータ群を、前記クラスタ数推定手段へ入力する
ようにコンピュータを機能させることを特徴とする請求項1から3のいずれか1項に記載のプログラム。 In front of the cluster number estimation means, it further has a dimensional compression means for dimensionally compressing a multidimensional vector data group.
The program according to any one of claims 1 to 3, wherein the computer functions to input the low-dimensional vector data group output from the dimensional compression means to the cluster number estimation means.
前記低次元ベクトルデータ群は、2次元又は3次元のベクトルデータ群である
ようにコンピュータを機能させることを特徴とする請求項4に記載のプログラム。 The dimensional compression means is based on t-SNE (t-Distributed Stochastic Neighbor Embedding).
The program according to claim 4, wherein the low-dimensional vector data group causes a computer to function as if it were a two-dimensional or three-dimensional vector data group.
ようにコンピュータを機能させることを特徴とする請求項1から5のいずれか1項に記載のプログラム。 The program according to any one of claims 1 to 5, wherein the multidimensional vector data group causes a computer to function as if vector data output from a plurality of sensors are mixed.
複数次元のベクトルデータ群をクラスタリングすることによって、クラスタ数kを推定するクラスタ数推定手段と、
複数次元のベクトルデータを、出力層をクラスタ数kとするニューラルネットワークに入力し、k個のクラス毎の分類確率を出力するクラス分類手段と、
前記クラス分類手段によって最も高い分類確率となるクラスのラベルを、当該複数次元のベクトルデータに付与することによって、教師データを生成する教師データ生成手段と
を有することを特徴とする装置。 A device that classifies a group of multidimensional vector data.
A cluster number estimation means that estimates the number of clusters k by clustering a multidimensional vector data group,
A class classification means that inputs multidimensional vector data into a neural network whose output layer is the number of clusters k and outputs the classification probability for each k class .
An apparatus having a teacher data generation means for generating teacher data by assigning a label of a class having the highest classification probability by the classification means to the vector data of the plurality of dimensions. ..
前記装置は、
複数次元のベクトルデータ群をクラスタリングすることによって、クラスタ数kを推定する第1のステップと、
複数次元のベクトルデータを、出力層をクラスタ数kとするニューラルネットワークに入力し、k個のクラス毎の分類確率を出力する第2のステップと、
第2のステップによって最も高い分類確率となるクラスのラベルを、当該複数次元のベクトルデータに付与することによって、教師データを生成する第3のステップと
を実行することを特徴とする装置のクラス分類方法。 This is a classification method for devices that input multidimensional vector data groups.
The device is
The first step of estimating the number of clusters k by clustering a multidimensional vector data group,
The second step of inputting multidimensional vector data into a neural network whose output layer is the number of clusters k and outputting the classification probabilities for each of k classes ,
By assigning the label of the class having the highest classification probability by the second step to the multidimensional vector data, the third step and the third step of generating the teacher data are executed. How to classify equipment.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018024404A JP6846369B2 (en) | 2018-02-14 | 2018-02-14 | Programs, devices and methods for classifying unknown multidimensional vector data groups |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018024404A JP6846369B2 (en) | 2018-02-14 | 2018-02-14 | Programs, devices and methods for classifying unknown multidimensional vector data groups |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2019139651A JP2019139651A (en) | 2019-08-22 |
JP6846369B2 true JP6846369B2 (en) | 2021-03-24 |
Family
ID=67694331
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018024404A Active JP6846369B2 (en) | 2018-02-14 | 2018-02-14 | Programs, devices and methods for classifying unknown multidimensional vector data groups |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6846369B2 (en) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102453085B1 (en) * | 2020-09-22 | 2022-10-12 | 동국대학교 산학협력단 | Apparatus and method for estimating age |
JP6961126B1 (en) * | 2020-10-28 | 2021-11-05 | 三菱電機株式会社 | Deterioration detection device |
CN113011472B (en) * | 2021-02-26 | 2023-09-01 | 广东电网有限责任公司电力调度控制中心 | Multi-section electric power quotation curve similarity judging method and device |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0785013B2 (en) * | 1991-05-14 | 1995-09-13 | 川崎製鉄株式会社 | Method for determining surface grade of steel sheet |
JP6509694B2 (en) * | 2015-09-15 | 2019-05-08 | 株式会社東芝 | Learning device, speech detection device, learning method and program |
-
2018
- 2018-02-14 JP JP2018024404A patent/JP6846369B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
JP2019139651A (en) | 2019-08-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Liao et al. | Enhanced restricted Boltzmann machine with prognosability regularization for prognostics and health assessment | |
Avci et al. | A review of vibration-based damage detection in civil structures: From traditional methods to Machine Learning and Deep Learning applications | |
Sun et al. | Review of bridge structural health monitoring aided by big data and artificial intelligence: From condition assessment to damage detection | |
Zhang et al. | A review on deep learning applications in prognostics and health management | |
Darban et al. | Deep learning for time series anomaly detection: A survey | |
Yang et al. | ART–KOHONEN neural network for fault diagnosis of rotating machinery | |
WO2021257128A2 (en) | Quantum computing based deep learning for detection, diagnosis and other applications | |
JP6846369B2 (en) | Programs, devices and methods for classifying unknown multidimensional vector data groups | |
Ren et al. | A deep learning-based computational algorithm for identifying damage load condition: an artificial intelligence inverse problem solution for failure analysis | |
Prabhod | Advanced Machine Learning Techniques for Predictive Maintenance in Industrial IoT: Integrating Generative AI and Deep Learning for Real-Time Monitoring | |
Akpudo et al. | Towards bearing failure prognostics: A practical comparison between data-driven methods for industrial applications | |
Qiu et al. | A piecewise method for bearing remaining useful life estimation using temporal convolutional networks | |
Yang | Monitoring and diagnosing of mean shifts in multivariate manufacturing processes using two-level selective ensemble of learning vector quantization neural networks | |
Yang et al. | Autoregressive coefficient-invariant control chart pattern recognition in autocorrelated manufacturing processes using neural network ensemble | |
Son et al. | Deep learning-based anomaly detection to classify inaccurate data and damaged condition of a cable-stayed bridge | |
CN110851654A (en) | Industrial equipment fault detection and classification method based on tensor data dimension reduction | |
CN117257302B (en) | Personnel mental health state assessment method and system | |
CN112329974B (en) | LSTM-RNN-based civil aviation security event behavior subject identification and prediction method and system | |
Hui et al. | A hybrid artificial neural network with Dempster-Shafer theory for automated bearing fault diagnosis | |
Samudra et al. | Machine learning-assisted improved anomaly detection for structural health monitoring | |
Luleci et al. | Generative adversarial networks for data generation in structural health monitoring | |
CN115471043A (en) | Wax mould casting heat treatment equipment health state evaluation method based on integrated SAE-SOM | |
Omar et al. | Compatibility and challenges in machine learning approach for structural crack assessment | |
Li et al. | Structural health monitoring data anomaly detection by transformer enhanced densely connected neural networks | |
CN115310499B (en) | Industrial equipment fault diagnosis system and method based on data fusion |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20191218 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20201228 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20210114 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210118 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20210205 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20210301 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6846369 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |