JP6661839B1 - Time series data diagnosis device, additional learning method, and program - Google Patents
Time series data diagnosis device, additional learning method, and program Download PDFInfo
- Publication number
- JP6661839B1 JP6661839B1 JP2019526332A JP2019526332A JP6661839B1 JP 6661839 B1 JP6661839 B1 JP 6661839B1 JP 2019526332 A JP2019526332 A JP 2019526332A JP 2019526332 A JP2019526332 A JP 2019526332A JP 6661839 B1 JP6661839 B1 JP 6661839B1
- Authority
- JP
- Japan
- Prior art keywords
- data
- time
- diagnosis result
- sample subsequence
- series data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000003745 diagnosis Methods 0.000 title claims abstract description 147
- 238000000034 method Methods 0.000 title claims description 25
- 238000011156 evaluation Methods 0.000 claims abstract description 87
- 238000004364 calculation method Methods 0.000 claims abstract description 25
- 238000013500 data storage Methods 0.000 claims 1
- 230000006870 function Effects 0.000 description 20
- 230000002159 abnormal effect Effects 0.000 description 12
- 238000012545 processing Methods 0.000 description 11
- 238000012217 deletion Methods 0.000 description 8
- 230000037430 deletion Effects 0.000 description 8
- 230000005856 abnormality Effects 0.000 description 4
- 238000004891 communication Methods 0.000 description 4
- 238000012986 modification Methods 0.000 description 4
- 230000004048 modification Effects 0.000 description 4
- 230000005540 biological transmission Effects 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 239000000284 extract Substances 0.000 description 3
- 238000005070 sampling Methods 0.000 description 3
- 238000012935 Averaging Methods 0.000 description 1
- 230000032683 aging Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000005484 gravity Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000001932 seasonal effect Effects 0.000 description 1
- 238000012549 training Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B23/00—Testing or monitoring of control systems or parts thereof
- G05B23/02—Electric testing or monitoring
- G05B23/0205—Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults
- G05B23/0218—Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults characterised by the fault detection method dealing with either existing or incipient faults
- G05B23/0224—Process history based detection method, e.g. whereby history implies the availability of large amounts of data
- G05B23/024—Quantitative history assessment, e.g. mathematical relationships between available data; Functions therefor; Principal component analysis [PCA]; Partial least square [PLS]; Statistical classifiers, e.g. Bayesian networks, linear regression or correlation analysis; Neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/0703—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
- G06F11/079—Root cause analysis, i.e. error or fault diagnosis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/0703—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
- G06F11/0751—Error or fault detection not based on redundancy
- G06F11/0754—Error or fault detection not based on redundancy by exceeding limits
- G06F11/076—Error or fault detection not based on redundancy by exceeding limits by exceeding a count or rate limit, e.g. word- or bit count limit
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/0703—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
- G06F11/0766—Error or fault reporting or storing
- G06F11/0775—Content or structure details of the error report, e.g. specific table structure, specific error fields
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/22—Indexing; Data structures therefor; Storage structures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/22—Indexing; Data structures therefor; Storage structures
- G06F16/2228—Indexing structures
- G06F16/2237—Vectors, bitmaps or matrices
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/0703—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
- G06F11/0706—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
- G06F11/0736—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment in functional embedded systems, i.e. in a data processing system designed as a combination of hardware and software dedicated to performing a certain function
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/0703—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
- G06F11/0751—Error or fault detection not based on redundancy
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Software Systems (AREA)
- Data Mining & Analysis (AREA)
- Quality & Reliability (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Mathematical Physics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Medical Informatics (AREA)
- Computing Systems (AREA)
- Databases & Information Systems (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Automation & Control Theory (AREA)
- Testing And Monitoring For Control Systems (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
時系列データ診断装置(10)は、記憶部(11)と、相違度算出部(13)と、診断結果情報生成部(14)と、評価情報取得部(16)と、更新部(17)と、を備える。相違度算出部(13)は、診断対象の時系列データと、記憶手段に格納された学習済み標本部分列データと、の相違度を算出する。診断結果情報生成部(14)は、相違度算出部(13)が算出した相違度に基づいて診断対象の時系列データの診断結果情報を生成する。評価情報取得部(16)は、診断結果情報が妥当な診断結果であるか否かの評価を表す評価情報を取得する。更新部(17)は、評価情報取得部(16)が、妥当な診断結果でないという評価を表す評価情報を取得した場合に、診断結果情報に対応する診断対象の時系列データに基づいて記憶部(11)に格納された学習済み標本部分列データを更新する。The time-series data diagnostic device (10) includes a storage unit (11), a dissimilarity calculation unit (13), a diagnosis result information generation unit (14), an evaluation information acquisition unit (16), and an update unit (17). And A dissimilarity calculation unit (13) calculates a dissimilarity between the time-series data to be diagnosed and the learned sample subsequence data stored in the storage means. The diagnosis result information generation unit (14) generates diagnosis result information of the time-series data of the diagnosis target based on the difference degree calculated by the difference degree calculation unit (13). An evaluation information acquisition unit (16) acquires evaluation information indicating an evaluation as to whether the diagnosis result information is a proper diagnosis result. The update unit (17) stores the evaluation information acquisition unit (16) based on the time-series data of the diagnosis target corresponding to the diagnosis result information when the evaluation information acquisition unit (16) acquires the evaluation information indicating the evaluation that the diagnosis result is not appropriate. The learned sample subsequence data stored in (11) is updated.
Description
本発明は、時系列データ診断装置、追加学習方法およびプログラムに関する。 The present invention relates to a time-series data diagnosis device, an additional learning method, and a program.
ビル、工場等の設備、工場のラインの機器、自動車、鉄道車両等には、時間の経過に従って得られた種々の時系列データが蓄積される。この時系列データを診断して、機器の異常を検知する装置が研究されている。また、これらの装置が正常時もしくは異常時の時系列データを学習して、診断精度を上げる研究もされている。例えば、特許文献1には、診断において比較対象となる学習済みモデルとして、時系列データから抽出した部分列データのうち、互いに類似する部分列データの統計値から標本部分列データを生成する技術が開示されている。この生成された標本部分列データを診断の比較対象とすることによって、精度と計算量のバランスを取っている。 Various time-series data obtained over time are accumulated in equipment such as buildings and factories, equipment on factory lines, automobiles, railway vehicles, and the like. A device that diagnoses the time-series data and detects an abnormality of the device has been studied. In addition, studies have been made to improve the diagnostic accuracy by learning time-series data of these devices in normal or abnormal times. For example, Patent Literature 1 discloses a technique of generating sample subsequence data from statistical values of similar subsequence data among subsequence data extracted from time-series data as a learned model to be compared in diagnosis. It has been disclosed. By using the generated sample subsequence data as a comparison target for diagnosis, the accuracy and the amount of calculation are balanced.
学習済みモデルとなる標本部分列データは、最初から高い精度で生成することが望ましい。しかし、時間的または経済的な制約によって必ずしも最初から完全な精度にはならない。また、機器の経年劣化、季節変動等の運用中のさまざまな状況の変化に対応する必要がある。そこで、運用中であっても追加で学習することによって標本部分列データを更新できることが望ましい。これに対して、特許文献1には、運用中に学習済みモデルを更新する追加学習の方法についての開示は無い。一方、特許文献2には、診断手段によって故障の予兆なしと診断された時系列データを、当該時系列データが属する時間帯のクラスタに追加して、当該クラスタを更新する技術が開示されている。しかし、特許文献2に記載された技術は、追加した時系列データと追加前のメンバである複数の時系列データとに基づいてクラスタを更新する技術であるために、計算量が多くなる。したがって、処理スピードが要求される運用中の追加学習に適しているとは言えない。また、単純に少ない計算量とすることによって学習の精度が著しく低くなると、実運用に耐えられなくなってしまう。 It is desirable that sample subsequence data to be a trained model be generated with high accuracy from the beginning. However, due to time or economic constraints, the accuracy is not always perfect from the beginning. It is also necessary to cope with changes in various situations during operation, such as aging of equipment and seasonal fluctuations. Therefore, it is desirable that the sample subsequence data can be updated by additionally learning even during operation. On the other hand, Patent Literature 1 does not disclose a method of additional learning for updating a learned model during operation. On the other hand, Patent Literature 2 discloses a technique in which time series data diagnosed by the diagnosis unit as having no sign of failure is added to a cluster in a time zone to which the time series data belongs, and the cluster is updated. . However, the technique described in Patent Literature 2 is a technique for updating a cluster based on the added time-series data and a plurality of time-series data which are members before the addition, and thus requires a large amount of calculation. Therefore, it cannot be said that it is suitable for additional learning during operation that requires processing speed. Also, if the accuracy of learning is significantly reduced by simply setting a small amount of calculation, it becomes impossible to withstand actual operation.
本発明は、上記実情に鑑みてなされたものであり、少ない計算量と高い精度で追加学習をすることができる時系列データ診断装置、追加学習方法およびプログラムを提供することを目的とする。 The present invention has been made in view of the above circumstances, and has as its object to provide a time-series data diagnosis device, an additional learning method, and a program that can perform additional learning with a small amount of calculation and high accuracy.
上記目的を達成するため、本発明の時系列データ診断装置は、記憶手段と、相違度算出手段と、診断結果情報生成手段と、評価情報取得手段と、更新手段と、を備える。記憶手段は、学習対象の時系列データを時間的に連続する類似の部分列データでグループ化した各グループの部分列データの統計値から生成された中間標本部分列データと、中間標本部分列データに基づいて生成された学習済み標本部分列データと、第1の閾値を含むパラメータと、を記憶する。相違度算出手段は、診断対象の時系列データと、記憶手段に格納された学習済み標本部分列データと、の相違度を算出する。診断結果情報生成手段は、相違度算出手段が算出した相違度と第1の閾値とを比較して、診断対象の時系列データの診断結果情報を生成する。評価情報取得手段は、診断結果情報が妥当な診断結果であるか否かの評価を表す評価情報を取得する。更新手段は、相違度が第1の閾値以上であり、評価情報取得手段が、妥当な診断結果でないという評価を表す評価情報を取得した場合に、妥当な診断結果でないと評価された診断結果情報に対応する診断対象の時系列データから時間的に連続する類似の部分列データでグループ化した各グループの部分列データの統計値から更新用中間標本部分列データを生成し、更新用中間標本部分列データと記憶手段に格納された中間標本部分列データとに基づいて標本部分列データを生成し、生成された標本部分列データで記憶手段に格納された学習済み標本部分列データを更新する。 In order to achieve the above object, a time-series data diagnosis apparatus of the present invention includes a storage unit, a difference calculation unit, a diagnosis result information generation unit, an evaluation information acquisition unit, and an update unit. The storage means includes intermediate sample subsequence data generated from statistical values of subsequence data of each group obtained by grouping time series data to be learned with similar temporally continuous subsequence data, and intermediate sample subsequence data. And the learned sample subsequence data generated based on the above , and parameters including the first threshold value . The dissimilarity calculating means calculates the dissimilarity between the time-series data to be diagnosed and the learned sample subsequence data stored in the storage means. The diagnosis result information generation unit compares the difference calculated by the difference calculation unit with the first threshold to generate diagnosis result information of the time-series data to be diagnosed. The evaluation information obtaining means obtains evaluation information indicating whether or not the diagnosis result information is a valid diagnosis result. The updating means, when the degree of difference is equal to or greater than the first threshold, and when the evaluation information obtaining means obtains evaluation information indicating an evaluation that is not a valid diagnostic result, the diagnostic result information evaluated as not being a valid diagnostic result Generating an intermediate sample subsequence data for update from the statistical value of the subsequence data of each group grouped by similar subsequence data that is temporally continuous from the time series data of the diagnosis target corresponding to Sample subsequence data is generated based on the column data and the intermediate sample subsequence data stored in the storage unit, and the learned sample subsequence data stored in the storage unit is updated with the generated sample subsequence data.
本発明によれば、学習対象の時系列データに基づいて生成された学習済み標本部分列データを更新することによって、少ない計算量と高い精度で追加学習をすることができる時系列データ診断装置を提供することができる。 According to the present invention, there is provided a time-series data diagnostic apparatus that can perform additional learning with a small amount of calculation and high accuracy by updating learned sample subsequence data generated based on time-series data to be learned. Can be provided.
(実施の形態1)
以下、本発明の時系列データ診断装置、追加学習方法およびプログラムを運用中のオンライン学習に適用した実施の形態について、図面を参照して説明する。(Embodiment 1)
Hereinafter, an embodiment in which a time-series data diagnosis device, an additional learning method, and a program of the present invention are applied to online learning during operation will be described with reference to the drawings.
診断の対象となる時系列データは、ビル、工場等の設備、工場のラインの機器、自動車、鉄道車両等に取り付けられた温度計、振動計、電圧計等のさまざまなセンサから時間の経過に従って得られた種々のデータである。そして、時系列データ診断装置は、これらの機器の状態を監視する目的で、時系列データを取得してリアルタイムに診断し、診断結果を出力する。 The time series data to be diagnosed is based on the passage of time from various sensors such as buildings, factories, etc., factory line equipment, thermometers, vibration meters, voltmeters, etc. attached to automobiles, railway vehicles, etc. These are various data obtained. Then, the time-series data diagnosis device acquires time-series data, diagnoses the data in real time, and outputs a diagnosis result in order to monitor the states of these devices.
実際には、時系列データ診断装置を使用する前に、学習装置によって学習済みモデルを構築する。そして、時系列データ診断装置は、学習済みモデルを参照して、リアルタイムに送信される時系列データを診断する。さらに、時系列データ診断装置は、診断の精度を上げるため、運用中に追加学習することによって学習済みモデルを更新する。 In practice, a learned model is constructed by a learning device before using the time-series data diagnosis device. Then, the time-series data diagnosis device diagnoses the time-series data transmitted in real time with reference to the learned model. Further, the time-series data diagnosis device updates the learned model by performing additional learning during operation in order to increase the accuracy of diagnosis.
最初に、本実施の形態の前提となる学習済みモデルの構築方法について、図1を参照して説明する。 First, a method of constructing a learned model as a premise of the present embodiment will be described with reference to FIG.
本実施の形態にかかる時系列データ診断装置とは別の学習装置が学習済みモデルを構築する例を示す。ただし、時系列データ診断装置が学習装置を兼ねても良い。また、本実施の形態では、学習装置が正常な時系列データを取得して学習済みモデルを生成することによって、時系列データ診断装置が生成された学習済みモデルと類似する時系列データを正常と診断する。 An example is shown in which a learning device different from the time-series data diagnosis device according to the present embodiment constructs a learned model. However, the time-series data diagnosis device may double as the learning device. Further, in the present embodiment, the learning device acquires normal time-series data and generates a learned model, so that the time-series data diagnostic device determines that the time-series data similar to the generated learned model is normal. Diagnose.
学習対象の時系列データは時刻とデータとが関連付けられていて、連続した値を特定のサンプリングレートで離散データに変換したデジタルデータである。学習装置は、まず取得した学習対象の時系列データからW個の時間的に連続するデータを抽出する。この抽出したW個のデータを部分列データと呼び、Wを部分列データ長と呼ぶ。そして、学習装置は、時系列データを抽出する対象の時刻を少しずつずらしながら複数の部分列データを順次生成する。 The time-series data to be learned is digital data in which time and data are associated with each other and continuous values are converted into discrete data at a specific sampling rate. The learning device first extracts W temporally continuous data from the acquired time-series data of the learning target. The W data thus extracted is referred to as subsequence data, and W is referred to as the subsequence data length. Then, the learning device sequentially generates the plurality of partial sequence data while slightly shifting the time at which the time-series data is to be extracted.
次に、学習装置は、時系列データを時間的に連続する類似の部分列データにグループ化する。ここで、機器から取得した時系列データは連続性のある値であることが通常であるため、時間的に連続する部分列データが互いに類似する傾向にあることを利用して、時間的に連続する部分列データをグループ化することとしている。また、W個のデータを含む部分列データは、W次元空間上の点とみなすことができる。そこで、部分列データ同士の相違度をW次元空間上の2点間のユークリッド距離で表し、距離が長いほど相違度が大きく、部分列データ同士が互いに類似していないことを表す。 Next, the learning device groups the time-series data into similar partial sequence data that are temporally continuous. Here, since the time-series data obtained from the device is usually a value having continuity, the fact that the temporally continuous sub-sequence data tend to be similar to each other makes use of the temporally continuous data. The sub-sequence data to be grouped. Further, the subsequence data including W data can be regarded as a point in the W-dimensional space. Therefore, the difference between the partial sequence data is represented by the Euclidean distance between two points in the W-dimensional space, and the longer the distance is, the larger the difference is, indicating that the partial sequence data are not similar to each other.
学習装置は、図1に示すように、基準となる先頭の部分列データとの距離が特定の閾値以下の部分列データをグループ化していく。そして、学習装置は、先頭の部分列データとの距離が特定の閾値を超えた部分列データが表れた場合、その部分列データを新たに先頭の部分列データとして同様の処理を繰り返す。この閾値は、統計値から生成された標本に許容される近似誤差の上限である標本誤差上限εを使って、ε/2とする。この標本誤差上限εは時系列データの統計値を使用してあらかじめ設定されている。そして、グループに属する部分列データは、先頭の部分列データとの距離がすべてε/2以下であることから、先頭の部分列データを表す点を中心としたW次元上の半径ε/2の球の内側に、同一のグループに属するすべての部分列データが含まれることとなるため、同一のグループに属する任意の部分列データ同士の距離はすべてε以下になる。 As illustrated in FIG. 1, the learning device groups the subsequence data whose distance from the reference subsequence data is equal to or smaller than a specific threshold. Then, when partial string data whose distance from the leading partial string data exceeds a specific threshold value appears, the learning apparatus repeats the same processing with the partial string data as a new leading partial string data. This threshold is set to ε / 2 by using a sampling error upper limit ε which is an upper limit of an approximation error allowed for a sample generated from a statistical value. The sampling error upper limit ε is set in advance using the statistical value of the time series data. Since the distance between the subsequence data belonging to the group and the head subsequence data is all ε / 2 or less, the radius ε / 2 on the W dimension centered on the point representing the head subsequence data is obtained. Since all the subsequence data belonging to the same group are included inside the sphere, the distances between arbitrary subsequence data belonging to the same group are all less than or equal to ε.
次に、学習装置はグループ化された部分列データを平均化した中間標本部分列データを生成する。中間標本部分列データはグループに属するすべての部分列データに含まれるW個のデータの統計値で表される。この統計値は、相加平均、相乗平均等の平均値でも良く、その他の統計値でも良い。典型的には、W次元空間において、中間標本部分列データを表す点は、各部分列データの重心であっても良い。例えば、相加平均を統計値として採用するならば、部分列データA(a,b,c)、部分列データB(d,e,f)、部分列データC(g,h,i)の3つの部分列データを含むグループの中間標本部分列データは、((a+d+g)/3,(b+e+h)/3,(c+f+i)/3)となる。 Next, the learning device generates intermediate sample subsequence data by averaging the grouped subsequence data. The intermediate sample subsequence data is represented by a statistical value of W data included in all subsequence data belonging to the group. This statistical value may be an average value such as an arithmetic mean or a geometric mean, or may be another statistical value. Typically, in the W-dimensional space, the point representing the intermediate sample subsequence data may be the center of gravity of each subsequence data. For example, if the arithmetic mean is adopted as the statistical value, the partial sequence data A (a, b, c), the partial sequence data B (d, e, f), and the partial sequence data C (g, h, i) The intermediate sample subsequence data of the group including the three subsequence data is ((a + d + g) / 3, (b + e + h) / 3, (c + f + i) / 3).
次に、学習装置はそれぞれの部分列データの特徴量を算出して、部分列データを特徴量の順にソートする。部分列データの特徴量は、含まれるW個のデータの平均値であっても良い。このソートは、機器から取得した時系列データが周期性を持つことが通常であることを利用した処理である。このようにすれば、学習装置は、時間的に連続していないが互いに類似する部分列データを互いに近くに並べることができる。 Next, the learning device calculates the feature amount of each partial sequence data, and sorts the partial sequence data in order of the feature amount. The feature value of the subsequence data may be an average value of W data included. This sorting is a process utilizing the fact that time-series data acquired from a device usually has periodicity. In this way, the learning device can arrange partial sequence data that are not temporally continuous but are similar to each other close to each other.
次に、学習装置は前述の中間標本部分列データを生成した処理と同様の処理によって、ソートされた複数の中間標本部分列データから類似の中間標本部分列データをグループ化する。そして、学習装置は、グループ化された中間標本部分列データの統計値から学習済み標本部分列データを生成する。 Next, the learning device groups similar intermediate sample subsequence data from the sorted plurality of intermediate sample subsequence data by a process similar to the process of generating the intermediate sample subsequence data described above. Then, the learning device generates learned sample subsequence data from the statistical values of the grouped intermediate sample subsequence data.
さらに、学習装置は、試行データとして新たに時系列データを取得する。そして、学習装置は、学習済み標本部分列データと試行データとの相違度を算出し、その統計値として相違度の平均値m、標準偏差σ等を算出する。そして学習装置は、これらの統計値に基づいて、診断のためのパラメータとして相違度の閾値Thaおよび閾値Thbを決定する。また、部分列データ長Wも診断のためのパラメータに含まれる。 Further, the learning device newly acquires time-series data as trial data. Then, the learning device calculates the degree of difference between the trained sample subsequence data and the trial data, and calculates an average value m of the degree of difference, a standard deviation σ, and the like as statistical values. Then, the learning device determines a threshold value Tha and a threshold value Thb of the degree of difference as parameters for diagnosis based on these statistical values. The substring data length W is also included in the parameter for diagnosis.
ここで、第2の閾値である閾値Thbは第1の閾値である閾値Thaよりも大きい。例えば、Tha=50、Thb=70と設定されているとする。その場合、後述する診断結果情報生成処理において、学習済み標本部分列データとの相違度がThaすなわち50以上の時系列データは異常と判定される。さらに、後述する追加学習の処理において、学習済み標本部分列データとの相違度がThbすなわち70以上の時系列データを学習済み標本部分列データに反映する際は、時系列データから生成された追加用標本部分列データを学習済み標本部分列データに追加する。一方、学習済み標本部分列データとの相違度がThbすなわち70未満の時系列データを学習済み標本部分列データに反映する際は、学習済み標本部分列データを更新する。 Here, the threshold Thb, which is the second threshold, is larger than the threshold Th, which is the first threshold. For example, it is assumed that Tha = 50 and Thb = 70 are set. In this case, in the diagnosis result information generation processing described later, time series data having a degree of difference from the learned sample partial sequence data of Tha, that is, 50 or more, is determined to be abnormal. Further, in the additional learning processing described later, when reflecting the time series data having a difference of Thb from the learned sample subsequence data of 70 or more to the learned sample subsequence data, the additional generation generated from the time series data is performed. The sample subsequence data for training is added to the trained sample subsequence data. On the other hand, when reflecting the time series data having a degree of difference from the learned sample subsequence data of Thb, that is, less than 70, to the learned sample subsequence data, the learned sample subsequence data is updated.
このようにして、学習装置は、学習済みモデルとして、学習済み標本部分列データと、診断のためのパラメータと、を生成する。 In this way, the learning device generates learned sample subsequence data and parameters for diagnosis as a learned model.
次に、本実施の形態に係る時系列データ診断装置10の機能構成について図2を参照して説明する。
Next, a functional configuration of the time-series data
時系列データ診断装置10は、各種データを格納する記憶部11と、時系列データを取得する時系列データ取得部12と、相違度情報を生成する相違度算出部13と、診断結果情報を生成する診断結果情報生成部14と、診断結果情報を出力する診断結果情報出力部15と、評価情報を取得する評価情報取得部16と、学習済み標本部分列データを更新する更新部17と、学習済み標本部分列データを追加する追加部18と、パラメータを更新するパラメータ更新部19と、を備える。
The time-series data
記憶部11は、前述の学習装置が生成した学習済みモデル、すなわち学習済み標本部分列データと、相違度の閾値Thaおよび閾値Thb、部分列データ長W等を含むパラメータと、を格納している。また、記憶部11は、学習装置が生成した中間データである中間標本部分列データも格納している。さらに、記憶部11は、学習装置がパラメータを生成する際に使用した試行データも格納する。
The
時系列データ取得部12は、診断対象の時系列データを時系列データ送信装置30から取得する。
The time-series
相違度算出部13は、取得した時系列データと、記憶部11に格納された学習済み標本部分列データとの相違度を算出する。具体的には、相違度算出部13は、時系列データから部分列データ長Wの部分列データを複数抽出し、抽出した複数の部分列データと学習済み標本部分列データとの距離を算出する。そして、算出した距離のうち最も近い距離を相違度とする。
The
診断結果情報生成部14は、相違度算出部13が生成した相違度と、記憶部11に格納されたパラメータに含まれる閾値Thaと、を比較して、診断結果情報を生成する。具体的には、診断結果情報生成部14は、学習済み標本部分列データとの相違度が閾値Tha以上の場合に、診断対象の時系列データが異常である旨の診断結果情報を生成し、学習済み標本部分列データとの相違度が閾値Tha未満の場合に、診断対象の時系列データが正常である旨の診断結果情報を生成する。
The diagnosis result
診断結果情報出力部15は、診断結果情報生成部14が生成した診断結果情報を出力する。具体的には、診断結果情報出力部15は、後述するディスプレイに診断結果情報を表示する。または、診断結果情報出力部15は、外部の装置、システム等に診断結果情報を送信しても良い。
The diagnosis result
評価情報取得部16は、診断結果情報が妥当な診断結果であるか否かの評価を表す評価情報を取得する。具体的には、診断結果情報出力部15が出力した診断結果情報を閲覧した担当者が、診断対象の時系列データ、実際の機器の状態、過去の経験等を総合的に判断して、診断結果情報が妥当であるか否かを評価する。そして、評価情報取得部16は、担当者が後述するキーボードを操作して入力した評価情報を取得する。診断結果情報が妥当でないという評価には、正常という診断結果であったが異常という診断結果が妥当である場合と、逆に異常という診断結果であったが正常という診断結果が妥当である場合と、が含まれる。なお、評価情報取得部16は、評価情報を外部の装置、システム等から取得しても良い。
The evaluation
更新部17は、相違度算出部13が算出した相違度が閾値Tha以上であり、評価情報取得部16が、妥当な診断結果でないという評価を表す評価情報を取得した場合に、診断結果情報に対応する時系列データから、時間的に連続する相違度がε/2以下の複数の部分列データをグループ化する。そして、更新部17は、各グループに属する部分列データの統計値から更新用中間標本部分列データを生成する。そして、更新部17は、更新用中間標本部分列データと記憶部11に格納された中間標本部分列データとを併せて、相違度がε/2以下のものでさらにグループ化する。そして、更新部17は、各グループに属する更新用中間標本部分列データの統計値から標本部分列データを生成する。さらに、更新部17は、生成された標本部分列データで記憶部11に格納された学習済み標本部分列データを更新する。
When the difference calculated by the
追加部18は、相違度算出部13が算出した相違度が閾値Tha以上であり、評価情報取得部16が、妥当な診断結果でないという評価を表す評価情報を取得した場合に、診断結果情報に対応する時系列データに基づいて追加用標本部分列データを生成する。そして、追加部18は、記憶部11に格納された学習済み標本部分列データに追加用標本部分列データを追加する。
When the difference calculated by the
パラメータ更新部19は、評価情報取得部16が、妥当な診断結果でないという評価を表す評価情報を取得した場合に、更新された標本部分列データに基づいてパラメータを更新する。
The
次に、時系列データ診断装置10のハードウェア構成について、図3を参照して説明する。時系列データ診断装置10は、各種の処理を実行するCPU(Central Processing Unit)101と、揮発性メモリであるRAM(Random Access Memory)102と、不揮発性メモリであるROM(Read Only Memory)103と、各種情報を記憶するハードディスクドライブ104と、操作を受け付けるキーボード105と、情報を表示するディスプレイ106と、情報を送受信するネットワークカード107と、を備える。
Next, a hardware configuration of the time-series data
CPU101は、ハードディスクドライブ104に記憶されているプログラムをRAM102に読み出して実行することにより、後述する各種処理を実行する。
The
RAM102は、揮発性メモリであり、CPU101の作業領域として用いられる。
The
ROM103は、不揮発性メモリであり、CPU101が実行する時系列データ診断装置10の基本動作のための制御プログラム、BIOS(Basic Input Output System)等を記憶する。
The
CPU101、RAM102およびROM103は、協働して、前述の相違度算出部13、診断結果情報生成部14、更新部17、追加部18およびパラメータ更新部19として機能する。
The
ハードディスクドライブ104は、情報を記憶する媒体であり、前述の各種データが格納される。ハードディスクドライブ104は、記憶部11として機能する。
The
キーボード105は、情報入力装置であり、ユーザの操作による各種情報の入力を受ける。キーボード105は、評価情報取得部16として機能する。
The
ディスプレイ106は、液晶パネル、プロジェクタ等の情報表示装置である。ディスプレイ106は、ユーザが操作するために必要な情報を表示する。ディスプレイ106は、診断結果情報出力部15として機能する。
The
ネットワークカード107は、外部機器と情報を通信する通信装置であり、時系列データ送信装置30と通信可能に接続されている。ネットワークカード107は、時系列データ取得部12として機能する。また、場合によっては、ネットワークカード107は、診断結果情報出力部15または評価情報取得部16としても機能する。
The
次に、時系列データ診断装置10の動作について、図4を参照して説明する。
Next, the operation of the time-series data
時系列データ診断装置10の記憶部11には、学習済みモデルとしての学習済み標本部分列データと、相違度の閾値Thaおよび閾値Thb、部分列データ長W等を含むパラメータと、が格納されている。また、記憶部11には、中間標本部分列データおよび試行データも格納されている。したがって、記憶部11は、中間標本部分列データと、学習済み標本部分列データと、パラメータと、を記憶する記憶手段として機能する。
The
時系列データ診断装置10の使用者が、キーボード105を操作して時系列データ診断処理を開始する要求を入力すると、時系列データ診断装置10の時系列データ取得部12は、時系列データ送信装置30から診断対象の時系列データを取得する(ステップS11)。
When the user of the time-series
次に、相違度算出部13は、ステップS11で取得した時系列データと、記憶部11に格納されている学習済み標本部分列データとの相違度を算出する(ステップS12)。具体的には、相違度算出部13は、時系列データから部分列データ長Wの部分列データを複数抽出する。そして、抽出した複数の部分列データと学習済み標本部分列データとの距離をそれぞれ算出する。そして、相違度算出部13は、算出した距離のうち最も近い距離を、時系列データと学習済み標本部分列データとの相違度とする。このステップS12において、相違度算出部13は、診断対象の時系列データと、記憶部11に格納された学習済み標本部分列データと、の相違度を算出する相違度算出手段として機能する。また、このステップS12は、相違度を算出する相違度算出ステップとして機能する。
Next, the
続いて、診断結果情報生成部14は、ステップS12で算出された相違度と閾値Thaとを比較して診断結果情報を生成する(ステップS13)。具体的には、学習済み標本部分列データとの相違度が閾値Tha以上の場合に、診断結果情報生成部14は、診断対象の時系列データが異常である旨の診断結果情報を生成し、学習済み標本部分列データとの相違度が閾値Tha未満の場合に、診断対象の時系列データが正常である旨の診断結果情報を生成する。このステップS13において、診断結果情報生成部14は、相違度算出部13が算出した相違度と第1の閾値とを比較して、診断対象の時系列データの診断結果情報を生成する診断結果情報生成手段として機能する。また、このステップS13は、診断結果情報を生成する診断結果情報生成ステップとして機能する。
Subsequently, the diagnosis result
次に、診断結果情報出力部15は、診断結果情報生成部14が生成した診断結果情報を出力する(ステップS14)。具体的には、診断結果情報出力部15は、ディスプレイ106に診断結果情報を表示する。または、診断結果情報出力部15は、ネットワークカード107を介して、外部の装置、システム等に診断結果情報を送信しても良い。
Next, the diagnosis result
次に、評価情報取得部16は、診断結果情報が妥当な診断結果であるか否かの評価を表す評価情報を取得する(ステップS15)。具体的には、ステップS14で出力された診断結果情報を閲覧した担当者が、診断対象の時系列データ、実際の機器の状態、過去の経験等を総合的に判断して、診断結果情報が妥当な診断結果であるか否かを評価する。そして、評価情報取得部16は、担当者がキーボード105を操作して入力した評価情報を取得する。なお、評価情報取得部16は、評価情報を外部の装置、システム等から取得しても良い。このステップS15において、評価情報取得部16は、診断結果情報が妥当な診断結果であるか否かの評価を表す評価情報を取得する評価情報取得手段として機能する。また、このステップS15は、評価情報を取得する評価情報取得ステップとして機能する。
Next, the evaluation
続いて、時系列データ診断装置10は、ステップS15で取得した評価情報が、妥当な診断結果でないという評価を表すか否かを判定する(ステップS16)。具体的には、時系列データが正常であるという診断結果に対して、時系列データは異常であるという評価であった場合と、時系列データが異常であるという診断結果に対して、時系列データは正常であるという評価であった場合には、評価情報が、妥当な診断結果でないという評価を表すと判定する。
Subsequently, the time-series
時系列データ診断装置10は、ステップS15で取得した評価情報が、妥当な診断結果でないという評価を表すと判定すると(ステップS16:Yes)、ステップS12で算出された相違度が、記憶部11に格納されたパラメータに含まれる閾値Thb未満であるか否かを判定する(ステップS17)。一方、時系列データ診断装置10は、ステップS15で取得した評価情報が、妥当な診断結果であるという評価を表すと判定すると(ステップS16:No)、時系列データ診断処理を終了する。
If the time-series
時系列データ診断装置10が、閾値Thb未満の相違度であると判定すると(ステップS17:Yes)、更新部17は、学習済み標本部分列データを更新する(ステップS18)。具体的には、更新部17は、Thb未満の相違度であった学習済み標本部分列データを更新処理の対象として特定する。そして、更新部17は、図5に示すように、学習済みモデルの構築方法と同様の処理によって中間標本部分列データを生成する。生成された中間標本部分列データを、更新用中間標本部分列データと呼ぶ。そして、更新部17は、更新対象の学習済み標本部分列データに対応する記憶部11に格納された中間標本部分列データと、生成した更新用中間標本部分列データと、を併せて、これらの特徴量の順にソートする。
When the time-series data
そして、更新部17は、ソートされた複数の中間標本部分列データから類似の中間標本部分列データをグループ化する。更新部17は、グループ化された中間標本部分列データの統計値から更新後の学習済み標本部分列データを生成する。このステップS18において、更新部17は、生成された標本部分列データで記憶部11に格納された学習済み標本部分列データを更新する更新手段として機能する。また、このステップS18は、学習済み標本部分列データを更新する更新ステップとして機能する。
Then, the updating
図4に戻り、時系列データ診断装置10が、閾値Thb以上の相違度であると判定すると(ステップS17:No)、追加部18は、学習済み標本部分列データに部分列データを追加する(ステップS19)。具体的には、追加部18は、学習済みモデルを構築する際と同じ手順で、診断結果情報に対応する時系列データから追加用標本部分列データを生成する。そして、追加部18は、記憶部11に格納された学習済み標本部分列データに、生成した追加用標本部分列データを追加する。このステップS19において、追加部18は、記憶部11に格納された学習済み標本部分列データに追加用標本部分列データを追加する追加手段として機能する。
Returning to FIG. 4, when the time-series data
ステップS18またはステップS19に続いて、パラメータ更新部19は、記憶部11に格納されている診断のためのパラメータを更新する(ステップS20)。具体的には、パラメータ更新部19は、学習済みモデルを構築する際と同様に、更新または追加された学習済み標本部分列データと、記憶部11に格納されている試行データと、の相違度を算出し、その統計値として相違度の平均値m、標準偏差σ等を再計算する。そして、パラメータ更新部19は、これらの統計値に基づいて、診断のためのパラメータである相違度の閾値Thaおよび閾値Thbを更新する。このステップS20において、パラメータ更新部19は、更新された学習済み標本部分列データに基づいてパラメータを更新するパラメータ更新手段として機能する。
Subsequent to step S18 or step S19, the
本実施の形態に係る時系列データ診断装置10によれば、追加学習の対象の時系列データと学習済みモデル構築に使用した時系列データから学習済みモデルの再構築をするのではなく、学習済みモデルの構築の際に生成された中間標本部分列データを活用して学習済み標本部分列データを生成することができる。したがって、計算量を少なく抑えることができ、追加学習、とりわけ運用中に学習するオンライン学習に適している。また、追加学習に使用する時系列データは、学習済みモデル構築に使用した時系列データとは時間的に連続していないため、学習済みモデルを再構築することと比較してほとんど精度が変わらない結果が得られる。したがって、少ない計算量と高い精度で追加学習をすることができる。
According to the time-series data
また、本実施の形態に係る時系列データ診断装置10は、閾値Thbによって更新部17による学習済み標本部分列データを更新と、追加部18による学習済み標本部分列データへの追加と、を振り分ける。これによって、追加で学習する時系列データと類似する学習済み標本部分列データがある場合はこれを更新し、類似する学習済み標本部分列データが無い場合は、新たに学習済み標本部分列データを追加することになる。そのため、過度に学習済み標本部分列データが増えることがなく、適切な追加学習が可能となる。
In addition, the time-series data
(実施の形態2)
実施の形態1においては、異常という診断結果情報に対して正常という評価情報を取得した場合に、学習済み標本部分列データの更新または追加をする例を示した。本実施の形態においては、正常という診断結果情報に対して異常という評価情報を取得した場合に、学習済み標本部分列データを削除する例を示す。以下、実施の形態1と異なる部分を中心に説明する。(Embodiment 2)
In the first embodiment, an example has been described in which the learned sample subsequence data is updated or added when the evaluation information indicating that the diagnosis result information indicating the abnormality is normal is acquired. In the present embodiment, an example in which learned sample subsequence data is deleted when evaluation information indicating abnormality is acquired for diagnosis result information indicating normality is obtained. Hereinafter, a description will be given focusing on portions different from the first embodiment.
本実施の形態に係る時系列データ診断装置10は、図6に示すように、実施の形態1で説明した機能部の他に、学習済み標本部分列データを削除する削除部20をさらに備える。
As shown in FIG. 6, the time-series data
削除部20は、相違度算出部13が算出した相違度が閾値Tha未満であり、評価情報取得部16が、妥当な診断結果でないという評価を表す評価情報を取得した場合に、診断結果に対応する時系列データとの相違度が閾値Tha未満であった学習済み標本部分列データを記憶部11から削除する。
The
より具体的に、時系列データ診断装置10の動作とともに、図面を参照して説明する。図7に示すように、時系列データ診断装置10は、時系列データ診断処理のステップS16において、ステップS15で取得した評価情報が、妥当な診断結果でないという評価を表すと判定すると(ステップS16:Yes)、ステップS12で算出された相違度が閾値Tha以上であるか否かを判定する(ステップS21)。時系列データ診断装置10は、相違度が閾値Tha以上であると判定すると(ステップS21:Yes)、相違度が閾値Thb未満であるか否かの判定処理であるステップS17に進み、以下は実施の形態1と同じ処理をする。
More specifically, the operation of the time-series data
一方、時系列データ診断装置10が、相違度が閾値Tha未満であると判定すると(ステップS21:No)、削除部20は、相違度が閾値Tha未満の学習済み標本部分列データに対応する中間標本部分列データを削除する(ステップS22)。ステップS12では、時系列データと学習済み標本部分列データとの相違度が最も小さい組み合わせで相違度を算出しているため、時系列データとの相違度が閾値Tha未満の学習済み標本部分列データが少なくとも1つ以上存在するはずである。そこで、具体的には、削除部20は、相違度が閾値Tha未満の学習済み標本部分列データに対応する中間標本部分列データとの相違度を算出する。そして、削除部20は、算出した相違度が閾値Tha未満の中間標本部分列データを削除する。さらに、削除部20は、削除されなかった中間標本部分列データに基づいて学習済み標本部分列データを更新する。このステップS22において、削除部20は、診断対象の時系列データとの相違度が閾値Tha未満である中間標本部分列データを記憶部11から削除して、残った中間標本部分列データに基づいて記憶部11に格納された学習済み標本部分列データを更新する削除手段として機能する。
On the other hand, if the time-series data
ステップS22に続いて、パラメータ更新部19は、実施の形態1と同様に、更新後の学習済み標本部分列データに基づいてパラメータを更新する(ステップS20)。
Subsequent to step S22, the
本実施の形態に係る時系列データ診断装置10は、正常という診断結果情報に対して異常という評価情報を取得した場合に、学習済み標本部分列データを更新する。これによって、学習済み標本部分列データの精度がさらに向上する。
The time-series data
また、本実施の形態に係る時系列データ診断装置10は、中間標本部分列データを削除することによって、学習済み標本部分列データを更新する。したがって、時系列データそのものを削除して中間標本部分列データを削除することに比べて計算量を少なく抑えることができる。また、学習済み標本部分列データを削除するよりも高い精度で追加学習をすることができる。
Further, the time-series data
(変形例)
本発明は、上述した実施の形態に限定されるわけではなく、その他の種々の変更が可能である。(Modification)
The present invention is not limited to the above-described embodiment, and various other modifications are possible.
上述の実施の形態においては、正常な機器の時系列データから学習済みモデルを構築し、学習済みモデルに含まれる学習済み標本部分列データとの相違度が小さい場合に正常と診断する例を示した。しかし、本発明の範囲はこれに限られず、異常な機器の時系列データから学習済みモデルを構築し、学習済みモデルに含まれる学習済み標本部分列データとの相違度が小さい場合に異常と診断する構成であっても良い。この場合、上述の実施の形態における正常と異常とをすべて反対に読み替えることによって、本発明がそのまま適用できる。 In the above-described embodiment, an example is shown in which a trained model is constructed from time-series data of a normal device, and a normal diagnosis is performed when the degree of difference from the trained sample subsequence data included in the trained model is small. Was. However, the scope of the present invention is not limited to this, and a trained model is constructed from the time-series data of the abnormal device, and when the degree of difference from the trained sample subsequence data included in the trained model is small, it is diagnosed as abnormal. The configuration may be as follows. In this case, the present invention can be applied as it is by reading the terms “normal” and “abnormal” in the above-described embodiments in the opposite directions.
上述の実施の形態において、時系列データ診断装置10は、相違度をW次元空間上のユークリッド距離によって算出したが、これは一例であり、他の算出方法によって相違度を算出しても良い。また、時系列データ診断装置10が学習装置を兼ねてもよい。
In the above-described embodiment, the time-series data
相違度、閾値Thaまたは閾値Thbがそれぞれ1つの数値である例を示したが、これらはそれぞれ複数の数値の組み合わせであっても良い。その場合、閾値とは複数の数値に対する条件と解釈すべきである。 Although the example in which each of the dissimilarity, the threshold value Tha, and the threshold value Thb is one numerical value has been described, these may be a combination of a plurality of numerical values. In that case, the threshold should be interpreted as a condition for a plurality of numerical values.
本実施の形態に係る時系列データ診断装置10は、専用の装置によらず、通常のコンピュータを用いて実現可能である。例えば、コンピュータに上述のいずれかを実行するためのプログラムを格納した記録媒体から該プログラムをコンピュータにインストールすることにより、上述の処理を実行する時系列データ診断装置10を構成してもよい。また、複数のコンピュータが協働して動作することによって、1つの時系列データ診断装置10を構成してもよい。
The time-series data
また、コンピュータにプログラムを供給するための手法は、任意である。例えば、通信回線、通信ネットワーク、通信システム等を介して供給してもよい。 The method for supplying the program to the computer is arbitrary. For example, the information may be supplied via a communication line, a communication network, a communication system, or the like.
また、上述の機能の一部をOS(Operating System)が提供する場合には、OSが提供する機能以外の部分をプログラムで提供すればよい。 When a part of the above functions is provided by an OS (Operating System), a part other than the functions provided by the OS may be provided by a program.
なお、本発明は、本発明の広義の精神と範囲を逸脱することなく、様々な実施の形態及び変形が可能とされるものである。また、上述した実施の形態は、この発明を説明するためのものであり、本発明の範囲を限定するものではない。即ち、本発明の範囲は、実施の形態ではなく、請求の範囲によって示される。そして、請求の範囲内及びそれと同等の発明の意義の範囲内で施される様々な変形が、この発明の範囲内とみなされる。 The present invention is capable of various embodiments and modifications without departing from the broad spirit and scope of the present invention. Further, the above-described embodiment is for describing the present invention, and does not limit the scope of the present invention. That is, the scope of the present invention is shown not by the embodiments but by the claims. Various modifications made within the scope of the claims and the equivalents of the invention are considered to be within the scope of the present invention.
10 時系列データ診断装置、11 記憶部、12 時系列データ取得部、13 相違度算出部、14 診断結果情報生成部、15 診断結果情報出力部、16 評価情報取得部、17 更新部、18 追加部、19 パラメータ更新部、20 削除部、30 時系列データ送信装置、101 CPU、102 RAM、103 ROM、104 ハードディスクドライブ、105 キーボード、106 ディスプレイ、107 ネットワークカード。 10 time series data diagnosis device, 11 storage unit, 12 time series data acquisition unit, 13 difference degree calculation unit, 14 diagnosis result information generation unit, 15 diagnosis result information output unit, 16 evaluation information acquisition unit, 17 update unit, 18 addition Unit, 19 parameter updating unit, 20 deleting unit, 30 time series data transmission device, 101 CPU, 102 RAM, 103 ROM, 104 hard disk drive, 105 keyboard, 106 display, 107 network card.
Claims (7)
診断対象の時系列データと、前記記憶手段に格納された前記学習済み標本部分列データと、の相違度を算出する相違度算出手段と、
前記相違度算出手段が算出した前記相違度と前記第1の閾値とを比較して、前記診断対象の時系列データの診断結果情報を生成する診断結果情報生成手段と、
前記診断結果情報が妥当な診断結果であるか否かの評価を表す評価情報を取得する評価情報取得手段と、
前記相違度が前記第1の閾値以上であり、前記評価情報取得手段が、妥当な診断結果でないという評価を表す評価情報を取得した場合に、妥当な診断結果でないと評価された前記診断結果情報に対応する前記診断対象の時系列データから時間的に連続する類似の部分列データでグループ化した各グループの前記部分列データの統計値から更新用中間標本部分列データを生成し、前記更新用中間標本部分列データと前記記憶手段に格納された前記中間標本部分列データとに基づいて標本部分列データを生成し、前記生成された標本部分列データで前記記憶手段に格納された前記学習済み標本部分列データを更新する更新手段と、を備える、
時系列データ診断装置。 Based on the intermediate sample subsequence data generated from the statistical value of the subsequence data of each group obtained by grouping the time series data to be trained with similar temporally continuous subsequence data, and the intermediate sample subsequence data Storage means for storing the learned sample subsequence data generated by the above, and a parameter including a first threshold value ;
Time-series data of a diagnosis target, and a difference calculation unit that calculates a difference between the learned sample subsequence data stored in the storage unit,
A diagnosis result information generation unit that compares the difference calculated by the difference calculation unit with the first threshold, and generates diagnosis result information of the time-series data of the diagnosis target;
Evaluation information acquisition means for acquiring evaluation information indicating whether the diagnosis result information is a valid diagnosis result,
When the degree of difference is equal to or greater than the first threshold, and the evaluation information obtaining unit obtains evaluation information indicating evaluation that is not a valid diagnosis result, the diagnosis result information evaluated as not being a valid diagnosis result Generating an intermediate sample subsequence data for update from the statistical value of the subsequence data of each group grouped by similar subsequence data successive in time from the time- series data of the diagnosis object corresponding to the Generating sample subsequence data based on the intermediate sample subsequence data and the intermediate sample subsequence data stored in the storage means, and storing the learned sampled sequence stored in the storage means with the generated sample subsequence data Updating means for updating the sample subsequence data,
Time series data diagnostic device.
請求項1に記載の時系列データ診断装置。 When the degree of difference is equal to or greater than the first threshold and the evaluation information obtaining unit obtains evaluation information indicating an evaluation that is not a valid diagnosis result, the time series of the diagnosis target corresponding to the diagnosis result information Generating additional sample subsequence data based on the data, further comprising an additional unit that adds the additional sample subsequence data to the learned sample subsequence data stored in the storage unit;
The time-series data diagnostic device according to claim 1 .
前記更新手段は、前記相違度が前記第2の閾値未満である場合に、前記学習済み標本部分列データを更新し、
前記追加手段は、前記相違度が前記第2の閾値以上である場合に、前記生成した追加用標本部分列データを追加する、
請求項2に記載の時系列データ診断装置。 The parameter further includes a second threshold greater than the first threshold;
The updating means updates the learned sample subsequence data when the dissimilarity is less than the second threshold value,
The adding unit adds the generated additional sample subsequence data when the degree of difference is equal to or greater than the second threshold.
The time-series data diagnostic device according to claim 2 .
請求項1から3のいずれか1項に記載の時系列データ診断装置。 When the degree of difference is less than the first threshold value and the evaluation information acquisition unit acquires evaluation information indicating an evaluation that the evaluation result is not a valid diagnosis result, the time-series data of the diagnosis target corresponding to the diagnosis result Of the intermediate sample subsequence data corresponding to the learned sample subsequence data whose difference degree was less than the first threshold value, the difference degree with the time-series data of the diagnosis target corresponding to the diagnosis result is The intermediate sample subsequence data that is less than the first threshold is deleted from the storage unit, and the learned sample subsequence data stored in the storage unit is updated based on the remaining intermediate sample subsequence data. Further comprising:
The time-series data diagnostic device according to any one of claims 1 to 3 .
請求項1から4のいずれか1項に記載の時系列データ診断装置。 A parameter updating unit that updates the parameter based on the updated learned sample subsequence data when the evaluation information obtaining unit obtains evaluation information indicating an evaluation that the diagnosis result information is not a valid diagnosis result. Further comprising,
The time-series data diagnostic device according to any one of claims 1 to 4 .
診断対象の時系列データと、学習対象の時系列データを時間的に連続する類似の部分列データでグループ化した各グループの前記部分列データの統計値から生成された中間標本部分列データに基づいて生成された学習済み標本部分列データとの相違度が妥当でないという評価を表す評価情報を取得した場合に、前記診断対象の時系列データから時間的に連続する類似の部分列データでグループ化した各グループの前記部分列データの統計値から更新用中間標本部分列データを生成し、
前記更新用中間標本部分列データと、前記中間標本部分列データと、に基づいて標本部分列データを生成し、
前記生成された標本部分列データで、前記学習済み標本部分列データを更新する、
追加学習方法。 Executed by the time-series data diagnostic device,
Based on the time-series data of the diagnosis target and the intermediate sample sub-sequence data generated from the statistical value of the sub-sequence data of each group obtained by grouping the time-series data of the learning target with similar temporally continuous sub-sequence data. When the evaluation information indicating the evaluation that the degree of difference from the learned sample subsequence data generated by the above is not appropriate is acquired, the data is grouped by similar subsequence data that is temporally continuous from the time series data of the diagnosis target . Generating an intermediate sample subsequence data for update from the statistical value of the subsequence data of each group,
Wherein the intermediate samples subsequence data for updating, and the intermediate samples subsequence data to generate sample subsequence data based on,
Wherein the generated specimen subsequence data, updating the learned sample subsequence data,
Additional learning method.
診断対象の時系列データと、学習対象の時系列データを時間的に連続する類似の部分列データでグループ化した各グループの前記部分列データの統計値から生成された中間標本部分列データに基づいて生成された学習済み標本部分列データと、の相違度を算出する相違度算出ステップと、
前記相違度算出ステップで算出した前記相違度と第1の閾値とを比較して、前記診断対象の時系列データの診断結果情報を生成する診断結果情報生成ステップと、
前記診断結果情報が妥当な診断結果であるか否かの評価を表す評価情報を取得する評価情報取得ステップと、
前記相違度が前記第1の閾値以上であり、前記評価情報取得ステップで、妥当な診断結果でないという評価を表す評価情報を取得した場合に、妥当な診断結果でないと評価された前記診断結果情報に対応する前記診断対象の時系列データから時間的に連続する類似の部分列データでグループ化した各グループの前記部分列データの統計値から更新用中間標本部分列データを生成し、前記更新用中間標本部分列データと前記中間標本部分列データとに基づいて標本部分列データを生成し、前記生成された標本部分列データで前記学習済み標本部分列データを更新する更新ステップと、
を実行させるためのプログラム。 On the computer,
Based on the time-series data of the diagnosis target and the intermediate sample sub-sequence data generated from the statistical value of the sub-sequence data of each group obtained by grouping the time-series data of the learning target with similar temporally continuous sub-sequence data. A difference calculation step of calculating a difference between the learned sample subsequence data generated and
A diagnosis result information generation step of comparing the difference calculated in the difference calculation step with a first threshold to generate diagnosis result information of the time-series data of the diagnosis target;
An evaluation information obtaining step of obtaining evaluation information indicating whether the diagnosis result information is a valid diagnosis result or not;
When the degree of difference is equal to or greater than the first threshold and the evaluation information obtaining step obtains evaluation information indicating an evaluation that is not a valid diagnosis result, the diagnosis result information evaluated as not a proper diagnosis result Generating an intermediate sample subsequence data for update from the statistical value of the subsequence data of each group grouped by similar subsequence data successive in time from the time- series data of the diagnosis object corresponding to the An updating step of generating sample subsequence data based on the intermediate sample subsequence data and the intermediate sample subsequence data, and updating the learned sample subsequence data with the generated sample subsequence data;
A program for executing
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2018/027441 WO2020021587A1 (en) | 2018-07-23 | 2018-07-23 | Time-sequential data diagnosis device, additional learning method, and program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP6661839B1 true JP6661839B1 (en) | 2020-03-11 |
JPWO2020021587A1 JPWO2020021587A1 (en) | 2020-07-30 |
Family
ID=69180920
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019526332A Active JP6661839B1 (en) | 2018-07-23 | 2018-07-23 | Time series data diagnosis device, additional learning method, and program |
Country Status (4)
Country | Link |
---|---|
US (1) | US11093314B2 (en) |
JP (1) | JP6661839B1 (en) |
CN (1) | CN112449696B (en) |
WO (1) | WO2020021587A1 (en) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2023287118A1 (en) * | 2021-07-16 | 2023-01-19 | 주식회사 휴이노 | Method, system, and non-transitory computer-readable recording medium for managing output data of analysis model for bio-signal |
KR20230012942A (en) * | 2021-07-16 | 2023-01-26 | 주식회사 휴이노 | Method, system and non-transitory computer-readable recording medium for managing output data of analysis model for bio-signal |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11373243B2 (en) * | 2019-02-11 | 2022-06-28 | TD Ameritrade IP Compnay, Inc. | Time-series pattern matching system |
JP2021140303A (en) * | 2020-03-03 | 2021-09-16 | トヨタ自動車株式会社 | Learning method, learning system and learning program |
JP7310673B2 (en) * | 2020-03-23 | 2023-07-19 | 横河電機株式会社 | Data management system, data management method, and data management program |
CN112098850B (en) * | 2020-09-21 | 2024-03-08 | 山东工商学院 | Lithium ion battery voltage fault diagnosis method and system based on SDO algorithm |
CN114580982B (en) * | 2022-05-07 | 2022-08-05 | 昆仑智汇数据科技(北京)有限公司 | Method, device and equipment for evaluating data quality of industrial equipment |
CN115392812B (en) * | 2022-10-31 | 2023-03-24 | 成都飞机工业(集团)有限责任公司 | Abnormal root cause positioning method, device, equipment and medium |
CN116383190B (en) * | 2023-05-15 | 2023-08-25 | 青岛场外市场清算中心有限公司 | Intelligent cleaning method and system for massive financial transaction big data |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012252556A (en) * | 2011-06-03 | 2012-12-20 | Mitsubishi Heavy Ind Ltd | Plant monitoring device, plant monitoring program and plant monitoring method |
WO2014207789A1 (en) * | 2013-06-24 | 2014-12-31 | 株式会社 日立製作所 | Status monitoring device |
JP2015088078A (en) * | 2013-11-01 | 2015-05-07 | 株式会社日立パワーソリューションズ | Abnormality sign detection system and abnormality sign detection method |
JP2017151598A (en) * | 2016-02-23 | 2017-08-31 | 株式会社安川電機 | Abnormality determination device, abnormality determination program, abnormality determination system, and motor controller |
Family Cites Families (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5018444B2 (en) | 2007-12-13 | 2012-09-05 | 株式会社豊田中央研究所 | Vehicle fault diagnosis and prediction device |
JP5301310B2 (en) * | 2009-02-17 | 2013-09-25 | 株式会社日立製作所 | Anomaly detection method and anomaly detection system |
JP5341800B2 (en) * | 2010-03-11 | 2013-11-13 | アズビル株式会社 | Control model update device, control model update method, air conditioning control system, data validity judgment device |
JP5455866B2 (en) * | 2010-10-28 | 2014-03-26 | 株式会社日立製作所 | Abnormality diagnosis device and industrial machine |
US10430733B2 (en) * | 2013-09-11 | 2019-10-01 | Hitachi, Ltd. | Analysis method for time series data and device therefor |
JP5480440B1 (en) | 2013-12-03 | 2014-04-23 | 株式会社日立パワーソリューションズ | Abnormal sign diagnostic apparatus and abnormal sign diagnostic method |
JP5684941B1 (en) | 2014-07-31 | 2015-03-18 | 株式会社日立パワーソリューションズ | Abnormal sign diagnostic apparatus and abnormal sign diagnostic method |
US10223069B2 (en) * | 2015-01-22 | 2019-03-05 | Mitsubishi Electric Corporation | Time-series data search device and computer readable medium |
JP6877245B2 (en) * | 2017-06-01 | 2021-05-26 | 株式会社東芝 | Information processing equipment, information processing methods and computer programs |
DE112017005640T5 (en) * | 2017-07-31 | 2019-08-22 | Mitsubishi Electric Corporation | Information processing apparatus and information processing method |
CN108231177A (en) * | 2017-12-28 | 2018-06-29 | 深圳开立生物医疗科技股份有限公司 | A kind of auxiliary update method, system and device |
US10885048B2 (en) * | 2019-02-11 | 2021-01-05 | Td Ameritrade Ip Company, Inc. | Time-series pattern matching system |
-
2018
- 2018-07-23 JP JP2019526332A patent/JP6661839B1/en active Active
- 2018-07-23 CN CN201880095747.6A patent/CN112449696B/en active Active
- 2018-07-23 US US15/734,229 patent/US11093314B2/en active Active
- 2018-07-23 WO PCT/JP2018/027441 patent/WO2020021587A1/en active Application Filing
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012252556A (en) * | 2011-06-03 | 2012-12-20 | Mitsubishi Heavy Ind Ltd | Plant monitoring device, plant monitoring program and plant monitoring method |
WO2014207789A1 (en) * | 2013-06-24 | 2014-12-31 | 株式会社 日立製作所 | Status monitoring device |
JP2015088078A (en) * | 2013-11-01 | 2015-05-07 | 株式会社日立パワーソリューションズ | Abnormality sign detection system and abnormality sign detection method |
JP2017151598A (en) * | 2016-02-23 | 2017-08-31 | 株式会社安川電機 | Abnormality determination device, abnormality determination program, abnormality determination system, and motor controller |
Non-Patent Citations (1)
Title |
---|
平井 規郎: "設備維持管理向けデータ分析技術", 三菱電機技報, vol. 第90巻 第7号, JPN6019032439, 20 July 2016 (2016-07-20), pages 40 - 44, ISSN: 0004101117 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2023287118A1 (en) * | 2021-07-16 | 2023-01-19 | 주식회사 휴이노 | Method, system, and non-transitory computer-readable recording medium for managing output data of analysis model for bio-signal |
KR20230012942A (en) * | 2021-07-16 | 2023-01-26 | 주식회사 휴이노 | Method, system and non-transitory computer-readable recording medium for managing output data of analysis model for bio-signal |
KR102573416B1 (en) * | 2021-07-16 | 2023-09-04 | 주식회사 휴이노 | Method, system and non-transitory computer-readable recording medium for managing output data of analysis model for bio-signal |
Also Published As
Publication number | Publication date |
---|---|
CN112449696B (en) | 2022-04-29 |
WO2020021587A1 (en) | 2020-01-30 |
US20210216386A1 (en) | 2021-07-15 |
JPWO2020021587A1 (en) | 2020-07-30 |
US11093314B2 (en) | 2021-08-17 |
CN112449696A (en) | 2021-03-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6661839B1 (en) | Time series data diagnosis device, additional learning method, and program | |
CN111459700B (en) | Equipment fault diagnosis method, diagnosis device, diagnosis equipment and storage medium | |
US20210136098A1 (en) | Root cause analysis in multivariate unsupervised anomaly detection | |
US20220214957A1 (en) | Machine learning models applied to interaction data for facilitating modifications to online environments | |
US20200143292A1 (en) | Signature enhancement for deviation measurement-based classification of a detected anomaly in an industrial asset | |
US20160255109A1 (en) | Detection method and apparatus | |
JPWO2008120552A1 (en) | Diagnostic system | |
KR20190072652A (en) | Information processing apparatus and information processing method | |
US20220011760A1 (en) | Model fidelity monitoring and regeneration for manufacturing process decision support | |
US20190310618A1 (en) | System and software for unifying model-based and data-driven fault detection and isolation | |
US10572827B2 (en) | Prediction quality assessment | |
CN110750455B (en) | Intelligent online self-updating fault diagnosis method and system based on system log analysis | |
JP6917805B2 (en) | Data filtering device and method | |
CN112700112B (en) | RPA flow adjustment method and device, electronic equipment and storage medium | |
JP2020098373A (en) | Abnormality detection device and program and method for the same | |
JP6668699B2 (en) | Monitoring support device, monitoring support method, and program | |
EP4012667A2 (en) | Data preparation for artificial intelligence models | |
JP2012181739A (en) | Man-hour estimation device, man-hour estimation method, and man-hour estimation program | |
US20210373987A1 (en) | Reinforcement learning approach to root cause analysis | |
JP6710913B2 (en) | Information providing apparatus, information providing method, and program | |
US20220083816A1 (en) | Regression detection and correction in relationships between performance indicators and ai metrics | |
JP2018044958A (en) | Bias estimation device, method of the same, and program | |
US20190362353A1 (en) | Systems and methods for interpreting analytical results | |
JP7052914B1 (en) | Abnormality diagnosis system, abnormality diagnosis device, abnormality diagnosis method, and program | |
US20230306349A1 (en) | Benchmarking processes of an organization to standardized processes |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190515 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20190515 |
|
A871 | Explanation of circumstances concerning accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A871 Effective date: 20190515 |
|
A975 | Report on accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A971005 Effective date: 20190815 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20190827 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20191025 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20200114 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20200212 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6661839 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |