JP6661839B1 - Time series data diagnosis device, additional learning method, and program - Google Patents

Time series data diagnosis device, additional learning method, and program Download PDF

Info

Publication number
JP6661839B1
JP6661839B1 JP2019526332A JP2019526332A JP6661839B1 JP 6661839 B1 JP6661839 B1 JP 6661839B1 JP 2019526332 A JP2019526332 A JP 2019526332A JP 2019526332 A JP2019526332 A JP 2019526332A JP 6661839 B1 JP6661839 B1 JP 6661839B1
Authority
JP
Japan
Prior art keywords
data
time
diagnosis result
sample subsequence
series data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2019526332A
Other languages
Japanese (ja)
Other versions
JPWO2020021587A1 (en
Inventor
隆彦 増崎
隆彦 増崎
督 那須
督 那須
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Application granted granted Critical
Publication of JP6661839B1 publication Critical patent/JP6661839B1/en
Publication of JPWO2020021587A1 publication Critical patent/JPWO2020021587A1/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B23/00Testing or monitoring of control systems or parts thereof
    • G05B23/02Electric testing or monitoring
    • G05B23/0205Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults
    • G05B23/0218Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults characterised by the fault detection method dealing with either existing or incipient faults
    • G05B23/0224Process history based detection method, e.g. whereby history implies the availability of large amounts of data
    • G05B23/024Quantitative history assessment, e.g. mathematical relationships between available data; Functions therefor; Principal component analysis [PCA]; Partial least square [PLS]; Statistical classifiers, e.g. Bayesian networks, linear regression or correlation analysis; Neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/079Root cause analysis, i.e. error or fault diagnosis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0751Error or fault detection not based on redundancy
    • G06F11/0754Error or fault detection not based on redundancy by exceeding limits
    • G06F11/076Error or fault detection not based on redundancy by exceeding limits by exceeding a count or rate limit, e.g. word- or bit count limit
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0766Error or fault reporting or storing
    • G06F11/0775Content or structure details of the error report, e.g. specific table structure, specific error fields
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/2228Indexing structures
    • G06F16/2237Vectors, bitmaps or matrices
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0706Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
    • G06F11/0736Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment in functional embedded systems, i.e. in a data processing system designed as a combination of hardware and software dedicated to performing a certain function
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0751Error or fault detection not based on redundancy

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Quality & Reliability (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Mathematical Physics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Medical Informatics (AREA)
  • Computing Systems (AREA)
  • Databases & Information Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Automation & Control Theory (AREA)
  • Testing And Monitoring For Control Systems (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

時系列データ診断装置(10)は、記憶部(11)と、相違度算出部(13)と、診断結果情報生成部(14)と、評価情報取得部(16)と、更新部(17)と、を備える。相違度算出部(13)は、診断対象の時系列データと、記憶手段に格納された学習済み標本部分列データと、の相違度を算出する。診断結果情報生成部(14)は、相違度算出部(13)が算出した相違度に基づいて診断対象の時系列データの診断結果情報を生成する。評価情報取得部(16)は、診断結果情報が妥当な診断結果であるか否かの評価を表す評価情報を取得する。更新部(17)は、評価情報取得部(16)が、妥当な診断結果でないという評価を表す評価情報を取得した場合に、診断結果情報に対応する診断対象の時系列データに基づいて記憶部(11)に格納された学習済み標本部分列データを更新する。The time-series data diagnostic device (10) includes a storage unit (11), a dissimilarity calculation unit (13), a diagnosis result information generation unit (14), an evaluation information acquisition unit (16), and an update unit (17). And A dissimilarity calculation unit (13) calculates a dissimilarity between the time-series data to be diagnosed and the learned sample subsequence data stored in the storage means. The diagnosis result information generation unit (14) generates diagnosis result information of the time-series data of the diagnosis target based on the difference degree calculated by the difference degree calculation unit (13). An evaluation information acquisition unit (16) acquires evaluation information indicating an evaluation as to whether the diagnosis result information is a proper diagnosis result. The update unit (17) stores the evaluation information acquisition unit (16) based on the time-series data of the diagnosis target corresponding to the diagnosis result information when the evaluation information acquisition unit (16) acquires the evaluation information indicating the evaluation that the diagnosis result is not appropriate. The learned sample subsequence data stored in (11) is updated.

Description

本発明は、時系列データ診断装置、追加学習方法およびプログラムに関する。   The present invention relates to a time-series data diagnosis device, an additional learning method, and a program.

ビル、工場等の設備、工場のラインの機器、自動車、鉄道車両等には、時間の経過に従って得られた種々の時系列データが蓄積される。この時系列データを診断して、機器の異常を検知する装置が研究されている。また、これらの装置が正常時もしくは異常時の時系列データを学習して、診断精度を上げる研究もされている。例えば、特許文献1には、診断において比較対象となる学習済みモデルとして、時系列データから抽出した部分列データのうち、互いに類似する部分列データの統計値から標本部分列データを生成する技術が開示されている。この生成された標本部分列データを診断の比較対象とすることによって、精度と計算量のバランスを取っている。   Various time-series data obtained over time are accumulated in equipment such as buildings and factories, equipment on factory lines, automobiles, railway vehicles, and the like. A device that diagnoses the time-series data and detects an abnormality of the device has been studied. In addition, studies have been made to improve the diagnostic accuracy by learning time-series data of these devices in normal or abnormal times. For example, Patent Literature 1 discloses a technique of generating sample subsequence data from statistical values of similar subsequence data among subsequence data extracted from time-series data as a learned model to be compared in diagnosis. It has been disclosed. By using the generated sample subsequence data as a comparison target for diagnosis, the accuracy and the amount of calculation are balanced.

国際公開第2016/117086号International Publication No. 2016/117086 特開2016−033778号公報JP-A-2006-033778

学習済みモデルとなる標本部分列データは、最初から高い精度で生成することが望ましい。しかし、時間的または経済的な制約によって必ずしも最初から完全な精度にはならない。また、機器の経年劣化、季節変動等の運用中のさまざまな状況の変化に対応する必要がある。そこで、運用中であっても追加で学習することによって標本部分列データを更新できることが望ましい。これに対して、特許文献1には、運用中に学習済みモデルを更新する追加学習の方法についての開示は無い。一方、特許文献2には、診断手段によって故障の予兆なしと診断された時系列データを、当該時系列データが属する時間帯のクラスタに追加して、当該クラスタを更新する技術が開示されている。しかし、特許文献2に記載された技術は、追加した時系列データと追加前のメンバである複数の時系列データとに基づいてクラスタを更新する技術であるために、計算量が多くなる。したがって、処理スピードが要求される運用中の追加学習に適しているとは言えない。また、単純に少ない計算量とすることによって学習の精度が著しく低くなると、実運用に耐えられなくなってしまう。   It is desirable that sample subsequence data to be a trained model be generated with high accuracy from the beginning. However, due to time or economic constraints, the accuracy is not always perfect from the beginning. It is also necessary to cope with changes in various situations during operation, such as aging of equipment and seasonal fluctuations. Therefore, it is desirable that the sample subsequence data can be updated by additionally learning even during operation. On the other hand, Patent Literature 1 does not disclose a method of additional learning for updating a learned model during operation. On the other hand, Patent Literature 2 discloses a technique in which time series data diagnosed by the diagnosis unit as having no sign of failure is added to a cluster in a time zone to which the time series data belongs, and the cluster is updated. . However, the technique described in Patent Literature 2 is a technique for updating a cluster based on the added time-series data and a plurality of time-series data which are members before the addition, and thus requires a large amount of calculation. Therefore, it cannot be said that it is suitable for additional learning during operation that requires processing speed. Also, if the accuracy of learning is significantly reduced by simply setting a small amount of calculation, it becomes impossible to withstand actual operation.

本発明は、上記実情に鑑みてなされたものであり、少ない計算量と高い精度で追加学習をすることができる時系列データ診断装置、追加学習方法およびプログラムを提供することを目的とする。   The present invention has been made in view of the above circumstances, and has as its object to provide a time-series data diagnosis device, an additional learning method, and a program that can perform additional learning with a small amount of calculation and high accuracy.

上記目的を達成するため、本発明の時系列データ診断装置は、記憶手段と、相違度算出手段と、診断結果情報生成手段と、評価情報取得手段と、更新手段と、を備える。記憶手段は、学習対象の時系列データを時間的に連続する類似の部分列データでグループ化した各グループの部分列データの統計値から生成された中間標本部分列データと、中間標本部分列データに基づいて生成された学習済み標本部分列データと、第1の閾値を含むパラメータと、を記憶する。相違度算出手段は、診断対象の時系列データと、記憶手段に格納された学習済み標本部分列データと、の相違度を算出する。診断結果情報生成手段は、相違度算出手段が算出した相違度と第1の閾値とを比較して、診断対象の時系列データの診断結果情報を生成する。評価情報取得手段は、診断結果情報が妥当な診断結果であるか否かの評価を表す評価情報を取得する。更新手段は、相違度が第1の閾値以上であり、評価情報取得手段が、妥当な診断結果でないという評価を表す評価情報を取得した場合に、妥当な診断結果でないと評価された診断結果情報に対応する診断対象の時系列データから時間的に連続する類似の部分列データでグループ化した各グループの部分列データの統計値から更新用中間標本部分列データを生成し、更新用中間標本部分列データと記憶手段に格納された中間標本部分列データとに基づいて標本部分列データを生成し、生成された標本部分列データで記憶手段に格納された学習済み標本部分列データを更新する。 In order to achieve the above object, a time-series data diagnosis apparatus of the present invention includes a storage unit, a difference calculation unit, a diagnosis result information generation unit, an evaluation information acquisition unit, and an update unit. The storage means includes intermediate sample subsequence data generated from statistical values of subsequence data of each group obtained by grouping time series data to be learned with similar temporally continuous subsequence data, and intermediate sample subsequence data. And the learned sample subsequence data generated based on the above , and parameters including the first threshold value . The dissimilarity calculating means calculates the dissimilarity between the time-series data to be diagnosed and the learned sample subsequence data stored in the storage means. The diagnosis result information generation unit compares the difference calculated by the difference calculation unit with the first threshold to generate diagnosis result information of the time-series data to be diagnosed. The evaluation information obtaining means obtains evaluation information indicating whether or not the diagnosis result information is a valid diagnosis result. The updating means, when the degree of difference is equal to or greater than the first threshold, and when the evaluation information obtaining means obtains evaluation information indicating an evaluation that is not a valid diagnostic result, the diagnostic result information evaluated as not being a valid diagnostic result Generating an intermediate sample subsequence data for update from the statistical value of the subsequence data of each group grouped by similar subsequence data that is temporally continuous from the time series data of the diagnosis target corresponding to Sample subsequence data is generated based on the column data and the intermediate sample subsequence data stored in the storage unit, and the learned sample subsequence data stored in the storage unit is updated with the generated sample subsequence data.

本発明によれば、学習対象の時系列データに基づいて生成された学習済み標本部分列データを更新することによって、少ない計算量と高い精度で追加学習をすることができる時系列データ診断装置を提供することができる。   According to the present invention, there is provided a time-series data diagnostic apparatus that can perform additional learning with a small amount of calculation and high accuracy by updating learned sample subsequence data generated based on time-series data to be learned. Can be provided.

本発明の実施の形態1に係る学習済みモデル構築方法の一例を表す図The figure showing an example of the learned model construction method according to Embodiment 1 of the present invention. 本発明の実施の形態1に係る時系列データ診断装置の機能ブロック図Functional block diagram of a time-series data diagnostic device according to Embodiment 1 of the present invention 本発明の実施の形態1に係る時系列データ診断装置のハードウェア構成図FIG. 2 is a hardware configuration diagram of the time-series data diagnostic device according to the first embodiment of the present invention. 本発明の実施の形態1に係る時系列データ診断処理のフローチャートFlowchart of time-series data diagnosis processing according to Embodiment 1 of the present invention 本発明の実施の形態1に係る学習済み標本部分列データの更新方法の一例を表す図The figure showing an example of the updating method of the trained sample subsequence data according to Embodiment 1 of the present invention. 本発明の実施の形態2に係る時系列データ診断装置の機能ブロック図Functional block diagram of a time-series data diagnostic device according to Embodiment 2 of the present invention 本発明の実施の形態2に係る時系列データ診断処理のフローチャートFlowchart of time-series data diagnosis processing according to Embodiment 2 of the present invention

(実施の形態1)
以下、本発明の時系列データ診断装置、追加学習方法およびプログラムを運用中のオンライン学習に適用した実施の形態について、図面を参照して説明する。
(Embodiment 1)
Hereinafter, an embodiment in which a time-series data diagnosis device, an additional learning method, and a program of the present invention are applied to online learning during operation will be described with reference to the drawings.

診断の対象となる時系列データは、ビル、工場等の設備、工場のラインの機器、自動車、鉄道車両等に取り付けられた温度計、振動計、電圧計等のさまざまなセンサから時間の経過に従って得られた種々のデータである。そして、時系列データ診断装置は、これらの機器の状態を監視する目的で、時系列データを取得してリアルタイムに診断し、診断結果を出力する。   The time series data to be diagnosed is based on the passage of time from various sensors such as buildings, factories, etc., factory line equipment, thermometers, vibration meters, voltmeters, etc. attached to automobiles, railway vehicles, etc. These are various data obtained. Then, the time-series data diagnosis device acquires time-series data, diagnoses the data in real time, and outputs a diagnosis result in order to monitor the states of these devices.

実際には、時系列データ診断装置を使用する前に、学習装置によって学習済みモデルを構築する。そして、時系列データ診断装置は、学習済みモデルを参照して、リアルタイムに送信される時系列データを診断する。さらに、時系列データ診断装置は、診断の精度を上げるため、運用中に追加学習することによって学習済みモデルを更新する。   In practice, a learned model is constructed by a learning device before using the time-series data diagnosis device. Then, the time-series data diagnosis device diagnoses the time-series data transmitted in real time with reference to the learned model. Further, the time-series data diagnosis device updates the learned model by performing additional learning during operation in order to increase the accuracy of diagnosis.

最初に、本実施の形態の前提となる学習済みモデルの構築方法について、図1を参照して説明する。   First, a method of constructing a learned model as a premise of the present embodiment will be described with reference to FIG.

本実施の形態にかかる時系列データ診断装置とは別の学習装置が学習済みモデルを構築する例を示す。ただし、時系列データ診断装置が学習装置を兼ねても良い。また、本実施の形態では、学習装置が正常な時系列データを取得して学習済みモデルを生成することによって、時系列データ診断装置が生成された学習済みモデルと類似する時系列データを正常と診断する。   An example is shown in which a learning device different from the time-series data diagnosis device according to the present embodiment constructs a learned model. However, the time-series data diagnosis device may double as the learning device. Further, in the present embodiment, the learning device acquires normal time-series data and generates a learned model, so that the time-series data diagnostic device determines that the time-series data similar to the generated learned model is normal. Diagnose.

学習対象の時系列データは時刻とデータとが関連付けられていて、連続した値を特定のサンプリングレートで離散データに変換したデジタルデータである。学習装置は、まず取得した学習対象の時系列データからW個の時間的に連続するデータを抽出する。この抽出したW個のデータを部分列データと呼び、Wを部分列データ長と呼ぶ。そして、学習装置は、時系列データを抽出する対象の時刻を少しずつずらしながら複数の部分列データを順次生成する。   The time-series data to be learned is digital data in which time and data are associated with each other and continuous values are converted into discrete data at a specific sampling rate. The learning device first extracts W temporally continuous data from the acquired time-series data of the learning target. The W data thus extracted is referred to as subsequence data, and W is referred to as the subsequence data length. Then, the learning device sequentially generates the plurality of partial sequence data while slightly shifting the time at which the time-series data is to be extracted.

次に、学習装置は、時系列データを時間的に連続する類似の部分列データにグループ化する。ここで、機器から取得した時系列データは連続性のある値であることが通常であるため、時間的に連続する部分列データが互いに類似する傾向にあることを利用して、時間的に連続する部分列データをグループ化することとしている。また、W個のデータを含む部分列データは、W次元空間上の点とみなすことができる。そこで、部分列データ同士の相違度をW次元空間上の2点間のユークリッド距離で表し、距離が長いほど相違度が大きく、部分列データ同士が互いに類似していないことを表す。   Next, the learning device groups the time-series data into similar partial sequence data that are temporally continuous. Here, since the time-series data obtained from the device is usually a value having continuity, the fact that the temporally continuous sub-sequence data tend to be similar to each other makes use of the temporally continuous data. The sub-sequence data to be grouped. Further, the subsequence data including W data can be regarded as a point in the W-dimensional space. Therefore, the difference between the partial sequence data is represented by the Euclidean distance between two points in the W-dimensional space, and the longer the distance is, the larger the difference is, indicating that the partial sequence data are not similar to each other.

学習装置は、図1に示すように、基準となる先頭の部分列データとの距離が特定の閾値以下の部分列データをグループ化していく。そして、学習装置は、先頭の部分列データとの距離が特定の閾値を超えた部分列データが表れた場合、その部分列データを新たに先頭の部分列データとして同様の処理を繰り返す。この閾値は、統計値から生成された標本に許容される近似誤差の上限である標本誤差上限εを使って、ε/2とする。この標本誤差上限εは時系列データの統計値を使用してあらかじめ設定されている。そして、グループに属する部分列データは、先頭の部分列データとの距離がすべてε/2以下であることから、先頭の部分列データを表す点を中心としたW次元上の半径ε/2の球の内側に、同一のグループに属するすべての部分列データが含まれることとなるため、同一のグループに属する任意の部分列データ同士の距離はすべてε以下になる。   As illustrated in FIG. 1, the learning device groups the subsequence data whose distance from the reference subsequence data is equal to or smaller than a specific threshold. Then, when partial string data whose distance from the leading partial string data exceeds a specific threshold value appears, the learning apparatus repeats the same processing with the partial string data as a new leading partial string data. This threshold is set to ε / 2 by using a sampling error upper limit ε which is an upper limit of an approximation error allowed for a sample generated from a statistical value. The sampling error upper limit ε is set in advance using the statistical value of the time series data. Since the distance between the subsequence data belonging to the group and the head subsequence data is all ε / 2 or less, the radius ε / 2 on the W dimension centered on the point representing the head subsequence data is obtained. Since all the subsequence data belonging to the same group are included inside the sphere, the distances between arbitrary subsequence data belonging to the same group are all less than or equal to ε.

次に、学習装置はグループ化された部分列データを平均化した中間標本部分列データを生成する。中間標本部分列データはグループに属するすべての部分列データに含まれるW個のデータの統計値で表される。この統計値は、相加平均、相乗平均等の平均値でも良く、その他の統計値でも良い。典型的には、W次元空間において、中間標本部分列データを表す点は、各部分列データの重心であっても良い。例えば、相加平均を統計値として採用するならば、部分列データA(a,b,c)、部分列データB(d,e,f)、部分列データC(g,h,i)の3つの部分列データを含むグループの中間標本部分列データは、((a+d+g)/3,(b+e+h)/3,(c+f+i)/3)となる。   Next, the learning device generates intermediate sample subsequence data by averaging the grouped subsequence data. The intermediate sample subsequence data is represented by a statistical value of W data included in all subsequence data belonging to the group. This statistical value may be an average value such as an arithmetic mean or a geometric mean, or may be another statistical value. Typically, in the W-dimensional space, the point representing the intermediate sample subsequence data may be the center of gravity of each subsequence data. For example, if the arithmetic mean is adopted as the statistical value, the partial sequence data A (a, b, c), the partial sequence data B (d, e, f), and the partial sequence data C (g, h, i) The intermediate sample subsequence data of the group including the three subsequence data is ((a + d + g) / 3, (b + e + h) / 3, (c + f + i) / 3).

次に、学習装置はそれぞれの部分列データの特徴量を算出して、部分列データを特徴量の順にソートする。部分列データの特徴量は、含まれるW個のデータの平均値であっても良い。このソートは、機器から取得した時系列データが周期性を持つことが通常であることを利用した処理である。このようにすれば、学習装置は、時間的に連続していないが互いに類似する部分列データを互いに近くに並べることができる。   Next, the learning device calculates the feature amount of each partial sequence data, and sorts the partial sequence data in order of the feature amount. The feature value of the subsequence data may be an average value of W data included. This sorting is a process utilizing the fact that time-series data acquired from a device usually has periodicity. In this way, the learning device can arrange partial sequence data that are not temporally continuous but are similar to each other close to each other.

次に、学習装置は前述の中間標本部分列データを生成した処理と同様の処理によって、ソートされた複数の中間標本部分列データから類似の中間標本部分列データをグループ化する。そして、学習装置は、グループ化された中間標本部分列データの統計値から学習済み標本部分列データを生成する。   Next, the learning device groups similar intermediate sample subsequence data from the sorted plurality of intermediate sample subsequence data by a process similar to the process of generating the intermediate sample subsequence data described above. Then, the learning device generates learned sample subsequence data from the statistical values of the grouped intermediate sample subsequence data.

さらに、学習装置は、試行データとして新たに時系列データを取得する。そして、学習装置は、学習済み標本部分列データと試行データとの相違度を算出し、その統計値として相違度の平均値m、標準偏差σ等を算出する。そして学習装置は、これらの統計値に基づいて、診断のためのパラメータとして相違度の閾値Thaおよび閾値Thbを決定する。また、部分列データ長Wも診断のためのパラメータに含まれる。   Further, the learning device newly acquires time-series data as trial data. Then, the learning device calculates the degree of difference between the trained sample subsequence data and the trial data, and calculates an average value m of the degree of difference, a standard deviation σ, and the like as statistical values. Then, the learning device determines a threshold value Tha and a threshold value Thb of the degree of difference as parameters for diagnosis based on these statistical values. The substring data length W is also included in the parameter for diagnosis.

ここで、第2の閾値である閾値Thbは第1の閾値である閾値Thaよりも大きい。例えば、Tha=50、Thb=70と設定されているとする。その場合、後述する診断結果情報生成処理において、学習済み標本部分列データとの相違度がThaすなわち50以上の時系列データは異常と判定される。さらに、後述する追加学習の処理において、学習済み標本部分列データとの相違度がThbすなわち70以上の時系列データを学習済み標本部分列データに反映する際は、時系列データから生成された追加用標本部分列データを学習済み標本部分列データに追加する。一方、学習済み標本部分列データとの相違度がThbすなわち70未満の時系列データを学習済み標本部分列データに反映する際は、学習済み標本部分列データを更新する。   Here, the threshold Thb, which is the second threshold, is larger than the threshold Th, which is the first threshold. For example, it is assumed that Tha = 50 and Thb = 70 are set. In this case, in the diagnosis result information generation processing described later, time series data having a degree of difference from the learned sample partial sequence data of Tha, that is, 50 or more, is determined to be abnormal. Further, in the additional learning processing described later, when reflecting the time series data having a difference of Thb from the learned sample subsequence data of 70 or more to the learned sample subsequence data, the additional generation generated from the time series data is performed. The sample subsequence data for training is added to the trained sample subsequence data. On the other hand, when reflecting the time series data having a degree of difference from the learned sample subsequence data of Thb, that is, less than 70, to the learned sample subsequence data, the learned sample subsequence data is updated.

このようにして、学習装置は、学習済みモデルとして、学習済み標本部分列データと、診断のためのパラメータと、を生成する。   In this way, the learning device generates learned sample subsequence data and parameters for diagnosis as a learned model.

次に、本実施の形態に係る時系列データ診断装置10の機能構成について図2を参照して説明する。   Next, a functional configuration of the time-series data diagnostic device 10 according to the present embodiment will be described with reference to FIG.

時系列データ診断装置10は、各種データを格納する記憶部11と、時系列データを取得する時系列データ取得部12と、相違度情報を生成する相違度算出部13と、診断結果情報を生成する診断結果情報生成部14と、診断結果情報を出力する診断結果情報出力部15と、評価情報を取得する評価情報取得部16と、学習済み標本部分列データを更新する更新部17と、学習済み標本部分列データを追加する追加部18と、パラメータを更新するパラメータ更新部19と、を備える。   The time-series data diagnostic device 10 includes a storage unit 11 for storing various data, a time-series data acquisition unit 12 for acquiring time-series data, a dissimilarity calculation unit 13 for generating dissimilarity information, and generating diagnostic result information. A diagnostic result information generating unit 14 that outputs diagnostic result information, a diagnostic result information output unit 15 that outputs diagnostic result information, an evaluation information acquiring unit 16 that acquires evaluation information, an updating unit 17 that updates learned sample subsequence data, An addition unit 18 for adding already-sampled subsequence data and a parameter update unit 19 for updating parameters are provided.

記憶部11は、前述の学習装置が生成した学習済みモデル、すなわち学習済み標本部分列データと、相違度の閾値Thaおよび閾値Thb、部分列データ長W等を含むパラメータと、を格納している。また、記憶部11は、学習装置が生成した中間データである中間標本部分列データも格納している。さらに、記憶部11は、学習装置がパラメータを生成する際に使用した試行データも格納する。   The storage unit 11 stores a learned model generated by the above-described learning device, that is, learned sample subsequence data, and parameters including a threshold value Tha and a threshold value Thb of the degree of difference, a subsequence data length W, and the like. . The storage unit 11 also stores intermediate sample subsequence data, which is intermediate data generated by the learning device. Further, the storage unit 11 also stores trial data used when the learning device generates the parameters.

時系列データ取得部12は、診断対象の時系列データを時系列データ送信装置30から取得する。   The time-series data acquisition unit 12 acquires the time-series data to be diagnosed from the time-series data transmission device 30.

相違度算出部13は、取得した時系列データと、記憶部11に格納された学習済み標本部分列データとの相違度を算出する。具体的には、相違度算出部13は、時系列データから部分列データ長Wの部分列データを複数抽出し、抽出した複数の部分列データと学習済み標本部分列データとの距離を算出する。そして、算出した距離のうち最も近い距離を相違度とする。   The dissimilarity calculating unit 13 calculates a dissimilarity between the acquired time-series data and the learned sample subsequence data stored in the storage unit 11. Specifically, the dissimilarity calculating unit 13 extracts a plurality of partial sequence data having a partial sequence data length W from the time-series data, and calculates a distance between the extracted plurality of partial sequence data and the trained sample partial sequence data. . Then, the closest distance among the calculated distances is set as the degree of difference.

診断結果情報生成部14は、相違度算出部13が生成した相違度と、記憶部11に格納されたパラメータに含まれる閾値Thaと、を比較して、診断結果情報を生成する。具体的には、診断結果情報生成部14は、学習済み標本部分列データとの相違度が閾値Tha以上の場合に、診断対象の時系列データが異常である旨の診断結果情報を生成し、学習済み標本部分列データとの相違度が閾値Tha未満の場合に、診断対象の時系列データが正常である旨の診断結果情報を生成する。   The diagnosis result information generation unit 14 compares the difference generated by the difference calculation unit 13 with a threshold Tha included in the parameters stored in the storage unit 11 to generate diagnosis result information. Specifically, when the degree of difference from the learned sample subsequence data is equal to or greater than the threshold Tha, the diagnosis result information generation unit 14 generates diagnosis result information indicating that the time-series data to be diagnosed is abnormal, When the degree of difference from the trained sample subsequence data is less than the threshold value Tha, diagnostic result information indicating that the time-series data to be diagnosed is normal is generated.

診断結果情報出力部15は、診断結果情報生成部14が生成した診断結果情報を出力する。具体的には、診断結果情報出力部15は、後述するディスプレイに診断結果情報を表示する。または、診断結果情報出力部15は、外部の装置、システム等に診断結果情報を送信しても良い。   The diagnosis result information output unit 15 outputs the diagnosis result information generated by the diagnosis result information generation unit 14. Specifically, the diagnosis result information output unit 15 displays the diagnosis result information on a display described later. Alternatively, the diagnostic result information output unit 15 may transmit the diagnostic result information to an external device, system, or the like.

評価情報取得部16は、診断結果情報が妥当な診断結果であるか否かの評価を表す評価情報を取得する。具体的には、診断結果情報出力部15が出力した診断結果情報を閲覧した担当者が、診断対象の時系列データ、実際の機器の状態、過去の経験等を総合的に判断して、診断結果情報が妥当であるか否かを評価する。そして、評価情報取得部16は、担当者が後述するキーボードを操作して入力した評価情報を取得する。診断結果情報が妥当でないという評価には、正常という診断結果であったが異常という診断結果が妥当である場合と、逆に異常という診断結果であったが正常という診断結果が妥当である場合と、が含まれる。なお、評価情報取得部16は、評価情報を外部の装置、システム等から取得しても良い。   The evaluation information obtaining unit 16 obtains evaluation information indicating whether or not the diagnosis result information is a valid diagnosis result. Specifically, the person in charge who browsed the diagnosis result information output by the diagnosis result information output unit 15 comprehensively judges the time-series data of the diagnosis target, the actual state of the device, the past experience, and the like. Evaluate whether the result information is valid. Then, the evaluation information acquisition unit 16 acquires the evaluation information input by the person in charge operating the keyboard described later. The evaluation that the diagnosis result information is not valid includes the case where the diagnosis result is normal but the diagnosis result is abnormal, and the case where the diagnosis result is abnormal but the diagnosis result is normal is valid. , Is included. The evaluation information acquisition unit 16 may acquire the evaluation information from an external device, system, or the like.

更新部17は、相違度算出部13が算出した相違度が閾値Tha以上であり、評価情報取得部16が、妥当な診断結果でないという評価を表す評価情報を取得した場合に、診断結果情報に対応する時系列データから、時間的に連続する相違度がε/2以下の複数の部分列データをグループ化する。そして、更新部17は、各グループに属する部分列データの統計値から更新用中間標本部分列データを生成する。そして、更新部17は、更新用中間標本部分列データと記憶部11に格納された中間標本部分列データとを併せて、相違度がε/2以下のものでさらにグループ化する。そして、更新部17は、各グループに属する更新用中間標本部分列データの統計値から標本部分列データを生成する。さらに、更新部17は、生成された標本部分列データで記憶部11に格納された学習済み標本部分列データを更新する。   When the difference calculated by the difference calculating unit 13 is equal to or greater than the threshold Tha, and the evaluation information obtaining unit 16 obtains evaluation information indicating an evaluation that is not a valid diagnosis result, the updating unit 17 adds the evaluation information to the diagnosis result information. From the corresponding time-series data, a plurality of partial sequence data having temporally different degrees of difference of ε / 2 or less are grouped. Then, the updating unit 17 generates update intermediate sample subsequence data from the statistical value of the subsequence data belonging to each group. Then, the updating unit 17 combines the intermediate sample subsequence data for update and the intermediate sample subsequence data stored in the storage unit 11 and further groups those having a difference degree of ε / 2 or less. Then, the updating unit 17 generates sample subsequence data from the statistical values of the intermediate sample subsequence data for update belonging to each group. Further, the updating unit 17 updates the learned sample subsequence data stored in the storage unit 11 with the generated sample subsequence data.

追加部18は、相違度算出部13が算出した相違度が閾値Tha以上であり、評価情報取得部16が、妥当な診断結果でないという評価を表す評価情報を取得した場合に、診断結果情報に対応する時系列データに基づいて追加用標本部分列データを生成する。そして、追加部18は、記憶部11に格納された学習済み標本部分列データに追加用標本部分列データを追加する。   When the difference calculated by the difference calculating unit 13 is equal to or greater than the threshold Tha and the evaluation information obtaining unit 16 obtains evaluation information indicating an evaluation that is not a valid diagnosis result, the adding unit 18 determines whether the evaluation result is not a valid diagnosis result. The additional sample subsequence data is generated based on the corresponding time series data. Then, the adding unit 18 adds additional sample subsequence data to the learned sample subsequence data stored in the storage unit 11.

パラメータ更新部19は、評価情報取得部16が、妥当な診断結果でないという評価を表す評価情報を取得した場合に、更新された標本部分列データに基づいてパラメータを更新する。   The parameter updating unit 19 updates the parameters based on the updated sample subsequence data when the evaluation information obtaining unit 16 obtains evaluation information indicating an evaluation that is not a valid diagnosis result.

次に、時系列データ診断装置10のハードウェア構成について、図3を参照して説明する。時系列データ診断装置10は、各種の処理を実行するCPU(Central Processing Unit)101と、揮発性メモリであるRAM(Random Access Memory)102と、不揮発性メモリであるROM(Read Only Memory)103と、各種情報を記憶するハードディスクドライブ104と、操作を受け付けるキーボード105と、情報を表示するディスプレイ106と、情報を送受信するネットワークカード107と、を備える。   Next, a hardware configuration of the time-series data diagnostic device 10 will be described with reference to FIG. The time-series data diagnostic device 10 includes a CPU (Central Processing Unit) 101 that executes various processes, a RAM (Random Access Memory) 102 that is a volatile memory, and a ROM (Read Only Memory) 103 that is a nonvolatile memory. A hard disk drive 104 for storing various information, a keyboard 105 for receiving operations, a display 106 for displaying information, and a network card 107 for transmitting and receiving information.

CPU101は、ハードディスクドライブ104に記憶されているプログラムをRAM102に読み出して実行することにより、後述する各種処理を実行する。   The CPU 101 reads various programs stored in the hard disk drive 104 into the RAM 102 and executes them to execute various processes described below.

RAM102は、揮発性メモリであり、CPU101の作業領域として用いられる。   The RAM 102 is a volatile memory and is used as a work area of the CPU 101.

ROM103は、不揮発性メモリであり、CPU101が実行する時系列データ診断装置10の基本動作のための制御プログラム、BIOS(Basic Input Output System)等を記憶する。   The ROM 103 is a non-volatile memory and stores a control program for the basic operation of the time-series data diagnostic device 10 executed by the CPU 101, a basic input output system (BIOS), and the like.

CPU101、RAM102およびROM103は、協働して、前述の相違度算出部13、診断結果情報生成部14、更新部17、追加部18およびパラメータ更新部19として機能する。   The CPU 101, the RAM 102, and the ROM 103 cooperate to function as the above-described dissimilarity calculation unit 13, diagnosis result information generation unit 14, update unit 17, addition unit 18, and parameter update unit 19.

ハードディスクドライブ104は、情報を記憶する媒体であり、前述の各種データが格納される。ハードディスクドライブ104は、記憶部11として機能する。   The hard disk drive 104 is a medium for storing information, and stores the various data described above. The hard disk drive 104 functions as the storage unit 11.

キーボード105は、情報入力装置であり、ユーザの操作による各種情報の入力を受ける。キーボード105は、評価情報取得部16として機能する。   The keyboard 105 is an information input device, and receives input of various information by a user operation. The keyboard 105 functions as the evaluation information acquisition unit 16.

ディスプレイ106は、液晶パネル、プロジェクタ等の情報表示装置である。ディスプレイ106は、ユーザが操作するために必要な情報を表示する。ディスプレイ106は、診断結果情報出力部15として機能する。   The display 106 is an information display device such as a liquid crystal panel and a projector. The display 106 displays information necessary for the user to operate. The display 106 functions as the diagnosis result information output unit 15.

ネットワークカード107は、外部機器と情報を通信する通信装置であり、時系列データ送信装置30と通信可能に接続されている。ネットワークカード107は、時系列データ取得部12として機能する。また、場合によっては、ネットワークカード107は、診断結果情報出力部15または評価情報取得部16としても機能する。   The network card 107 is a communication device that communicates information with an external device, and is communicably connected to the time-series data transmission device 30. The network card 107 functions as the time-series data acquisition unit 12. In some cases, the network card 107 also functions as the diagnosis result information output unit 15 or the evaluation information acquisition unit 16.

次に、時系列データ診断装置10の動作について、図4を参照して説明する。   Next, the operation of the time-series data diagnostic device 10 will be described with reference to FIG.

時系列データ診断装置10の記憶部11には、学習済みモデルとしての学習済み標本部分列データと、相違度の閾値Thaおよび閾値Thb、部分列データ長W等を含むパラメータと、が格納されている。また、記憶部11には、中間標本部分列データおよび試行データも格納されている。したがって、記憶部11は、中間標本部分列データと、学習済み標本部分列データと、パラメータと、を記憶する記憶手段として機能する。   The storage unit 11 of the time-series data diagnostic device 10 stores learned sample subsequence data as a trained model and parameters including a threshold value Tha and a threshold value Thb of the degree of difference, a subsequence data length W, and the like. I have. The storage unit 11 also stores intermediate sample subsequence data and trial data. Therefore, the storage unit 11 functions as a storage unit that stores the intermediate sample subsequence data, the learned sample subsequence data, and the parameters.

時系列データ診断装置10の使用者が、キーボード105を操作して時系列データ診断処理を開始する要求を入力すると、時系列データ診断装置10の時系列データ取得部12は、時系列データ送信装置30から診断対象の時系列データを取得する(ステップS11)。   When the user of the time-series data diagnosis device 10 inputs a request to start the time-series data diagnosis process by operating the keyboard 105, the time-series data acquisition unit 12 of the time-series data diagnosis device 10 The time series data of the diagnosis target is acquired from 30 (step S11).

次に、相違度算出部13は、ステップS11で取得した時系列データと、記憶部11に格納されている学習済み標本部分列データとの相違度を算出する(ステップS12)。具体的には、相違度算出部13は、時系列データから部分列データ長Wの部分列データを複数抽出する。そして、抽出した複数の部分列データと学習済み標本部分列データとの距離をそれぞれ算出する。そして、相違度算出部13は、算出した距離のうち最も近い距離を、時系列データと学習済み標本部分列データとの相違度とする。このステップS12において、相違度算出部13は、診断対象の時系列データと、記憶部11に格納された学習済み標本部分列データと、の相違度を算出する相違度算出手段として機能する。また、このステップS12は、相違度を算出する相違度算出ステップとして機能する。   Next, the dissimilarity calculating unit 13 calculates the dissimilarity between the time-series data acquired in step S11 and the learned sample subsequence data stored in the storage unit 11 (step S12). Specifically, the dissimilarity calculating unit 13 extracts a plurality of partial sequence data having a partial sequence data length W from the time-series data. Then, the distance between the extracted plurality of partial sequence data and the learned sample partial sequence data is calculated. Then, the dissimilarity calculating unit 13 determines the closest distance among the calculated distances as the dissimilarity between the time-series data and the trained sample subsequence data. In step S12, the dissimilarity calculating unit 13 functions as a dissimilarity calculating unit that calculates the dissimilarity between the time-series data to be diagnosed and the learned sample subsequence data stored in the storage unit 11. Step S12 functions as a dissimilarity calculation step for calculating the dissimilarity.

続いて、診断結果情報生成部14は、ステップS12で算出された相違度と閾値Thaとを比較して診断結果情報を生成する(ステップS13)。具体的には、学習済み標本部分列データとの相違度が閾値Tha以上の場合に、診断結果情報生成部14は、診断対象の時系列データが異常である旨の診断結果情報を生成し、学習済み標本部分列データとの相違度が閾値Tha未満の場合に、診断対象の時系列データが正常である旨の診断結果情報を生成する。このステップS13において、診断結果情報生成部14は、相違度算出部13が算出した相違度と第1の閾値とを比較して、診断対象の時系列データの診断結果情報を生成する診断結果情報生成手段として機能する。また、このステップS13は、診断結果情報を生成する診断結果情報生成ステップとして機能する。   Subsequently, the diagnosis result information generation unit 14 compares the degree of difference calculated in step S12 with the threshold Tha to generate diagnosis result information (step S13). Specifically, when the degree of difference from the learned sample subsequence data is equal to or greater than the threshold Tha, the diagnosis result information generation unit 14 generates diagnosis result information indicating that the time-series data of the diagnosis target is abnormal, When the degree of difference from the trained sample subsequence data is less than the threshold value Tha, diagnostic result information indicating that the time-series data to be diagnosed is normal is generated. In step S13, the diagnosis result information generation unit 14 compares the difference calculated by the difference calculation unit 13 with the first threshold value, and generates diagnosis result information of time-series data to be diagnosed. Functions as generating means. Step S13 functions as a diagnostic result information generating step of generating diagnostic result information.

次に、診断結果情報出力部15は、診断結果情報生成部14が生成した診断結果情報を出力する(ステップS14)。具体的には、診断結果情報出力部15は、ディスプレイ106に診断結果情報を表示する。または、診断結果情報出力部15は、ネットワークカード107を介して、外部の装置、システム等に診断結果情報を送信しても良い。   Next, the diagnosis result information output unit 15 outputs the diagnosis result information generated by the diagnosis result information generation unit 14 (Step S14). Specifically, the diagnosis result information output unit 15 displays the diagnosis result information on the display 106. Alternatively, the diagnostic result information output unit 15 may transmit the diagnostic result information to an external device, system, or the like via the network card 107.

次に、評価情報取得部16は、診断結果情報が妥当な診断結果であるか否かの評価を表す評価情報を取得する(ステップS15)。具体的には、ステップS14で出力された診断結果情報を閲覧した担当者が、診断対象の時系列データ、実際の機器の状態、過去の経験等を総合的に判断して、診断結果情報が妥当な診断結果であるか否かを評価する。そして、評価情報取得部16は、担当者がキーボード105を操作して入力した評価情報を取得する。なお、評価情報取得部16は、評価情報を外部の装置、システム等から取得しても良い。このステップS15において、評価情報取得部16は、診断結果情報が妥当な診断結果であるか否かの評価を表す評価情報を取得する評価情報取得手段として機能する。また、このステップS15は、評価情報を取得する評価情報取得ステップとして機能する。   Next, the evaluation information acquisition unit 16 acquires evaluation information indicating whether or not the diagnosis result information is a valid diagnosis result (step S15). Specifically, the person who views the diagnosis result information output in step S14 comprehensively determines the time series data of the diagnosis target, the actual device status, past experience, and the like, and the diagnosis result information is displayed. Evaluate whether the results are appropriate. Then, the evaluation information acquisition unit 16 acquires the evaluation information input by the person in charge operating the keyboard 105. The evaluation information acquisition unit 16 may acquire the evaluation information from an external device, system, or the like. In step S15, the evaluation information obtaining unit 16 functions as evaluation information obtaining means for obtaining evaluation information indicating whether or not the diagnosis result information is a valid diagnosis result. Step S15 functions as an evaluation information obtaining step of obtaining evaluation information.

続いて、時系列データ診断装置10は、ステップS15で取得した評価情報が、妥当な診断結果でないという評価を表すか否かを判定する(ステップS16)。具体的には、時系列データが正常であるという診断結果に対して、時系列データは異常であるという評価であった場合と、時系列データが異常であるという診断結果に対して、時系列データは正常であるという評価であった場合には、評価情報が、妥当な診断結果でないという評価を表すと判定する。   Subsequently, the time-series data diagnosis device 10 determines whether or not the evaluation information acquired in step S15 indicates an evaluation that is not a valid diagnosis result (step S16). More specifically, the time series data is evaluated as abnormal with respect to the diagnosis result that the time series data is normal, and the time series data is evaluated as abnormal with respect to the diagnosis result that the time series data is abnormal. If the evaluation is that the data is normal, it is determined that the evaluation information indicates an evaluation that is not a valid diagnosis result.

時系列データ診断装置10は、ステップS15で取得した評価情報が、妥当な診断結果でないという評価を表すと判定すると(ステップS16:Yes)、ステップS12で算出された相違度が、記憶部11に格納されたパラメータに含まれる閾値Thb未満であるか否かを判定する(ステップS17)。一方、時系列データ診断装置10は、ステップS15で取得した評価情報が、妥当な診断結果であるという評価を表すと判定すると(ステップS16:No)、時系列データ診断処理を終了する。   If the time-series data diagnosis device 10 determines that the evaluation information acquired in step S15 indicates an evaluation that is not a valid diagnosis result (step S16: Yes), the difference calculated in step S12 is stored in the storage unit 11. It is determined whether it is less than the threshold Thb included in the stored parameters (step S17). On the other hand, if the time-series data diagnosis device 10 determines that the evaluation information acquired in step S15 indicates an evaluation indicating a valid diagnosis result (step S16: No), the time-series data diagnosis process ends.

時系列データ診断装置10が、閾値Thb未満の相違度であると判定すると(ステップS17:Yes)、更新部17は、学習済み標本部分列データを更新する(ステップS18)。具体的には、更新部17は、Thb未満の相違度であった学習済み標本部分列データを更新処理の対象として特定する。そして、更新部17は、図5に示すように、学習済みモデルの構築方法と同様の処理によって中間標本部分列データを生成する。生成された中間標本部分列データを、更新用中間標本部分列データと呼ぶ。そして、更新部17は、更新対象の学習済み標本部分列データに対応する記憶部11に格納された中間標本部分列データと、生成した更新用中間標本部分列データと、を併せて、これらの特徴量の順にソートする。   When the time-series data diagnostic device 10 determines that the difference is less than the threshold Thb (step S17: Yes), the updating unit 17 updates the learned sample subsequence data (step S18). Specifically, the updating unit 17 specifies the learned sample subsequence data having a degree of difference less than Thb as a target of the update process. Then, as shown in FIG. 5, the updating unit 17 generates the intermediate sample subsequence data by the same processing as the method of constructing the learned model. The generated intermediate sample subsequence data is referred to as update intermediate sample subsequence data. Then, the update unit 17 combines the intermediate sample subsequence data stored in the storage unit 11 corresponding to the learned sample subsequence data to be updated, and the generated intermediate sample subsequence data for update together with these. Sort in order of feature value.

そして、更新部17は、ソートされた複数の中間標本部分列データから類似の中間標本部分列データをグループ化する。更新部17は、グループ化された中間標本部分列データの統計値から更新後の学習済み標本部分列データを生成する。このステップS18において、更新部17は、生成された標本部分列データで記憶部11に格納された学習済み標本部分列データを更新する更新手段として機能する。また、このステップS18は、学習済み標本部分列データを更新する更新ステップとして機能する。   Then, the updating unit 17 groups similar intermediate sample subsequence data from the plurality of sorted intermediate sample subsequence data. The updating unit 17 generates updated learned sample subsequence data from the statistical values of the grouped intermediate sample subsequence data. In step S18, the updating unit 17 functions as an updating unit that updates the learned sample partial sequence data stored in the storage unit 11 with the generated sample partial sequence data. Step S18 functions as an update step of updating the learned sample subsequence data.

図4に戻り、時系列データ診断装置10が、閾値Thb以上の相違度であると判定すると(ステップS17:No)、追加部18は、学習済み標本部分列データに部分列データを追加する(ステップS19)。具体的には、追加部18は、学習済みモデルを構築する際と同じ手順で、診断結果情報に対応する時系列データから追加用標本部分列データを生成する。そして、追加部18は、記憶部11に格納された学習済み標本部分列データに、生成した追加用標本部分列データを追加する。このステップS19において、追加部18は、記憶部11に格納された学習済み標本部分列データに追加用標本部分列データを追加する追加手段として機能する。   Returning to FIG. 4, when the time-series data diagnostic device 10 determines that the difference is equal to or greater than the threshold Thb (step S17: No), the adding unit 18 adds the partial sequence data to the learned sample partial sequence data ( Step S19). Specifically, the adding unit 18 generates additional sample subsequence data from the time-series data corresponding to the diagnosis result information in the same procedure as when constructing the learned model. Then, the adding unit 18 adds the generated additional sample subsequence data to the learned sample subsequence data stored in the storage unit 11. In step S19, the adding unit 18 functions as an adding unit that adds additional sample subsequence data to the learned sample subsequence data stored in the storage unit 11.

ステップS18またはステップS19に続いて、パラメータ更新部19は、記憶部11に格納されている診断のためのパラメータを更新する(ステップS20)。具体的には、パラメータ更新部19は、学習済みモデルを構築する際と同様に、更新または追加された学習済み標本部分列データと、記憶部11に格納されている試行データと、の相違度を算出し、その統計値として相違度の平均値m、標準偏差σ等を再計算する。そして、パラメータ更新部19は、これらの統計値に基づいて、診断のためのパラメータである相違度の閾値Thaおよび閾値Thbを更新する。このステップS20において、パラメータ更新部19は、更新された学習済み標本部分列データに基づいてパラメータを更新するパラメータ更新手段として機能する。   Subsequent to step S18 or step S19, the parameter updating unit 19 updates parameters for diagnosis stored in the storage unit 11 (step S20). Specifically, the parameter updating unit 19 determines the difference between the updated or added learned sample subsequence data and the trial data stored in the storage unit 11 in the same manner as when constructing the learned model. Is calculated, and the average value m, the standard deviation σ, and the like of the degree of difference are recalculated as the statistical values. Then, the parameter updating unit 19 updates the difference thresholds Tha and Thb, which are parameters for diagnosis, based on these statistical values. In step S20, the parameter updating unit 19 functions as a parameter updating unit that updates a parameter based on the updated learned sample subsequence data.

本実施の形態に係る時系列データ診断装置10によれば、追加学習の対象の時系列データと学習済みモデル構築に使用した時系列データから学習済みモデルの再構築をするのではなく、学習済みモデルの構築の際に生成された中間標本部分列データを活用して学習済み標本部分列データを生成することができる。したがって、計算量を少なく抑えることができ、追加学習、とりわけ運用中に学習するオンライン学習に適している。また、追加学習に使用する時系列データは、学習済みモデル構築に使用した時系列データとは時間的に連続していないため、学習済みモデルを再構築することと比較してほとんど精度が変わらない結果が得られる。したがって、少ない計算量と高い精度で追加学習をすることができる。   According to the time-series data diagnostic device 10 according to the present embodiment, the trained model is not reconstructed from the time-series data to be subjected to the additional learning and the time-series data used for building the trained model. The trained sample subsequence data can be generated by utilizing the intermediate sample subsequence data generated when the model is constructed. Therefore, the amount of calculation can be reduced, and it is suitable for additional learning, especially for online learning to learn during operation. In addition, since the time series data used for additional learning is not temporally continuous with the time series data used for building the trained model, the accuracy is hardly changed compared to rebuilding the trained model. The result is obtained. Therefore, additional learning can be performed with a small amount of calculation and high accuracy.

また、本実施の形態に係る時系列データ診断装置10は、閾値Thbによって更新部17による学習済み標本部分列データを更新と、追加部18による学習済み標本部分列データへの追加と、を振り分ける。これによって、追加で学習する時系列データと類似する学習済み標本部分列データがある場合はこれを更新し、類似する学習済み標本部分列データが無い場合は、新たに学習済み標本部分列データを追加することになる。そのため、過度に学習済み標本部分列データが増えることがなく、適切な追加学習が可能となる。   In addition, the time-series data diagnostic device 10 according to the present embodiment distributes the update of the learned sample subsequence data by the update unit 17 and the addition to the learned sample subsequence data by the addition unit 18 based on the threshold Thb. . By this, if there is a trained sample subsequence data similar to the time series data to be additionally trained, this is updated, and if there is no similar trained sample subsequence data, the trained sample subsequence data is newly updated. Will be added. Therefore, it is possible to perform appropriate additional learning without excessively increasing the sample subsequence data that has already been learned.

(実施の形態2)
実施の形態1においては、異常という診断結果情報に対して正常という評価情報を取得した場合に、学習済み標本部分列データの更新または追加をする例を示した。本実施の形態においては、正常という診断結果情報に対して異常という評価情報を取得した場合に、学習済み標本部分列データを削除する例を示す。以下、実施の形態1と異なる部分を中心に説明する。
(Embodiment 2)
In the first embodiment, an example has been described in which the learned sample subsequence data is updated or added when the evaluation information indicating that the diagnosis result information indicating the abnormality is normal is acquired. In the present embodiment, an example in which learned sample subsequence data is deleted when evaluation information indicating abnormality is acquired for diagnosis result information indicating normality is obtained. Hereinafter, a description will be given focusing on portions different from the first embodiment.

本実施の形態に係る時系列データ診断装置10は、図6に示すように、実施の形態1で説明した機能部の他に、学習済み標本部分列データを削除する削除部20をさらに備える。   As shown in FIG. 6, the time-series data diagnostic device 10 according to the present embodiment further includes, in addition to the functional units described in the first embodiment, a deletion unit 20 that deletes learned sample subsequence data.

削除部20は、相違度算出部13が算出した相違度が閾値Tha未満であり、評価情報取得部16が、妥当な診断結果でないという評価を表す評価情報を取得した場合に、診断結果に対応する時系列データとの相違度が閾値Tha未満であった学習済み標本部分列データを記憶部11から削除する。   The deletion unit 20 responds to the diagnosis result when the difference calculated by the difference calculation unit 13 is less than the threshold Tha and the evaluation information obtaining unit 16 obtains evaluation information indicating that the evaluation is not a valid diagnosis result. The learned sample subsequence data whose degree of difference from the time series data to be performed is less than the threshold Tha is deleted from the storage unit 11.

より具体的に、時系列データ診断装置10の動作とともに、図面を参照して説明する。図7に示すように、時系列データ診断装置10は、時系列データ診断処理のステップS16において、ステップS15で取得した評価情報が、妥当な診断結果でないという評価を表すと判定すると(ステップS16:Yes)、ステップS12で算出された相違度が閾値Tha以上であるか否かを判定する(ステップS21)。時系列データ診断装置10は、相違度が閾値Tha以上であると判定すると(ステップS21:Yes)、相違度が閾値Thb未満であるか否かの判定処理であるステップS17に進み、以下は実施の形態1と同じ処理をする。   More specifically, the operation of the time-series data diagnostic device 10 will be described with reference to the drawings. As illustrated in FIG. 7, the time-series data diagnosis device 10 determines that the evaluation information acquired in step S15 indicates an evaluation that is not a valid diagnosis result in step S16 of the time-series data diagnosis processing (step S16: Yes), it is determined whether or not the degree of difference calculated in step S12 is equal to or greater than a threshold Tha (step S21). When the time-series data diagnostic device 10 determines that the degree of difference is equal to or greater than the threshold Tha (step S21: Yes), the process proceeds to step S17, which is a process of determining whether the degree of difference is less than the threshold Thb. The same processing as in the first mode is performed.

一方、時系列データ診断装置10が、相違度が閾値Tha未満であると判定すると(ステップS21:No)、削除部20は、相違度が閾値Tha未満の学習済み標本部分列データに対応する中間標本部分列データを削除する(ステップS22)。ステップS12では、時系列データと学習済み標本部分列データとの相違度が最も小さい組み合わせで相違度を算出しているため、時系列データとの相違度が閾値Tha未満の学習済み標本部分列データが少なくとも1つ以上存在するはずである。そこで、具体的には、削除部20は、相違度が閾値Tha未満の学習済み標本部分列データに対応する中間標本部分列データとの相違度を算出する。そして、削除部20は、算出した相違度が閾値Tha未満の中間標本部分列データを削除する。さらに、削除部20は、削除されなかった中間標本部分列データに基づいて学習済み標本部分列データを更新する。このステップS22において、削除部20は、診断対象の時系列データとの相違度が閾値Tha未満である中間標本部分列データを記憶部11から削除して、残った中間標本部分列データに基づいて記憶部11に格納された学習済み標本部分列データを更新する削除手段として機能する。   On the other hand, if the time-series data diagnostic device 10 determines that the degree of difference is less than the threshold Tha (step S21: No), the deletion unit 20 determines the intermediate value corresponding to the learned sample subsequence data whose degree of difference is less than the threshold Tha. The sample subsequence data is deleted (step S22). In step S12, since the dissimilarity is calculated using the combination having the smallest difference between the time-series data and the learned sample subsequence data, the learned sample subsequence data whose dissimilarity from the time-series data is less than the threshold Tha Must be present at least one or more times. Therefore, specifically, the deletion unit 20 calculates the degree of difference from the intermediate sample subsequence data corresponding to the learned sample subsequence data whose degree of difference is less than the threshold Tha. Then, the deletion unit 20 deletes the intermediate sample subsequence data whose calculated degree of difference is less than the threshold Tha. Furthermore, the deletion unit 20 updates the learned sample subsequence data based on the intermediate sample subsequence data that has not been deleted. In step S22, the deletion unit 20 deletes the intermediate sample subsequence data whose degree of difference from the time-series data to be diagnosed is less than the threshold Tha from the storage unit 11, and based on the remaining intermediate sample subsequence data. It functions as a deletion unit that updates the learned sample subsequence data stored in the storage unit 11.

ステップS22に続いて、パラメータ更新部19は、実施の形態1と同様に、更新後の学習済み標本部分列データに基づいてパラメータを更新する(ステップS20)。   Subsequent to step S22, the parameter update unit 19 updates the parameters based on the updated learned sample subsequence data as in the first embodiment (step S20).

本実施の形態に係る時系列データ診断装置10は、正常という診断結果情報に対して異常という評価情報を取得した場合に、学習済み標本部分列データを更新する。これによって、学習済み標本部分列データの精度がさらに向上する。   The time-series data diagnostic device 10 according to the present embodiment updates the learned sample subsequence data when acquiring the evaluation information indicating abnormality with respect to the diagnosis result information indicating normal. This further improves the accuracy of the learned sample subsequence data.

また、本実施の形態に係る時系列データ診断装置10は、中間標本部分列データを削除することによって、学習済み標本部分列データを更新する。したがって、時系列データそのものを削除して中間標本部分列データを削除することに比べて計算量を少なく抑えることができる。また、学習済み標本部分列データを削除するよりも高い精度で追加学習をすることができる。   Further, the time-series data diagnostic device 10 according to the present embodiment updates the learned sample subsequence data by deleting the intermediate sample subsequence data. Therefore, the amount of calculation can be reduced as compared with deleting the time series data itself and deleting the intermediate sample subsequence data. Further, additional learning can be performed with higher accuracy than when the learned sample subsequence data is deleted.

(変形例)
本発明は、上述した実施の形態に限定されるわけではなく、その他の種々の変更が可能である。
(Modification)
The present invention is not limited to the above-described embodiment, and various other modifications are possible.

上述の実施の形態においては、正常な機器の時系列データから学習済みモデルを構築し、学習済みモデルに含まれる学習済み標本部分列データとの相違度が小さい場合に正常と診断する例を示した。しかし、本発明の範囲はこれに限られず、異常な機器の時系列データから学習済みモデルを構築し、学習済みモデルに含まれる学習済み標本部分列データとの相違度が小さい場合に異常と診断する構成であっても良い。この場合、上述の実施の形態における正常と異常とをすべて反対に読み替えることによって、本発明がそのまま適用できる。   In the above-described embodiment, an example is shown in which a trained model is constructed from time-series data of a normal device, and a normal diagnosis is performed when the degree of difference from the trained sample subsequence data included in the trained model is small. Was. However, the scope of the present invention is not limited to this, and a trained model is constructed from the time-series data of the abnormal device, and when the degree of difference from the trained sample subsequence data included in the trained model is small, it is diagnosed as abnormal. The configuration may be as follows. In this case, the present invention can be applied as it is by reading the terms “normal” and “abnormal” in the above-described embodiments in the opposite directions.

上述の実施の形態において、時系列データ診断装置10は、相違度をW次元空間上のユークリッド距離によって算出したが、これは一例であり、他の算出方法によって相違度を算出しても良い。また、時系列データ診断装置10が学習装置を兼ねてもよい。   In the above-described embodiment, the time-series data diagnostic device 10 calculates the degree of difference based on the Euclidean distance in the W-dimensional space. However, this is an example, and the degree of difference may be calculated by another calculation method. Further, the time-series data diagnosis device 10 may also serve as a learning device.

相違度、閾値Thaまたは閾値Thbがそれぞれ1つの数値である例を示したが、これらはそれぞれ複数の数値の組み合わせであっても良い。その場合、閾値とは複数の数値に対する条件と解釈すべきである。   Although the example in which each of the dissimilarity, the threshold value Tha, and the threshold value Thb is one numerical value has been described, these may be a combination of a plurality of numerical values. In that case, the threshold should be interpreted as a condition for a plurality of numerical values.

本実施の形態に係る時系列データ診断装置10は、専用の装置によらず、通常のコンピュータを用いて実現可能である。例えば、コンピュータに上述のいずれかを実行するためのプログラムを格納した記録媒体から該プログラムをコンピュータにインストールすることにより、上述の処理を実行する時系列データ診断装置10を構成してもよい。また、複数のコンピュータが協働して動作することによって、1つの時系列データ診断装置10を構成してもよい。   The time-series data diagnostic device 10 according to the present embodiment can be realized using a normal computer without using a dedicated device. For example, the time-series data diagnosis device 10 that executes the above-described processing may be configured by installing the program for executing any of the above-described programs into the computer from a recording medium that stores the program. Further, one time-series data diagnosis device 10 may be configured by a plurality of computers operating in cooperation.

また、コンピュータにプログラムを供給するための手法は、任意である。例えば、通信回線、通信ネットワーク、通信システム等を介して供給してもよい。   The method for supplying the program to the computer is arbitrary. For example, the information may be supplied via a communication line, a communication network, a communication system, or the like.

また、上述の機能の一部をOS(Operating System)が提供する場合には、OSが提供する機能以外の部分をプログラムで提供すればよい。   When a part of the above functions is provided by an OS (Operating System), a part other than the functions provided by the OS may be provided by a program.

なお、本発明は、本発明の広義の精神と範囲を逸脱することなく、様々な実施の形態及び変形が可能とされるものである。また、上述した実施の形態は、この発明を説明するためのものであり、本発明の範囲を限定するものではない。即ち、本発明の範囲は、実施の形態ではなく、請求の範囲によって示される。そして、請求の範囲内及びそれと同等の発明の意義の範囲内で施される様々な変形が、この発明の範囲内とみなされる。   The present invention is capable of various embodiments and modifications without departing from the broad spirit and scope of the present invention. Further, the above-described embodiment is for describing the present invention, and does not limit the scope of the present invention. That is, the scope of the present invention is shown not by the embodiments but by the claims. Various modifications made within the scope of the claims and the equivalents of the invention are considered to be within the scope of the present invention.

10 時系列データ診断装置、11 記憶部、12 時系列データ取得部、13 相違度算出部、14 診断結果情報生成部、15 診断結果情報出力部、16 評価情報取得部、17 更新部、18 追加部、19 パラメータ更新部、20 削除部、30 時系列データ送信装置、101 CPU、102 RAM、103 ROM、104 ハードディスクドライブ、105 キーボード、106 ディスプレイ、107 ネットワークカード。   10 time series data diagnosis device, 11 storage unit, 12 time series data acquisition unit, 13 difference degree calculation unit, 14 diagnosis result information generation unit, 15 diagnosis result information output unit, 16 evaluation information acquisition unit, 17 update unit, 18 addition Unit, 19 parameter updating unit, 20 deleting unit, 30 time series data transmission device, 101 CPU, 102 RAM, 103 ROM, 104 hard disk drive, 105 keyboard, 106 display, 107 network card.

Claims (7)

学習対象の時系列データを時間的に連続する類似の部分列データでグループ化した各グループの前記部分列データの統計値から生成された中間標本部分列データと、前記中間標本部分列データに基づいて生成された学習済み標本部分列データと、第1の閾値を含むパラメータと、を記憶する記憶手段と、
診断対象の時系列データと、前記記憶手段に格納された前記学習済み標本部分列データと、の相違度を算出する相違度算出手段と、
前記相違度算出手段が算出した前記相違度と前記第1の閾値とを比較して、前記診断対象の時系列データの診断結果情報を生成する診断結果情報生成手段と、
前記診断結果情報が妥当な診断結果であるか否かの評価を表す評価情報を取得する評価情報取得手段と、
前記相違度が前記第1の閾値以上であり、前記評価情報取得手段が、妥当な診断結果でないという評価を表す評価情報を取得した場合に、妥当な診断結果でないと評価された前記診断結果情報に対応する前記診断対象の時系列データから時間的に連続する類似の部分列データでグループ化した各グループの前記部分列データの統計値から更新用中間標本部分列データを生成し、前記更新用中間標本部分列データと前記記憶手段に格納された前記中間標本部分列データとに基づいて標本部分列データを生成し、前記生成された標本部分列データで前記記憶手段に格納された前記学習済み標本部分列データを更新する更新手段と、を備える、
時系列データ診断装置。
Based on the intermediate sample subsequence data generated from the statistical value of the subsequence data of each group obtained by grouping the time series data to be trained with similar temporally continuous subsequence data, and the intermediate sample subsequence data Storage means for storing the learned sample subsequence data generated by the above, and a parameter including a first threshold value ;
Time-series data of a diagnosis target, and a difference calculation unit that calculates a difference between the learned sample subsequence data stored in the storage unit,
A diagnosis result information generation unit that compares the difference calculated by the difference calculation unit with the first threshold, and generates diagnosis result information of the time-series data of the diagnosis target;
Evaluation information acquisition means for acquiring evaluation information indicating whether the diagnosis result information is a valid diagnosis result,
When the degree of difference is equal to or greater than the first threshold, and the evaluation information obtaining unit obtains evaluation information indicating evaluation that is not a valid diagnosis result, the diagnosis result information evaluated as not being a valid diagnosis result Generating an intermediate sample subsequence data for update from the statistical value of the subsequence data of each group grouped by similar subsequence data successive in time from the time- series data of the diagnosis object corresponding to the Generating sample subsequence data based on the intermediate sample subsequence data and the intermediate sample subsequence data stored in the storage means, and storing the learned sampled sequence stored in the storage means with the generated sample subsequence data Updating means for updating the sample subsequence data,
Time series data diagnostic device.
前記相違度が前記第1の閾値以上であり、前記評価情報取得手段が、妥当な診断結果でないという評価を表す評価情報を取得した場合に、前記診断結果情報に対応する前記診断対象の時系列データに基づいて追加用標本部分列データを生成し、前記記憶手段に格納された前記学習済み標本部分列データに前記追加用標本部分列データを追加する追加手段をさらに備える、
請求項に記載の時系列データ診断装置。
When the degree of difference is equal to or greater than the first threshold and the evaluation information obtaining unit obtains evaluation information indicating an evaluation that is not a valid diagnosis result, the time series of the diagnosis target corresponding to the diagnosis result information Generating additional sample subsequence data based on the data, further comprising an additional unit that adds the additional sample subsequence data to the learned sample subsequence data stored in the storage unit;
The time-series data diagnostic device according to claim 1 .
前記パラメータは、前記第1の閾値よりも大きい第2の閾値をさらに含み、
前記更新手段は、前記相違度が前記第2の閾値未満である場合に、前記学習済み標本部分列データを更新し、
前記追加手段は、前記相違度が前記第2の閾値以上である場合に、前記生成した追加用標本部分列データを追加する、
請求項に記載の時系列データ診断装置。
The parameter further includes a second threshold greater than the first threshold;
The updating means updates the learned sample subsequence data when the dissimilarity is less than the second threshold value,
The adding unit adds the generated additional sample subsequence data when the degree of difference is equal to or greater than the second threshold.
The time-series data diagnostic device according to claim 2 .
前記相違度が前記第1の閾値未満であり、前記評価情報取得手段が、妥当な診断結果でないという評価を表す評価情報を取得した場合に、前記診断結果に対応する前記診断対象の時系列データとの相違度が前記第1の閾値未満であった学習済み標本部分列データに対応する前記中間標本部分列データのうち、前記診断結果に対応する前記診断対象の時系列データとの相違度が前記第1の閾値未満である前記中間標本部分列データを前記記憶手段から削除して、残った前記中間標本部分列データに基づいて前記記憶手段に格納された前記学習済み標本部分列データを更新する削除手段をさらに備える、
請求項からのいずれか1項に記載の時系列データ診断装置。
When the degree of difference is less than the first threshold value and the evaluation information acquisition unit acquires evaluation information indicating an evaluation that the evaluation result is not a valid diagnosis result, the time-series data of the diagnosis target corresponding to the diagnosis result Of the intermediate sample subsequence data corresponding to the learned sample subsequence data whose difference degree was less than the first threshold value, the difference degree with the time-series data of the diagnosis target corresponding to the diagnosis result is The intermediate sample subsequence data that is less than the first threshold is deleted from the storage unit, and the learned sample subsequence data stored in the storage unit is updated based on the remaining intermediate sample subsequence data. Further comprising:
The time-series data diagnostic device according to any one of claims 1 to 3 .
前記評価情報取得手段が、前記診断結果情報が妥当な診断結果でないという評価を表す評価情報を取得した場合に、更新された前記学習済み標本部分列データに基づいて前記パラメータを更新するパラメータ更新手段をさらに備える、
請求項からのいずれか1項に記載の時系列データ診断装置。
A parameter updating unit that updates the parameter based on the updated learned sample subsequence data when the evaluation information obtaining unit obtains evaluation information indicating an evaluation that the diagnosis result information is not a valid diagnosis result. Further comprising,
The time-series data diagnostic device according to any one of claims 1 to 4 .
時系列データ診断装置が実行する、
診断対象の時系列データと、学習対象の時系列データを時間的に連続する類似の部分列データでグループ化した各グループの前記部分列データの統計値から生成された中間標本部分列データに基づいて生成された学習済み標本部分列データとの相違度が妥当でないという評価を表す評価情報を取得した場合に、前記診断対象の時系列データから時間的に連続する類似の部分列データでグループ化した各グループの前記部分列データの統計値から更新用中間標本部分列データを生成し、
前記更新用中間標本部分列データと、前記中間標本部分列データと、に基づいて標本部分列データを生成し、
前記生成された標本部分列データで、前記学習済み標本部分列データを更新する、
追加学習方法。
Executed by the time-series data diagnostic device,
Based on the time-series data of the diagnosis target and the intermediate sample sub-sequence data generated from the statistical value of the sub-sequence data of each group obtained by grouping the time-series data of the learning target with similar temporally continuous sub-sequence data. When the evaluation information indicating the evaluation that the degree of difference from the learned sample subsequence data generated by the above is not appropriate is acquired, the data is grouped by similar subsequence data that is temporally continuous from the time series data of the diagnosis target . Generating an intermediate sample subsequence data for update from the statistical value of the subsequence data of each group,
Wherein the intermediate samples subsequence data for updating, and the intermediate samples subsequence data to generate sample subsequence data based on,
Wherein the generated specimen subsequence data, updating the learned sample subsequence data,
Additional learning method.
コンピュータに、
診断対象の時系列データと、学習対象の時系列データを時間的に連続する類似の部分列データでグループ化した各グループの前記部分列データの統計値から生成された中間標本部分列データに基づいて生成された学習済み標本部分列データと、の相違度を算出する相違度算出ステップと、
前記相違度算出ステップで算出した前記相違度と第1の閾値とを比較して、前記診断対象の時系列データの診断結果情報を生成する診断結果情報生成ステップと、
前記診断結果情報が妥当な診断結果であるか否かの評価を表す評価情報を取得する評価情報取得ステップと、
前記相違度が前記第1の閾値以上であり、前記評価情報取得ステップで、妥当な診断結果でないという評価を表す評価情報を取得した場合に、妥当な診断結果でないと評価された前記診断結果情報に対応する前記診断対象の時系列データから時間的に連続する類似の部分列データでグループ化した各グループの前記部分列データの統計値から更新用中間標本部分列データを生成し、前記更新用中間標本部分列データと前記中間標本部分列データとに基づいて標本部分列データを生成し、前記生成された標本部分列データで前記学習済み標本部分列データを更新する更新ステップと、
を実行させるためのプログラム。
On the computer,
Based on the time-series data of the diagnosis target and the intermediate sample sub-sequence data generated from the statistical value of the sub-sequence data of each group obtained by grouping the time-series data of the learning target with similar temporally continuous sub-sequence data. A difference calculation step of calculating a difference between the learned sample subsequence data generated and
A diagnosis result information generation step of comparing the difference calculated in the difference calculation step with a first threshold to generate diagnosis result information of the time-series data of the diagnosis target;
An evaluation information obtaining step of obtaining evaluation information indicating whether the diagnosis result information is a valid diagnosis result or not;
When the degree of difference is equal to or greater than the first threshold and the evaluation information obtaining step obtains evaluation information indicating an evaluation that is not a valid diagnosis result, the diagnosis result information evaluated as not a proper diagnosis result Generating an intermediate sample subsequence data for update from the statistical value of the subsequence data of each group grouped by similar subsequence data successive in time from the time- series data of the diagnosis object corresponding to the An updating step of generating sample subsequence data based on the intermediate sample subsequence data and the intermediate sample subsequence data, and updating the learned sample subsequence data with the generated sample subsequence data;
A program for executing
JP2019526332A 2018-07-23 2018-07-23 Time series data diagnosis device, additional learning method, and program Active JP6661839B1 (en)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2018/027441 WO2020021587A1 (en) 2018-07-23 2018-07-23 Time-sequential data diagnosis device, additional learning method, and program

Publications (2)

Publication Number Publication Date
JP6661839B1 true JP6661839B1 (en) 2020-03-11
JPWO2020021587A1 JPWO2020021587A1 (en) 2020-07-30

Family

ID=69180920

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019526332A Active JP6661839B1 (en) 2018-07-23 2018-07-23 Time series data diagnosis device, additional learning method, and program

Country Status (4)

Country Link
US (1) US11093314B2 (en)
JP (1) JP6661839B1 (en)
CN (1) CN112449696B (en)
WO (1) WO2020021587A1 (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023287118A1 (en) * 2021-07-16 2023-01-19 주식회사 휴이노 Method, system, and non-transitory computer-readable recording medium for managing output data of analysis model for bio-signal
KR20230012942A (en) * 2021-07-16 2023-01-26 주식회사 휴이노 Method, system and non-transitory computer-readable recording medium for managing output data of analysis model for bio-signal

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11373243B2 (en) * 2019-02-11 2022-06-28 TD Ameritrade IP Compnay, Inc. Time-series pattern matching system
JP2021140303A (en) * 2020-03-03 2021-09-16 トヨタ自動車株式会社 Learning method, learning system and learning program
JP7310673B2 (en) * 2020-03-23 2023-07-19 横河電機株式会社 Data management system, data management method, and data management program
CN112098850B (en) * 2020-09-21 2024-03-08 山东工商学院 Lithium ion battery voltage fault diagnosis method and system based on SDO algorithm
CN114580982B (en) * 2022-05-07 2022-08-05 昆仑智汇数据科技(北京)有限公司 Method, device and equipment for evaluating data quality of industrial equipment
CN115392812B (en) * 2022-10-31 2023-03-24 成都飞机工业(集团)有限责任公司 Abnormal root cause positioning method, device, equipment and medium
CN116383190B (en) * 2023-05-15 2023-08-25 青岛场外市场清算中心有限公司 Intelligent cleaning method and system for massive financial transaction big data

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012252556A (en) * 2011-06-03 2012-12-20 Mitsubishi Heavy Ind Ltd Plant monitoring device, plant monitoring program and plant monitoring method
WO2014207789A1 (en) * 2013-06-24 2014-12-31 株式会社 日立製作所 Status monitoring device
JP2015088078A (en) * 2013-11-01 2015-05-07 株式会社日立パワーソリューションズ Abnormality sign detection system and abnormality sign detection method
JP2017151598A (en) * 2016-02-23 2017-08-31 株式会社安川電機 Abnormality determination device, abnormality determination program, abnormality determination system, and motor controller

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5018444B2 (en) 2007-12-13 2012-09-05 株式会社豊田中央研究所 Vehicle fault diagnosis and prediction device
JP5301310B2 (en) * 2009-02-17 2013-09-25 株式会社日立製作所 Anomaly detection method and anomaly detection system
JP5341800B2 (en) * 2010-03-11 2013-11-13 アズビル株式会社 Control model update device, control model update method, air conditioning control system, data validity judgment device
JP5455866B2 (en) * 2010-10-28 2014-03-26 株式会社日立製作所 Abnormality diagnosis device and industrial machine
US10430733B2 (en) * 2013-09-11 2019-10-01 Hitachi, Ltd. Analysis method for time series data and device therefor
JP5480440B1 (en) 2013-12-03 2014-04-23 株式会社日立パワーソリューションズ Abnormal sign diagnostic apparatus and abnormal sign diagnostic method
JP5684941B1 (en) 2014-07-31 2015-03-18 株式会社日立パワーソリューションズ Abnormal sign diagnostic apparatus and abnormal sign diagnostic method
US10223069B2 (en) * 2015-01-22 2019-03-05 Mitsubishi Electric Corporation Time-series data search device and computer readable medium
JP6877245B2 (en) * 2017-06-01 2021-05-26 株式会社東芝 Information processing equipment, information processing methods and computer programs
DE112017005640T5 (en) * 2017-07-31 2019-08-22 Mitsubishi Electric Corporation Information processing apparatus and information processing method
CN108231177A (en) * 2017-12-28 2018-06-29 深圳开立生物医疗科技股份有限公司 A kind of auxiliary update method, system and device
US10885048B2 (en) * 2019-02-11 2021-01-05 Td Ameritrade Ip Company, Inc. Time-series pattern matching system

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012252556A (en) * 2011-06-03 2012-12-20 Mitsubishi Heavy Ind Ltd Plant monitoring device, plant monitoring program and plant monitoring method
WO2014207789A1 (en) * 2013-06-24 2014-12-31 株式会社 日立製作所 Status monitoring device
JP2015088078A (en) * 2013-11-01 2015-05-07 株式会社日立パワーソリューションズ Abnormality sign detection system and abnormality sign detection method
JP2017151598A (en) * 2016-02-23 2017-08-31 株式会社安川電機 Abnormality determination device, abnormality determination program, abnormality determination system, and motor controller

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
平井 規郎: "設備維持管理向けデータ分析技術", 三菱電機技報, vol. 第90巻 第7号, JPN6019032439, 20 July 2016 (2016-07-20), pages 40 - 44, ISSN: 0004101117 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023287118A1 (en) * 2021-07-16 2023-01-19 주식회사 휴이노 Method, system, and non-transitory computer-readable recording medium for managing output data of analysis model for bio-signal
KR20230012942A (en) * 2021-07-16 2023-01-26 주식회사 휴이노 Method, system and non-transitory computer-readable recording medium for managing output data of analysis model for bio-signal
KR102573416B1 (en) * 2021-07-16 2023-09-04 주식회사 휴이노 Method, system and non-transitory computer-readable recording medium for managing output data of analysis model for bio-signal

Also Published As

Publication number Publication date
CN112449696B (en) 2022-04-29
WO2020021587A1 (en) 2020-01-30
US20210216386A1 (en) 2021-07-15
JPWO2020021587A1 (en) 2020-07-30
US11093314B2 (en) 2021-08-17
CN112449696A (en) 2021-03-05

Similar Documents

Publication Publication Date Title
JP6661839B1 (en) Time series data diagnosis device, additional learning method, and program
CN111459700B (en) Equipment fault diagnosis method, diagnosis device, diagnosis equipment and storage medium
US20210136098A1 (en) Root cause analysis in multivariate unsupervised anomaly detection
US20220214957A1 (en) Machine learning models applied to interaction data for facilitating modifications to online environments
US20200143292A1 (en) Signature enhancement for deviation measurement-based classification of a detected anomaly in an industrial asset
US20160255109A1 (en) Detection method and apparatus
JPWO2008120552A1 (en) Diagnostic system
KR20190072652A (en) Information processing apparatus and information processing method
US20220011760A1 (en) Model fidelity monitoring and regeneration for manufacturing process decision support
US20190310618A1 (en) System and software for unifying model-based and data-driven fault detection and isolation
US10572827B2 (en) Prediction quality assessment
CN110750455B (en) Intelligent online self-updating fault diagnosis method and system based on system log analysis
JP6917805B2 (en) Data filtering device and method
CN112700112B (en) RPA flow adjustment method and device, electronic equipment and storage medium
JP2020098373A (en) Abnormality detection device and program and method for the same
JP6668699B2 (en) Monitoring support device, monitoring support method, and program
EP4012667A2 (en) Data preparation for artificial intelligence models
JP2012181739A (en) Man-hour estimation device, man-hour estimation method, and man-hour estimation program
US20210373987A1 (en) Reinforcement learning approach to root cause analysis
JP6710913B2 (en) Information providing apparatus, information providing method, and program
US20220083816A1 (en) Regression detection and correction in relationships between performance indicators and ai metrics
JP2018044958A (en) Bias estimation device, method of the same, and program
US20190362353A1 (en) Systems and methods for interpreting analytical results
JP7052914B1 (en) Abnormality diagnosis system, abnormality diagnosis device, abnormality diagnosis method, and program
US20230306349A1 (en) Benchmarking processes of an organization to standardized processes

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190515

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20190515

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20190515

A975 Report on accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A971005

Effective date: 20190815

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20190827

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20191025

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20200114

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20200212

R150 Certificate of patent or registration of utility model

Ref document number: 6661839

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250