WO2020188696A1 - 異常検知装置および異常検知方法 - Google Patents

異常検知装置および異常検知方法 Download PDF

Info

Publication number
WO2020188696A1
WO2020188696A1 PCT/JP2019/011158 JP2019011158W WO2020188696A1 WO 2020188696 A1 WO2020188696 A1 WO 2020188696A1 JP 2019011158 W JP2019011158 W JP 2019011158W WO 2020188696 A1 WO2020188696 A1 WO 2020188696A1
Authority
WO
WIPO (PCT)
Prior art keywords
data
learning
abnormality
time
series data
Prior art date
Application number
PCT/JP2019/011158
Other languages
English (en)
French (fr)
Inventor
宜史 上田
淳 岡嶋
Original Assignee
三菱電機株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 三菱電機株式会社 filed Critical 三菱電機株式会社
Priority to KR1020217028496A priority Critical patent/KR102408756B1/ko
Priority to CN201980093996.6A priority patent/CN113574358B/zh
Priority to PCT/JP2019/011158 priority patent/WO2020188696A1/ja
Priority to JP2019555983A priority patent/JP6647473B1/ja
Publication of WO2020188696A1 publication Critical patent/WO2020188696A1/ja

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01MTESTING STATIC OR DYNAMIC BALANCE OF MACHINES OR STRUCTURES; TESTING OF STRUCTURES OR APPARATUS, NOT OTHERWISE PROVIDED FOR
    • G01M99/00Subject matter not provided for in other groups of this subclass
    • G01M99/008Subject matter not provided for in other groups of this subclass by doing functionality tests
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01MTESTING STATIC OR DYNAMIC BALANCE OF MACHINES OR STRUCTURES; TESTING OF STRUCTURES OR APPARATUS, NOT OTHERWISE PROVIDED FOR
    • G01M99/00Subject matter not provided for in other groups of this subclass
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0706Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
    • G06F11/0736Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment in functional embedded systems, i.e. in a data processing system designed as a combination of hardware and software dedicated to performing a certain function
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0751Error or fault detection not based on redundancy
    • G06F11/0754Error or fault detection not based on redundancy by exceeding limits
    • G06F11/076Error or fault detection not based on redundancy by exceeding limits by exceeding a count or rate limit, e.g. word- or bit count limit
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Definitions

  • the present invention relates to an abnormality detection device and an abnormality detection method for determining an abnormality in an object for abnormality detection such as equipment such as a factory, a chemical plant, and a steel plant.
  • control systems for controlling equipment such as air conditioning equipment and electric lighting in the equipment have been introduced.
  • Control systems for controlling processes have also been introduced in facilities such as power plants, chemical plants, and steel plants, including thermal power, hydraulic power, and nuclear power.
  • factory equipment, automobiles, railroad vehicles, and the like are often equipped with a logging system for recording the state of these equipment.
  • the state of the equipment includes the state of the equipment provided in the equipment, the state indicating the environment inside or outside the equipment, and the like.
  • Logging systems and control systems generally store time-series data, measured by sensors, that indicates the state of the equipment over time.
  • Patent Document 1 describes an abnormality detection method in which features are extracted from time-series data, and when the distance between the extracted features and the features extracted from training data that does not include anomalies exceeds a threshold value, anomalies are determined. Is disclosed.
  • the tendency of time series data may differ depending on the equipment in the equipment or the sensor that measures the state. Therefore, when performing a determination using a threshold value as in the method described in Patent Document 1, there is a problem that the threshold value needs to be evaluated and verified for each device and sensor. Further, the evaluation and verification of this threshold value requires external information such as the knowledge of a skilled operator and the knowledge of the equipment designer, so that the load on the operator and the designer is high and it takes time. Therefore, it is desired to suppress the workload for setting the threshold value.
  • the present invention has been made in view of the above, and an object of the present invention is to obtain an abnormality detection device capable of detecting an abnormality of an object for abnormality detection by suppressing a workload for setting a threshold value. To do.
  • the abnormality detection device has a data division unit that divides time-series data into a learning section and a test section, and a portion of the time-series data in the learning section. It includes a subsequence generation unit that generates columns as training data. Further, the abnormality detection device includes a prediction distribution calculation unit that obtains a probability distribution corresponding to a data point in a test section using learning data, and an abnormality detection unit that detects an abnormality using the probability distribution.
  • the abnormality detection device has the effect of suppressing the workload for setting the threshold value and detecting the abnormality of the object for abnormality detection.
  • FIG. 1 is a diagram showing a functional configuration example of the abnormality detection device according to the embodiment of the present invention.
  • the abnormality detection device 100 of the present embodiment includes a data acquisition unit 101, a data division unit 102, a subsequence generation unit 103, a prediction distribution calculation unit 104, a credit interval calculation unit 105, and an abnormality score calculation.
  • a unit 106 and an abnormality detection unit 107 are provided.
  • the abnormality detection device 100 of the present embodiment acquires time-series data indicating the state of the object of abnormality detection, and detects the abnormality of the object of abnormality detection based on the acquired time-series data.
  • the object of abnormality detection data on facilities such as factories, chemical plants, steel plants, water and sewage plants, automobiles, railroad vehicles, economy or management can be exemplified.
  • the time series data is a data string including data corresponding to a plurality of different times, and is a data string in which the time change of the data can be grasped.
  • the time series data may be any data, for example, a data string containing data observed at a plurality of different times, or data processed at a plurality of different times. It may be a data string containing the results.
  • the time series data may be feedback data or the like used for control. That is, the time series data includes a plurality of data points corresponding to different times.
  • the data point corresponds to one point when the time information indicating the time and the value such as the sensor value corresponding to the time are represented by the two-dimensional coordinate system.
  • the time-series data is data in which sensor values measured by sensors at regular time intervals are arranged together with the acquisition time of the sensor values.
  • the sensors include, for example, a temperature sensor that measures the temperature of equipment, equipment, etc., a sensor that detects the rotational position of a motor provided in a factory machine, a force sensor that measures the acceleration of a factory machine, a current sensor, and the like.
  • a voltage sensor or the like Time-series data on exchange rates, stock prices, futures prices, etc. are exemplified as time-series data on the economy or management. Examples of the anomaly of these data include anomalies such as a sharp drop in price.
  • Time-series data may be stored in, for example, processing machines that are equipment on the factory line, manufacturing equipment such as robot pumps, equipment such as automobiles and railroad vehicles, air conditioning equipment such as factories and buildings, electricity, and so on. It may be data stored in a control system such as lighting and water supply / drainage. Further, the time series data may be data accumulated in a control system for controlling processes of a power plant such as thermal power, hydraulic power, nuclear power, a chemical plant, a steel plant, a water and sewage plant, and the like. Further, the time series data may be data accumulated in an information system related to economy, management, or the like.
  • the data acquisition unit 101 of the abnormality detection device 100 receives input of data such as settings used for the abnormality detection process.
  • the data acquisition unit 101 may accept input of time series data.
  • the data division unit 102 divides the time series data into a learning section and a test section, which will be described later.
  • the subsequence generation unit 103 generates learning data that is a subsequence of the learning section of the time series data.
  • the prediction distribution calculation unit 104 obtains the probability distribution corresponding to the data points in the test section based on the learning data.
  • the credible interval calculation unit 105 calculates the credible interval corresponding to the data points of the test interval based on the probability distribution.
  • the anomaly score calculation unit 106 calculates an anomaly score indicating the degree of deviation between the credit interval and the time series data of the test interval.
  • the anomaly detection unit 107 detects an abnormality using the probability distribution calculated by the prediction distribution calculation unit 104.
  • the abnormality detection unit 107 detects an abnormality based on, for example, an abnormality degree score. Details of the operation of each part of the abnormality detection device 100 will be described later.
  • FIG. 2 is a diagram showing a configuration example of a computer system that realizes the abnormality detection device 100.
  • the computer system includes a computer 20 and an input device 209 and a display 210 connected to the computer 20.
  • the computer 20 includes a processor 201, an auxiliary storage device 202, a memory 203, an input interface (hereinafter abbreviated as I / F) 204, a display I / F 205, an alarm output device 206, and a network I / F 207.
  • the processor 201 is connected to the auxiliary storage device 202, the memory 203, the input I / F 204, the display I / F 205, the alarm output device 206, and the network I / F 207 via the signal line 208.
  • the processor 201 is, for example, a CPU (Central Processing Unit), an MPU (Micro Processing Unit), or the like.
  • the auxiliary storage device 202 and the memory 203 are a RAM (Random Access Memory), a ROM (Read Only Memory), an HDD (Hard Disk Drive), and the like.
  • the input I / F 204 is connected to the input device 209 via the cable 211.
  • the input I / F 204 is a circuit for exchanging data with the input device 209.
  • the input device 209 is a device that receives input from the user, and includes a keyboard, a mouse, and the like.
  • the display I / F 205 is connected to the display 210 via the cable 212.
  • the display I / F 205 is a circuit for exchanging data with the display 210.
  • the input device 209 and the display 210 may be integrated and realized by a touch panel.
  • the display 210 is an example of an output device, but in addition to the display 210, an output device such as a printer may be connected via the I / F of the output device.
  • the alarm output device 206 is an indicator light such as an LED (Light Emitting Diode) pilot lamp, a speaker, and the like. Note that FIG. 2 shows an example in which the alarm output device 206 is provided inside the computer 20, but the present invention is not limited to this, and the alarm output device 206 is provided outside the computer 20 like the display 210 and has a cable. It may be connected to the computer 20 via.
  • LED Light Emitting Diode
  • the network I / F207 is a communication circuit for communicating with the outside, and is connected to a network (not shown) via a wired line or a wireless line. Other devices such as a computer (not shown) and a database server having a database are connected to the network.
  • the network I / F 207 sends / receives e-mail to / from another device, receives data stored in the database of the other device, and stores data in the database of the other device. Send to the device of.
  • each functional unit of the abnormality detection device 100 shown in FIG. 1 are realized by software, firmware, or a combination of software and firmware.
  • the software, firmware, or software and firmware for realizing the functions of each functional unit of the abnormality detection device 100 are described as a program.
  • This program is stored in the auxiliary storage device 202.
  • This program causes the computer 20 to execute the procedure or method of each functional unit. Specifically, when the processor 201 executes the program, each functional unit of the abnormality detection device 100 shown in FIG. 1 is realized.
  • the input device 209 is also used to realize the function of the data acquisition unit 101.
  • at least one of the display 210 and the alarm output device 206 is used to realize the function of the abnormality detection unit 107.
  • This program may be provided by a recording medium or a communication medium and stored in the auxiliary storage device 202.
  • the above-mentioned time series data is stored in the auxiliary storage device 202.
  • the time series data is transmitted from another device and stored in the auxiliary storage device 202 via the network I / F 207.
  • the time series data may be stored in the auxiliary storage device 202 by being recorded on the recording medium and read from the recording medium, or may be input by the user via the input device 209.
  • the program stored in the auxiliary storage device 202 is loaded from the auxiliary storage device 202 into the memory 203 and read into the processor 201 to be executed. By executing the program, the functions of each functional unit shown in FIG. 1 are realized. Further, when the program is executed, data used for executing the program such as time series data is also loaded from the auxiliary storage device 202 into the memory 203. The execution result of the program is written in the memory 203, stored in the auxiliary storage device 202, displayed on the display 210 via the display I / F 205, or displayed on the display 210 via the network I / F 207, depending on the description content of the program. It may be sent to other devices on the network.
  • time-series data data measured by a plurality of types of sensors installed in a manufacturing apparatus continuously operating on a factory line
  • the object of abnormality detection is a manufacturing apparatus
  • the time series data is not limited to the data measured by the sensor.
  • FIGS. 3 to 5 are diagrams showing an example of time series data.
  • the sensor values 303 shown in FIGS. 3 to 5 are sensor values that are data measured at regular intervals by a plurality of types of sensors installed in a manufacturing apparatus that continuously operates on a factory line.
  • the sensor value 303 is associated with time information 301 indicating the time when each data is acquired.
  • the set of the time information 301 and the sensor value 303 is time series data.
  • the plurality of types of sensors include the acceleration sensor A.
  • the sensor value is not limited to the value measured by the acceleration sensor A, and the measured values of the current, voltage, vibration, acceleration, pressure, etc. of the manufacturing apparatus can be exemplified.
  • time information 301 indicating the time when each data of the sensor value 303 is acquired and control information 302 indicating the control conditions of the manufacturing apparatus are shown together with the sensor value 303.
  • the control information 302 is, for example, recipe information which is a command value related to the number of manufactured products, which is the number of manufactured products, and the manufacturing conditions.
  • the command value is, for example, the command value of the motor speed in the case of a rotating mechanism, the command value of the temperature at the time of welding in the case of a welding device, and the laser in the case of a laser processing machine. This is the command value of the output voltage.
  • the recipe information will be explained. Depending on the product, the command value may be changed in several stages.
  • Some command value change patterns, a set of processing conditions, and the like are called recipes.
  • An example of a rotating mechanism is a vacuum pump in semiconductor manufacturing. In a vacuum pump, air is discharged by rotating a motor to create a vacuum state.
  • chemicals, gas, etc. are applied to the wafer.
  • the types of chemicals, gases, etc. differ depending on the product type.
  • the application timing of chemicals, gas, etc. differs depending on the product, and the rotation speed of the motor differs depending on the product. For example, the rotation speed of the motor is A before the gas is charged, the rotation speed of the motor is B when the gas is charged, and the rotation speed of the motor is C after the gas is charged.
  • Recipe information is information that indicates these procedures.
  • the control information 302 includes the command value 1.
  • the control information 302 is recorded as state information together with the time information 301 and the sensor value 303 which are time series data.
  • the state information is recorded by, for example, a control device that controls the manufacturing device, and the abnormality detection device 100 acquires the state information from this control device via the network.
  • the time information 301 is indicated by the time, but the time information is not limited to the time itself, and may be a continuous number assigned mechanically. It may be a numerical value such as a row number of a matrix.
  • the time information may not be added to each sensor as long as the data are arranged in the order of acquisition time.
  • the start time of the time-series data is managed separately by being described in the file name of the data file containing the time-series data, for example, and the information indicating the acquisition interval of each sensor value is managed.
  • the acquisition time of each data can be known from the start time and the number of the data in the time series data.
  • the time information is not added for each data point in this way, but may be given indirectly.
  • the state information is described as one table in FIG. 3, the format of the state information is not limited to the example shown in FIG.
  • the time information and the control information may be created as one table, and the set of the time information 301 and the sensor value 303, which are time series data, may be created as another table. Further, the time series data may be created as a separate table for each sensor type. In this way, the state information may be divided into a plurality of states as long as the correspondence between the information can be performed.
  • the time series data may be a summarized summary value instead of the measured value itself measured by the sensor.
  • a value that summarizes the data measured by the sensor according to a certain rule may be recorded.
  • the term "summary" as used herein means that data with a smaller amount of data than the original data is generated by performing processing using the original data.
  • the specific processing content of the summary is not particularly limited, but may be, for example, statistical processing, Fourier transform processing, or the like.
  • the sensor acquires the measured value from every second, and the control device of the manufacturing apparatus generates one representative value per hour based on the measured value.
  • the representative value may be the average value of the measured values for one hour, the median value of the measured values for one hour, or the mode value of the measured values for one hour. Good. Further, the abnormality detection device 100 may acquire the measured values measured by the sensor, summarize the acquired measured values, and generate time series data.
  • the time series data is data every second.
  • the value of the command value 1 is not changed.
  • the time series data is data every hour.
  • the command value 1 is changed from 20 to 40 at 14:00:00 on December 01, 2018, from 40 to 80 at 16:00:00 on December 01, 2018, and 2018. / 12/01 It was changed from 80 to 20 at 17:00:00.
  • the command value may be changed depending on the production status and the like.
  • data can be extracted according to the command value and the abnormality detection process can be performed using the time series data for each command value so that the tendency of the time series data can be easily predicted.
  • the extracted data will be defective. For example, in the example shown in FIG. 4, if the command value 1 value of 20 is extracted, it will be at three time points from 2018/12/01 14:00:00 to 2018/12/01 16:00:00. The corresponding data will be lost.
  • FIG. 5 shows an example in which the time series data is missing.
  • the data corresponding to the two time points of 2018/12/01 14:00:00 and 2018/12/01 15:00:00 are missing.
  • the abnormality detection device 100 may interpolate the missing data by the interpolation process.
  • FIG. 6 is a flowchart showing an example of the abnormality detection processing procedure in the abnormality detection device 100.
  • the data acquisition unit 101 accepts the selection of time-series data to be processed (step S1). As described above, when the measured values of a plurality of types of sensors are used as time series data, the time series data is generated for each sensor.
  • the user receives a selection of which of these time series data is to be processed.
  • the data acquisition unit 101 displays information for identifying selectable time-series data, for example, a name indicating a sensor corresponding to the time-series data, on the display 210, and the user selects the displayed name from the displayed names. You may accept the selection.
  • the processing condition for example, it is possible to specify whether to perform the processing of extracting the data for each command value as described above.
  • the processing condition also determines which command value the data corresponding to which command value is to be processed.
  • step S2 the data acquisition unit 101 performs preprocessing according to the processing conditions (step S2).
  • the data acquisition unit 101 performs a process of extracting the time-series data of the processing target specified in step S1 from the state information as a preprocessing.
  • the data acquisition unit 101 is instructed in step S2 from the time-series data to be processed as preprocessing. Extract the data corresponding to the command value.
  • the data acquisition unit 101 may make up for the missing data by the interpolation process as preprocessing.
  • the data acquisition unit 101 receives the ratio of the learning section and the test section (step S3).
  • the time series data is divided into a learning section and a test section, and the data in the test section is predicted using the time series data in the learning section.
  • the data acquisition unit 101 receives input from the user of the ratio of the learning section and the test section used at the time of this division.
  • the learning interval and the test interval may be the ratio of the time length corresponding to the data or the ratio of the data points, but here, as described above, the case where the time series data is missing is considered. Then, the ratio of the data points is used.
  • the data division unit 102 divides the time series data into a learning section and a test section based on the ratio of the learning section and the test section (step S4). Specifically, the data division unit 102 calculates the division position for dividing the time series data into the learning section and the test section based on the ratio of the learning section and the test section. For example, suppose that the number of data points of the time-series data to be processed is N all , and the ratio of the learning section to the test section is R t : R d for the learning section: test section.
  • the data dividing unit 102 among the N all pieces of data, the beginning of N all ⁇ a (R t / (R t + R d)) pieces of data as training interval, the time series data after the learning period Let it be a test section.
  • N all ⁇ (R t / (R t + R d )) is not an integer
  • learning is performed by rounding, rounding, rounding up, etc. to N all ⁇ (R t / (R t + R d )).
  • N all ⁇ (R t / (R t + R d )) is not an integer
  • learning is performed by rounding, rounding, rounding up, etc. to N all ⁇ (R t / (R t + R d )).
  • n be the data length of the learning section obtained in this way, that is, the number of data points
  • m be the data length of the test section.
  • n + m N all .
  • the division position between the learning section and the test section is between the nth and n + 1th of the time series data.
  • the learning section is a section in which the time corresponding to the time series data precedes the test section.
  • the number of data points in the learning section and the number of data points in the test section are also hereinafter referred to as learning data length and test data length, respectively.
  • the data division unit 102 notifies the subsequence generation unit 103 of the training data length and the test data length.
  • the subsequence generation unit 103 generates learning data, which is a subsequence of the learning section, based on the division result of step S4, that is, the division position calculated in step S4 (step S5). That is, the subsequence generation unit 103 generates a subsequence of the learning section by extracting the first n points from the time series data, and extracts the remaining m points of the time series data to generate the subsequence of the test section. Generate.
  • the subsequence generation unit 103 outputs the generated subsequence of the learning section to the prediction distribution calculation unit 104.
  • the learning section is updated in the process of step S9 later.
  • the learning section divided in step S5 is also referred to as an initial learning section.
  • the prediction distribution calculation unit 104 obtains the probability distribution and the predicted value at point j of the test section based on the learning data which is a subsequence of the learning section (step S6).
  • j is a natural number indicating the number of data in the subsequence in the initial test interval, and the initial value is 1.
  • the j-time point indicates a time point corresponding to the j-th data point in the subsequence in the test interval, that is, the j-th time point.
  • the prediction distribution calculation unit 104 is a test corresponding to the next data point of the learning data, that is, the n + 1 point from the beginning, based on the learning data which is a subsequence of the initial learning section.
  • the prediction distribution calculation unit 104 calculates a conditional distribution at the next point of the training data based on the training data, for example, using a model by Gaussian process regression (GPR: Gaussian Process Regression).
  • GPR Gaussian Process Regression
  • Y (y 1, y 2, ..., y n)
  • p (Y ) the Gaussian distribution.
  • C n + 1 in the equation (1) is a covariance matrix of (n + 1) ⁇ (n + 1) and can be expressed in the form shown in the equation (2).
  • C n is the covariance matrix of n ⁇ n, can be expressed using a kernel function k (x i, x j) .
  • j is n + 1.
  • the kernel function is a function that expresses the degree of similarity, that is, the correlation between two variables, x i and x j .
  • K is a vector having an element of k (x n , x n + 1 ).
  • c is a scalar as shown in the equation (3).
  • is a constant.
  • Gauss kernel shown in equation (4) is used as the kernel function.
  • An exponential kernel or a linear kernel may be used, and the kernel function is not limited to the Gauss kernel.
  • the prediction distribution calculation unit 104 uses the above equations (1) to (4) to obtain (x 1 , y 1 ), (x 2 , y 2 ), ..., (x n ,) the time series data of the learning interval.
  • y n the average value ⁇ of the conditional distribution p (x n + 1
  • Y) can be expressed by the equation (7).
  • the probability distribution at the time point corresponding to x n + 1 is a Gaussian distribution with a mean value ⁇ and a variance ⁇ 2 .
  • FIG. 7 is a diagram showing an example of a Gaussian distribution.
  • the predicted value of the time series data at time j can be the average value of the Gaussian distribution.
  • the credit interval is, for example, a 95% credit interval
  • the range excluding the left and right 2.5% in the Gaussian distribution is the credit interval at time j.
  • the 95% credible interval is the interval in which the probability that the true value exists in the credible interval is 95%.
  • the prediction distribution calculation unit 104 calculates the probability distribution and then calculates the prediction value, that is, the average value of the Gaussian distribution based on the probability distribution. Further, the prediction distribution calculation unit 104 passes the calculated probability distribution to the credit interval calculation unit 105.
  • the credible interval calculation unit 105 calculates the credible interval at time j based on the probability distribution (step S7). The credible interval calculation unit 105 stores the calculated credible interval in the auxiliary storage device 202.
  • the credible interval calculation unit 105 determines whether or not the credible intervals of all the points in the test section have been calculated (step S8). When there is a time point in the test section where the credit interval is not calculated (step S8 No), the credit interval calculation unit 105 instructs the subsequence generation unit 103 to learn the learning interval, and the subsequence generation unit 103 determines the learning interval. Update (step S9). Specifically, in step S9, the subsequence generation unit 103 updates the learning section by sliding the learning section backward, that is, by one data point toward the test section side, and updates the subsequence of the updated learning section. It is generated and output to the prediction distribution calculation unit 104.
  • Prediction 1 in the second stage of FIG. 8 shows how the predicted value is calculated in step S6 of the first time, that is, the first loop.
  • the dark hatched circles indicate the measured values in the learning section
  • the light hatched circles indicate the measured values in the test section.
  • the measured value is data input as time series data.
  • the time-series data may be a summary value or the like instead of the measured value as described above, but since the sensor value is illustrated here, it is described as the measured value.
  • the actually measured value in FIG. 8 is a summary value.
  • Prediction 1 based on the learning section, that is, the initial learning section, which is the time point 14 points from the left in the time series data, it corresponds to the time point next to the initial learning section, that is, the first time point of the test section, which is indicated by a square mark.
  • the predicted value to be calculated is calculated.
  • Prediction 2 in the third stage of FIG. 8 shows how the prediction value is calculated in step S6 of the second loop after the learning section is updated in step S9 of the first loop.
  • step S9 of the first loop the learning section is updated so as to be slid to the left by one point. That is, the subsequence generation unit 103 updates the learning section so that the corresponding time shifts to a later time, and generates the subsequence corresponding to the updated learning section as the updated learning data. Further, in the updated learning section, the predicted value is used instead of the measured value at the time point when the test section is deviated by one point to the left. That is, in the third stage of FIG.
  • the updated learning section includes the actually measured values of 13 points from the second to the 14th from the left in the time series data and one predicted value of the test section.
  • the learning interval updated in this way includes the predicted value of the test interval calculated according to the probability distribution.
  • the probability distribution of the update point which is the next data point of the updated learning interval, that is, the next time point of the updated learning interval, is calculated by using the subsequence of the updated learning interval.
  • the predicted value based on the distribution is calculated.
  • the data points next to the initial learning section that is, the test section, indicated by the square marks. The predicted value corresponding to the first data point is calculated.
  • step S9 the learning section of step S9 is updated and steps S6 to S8 are carried out until the credit intervals of all the points of the test section are calculated, that is, the m-th prediction m, which is the number of data points of the test section, is executed. Until then, the processes of prediction 3 to prediction m are carried out in the same manner.
  • the update of the learning section in step S9 the learning section is sequentially shifted to the left side, and along with this, the predicted value is added one point at a time to the learning section.
  • the credible interval calculation unit 105 passes the credible interval data of each point in the test section to the abnormality score calculation unit 106.
  • the abnormality degree score calculation unit 106 calculates the abnormality degree score of the test section (step S10).
  • the anomaly score is a value indicating the degree of deviation between the training data and the time series data of the test interval. That is, the anomaly degree score is a value indicating the relative degree of divergence between the behavior of the time series data in the learning section and the behavior of the time series data in the test section.
  • the anomaly degree score is expressed by a numerical value from 0.0 to 1.0, for example, and the larger the degree of deviation, the closer to 1.0.
  • the anomaly degree score becomes low.
  • the definition of the anomaly score is not limited to this, and any degree of deviation between the behavior of the time series data in the learning section and the behavior of the time series data in the test section may be expressed.
  • the abnormality degree score calculation unit 106 determines at each point whether or not the measured value of the test section is within the credible interval, and the measured value is within the credible interval. It is assumed that a method of calculating the anomaly degree score by dividing the data score by the total data score of the test interval is used. That is, the abnormality degree score calculation unit 106 calculates the abnormality degree score based on the credit interval corresponding to the plurality of data points of the test section and the time series data of the test section.
  • the anomaly degree score calculation unit 106 may calculate the anomaly degree score based on the variance of the probability distribution calculated by the prediction distribution calculation unit 104.
  • the abnormality detection unit 107 outputs the abnormality determination result according to the abnormality degree score (step S11). For example, the abnormality detection unit 107 determines that the abnormality is normal when the abnormality score is 0.0 or more and less than 0.5, and needs attention when the abnormality score is 0.5 or more and less than 0.7. If the anomaly score is 0.7 or more, it is determined that the abnormality requires a warning. Although caution is also included here as a part of the abnormality, only the abnormality that requires a warning may be defined as the abnormality.
  • the abnormality detection unit 107 transmits the abnormality determination result to another device via the network I / F 207 by e-mail, or displays the abnormality determination result on the display 210 via the display I / F 205. If the determination result is an abnormality that requires a warning, the abnormality detection unit 107 may issue an alarm by the alarm output device 206. Further, the abnormality detection unit 107 may treat the transition of the abnormality degree score as time-series data, and display the trend graph on the display 210 via the display I / F 205.
  • the abnormality detection unit 107 determines the abnormality using the abnormality degree score, but the abnormality determination method is a method using the calculated credit interval or predicted value, in other words, the probability distribution. Any method may be used to determine an abnormality, and the method is not limited to the above-mentioned example.
  • the abnormality detection unit 107 may determine that there is an abnormality if there is even one actually measured value that deviates from the credible interval in the test section. That is, the abnormality detection unit 107 may determine an abnormality based on the probability distribution calculated by the prediction distribution calculation unit 104.
  • the subsequence generation unit 103 may generate the subsequence of the learning section of the time series data as the learning data. Then, when the test section has a plurality of points, the subsequence generation unit 103 updates the learning section as described above.
  • the abnormality detection unit 107 may display information including the credible interval and the abnormality degree score shown in FIG. 9 on the display 210 via the display I / F 205. Further, data such as a credible interval and an abnormality degree score may be transmitted to an external display via the network I / F 207 and displayed on the external display. By constantly displaying this information on the display 210 or an external display, the operator can confirm the presence or absence of an abnormality and an abnormality sign in real time on a factory line or the like.
  • the processing shown in FIG. 6 may be performed for each time series data, or the processing shown in FIG. 6 may be performed for the specific time series data. May be good. Further, when time-series data is extracted for each control condition such as a command value and the process shown in FIG. 6 is performed, the process shown in FIG. 6 may be performed for each command value or specified. The processing shown in FIG. 6 may be carried out with respect to the command value of.
  • the above information may be recorded and displayed as a graph on a regular basis.
  • it can be dealt with by weighting or the like when calculating the abnormality degree score, so that it is a case where a plurality of types of indicated values are switched according to the production plan with the same device.
  • the processing shown in FIG. 6 above can be performed for each command value.
  • the abnormality detection method of the present embodiment does not matter the equipment such as a factory, the type of sensor, the tendency of time series data, etc., which are the objects of abnormality detection. Therefore, it is not necessary to evaluate for setting the threshold value for determining the abnormality for each object of abnormality detection, so that the workload for setting the threshold value can be suppressed. Further, in the present embodiment, since the abnormality can be detected based on the tendency of the change such as the gradual change of the time series data and the abnormality in which the tendency suddenly changes, the abnormality can be detected by a simple comparison between the time series data and the threshold value. Compared to the detection method, it is possible to respond to the detection of various abnormalities.
  • anomaly detection device 101 data acquisition unit, 102 data division unit, 103 sub-column generation unit, 104 prediction distribution calculation unit, 105 credit section calculation unit, 106 abnormality degree score calculation unit, 107 abnormality detection unit, 201 processor, 202 auxiliary Storage device, 203 memory, 204 input I / F, 205 display I / F, 206 alarm output device, 207 network I / F, 209 input device, 210 display.

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Biophysics (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Biomedical Technology (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Testing And Monitoring For Control Systems (AREA)
  • Testing Of Devices, Machine Parts, Or Other Structures Thereof (AREA)

Abstract

本発明にかかる異常検知装置(100)は、時系列データを、学習区間とテスト区間に分割するデータ分割部(102)と、時系列データのうち学習区間の部分列を学習データとして生成する部分列生成部(103)と、学習データを用いて、テスト区間のデータ点に対応する確率分布を求める予測分布算出部(104)と、確率分布を用いて異常を検知する異常検知部(107)と、を備える。

Description

異常検知装置および異常検知方法
 本発明は、工場、化学プラント、鉄鋼プラント等の設備をはじめとした異常検知の対象物の異常を判定する異常検知装置および異常検知方法に関する。
 工場、ビルといった設備では、該設備内の空調設備、電気照明等といった機器を制御するための制御システムが導入されている。火力、水力および原子力をはじめとした発電プラント、化学プラント、鉄鋼プラント等の設備でも、プロセスを制御するための制御システムが導入されている。また、工場の設備、自動車、鉄道車両等には、これらの設備の状態を記録するためのロギングシステムが搭載されている場合が多い。設備の状態は、設備が備える機器の状態、設備内または設備外の環境を示す状態などを含む。ロギングシステムおよび制御システムでは、一般に、センサによって計測された、時間の経過に応じた設備の状態を示す時系列データが蓄積されている。
 従来から、上記時系列データの変化を分析して、上記設備などの異常検知の対象物の異常を検知することが行われている。例えば、特許文献1には、時系列データから特徴を抽出し、抽出した特徴と、異常を含まないトレーニングデータから抽出された特徴との距離が、閾値を超える場合に異常と判定する異常検出手法が開示されている。
特開2015-11027号公報
 一方、設備内の機器によって、または状態を計測するセンサによって、時系列データの傾向が異なる場合がある。このため、上記特許文献1に記載の手法のように閾値を用いた判定を行う場合、機器およびセンサごとに、閾値の評価および検証が必要となるという課題がある。また、この閾値の評価および検証は、熟練オペレータの知見、設備設計者の知見等の外部情報が必要となるため、オペレータおよび設計者の負荷が高くかつ時間を要する。このため、閾値の設定のための作業負荷を抑制することが望まれる。
 本発明は、上記に鑑みてなされたものであって、閾値の設定のための作業負荷を抑制して、異常検知の対象物の異常を検知することができる異常検知装置を得ることを目的とする。
 上述した課題を解決し、目的を達成するために、本発明にかかる異常検知装置は、時系列データを、学習区間とテスト区間に分割するデータ分割部と、時系列データのうち学習区間の部分列を学習データとして生成する部分列生成部と、を備える。また、異常検知装置は、学習データを用いて、テスト区間のデータ点に対応する確率分布を求める予測分布算出部と、確率分布を用いて異常を検知する異常検知部と、備える。
 本発明にかかる異常検知装置は、閾値の設定のための作業負荷を抑制して、異常検知の対象物の異常を検知することができるという効果を奏する。
本発明の実施の形態にかかる異常検知装置の機能構成例を示す図 異常検知装置を実現するコンピュータシステムの構成例を示す図 時系列データの一例を示す図 時系列データの一例を示す図 時系列データの一例を示す図 異常検知装置における異常検知処理手順の一例を示すフローチャート ガウス分布の一例を示す図 学習区間の更新の様子を示す図 テスト区間の各時点の信用区間と異常度スコアの一例を示す図
 以下に、本発明の実施の形態にかかる異常検知装置および異常検知方法を図面に基づいて詳細に説明する。なお、この実施の形態によりこの発明が限定されるものではない。
実施の形態.
 図1は、本発明の実施の形態にかかる異常検知装置の機能構成例を示す図である。図1に示すように、本実施の形態の異常検知装置100は、データ取得部101、データ分割部102、部分列生成部103、予測分布算出部104、信用区間算出部105、異常度スコア算出部106および異常検知部107を備える。
 本実施の形態の異常検知装置100は、異常検知の対象物の状態を示す時系列データを取得し、取得した時系列データに基づいて、異常検知の対象物の異常を検知する。異常検知の対象物としては、工場、化学プラント、鉄鋼プラント、上下水道プラントをはじめとした設備、自動車、鉄道車両、経済または経営等に関するデータを例示することができる。時系列データは、複数の異なる時間にそれぞれ対応するデータを含むデータ列であり、データの時間変化が把握可能なデータ列である。時系列データは、どのようなものでも良く、例えば、複数の異なる時間にそれぞれ観測されたデータを含むデータ列であってもよいし、複数の異なる時間にそれぞれ観測されたデータがデータ処理された結果を含むデータ列であってもよい。また、時系列データは、制御に用いられたフィードバックデータなどであってもよい。すなわち、時系列データは、異なる時刻に対応する複数のデータ点を含む。なお、以下では、データ点は、時刻を示す時刻情報と該時刻に対応するセンサ値などの値とを、2次元座標系で表したときの1点に対応する。例えば、時系列データは、一定時間間隔でセンサにより計測されたセンサ値が、センサ値の取得時刻とともに、並べられたデータである。センサは、例えば、設備、機器等の温度を計測する温度センサ、工場の機械装置などが備えるモータの回転位置を検出するセンサ、工場の機械装置の加速度などを計測する力覚センサ、電流センサ、電圧センサ等である。経済または経営等に関する時系列データとしては、為替、株価、先物価格の時系列データが例示される。これらのデータの異常としては、例えば価格の急落といった異常が例示される。
 時系列データは、例えば、工場のラインの機器である加工機、ロボットポンプ等の製造装置、自動車、鉄道車両などの機器に蓄積されていてもよいし、工場、ビル等の空調設備、電気、照明、給排水等の制御システムに蓄積されているデータであってもよい。また、時系列データは、火力、水力、原子力等の発電プラント、化学プラント、鉄鋼プラント、上下水道プラント等のプロセスを制御するための制御システムに蓄積されているデータであってもよい。さらに、時系列データは、経済または経営等に関する情報システムに蓄積されているデータであっても良い。
 図1の説明に戻る。異常検知装置100のデータ取得部101は、異常検知処理に用いる設定等のデータの入力を受け付ける。データ取得部101は、時系列データの入力を受け付けてもよい。データ分割部102は、時系列データを後述する学習区間とテスト区間に分割する。部分列生成部103は、時系列データのうち学習区間の部分列である学習データを生成する。
 予測分布算出部104は、学習データに基づいて、テスト区間のデータ点に対応する確率分布を求める。信用区間算出部105は、確率分布に基づいて、テスト区間のデータ点に対応する信用区間を算出する。異常度スコア算出部106は、信用区間と、テスト区間の時系列データとの間の外れ度合いを示す異常度スコアを算出する。異常検知部107は、予測分布算出部104により算出された確率分布を用いて異常を検知する。異常検知部107は、例えば、異常度スコアに基づいて異常を検知する。異常検知装置100の各部の動作の詳細は後述する。
 ここで、異常検知装置100のハードウェア構成について説明する。異常検知装置100は、コンピュータシステムにより実現される。図2は、異常検知装置100を実現するコンピュータシステムの構成例を示す図である。このコンピュータシステムは、コンピュータ20と、コンピュータ20に接続される入力装置209およびディスプレイ210とを備える。
 コンピュータ20は、プロセッサ201、補助記憶装置202、メモリ203、入力インタフェース(以下、I/Fと略す)204、ディスプレイI/F205、警報出力装置206およびネットワークI/F207を備える。プロセッサ201は、信号線208を介して、補助記憶装置202、メモリ203、入力I/F204,ディスプレイI/F205、警報出力装置206およびネットワークI/F207と接続される。プロセッサ201は、例えば、CPU(Central Processing Unit)、MPU(Micro Processing Unit)等である。補助記憶装置202およびメモリ203は、RAM(Random Access Memory),ROM(Read Only Memory),HDD(Hard Disk Drive)等である。
 入力I/F204は、ケーブル211を介して、入力装置209に接続される。入力I/F204は、入力装置209との間でデータのやりとりをするための回路である。入力装置209は、ユーザからの入力を受け付ける装置であり、キーボード、マウス等を含む。
 ディスプレイI/F205は、ケーブル212を介して、ディスプレイ210に接続される。ディスプレイI/F205は、ディスプレイ210との間でデータのやりとりをするための回路である。なお、入力装置209とディスプレイ210は一体化されて、タッチパネルにより実現されてもよい。ディスプレイ210は、出力装置の一例であるが、ディスプレイ210に加えてプリンタなどの出力装置が、当該出力装置のI/Fを介して接続されていてもよい。
 警報出力装置206は、LED(Light Emitting Diode)パイロットランプをはじめとした表示灯、スピーカー等である。なお、図2では、警報出力装置206がコンピュータ20内に設けられる例を示しているが、これに限らず、警報出力装置206は、ディスプレイ210と同様にコンピュータ20の外部に設けられて、ケーブルを介してコンピュータ20と接続されていてもよい。
 ネットワークI/F207は、外部と通信を行うための通信回路であり、有線回線または無線回線を介して、図示しないネットワークに接続される。ネットワーク上には、図示しないコンピュータ、データベースを有するデータベースサーバ等の他の装置が接続される。ネットワークI/F207は、他の装置との間で電子メールの送受信を行ったり、他の装置のデータベースに格納されているデータを受信したり、他の装置のデータベースへ格納するためにデータを他の装置へ送信したりする。
 図1に示した異常検知装置100の各機能部の機能は、ソフトウエア、ファームウエア、またはソフトウエアとファームウエアとの組み合わせにより実現される。異常検知装置100の各機能部の機能を実現するためのソフトウエア、ファームウエア、またはソフトウエアとファームウエアは、プログラムとして記述される。このプログラムは、補助記憶装置202に記憶されている。このプログラムは、各機能部の手順または方法をコンピュータ20に実行させるものである。詳細には、プロセッサ201がプログラムを実行することにより、図1に示した異常検知装置100の各機能部が実現される。なお、図1に示した異常検知装置100の各機能部のうちデータ取得部101の機能の実現には入力装置209も用いられる。また、異常検知部107の機能の実現には、ディスプレイ210および警報出力装置206の内の少なくとも1つが用いられる。このプログラムは、記録媒体または通信媒体により提供されて、補助記憶装置202に記憶されてもよい。
 上述した時系列データは、補助記憶装置202に記憶されている。例えば、時系列データは、他の装置から送信され、ネットワークI/F207を介して補助記憶装置202に記憶される。または、時系列データは記録媒体に記録され、記録媒体から読み出されることにより、補助記憶装置202に記憶されてもよいし、入力装置209を介してユーザから入力されてもよい。
 補助記憶装置202に記憶されているプログラムは、補助記憶装置202からメモリ203にロードされ、プロセッサ201に読み込まれることにより実行される。プログラムが実行されることにより、図1に示す各機能部の機能が実現される。また、プログラムの実行時には、時系列データ等のプログラムの実行に用いられるデータも補助記憶装置202からメモリ203にロードされる。プログラムの実行結果は、メモリ203に書き込まれ、プログラムの記述内容に応じて、補助記憶装置202に記憶されたり、ディスプレイI/F205を介してディスプレイ210に表示されたり、ネットワークI/F207を介してネットワーク上の他の装置に送信されたりする。
 入力装置209は、後述するデータ分割割合等の異常検知装置100の処理において用いられる設定情報をユーザから受け付ける。また、入力装置209は、時系列データ処理の開始要求、終了要求といった処理に関する指示をユーザから受け付ける。入力装置209が受け付けた設定情報は、入力I/F204を介して補助記憶装置202に記憶される。入力装置209が受け付けた指示は、入力I/F204を介してプロセッサ201に入力される。
 次に、本実施の形態の異常検知方法について説明する。以下では、時系列データとして、工場のライン上で連続稼働する製造装置に備え付けられた、複数種類のセンサにより計測されたデータを例に挙げて説明する。すなわち、異常検知の対象物が製造装置である例を説明する。なお、上述したとおり、時系列データは、センサにより計測されたデータに限定されない。
 図3から図5は、時系列データの一例を示す図である。図3から図5に示したセンサ値303は、工場のライン上で連続稼働する製造装置に備え付けられた複数種類のセンサにより一定周期で計測されたデータであるセンサ値である。センサ値303は、各データが取得された時刻を示す時刻情報301と対応付けられている。図3から図5に示した例では、時刻情報301とセンサ値303の組が時系列データである。図3から図5に示した例では、複数種類のセンサは、加速度センサAを含む。センサ値は、加速度センサAによる計測値に限定されず、製造装置の電流、電圧、振動、加速度、圧力等の計測値を例示することができる。
 図3から図5では、センサ値303の各データが取得された時刻を示す時刻情報301と、製造装置の制御の条件を示す制御情報302と、がセンサ値303とともに示されている。制御情報302は、例えば、製造する製品の数である製品製造数、製造条件に関する指令値であるレシピ情報である。指令値は、例えば、異常検知の対象物が、回転する機構の場合にはモータの速度の指令値、溶接する装置の場合には溶接時の温度の指令値、レーザ加工機の場合にはレーザ出力電圧の指令値である。レシピ情報について説明する。製品によって、指令値を何段階かに分けて変更することがある。ここでは、いくつかの指令値変更パターン、処理条件の集合などをレシピと呼ぶ。回転する機構の例として、半導体製造における真空ポンプを挙げる。真空ポンプでは、モータを回転させることにより空気を排出して真空状態を作る。半導体を製造時に、薬品、ガスなどをウエハに塗布する。製品種類によって、薬品、ガスなどの種類が異なる。製品によって薬品、ガスなどの塗布タイミングが異なり、また製品によってモータの回転速度が異なる。例えば、ガス投入前はモータの回転速度はAとし、ガス投入時はモータの回転速度はBとる、ガス投入後はモータの回転速度をCとする。これらの手順をレシピと呼ぶ。レシピ情報は、これらの手順を示す情報である。図3から図5に示した例では、制御情報302は指令値1を含む。ここでは、制御情報302が、時系列データである時刻情報301およびセンサ値303とともに、状態情報として記録されているとする。状態情報は例えば製造装置を制御する制御装置が記録しており、異常検知装置100がこの制御装置からネットワークを介して取得する。
 図3から図5に示した例では、時刻情報301が時刻により示されているが、時刻情報は、時刻自体を示すものに限定されず、機械的に振られた連続する番号であったり、行列の行番号などの数値であったりしてもよい。また、時系列データが定期的に取得され欠損がないことが明らかなデータである場合には、取得時刻順にデータが並んでいれば、時刻情報がセンサごとに付加されていなくてもよい。この場合、時系列データの開始時刻については、例えば、時系列データが含まれるデータファイルのファイル名に記載される等により別に管理され、各センサ値の取得間隔を示す情報が管理されていれば、開始時刻と、データが時系列データの何番目のデータであるかにより、各データの取得時刻がわかる。時刻情報はこのようにデータ点ごとに付加されているのではなく、間接的に与えられていてもよい。
 なお、図3では、状態情報を1つのテーブルとして記載しているが、状態情報の形式は図3に示した例に限定されない。例えば、時刻情報と制御情報が1つのテーブルとして作成され、時系列データである時刻情報301とセンサ値303の組が別の1つのテーブルとして作成されていてもよい。また、時系列データもセンサの種別ごとに別のテーブルとして作成されていてもよい。このように、各情報間の対応付けが可能であれば、状態情報は複数に分割されていてもよい。
 また、時系列データは、センサにより計測された計測値そのものではなく要約された要約値であってもよい。工場、ライン、製造装置等によっては、センサにより計測されたデータを一定のルールに沿って要約した値が記録されている場合がある。ここでいう要約とは、元のデータを用いた処理を行うことにより、元のデータよりデータ量の少ないデータを生成することをいう。要約の具体的な処理内容は特に制約はないが、例えば、統計処理、フーリエ変換処理等であってもよい。例えば、センサが毎秒より計測値を取得しており、製造装置の制御装置がこの計測値に基づいて、1時間あたり1つの代表値を生成する。代表値は、1時間分の計測値の平均値であってもよいし、1時間分の計測値の中央値であってもよいし、1時間分の計測値の最頻値であってもよい。また、異常検知装置100が、センサにより計測された計測値を取得し、取得した計測値を要約して時系列データを生成してもよい。
 図3に示した例では、時系列データは1秒おきのデータである。図3に示した例では、指令値1の値は変更されていない。図4および図5に示した例では、時系列データは1時間おきのデータである。図4に示した例では、指令値1が、2018/12/01 14:00:00に20から40へ変更され、2018/12/01 16:00:00に40から80へ変更され、2018/12/01 17:00:00に80から20へ変更されている。このように、生産状況等に応じて指令値が変更されることもある。後述する異常検知処理において、時系列データの傾向を予測しやすいように、指令値に応じてデータを抽出し、指令値ごとの時系列データを用いて異常検知処理を行うことができる。このような場合、同一の動作条件、すなわち指令値1の値が同一のデータを抽出すると、抽出されたデータには欠損が生じる。例えば、図4に示した例で、指令値1の値が20のものを抽出すると、2018/12/01 14:00:00から2018/12/01 16:00:00までの3つの時点に対応するデータが欠損することになる。
 また、設備の稼働状態、通電状態によっては、一定周期で取得されているはずの計測値が取得されなかったり、設備のメンテナンス等で計測自体が行われなかったりすることにより、データに欠落が生じることがある。図5は、時系列データに欠落が生じた例を示している。図5に示した例では、2018/12/01 14:00:00と2018/12/01 15:00:00の2つの時点に対応するデータが欠落している。
 図4に示した例で指令値ごとにデータを抽出した場合、および図5に示したように元のデータに欠落が生じている場合などのように時系列データに欠落が生じている場合、異常検知装置100は、後述するように、補間処理により、欠落したデータを補間してもよい。
 図6は、異常検知装置100における異常検知処理手順の一例を示すフローチャートである。まず、データ取得部101は、処理対象の時系列データの選択を受け付ける(ステップS1)。上述した通り、複数種類のセンサの計測値が時系列データとして用いられる場合、時系列データはセンサごとには生成される。ステップS1では、ユーザから、これらの時系列データのうちどれを処理対象とするかの選択を受け付ける。このとき、データ取得部101は、ディスプレイ210に、選択可能な時系列データを識別する情報、例えば、時系列データに対応するセンサを示す名称などを表示し、表示された名称のなかからユーザによる選択を受け付けるようにしてもよい。また、処理対象の時系列データとしてセンサの種類だけでなく、処理対象の期間の選択も受け付けるようにしてもよい。ユーザは、入力装置209を操作することにより、表示された名称のなかから処理対象とする時系列データに対応する名称を選択する。また、データ取得部101は、ステップS1で、処理条件の入力も受け付けるようにしてもよい。処理条件としては、例えば、上述したように指令値ごとにデータを抽出した処理をするかを指定することが挙げられる。指令値ごとにデータを抽出した処理をするかが指定された場合には、どの指令値に対応するデータを処理対象とするかも処理条件となる。
 ステップS1の後、データ取得部101は、処理条件に応じた前処理を実施する(ステップS2)。処理条件が定められていない場合には、データ取得部101は、前処理として、状態情報からステップS1で指定された処理対象の時系列データを抽出する処理を行う。また、処理条件としてステップS1で指令値ごとにデータを抽出した処理することが指定された場合には、データ取得部101は、前処理として、処理対象の時系列データからステップS2で指令された指令値に対応するデータを抽出する。また、データ取得部101は、時系列データに欠落がある場合、前処理として、補間処理により欠落したデータを補ってもよい。
 また、データ取得部101は、学習区間とテスト区間の割合を受け付ける(ステップS3)。本実施の形態では、後述するように時系列データを学習区間とテスト区間とに分割し、学習区間の時系列データを用いてテスト区間のデータを予測する。ステップS3では、データ取得部101は、この分割の際に用いる学習区間とテスト区間の割合の入力を、ユーザから受け付ける。学習区間とテスト区間は、データに対応する時間長の比であってもよいし、データ点数の比であってもよいが、ここでは、上述したように時系列データに欠落が有る場合を考慮してデータ点数の比を用いるとする。
 次に、データ分割部102は、学習区間とテスト区間の割合に基づいて、時系列データを学習区間とテスト区間とに分割する(ステップS4)。詳細には、データ分割部102は、学習区間とテスト区間の割合に基づいて、時系列データを学習区間とテスト区間とに分割する分割位置を算出する。例えば、処理対象の時系列データのデータ点数がNallであり、学習区間とテスト区間の割合が、学習区間:テスト区間がR:Rであったとする。このとき、データ分割部102は、Nall個のデータのうち、はじめのNall×(R/(R+R))個のデータを学習区間とし、学習区間より後の時系列データをテスト区間とする。Nall×(R/(R+R))が整数でない場合には、Nall×(R/(R+R))に四捨五入、切り捨て、切り上げなどの処理をすることにより、学習区間のデータ点数を決定する。このようにして求めた学習区間のデータ長すなわちデータ点数をnとし、テスト区間のデータ長をmとする。n+m=Nallである。時系列データのn番目とn+1番目の間が学習区間とテスト区間の分割位置となる。このように、学習区間は、テスト区間より、時系列データに対応する時刻が前となる区間である。学習区間のデータ点数、テスト区間のデータ点数を、以下、それぞれ学習データ長、テストデータ長ともいう。データ分割部102は、学習データ長、テストデータ長を部分列生成部103へ通知する。
 次に、部分列生成部103は、ステップS4の分割結果、すなわちステップS4で算出された分割位置に基づいて、学習区間の部分列である学習データを生成する(ステップS5)。すなわち、部分列生成部103は、時系列データからはじめのn点を抽出することにより学習区間の部分列を生成し、時系列データの残りのm点を抽出することによりテスト区間の部分列を生成する。部分列生成部103は、生成した学習区間の部分列を予測分布算出部104へ出力する。なお、後述するように学習区間は後のステップS9の処理で更新される。以下では、ステップS5で分割された学習区間を初期学習区間ともいう。
 次に、予測分布算出部104は、学習区間の部分列である学習データを基に、テスト区間のj時点の確率分布と予測値を求める(ステップS6)。jは、初期テスト区間における部分列内のデータの番号を示す自然数であり、初期値は1である。j時点とは、テスト区間における部分列内のj番目のデータ点に対応する時点すなわちj番目の時刻のことを示す。具体的には、初回のステップS6では、予測分布算出部104は、初期学習区間の部分列である学習データを基に、学習データの次のデータ点、つまり先頭からn+1点目に相当するテスト区間のj番目の時点のデータの確率分布を算出する。したがって、1回目のステップS6では、jは1である。予測分布算出部104は、例えば、ガウス過程回帰(GPR:Gaussian Process Regression)によるモデルを用いて、学習データに基づき、学習データの次の点における条件付き分布を算出する。
 ガウス過程は、n個のデータの集合(x,x,…,x)について、これらのデータに対応するY=(y,y,…,y)における同時分布p(Y)がガウス分布に従うものである。回帰問題にガウス過程を適用すること、つまり上記のデータ集合に、ガウス過程を当てはめることがガウス過程回帰である。したがって、ガウス過程回帰では、上記の通り、n個のデータ点(X,Y)=(x,y),(x,y),…,(x,y)が与えられたとき、xn+1の点におけるYの予測分布として、条件付き分布p(xn+1|Y)を求めることになる。なお、i=1,2,…,nとするとき、(xi,)は、学習区間のi番目のデータ点を示し、xは時刻情報、yはxに対応するセンサ値等の値を示す。
 上記条件付き分布p(xn+1|Y)の算出には、以下の式(1)で示す同時分布p(Yn+1)が必要となる。式(1)におけるCn+1は、(n+1)×(n+1)の共分散行列であり、式(2)に示す形で表せる。
Figure JPOXMLDOC01-appb-M000001
Figure JPOXMLDOC01-appb-M000002
 ここで、Cはn×nの共分散行列であり、カーネル関数k(x,x)を用いて表現できる。なお、jは、n+1である。カーネル関数とは、xとxの2つの変数の類似度合いすなわち相関関係を表す関数である。また、Kは、k(x,xn+1)という要素を持つベクトルである。また、cは、式(3)に示す通りスカラーである。βは定数である。δijは、i=jのとき0となる変数である。なお、Yには測定誤差等の誤差があり、かつ誤差がガウス分布に従うと仮定する。この誤差は、式(3)における定数β-1と変数δijとの乗算結果に対応する。
Figure JPOXMLDOC01-appb-M000003
 ここでは、カーネル関数として、式(4)に示すガウスカーネルを用いるとする。なお、指数カーネルまたは線形カーネルを用いてもよく、カーネル関数はガウスカーネルに限定されない。
Figure JPOXMLDOC01-appb-M000004
 予測分布算出部104は、上記の式(1)~(4)を用いて、学習区間の時系列データを(x,y),(x,y),…,(x,y)として用いることで、yn+1のガウス分布である条件付き分布p(xn+1|Y)の平均値μと、分散σを、式(5)、式(6)により求めることができる。条件付き分布p(xn+1|Y)は、式(7)により表すことができる。
Figure JPOXMLDOC01-appb-M000005
Figure JPOXMLDOC01-appb-M000006
Figure JPOXMLDOC01-appb-M000007
 xn+1に対応する時点、すなわちj時点の確率分布は、平均値μ、分散σのガウス分布である。図7は、ガウス分布の一例を示す図である。ここで、j時点の時系列データの予測値は、上記ガウス分布の平均値とすることができる。また、そして信用区間は、例えば95%信用区間とした場合、ガウス分布における左右の2.5%を除く範囲が、j時点における信用区間となる。95%信用区間は、真の値が信用区間に存在する確率が95%となる区間である。
 図6の説明に戻り、予測分布算出部104は、確率分布を算出した後、確率分布に基づいて予測値、すなわちガウス分布の平均値を算出する。また、予測分布算出部104は、算出した確率分布を信用区間算出部105へ渡す。信用区間算出部105は、確率分布に基づいて、j時点の信用区間を算出する(ステップS7)。信用区間算出部105は、算出した信用区間を補助記憶装置202に記憶する。
 信用区間算出部105は、テスト区間の全点の信用区間を算出したか否かを判断する(ステップS8)。テスト区間のうち信用区間を算出していない時点がある場合(ステップS8 No)、信用区間算出部105は、部分列生成部103に学習区間を指示し、部分列生成部103は、学習区間を更新する(ステップS9)。具体的には、ステップS9では、部分列生成部103は、学習区間を、後ろへ、すなわちテスト区間側に1データ点分スライドさせることにより学習区間を更新し、更新した学習区間の部分列を生成して予測分布算出部104へ出力する。ステップS9の後、更新された学習区間に対応する部分列が学習データとして用いられて、ステップ6からの処理が繰り返される。学習区間は、ステップS9で更新されているので、2回目以降のステップS6では、更新された学習区間の次のデータ点に対応する処理が行われる。このため、ステップS6のj時点のjの値は学習区間の更新のたびに、1つずつインクリメントしていく。
 図8は、学習区間の更新の様子を示す図である。図8では、時系列データのデータ点数がNallを20とし、学習区間とテスト区間の割合を、R:R=7:3とした例を示している。つまり、図8では、時系列データを、学習区間を70%でテスト区間を30%となる割合で分割する例を示している。この例では、学習区間のデータ点数は14であり、テスト区間のデータ点数は6である。上述したステップS5では図中の最上段に示すように、入力である時系列データのうち左から14点が学習区間の部分列となり、右から6点がテスト区間の部分列となる。図8では、最右の点が最も直近のデータを示す。なお、図8では、時系列データとしてセンサ値を例に記載している。
 図8の2段目の予測1では、初回すなわちループ1回目のステップS6で予測値が算出される様子を示している。図8では、濃いハッチングの丸は学習区間内の実測値を示し、薄いハッチングの丸はテスト区間の実測値を示している。実測値は、時系列データとして入力されるデータである。なお、時系列データは、上述したように実測された値ではなく要約値等である場合もあるがここではセンサ値を例示しているので実測値と記載する。時系列データが要約値である場合には、図8の実測値は要約値となる。予測1では、時系列データのうち左から14点の時点である学習区間すなわち初期学習区間に基づいて、四角の印で示した、初期学習区間の次の時点すなわちテスト区間の最初の時点に対応する予測値が算出される。
 図8の3段目の予測2は、ループ1回目のステップS9で学習区間が更新された後のループ2回目のステップS6で、予測値が算出される様子を示している。ループ1回目のステップS9では、学習区間が、左側に1点ずれるようにスライドされるように更新される。すなわち、部分列生成部103は、学習区間を、対応する時刻が後の時刻へずれるように更新し、更新後の学習区間に対応する部分列を更新後の学習データとして生成する。また、更新された学習区間では、左側に1点ずれてテスト区間に入り込む時点については実測値ではなく予測値が用いられる。つまり、図8の3段目では、更新された学習区間は、時系列データのうち左から2番目から14番目までの13点の実測値と、テスト区間の予測値1点とを含む。このように更新された学習区間は、確率分布に応じて算出されるテスト区間の予測値を含む。予測2では、この更新された学習区間の部分列を用いて、更新された学習区間の次の時点すなわち更新後の学習区間の次のデータ点である更新点の確率分布が算出され、この確率分布に基づく予測値が算出される。時系列データのうち左から2番目から14番目までの13点の実測値と、学習区間すなわち初期学習区間に基づいて、四角の印で示した、初期学習区間の次のデータ点すなわちテスト区間の最初のデータ点に対応する予測値が算出される。
 予測2の後、ステップS9の学習区間の更新とステップS6~S8とが、テスト区間の全点の信用区間が算出されるまで、つまりテスト区間のデータ点数であるm回目の予測mが実施されるまで、予測3~予測mの処理が同様に実施される。ステップS9の学習区間の更新では、順次、左側に学習区間がずれ、これにともなって学習区間に予測値が1点ずつ追加されていく。
 図6の説明に戻る。ステップS8でYesと判定した場合、信用区間算出部105は、異常度スコア算出部106へ、テスト区間の各点の信用区間のデータを渡す。これにより、異常度スコア算出部106は、テスト区間の異常度スコアを算出する(ステップS10)。異常度スコアは、学習データとテスト区間の時系列データとの間の外れ度合いを示す値である。つまり、異常度スコアは、学習区間における時系列データの挙動と、テスト区間における時系列データの挙動との、相対的な乖離度合いを示す値である。異常度スコアは、例えば、0.0から1.0までの数値で表現され、乖離度合いが大きいほど1.0に近づくとする。したがって、学習区間における時系列データの挙動と、テスト区間における時系列データの挙動とが類似していると異常度スコアは低くなる。なお、異常度スコアの定義はこれに限定されず、学習区間における時系列データの挙動と、テスト区間における時系列データの挙動との乖離度合いを表現でくるものであればよい。
 ここでは、異常度スコアの具体的な算出方法として、異常度スコア算出部106が、テスト区間の実測値が信用区間内であるかどうかを各点で判定し、実測値が信用区間内となるデータ点数を、テスト区間の総データ点数で割った値を異常度スコアとして算出する方法を用いるとする。すなわち、異常度スコア算出部106は、テスト区間の複数のデータ点に対応する信用区間と、テスト区間の時系列データとに基づいて異常度スコアを算出する。
 図9は、テスト区間の各時点の信用区間と異常度スコアの一例を示す図である。図9では、テスト区間内で、破線で示した信用区間に存在しない実測値が5点あり、テスト区間のデータ点数は6である。このため、異常度スコアは、5/6=0.833…となる。図9では、異常度スコアの小数点第3位を四捨五入して異常度スコアを0.83と記載している。なお、学習データとして用いた部分列に、欠落がある場合は、分散σの値が大きくなり確率分布の裾が広がるため、信用区間が広がり、予測の確度が低下する。このような予測の確度が低い点に関しては、異常度スコアを算出する際に、重みを付けたりすることにより、予測の確度の低いデータの異常判定への影響を抑制することができる。例えば、分散σの値が規定値異常の場合には、異常度スコアの算出において該当する点を1点とせずに、0.5点とするといった重み付け方法が考えられる。このように、異常度スコア算出部106は、予測分布算出部104で算出された確率分布の分散に基づいて、異常度スコアを算出してもよい。
 図6の説明に戻り、ステップS10の後、異常検知部107は、異常度スコアに応じて、異常の判定結果を出力する(ステップS11)。例えば、異常検知部107は、異常度スコアが0.0以上かつ0.5未満である場合に正常と判定し、異常度スコアが0.5以上かつ0.7未満である場合に、要注意の異常と判定し、異常度スコアが0.7以上である場合に警告が必要な異常と判定する。なお、ここでは、要注意についても異常の一部としたが、警告が必要な異常のみを異常と定義してもよい。異常検知部107は、異常の判定結果を、電子メールによりネットワークI/F207を介して他の装置に送信したり、ディスプレイI/F205を介してディスプレイ210に表示したりする。また、判定結果が、警告が必要な異常であった場合には、異常検知部107は、警報出力装置206により警報を発してもよい。また、異常検知部107は、異常度スコアの推移を時系列データとして扱い、この時系列データをディスプレイI/F205を介してディスプレイ210にトレンドグラフを表示させてもよい。
 なお、上述した例では、異常検知部107は、異常度スコアを用いて異常を判定したが、異常の判定方法は、算出された信用区間または予測値を用いる方法、換言すれば確率分布に用いて異常を判定する方法であればよく、上述した例に限定されない。例えば、異常検知部107は、テスト区間で信用区間をはずれる実測値が1つでもあれば異常と判定してもよい。すなわち、異常検知部107は、予測分布算出部104によって算出された確率分布に基づいて異常を判定するものであればよい。
 なお、以上の例では、テスト区間の点数が複数であるため、テスト区間の回数分の予測値を求めたが、テスト区間が1点である場合には、初回のステップS8でYesとなるため、学習区間の更新はされない。つまり、学習区間の更新は必須ではなく、部分列生成部103は、時系列データのうち学習区間の部分列を学習データとして生成すればよい。そして、テスト区間が複数点である場合には、部分列生成部103は、上述したように学習区間の更新を行う。
 また、異常検知部107は、図9に示した信用区間と異常度スコアを含む情報をディスプレイI/F205を介してディスプレイ210に表示させてもよい。また、ネットワークI/F207を介して、信用区間と異常度スコア等のデータを外部の表示器へ送信し、外部の表示器に表示させてもよい。ディスプレイ210または外部の表示器に、これらの情報を常時表示しておくことで、工場のライン等において、作業者が、異常、および異常兆候の有無をリアルタイムに確認することができる。
 上述した通り、時系列データが複数ある場合には、時系列データごとに、図6に示した処理を実施してもよいし、特定の時系列データに関して図6に示した処理を実施してもよい。また、指令値の値など制御条件ごとに時系列データを抽出して図6に示した処理を実施する場合、指令値の値ごとに図6に示した処理を実施してもよいし、特定の指令値に関して図6に示した処理を実施してもよい。
 また、リアルタイム性が不要な場合には、上述した情報を記録しておき、定期的にグラフとして表示しても良い。本実施の形態では、時系列データの抜けがあった場合に異常度スコアの算出の際に重み付けなどにより対応できるため、同じ機器で生産計画に応じて複数種類の指示値を切り替える場合であっても、指令値の値ごとに上記の図6に示した処理を行うことができる。
 本実施の形態の異常検出方法は、異常検知の対象物である工場などの設備、センサの種類、時系列データの傾向などを問わない。このため、異常検知の対象物ごとに、異常と判定するための閾値の設定のための評価等を要しないので、閾値の設定のための作業負荷を抑制することができる。また、本実施の形態では、時系列データの徐々な変化、傾向が急変する異常といった変化の傾向を基に異常を検知することができるため、時系列データと閾値との単純な比較によって異常を検出する方法に比べて多様な異常の検知に対応することができる。また、例えば、異常の種類、原因といった詳細情報と、異常発生前後における異常度スコアとを紐付けすることで、異常の原因診断にも活用することができる。これにより、異常検知精度の向上および、異常原因の調査負荷が削減できる。
 以上の実施の形態に示した構成は、本発明の内容の一例を示すものであり、別の公知の技術と組み合わせることも可能であるし、本発明の要旨を逸脱しない範囲で、構成の一部を省略、変更することも可能である。
 100 異常検知装置、101 データ取得部、102 データ分割部、103 部分列生成部、104 予測分布算出部、105 信用区間算出部、106 異常度スコア算出部、107 異常検知部、201 プロセッサ、202 補助記憶装置、203 メモリ、204 入力I/F、205 ディスプレイI/F、206 警報出力装置、207 ネットワークI/F、209 入力装置、210 ディスプレイ。

Claims (7)

  1.  時系列データを、学習区間とテスト区間に分割するデータ分割部と、
     前記時系列データのうち前記学習区間の部分列を学習データとして生成する部分列生成部と、
     前記学習データを用いて、前記テスト区間のデータ点に対応する確率分布を求める予測分布算出部と、
     前記確率分布を用いて異常を検知する異常検知部と、
     を備えることを特徴とする異常検知装置。
  2.  前記確率分布に基づいて、前記テスト区間のデータ点に対応する信用区間を算出する信用区間算出部と、
     前記信用区間を用いて、前記学習データと前記テスト区間の前記時系列データとの間の外れ度合いを示す異常度スコアを算出する異常度スコア算出部と、
     を備え、
     前記異常検知部は、前記異常度スコアに基づいて異常を検知することを特徴とする請求項1に記載の異常検知装置。
  3.  前記学習区間は、前記テスト区間より、前記時系列データに対応する時刻が前となる区間であり、
     前記予測分布算出部は、前記確率分布として、前記学習区間の次のデータ点に対応する確率分布を求め、
     前記部分列生成部は、前記学習区間を、対応する時刻が後の時刻へずれるように更新し、更新後の学習区間に対応する部分列を更新後の学習データとして生成し、
     前記予測分布算出部は、前記更新後の学習データを用いて、前記更新後の学習区間の次のデータ点である更新点の確率分布を求め、
     前記信用区間算出部は、前記更新点の確率分布に基づいて、前記更新点の信用区間を算出し、
     前記異常度スコア算出部は、前記テスト区間の複数のデータ点に対応する前記信用区間
    と、前記テスト区間の前記時系列データとに基づいて前記異常度スコアを算出することを特徴とする請求項2に記載の異常検知装置。
  4.  前記更新後の学習区間は、前記確率分布に応じて算出される前記テスト区間の予測値を含むことを特徴とする請求項3に記載の異常検知装置。
  5.  異常度スコア算出部は、前記テスト区間の前記時系列データのうち、対応する前記信用区間内に存在しないデータの点数に基づいて、前記異常度スコアを算出することを特徴とする請求項3または4に記載の異常検知装置。
  6.  前記異常度スコア算出部は、前記予測分布算出部で算出された確率分布の分散に基づいて、前記異常度スコアを算出することを特徴とする請求項2から5のいずれか1つに記載の異常検知装置。
  7.  異常検知装置における異常検出方法であって、
     時系列データを、学習区間とテスト区間に分割する第1のステップと、
     前記時系列データのうち前記学習区間の部分列を学習データとして生成する第2のステップと、
     前記学習データを用いて、前記テスト区間のデータ点に対応する確率分布を求める第3のステップと、
     前記確率分布を用いて異常を検知する第4のステップと、
     を含むことを特徴とする異常検知方法。
PCT/JP2019/011158 2019-03-18 2019-03-18 異常検知装置および異常検知方法 WO2020188696A1 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
KR1020217028496A KR102408756B1 (ko) 2019-03-18 2019-03-18 이상 검지 장치 및 이상 검지 방법
CN201980093996.6A CN113574358B (zh) 2019-03-18 2019-03-18 异常检测装置及异常检测方法
PCT/JP2019/011158 WO2020188696A1 (ja) 2019-03-18 2019-03-18 異常検知装置および異常検知方法
JP2019555983A JP6647473B1 (ja) 2019-03-18 2019-03-18 異常検知装置および異常検知方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2019/011158 WO2020188696A1 (ja) 2019-03-18 2019-03-18 異常検知装置および異常検知方法

Publications (1)

Publication Number Publication Date
WO2020188696A1 true WO2020188696A1 (ja) 2020-09-24

Family

ID=69568118

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2019/011158 WO2020188696A1 (ja) 2019-03-18 2019-03-18 異常検知装置および異常検知方法

Country Status (4)

Country Link
JP (1) JP6647473B1 (ja)
KR (1) KR102408756B1 (ja)
CN (1) CN113574358B (ja)
WO (1) WO2020188696A1 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113296990A (zh) * 2020-09-30 2021-08-24 阿里云计算有限公司 时序数据的异常识别方法及装置
WO2023276083A1 (ja) * 2021-06-30 2023-01-05 慎平 大杉 情報処理システム、学習済みモデル、情報処理方法、及びプログラム
WO2023047903A1 (ja) * 2021-09-21 2023-03-30 株式会社日立インダストリアルプロダクツ 機器診断システム

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117113009B (zh) * 2023-10-23 2024-01-16 合肥亚明汽车部件有限公司 一种数字化工厂设备运行风险预警方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07280603A (ja) * 1994-04-14 1995-10-27 Shikoku Electric Power Co Inc 機械の異常判定方法
JP2000028781A (ja) * 1998-07-09 2000-01-28 Mitsubishi Electric Corp 制御棒挿入状態監視装置
JP2004054370A (ja) * 2002-07-17 2004-02-19 Nec Corp 時系列データに対する自己回帰モデル学習装置並びにそれを用いた外れ値および変化点の検出装置
WO2008114863A1 (ja) * 2007-03-22 2008-09-25 Nec Corporation 診断装置
JP2017215230A (ja) * 2016-06-01 2017-12-07 株式会社神戸製鋼所 回転機械の運転状態を診断する診断装置及び診断方法

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5602761A (en) * 1993-12-30 1997-02-11 Caterpillar Inc. Machine performance monitoring and fault classification using an exponentially weighted moving average scheme
JP3427946B2 (ja) * 1994-04-08 2003-07-22 大和製衡株式会社 重量選別機
JP4573036B2 (ja) * 2005-03-16 2010-11-04 オムロン株式会社 検査装置および検査方法
JP5072693B2 (ja) * 2007-04-11 2012-11-14 キヤノン株式会社 パターン識別装置及びその制御方法、異常パターン検出装置及びその制御方法、プログラム、記憶媒体
CN101256646A (zh) * 2008-03-20 2008-09-03 上海交通大学 轿车客户需求信息聚类分析系统
JP5301310B2 (ja) * 2009-02-17 2013-09-25 株式会社日立製作所 異常検知方法及び異常検知システム
JP2013143009A (ja) * 2012-01-11 2013-07-22 Hitachi Ltd 設備状態監視方法およびその装置
KR20140011064A (ko) * 2012-07-17 2014-01-28 서울과학기술대학교 산학협력단 이상치 탐지 기법을 이용한 가상 계측 결과의 신뢰도 추정 방법
US9146800B2 (en) 2013-07-01 2015-09-29 Mitsubishi Electric Research Laboratories, Inc. Method for detecting anomalies in a time series data with trajectory and stochastic components
JP6386520B2 (ja) * 2016-12-13 2018-09-05 ファナック株式会社 数値制御装置及び機械学習装置
JP6877245B2 (ja) * 2017-06-01 2021-05-26 株式会社東芝 情報処理装置、情報処理方法及びコンピュータプログラム

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07280603A (ja) * 1994-04-14 1995-10-27 Shikoku Electric Power Co Inc 機械の異常判定方法
JP2000028781A (ja) * 1998-07-09 2000-01-28 Mitsubishi Electric Corp 制御棒挿入状態監視装置
JP2004054370A (ja) * 2002-07-17 2004-02-19 Nec Corp 時系列データに対する自己回帰モデル学習装置並びにそれを用いた外れ値および変化点の検出装置
WO2008114863A1 (ja) * 2007-03-22 2008-09-25 Nec Corporation 診断装置
JP2017215230A (ja) * 2016-06-01 2017-12-07 株式会社神戸製鋼所 回転機械の運転状態を診断する診断装置及び診断方法

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113296990A (zh) * 2020-09-30 2021-08-24 阿里云计算有限公司 时序数据的异常识别方法及装置
CN113296990B (zh) * 2020-09-30 2022-06-24 阿里云计算有限公司 时序数据的异常识别方法及装置
WO2023276083A1 (ja) * 2021-06-30 2023-01-05 慎平 大杉 情報処理システム、学習済みモデル、情報処理方法、及びプログラム
WO2023047903A1 (ja) * 2021-09-21 2023-03-30 株式会社日立インダストリアルプロダクツ 機器診断システム

Also Published As

Publication number Publication date
KR20210114070A (ko) 2021-09-17
CN113574358A (zh) 2021-10-29
JPWO2020188696A1 (ja) 2021-04-01
KR102408756B1 (ko) 2022-06-15
CN113574358B (zh) 2022-09-20
JP6647473B1 (ja) 2020-02-14

Similar Documents

Publication Publication Date Title
WO2020188696A1 (ja) 異常検知装置および異常検知方法
EP3809220B1 (en) Method and system for semi-supervised deep anomaly detection for large-scale industrial monitoring systems based on time-series data utilizing digital twin simulation data
JP6148316B2 (ja) 故障条件を学習する機械学習方法及び機械学習装置、並びに該機械学習装置を備えた故障予知装置及び故障予知システム
EP2905665B1 (en) Information processing apparatus, diagnosis method, and program
JP6810097B2 (ja) 異常検出器
JP6076571B1 (ja) 情報処理装置、情報処理システム、情報処理方法及びプログラム
JP5301310B2 (ja) 異常検知方法及び異常検知システム
JP5179086B2 (ja) 工業プロセスの監視方法及び監視システム
WO2021220358A1 (ja) 異常診断方法、異常診断装置および異常診断プログラム
WO2013011745A1 (ja) 設備状態監視方法およびその装置
US20080140352A1 (en) System and method for equipment life estimation
CN107710089B (zh) 工厂设备诊断装置以及工厂设备诊断方法
WO2017138238A1 (ja) 監視装置及び監視装置の制御方法
CN112272763A (zh) 异常探测装置、异常探测方法以及异常探测程序
WO2019045699A1 (en) RECURRENT GAUSSIAN MIXTURE MODEL FOR ESTIMATING SENSOR STATUS IN STATUS MONITORING
US20190265088A1 (en) System analysis method, system analysis apparatus, and program
JP2007108107A (ja) 設備診断装置
WO2017138239A1 (ja) 監視装置及び監視装置の制御方法
WO2021241578A1 (ja) 異常変調原因特定装置、異常変調原因特定方法及び異常変調原因特定プログラム
JP2010276339A (ja) センサ診断方法およびセンサ診断装置
US11320813B2 (en) Industrial asset temporal anomaly detection with fault variable ranking
JP7103539B1 (ja) 運転支援装置、運転支援方法及びプログラム
WO2018207605A1 (ja) 正常異常判別装置、正常異常判別方法、及び正常異常判別システム
US20210247751A1 (en) Diagnosis device, diagnosis method and program
WO2021229815A1 (ja) 情報処理装置、評価方法、および評価プログラム

Legal Events

Date Code Title Description
ENP Entry into the national phase

Ref document number: 2019555983

Country of ref document: JP

Kind code of ref document: A

121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 19920592

Country of ref document: EP

Kind code of ref document: A1

ENP Entry into the national phase

Ref document number: 20217028496

Country of ref document: KR

Kind code of ref document: A

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 19920592

Country of ref document: EP

Kind code of ref document: A1