WO2022003983A1 - 時系列データ処理方法、時系列データ処理装置、時系列データ処理システム、記録媒体 - Google Patents

時系列データ処理方法、時系列データ処理装置、時系列データ処理システム、記録媒体 Download PDF

Info

Publication number
WO2022003983A1
WO2022003983A1 PCT/JP2020/026287 JP2020026287W WO2022003983A1 WO 2022003983 A1 WO2022003983 A1 WO 2022003983A1 JP 2020026287 W JP2020026287 W JP 2020026287W WO 2022003983 A1 WO2022003983 A1 WO 2022003983A1
Authority
WO
WIPO (PCT)
Prior art keywords
time
series data
data processing
period
processing method
Prior art date
Application number
PCT/JP2020/026287
Other languages
English (en)
French (fr)
Inventor
貴史 小梨
Original Assignee
日本電気株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 日本電気株式会社 filed Critical 日本電気株式会社
Priority to US18/013,405 priority Critical patent/US20230252038A1/en
Priority to JP2022533018A priority patent/JP7533582B2/ja
Priority to PCT/JP2020/026287 priority patent/WO2022003983A1/ja
Publication of WO2022003983A1 publication Critical patent/WO2022003983A1/ja

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2474Sequence data queries, e.g. querying versioned data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2477Temporal data queries
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B23/00Testing or monitoring of control systems or parts thereof
    • G05B23/02Electric testing or monitoring
    • G05B23/0205Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults
    • G05B23/0218Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults characterised by the fault detection method dealing with either existing or incipient faults
    • G05B23/0224Process history based detection method, e.g. whereby history implies the availability of large amounts of data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/248Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/40Data acquisition and logging
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/2433Single-class perspective, e.g. one-against-all classification; Novelty detection; Outlier detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2218/00Aspects of pattern recognition specially adapted for signal processing
    • G06F2218/08Feature extraction
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2218/00Aspects of pattern recognition specially adapted for signal processing
    • G06F2218/12Classification; Matching
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V2201/00Indexing scheme relating to image or video recognition or understanding
    • G06V2201/06Recognition of objects for industrial automation

Definitions

  • the present invention relates to a time-series data processing method, a time-series data processing device, a time-series data processing system, and a recording medium.
  • time-series data which are measured values from various sensors, are analyzed, and the occurrence of an abnormal state is detected and output.
  • an abnormality is detected from time-series data by using feature quantities of a plurality of feature waveforms.
  • the problem is the length of the time width of the feature waveform, that is, the length of the period of the partial time-series data from which the feature amount is extracted. Become. For example, if the period is long, it becomes difficult to prepare training data that covers the characteristics of various partial time-series data to be detected. On the other hand, when the length of the period is short, there is a problem that there are few variations in the characteristics of the partial time-series data, and a large number of partial time-series data are matched, resulting in an increase in erroneous detection. As a result, there arises a problem that it is difficult to appropriately detect a specific situation such as an abnormality from the time series data.
  • an object of the present invention is to provide a time-series data processing method capable of solving the above-mentioned problem, that it is difficult to appropriately detect a specific situation from time-series data. be.
  • the time-series data processing method which is one embodiment of the present invention, is The features of the partial time-series data in a plurality of specific periods in which the positions on the time axis are different in the first time-series data, and the positional relationship between the plurality of specific periods in the second time-series data. Compare with each feature of the partial time series data in multiple periods located correspondingly, Detecting a specific state in the second time series data based on the result of the comparison, It takes the composition.
  • the time-series data processing apparatus which is one embodiment of the present invention, is The feature amount of each partial time-series data in a plurality of specific periods in which the positions on the time axis are different in the first time-series data, and the positional relationship between the plurality of specific periods in the second time-series data.
  • a comparison means for comparing the feature quantities of the partial time series data in a plurality of correspondingly located periods, and
  • a detection means for detecting a specific state in the second time series data based on the result of the comparison, and With, It takes the composition.
  • the program which is one form of the present invention is For information processing equipment
  • the present invention can appropriately detect a specific situation from time series data by being configured as described above.
  • FIG. 1 It is a block diagram which shows the structure of the time series data processing apparatus in Embodiment 1 of this invention. It is a figure which shows the state of processing of the time-series data by the time-series data processing apparatus disclosed in FIG. It is a figure which shows the state of processing of the time-series data by the time-series data processing apparatus disclosed in FIG. It is a figure which shows the state of processing of the time-series data by the time-series data processing apparatus disclosed in FIG. It is a figure which shows the state of processing of the time-series data by the time-series data processing apparatus disclosed in FIG. It is a figure which shows the state of processing of the time-series data by the time-series data processing apparatus disclosed in FIG. It is a figure which shows the state of processing of the time-series data by the time-series data processing apparatus disclosed in FIG.
  • FIG. 1 is a diagram for explaining a configuration of a time-series data processing device
  • FIGS. 2 to 10 are diagrams for explaining a processing operation of the time-series data processing device.
  • the time-series data processing device 10 in the present invention is connected to a monitored object P such as a plant. Then, the time-series data processing device 10 acquires and analyzes the measured values of at least one or more data items of the monitored target P, and monitors the state of the monitored target P based on the analysis result.
  • the monitoring target P is a plant such as a manufacturing factory or a processing facility
  • the measured values of each data item are of multiple types such as temperature, pressure, flow rate, power consumption value, raw material supply amount, and remaining amount in the plant. Consists of the values of the data items of.
  • the state of the monitored target P to be monitored is a state determined in advance to be abnormal in the monitored target P, and it is determined that the state is an abnormal state from the feature amount of the measured value of each data item.
  • the state of the monitoring target P to be monitored is not necessarily limited to an abnormal state, and may be a specific state set in advance even if it is not abnormal.
  • the specific preset state that is not abnormal is, for example, a sign of abnormality.
  • the monitoring target P in the present invention is not limited to a plant, and may be any equipment such as an information processing system.
  • the CPU Central Processing Unit
  • memory usage rate e.g., RAM
  • disk access frequency e.g., ROM
  • input / output of each information processing device such as a terminal or server constituting the information processing system.
  • the number of packets, the input / output packet rate, the power consumption value, and the like may be measured as measured values of each data item, and the measured values may be analyzed to monitor the state of the information processing system.
  • the time-series data processing device 10 is composed of one or a plurality of information processing devices including an arithmetic unit and a storage device. As shown in FIG. 1, the time-series data processing device 10 includes a measurement unit 11, a learning unit 12, an abnormality detection unit 13, and an output unit 14. The functions of the measurement unit 11, the learning unit 12, the abnormality detection unit 13, and the output unit 14 can be realized by the arithmetic unit executing a program for realizing each function stored in the storage device. Further, the time-series data processing device 10 includes a measurement data storage unit 16, a learning data storage unit 17, and a detection data storage unit 18. The measurement data storage unit 16, the learning data storage unit 17, and the detection data storage unit 18 are configured by a storage device. Hereinafter, each configuration will be described in detail.
  • the measurement unit 11 acquires the measurement values of each element measured by various sensors installed in the monitoring target P as time-series data at predetermined time intervals and stores them in the measurement data storage unit 16. At this time, since there are a plurality of types of elements to be measured, the measurement unit 11 acquires a time-series data set which is a set of time-series data A, B, C, and D of the plurality of elements as shown in FIG. For example, in the present embodiment, the measurement unit 11 acquires the measurement value of each element at 1-minute intervals and records it as time-series data, but the measurement unit 11 may acquire the measurement value of each element at any time interval.
  • the time-series data set is acquired and stored by the measurement unit 11 at all times or at predetermined time intervals, and the acquired time-series data set is a model representing an abnormal state of the monitored target P, as will be described later. It is a time-series data set for learning (first time-series data) used for generation, or a time-series data set for abnormality detection (second time-series data) used when monitoring the status of the monitored target P. Time series data).
  • first time-series data used for generation
  • second time-series data used when monitoring the status of the monitored target P.
  • Time series data Time series data
  • the time-series data acquired by the measurement unit 11 is not necessarily limited to the measurement values of a plurality of elements, and may be the measurement values of one element.
  • the learning unit 12 is a learning time-series data set (first time-series data) stored in the measurement data storage unit 16 and measured when the monitored target P is determined to be in an abnormal state in the past.
  • the learning is based on the information indicating the type of the determined abnormal state.
  • the learning unit 12 calculates the feature amount of the time-series data set in the case of a specific abnormal state, and generates coded data representing the feature amount as an abnormal state model representing the specific abnormal state. Then, the learning unit 12 stores the model consisting of the generated coded data in the learning data storage unit 17 together with the information representing the specific abnormal state.
  • the learning unit 12 inputs the time-series data set measured from the monitored target P, and divides the time-series data set near the time when a specific abnormal state occurs on the time axis into predetermined time intervals.
  • a segment set consisting of a plurality of segments (multiple specific periods) is extracted.
  • the plurality of segments constituting the segment set are one segment (target period) and another one or a plurality of other segments having a positional relationship located at a specific position preset with respect to the one segment. It consists of a segment (another period).
  • the learning unit 12 when the time t is in a specific abnormal state, the learning unit 12 first extracts a predetermined period including the time t as one "target segment" indicated by a frame surrounded by a solid line. do. Further, the learning unit 12 extracts each predetermined period including other times t-1 and t + 1 before and after the target segment on the time axis as "peripheral segments" indicated by frames surrounded by dotted lines. .. That is, in the example of FIG. 2, the peripheral segment has two predetermined periods that are adjacent to each other in the front-back direction on the time axis with respect to the target segment. The target segment and the peripheral segment are both periods of the same time width, for example, a period of 10 minutes.
  • the learning unit 12 calculates the feature amount of the partial time series data included in each segment constituting the segment set extracted as described above. In the example of FIG. 2, calculates the feature amount f t of partial time-series data contained in the segment, the feature quantity of each partial time series data contained in each of the two peripheral segments f t-1, and f t + 1, the do. At this time, the learning unit 12 may use the partial time series in each segment, for example, based on the measured values of each element with respect to the time in the segment in the partial time series data in each segment, the correlation between the measured values of each element, and the like. Calculate the feature amount of the data.
  • the learning unit 12 is associated with the information representing a specific abnormal state, and the feature amount of each segment is represented by a binary code such as 0 or 1, as coded data, and the learning data storage unit is used as an abnormal state model.
  • the learning unit 12 may also store information representing the positional relationship between the segments, that is, the positional relationship of the peripheral segments with respect to the target segment.
  • the positional relationship information indicating that one peripheral segment is located adjacent to each of the front and rear on the time axis is stored with respect to the target segment constituting the segment set.
  • the method for calculating the feature amount of the partial time series data in each segment is not limited to the above method, and may be any method.
  • the learning unit 12 may learn the normal state of the monitored object P.
  • the learning unit 12 generates a normal state model regarding the normal state of the monitored target P based on the time series data of each element when the monitored target P is in the normal state.
  • the abnormality detection unit 13 (comparison means, detection means) is a time-series data set (second) for detecting an abnormality of the monitored target P, which is measured by the measurement unit 11 or stored in the measurement data storage unit 16. Time-series data) is read out, and a specific abnormal state is detected from the time-series data set. At this time, the abnormality detection unit 13 reads out each feature amount of the target segment and the peripheral segment described above as an abnormality state model stored in the learning data storage unit 17, and the feature amount and the time for abnormality detection are used. A specific abnormal state is detected by comparing each feature amount of each partial time-series data set in a plurality of certain periods in the series data set.
  • the abnormality detection unit 13 is first located from the time-series data set for abnormality detection, corresponding to the positional relationship on the time axis of the segment set consisting of the target segment and the peripheral segment described above. Extract a comparison segment set consisting of segments. For example, the abnormality detection unit 13 first sets a segment having a time width of 10 minutes at an arbitrary position on the time axis of the time-series data set for abnormality detection as a “comparison target segment” corresponding to the target segment. Extract as.
  • the abnormality detection unit 13 sets each segment having a time width of 10 minutes, which is located adjacent to each of the front and rear segments on the time axis with respect to the comparison target segment, as a "comparison peripheral segment" corresponding to the peripheral segment. Extract.
  • the upper figure of FIG. 3 shows a time-series data set for learning
  • the lower figure of FIG. 3 shows a time-series data set for abnormality detection.
  • the anomaly detection unit 13 first extracts a predetermined period including the time T as a "comparison target segment" indicated by a frame surrounded by a solid line in the time series data set for anomaly detection.
  • Each predetermined period including other time T-1 and T + 1 adjacent to each other before and after is extracted as a "comparison peripheral segment" indicated by a frame surrounded by a dotted line, and these are used as a comparison segment set.
  • the abnormality detection unit 13 is a comparison segment set in the time-series data set for abnormality detection, that is, a comparison target, in the same manner as the feature quantities calculated for the target segment and the peripheral segment in the time-series data set for learning described above.
  • the feature amount of the partial time series data in each of the segment and the comparison peripheral segment set is calculated.
  • the abnormality detection unit 13 compares each feature amount of each segment in the time-series data set for learning with each feature amount of each segment in the time-series data set for abnormality detection. At this time, as shown by the arrow in FIG. 3, the abnormality detection unit 13 compares the feature quantities of the segments whose positional relationships on the time axis of each time series data set correspond to each other.
  • the feature amount of the target segment (time t) in the time-series data set for learning and the feature amount of the comparison target segment (time T) in the time-series data for abnormality detection are compared. .. Also, from the features of the peripheral segment (time t-1) located adjacent to the target segment in the time-series data set for learning on the time axis, and the comparison target segment in the time-series data for abnormality detection. Compare with the feature quantity of the comparison peripheral segment (time T-1) located adjacent to the front.
  • the feature amount of the comparison peripheral segment (time T + 1) located in the above direction is compared.
  • the abnormality detection unit 13 calculates the degree of similarity between the feature amounts when comparing the feature amounts between the segments as described above.
  • the feature amount is represented by coded data such as a binary vector
  • the abnormality detection unit 13 calculates the distance between the binary vectors, and obtains the similarity between the feature amounts from the distance. calculate.
  • the similarity St is calculated for the target segment
  • the similarity St-1 and St + 1 are calculated for the two peripheral segments, respectively.
  • the abnormality detection unit 13 is used for abnormality detection based on the comparison result of the feature amount performed for each segment as described above, that is, the similarity St , St-1 , St + 1 calculated for each segment. Detects whether or not an abnormal state, which is a specific state, has occurred in a time series data set. For example, the anomaly detection unit 13 calculates a score obtained by totaling all the calculated similarity St , St-1 , St + 1 by a preset totaling method, and based on the score which is the totaling result. Detects abnormal conditions.
  • the weight value applied to the similarity of the peripheral segments as described above may be set according to the position of the peripheral segment with respect to the target segment.
  • the value of the weight applied to the similarity of the peripheral segments may be set according to whether the position of the peripheral segment is before or after the target segment on the time axis, and as will be described later, the peripheral segment is set. If the segment is not located adjacent to the target segment, it may be set according to the distance from the target segment to the peripheral segment. As an example, the longer the distance from the target segment to the peripheral segment, the lower the value of the weight applied to the similarity of the peripheral segment may be set.
  • the abnormality detection unit 13 changes the position of the comparison segment set on the time-series data set for abnormality detection, and repeats the above-mentioned abnormality detection process.
  • the anomaly detection unit 13 first calculates the score for the comparison target segment set shown in FIG. 3, then sets the segment located at time T + 1 as the comparison target segment and sets the segments adjacent to the front and rear segments as the comparison target segment, as shown in FIG.
  • the score for the comparison segment set at the position on the different time axis is calculated. After that, as shown in FIG.
  • the abnormality detection unit 13 further sets the segment located at time T + 2 as the comparison target segment, the segments adjacent to the segment before and after it as the comparison peripheral segment, and the comparison segment set of positions on different time axes. Calculate the score for. In this way, the abnormality detection unit 13 extracts the comparison segment set at a plurality of positions on the time axis on the time-series data set for abnormality detection, and calculates the score by comparing with the abnormality state model.
  • the abnormality detection unit 13 detects whether or not an abnormality has occurred in the time-series data set for abnormality detection from the scores for the plurality of comparison segment sets calculated as described above. For example, the abnormality detection unit 13 detects that an abnormal state has occurred when the score is equal to or higher than a preset threshold value. However, the abnormality detection unit 13 may detect an abnormality by any method from the score value.
  • the segment set extracted on the time-series data set for learning includes one target segment and two peripheral segments located adjacent to each other on the time axis in front of and behind the target segment.
  • the number and position of peripheral segments are not limited to those described above. That is, the peripheral segments may be any number and may be located in any positional relationship with respect to the target segment.
  • the comparison segment set extracted on the time-series data set for abnormality detection is also extracted corresponding to the positional relationship between the target segment and the peripheral segment in the segment set.
  • the peripheral segments constituting the segment set may be located within a range preset on the time axis with respect to the target segment. That is, it is preferable that the peripheral segment is not too far from the target segment on the time axis and is extracted in a range set in advance with the peripheral time with respect to the time of the target segment.
  • one target segment at time t and a plurality of front and rear segments are continuously adjacent to each other on the time axis with respect to the target segment.
  • Peripheral segments (time t-2, t-1, t + 1, t + 2) may be composed of the peripheral segments (time t-2, t-1, t + 1, t + 2).
  • a segment set is continuously adjacent to one target segment at time t and only before the target segment on the time axis. It may be composed of peripheral segments (time t-2, t-1, t + 1, t + 2).
  • the segment set is composed of one target segment at time t and peripheral segments in which a plurality of target segments are continuously adjacent to the target segment only afterwards on the time axis. You may. Further, for example, as shown in FIG. 7 (1), the segment set is located before and after one target segment at time t and a predetermined time between the segments. It may be composed of peripheral segments (time t-2, t + 2). Further, for example, as shown in FIG. 7 (2), the segment set is arranged between one target segment at time t and a predetermined time between the segments, and a plurality of peripherals located only in front of the target segment. It may be composed of segments (time t-2, t-4).
  • the segment set is composed of one target segment at time t and a plurality of peripheral segments arranged only after the target segment at a predetermined time between the segments. May be good.
  • the abnormality detecting unit 13 determines that the monitored target P is in the abnormal state when it is out of the normal state based on the normal state model. Detect.
  • the output unit 14 (detection means) is a terminal device (for example, a smartphone, etc.) used by a monitor (for example, a smartphone) that does not show the comparison result of the feature amount between the segments, that is, the result of abnormality detection and the calculated score. Output to portable terminals such as mobile phones, tablets, etc.).
  • the output unit 14 is a terminal device operated by a preset observer when an abnormality is detected by performing abnormality detection processing on a time-series data set for abnormality detection immediately after measurement as described above. Information indicating that an abnormality has been detected may be sent to the address, or information indicating that an abnormality has been detected may be displayed on a monitor installed in the monitoring room.
  • the output unit 14 may output a ranking of scores when anomaly detection processing is performed on a time-series data set for past anomaly detection.
  • the time on the time-series data set for anomaly detection in which the score is calculated, the score, and the information based on the similarity calculated for each segment may be output in descending order of the score.
  • the output unit 14 displays each box in the "similarity map" column corresponding to the position of each segment, and fills the inside of each box with a color corresponding to the similarity calculated for each corresponding segment. indicate.
  • FIG. 1 the example of FIG.
  • the box corresponding to the target segment is surrounded by a solid line in the center of the “similar map” column, and the peripheral segments of the positional relationship set for the target segment are shown on both sides of the box. Illustrate the box. Then, the higher the similarity calculated for each segment, the darker the color, and the inside of the box corresponding to each segment is filled and displayed.
  • the output unit 14 may output information based on the similarity calculated for each segment by another method. Further, the output unit 14 may also output the position of the observer closest to the abnormality detection position based on the position where the abnormality is detected and the position information of the terminal device possessed by the observer. This makes it possible to quickly respond to the abnormalities that have occurred.
  • the time-series data processing device 10 is a time-series data set for learning measured when the monitoring target P is determined to be in an abnormal state among the time-series data already measured and stored from the monitoring target P (the first). (One time series data) is acquired (step S1). Then, the time-series data processing device 10 starts from a plurality of segments (a plurality of specific periods) among the segments in which the time-series data set near the time when a specific abnormal state occurs on the time axis is divided by a predetermined time. Extract the segment set. For example, as shown in FIG. 2, the time-series data processing apparatus 10 has one "target segment" including the time t and other times t-1, t + 1 before and after the target segment on the time axis, respectively.
  • time-series data processing device 10 calculates the feature quantities ft , ft-1 , and ft + 1 of the partial time-series data included in each segment, respectively (step S2).
  • the time-series data processing device 10 associates the feature amount of each segment constituting the segment set with the information representing a specific abnormal state, and stores it as an abnormal state model (step S3). At this time, the time-series data processing device 10 also stores information representing the positional relationship between the segments constituting the segment set, that is, the positional relationship of the peripheral segments with respect to the target segment.
  • the time-series data processing device 10 is not limited to extracting the segment set of the positional relationship between the target segment and the peripheral segment as shown in FIG. 2 described above, and has the positional relationship as shown in FIGS. 6 to 7. You may extract the segment set.
  • the time-series data processing device 10 acquires a time-series data set (second time-series data) for detecting an abnormality of the monitored target P, which has been measured or stored (step S11). At the same time, the time-series data processing device 10 reads out each feature amount of the above-mentioned target segment and peripheral segment as a stored abnormal state model.
  • the time-series data processing device 10 is from a plurality of segments located corresponding to the positional relationship on the time axis of the segment set including the target segment and the peripheral segment described above from the time-series data set for abnormality detection. Extract the comparison segment set.
  • the time-series data processing device 10 has the same positional relationship as the segment set extracted during learning in the above figure, centering on a predetermined time T on the time-series data set for abnormality detection in the figure below. Extract the comparison segment set located in.
  • the time-series data processing device 10 includes a "comparison target segment” at time T constituting the comparison segment set, and a “comparison peripheral segment” including other time T-1 and T + 1 adjacent to each other before and after the "comparison target segment”.
  • the feature quantities of the partial time series data sets in the above are calculated (step S12).
  • the time-series data processing device 10 describes each feature amount of each segment constituting the segment set in the time-series data set for learning and each segment constituting the comparison segment set in the time-series data set for abnormality detection. Compare each feature quantity with each other.
  • the time-series data processor 10 as indicated by arrows in FIG. 3, the feature amount similarity S t segments between the positional relation on the time axis for each time-series data set corresponding to one another, S t -1 , St + 1 is calculated (step S13).
  • the time-series data processing apparatus 10 aggregates the similarity St , St-1 , and St + 1 calculated for each segment as described above (step S14) into a time-series data set for abnormality detection. It is determined whether or not an abnormal state, which is a specific state, has occurred (step S15). For example, the time-series data processing device 10 calculates an average value by weighting the similarity St , St-1 , and St + 1 according to the position of each segment, and makes an abnormality based on the score as the calculation result. Detect the state.
  • the time-series data processing device 10 extracts a comparison segment set located at a different time in the time-series data set. Then, the time-series data processing device 10 calculates the feature amount of each segment constituting the comparison segment set (step S12) and calculates the similarity with the abnormal state model (steps S13, S14) in the same manner as described above. ), It is determined whether or not an abnormal state has occurred (step S15).
  • the time-series data processing device 10 When an abnormality is detected in the time-series data set for abnormality detection from the aggregated score (Yes in step S15), the time-series data processing device 10 outputs the abnormality detection (step S16). For example, the time-series data processing device 10 transmits information that an abnormality has been detected to a preset monitor's e-mail address, or transmits information that an abnormality has been detected to a monitor installed in the monitoring room. Output to display. As shown in FIG. 8, the time-series data processing device 10 may output the aggregated results of abnormality detection so far in a ranking format.
  • the feature amount of the partial time-series data of a plurality of segments (periods) on the time-series data measured from the monitoring target P is used to detect an abnormality in the time-series data for abnormality detection. Detecting a specific condition. In this way, since the features of multiple segments are used as a set to detect a specific state, even if the length of the time width of the segment is set short, a large number of partial time series data can be used. Matching can be suppressed, and specific situations such as abnormalities can be appropriately detected from time-series data.
  • FIGS. 11 to 13 are block diagrams showing the configuration of the time-series data processing device according to the second embodiment
  • FIG. 13 is a flowchart showing the operation of the time-series data processing device.
  • the outline of the configuration of the time-series data processing apparatus and the time-series data processing method described in the above-described embodiment is shown.
  • the time-series data processing device 100 is composed of a general information processing device, and is equipped with the following hardware configuration as an example.
  • -CPU Central Processing Unit
  • -ROM Read Only Memory
  • RAM Random Access Memory
  • 103 storage device
  • -Program group 104 loaded in RAM 103
  • a storage device 105 for storing the program group 104.
  • a drive device 106 that reads / writes the storage medium 110 external to the information processing device.
  • -Communication interface 107 that connects to the communication network 111 outside the information processing device.
  • -I / O interface 108 for inputting / outputting data -Bus 109 connecting each component
  • the time-series data processing device 100 can construct and equip the comparison means 121 and the detection means 122 shown in FIG. 12 by acquiring the program group 104 by the CPU 101 and executing the program group 104.
  • the program group 104 is stored in, for example, a storage device 105 or a ROM 102 in advance, and the CPU 101 loads the program group 104 into the RAM 103 and executes the program group 104 as needed. Further, the program group 104 may be supplied to the CPU 101 via the communication network 111, or may be stored in the storage medium 110 in advance, and the drive device 106 may read the program and supply the program to the CPU 101.
  • the above-mentioned comparison means 121 and detection means 122 may be constructed by a dedicated electronic circuit for realizing such means.
  • FIG. 11 shows an example of the hardware configuration of the information processing device, which is the time-series data processing device 100, and the hardware configuration of the information processing device is not limited to the above case.
  • the information processing device may be configured from a part of the above-mentioned configuration, such as not having the drive device 106.
  • the time-series data processing device 100 executes the time-series data processing method shown in the flowchart of FIG. 13 by the functions of the comparison means 121 and the detection means 122 constructed by the program as described above.
  • the time-series data processing device 100 is The feature amount of each partial time-series data in a plurality of specific periods in which the positions on the time axis are different in the first time-series data, and the positional relationship between the plurality of specific periods in the second time-series data. Comparing with each feature amount of the partial time series data in a plurality of correspondingly located periods (step S101), A specific state in the second time series data is detected based on the result of the comparison (step S102). Is executed.
  • the present invention detects a specific state such as an abnormality in the time-series data for abnormality detection by using the feature amount of the partial time-series data of a plurality of periods on the time-series data. is doing. In this way, since the feature quantities of multiple periods are used as a set to detect a specific state, even if the length of the time width of the period is set short, a large number of partial time series data can be obtained. Matching can be suppressed, and specific situations such as abnormalities can be appropriately detected from time-series data.
  • Non-temporary computer-readable media include various types of tangible storage media.
  • Examples of non-temporary computer-readable media include magnetic recording media (eg, flexible disks, magnetic tapes, hard disk drives), magneto-optical recording media (eg, magneto-optical disks), CD-ROMs (ReadOnlyMemory), CD-Rs, Includes CD-R / W, semiconductor memory (eg, mask ROM, PROM (Programmable ROM), EPROM (Erasable PROM), flash ROM, RAM (RandomAccessMemory)).
  • the program may also be supplied to the computer by various types of temporary computer readable medium. Examples of temporary computer-readable media include electrical, optical, and electromagnetic waves.
  • the temporary computer-readable medium can supply the program to the computer via a wired communication path such as an electric wire and an optical fiber, or a wireless communication path.
  • the comparison means 121 and the detection means 122 described above may be executed by an information processing device installed and connected to any place on the network, that is, so-called cloud computing. It may be executed in the ing.
  • Time series data processing method Compare with each feature of the partial time series data in multiple periods located correspondingly, Detecting a specific state in the second time series data based on the result of the comparison, Time series data processing method.
  • Appendix 2 The time-series data processing method described in Appendix 1 Features of the partial time-series data between the plurality of specific periods of the first time-series data and the plurality of periods of the second time-series data in which the positional relationships on the time axis correspond to each other. Compare the amounts respectively, Time series data processing method.
  • Appendix 3) The time-series data processing method described in Appendix 1 or 2.
  • the plurality of specific periods are one target period of the first time series data and at least one other period located at a specific position which is a preset position on the time axis with respect to the target period. And consists of The feature amount of the partial time-series data in the target period of the first time-series data and the feature amount of the partial time-series data in the predetermined period of the second time-series data are compared and described. The feature amount of the partial time-series data in the at least one different period of the first time-series data and at least one period of the second time-series data located at the specific position with respect to the predetermined period. Compare with the feature quantity of the partial time series data in Time series data processing method.
  • the specific position represents a plurality of positions continuously adjacent to the target period on the time axis.
  • Time series data processing method (Appendix 8) The time-series data processing method according to any one of Supplementary Provisions 1 to 7. Calculate the similarity between the features to be compared for each period, Detecting a specific state in the second time series data based on all the calculated similarities.
  • Time series data processing method (Appendix 9) The time-series data processing method according to any one of Supplementary note 3 to 7. The similarity between the feature quantities to be compared for the target period and the similarity between the feature quantities to be compared for the other period are calculated.
  • the similarity for the target period and the similarity for the other period are aggregated by different methods, and a specific state in the second time series data is detected based on the aggregation result.
  • Time series data processing method (Appendix 10) The time-series data processing method described in Appendix 9. The similarity for the other period is aggregated with a lower weight than the similarity for the target period.
  • Time series data processing method (Appendix 11) The time-series data processing method according to any one of Supplementary note 1 to 10. Output the result of comparing features for each period, Time series data processing method.
  • the comparison means is a portion between the plurality of specific periods of the first time-series data and the plurality of periods of the second time-series data in which the positional relationships on the time axis correspond to each other. Compare the features of time series data, Time series data processing device.
  • the plurality of specific periods are one target period of the first time series data and at least one other period located at a specific position which is a preset position on the time axis with respect to the target period.
  • the comparison means has a feature amount of the partial time-series data in the target period of the first time-series data and a feature amount of the partial time-series data in the predetermined period of the second time-series data. While comparing, the feature amount of the partial time-series data in the at least one different period of the first time-series data and the position in the specific position with respect to the predetermined period of the second time-series data. Compare with the feature quantities of the partial time series data in at least one period.
  • Time series data processing device (Appendix 14.1) The time-series data processing apparatus according to Appendix 14, The specific position represents a position before and / or after the target period on the time axis. Time series data processing device.
  • the comparison means calculates the degree of similarity between the feature quantities to be compared for each period.
  • the detection means detects a specific state in the second time series data based on all the calculated similarities.
  • Time series data processing device. (Appendix 16) The time-series data processing apparatus according to Appendix 14, The comparison means calculates the similarity between the feature quantities to be compared for the target period and the similarity between the feature quantities to be compared for the other period.
  • the detection means aggregates the similarity for the target period and the similarity for another period by different methods, and detects a specific state in the second time-series data based on the aggregation result.
  • Time series data processing device. (Appendix 17) The time-series data processing apparatus according to Appendix 16.
  • the detection means aggregates the similarity for the other period with a lower weight than the similarity for the target period.
  • Time series data processing device (Appendix 18) The time-series data processing apparatus according to any one of Supplementary Provisions 12 to 17. The detection means outputs the result of comparing the feature quantities for each period.
  • Time series data processing device (Appendix 19) For information processing equipment The feature amount of each partial time-series data in a plurality of specific periods in which the positions on the time axis are different in the first time-series data, and the positional relationship between the plurality of specific periods in the second time-series data.
  • a comparison means for comparing the feature quantities of the partial time series data in a plurality of correspondingly located periods, and A detection means for detecting a specific state in the second time series data based on the result of the comparison, and A program to realize.
  • Appendix 20 The feature amount of each partial time-series data in a plurality of specific periods in which the positions on the time axis are different in the first time-series data, and the positional relationship between the plurality of specific periods in the second time-series data.
  • a comparison means for comparing the feature quantities of the partial time series data in a plurality of correspondingly located periods, and A detection means for detecting a specific state in the second time series data based on the result of the comparison, and Time series data processing system with.
  • Time-series data processing device 11 Measurement unit 12 Learning unit 13 Abnormality detection unit 14 Output unit 16 Measurement data storage unit 17 Learning data storage unit 18 Detection data storage unit 100 Time-series data processing device 101 CPU 102 ROM 103 RAM 104 Program group 105 Storage device 106 Drive device 107 Communication interface 108 Input / output interface 109 Bus 110 Storage medium 111 Communication network 121 Comparison means 122 Detection means

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Fuzzy Systems (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Mathematical Analysis (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Optimization (AREA)
  • Computational Mathematics (AREA)
  • Computing Systems (AREA)
  • Computer Hardware Design (AREA)
  • Operations Research (AREA)
  • Medical Informatics (AREA)
  • Algebra (AREA)
  • Automation & Control Theory (AREA)
  • Testing And Monitoring For Control Systems (AREA)

Abstract

本発明の時系列データ処理装置100は、第一の時系列データのうち時間軸上の位置が異なる複数の特定期間における部分時系列データのそれぞれの特徴量と、第二の時系列データのうち複数の特定期間の間の位置関係に対応して位置する複数の期間における部分時系列データのそれぞれの特徴量と、を比較する比較手段121と、比較の結果に基づいて第二の時系列データにおける特定の状態を検出する検出手段122と、を備える。

Description

時系列データ処理方法、時系列データ処理装置、時系列データ処理システム、記録媒体
 本発明は、時系列データ処理方法、時系列データ処理装置、時系列データ処理システム、記録媒体に関する。
 エネルギー(電気、ガス、上水など)や石油化学製品(原油、ガソリン、プラスチックなど)、食品、医薬品などを製造する産業プラントや、化学製品を生産する工場施設や装置などの化学プラントがある。これらプラントや、情報処理システムといった設備・大型機械では、各種センサからの計測値である時系列データを分析し、異常状態が発生したことを検出して出力することが行われている。例えば、特許文献1では、複数の特徴波形の特徴量を用いて、時系列データから異常を検出することとしている。
特開2018-205994号公報
 ここで、上述したように特徴波形から時系列データの異常を検出する場合には、特徴波形の時間幅の長さ、つまり、特徴量を抽出する部分時系列データの期間の長さが問題となる。例えば、期間の長さが長い場合には、検出したい様々な部分時系列データの特徴を網羅した学習データの用意が困難となる。一方で、期間の長さが短い場合には、部分時系列データの特徴のバリエーションが少なく、多数の部分時系列データに合致してしまうこととなり、誤検出が増大するという問題がある。その結果、時系列データから異常など特定の状況を適切に検出することが困難である、という問題が生じる。
 このため、本発明の目的は、上述した課題である、時系列データから特定の状況を適切に検出することが困難である、ことを解決することができる時系列データ処理方法を提供することにある。
 本発明の一形態である時系列データ処理方法は、
 第一の時系列データのうち時間軸上の位置が異なる複数の特定期間における部分時系列データのそれぞれの特徴量と、第二の時系列データのうち前記複数の特定期間の間の位置関係に対応して位置する複数の期間における部分時系列データのそれぞれの特徴量と、を比較し、
 前記比較の結果に基づいて前記第二の時系列データにおける特定の状態を検出する、
という構成をとる。
 また、本発明の一形態である時系列データ処理装置は、
 第一の時系列データのうち時間軸上の位置が異なる複数の特定期間における部分時系列データのそれぞれの特徴量と、第二の時系列データのうち前記複数の特定期間の間の位置関係に対応して位置する複数の期間における部分時系列データのそれぞれの特徴量と、を比較する比較手段と、
 前記比較の結果に基づいて前記第二の時系列データにおける特定の状態を検出する検出手段と、
を備えた、
という構成をとる。
 また、本発明の一形態であるプログラムは、
 情報処理装置に、
 第一の時系列データのうち時間軸上の位置が異なる複数の特定期間における部分時系列データのそれぞれの特徴量と、第二の時系列データのうち前記複数の特定期間の間の位置関係に対応して位置する複数の期間における部分時系列データのそれぞれの特徴量と、を比較する比較手段と、
 前記比較の結果に基づいて前記第二の時系列データにおける特定の状態を検出する検出手段と、
を実現させる、
という構成をとる。
 本発明は、以上のように構成されることにより、時系列データから特定の状況を適切に検出することができる。
本発明の実施形態1における時系列データ処理装置の構成を示すブロック図である。 図1に開示した時系列データ処理装置による時系列データの処理の様子を示す図である。 図1に開示した時系列データ処理装置による時系列データの処理の様子を示す図である。 図1に開示した時系列データ処理装置による時系列データの処理の様子を示す図である。 図1に開示した時系列データ処理装置による時系列データの処理の様子を示す図である。 図1に開示した時系列データ処理装置による時系列データの処理の様子を示す図である。 図1に開示した時系列データ処理装置による時系列データの処理の様子を示す図である。 図1に開示した時系列データ処理装置による時系列データの処理の様子を示す図である。 図1に開示した時系列データ処理装置の動作を示すフローチャートである。 図1に開示した時系列データ処理装置の動作を示すフローチャートである。 本発明の実施形態2における時系列データ処理装置のハードウェア構成を示すブロック図である。 本発明の実施形態2における時系列データ処理装置の構成を示すブロック図である。 本発明の実施形態2における時系列データ処理装置の動作を示すフローチャートである。
 <実施形態1>
 本発明の第1の実施形態を、図1乃至図10を参照して説明する。図1は、時系列データ処理装置の構成を説明するための図であり、図2乃至図10は、時系列データ処理装置の処理動作を説明するための図である。
 [構成]
 本発明における時系列データ処理装置10は、プラントなどの監視対象Pに接続されている。そして、時系列データ処理装置10は、監視対象Pの少なくとも一以上のデータ項目の計測値を取得して分析し、分析結果に基づいて監視対象Pの状態を監視する。例えば、監視対象Pは、製造工場や処理施設などのプラントであり、各データ項目の計測値は、プラント内の温度、圧力、流量、消費電力値、原料の供給量、残量など、複数種類のデータ項目の値からなる。そして、本実施形態では、監視する監視対象Pの状態は、監視対象Pの予め異常であると判断された状態であることとし、各データ項目の計測値の特徴量から異常状態であることを検出する。但し、監視する監視対象Pの状態は、必ずしも異常状態であることに限定されず、異常でなくとも予め設定された特定の状態であってもよい。異常ではない予め設定された特定の状態とは、例えば、異常の予兆、である。
 なお、本発明における監視対象Pは、プラントであることに限定されず、情報処理システムなどの設備といったいかなるものであってもよい。例えば、監視対象Pが情報処理システムである場合には、情報処理システムを構成する端末やサーバ等の各情報処理装置のCPU(Central Processing Unit)使用率、メモリ使用率、ディスクアクセス頻度、入出力パケット数、入出力パケットレート、消費電力値などを、各データ項目の計測値として計測し、かかる計測値を分析して情報処理システムの状態を監視してもよい。
 上記時系列データ処理装置10は、演算装置と記憶装置とを備えた1台又は複数台の情報処理装置にて構成される。そして、時系列データ処理装置10は、図1に示すように、計測部11、学習部12、異常検知部13、出力部14、を備える。計測部11、学習部12、異常検知部13、出力部14の機能は、演算装置が記憶装置に格納された各機能を実現するためのプログラムを実行することにより、実現することができる。また、時系列データ処理装置10は、計測データ記憶部16、学習データ記憶部17、検出データ記憶部18、を備える。計測データ記憶部16、学習データ記憶部17、検出データ記憶部18は、記憶装置により構成される。以下、各構成について詳述する。
 計測部11は、監視対象Pに設置された各種センサにて計測された各要素の計測値を所定の時間間隔で時系列データとして取得して、計測データ記憶部16に記憶する。このとき、計測する要素は複数種類あるため、計測部11は、図2に示すような複数の要素の時系列データA,B,C,Dの集合である時系列データセットを取得する。例えば、計測部11は、本実施形態では1分間隔で各要素の計測値を取得して時系列データとして記録するが、いかなる時間間隔で各要素の計測値を取得してもよい。なお、計測部11による時系列データセットの取得及び記憶は常時又は所定時間ごとに行われており、取得された時系列データセットは、後述するように、監視対象Pの異常状態を表すモデルを生成するために利用される学習用の時系列データセット(第一の時系列データ)であったり、監視対象Pの状態を監視するときに利用される異常検知用の時系列データセット(第二の時系列データ)である。但し、計測部11が取得する時系列データは、必ずしも複数の要素の計測値からなることに限定されず、1つの要素の計測値であってもよい。
 学習部12は、計測データ記憶部16に記憶されている、過去に監視対象Pが異常状態であると判断されたときに計測された学習用の時系列データセット(第一の時系列データ)と、判断された異常状態の種類を表す情報と、に基づいて学習する。特に、学習部12は、特定の異常状態のときにおける時系列データセットの特徴量を算出して、かかる特徴量を表す符号化データを、特定の異常状態を表す異常状態モデルとして生成する。そして、学習部12は、特定の異常状態を表す情報と共に、生成した符号化データからなるモデルを学習データ記憶部17に記憶しておく。
 ここで、学習部12による具体的な学習処理の内容を説明する。学習部12は、まず、監視対象Pから計測された時系列データセットを入力して、時間軸上において特定の異常状態となった時刻付近の時系列データセットを所定の時間毎に区切った期間であるセグメントのうち、複数のセグメント(複数の特定期間)からなるセグメントセットを抽出する。このとき、セグメントセットを構成する複数のセグメントは、1つのセグメント(対象期間)と、当該1つのセグメントに対して予め設定された特定の位置に位置する位置関係を有する他の1つ又は複数のセグメント(別期間)と、からなる。
 一例として、図2に示す時系列データセットの場合において、セグメントセットを抽出する場合を説明する。この時系列データセットにおいて、時刻tが特定の異常状態である場合には、学習部12は、まず時刻tを含む所定の期間を、実線で囲った枠で示す1つの「対象セグメント」として抽出する。また、学習部12は、対象セグメントに対して時間軸上で前後する他の時刻t-1,t+1を含むそれぞれの所定の期間を、それぞれ点線で囲った枠で示す「周辺セグメント」として抽出する。つまり、図2の例では、周辺セグメントは、対象セグメントに対して時間軸上で前後にそれぞれ隣接した2つの所定の期間となる。なお、対象セグメントと周辺セグメントとは、共に同じ時間幅の期間であり、例えば、10分といった期間である。
 そして、学習部12は、上述したように抽出したセグメントセットを構成する各セグメントにそれぞれ含まれる部分時系列データの特徴量を算出する。図2の例では、対象セグメントに含まれる部分時系列データの特徴量fと、2つの周辺セグメントのそれぞれに含まれる各部分時系列データの特徴量ft-1,ft+1と、を算出する。このとき、学習部12は、例えば、各セグメント内の部分時系列データにおけるセグメント内の時間に対する各要素の計測値や、各要素の計測値間の相関関係などから、各セグメント内の部分時系列データの特徴量を算出する。そして、学習部12は、特定の異常状態を表す情報に関連付けて、各セグメントの特徴量を、例えば、0,1といった二値の符号で表す符号化データとして、異常状態モデルとして学習データ記憶部17に記憶する。このとき、学習部12は、各セグメント間の位置関係、つまり、対象セグメントに対する周辺セグメントの位置関係、を表す情報も記憶しておいてもよい。図2の例では、セグメントセットを構成する対象セグメントに対して、時間軸上の前後のそれぞれに隣接して1つずつ周辺セグメントが位置していることを表す位置関係情報を記憶している。なお、各セグメント内の部分時系列データの特徴量の算出方法は、上述の方法に限定されず、いかなる方法であってもよい。尚、上記では、監視対象Pの異常状態を学習する場合について説明したが、学習部12は監視対象Pの正常状態を学習してもよい。この場合、学習部12は、監視対象Pが正常状態のときの各要素の時系列データに基づいて、監視対象Pの正常状態に関する正常状態モデルを生成する。
 異常検知部13(比較手段、検出手段)は、計測部11にて計測された、あるいは、計測データ記憶部16に記憶されている、監視対象Pの異常検知用の時系列データセット(第二の時系列データ)を読み出し、かかる時系列データセットから、特定の異常状態の検出を行う。このとき、異常検知部13は、学習データ記憶部17に記憶されている異常状態モデルとして、上述した対象セグメントと周辺セグメントとの各特徴量を読み出し、かかる各特徴量と、異常検知用の時系列データセット内の複数のある期間における各部分時系列データセットの各特徴量と、を比較することで、特定の異常状態の検出を行う。
 具体的に、異常検知部13は、まず、異常検知用の時系列データセットから、上述した対象セグメントと周辺セグメントとからなるセグメントセットの時間軸上の位置関係に対応して位置する、複数のセグメントからなる比較セグメントセットを抽出する。例えば、異常検知部13は、まず、異常検知用の時系列データセットの時間軸上における任意の位置における10分といった時間幅の期間であるセグメントを、上記対象セグメントに対応する「比較対象セグメント」として抽出する。加えて、異常検知部13は、比較対象セグメントに対して時間軸上で前後のそれぞれに隣接して位置する10分といった時間幅の各セグメントを、上記周辺セグメントに対応する「比較周辺セグメント」として抽出する。ここで、図3の上図に学習用の時系列データセットを示し、図3の下図に異常検知用の時系列データセットを示す。この図に示すように、異常検知部13は、異常検知用の時系列データセットにおいて、まず時刻Tを含む所定の期間を、実線で囲った枠で示す「比較対象セグメント」として抽出し、その前後して隣接する他の時刻T-1,T+1を含むそれぞれの所定の期間を、それぞれ点線で囲った枠で示す「比較周辺セグメント」として抽出し、これらを比較セグメントセットとする。
 そして、異常検知部13は、上述した学習用の時系列データセットにおける対象セグメントと周辺セグメントとについて算出した特徴量と同様に、異常検知用の時系列データセットにおける比較セグメントセット、つまり、比較対象セグメントと比較周辺セグメントセットとのそれぞれにおける部分時系列データの特徴量をそれぞれ算出する。そして、異常検知部13は、学習用の時系列データセットにおける各セグメントの各特徴量と、異常検知用の時系列データセットにおける各セグメントの各特徴量と、をそれぞれ比較する。このとき、異常検知部13は、図3の矢印に示すように、各時系列データセットの時間軸上における位置関係が相互に対応するセグメント同士の特徴量を比較する。つまり、図3の例では、学習用の時系列データセットにおける対象セグメント(時刻t)の特徴量と、異常検知用の時系列データにおける比較対象セグメント(時刻T)の特徴量と、を比較する。また、学習用の時系列データセットにおける対象セグメントよりも時間軸上で前に隣接して位置する周辺セグメント(時刻t-1)の特徴量と、異常検知用の時系列データにおける比較対象セグメントよりも前に隣接して位置する比較周辺セグメント(時刻T-1)の特徴量と、を比較する。さらに、学習用の時系列データセットにおける対象セグメントよりも時間軸上で後に隣接して位置する周辺セグメント(時刻t+1)の特徴量と、異常検知用の時系列データにおける比較対象セグメントよりも後に隣接して位置する比較周辺セグメント(時刻T+1)の特徴量と、を比較する。
 このとき、異常検知部13は、上述したようにセグメント間の特徴量を比較する際に、特徴量同士の類似度を算出する。一例として、異常検知部13は、特徴量が二値ベクトルといった符号化データで表されている場合には、二値ベクトル間の距離を算出することで、かかる距離から特徴量同士の類似度を算出する。ここで、図3の例では、対象セグメントについては類似度Sが算出され、2つの周辺セグメントについてはそれぞれ類似度St-1,St+1が算出されることとする。
 さらに、異常検知部13は、上述したように各セグメントについて行った特徴量の比較結果、つまり、各セグメントについて算出した類似度S,St-1,St+1に基づいて、異常検知用の時系列データセットに特定の状態である異常状態が発生しているか否かを検出する。例えば、異常検知部13は、算出した全ての類似度S,St-1,St+1を、予め設定された集計方法にて集計したスコアを算出し、かかる集計結果であるスコアに基づいて異常状態の検出を行う。一例として、異常検知部13は、全ての類似度S,St-1,St+1を加算してセグメントの数で割ることで、類似度の平均値を算出して、集計結果であるスコアとする。このとき、異常検知部13は、対象セグメントについて類似度Sはそのまま加算し、各周辺セグメントについての各類似度St-1,St+1は重みwを低くして加算して、平均値を算出してスコアとする。例えば、図3の例では、対象セグメントについて類似度S=0.9の場合に、w(t)=1.0とし、周辺セグメントについて各類似度がそれぞれSt-1=0.85、St+1=0.70である場合に、それぞれの重みw(t-1)=w(t+1)=0.9、とする。そして、セグメント数をnとすると、スコアは、「スコア=ΣS(t)*w(t)/n」で算出することができ、「(0.9*1.0+0.85*0.9+0.70*0.9)/3」で算出される。
 なお、上述したようい周辺セグメントの類似度に対してかけられる重みの値は、対象セグメントに対する周辺セグメントの位置に応じて設定されてもよい。例えば、周辺セグメントの類似度に対してかけられる重みの値は、対象セグメントに対して時間軸上で周辺セグメントの位置が前か後かに応じて設定されてもよく、後述するように、周辺セグメントが対象セグメントに対して隣接して位置していない場合には、対象セグメントから周辺セグメントまでの距離に応じて設定されてもよい。一例として、対象セグメントから周辺セグメントに対する距離が長くなるほど、周辺セグメントの類似度に対してかけられる重みの値を低く設定してもよい。
 そして、異常検知部13は、異常検知用の時系列データセット上における比較セグメントセットの位置を変えて、上述した異常検知処理を繰り返す。例えば、異常検知部13は、まず図3に示す比較対象セグメントセットに対するスコアを算出した後に、図4に示すように、時刻T+1に位置するセグメントを比較対象セグメントとし、その前後に隣接するセグメントを比較周辺セグメントとして、異なる時間軸上の位置の比較セグメントセットに対するスコアを算出する。その後さらに、異常検知部13は、図5に示すように、時刻T+2に位置するセグメントを比較対象セグメントとし、その前後に隣接するセグメントを比較周辺セグメントとして、異なる時間軸上の位置の比較セグメントセットに対するスコアを算出する。このようにして、異常検知部13は、異常検知用の時系列データセット上の複数の時間軸上の位置で比較セグメントセットを抽出して、異常状態モデルと比較してスコアを算出する。
 そして、異常検知部13は、上述したように算出した複数の比較セグメントセットに対するスコアから、異常検知用の時系列データセットに異常が発生したか否かを検知する。例えば、異常検知部13は、スコアが予め設定された閾値以上である場合に、異常状態が発生したと検知する。但し、異常検知部13は、スコアの値からいかなる方法で異常検知を行ってもよい。
 なお、上記では、学習用の時系列データセット上で抽出したセグメントセットは、1つの対象セグメントと、当該対象セグメントに対して時間軸上で前後にそれぞれ隣接して位置する2つの周辺セグメントと、からなることを例示したが、周辺セグメントの数と位置は上述したものに限定されない。つまり、周辺セグメントは、いかなる数であってもよく、また、対象セグメントに対していかなる位置関係に位置していてもよい。これに応じて、異常検知用の時系列データセット上で抽出する比較セグメントセットも、セグメントセットにおける対象セグメントと周辺セグメントとの位置関係に対応して抽出されることとなる。このとき、セグメントセットを構成する周辺セグメントは、対象セグメントに対して時間軸上で予め設定された範囲内に位置するものであるとよい。つまり、周辺セグメントは、対象セグメントに対して、時間軸上で離れすぎず、対象セグメントの時刻に対して予め周辺時刻と設定される範囲で抽出されるとよい。
 例えば、図6(1)に示すように、セグメントセットは、時刻tにおける1つの対象セグメントと、当該対象セグメントに対して時間軸上で前と後のそれぞれに複数が連続して隣接して位置する周辺セグメント(時刻t-2,t-1,t+1,t+2)と、から構成されていてもよい。また、例えば、図6(2)に示すように、セグメントセットは、時刻tにおける1つの対象セグメントと、当該対象セグメントに対して時間軸上で前のみに複数が連続して隣接して位置する周辺セグメント(時刻t-2,t-1,t+1,t+2)と、から構成されていてもよい。なお、図示しないが、セグメントセットは、時刻tにおける1つの対象セグメントと、当該対象セグメントに対して時間軸上で後のみに複数が連続して隣接して位置する周辺セグメントと、から構成されていてもよい。また、例えば、図7(1)に示すように、セグメントセットは、時刻tにおける1つの対象セグメントと、セグメント間で所定の時間を空けて、対象セグメントに対して前と後のそれぞれに位置する周辺セグメント(時刻t-2,t+2)と、から構成されていてもよい。また、例えば、図7(2)に示すように、セグメントセットは、時刻tにおける1つの対象セグメントと、セグメント間で所定の時間を空けて配置され、対象セグメントの前のみに位置する複数の周辺セグメント(時刻t-2,t-4)と、から構成されていてもよい。なお、図示しないが、セグメントセットは、時刻tにおける1つの対象セグメントと、セグメント間で所定の時間を空けて配置され、対象セグメントの後のみに位置する複数の周辺セグメントと、から構成されていてもよい。尚、学習部12が監視対象Pの正常状態モデルを生成する場合、異常検知部13は、正常状態モデルに基づいて、正常状態から外れている場合に、監視対象Pが異常状態であることを検知する。
 出力部14(検出手段)は、上述したように、セグメント間での特徴量の比較結果、つまり、異常検知の結果や算出したスコアを、図示しない監視者が使用する端末装置(例えば、スマートフォン、携帯電話、タブレット、などのポータブル端末など)に対して出力する。例えば、出力部14は、計測直後の異常検知用の時系列データセットに対して上述したように異常検知処理を行って異常が検知された場合に、予め設定された監視者の操作する端末装置宛に異常を検知した旨の情報を送信したり、また、監視室に設置されたモニタに異常を検知した旨の情報を表示するよう出力してもよい。
 また、出力部14は、例えば、図8に示すように、過去の異常検知用の時系列データセットに対して異常検知処理を行ったときのスコアのランキングを出力してもよい。この場合、スコアが高い順に、かかるスコアが算出された異常検知用の時系列データセット上の時刻と、スコアと、各セグメントについて算出した類似度に基づく情報と、を出力してもよい。例えば、出力部14は、「類似マップ」欄に、各セグメントの位置に対応して各ボックスを表示し、当該各ボックス内部を、対応する各セグメントについて算出した類似度に応じた色で塗りつぶして表示する。図8の例では、「類似マップ」欄の中央に、対象セグメントに対応するボックスを実線で囲って図示し、その両脇に、対象セグメントに対して設定された位置関係の周辺セグメントに対応するボックスを図示する。そして、各セグメントについて算出した類似度が高いほど、濃い濃度の色で、各セグメントに対応するボックス内部を塗りつぶして表示する。但し、出力部14は、他の方法で各セグメントについて算出した類似度に基づく情報を出力してもよい。また、出力部14は、異常を検知した位置と、監視者が所持する端末装置の位置情報とに基づいて、異常検知位置に最も近い監視者の位置も出力してもよい。これにより、発生した異常に対して迅速に対応することができるようになる。
 [動作]
 次に、上述した時系列データ処理装置10の動作を、主に図9乃至図10のフローチャートを参照して説明する。まず、図9のフローチャートを参照して、監視対象Pの異常状態を検知するための異常状態モデルを生成するときの動作を説明する。
 時系列データ処理装置10は、既に監視対象Pから計測され記憶された時系列データのうち、監視対象Pが異常状態であると判断されたときに計測された学習用の時系列データセット(第一の時系列データ)を取得する(ステップS1)。そして、時系列データ処理装置10は、時間軸上において特定の異常状態となった時刻付近の時系列データセットを所定の時間毎に区切ったセグメントのうち、複数のセグメント(複数の特定期間)からなるセグメントセットを抽出する。例えば、時系列データ処理装置10は、図2に示すように、時刻tを含む1つの「対象セグメント」と、対象セグメントに対して時間軸上で前後する他の時刻t-1,t+1をそれぞれ含む2つの「周辺セグメント」と、をセグメントセットとして抽出する。そして、時系列データ処理装置10は、各セグメントに含まれる部分時系列データの特徴量f,ft-1,ft+1をそれぞれ算出する(ステップS2)。
 そして、時系列データ処理装置10は、セグメントセットを構成する各セグメントの特徴量を、特定の異常状態を表す情報に関連付けて、異常状態モデルとして記憶する(ステップS3)。このとき、時系列データ処理装置10は、セグメントセットを構成する各セグメント間の位置関係、つまり、対象セグメントに対する周辺セグメントの位置関係、を表す情報も記憶しておく。なお、時系列データ処理装置10は、上述した図2に示すような対象セグメントと周辺セグメントとの位置関係のセグメントセットを抽出することに限らず、図6乃至図7に示すような位置関係のセグメントセットを抽出してもよい。
 次に、図10のフローチャートを参照して、監視対象Pの異常状態を検知するときの動作を説明する。時系列データ処理装置10は、計測された、あるいは、記憶されている、監視対象Pの異常検知用の時系列データセット(第二の時系列データ)を取得する(ステップS11)。併せて、時系列データ処理装置10は、記憶されている異常状態モデルとして、上述した対象セグメントと周辺セグメントとの各特徴量を読み出す。
 そして、時系列データ処理装置10は、異常検知用の時系列データセットから、上述した対象セグメントと周辺セグメントとからなるセグメントセットの時間軸上の位置関係に対応して位置する、複数のセグメントからなる比較セグメントセットを抽出する。例えば、時系列データ処理装置10は、図3に示すように、下図の異常検知用の時系列データセット上における所定時刻Tを中心として、上図の学習時に抽出したセグメントセットと同様の位置関係に位置する比較セグメントセットを抽出する。そして、時系列データ処理装置10は、比較セグメントセットを構成する時刻Tにおける「比較対象セグメント」と、その前後して隣接する他の時刻T-1,T+1をそれぞれ含む「比較周辺セグメント」と、における部分時系列データセットの特徴量をそれぞれ算出する(ステップS12)。
 続いて、時系列データ処理装置10は、学習用の時系列データセットにおけるセグメントセットを構成する各セグメントの各特徴量と、異常検知用の時系列データセットにおける比較セグメントセットを構成する各セグメントの各特徴量と、をそれぞれ比較する。このとき、時系列データ処理装置10は、図3の矢印に示すように、各時系列データセットの時間軸上における位置関係が相互に対応するセグメント同士の特徴量の類似度S,St-1,St+1を算出する(ステップS13)。
 続いて、時系列データ処理装置10は、上述したように各セグメントについて算出した類似度S,St-1,St+1を集計して(ステップS14)、異常検知用の時系列データセットに特定の状態である異常状態が発生しているか否かを判断する(ステップS15)。例えば、時系列データ処理装置10は、各セグメントの位置に応じて類似度S,St-1,St+1に重みをつけて平均値を算出し、その算出結果であるスコアに基づいて異常状態の検出を行う。
 時系列データ処理装置10は、異常検知用の時系列データセットから異常が検知されない場合には(ステップS15でNo)、かかる時系列データセットの異なる時刻に位置する比較セグメントセットを抽出する。そして、時系列データ処理装置10は、上述同様に、比較セグメントセットを構成する各セグメントの特徴量を算出して(ステップS12)、異常状態モデルとの類似度を算出して(ステップS13,S14)、異常状態が発生しているか否かを判断する(ステップS15)。
 時系列データ処理装置10は、集計したスコアから異常検知用の時系列データセットに異常が検知された場合には(ステップS15でYes)、異常検知の出力を行う(ステップS16)。例えば、時系列データ処理装置10は、予め設定された監視者のメールアドレスに異常を検知した旨の情報を送信したり、また、監視室に設置されたモニタに異常を検知した旨の情報を表示するよう出力する。なお、時系列データ処理装置10は、図8に示すように、これまでの異常検知の集計結果をランキング形式で出力してもよい。
 以上のように、本実施形態では、監視対象Pから計測した時系列データ上の複数のセグメント(期間)の部分時系列データの特徴量を用いて、異常検知用の時系列データの異常などの特定の状態を検出している。このように、複数のセグメントの特徴量をセットで用いて特定の状態の検出を行っているため、セグメントの時間幅の長さを短く設定した場合であっても、多数の部分時系列データに合致することを抑制でき、時系列データから異常など特定の状況を適切に検出することができる。
 <実施形態2>
 次に、本発明の第2の実施形態を、図11乃至図13を参照して説明する。図11乃至図12は、実施形態2における時系列データ処理装置の構成を示すブロック図であり、図13は、時系列データ処理装置の動作を示すフローチャートである。なお、本実施形態では、上述した実施形態で説明した時系列データ処理装置及び時系列データ処理方法の構成の概略を示している。
 まず、図11を参照して、本実施形態における時系列データ処理装置100のハードウェア構成を説明する。時系列データ処理装置100は、一般的な情報処理装置にて構成されており、一例として、以下のようなハードウェア構成を装備している。
 ・CPU(Central Processing Unit)101(演算装置)
 ・ROM(Read Only Memory)102(記憶装置)
 ・RAM(Random Access Memory)103(記憶装置)
 ・RAM103にロードされるプログラム群104
 ・プログラム群104を格納する記憶装置105
 ・情報処理装置外部の記憶媒体110の読み書きを行うドライブ装置106
 ・情報処理装置外部の通信ネットワーク111と接続する通信インタフェース107
 ・データの入出力を行う入出力インタフェース108
 ・各構成要素を接続するバス109
 そして、時系列データ処理装置100は、プログラム群104をCPU101が取得して当該CPU101が実行することで、図12に示す比較手段121と検出手段122とを構築して装備することができる。なお、プログラム群104は、例えば、予め記憶装置105やROM102に格納されており、必要に応じてCPU101がRAM103にロードして実行する。また、プログラム群104は、通信ネットワーク111を介してCPU101に供給されてもよいし、予め記憶媒体110に格納されており、ドライブ装置106が該プログラムを読み出してCPU101に供給してもよい。但し、上述した比較手段121と検出手段122とは、かかる手段を実現させるための専用の電子回路で構築されるものであってもよい。
 なお、図11は、時系列データ処理装置100である情報処理装置のハードウェア構成の一例を示しており、情報処理装置のハードウェア構成は上述した場合に限定されない。例えば、情報処理装置は、ドライブ装置106を有さないなど、上述した構成の一部から構成されてもよい。
 そして、時系列データ処理装置100は、上述したようにプログラムによって構築された比較手段121と検出手段122との機能により、図13のフローチャートに示す時系列データ処理方法を実行する。
 図13に示すように、時系列データ処理装置100は、
 第一の時系列データのうち時間軸上の位置が異なる複数の特定期間における部分時系列データのそれぞれの特徴量と、第二の時系列データのうち前記複数の特定期間の間の位置関係に対応して位置する複数の期間における部分時系列データのそれぞれの特徴量と、を比較し(ステップS101)、
 前記比較の結果に基づいて前記第二の時系列データにおける特定の状態を検出する(ステップS102)、
という処理を実行する。
 本発明は、以上のように構成されることにより、時系列データ上の複数の期間の部分時系列データの特徴量を用いて、異常検知用の時系列データの異常などの特定の状態を検出している。このように、複数の期間の特徴量をセットで用いて特定の状態の検出を行っているため、期間の時間幅の長さを短く設定した場合であっても、多数の部分時系列データに合致することを抑制でき、時系列データから異常など特定の状況を適切に検出することができる。
 なお、上述したプログラムは、様々なタイプの非一時的なコンピュータ可読媒体(non-transitory computer readable medium)を用いて格納され、コンピュータに供給することができる。非一時的なコンピュータ可読媒体は、様々なタイプの実体のある記録媒体(tangible storage medium)を含む。非一時的なコンピュータ可読媒体の例は、磁気記録媒体(例えばフレキシブルディスク、磁気テープ、ハードディスクドライブ)、光磁気記録媒体(例えば光磁気ディスク)、CD-ROM(Read Only Memory)、CD-R、CD-R/W、半導体メモリ(例えば、マスクROM、PROM(Programmable ROM)、EPROM(Erasable PROM)、フラッシュROM、RAM(Random Access Memory))を含む。また、プログラムは、様々なタイプの一時的なコンピュータ可読媒体(transitory computer readable medium)によってコンピュータに供給されてもよい。一時的なコンピュータ可読媒体の例は、電気信号、光信号、及び電磁波を含む。一時的なコンピュータ可読媒体は、電線及び光ファイバ等の有線通信路、又は無線通信路を介して、プログラムをコンピュータに供給できる。
 以上、上記実施形態等を参照して本願発明を説明したが、本願発明は、上述した実施形態に限定されるものではない。本願発明の構成や詳細には、本願発明の範囲内で当業者が理解しうる様々な変更をすることができる。また、上述した比較手段121と検出手段122との機能のうちの少なくとも一以上の機能は、ネットワーク上のいかなる場所に設置され接続された情報処理装置で実行されてもよく、つまり、いわゆるクラウドコンピューティングで実行されてもよい。
 <付記>
 上記実施形態の一部又は全部は、以下の付記のようにも記載されうる。以下、本発明における時系列データ処理方法、時系列データ処理装置、時系列データ処理システム、プログラムの構成の概略を説明する。但し、本発明は、以下の構成に限定されない。
(付記1)
 第一の時系列データのうち時間軸上の位置が異なる複数の特定期間における部分時系列データのそれぞれの特徴量と、第二の時系列データのうち前記複数の特定期間の間の位置関係に対応して位置する複数の期間における部分時系列データのそれぞれの特徴量と、を比較し、
 前記比較の結果に基づいて前記第二の時系列データにおける特定の状態を検出する、
時系列データ処理方法。
(付記2)
 付記1に記載の時系列データ処理方法であって、
 前記第一の時系列データの前記複数の特定期間と、前記第二の時系列データの前記複数の期間と、の時間軸上の位置関係が相互に対応する期間同士における部分時系列データの特徴量をそれぞれ比較する、
時系列データ処理方法。
(付記3)
 付記1又は2に記載の時系列データ処理方法であって、
 前記複数の特定期間は、前記第一の時系列データのうち、1つの対象期間と、当該対象期間に対して時間軸上の予め設定された位置である特定位置に位置する少なくとも1つの別期間と、からなり、
 前記第一の時系列データのうち前記対象期間における部分時系列データの特徴量と、前記第二の時系列データのうち所定の期間における部分時系列データの特徴量と、を比較すると共に、前記第一の時系列データのうち前記少なくとも1つの別期間における部分時系列データの特徴量と、前記第二の時系列データのうち前記所定の期間に対して前記特定位置に位置する少なくとも1つの期間における部分時系列データの特徴量と、を比較する、
時系列データ処理方法。
(付記4)
 付記3に記載の時系列データ処理方法であって、
 前記特定位置は、前記対象期間に対して時間軸上で前及び/又は後の位置を表す、
時系列データ処理方法。
(付記5)
 付記3又は4に記載の時系列データ処理方法であって、
 前記特定位置は、前記対象期間に対して時間軸上で予め設定された範囲内の位置を表す、
時系列データ処理方法。
(付記6)
 付記3乃至5のいずれかに記載の時系列データ処理方法であって、
 前記特定位置は、前記対象期間に対して時間軸上で隣接する位置を表す、
時系列データ処理方法。
(付記7)
 付記3乃至6のいずれかに記載の時系列データ処理方法であって、
 前記特定位置は、前記対象期間に対して時間軸上で連続して隣接する複数の位置を表す、
時系列データ処理方法。
(付記8)
 付記1乃至7のいずれかに記載の時系列データ処理方法であって、
 期間毎に比較する特徴量間の類似度を算出し、
 算出した全ての類似度に基づいて、前記第二の時系列データにおける特定の状態を検出する、
時系列データ処理方法。
(付記9)
 付記3乃至7のいずれかに記載の時系列データ処理方法であって、
 前記対象期間について比較する特徴量間の類似度と、前記別期間について比較する特徴量間の類似度と、を算出し、
 前記対象期間についての類似度と、前記別期間についての類似度と、を異なる方法で集計して、集計結果に基づいて前記第二の時系列データにおける特定の状態を検出する、
時系列データ処理方法。
(付記10)
 付記9に記載の時系列データ処理方法であって、
 前記別期間についての類似度を、前記対象期間についての類似度よりも重みを低くして集計を行う、
時系列データ処理方法。
(付記11)
 付記1乃至10のいずれかに記載の時系列データ処理方法であって、
 期間毎に特徴量を比較した結果を出力する、
時系列データ処理方法。
(付記12)
 第一の時系列データのうち時間軸上の位置が異なる複数の特定期間における部分時系列データのそれぞれの特徴量と、第二の時系列データのうち前記複数の特定期間の間の位置関係に対応して位置する複数の期間における部分時系列データのそれぞれの特徴量と、を比較する比較手段と、
 前記比較の結果に基づいて前記第二の時系列データにおける特定の状態を検出する検出手段と、
を備えた時系列データ処理装置。
(付記13)
 付記12に記載の時系列データ処理装置であって、
 前記比較手段は、前記第一の時系列データの前記複数の特定期間と、前記第二の時系列データの前記複数の期間と、の時間軸上の位置関係が相互に対応する期間同士における部分時系列データの特徴量をそれぞれ比較する、
時系列データ処理装置。
(付記14)
 付記12又は13に記載の時系列データ処理装置であって、
 前記複数の特定期間は、前記第一の時系列データのうち、1つの対象期間と、当該対象期間に対して時間軸上の予め設定された位置である特定位置に位置する少なくとも1つの別期間と、からなり、
 前記比較手段は、前記第一の時系列データのうち前記対象期間における部分時系列データの特徴量と、前記第二の時系列データのうち所定の期間における部分時系列データの特徴量と、を比較すると共に、前記第一の時系列データのうち前記少なくとも1つの別期間における部分時系列データの特徴量と、前記第二の時系列データのうち前記所定の期間に対して前記特定位置に位置する少なくとも1つの期間における部分時系列データの特徴量と、を比較する、
時系列データ処理装置。
(付記14.1)
 付記14に記載の時系列データ処理装置であって、
 前記特定位置は、前記対象期間に対して時間軸上で前及び/又は後の位置を表す、
時系列データ処理装置。
(付記14.2)
 付記14又は14.1に記載の時系列データ処理装置であって、
 前記特定位置は、前記対象期間に対して時間軸上で予め設定された範囲内の位置を表す、
時系列データ処理装置。
(付記14.3)
 付記14乃至14.2のいずれかに記載の時系列データ処理装置であって、
 前記特定位置は、前記対象期間に対して時間軸上で隣接する位置を表す、
時系列データ処理装置。
(付記14.4)
 付記14乃至14.3のいずれかに記載の時系列データ処理装置であって、
 前記特定位置は、前記対象期間に対して時間軸上で連続して隣接する複数の位置を表す、
時系列データ処理装置。
(付記15)
 付記12乃至14のいずれかに記載の時系列データ処理装置であって、
 前記比較手段は、期間毎に比較する特徴量間の類似度を算出し、
 前記検出手段は、算出した全ての類似度に基づいて、前記第二の時系列データにおける特定の状態を検出する、
時系列データ処理装置。
(付記16)
 付記14に記載の時系列データ処理装置であって、
 前記比較手段は、前記対象期間について比較する特徴量間の類似度と、前記別期間について比較する特徴量間の類似度と、を算出し、
 前記検出手段は、前記対象期間についての類似度と、前記別期間についての類似度と、を異なる方法で集計して、集計結果に基づいて前記第二の時系列データにおける特定の状態を検出する、
時系列データ処理装置。
(付記17)
 付記16に記載の時系列データ処理装置であって、
 前記検出手段は、前記別期間についての類似度を、前記対象期間についての類似度よりも重みを低くして集計を行う、
時系列データ処理装置。
(付記18)
 付記12乃至17のいずれかに記載の時系列データ処理装置であって、
 前記検出手段は、期間毎に特徴量を比較した結果を出力する、
時系列データ処理装置。
(付記19)
 情報処理装置に、
 第一の時系列データのうち時間軸上の位置が異なる複数の特定期間における部分時系列データのそれぞれの特徴量と、第二の時系列データのうち前記複数の特定期間の間の位置関係に対応して位置する複数の期間における部分時系列データのそれぞれの特徴量と、を比較する比較手段と、
 前記比較の結果に基づいて前記第二の時系列データにおける特定の状態を検出する検出手段と、
を実現させるためのプログラム。
(付記20)
 第一の時系列データのうち時間軸上の位置が異なる複数の特定期間における部分時系列データのそれぞれの特徴量と、第二の時系列データのうち前記複数の特定期間の間の位置関係に対応して位置する複数の期間における部分時系列データのそれぞれの特徴量と、を比較する比較手段と、
 前記比較の結果に基づいて前記第二の時系列データにおける特定の状態を検出する検出手段と、
を備えた時系列データ処理システム。
10 時系列データ処理装置
11 計測部
12 学習部
13 異常検知部
14 出力部
16 計測データ記憶部
17 学習データ記憶部
18 検出データ記憶部
100 時系列データ処理装置
101 CPU
102 ROM
103 RAM
104 プログラム群
105 記憶装置
106 ドライブ装置
107 通信インタフェース
108 入出力インタフェース
109 バス
110 記憶媒体
111 通信ネットワーク
121 比較手段
122 検出手段
 

Claims (19)

  1.  第一の時系列データのうち時間軸上の位置が異なる複数の特定期間における部分時系列データのそれぞれの特徴量と、第二の時系列データのうち前記複数の特定期間の間の位置関係に対応して位置する複数の期間における部分時系列データのそれぞれの特徴量と、を比較し、
     前記比較の結果に基づいて前記第二の時系列データにおける特定の状態を検出する、
    時系列データ処理方法。
  2.  請求項1に記載の時系列データ処理方法であって、
     前記第一の時系列データの前記複数の特定期間と、前記第二の時系列データの前記複数の期間と、の時間軸上の位置関係が相互に対応する期間同士における部分時系列データの特徴量をそれぞれ比較する、
    時系列データ処理方法。
  3.  請求項1又は2に記載の時系列データ処理方法であって、
     前記複数の特定期間は、前記第一の時系列データのうち、1つの対象期間と、当該対象期間に対して時間軸上の予め設定された位置である特定位置に位置する少なくとも1つの別期間と、からなり、
     前記第一の時系列データのうち前記対象期間における部分時系列データの特徴量と、前記第二の時系列データのうち所定の期間における部分時系列データの特徴量と、を比較すると共に、前記第一の時系列データのうち前記少なくとも1つの別期間における部分時系列データの特徴量と、前記第二の時系列データのうち前記所定の期間に対して前記特定位置に位置する少なくとも1つの期間における部分時系列データの特徴量と、を比較する、
    時系列データ処理方法。
  4.  請求項3に記載の時系列データ処理方法であって、
     前記特定位置は、前記対象期間に対して時間軸上で前及び/又は後の位置を表す、
    時系列データ処理方法。
  5.  請求項3又は4に記載の時系列データ処理方法であって、
     前記特定位置は、前記対象期間に対して時間軸上で予め設定された範囲内の位置を表す、
    時系列データ処理方法。
  6.  請求項3乃至5のいずれかに記載の時系列データ処理方法であって、
     前記特定位置は、前記対象期間に対して時間軸上で隣接する位置を表す、
    時系列データ処理方法。
  7.  請求項3乃至6のいずれかに記載の時系列データ処理方法であって、
     前記特定位置は、前記対象期間に対して時間軸上で連続して隣接する複数の位置を表す、
    時系列データ処理方法。
  8.  請求項1乃至7のいずれかに記載の時系列データ処理方法であって、
     期間毎に比較する特徴量間の類似度を算出し、
     算出した全ての類似度に基づいて、前記第二の時系列データにおける特定の状態を検出する、
    時系列データ処理方法。
  9.  請求項3乃至7のいずれかに記載の時系列データ処理方法であって、
     前記対象期間について比較する特徴量間の類似度と、前記別期間について比較する特徴量間の類似度と、を算出し、
     前記対象期間についての類似度と、前記別期間についての類似度と、を異なる方法で集計して、集計結果に基づいて前記第二の時系列データにおける特定の状態を検出する、
    時系列データ処理方法。
  10.  請求項9に記載の時系列データ処理方法であって、
     前記別期間についての類似度を、前記対象期間についての類似度よりも重みを低くして集計を行う、
    時系列データ処理方法。
  11.  請求項1乃至10のいずれかに記載の時系列データ処理方法であって、
     期間毎に特徴量を比較した結果を出力する、
    時系列データ処理方法。
  12.  第一の時系列データのうち時間軸上の位置が異なる複数の特定期間における部分時系列データのそれぞれの特徴量と、第二の時系列データのうち前記複数の特定期間の間の位置関係に対応して位置する複数の期間における部分時系列データのそれぞれの特徴量と、を比較する比較手段と、
     前記比較の結果に基づいて前記第二の時系列データにおける特定の状態を検出する検出手段と、
    を備えた時系列データ処理装置。
  13.  請求項12に記載の時系列データ処理装置であって、
     前記比較手段は、前記第一の時系列データの前記複数の特定期間と、前記第二の時系列データの前記複数の期間と、の時間軸上の位置関係が相互に対応する期間同士における部分時系列データの特徴量をそれぞれ比較する、
    時系列データ処理装置。
  14.  請求項12又は13に記載の時系列データ処理装置であって、
     前記複数の特定期間は、前記第一の時系列データのうち、1つの対象期間と、当該対象期間に対して時間軸上の予め設定された位置である特定位置に位置する少なくとも1つの別期間と、からなり、
     前記比較手段は、前記第一の時系列データのうち前記対象期間における部分時系列データの特徴量と、前記第二の時系列データのうち所定の期間における部分時系列データの特徴量と、を比較すると共に、前記第一の時系列データのうち前記少なくとも1つの別期間における部分時系列データの特徴量と、前記第二の時系列データのうち前記所定の期間に対して前記特定位置に位置する少なくとも1つの期間における部分時系列データの特徴量と、を比較する、
    時系列データ処理装置。
  15.  請求項12乃至14のいずれかに記載の時系列データ処理装置であって、
     前記比較手段は、期間毎に比較する特徴量間の類似度を算出し、
     前記検出手段は、算出した全ての類似度に基づいて、前記第二の時系列データにおける特定の状態を検出する、
    時系列データ処理装置。
  16.  請求項14に記載の時系列データ処理装置であって、
     前記比較手段は、前記対象期間について比較する特徴量間の類似度と、前記別期間について比較する特徴量間の類似度と、を算出し、
     前記検出手段は、前記対象期間についての類似度と、前記別期間についての類似度と、を異なる方法で集計して、集計結果に基づいて前記第二の時系列データにおける特定の状態を検出する、
    時系列データ処理装置。
  17.  請求項16に記載の時系列データ処理装置であって、
     前記検出手段は、前記別期間についての類似度を、前記対象期間についての類似度よりも重みを低くして集計を行う、
    時系列データ処理装置。
  18.  請求項12乃至17のいずれかに記載の時系列データ処理装置であって、
     前記検出手段は、期間毎に特徴量を比較した結果を出力する、
    時系列データ処理装置。
  19.  情報処理装置に、
     第一の時系列データのうち時間軸上の位置が異なる複数の特定期間における部分時系列データのそれぞれの特徴量と、第二の時系列データのうち前記複数の特定期間の間の位置関係に対応して位置する複数の期間における部分時系列データのそれぞれの特徴量と、を比較する比較手段と、
     前記比較の結果に基づいて前記第二の時系列データにおける特定の状態を検出する検出手段と、
    を実現させるためのプログラムを記憶したコンピュータにて読み取り可能な記憶媒体。
     
PCT/JP2020/026287 2020-07-03 2020-07-03 時系列データ処理方法、時系列データ処理装置、時系列データ処理システム、記録媒体 WO2022003983A1 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
US18/013,405 US20230252038A1 (en) 2020-07-03 2020-07-03 Time-series data processing method, time-series data processing device, time-series data processing system, and recording medium
JP2022533018A JP7533582B2 (ja) 2020-07-03 2020-07-03 時系列データ処理方法、時系列データ処理装置、時系列データ処理システム、記録媒体
PCT/JP2020/026287 WO2022003983A1 (ja) 2020-07-03 2020-07-03 時系列データ処理方法、時系列データ処理装置、時系列データ処理システム、記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2020/026287 WO2022003983A1 (ja) 2020-07-03 2020-07-03 時系列データ処理方法、時系列データ処理装置、時系列データ処理システム、記録媒体

Publications (1)

Publication Number Publication Date
WO2022003983A1 true WO2022003983A1 (ja) 2022-01-06

Family

ID=79315014

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2020/026287 WO2022003983A1 (ja) 2020-07-03 2020-07-03 時系列データ処理方法、時系列データ処理装置、時系列データ処理システム、記録媒体

Country Status (3)

Country Link
US (1) US20230252038A1 (ja)
JP (1) JP7533582B2 (ja)
WO (1) WO2022003983A1 (ja)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012513645A (ja) * 2009-04-13 2012-06-14 エンサーズ カンパニー リミテッド 動画像関連広告を提供する方法およびその装置
JP2014112280A (ja) * 2012-12-05 2014-06-19 Nippon Telegr & Teleph Corp <Ntt> 映像群再構成・要約装置、映像群再構成・要約方法及び映像群再構成・要約プログラム
WO2020049666A1 (ja) * 2018-09-05 2020-03-12 日本電気株式会社 時系列データ処理装置

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9870294B2 (en) * 2014-01-23 2018-01-16 Microsoft Technology Licensing, Llc Visualization of behavior clustering of computer applications
JP7188950B2 (ja) * 2018-09-20 2022-12-13 株式会社Screenホールディングス データ処理方法およびデータ処理プログラム
TW202044394A (zh) * 2019-05-22 2020-12-01 日商荏原製作所股份有限公司 基板處理系統
KR102298414B1 (ko) * 2019-12-16 2021-09-06 주식회사 카카오 캘린더 서비스를 제공하는 방법 및 그 장치

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012513645A (ja) * 2009-04-13 2012-06-14 エンサーズ カンパニー リミテッド 動画像関連広告を提供する方法およびその装置
JP2014112280A (ja) * 2012-12-05 2014-06-19 Nippon Telegr & Teleph Corp <Ntt> 映像群再構成・要約装置、映像群再構成・要約方法及び映像群再構成・要約プログラム
WO2020049666A1 (ja) * 2018-09-05 2020-03-12 日本電気株式会社 時系列データ処理装置

Also Published As

Publication number Publication date
JPWO2022003983A1 (ja) 2022-01-06
US20230252038A1 (en) 2023-08-10
JP7533582B2 (ja) 2024-08-14

Similar Documents

Publication Publication Date Title
JP7007243B2 (ja) 異常検知システム
US20180059628A1 (en) Information processing apparatus, information processing method, and, recording medium
US8630962B2 (en) Error detection method and its system for early detection of errors in a planar or facilities
US11580629B2 (en) System and method for determining situation of facility by imaging sensing data of facility
US10599501B2 (en) Information processing device, information processing method, and recording medium
JPWO2017022312A1 (ja) 情報処理装置、情報処理システム、情報処理方法及びプログラム
EP3910437B1 (en) Monitoring apparatus, monitoring method, and computer-readable medium
US11747405B2 (en) System and method for audio and vibration based power distribution equipment condition monitoring
JP2019016039A (ja) プロセスの異常状態診断方法および異常状態診断装置
JP7248103B2 (ja) 異常検知方法、異常検知装置、プログラム
CN102257448A (zh) 使用切换模型进行机器状况监视的文件的滤波和预测
CN113723734A (zh) 时序数据的异常监测方法、装置、电子设备和存储介质
US20210089962A1 (en) Information processing device, information processing method, and recording medium
CN116997867A (zh) 用于预测技术设施的运行的方法和系统
WO2022003983A1 (ja) 時系列データ処理方法、時系列データ処理装置、時系列データ処理システム、記録媒体
CN107451029A (zh) 一种信息处理方法及装置、设备
CN108073464A (zh) 一种基于速度和加速度的时序数据异常点检测方法及装置
US10157113B2 (en) Information processing device, analysis method, and recording medium
US20220253461A1 (en) Time-series data processing method
JP6662222B2 (ja) 製造プロセスの異常状態診断方法及び異常状態診断装置
CN114391093B (zh) 异常判定装置以及异常判定方法
WO2018207605A1 (ja) 正常異常判別装置、正常異常判別方法、及び正常異常判別システム
JPWO2020166011A1 (ja) 時系列データ処理方法
US11652700B2 (en) State diagnosis apparatus and system
WO2023105725A1 (ja) 時系列データ処理方法

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 20942567

Country of ref document: EP

Kind code of ref document: A1

ENP Entry into the national phase

Ref document number: 2022533018

Country of ref document: JP

Kind code of ref document: A

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 20942567

Country of ref document: EP

Kind code of ref document: A1