WO2015145500A1 - システム分析装置、分析モデル生成方法、システム分析方法およびシステム分析プログラム - Google Patents

システム分析装置、分析モデル生成方法、システム分析方法およびシステム分析プログラム Download PDF

Info

Publication number
WO2015145500A1
WO2015145500A1 PCT/JP2014/005336 JP2014005336W WO2015145500A1 WO 2015145500 A1 WO2015145500 A1 WO 2015145500A1 JP 2014005336 W JP2014005336 W JP 2014005336W WO 2015145500 A1 WO2015145500 A1 WO 2015145500A1
Authority
WO
WIPO (PCT)
Prior art keywords
model
data item
regression equation
group
correlation model
Prior art date
Application number
PCT/JP2014/005336
Other languages
English (en)
French (fr)
Inventor
昌尚 棗田
Original Assignee
日本電気株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 日本電気株式会社 filed Critical 日本電気株式会社
Priority to JP2016509613A priority Critical patent/JP6493389B2/ja
Priority to US15/129,402 priority patent/US20170103148A1/en
Priority to EP14887291.4A priority patent/EP3125057B1/en
Publication of WO2015145500A1 publication Critical patent/WO2015145500A1/ja

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/20Design optimisation, verification or simulation
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B17/00Systems involving the use of models or simulators of said systems
    • G05B17/02Systems involving the use of models or simulators of said systems electric
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B23/00Testing or monitoring of control systems or parts thereof
    • G05B23/02Electric testing or monitoring
    • G05B23/0205Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults
    • G05B23/0218Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults characterised by the fault detection method dealing with either existing or incipient faults
    • G05B23/0221Preprocessing measurements, e.g. data collection rate adjustment; Standardization of measurements; Time series or signal analysis, e.g. frequency analysis or wavelets; Trustworthiness of measurements; Indexes therefor; Measurements using easily measured parameters to estimate parameters difficult to measure; Virtual sensor creation; De-noising; Sensor fusion; Unconventional preprocessing inherently present in specific fault detection methods like PCA-based methods
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B23/00Testing or monitoring of control systems or parts thereof
    • G05B23/02Electric testing or monitoring
    • G05B23/0205Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults
    • G05B23/0218Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults characterised by the fault detection method dealing with either existing or incipient faults
    • G05B23/0243Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults characterised by the fault detection method dealing with either existing or incipient faults model based detection method, e.g. first-principles knowledge model
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B2219/00Program-control systems
    • G05B2219/30Nc systems
    • G05B2219/31From computer integrated manufacturing till monitoring
    • G05B2219/31357Observer based fault detection, use model
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/02Total factory control, e.g. smart factories, flexible manufacturing systems [FMS] or integrated manufacturing systems [IMS]

Definitions

  • the present invention relates to a system analysis apparatus, an analysis model generation method, a system analysis method, and a system analysis program for analyzing a system state.
  • processing for analyzing the state of the system is performed based on sensor values obtained from system components.
  • the system is, for example, a unity or mechanism composed of elements that affect each other, such as an ICT (Information and Communication Technology) system, a chemical plant, a power plant, and power equipment.
  • ICT Information and Communication Technology
  • the sensor values are various values obtained from system components. For example, the valve opening, the liquid level, the temperature, the flow rate, and the pressure obtained through sensors provided in the system components. Measured values of current, voltage, etc., predicted values calculated using such measured values, values of control signals issued by information processing devices used to change the system to a desired operating state, etc. .
  • various values obtained from system components are simply referred to as sensor values without distinguishing their types.
  • a method for determining whether the state of the device is normal or abnormal is widely used.
  • the system analysis method may further include a method for identifying a malfunctioning facility when a predetermined number of sensor values exceed a threshold value.
  • a method for determining whether the state of the system is normal or abnormal based on such a sensor value itself, or specifying a failure location is referred to as a first method.
  • the first method has a problem that a system state change due to an internal factor or an external factor such as an air temperature, a system load, or a set value is erroneously detected as a system abnormality.
  • the threshold is set to a low level to avoid such false detections, system abnormalities that should be detected, such as equipment failures and operation mistakes, cannot be detected, and serious damage may be caused to the system and its surroundings. There was a problem that caused sex.
  • a regression analysis is performed on sensor values obtained from system components, and the results are based on the difference between the predicted values of other sensor values and the actual sensor values.
  • a method of determining whether the state of the system is normal or abnormal by using regression analysis for such sensor values is referred to as a second method.
  • the predicted value can be calculated in accordance with the state change of the system (how it has changed), so whether the system state is normal or abnormal based on the sensor value itself.
  • the sensitivity of abnormality detection can be increased while suppressing erroneous detection.
  • the multicollinearity phenomenon is a phenomenon that causes an incomputable problem and insufficient accuracy when a plurality of linked data items are included in an explanatory variable in regression analysis.
  • the “data item” is associated with various types of sensor values obtained from the system components, and represents a set of sensor values corresponding to the corresponding item, or the corresponding item. It is used to represent identification information that identifies the corresponding sensor value. Elements such as devices constituting the system operate in conjunction with other elements in order to achieve system purposes such as information processing, production of chemical products, and energy conversion. Therefore, it is conceivable that the sensor values obtained from the components of the system also change in conjunction with other sensor values. When regression analysis is used for such sensor values, the above-described multicollinearity phenomenon is likely to occur.
  • Patent Document 1 uses PLS (Partial Least Square) as an example of a method for constructing a regression equation for predicting manufacturing quality.
  • PLS Partial Least Square
  • Patent Document 2 describes a method for determining parameters of a regression equation for detecting plant abnormality using PLS as in Patent Document 1.
  • Patent Document 3 as an example of a method for constructing a regression equation for detecting an abnormality in a heat pump heat exchanger, a data item having a strong correlation is excluded from explanatory variables included in one regression equation. Describes a method for constructing a regression equation by avoiding the multicollinearity phenomenon.
  • Patent Document 4 data items are classified into three types: objective variables, explanatory variables and independence, or explanatory variables and collinearity, and one regression equation is classified into explanatory variables and collinearity.
  • a method is described in which a regression equation is constructed by avoiding the multicollinearity phenomenon by allowing only one data item to be entered.
  • the second method for determining whether the system state is normal or abnormal using regression analysis compared to the first method for determining whether the system state is normal or abnormal based on the sensor value itself, There is a high possibility that the sensitivity of abnormality detection can be increased while suppressing false detection.
  • each sensor value obtained from the system components often changes in conjunction with other sensor values, and there is a high possibility that a multicollinearity phenomenon occurs. Therefore, in the case of using the second method, a change in the sensor value due to a system state change that can normally occur and a change in the sensor value unrelated to such a change in the sensor value can be well separated. It is necessary to construct a regression equation that can avoid the multicollinearity phenomenon while using a plurality of data items corresponding to the types of sensor values that are highly related to each other.
  • Patent Documents 1 and 2 use a plurality of data items as explanatory variables, and construct a regression equation using latent variables and objective variables obtained by synthesizing the explanatory variables.
  • simply using a plurality of data items as explanatory variables may include data items that hardly contribute to the predicted value of the target variable calculated by the regression equation.
  • an abnormality that affects a small number of data items (more specifically, a change in sensor value associated with the abnormality) cannot be detected with high sensitivity.
  • Patent Document 3 has a problem that an abnormality appearing in the excluded data item cannot be detected because the data item having a strong correlation is excluded.
  • Patent Document 4 since the method described in Patent Document 4 divides data items into objective variables and explanatory variables in advance, depending on which data item is selected for the objective variable, whether the system state is normal or abnormal There was a problem that the judgment results were different. For example, even if the influence of an abnormality appears as a difference in sensor values between data items that are target variables or between data items that are explanatory variables, between the data items that are target variables and the data items that are explanatory variables If the sensor value does not appear as a difference in sensor value, the abnormality cannot be detected, and the system state is determined to be normal even though some abnormality has occurred in the system.
  • the collinearity between explanatory variables is due to changes in sensor values that are normally caused by system state changes, and changes in sensor values due to abnormalities appear only between explanatory variables that are collinear between explanatory variables. In such a case, such a change in sensor value may not be detected as abnormal.
  • the explanatory variable of the regression equation includes only one data item classified as explanatory variable and collinear, the sensor accompanying the system state change that can normally occur from the actual change of the sensor value. This is because a change in sensor value that is unrelated to a change in the state of the system (a change in sensor value that may be abnormal) cannot be extracted by removing the change in value.
  • the explanatory variable And at least two data items classified as collinear.
  • Patent Documents 1 to 4 have a problem that it becomes difficult to select appropriate objective variables and explanatory variables when the system becomes large and complicated.
  • changes in individual internal or external factors such as changes in temperature, system load, and changes in setting values affect changes in sensor values that indicate the state of the system. This is because it is difficult to grasp the range, and it is difficult to narrow down the data items to be set in the objective variable and the explanatory variable.
  • the present invention provides a system analysis apparatus, an analysis model generation method, a system analysis method, and a system analysis apparatus that can accurately analyze the state of the target system even when the target system is complex or multicollinearity exists between data items.
  • the purpose is to provide a system analysis program.
  • being able to analyze the state of the system means that it is possible to determine at least whether the state of the system is abnormal or normal.
  • a system analysis apparatus includes an analysis model generation unit that generates an analysis model for analyzing a state of a target system, using state information that is a collection of information on a plurality of types of data items of the target system.
  • the model includes at least one multi-body correlation model, which is a correlation model having at least a regression equation configured using three or more data items and an allowable range of prediction error of the regression equation, and an analysis model generating means Is a data item classification means for classifying the data item group included in the state information into one or more groups, and for each group classified by the data item classification means, at least one of the data items included in the group Select two representative data items, and any two of the data items included in the group excluding the selected representative data item For all combinations for the eye, a regression equation is constructed using the two data items and the representative data item, and the allowable range of prediction error of the regression equation and the superiority of the regression equation are set.
  • a many-body correlation model generating means for generating a many-body correlation model having at least a regression equation calculated and constructed, and an allowable range of a prediction error of the regression equation, and a many-body correlation generated by the many-body correlation model generating means
  • a model extracting means for extracting a multi-body correlation model satisfying an excellent model condition of a multi-body correlation model for which a regression equation has a predetermined level of excellence from the model group as a multi-body correlation model to be included in the analysis model;
  • the data item classifying means includes one data item arbitrarily selected from the data items included in the group in at least one group after classification.
  • the first degree of the regression equation constructed using the data item and the second data item which is one of the data items included in the same group as the first data item excluding the first data item, Classifying the data items such that at least one of the goodnesses of the regression equation satisfies a predetermined good model condition when calculated for all possible combinations of the second data items with respect to the data items; To do.
  • An analysis model generation method is an analysis model generation method for generating an analysis model for analyzing a state of a target system using state information that is a set of information related to a plurality of types of data items of the target system.
  • the data item classification means is a first data item that is one data item arbitrarily selected from the data items included in the group in at least one group after the classification of the data item group included in the state information.
  • the first data is the degree of excellence of the regression equation constructed using the item and the second data item that is one of the data items included in the same group as the first data item excluding the first data item.
  • At least one of the goodnesses of the regression formula is a predetermined goodness model condition.
  • the data is classified into one or more groups so as to satisfy, and the many-body correlation model generation means uses at least one representative data from the data items included in the group for each classified group using the state information.
  • An item is selected, and all the combinations for any two data items included in the group excluding the selected representative data item are configured using the two data items and the representative data item.
  • the regression equation is calculated, the tolerance of the prediction error of the regression equation and the superiority of the regression equation are calculated, and the constructed regression equation and the tolerance of the prediction error of the regression equation are at least included
  • a many-body correlation model is generated, and the model extraction means is a superior model of the many-body correlation model in which the degree of regression is determined in advance from the generated many-body correlation model group
  • the many-body correlation model that satisfies matter, and extracts as a multi-body correlation model to be included in the analysis model.
  • the data item classifying means includes, in at least one group after classification, the data item group included in the state information that is a set of information related to a plurality of types of data items of the target system.
  • a first data item that is one data item arbitrarily selected from the data items included in the group, and one of the data items that are included in the same group as the first data item excluding the first data item.
  • the superiority of the regression equation constructed using the second data item is calculated for all combinations of second data items that can be taken for the first data item, at least one of the superiorities of the regression equation is Categorized into one or more groups so as to satisfy a predetermined excellent model condition, and the many-body correlation model generation means uses the state information to classify the classified groups. For each of the data items included in the group, at least one representative data item is selected, and all of the data items included in the group except for the selected representative data item are all selected.
  • the model extraction means includes, in the analysis model, a multi-body correlation model that satisfies the excellent model condition of the many-body correlation model for which the degree of superiority of the regression equation is predetermined from the generated many-body correlation model group. It is extracted as a body correlation model, the information of the analysis model including the extracted many-body correlation model group is stored in a predetermined storage device, and the model destruction detection means is newly collected when the state information is newly acquired.
  • the predicted value of the objective variable of the regression equation of the correlation model is the correlation model
  • the presence or absence of model destruction, which is a phenomenon exceeding the allowable range of the prediction error of the regression equation, is detected, and the abnormality determination means determines that the system status is based on the detection result by the model destruction detection means. And judging whether normal or normal.
  • the system analysis program includes, in a computer, a data item group included in state information, which is a set of information related to a plurality of types of data items of the target system, in at least one group after classification.
  • a first data item that is one data item arbitrarily selected from the data items to be selected, and second data that is one of the data items included in the same group as the first data item excluding the first data item
  • the superiority of the regression equation constructed using the items is calculated for all combinations of the second data items that can be taken for the first data item, at least one of the superiorities of the regression equation is a predetermined value. For each group that has been classified using the data item classification process and status information that are classified into one or more groups to satisfy the excellent model condition.
  • At least one representative data item is selected from the data items included in the group, and all combinations of any two data items included in the group excluding the selected representative data item Construct a regression equation composed of the two data items and a representative data item, and calculate the tolerance of the prediction error of the regression equation and the superiority of the regression equation.
  • a multi-body correlation model generation process for generating a multi-body correlation model having at least the regression equation and an allowable range of prediction error of the regression equation, A model extraction process that extracts a many-body correlation model that satisfies the pre-determined excellent model of the many-body correlation model as a many-body correlation model to be included in the analysis model.
  • the predicted value of the objective variable of the regression equation of the correlation model is a phenomenon that exceeds the allowable range of the prediction error of the regression equation of the correlation model.
  • the state of the target system can be analyzed with high accuracy even if the target system is complex or there is multicollinearity between data items.
  • FIG. 1211 It is a block diagram showing an example of composition of system analysis device 100 of a 1st embodiment. It is explanatory drawing which shows an example of the extraction method of the excellent cross correlation model by the data item classification means 1211.
  • FIG. It is explanatory drawing which shows an example of the extraction method of the excellent many-body correlation model by the model extraction means.
  • It is explanatory drawing which shows the construction example of the graph structure of the excellent cross correlation model group.
  • Embodiment 1 FIG.
  • the system analysis apparatus of the present invention is applied to abnormality detection of a power plant system.
  • FIG. 1 is a block diagram illustrating a configuration example of the system analysis apparatus 100 according to the first embodiment.
  • the system analysis device 100 of this embodiment is connected to a monitored system including one or more monitored devices 200.
  • the monitored device 200 is a device or subsystem as a component constituting the power plant system, and is, for example, a turbine, a feed water heater, a condenser, or the like.
  • the monitored device 200 also includes elements that connect the devices, such as piping and signal lines.
  • the entire system is assumed as a monitored system like a power plant system, but the monitored system may be a part of a certain system. That is, you may limit a to-be-monitored system to the component for implement
  • Each monitored device 200 measures a sensor value obtained by the monitored device 200 for each predetermined period and transmits the measured sensor value to the system analysis device 100.
  • the sensor value is a value obtained from the sensor. Examples of sensor values include measured values measured by measuring devices installed in equipment such as valve opening, liquid level height, temperature, flow rate, pressure, current, and voltage, and predictions calculated from the measured values. Value and control signal value.
  • each sensor value is represented by a numerical value such as an integer or a decimal.
  • one data item is assigned to each sensor corresponding to the sensor value obtained from each monitored device 200.
  • a set of sensor values collected at the same timing from each monitored device 200 is called state information, and a set of data items corresponding to the sensor values included in the state information is called a data item group.
  • the items collected at the timing considered to be the same are not limited to those collected by the monitored devices 200 at the same time and transmitted to the system analysis device 100, but the time difference within a predetermined range. Measured and transmitted to the system analysis device 100, and those collected from each monitored device 200 by the system analysis device 100 through a series of collection processes.
  • a device that stores sensor values acquired by the monitored device 200 between the monitored device 200 and the system analysis device 100 such as a data server, a DCS (Distributed Control System), or the like.
  • a process computer may be provided. In such a case, even if the monitored device 200 acquires the sensor value at an arbitrary timing and stores it in the storage device, the system analysis device 100 reads the sensor value stored in the storage device every predetermined period. Good.
  • the system analysis apparatus 100 constructs an analysis model for analyzing the state of the monitored system while acquiring the state information of the monitored system at regular intervals, and uses the constructed analysis model to state the state of the monitored system which includes state information collection means 11, analysis model generation means 12, analysis means 13, state information storage means 14, and analysis model storage means 15.
  • Status information collection means 11 collects status information of the monitored system at regular intervals.
  • the time series data of the state information may be referred to as state series information.
  • the state information storage unit 14 stores the state information collected by the state information collection unit 11 in time series. In other words, the state information storage unit 14 stores the state information collected by the state information collection unit 11 as state series information.
  • the state information storage unit 14 may store information indicating the collection time and state information (more specifically, a collection of collected sensor values) in association with each other.
  • the state information may be, for example, information in which sensor values to be collected are arranged in a predetermined order.
  • the state information storage unit 14 of this embodiment has a storage area for storing state series information for at least a predetermined period.
  • the analysis model generation unit 12 generates an analysis model for analyzing the state of the monitored system based on the state series information for a predetermined period stored in the state information storage unit 14.
  • the analysis model of the present embodiment includes one or more multi-body correlation models, which are correlation models having a regression equation configured using three or more data items and an allowable range of prediction error of the regression equation. More specifically, the analysis model of the present embodiment is a set of correlation models composed of one or more many-body correlation models.
  • a model having at least a regression equation that defines a relationship between data items and an allowable range of a prediction error of the regression equation is called a correlation model, and a regression configured using two of the data items.
  • a correlation model including an equation is referred to as a “cross-correlation model”, and a correlation model including a regression equation configured using three or more data items is referred to as a “multi-body correlation model”.
  • a correlation model including a regression equation configured using three or more data items is referred to as a “multi-body correlation model”.
  • An arbitrary period that does not include a failure is set by the operator as the predetermined period of the state series information used for generating the analysis model. From the viewpoint of increasing the sensitivity of abnormality detection, it is preferable to set the period as short as possible so as not to be affected by the secular change of the monitored system. For example, if the maintenance cycle of the monitored system is one year, the predetermined period may be a period that is sufficiently shorter than that, such as one month, one week, or one day. At this time, it is preferable that the period includes an influence on the sensor value due to the factor that causes the largest change in the sensor values among the factors of the system state change that can normally occur.
  • the predetermined period may be a period such as 9 months or 1 year.
  • the analysis model storage unit 15 stores analysis model information that is information on the analysis model generated by the analysis model generation unit 12.
  • the analysis model information may be, for example, a set of model information for each of correlation models included in the analysis model (one or more multi-body correlation models in the present embodiment).
  • Model information includes, for example, an identifier of the correlation model, regression information of the correlation model (information of data items used as objective variables, information of data items used as explanatory variables, information of relational expressions between data items, etc. ) And information indicating an allowable range of the prediction error of the regression equation.
  • the model information may further include a degree of quality that is an index representing the quality of the regression equation.
  • the analysis unit 13 analyzes the state of the monitored system using the analysis model generated by the analysis model generation unit 12. As shown in FIG. 1, the analysis unit 13 includes a model destruction detection unit 131 and an abnormality determination unit 132.
  • the model destruction detection unit 131 predicts the regression equation of the correlation model for each correlation model included in the analysis model indicated by the analysis model information stored in the analysis model storage unit 15. Detects whether model destruction, a phenomenon in which the error exceeds the allowable range, has occurred.
  • the occurrence of such model destruction is referred to as a change in the sensor value that accompanies a change in the state of the system that can occur normally (hereinafter referred to simply as a normal change). It is used as an index indicating that a sensor value change unrelated to the change is included.
  • the model destruction detection unit 131 uses, for example, the correlation model for each correlation model included in the analysis model using the state series information including the latest state information stored in the state information storage unit 14 and the analysis model. Calculate the predicted value at least the latest time for the objective variable of the regression equation, calculate the prediction error that is the difference between the calculated predicted value of the objective variable and the actual sensor value, and allow the calculated prediction error The presence or absence of model destruction is detected by determining whether or not the range is satisfied. Further, the model destruction detection unit 131 outputs the model destruction detection result as model destruction information.
  • the model destruction information may be information indicating the model destruction status of each correlation model included in the analysis model, for example.
  • the model destruction information may be information that can identify a correlation model in which model destruction has occurred, or information that can identify a correlation model in which model destruction has not occurred.
  • the model destruction information includes information obtained from the correlation model in addition to or in place of information that can specify the correlation model (for example, information on data items included in the regression equation of the model, calculated prediction error, etc. ) May be included.
  • the information necessary for model destruction information depends on the alarm condition that is the condition for issuing an alarm.
  • the model destruction information is information that can specify the number of correlation models in which model destruction has occurred (for example, each of the models included in the analysis model). The presence or absence of model destruction of the correlation model, a set of identifiers of the correlation model in which the model destruction has occurred, and the like.
  • the model destruction information includes information indicating the superiority of the regression equation of the correlation model in which model destruction has occurred. It is only necessary to include information (such as a set of identifiers of correlation models in which model destruction has occurred) that can specify the superiority of the regression equation of the correlation model in which model destruction has occurred.
  • the abnormality determination unit 132 determines whether the model destruction status of the analysis model satisfies the alarm condition based on the model destruction information obtained from the model destruction detection unit 131. Moreover, if the alarm condition is satisfied as a result of the determination, the abnormality determination unit 132 determines that the state of the monitored system is abnormal, and notifies the operator and the monitored system of the determination result.
  • equation (1) can be used as the alarm condition.
  • Na is the number of correlation models in which model destruction has occurred among the correlation models included in the analysis model.
  • the analysis model generation means 12 of this embodiment includes an analysis model candidate generation means 121 and a model extraction means 122 as shown in FIG.
  • the analysis model candidate generation unit 121 includes a data item classification unit 1211 and a many-body correlation model generation unit 1212.
  • the analysis model candidate generation unit 121 generates correlation model candidates used (included) in the analysis model.
  • the data item classification means 1211 classifies the data item group into one or more groups, and the many-body correlation model generation means 1212 uses one or more many-body correlation models based on the classified groups. Is generated.
  • the data item classification means 1211 classifies the data item group included in the state information into one or more groups. More specifically, the data item classification means 1211 includes, in at least one group after classification, a first data item that is one data item arbitrarily selected from the data items included in the group, and the first data item The degree of excellence of the regression equation configured using the second data item that is one of the data items excluding the first data item among the data items included in the same group as the data item was arbitrarily selected When the calculation is performed for all combinations of the second data items with respect to the first data item, the data items are classified so that at least one of the superiorities of the regression equations satisfies a predetermined excellent model condition.
  • the data item classification unit 1211 first uses the state series information for a predetermined period, and first sets the first provisional cross-correlation model for all combinations of two arbitrary data items in the data item group. And a second provisional cross-correlation model.
  • each of the first tentative cross-correlation model and the second tentative cross-correlation model has at least a regression equation configured using the two selected data items, and a superiority of the regression equation. It is a model including.
  • the objective variable data item (described later) and the explanatory variable data item (described later) of the regression formula are replaced with those of the first temporary cross-correlation model.
  • t represents an index of state information.
  • the state information index t is given a sequential integer whose value increases from the oldest to the newest.
  • N, K, and M are arbitrary integers.
  • Y (t) represents the value of the data item y when the index of the state information is t. Therefore, y (t ⁇ N) represents a past value corresponding to N sensor value collection intervals compared to y (t).
  • “...” In the expression (2) indicates that a term obtained by increasing the value subtracted from t by 1 from the left to the right is omitted.
  • y (t) with a hat on the left side of the first equal sign corresponds to the objective variable.
  • the objective variable is a predicted value of the data item y when the status information index is t.
  • y (t-1) to y (tN) and u (tK) to u (tKM) on the right side of the second equal sign correspond to explanatory variables.
  • the u sensor value is used.
  • the data item y used for the objective variable is defined as “object variable data item”
  • the data item u used only for the explanatory variable is defined as “explanatory variable data item”.
  • f (u, y) between the first equal sign and the second equal sign indicates that the regression equation is a function using two data items u and y.
  • Equation (2) The parameters a 1 to a N , b 0 to b M , c, K, N, and M of Equation (2) are determined so that the degree of superiority F of the regression equation is maximized.
  • the prediction accuracy of the regression equation as shown in the following equation (3) can be used.
  • Equation (3) y with a bar represents the average value of the objective variable during a predetermined period (between the state information index is 1 to N1) included in the state series information.
  • the superiority of the regression equation has two viewpoints: high prediction accuracy and low generalization error.
  • high prediction accuracy is an example of the superiority determined from the viewpoint of high prediction accuracy
  • an information criterion may be used. Note that the superiority of the regression equation may be a combination of these.
  • the parameters that maximize the degree of superiority F are determined as a 1 to a N , b 0 to b M , and c so that the degree of superiority F is maximized for the set of K, N, and M. It is determined by selecting a set of K, N, and M that has the highest degree of superiority F. Specifically, the data item classification means 1211 first sets the maximum values of K, N, and M, respectively, formulates a regression equation for each combination of K, N, and M values. On the other hand, the parameters a 1 to a N , b 0 to b M , and c are determined using the least square method so that the numerator of the second term of the above formula (3) is minimized.
  • the data item classifying means 1211 calculates the superiority F for each regression equation, and the regression equation parameters a 1 to a N , b 0 to b M , c, K, having the maximum superiority F are obtained. Select N, M. In this way, a desired regression equation can be obtained.
  • the operator may set an arbitrary value as the maximum value of K, N, and M.
  • the data item classification unit 1211 includes a first temporary cross-correlation model group that is a set of the first temporary cross-correlation models generated as described above and a second temporary cross-correlation model set that is the second temporary cross-correlation model.
  • the data item classifying means 1211 determines, for each set of two data items, the one having the higher F of the regression equation among the first temporary cross-correlation model and the second temporary cross-correlation model. Select as a correlation model and obtain a set of cross-correlation models as a set of all sets of cross-correlation models for any two data items so selected.
  • the data item classification unit 1211 selects a cross-correlation model that satisfies a predetermined good model condition in the regression formula of each cross-correlation model from the cross-correlation model group thus obtained. And obtain a group of excellent cross-correlation models that is a set of the extracted excellent cross-correlation models.
  • the operator can set an arbitrary value for the threshold value Fth for the superiority F of the regression equation.
  • the threshold value Fth is preferably set low.
  • the threshold F th is preferably set high.
  • the threshold value F th is preferably set high.
  • the threshold value F th is preferably set high. .
  • the threshold value F th is preferably a value from 0.7 to 1 in order to reduce false detections or accurately detect signs of failure. A value of .8 to 1 is more preferred.
  • the data item classification means 1211 constructs a graph structure of the extracted excellent cross-correlation model group.
  • the graph structure is represented as a network diagram with the data items included in the regression equation of the cross-correlation model as nodes and the regression equation as a line.
  • a graph structure in which three or more nodes are connected via a line is called a cluster.
  • the data item classification unit 1211 classifies the data items based on the graph structure of the excellent cross-correlation model group so that each of the clusters in the graph structure corresponds to a data item group that is a group of one data item. .
  • nodal points in the graph structure correspond to data items, and therefore, data items corresponding to nodal points in each cluster become data items included in each data item group.
  • data items not included in the cluster are excluded from the analysis model construction target.
  • the first data item that is one data item arbitrarily selected from the data items included in the classified data item group, and the same data item group as the first data item
  • the combinations with all the second data items are calculated, the data items are classified so that at least one of the superiorities of the regression equation satisfies the above-described excellent model condition.
  • the many-body correlation model generation unit 1212 selects at least one representative data item from the data items included in the group for each group of data items classified by the data item classification unit 1211 and is included in the group. For all combinations of any two data items excluding the representative data item among the data items, a regression equation including the two data items and the representative data item is constructed. In addition, the many-body correlation model generation unit 1212 calculates the tolerance of the prediction error of the constructed regression equation and the superiority of the regression equation, and calculates the constructed regression equation and the tolerance of the prediction error of the regression equation. A multi-body correlation model having at least is generated. Note that the many-body correlation model generation unit 1212 may generate a many-body correlation model including a regression equation, an allowable range of prediction error of the regression equation, and a superiority of the regression equation.
  • the many-body correlation model generation unit 1212 uses, for each data item group classified by the data item classification unit 1211, a regression equation configured by using a set of two arbitrary data items in the data item group. Representative data items are selected based on the superiority of the regression equation calculated for all. For example, for each data item group, the many-body correlation model generation unit 1212 calculates the superiority of the regression formula calculated for all of the regression formulas that are configured using a set of two arbitrary data items in the data item group. Then, a statistical value for each data item in the data item group may be calculated, and a representative data item in the data item group may be selected based on the calculated statistical value for each data item.
  • the many-body correlation model generation unit 1212 may select, for example, the one having the highest statistical value as the representative data item. Note that the number of representative data items is not necessarily one. In the case of selecting a plurality of representative data items, the many-body correlation model generation unit 1212 may select representative data items from a higher statistical value.
  • the many-body correlation model generation unit 1212 accumulates, for each data item, the degree of superiority of the regression equation of each cross-correlation model included in the cross-correlation model group generated by the data item classification unit 1211. For each of the data items belonging to the data item group, the data item having the highest cumulative value of the regression equation may be used as the representative data item.
  • the superiority of the regression equation of each cross-correlation model included in the cross-correlation model group is associated with the data item used for the objective variable and the data item used for the explanatory variable.
  • the degree of excellence of the regression equation is added to both data items.
  • the cumulative value of the superiority of the regression equation corresponds to the statistical value.
  • the regression equation shown in the following equation (5) can be used as the regression equation of the many-body correlation model.
  • K, N, M, L, P, Q, and S are arbitrary integers.
  • y (t) with a hat on the left side of the first equal sign corresponds to the objective variable.
  • the objective variable is a predicted value of the data item y when the status information index is t.
  • (TLQ) and w (tP) to w (tPS) correspond to explanatory variables.
  • the sensor value of u and the index of the data item x when the status information index is tP to tPQ, and the data value of the data item w when the index of the data item x and the status information index is tR to tRS Sensor values are used.
  • the data item y used for the objective variable is defined as “object variable data item”
  • the data items u, x, w is defined as “an explanatory variable data item”.
  • two data items (more specifically, the data item x and the data item w) among the four explanatory variable data items correspond to the “representative data item”.
  • the multi-body correlation model generation unit 1212 constructs a regression equation using arbitrary two data items and a representative data item
  • the multi-body correlation model generation unit 1212 calculates a regression equation using each of the two data items that are not representative data items as objective variables.
  • a multi-body corresponding one regression equation to any two data items excluding the representative data item A correlation model group is generated.
  • the parameters a 1 to a N , b 0 to b M , c, d 0 to d Q , e 0 to e S , K, L, N, M, P, Q, and S in Expression (5) are, for example, , PLS regression is used to determine the maximum degree F of the regression equation.
  • PLS regression is used to determine the maximum degree F of the regression equation.
  • the superiority F of the regression equation for example, a value of the prediction accuracy of the regression equation as shown in the above equation (3) can be used.
  • the parameters with the highest degree of superiority F are, for example, a 1 to a N , b 0 to so that the degree of superiority F is maximized with respect to a set of K, L, N, M, P, Q, and S.
  • b M , c, d 0 to d Q , e 0 to e S are determined, and then a set of K, L, N, M, P, Q, and S with the highest degree of superiority F is selected. Is done.
  • the many-body correlation model generation unit 1212 sets, for example, the maximum values of K, L, N, M, P, Q, and S, and sets K, L, N, M, P, Q, and S, respectively.
  • Regression formulas are formulated for each combination of values, and for each regression formula, parameters a 1 to a N , b 0 to b M , c, d 0 to d Q , e 0 to e Determine S.
  • the maximum value of the prediction error for the state series information used for generating the analysis model is from decrease to before increase. The number of components may be used.
  • the many-body correlation model generation unit 1212 calculates the superiority F for each regression equation, and the regression equation parameters a 1 to a N , b 0 to b M , c, having the maximum superiority F are obtained.
  • d 0 to d Q , e 0 to e S , K, L, N, M, P, Q, S are selected.
  • the operator may set an arbitrary value as the maximum value of K, L, N, M, P, Q, and S.
  • the many-body correlation model group obtained in this way is a candidate for a correlation model used as an analysis model.
  • a range in which both the following formulas (6) and (7) are satisfied can be used as the allowable range of the prediction error of the regression equation of the many-body correlation model.
  • T 1 is the upper threshold for the prediction error.
  • T 2 is a lower threshold for the prediction error.
  • R i is a prediction error at the i-th time of the objective variable calculated using the regression equation of the multi-body correlation model.
  • i represents a time identifier in the state series information. More specifically, i is a sequence number when status information from a certain reference time to the corresponding time is arranged in ascending or descending order. For example, it may represent the i-th time from the start of monitoring.
  • the allowable range of the prediction error of the regression equation of the many-body correlation model includes a prediction error calculated over the period of the state series information used to construct the regression equation (hereinafter referred to as a prediction error during the calculation period). .))
  • a prediction error during the calculation period a prediction error calculated over the period of the state series information used to construct the regression equation.
  • T 1 max ⁇
  • T 2 ⁇ T 1 (9)
  • max ⁇ is a function that outputs the maximum value from the input numerical values.
  • is an operator for extracting the absolute value of x.
  • N1 is the number of prediction errors calculated from the state series information using the regression equation of the many-body correlation model.
  • the average value of the prediction error is calculated using the standard deviation.
  • the value obtained by adding three times the T 1 a value obtained by subtracting three times the standard deviation from the average value of prediction errors may be T 2.
  • the model extraction unit 122 extracts a correlation model used for the analysis model from the correlation model candidates generated by the analysis model candidate generation unit 121.
  • the model extraction unit 122 selects each correlation model from the correlation model group generated by the analysis model candidate generation unit 121 (in this embodiment, the many-body correlation model group generated by the many-body correlation model generation unit 1212).
  • One or more many-body correlation models are extracted based on the superiority of the regression equation.
  • the model extraction unit 122 extracts, for example, a multi-body correlation model that satisfies a predetermined excellent model condition as an excellent multi-body correlation model from the many-body correlation model group generated by the many-body correlation model generation unit 1212 and extracted.
  • An excellent many-body correlation model group that is a set of excellent many-body correlation models may be used as the analysis model.
  • the model extraction unit 122 stores analysis model information including model information of each excellent multi-body correlation model extracted in the analysis model storage unit 15.
  • the above equation (4) can be used.
  • the operator can set an arbitrary value for the threshold value Fth for the superiority F of the regression equation. From the viewpoint of expanding the target range of abnormality detection, it is preferable to set the threshold value Fth low. From the viewpoint of reducing erroneous detection due to a system state change or the like, the threshold F th is preferably set high.
  • the threshold F th is preferably a value from 0.7 to 1. A value of 0.8 to 1 is more preferred.
  • the superiority of the same regression equation may be used.
  • both the cross-correlation model and the many-body correlation model use the prediction accuracy as the superiority F of the regression equation
  • the excellent model condition for the cross-correlation model is “F> 0.6”
  • the excellent model condition for the many-body correlation model is For example, “F> 0.7”.
  • the index of superiority and the excellentness of the same regression equation are used regardless of the number of representative data items included in the multi-body correlation model group to be extracted.
  • the model condition is used, an index of superiority and an excellent model condition of different regression equations may be used according to the number of representative data items included in the many-body correlation model group to be extracted.
  • the prediction accuracy is used as the F of the regression equation of the many-body correlation model regardless of the number of representative data items
  • the excellent model condition for the many-body correlation model is “F> 0.6 ⁇ (number of representative data items). -1/3 "and the like.
  • FIG. 2 is an explanatory view showing an example of a method for extracting an excellent cross-correlation model by the data item classification means 1211.
  • reference numeral 701A represents a cross-correlation model group from which the excellent cross-correlation model is extracted.
  • Reference numeral 701B represents the extracted excellent cross-correlation model group.
  • Reference numeral 701 ⁇ / b> C represents an excellent model condition used for extracting the excellent cross-correlation model of this example.
  • the “Item 1” and “Item 2” columns in the upper and lower tables of FIG. 2 represent the data items of the explanatory variables used in the regression equation of the cross correlation model.
  • the “Regulation equation” column represents a regression equation of the cross-correlation model.
  • each cross-correlation model included in the cross-correlation model group may include an allowable range of the prediction error of the regression equation, but the allowable range of the prediction error of the regression equation is not used for extracting the excellent cross-correlation model. This is omitted in the figure.
  • values that are not used for explanation may be omitted from the drawings.
  • the data item classification unit 1211 acquires state series information from the state information storage unit 14 and generates a cross-correlation model group 701A.
  • the cross-correlation model group 701A of this example is composed of five cross-correlation models.
  • the data item group included in the state series information used to generate the cross-correlation model group 701A of this example includes data item A, data item B, data item C, data item D, data item G, and data item H.
  • f j () is a function for calculating the predicted value of the objective variable data item from the data items contained in parentheses (where j is an integer that is an identifier for identifying the regression equation).
  • the explanatory variable of the function includes not only the value (sensor value) of the data item included in the state series information stored in the state information storage unit 14 but also the data item included in the parenthesis. It is also possible to use a conversion value calculated by using the past value.
  • the data item classification unit 1211 extracts a good cross-correlation model that satisfies the good model condition 701C from the cross-correlation model group 701A, and obtains a good cross-correlation model group 701B.
  • the excellent model condition 701C of this example is “regression excellence F> 0.6” as shown in FIG. For this reason, the data item classification unit 1211 extracts a cross-correlation model having a regression formula with a superiority F exceeding 0.6 among the five cross-correlation models constituting the cross-correlation model group 701A as an excellent cross-correlation model.
  • FIG. 3 is an explanatory diagram showing an example of a method for extracting an excellent many-body correlation model by the model extracting means 122.
  • reference numeral 702A represents a many-body correlation model group from which the excellent many-body correlation model is extracted.
  • Reference numeral 702B represents the extracted excellent multi-body correlation model group.
  • Reference numeral 702C represents an excellent model condition used for extracting the excellent many-body correlation model of this example.
  • the “Item 1” and “Item 2” columns in the upper and lower tables of FIG. 3 represent data items excluding the representative data items among the data items of the explanatory variables used in the regression equation of the many-body correlation model. ing.
  • the “Representative Item” column in the table represents representative data items used in the regression equation of the many-body correlation model.
  • the model extraction unit 122 acquires the many-body correlation model group 702A from the many-body correlation model generation unit 1212.
  • the many-body correlation model group 702A of this example is composed of two many-body correlation models.
  • the data item group included in the state series information used for generating the many-body correlation model group 702A of this example includes a data item A, a data item B, a data item C, and a data item D.
  • the model extraction unit 122 extracts a superior many-body correlation model that satisfies the excellent model condition 702C from the many-body correlation model group 702A, and obtains an excellent many-body correlation model group 702B.
  • the excellent model condition 702C of this example is “regression excellence F> 0.6” as shown in FIG.
  • the model extracting means 122 uses, as the excellent many-body correlation model, the many-body correlation model in which the degree of superiority F of the regression equation exceeds 0.6 among the two many-body correlation models constituting the many-body correlation model group 702A. Extract.
  • the graph structure of the cross-correlation model group and the many-body correlation model group in this embodiment will be described using a specific example.
  • the graph structure is constructed as an example of a directed graph in which an arrow is attached from the explanatory variable data item used in the regression equation of the correlation model included in the target model group to the target variable data item.
  • the graph structure may be constructed as an undirected graph in which no arrow is attached to the line between the nodes.
  • FIG. 4 is an explanatory diagram showing a construction example of the graph structure of the excellent cross-correlation model group 701B shown in FIG.
  • the data item classification unit 1211 converts the data items used in the regression equation of each excellent cross-correlation model included in the excellent cross-correlation model group 701 ⁇ / b> B, which is the target model group, to each nodule. Represented by a point.
  • the nodes, for each regression equation there is an arrow pointing from the explanatory variable data item (data item used only for the explanatory variable) to the objective variable data item (data item used for the objective variable).
  • the graph structure 701D is constructed by connecting with lines.
  • the data item classification means 1211 represents the data item A, the data item B, the data item C, and the data item D as nodal points, and an arrow between the nodal points from the data item A to the data item B is provided.
  • a line with an arrow from data item A to data item C, a line with an arrow from data item D to data item B, and a line with an arrow from data item D to data item C, and Structure 701D is obtained.
  • FIG. 4 shows an example in which one cluster remains, but a plurality of clusters may remain. In this example, since there is no mass that only two nodes are connected via a line, any node is valid. For example, only two nodes are connected via a line. If there is a mass, the mass is not recognized as a cluster, and the data item corresponding to the nodal point included therein is excluded from the analysis model construction target.
  • FIG. 5 is an explanatory diagram showing an example of a method for selecting representative data items.
  • the many-body correlation model generation unit 1212 generates a regression equation for each data item corresponding to the nodal point in the cluster.
  • the cumulative value of the degree of quality F is calculated. Specifically, for each cluster included in the graph structure 701D, for each data item corresponding to the node included in the cluster, the prominence F of the regression equation corresponding to the arrow connected to the node is accumulated. , Get the cumulative value.
  • the obtained cumulative value is set as a score 701E of the data item.
  • the data item having the maximum score 701E among the data items is set as the representative data item.
  • a representative data item may be selected at random.
  • the score 701E of each data item is 1.6, 1.7, 1.5 and 1.6 for data item A, data item B, data item C and data item D, respectively. It is. Therefore, data item B is selected as the representative data item.
  • the data item B is selected as the representative data item of the data item group including the data item A, the data item B, the data item C, and the data item D.
  • This example is an example in the case where there is only one cluster in the graph structure 701D of the excellent many-body correlation model group. However, when there are a plurality of clusters, the representative data item is obtained for each cluster by the same method. Is elected. According to the method of this example, for example, since the score can be calculated using the prediction accuracy as the superiority F of the regression equation as the weight of each regression equation, other data items can be predicted with the highest accuracy. Is selected as the representative data item. From another point of view, data items that can predict other data items with the highest accuracy behave in an average manner in data items that belong to the same cluster, so that other data items in the same cluster can be predicted with the highest accuracy. It is considered possible.
  • the predicted value can be obtained by separating the sensor value change accompanying the system state change from the sensor value change unrelated to the system state change. Since it is possible to construct a regression equation that can be calculated, it is possible to detect signs of failure that are buried in a change in the state of the system.
  • FIG. 6 is an explanatory diagram showing an example of a graph structure of an excellent cross-correlation model group having two or more clusters.
  • reference numeral 703B represents an excellent cross-correlation model group that is a construction target of the graph structure.
  • Reference numeral 703D represents the graph structure of the excellent cross-correlation model group 703B.
  • Reference numerals 703F1 and 703F2 represent clusters included in the graph structure 703D.
  • the data item classification means 1211 represents each data item used in the regression equation of each excellent cross-correlation model included in the excellent cross-correlation model group 703B by a nodal point, and between the nodal points, for each regression equation, A graph structure 703D is obtained by connecting the explanatory variable data item to the target variable data item with a line with an arrow.
  • the graph structure 703D of this example includes a cluster 703F1 composed of data item A, data item B, data item C, and data item D, and data item K, data item L, and data item M.
  • a cluster 703F2 composed of
  • FIG. 7 is an explanatory diagram showing an example of a method for selecting representative data items when there are two or more clusters in the graph structure of the excellent cross-correlation model group.
  • the many-body correlation model generation unit 1212 accumulates, for example, the excellentness F of the regression formula for each data item included in the cluster for each cluster. Calculate the value.
  • the superiority F of the regression equation corresponding to each arrow connected to the node included in the cluster is used as the data item used in the regression equation.
  • the process of accumulating is performed to obtain the accumulated value for each data item.
  • the obtained accumulated value is used as the score of the data item.
  • the score of each data item constituting the cluster 703F1 is indicated as 703E1
  • the score of each data item constituting the cluster 703F2 is indicated as 703E2.
  • the many-body correlation model generation unit 1212 sets, for each cluster, the data item having the maximum score among the data items constituting the cluster as the representative data item. When there are a plurality of data items having the maximum score in one cluster, for example, a representative data item may be selected at random from the data items.
  • the scores 703E1 of the data items constituting the cluster 703F1 are 1.6, 1.7, 1..., Respectively, for the data item A, the data item B, the data item C, and the data item D. 5 and 1.6.
  • data item B is selected as the representative data item of cluster 703F1.
  • the data item B is selected as the representative data item of the data item group including the data item A, the data item B, the data item C, and the data item D.
  • the scores 703E2 of the data items constituting the cluster 703F2 are 1.4, 0.7, and 0.7 for the data item K, the data item L, and the data item M, respectively. Therefore, the data item K is selected as the representative data item of the cluster 703F2.
  • the data item K is selected as the representative data item of the data item group including the data item K, the data item L, and the data item M.
  • the system analysis apparatus 100 may be a computer that includes a CPU and a storage medium that stores a program, and that operates under the control of the CPU based on the program.
  • the state information collection unit 11, the analysis model generation unit 12, and the analysis unit 13 are realized by a CPU that operates according to a program.
  • the state information storage unit 14 and the analysis model storage unit 15 are realized by a storage medium included in the computer. Note that the state information storage unit 14 and the analysis model storage unit 15 may be realized by individual storage media or may be realized by one storage medium.
  • FIG. 8 is a flowchart illustrating an example of the operation of the system analysis apparatus 100 according to the present embodiment.
  • the state information collection unit 11 of the system analysis apparatus 100 collects state information from the monitored apparatus 200 and stores it in the state information storage unit 14 (step S101).
  • the state information collection unit 11 repeats the operation of step S101 until a determination is made to end the operation (Yes in step S108).
  • the state information collecting unit 11 collects the state information at every predetermined cycle and stores the state information in the state information storage unit 14 while the operations in steps S102 to S107 are being performed.
  • step S102 if the current timing is the timing at which the analysis model is generated (Yes in step S102), the analysis model generation unit 12 acquires state series information for a predetermined period used for generation of the analysis model from the state information storage unit 14. Then, an analysis model is generated using the acquired state series information (step S103). On the other hand, if the current timing is not the timing for generating the analysis model (No in step S102), the process proceeds to step S104. Whether or not it is the timing for generating the analysis model may be determined based on, for example, whether or not a determination to generate the analysis model has been given.
  • step S104 the analysis unit 13 returns to step S101 if the determination that the target system is monitored using the current analysis model (Yes in step S104) is not given. On the other hand, if a determination is made to monitor the target system using the current analysis model (Yes in step S104), the process proceeds to step S105.
  • step S105 the model destruction detection unit 131 uses the state information newly collected by the state information collection unit 11 to use the model destruction of the analysis model indicated by the analysis model information stored in the analysis model storage unit 15. Detect the situation. More specifically, the model destruction detection unit 131 determines whether or not model destruction has occurred in each of the many-body correlation models included in the analysis model, and generates model destruction information indicating the result.
  • the abnormality determination unit 132 determines whether the model destruction status satisfies the alarm condition based on the model destruction information obtained from the model destruction detection unit 131. If the model destruction status satisfies the alarm condition (Yes in step S106), the abnormality determination unit 132 notifies the operator or the monitored system of the model destruction information indicating the determination result or the model destruction status (step S107). ), The process proceeds to step S108. On the other hand, if the state of model destruction does not satisfy the alarm condition (No in step S106), the abnormality determination unit 132 does not particularly do anything because no abnormality is detected in the system, and returns to step S101.
  • the system analysis apparatus 100 continues the above operation until a determination is made to end the operation (Yes in step S108).
  • FIG. 9 is a flowchart showing an example of the processing flow of the analysis model generation processing (step S103 in FIG. 8) by the analysis model generation means 12.
  • the data item classification unit 1211 acquires state series information for a predetermined period used for generation of the analysis model from the state information storage unit 14, and uses the acquired state series information to create a data item.
  • a cross-correlation model group is generated for classification (step S201).
  • the data item classification means 1211 extracts a good cross-correlation model from the generated cross-correlation model group based on a predetermined good model condition to obtain a good cross-correlation model group (step S202).
  • the data item classification means 1211 constructs a graph structure of the obtained excellent cross-correlation model group (step S203).
  • step S203 the data item classification unit 1211 classifies the data items based on the constructed graph structure.
  • the data item classification unit 1211 sets each cluster included in the graph structure as a data item group.
  • the many-body correlation model generation unit 1212 selects a representative data item for each data item group classified by the data item classification unit 1211 (step S204).
  • the many-body correlation model generation unit 1212 generates, for each data item group, the two data items and the representative data item for all combinations of any two data items belonging to the data item group excluding the representative data item.
  • a multi-body correlation model having at least a regression equation using and a prediction error tolerance of the regression equation is generated to obtain a multi-body correlation model group (step S205).
  • the model extracting means 122 extracts an excellent multi-body correlation model from the generated many-body correlation model group based on a predetermined excellent model condition to obtain an excellent cross-correlation model group (step S206).
  • the model extraction unit 122 stores the analysis model information in the analysis model storage unit 15 using the obtained excellent many-body correlation model group as an analysis model (step S207).
  • the system analysis apparatus 100 generates an analysis model that can detect an abnormality with high sensitivity even if the target system is complex or multi-collinearity exists between data items. Therefore, the system abnormality can be determined with high accuracy.
  • the reason is the six features of this embodiment.
  • the data item classification means 1211 generates a cross-correlation model group, selects a regression formula with a high degree of superiority from the regression formulas of the cross-correlation models included in the cross-correlation model group, and the regression formula
  • the data items are classified for each data item included in the.
  • a normal change in the system state such as the temperature, the load on the system, and the set value appears in the value of the data item.
  • the index that represents the superiority of the regression equation such as the prediction accuracy of the regression equation that uses it, is high, so the regression necessary to obtain the desired superiority
  • the number of data items included in the expression can be reduced. Since the number of data items included in the regression equation is small, it is possible to detect signs of failure that affect a small number of data items with high sensitivity. Furthermore, since the number of data items included in the regression equation is small, an effect that it is easier to identify the location where the abnormality has occurred can be obtained as compared with the case where the regression equation is constructed using many data items as explanatory variables.
  • a representative data item is determined, and as a regression equation of the correlation model to be included in the analysis model, the representative data item and the two data excluding the representative data item are included. It is that the regression formula containing the item is constructed.
  • a data item for representing an influence accompanying a change in the state of the system is added to the regression equation, an effect similar to that obtained by removing the influence accompanying a change in the state of the system from each data item can be obtained.
  • the regression equation constructed by the above method the predicted value can be calculated by separating the change in the value of the data item accompanying the change in the state of the system and the change in the value of the data item unique to the data item.
  • the prediction error can be calculated by paying attention to the fluctuations specific to the data item, so the data item due to the sign of failure that is buried in the change in the value of the data item due to the change in the system status only by monitoring the sensor value Even a change in the value of can be accurately detected.
  • the third is that at least the data item with the highest cumulative value of superiority is selected as the representative data item.
  • the data item with the highest cumulative value of the superiority to other data items is the data item belonging to the data item group. It is thought that the average effect of the state change appeared. Therefore, the representative data item selected by the above method is suitable as a data item for expressing the change of the sensor value accompanying the change in the state of the system, the change in the value of the data item accompanying the change in the state of the system, and the data This is useful for separating the change in the value of an item-specific data item.
  • the fifth reason is that a plurality of regression equations may be constructed for one type of objective variable in the analysis model.
  • the percentage of one regression equation that contributes to normal or abnormal judgment results for the system is small, so which data item is used as the objective variable. Can solve the problem that the judgment result of normal or abnormal system may differ.
  • the number of regression equations constructed for one type of objective variable is not limited to one, so that anomaly detection omission due to the limitation of the objective variable can be prevented.
  • the sixth point is that the selection of representative data items, objective variables, and explanatory variables is not specified in advance, and they are automatically determined appropriately based on the behavior of sensor values. Therefore, the logic related to selection of representative data items, objective variables, and explanatory variables is not affected by the complexity of the system. Therefore, it is possible to solve the problem that it becomes difficult to select appropriate objective variables and explanatory variables. In other words, even if the configuration or the like of the target system is complicated, appropriate target variables and explanatory variables can be selected, so that the state of the target system can be analyzed with high accuracy.
  • the system analysis apparatus 100 of the present embodiment has a feature that the accuracy of narrowing down data items that are abnormal factors is high.
  • the representative data items included in the regression equation are common, so the excellent generated from one data item group in the correlation model included in the analysis model Focusing on the many-body correlation model group, for example, the following determination can be made. For example, when most of the excellent many-body correlation model group is destroyed, it can be determined that there is a high possibility that the representative data item is a data item that is regarded as an abnormal factor. Conversely, when a small number of the excellent many-body correlation model group becomes model destroyed, it can be determined that there is a high possibility that the data items other than the representative data item are data items that are considered to be abnormal factors.
  • the representative data item needs to be selected from a data item group that is grouped for each similar data item that is affected by a change in the state of the system that appears in the value of the data item. Furthermore, it is preferable that the data item has an average influence of a change in the state of the system in the group.
  • the system analysis apparatus 100 can select the representative data item as such. Specifically, it is only necessary to select the data item having the highest cumulative value of the degree of superiority (prediction accuracy) in the data item group in which the highly related data item groups are collected.
  • the explanatory variable includes the past value of the objective variable (for example, Expression (2) or Expression (5)) is shown as an example of the regression equation of the correlation model. You may exclude past values of.
  • the value of the data item is used for the objective variable and the explanatory variable.
  • a value obtained by numerically converting the value of the data item may be used. Examples of values obtained by numerically converting data item values include a difference, a power, an average value of state series information in a predetermined time width, and the like.
  • each parameter determines each parameter so that the value of the prediction precision which is a superiority may become the maximum as an example of the generation method of the regression equation shown in Formula (2) or Formula (5)
  • Other degrees of excellence may be used accordingly.
  • each parameter is determined by using the reciprocal of the information criterion such as AIC (Akaike's Information Criterion) or BIC (Bayesian Information Criterion) as the superiority of the regression formula, Good.
  • the numerator of the second term of the formula (3) is the minimum
  • the method of determining the parameters a 1 to a N , b 0 to b M , and c using the least square method is shown, but is used in Lasso (least absolute shrinkage and selection operator), Ridge regression, etc. These loss parameters with regularization parameters may be used to determine these parameters so that the loss function with regularization parameters is minimized.
  • the representative data item may be an objective variable.
  • the representative data item may be an objective variable.
  • a composite value of the plurality of representative data items may be used as the objective variable.
  • these parameters may be determined using, for example, Wal's R criterion, Krzanowski's W criterion, Osten's F criterion, and the like.
  • parameters a 1 to a N , b 0 to b M , c, d 0 to d Q , e 0 to K, L, N, M, P, Q, and S are fixed.
  • PLS regression principal component regression
  • the representative data items may be increased until a predetermined number predetermined by the operator is satisfied, or the information amount criterion is predetermined.
  • the representative data items may be increased until the threshold is exceeded. A smaller number of representative data items for each data item group is desirable from the viewpoint of abnormality detection sensitivity and abnormality factor data items, and a larger number is desirable from the viewpoint of false alarm frequency.
  • one type of index which is the cumulative value of the superiority of the regression equation
  • a plurality of types of indices may be used.
  • an index called the cumulative value of the superiority of the regression equation and an indicator called the speed of appearance of the change point described later are used to indicate each index.
  • the example which the system analysis apparatus 100 monitors the state of a to-be-monitored system using one analysis model (analysis model which consists of a many-body correlation model group produced
  • a plurality of analysis models may be created using state series information having different collection periods. In such a case, the state of the monitored system may be monitored while switching a plurality of analysis models.
  • system analysis apparatus 100 monitors the state of the monitored system by using all regression equations included in the analysis model for detection of model destruction has been described. However, only a part of the analysis model is shown. It may be used to monitor the state of the monitored system (for example, only a part of the monitored devices 200).
  • condition such as “when the number of correlation models in which model destruction has occurred exceeds a predetermined number” has been shown as an example of the alarm condition.
  • a condition such as “when the cumulative value of the superiority of the regression equation of the model exceeds a predetermined value” may be used.
  • a condition such as “when the alarm threshold is exceeded for a predetermined period set in advance” may be set as the alarm condition.
  • all conditions based on the model destruction information can be set as the alarm condition.
  • the monitored system is a power plant
  • one or more multi-body correlation models can be generated from information indicating the state of the monitored system, and the generated one or more multi-body
  • the monitored system may be another system as long as it can be determined whether or not an abnormality has occurred due to model destruction of the correlation model.
  • the monitored system may be an IT system, a plant system, a structure, a transportation device, or the like.
  • the system analysis apparatus 100 generates an analysis model as a data item of data items included in information indicating the state of the system, and detects model destruction.
  • Embodiment 2 a second embodiment of the present invention will be described. This embodiment is the same as the first embodiment except for a method for selecting representative data items. For this reason, the same parts as those in the first embodiment are denoted by the same reference numerals, and description thereof is omitted.
  • each data item group a data item whose value changes earliest in time series, that is, a data item in which a change point appears first is selected as a representative data item.
  • the representative data items may be selected from the one where the information change point appears earlier.
  • the multi-body correlation model generation means 1212 of this embodiment first randomly selects one of the data items included in the data item group classified by the data item classification means 1211. Then, the selected data item is set as a reference data item, and the reference data item having the maximum cross-correlation coefficient between the reference data item and each of the other data items in the data item group Find the amount of time shift in between. The data item having the largest time shift amount toward the past is set as the representative data item of the data item group.
  • FIG. 10 is an explanatory diagram illustrating an example of a method for selecting representative data items in the present embodiment. Note that the example shown in FIG. 10 is an example in which representative data items are selected from one data item group generated as a result of grouping based on the graph structure 701D of the excellent cross-correlation model group 701B shown in FIG. It is.
  • the multi-body correlation model generation means 1212 first randomly selects one data item from the data items included in the data item group corresponding to each cluster of the generated graph structure.
  • the upper part of FIG. 10 shows the time series change of data item A, data item B, data item C, and data item D (schematic diagram of time series data) in the state series information used for generating the analysis model. ing.
  • data item A is selected as the reference data item.
  • the time shift amounts of the data item A, the data item B, the data item C, and the data item D with respect to the data item A which is the reference data item were 0, 3, 2, and ⁇ 1, respectively.
  • FIG. 10 shows the amount of time shift by shifting the other data items in the time direction under the condition that the cross-correlation function between the reference data item A and the other data items has the maximum value.
  • the unit of the time shift amount is one measurement time interval.
  • the time shift amount takes a positive value because the other data item is moved in the future, that is, on the right side of the page, the cross-correlation between the data item A which is the reference data item and the other data item. Indicates that the function has the maximum value.
  • the time shift amount takes a negative value when the other data item is moved in the past, that is, to the left side of the page, and the cross-correlation function between the data item A which is the reference data item and the other data item. Is the maximum value. Therefore, in this example, the data item having the maximum time shift amount is selected as the representative data item. In the example shown in FIG. 10, data item B is selected as the representative data item.
  • the time context since the time context is also taken into account, when the data items in one data item group are composed only of items having similar waveforms, it causes a change in the system state.
  • Data items can be extracted.
  • the change in the data item value due to the change in the system state and the data item value specific to the data item Since the change can be separated from the change, it is possible to detect a change in the value of the data item due to a failure sign that is buried in the change in the value of the data item accompanying a change in the state of the system only by monitoring the sensor value.
  • the past equation of the objective variable is not included in the regression equation of the temporary cross-correlation model, and the superiority of the regression equation is not included.
  • the data items in the group may be configured using only the data items used in the high regression equation.
  • Embodiment 3 a third embodiment of the present invention will be described.
  • This embodiment is different from the above-described embodiments in that not only a many-body correlation model but also a cross-correlation model is used as a correlation model of an analysis model.
  • a function that uses a cross-correlation model as an analysis model is added to the configuration of the first embodiment will be described as an example, but the function may be added to the second embodiment.
  • the same parts as those in the first embodiment are denoted by the same reference numerals, and description thereof is omitted.
  • FIG. 11 is a block diagram illustrating a configuration example of the system analysis apparatus 300 according to the present embodiment.
  • the system analysis apparatus 300 shown in FIG. 11 is different from the configuration of the system analysis apparatus 100 of the first embodiment shown in FIG. 1 in that the analysis model generation means 12 is an analysis model generation means 32.
  • the analysis model generation unit 32 includes an analysis model candidate generation unit 321 and a model extraction unit 322.
  • the analysis model candidate generation unit 321 includes a cross-correlation model generation unit 3213, a data item classification unit 1211, and a many-body correlation model generation unit 1212.
  • the point that the analysis model candidate generation unit 321 of the analysis model generation unit 32 further includes the cross-correlation model generation unit 3213 is different from the first embodiment.
  • the operation of the model extraction unit 322 is also different from that of the first embodiment.
  • the cross-correlation model generation unit 3213 generates a cross-correlation model that is a candidate for a correlation model to be included in the analysis model.
  • the cross-correlation model generation unit 3213 constructs a regression equation including any two data items for all combinations of the arbitrary two data items, and sets the allowable range of the prediction error of the regression equation. The degree of excellence of the regression equation is calculated, and a cross-correlation model including at least the constructed regression equation and the allowable range of the prediction error of the regression equation is generated.
  • the cross-correlation model generating unit 3213 may generate a cross-correlation model including the constructed regression equation, the allowable range of the prediction error of the regression equation, and the superiority of the regression equation.
  • the cross-correlation model generated by the cross-correlation model generation unit 3213 may be referred to as an analysis cross-correlation model.
  • a set of analysis cross-correlation models may be referred to as an analysis cross-correlation model group.
  • the cross-correlation model group generated by the data item classification unit 1211 of the first embodiment may be referred to as a cross-correlation model group for classification.
  • the data item classification means 1211 replaces the first temporary cross-correlation model with the objective variable data item and the explanatory variable data item in the first temporary cross-correlation model for any two data items.
  • the second provisional cross-correlation model having the higher F of the regression formula a classification cross-correlation model group corresponding to one regression formula for any two data items is obtained.
  • the cross-correlation model generation unit 3213 performs the same selection process. In other words, for any two data items, an analysis mutual expression in which one regression equation having a higher superiority among two regression equations in which the objective variable data item and the explanatory variable data item are interchanged is associated. A correlation model group is generated.
  • the model extraction unit 322 of the present embodiment has the following function. That is, the model extraction unit 322 extracts a cross-correlation model that satisfies a predetermined excellent model condition from among the cross-correlation model group for analysis generated by the cross-correlation model generation unit 3213, and extracts it as an excellent cross-correlation model for analysis.
  • the analyzed excellent cross-correlation model group is used as a correlation model included in the analysis model. Therefore, the analysis model of the present embodiment can include one or more cross-correlation models in addition to the one or more many-body correlation models.
  • the model extraction means 322 stores the information of the many-body correlation model and the cross correlation model, which are the correlation models included in the analysis model as a result of extraction, in the analysis model storage means 15 as analysis model information.
  • the cross-correlation model for analysis and the cross-correlation model for classification may be the same or different in the regression equation, the index of the superiority of the regression equation, and the excellent model condition.
  • the analytical cross-correlation model and the many-body correlation model may be the same or different in the calculation method of the allowable range of the prediction error of the regression equation, the index of the superiority of the regression equation, and the excellent model conditions. Also good. In either case, the one shown in the first embodiment can be used.
  • model destruction detection method for the cross-correlation model included in the analysis model is the same as that for the many-body correlation model. Accordingly, when new state information is collected, the model destruction detection unit 131 of the analysis unit 13 performs the first operation on each correlation model included in the analysis model indicated by the analysis model information stored in the analysis model storage unit 15. The presence or absence of model destruction may be detected by the same method as in the first embodiment.
  • FIG. 12 is a flowchart showing an example of the operation of the analysis model generation unit 32 of the present embodiment.
  • the same operations as those shown in FIG. 9 are denoted by the same reference numerals, and description thereof is omitted.
  • the cross correlation model generation unit 3213 stores state series information for a predetermined period used for generation of an analysis model as state information storage.
  • An analysis cross-correlation model group is generated using the state series information acquired from the means 14 (step S301).
  • the model extraction means 322 extracts an excellent analysis cross-correlation model from the generated analysis cross-correlation model group based on a predetermined excellent model condition, and obtains an excellent analysis cross-correlation model group (step S302).
  • the data item classification means 1211 and the many-body correlation model generation means 1212 cooperate to generate a many-body correlation model group (steps S201 to S205) in the same manner as in the first embodiment, and the model extraction means 322 extracts an excellent many-body correlation model from the generated many-body correlation model group based on a predetermined excellent model condition, and obtains an excellent many-body correlation model group (step S206).
  • the model extraction means 322 stores the analysis model stored as an analysis model by combining the excellent cross-correlation model group for analysis obtained in step S302 and the excellent multi-body correlation model group obtained in step S206.
  • the analysis model information is stored in the means 15 (step S303).
  • the cross-correlation model is used not only for grouping data items, but also as a correlation model for the analysis model, so the range of data items to be analyzed. Can be wider.
  • the data item classification unit 1211 uses the analysis cross correlation model group generated by the cross correlation model generation unit 3213 as it is.
  • the cross-correlation model group for classification may be used.
  • the excellent cross-correlation model group can be shared. That is, the analysis excellent cross-correlation model group may be used as it is as the classification excellent cross-correlation model group. In such a case, the processes in steps S201 to S202 in FIG. 12 are omitted.
  • Embodiment 4 FIG. Next, a fourth embodiment of the present invention will be described.
  • This embodiment is different from each of the above embodiments in that it includes a function of extracting an abnormality factor.
  • the said function is added to the structure of 3rd Embodiment is shown as an example, However, The said function may be added to 1st Embodiment or 2nd Embodiment.
  • the same parts as those of the third embodiment are denoted by the same reference numerals, and description thereof is omitted.
  • FIG. 13 is a block diagram illustrating a configuration example of the system analysis apparatus 400 of the present embodiment.
  • the system analysis apparatus 400 shown in FIG. 13 is different from the configuration of the system analysis apparatus 300 of the third embodiment shown in FIG. 11 in that the analysis means 13 is an analysis means 43.
  • the analysis unit 43 of this embodiment includes a model destruction detection unit 131, an abnormality determination unit 132, an abnormality factor extraction unit 433, and a model destruction storage unit 434.
  • the analysis unit 43 is different from the third embodiment in that the analysis unit 43 further includes an abnormality factor extraction unit 433 and a model destruction storage unit 434.
  • the model destruction storage unit 434 stores the model destruction information generated by the model destruction detection unit 131.
  • the registration processing of the model destruction information in the model destruction storage unit 434 may be performed, for example, when the abnormality determination unit 132 determines that the system state is abnormal.
  • the alarm condition for determining whether the system state is abnormal or normal can be the one shown in the first embodiment.
  • the abnormality factor extraction unit 433 calculates the degree of abnormality indicating the degree of abnormality for each data item from the newly added model destruction information. Then, at least one data item is extracted from the higher degree of abnormality, and each of the extracted data items is used as an abnormality factor candidate data item that is a candidate for an abnormality factor, and an abnormality factor candidate that is a set thereof The data item group is notified to the operator and the monitored system.
  • the operator can set an arbitrary number of data items to be included in the abnormal factor candidate data item group, that is, the number of abnormal factor candidate data items to be notified, for example, as the number of data items to be confirmed at the time of abnormality.
  • the number of abnormal cause candidate data items to be notified increases the possibility of finding the cause of the failure, and is preferable from the viewpoint of understanding the overall situation of the failure, and shortens the investigation time when a false alarm occurs From the point of view, the smaller the number, the better.
  • the degree of abnormality of the data item is a value obtained by accumulating the number of data items included in the regression equation of the correlation model in which the model destruction has occurred among the correlation models included in the analysis model, or model destruction. It is possible to use a ratio between a value obtained by accumulating the number of data items included in the regression equation of the correlation model generated and a value obtained by accumulating the number of data items included in the regression equation of the correlation model in which the model destruction has not occurred. .
  • the information necessary for the model destruction information in this embodiment depends on the alarm condition and the calculation method of the degree of abnormality of the data item. For example, if the alarm condition relates to the number of correlation models in which model destruction has occurred, information that can identify the number of correlation models in which model destruction has occurred may be included in the model destruction information. In addition, if the method for calculating the degree of abnormality of a data item uses a value obtained by accumulating the number of data items included in the regression equation in which model destruction has occurred for each data item, model destruction occurs in the model destruction information. Information indicating the data item used in the regression equation of the correlation model and information that can identify the correlation model in which the model destruction has occurred may be included.
  • the calculation method of the degree of abnormality of the data item is a value related to the number of data items included in the regression equation where the model destruction occurred (cumulative value etc.) and a data item included in the regression equation where the model destruction did not occur If a value using a value (cumulative value, etc.) related to the number of (for example, a ratio of these) is used, the model destruction information includes a regression equation in which model destruction has occurred and a regression equation in which model destruction has not occurred. Information that can be specified may be included.
  • FIG. 14 is a flowchart showing an example of the operation of the system analysis apparatus 400 of the present embodiment.
  • the same operations as those shown in FIG. 8 are denoted by the same reference numerals, and description thereof is omitted.
  • the abnormality determination unit 132 determines that the system state is abnormal in step S107, the fact or model destruction information is notified to the operator or the monitored system. At the same time, the model destruction information is stored in the model destruction storage means 434.
  • the abnormal factor extraction unit 433 extracts one or more abnormal factor candidate data items based on the model destruction information newly stored in the model destruction storage unit 434, and shows the extracted abnormal factor candidate data item group Information is notified to the operator or the monitored system (step S401).
  • the degree of abnormality of data items is the value obtained by accumulating the number of data items included in the regression equation of the correlation model in which the model destruction occurred among the correlation models included in the analysis model, and no model destruction occurred
  • the number of data items included in the regression equation of the correlation model is a ratio with the accumulated value.
  • FIG. 15 is an explanatory diagram illustrating an example of a method for extracting an abnormal factor candidate data item group.
  • the analysis model used by the system analysis apparatus 400 includes seven correlation models.
  • the upper part of FIG. 15 shows a graph structure of a correlation model group included in the analysis model (a structure diagram schematically showing a relationship between data items used in the correlation model group). In the graph structure, nodal points corresponding to common data items are not shown. Further, “common metric” in the figure represents a representative data item.
  • the operator or the monitored system can narrow down the cause of the abnormality based on the information notified from the system analysis apparatus 400.
  • the data item name is notified as information indicating the abnormal factor candidate data item group.
  • the data item to be confirmed is also notified. Is preferred because it is given priority.
  • FIG. 16 is a block diagram showing the main part of the system analysis apparatus according to the present invention. As shown in FIG. 16, the system analysis apparatus according to the present invention includes an analysis model generation means 51 as a main configuration.
  • the analysis model generation unit 51 analyzes the state of the target system using state information that is a set of information related to a plurality of types of data items of the target system. And a data item classification unit 511, a many-body correlation model generation unit 512, and a model extraction unit 513.
  • the analysis model is a multi-body correlation model that is a correlation model having at least a regression equation composed of three or more data items and an allowable range of prediction error of the regression equation. Including one or more.
  • the data item classification unit 511 classifies the data item group included in the state information into one or more groups. More specifically, the data item classification means 511 includes, in at least one group after classification, a first data item that is one data item arbitrarily selected from the data items included in the group, and the first data item The superiority of the regression equation constructed using the second data item that is one of the data items included in the same group as the first data item excluding the data item can be taken for the first data item. When the calculation is performed for all the combinations of the second data items, the data items are classified so that at least one of the superiorities of the regression equation satisfies a predetermined excellent model condition.
  • the many-body correlation model generation unit 512 (for example, the many-body correlation model generation unit 1212), for each group classified by the data item classification unit 511, at least one representative data item from the data items included in the group. And all combinations of any two data items included in the group excluding the selected representative data item are configured using the two data items and the representative data item.
  • a multi-body which constructs a regression equation calculates an allowable range of prediction error of the regression equation and an excellent degree of the regression equation, and has at least the constructed regression equation and an allowable range of prediction error of the regression equation Generate a correlation model.
  • the model extraction unit 513 (for example, the model extraction unit 122) is a multi-body correlation model in which the degree of regression is determined in advance from the many-body correlation model group generated by the many-body correlation model generation unit 512.
  • a many-body correlation model that satisfies the excellent model condition is extracted as a many-body correlation model included in the analysis model.
  • FIG. 17 is a block diagram showing another configuration example of the system analysis apparatus according to the present invention.
  • the system analysis apparatus according to the present invention may be configured as shown in FIG. 17, for example.
  • the system analysis apparatus shown in FIG. 17 includes an analysis model storage unit 52 and an analysis unit 53 in addition to the analysis model generation unit 51 described above.
  • the analysis model storage unit 52 (for example, the analysis model storage unit 15) stores information on the analysis model generated by the analysis model generation unit 51.
  • the analysis unit 53 (for example, the analysis unit 13 and the analysis unit 43) is a unit that analyzes the state of the system using the analysis model stored in the analysis model storage unit when new state information is acquired.
  • the model destruction detecting unit 531 and the abnormality determining unit 532 are included.
  • the model destruction detection unit 531 (for example, the model destruction detection unit 131) is included in the analysis model indicated by the analysis model information stored in the analysis model storage unit using the newly collected state information. For each correlation model, the presence or absence of model destruction, which is a phenomenon in which the predicted value of the objective variable of the regression equation of the correlation model exceeds the allowable range of the prediction error of the regression equation of the correlation model, is detected.
  • the abnormality determination unit 532 determines whether the system state is abnormal or normal based on the detection result by the model destruction detection unit 531.
  • An analysis model generating unit that generates an analysis model for analyzing the state of the target system by using state information that is a set of information on a plurality of types of data items of the target system.
  • One or more multi-body correlation models which are correlation models having at least a regression equation configured using two or more data items and an allowable range of prediction error of the regression equation
  • the analysis model generation means includes state information Data item classifying means for classifying the data item group included in one or more groups, and at least one representative data item from among the data items included in the group for each group classified by the data item classifying means All combinations for any two data items included in the group excluding the selected representative data item A regression equation composed of the two data items and the representative data item is calculated, and an allowable range of the prediction error of the regression equation and a superiority of the regression equation are calculated and constructed.
  • a multi-body correlation model generating means for generating a multi-body correlation model having at least a regression equation obtained and an allowable range of a prediction error of the regression formula, and a multi-body correlation model group generated by the multi-body correlation model generating means
  • a model extracting means for extracting a multi-body correlation model satisfying the pre-requisite condition of the multi-body correlation model for which the degree of excellence of the regression equation is predetermined as a multi-body correlation model to be included in the analysis model, and data items
  • the classification means includes a first data item that is one data item arbitrarily selected from the data items included in the group in at least one group after classification, and the first data item For the first data item, the superiority of the regression equation constructed using the second data item that is one of the data items included in the same group as the first data item excluding the data item is taken.
  • An analysis model generation device characterized by classifying data items such that at least one of the superiorities of the regression equation satisfies a predetermined excellent model condition when calculated for all possible
  • the data item group contained in the status information which is a collection of the information regarding the multiple types of data items of the target system is arbitrarily selected from the data items included in the group in at least one group after classification. Constructed using a first data item that is one selected data item and a second data item that is one of the data items included in the same group as the first data item excluding the first data item.
  • the superiority of the regression equation is calculated for all combinations of the second data items that can be taken with respect to the first data item, at least one of the superiorities of the regression equation satisfies the predetermined excellent model condition
  • An analysis model generation program for executing a multi-body correlation model generation process for generating a multi-body correlation model having at least an allowable range of prediction error of an expression.
  • the present invention can be suitably applied to the detection of system faults and fault signs and the extraction of those factors.

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Automation & Control Theory (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Hardware Design (AREA)
  • Evolutionary Computation (AREA)
  • Geometry (AREA)
  • General Engineering & Computer Science (AREA)
  • Testing And Monitoring For Control Systems (AREA)

Abstract

システム分析装置(100)は、対象システムの複数種のデータ項目を、任意の2つのデータ項目を用いて構成される回帰式の優良度に基づいて、1つ以上のグループに分類するデータ項目分類手段(1211)と、分類された前記グループごとに、代表データ項目を選出し、当該グループに含まれる2つのデータ項目の組のいずれかと、前記代表データ項目とを用いて構成される回帰式と、該回帰式の予測誤差の許容範囲とを少なくとも含む多体相関モデルを生成する多体相関モデル生成手段(1212)と、生成された多体相関モデル群の中から、回帰式の優良度に基づいて、1つ以上の多体相関モデルを抽出するモデル抽出手段(122)とを有する分析モデル生成手段(12)を備える。

Description

[規則37.2に基づきISAが決定した発明の名称] システム分析装置、分析モデル生成方法、システム分析方法およびシステム分析プログラム
 本発明は、システムの状態を分析するシステム分析装置、分析モデル生成方法、システム分析方法およびシステム分析プログラムに関する。
 システムを安全かつ効率的に運用する目的で、システムの構成要素から得られるセンサ値に基づいて、システムの状態を分析する処理が行われている。
 システムは、例えば、ICT(Information and Communication Technology)システム、化学プラント、発電所、動力設備等、相互に影響を及ぼしあう要素から構成される、まとまりや仕組みである。
 また、センサ値は、システムの構成要素から得られる各種の値であり、例えば、システムの構成要素に設けられたセンサを通して取得される、弁の開度、液面高さ、温度、流量、圧力、電流、電圧等の計測値や、そのような計測値を用いて算出される予測値や、システムを所望の稼働状態に変更するために用いられる情報処理装置が発する制御信号の値などである。以下、本発明において、システムの構成要素から得られる各種の値を、その種別を区別することなく、単にセンサ値と呼ぶ。
 システム分析方法の多くは、このようなセンサ値を利用して、システムの状態が正常か異常かを判定する。例えば、対象システムの構成要素から得られるセンサ値に対して、それぞれ上限および下限の一方または両方を閾値として設定し、それぞれのセンサ値がその閾値を超えたか否かの判定結果に基づいて、システムの状態が正常か異常かを判定する方法が広く用いられている。また、システム分析方法は、さらに、所定のいくつかのセンサ値が閾値を超えたときに故障している設備を特定する方法を備えることもある。以下、このようなセンサ値そのものに基づいて、システムの状態が正常か異常かを判定したり、故障箇所を特定する方法を、第1の方法という。
 第1の方法には、気温やシステムの負荷、設定値などの内的要因または外的要因によるシステムの状態変化を、システムの異常と誤検知する問題があった。また、そのような誤検知を避けるために閾値を緩く設定した場合には、設備の故障や操作ミスなど本来検知すべきシステムの異常を検知できず、システムやその周辺に深刻な被害をもたらす可能性が生じる問題があった。
 システム分析方法の他の例として、システムの構成要素から得られるセンサ値に対して回帰分析を行い、その結果得られる他のセンサ値の予測値と実際に得られたセンサ値との差に基づいて、システムの状態が正常か異常かを判定する方法がある。以下、このようなセンサ値に対する回帰分析を利用してシステムの状態が正常か異常かを判定する方法を、第2の方法という。
 第2の方法によれば、システムの状態変化の様子(どのように変化したか)に合わせて予測値を算出することができるため、センサ値そのものに基づいてシステムの状態を正常か異常かを判定する第1の方法に比べて、誤検知を抑えながら、異常検知の感度を高めることができる可能性が高い。
 ただし、回帰分析を用いる場合には、多重共線性現象(Multiplecollinearity)を回避する必要がある。多重共線性現象は、回帰分析において、連動する複数のデータ項目を説明変数に含んだ場合、計算不可能問題や精度不足を引き起こす現象である。本発明では、「データ項目」を、システムの構成要素から得られる複数種のセンサ値の各種目に対応させており、該当する種目に対応するセンサ値の集合を表すもの、もしくは該当する種目に対応するセンサ値を識別する識別情報を表すものとして用いている。システムを構成する機器などの要素は、情報処理や、化学製品の生産、エネルギー変換等のシステムの目的を達成するために、他の要素と連動して動作する。よって、システムの構成要素から得られるセンサ値も同様に、他のセンサ値と連動して変化することが考えられる。このようなセンサ値に対して回帰分析を用いた場合、上述した多重共線性現象が発生する可能性が高い。
 回帰分析における多重共線性現象を回避する技術に関して、例えば特許文献1には、製造品質を予測するための回帰式を構築する方法の例として、PLS(Partial Least Square:部分最小二乗法)を用いることによって、一つの回帰式の説明変数として、連動する複数のデータ項目を含んだ状態で、多重共線性現象を回避して回帰式を構築する方法が記載されている。
 また、特許文献2には、特許文献1と同様にPLSを用いて、プラントの異常を検知するための回帰式のパラメータを決定する方法が記載されている。
 また、特許文献3には、ヒートポンプ熱交換器の異常を検知するための回帰式を構築する方法の例として、一つの回帰式に含まれる説明変数から、相関関係の強いデータ項目を除外することにより、多重共線性現象を回避して回帰式を構築する方法が記載されている。
 また、特許文献4には、データ項目を目的変数用、説明変数用かつ独立性、または説明変数用かつ共線性という3種に分類し、一つの回帰式では説明変数用かつ共線性に分類されるデータ項目が一つしか入らないようにすることで、多重共線性現象を回避して、回帰式を構築する方法が記載されている。
特開2010-218187号公報 特開2006-350698号公報 特開2003-314933号公報 特許第5108116号公報
 設備の故障、操作ミスなどによるシステム停止や事故を回避するためには、そのような障害が発生する兆候となるシステムの状態異常をできる限り早く発見する必要がある。しかし、センサ値そのものを利用してシステムの状態が正常か異常かを判定する第1の方法では、精度良く障害の兆候となるシステムの状態異常を発見できない。これは、障害の兆候となるような何らかの異常に伴うセンサ値の変化が、気温の変化やシステムの負荷の変化、設定値の変更といった通常起こりうるシステムの状態変化に伴うセンサ値の変化に埋もれてしまい、異常の伴うセンサ値の変化だけを精度よく抽出することができないためである。システムの状態が正常でセンサ値が大きく変化するようなシステムの場合、上記問題は特に顕著である。
 回帰分析を利用してシステムの状態が正常か異常かを判定する第2の方法であれば、センサ値そのものに基づいてシステムの状態が正常か異常かを判定する第1の方法に比べて、誤検知を抑えながら、異常検知の感度を高めることができる可能性が高い。
 しかし、上述したように、システムの構成要素から得られる各センサ値は、他のセンサ値と連動して変化することが多く、多重共線性現象が発生する可能性が高い。したがって、第2の方法を用いる場合には、通常起こりうるシステムの状態変化に伴うセンサ値の変化と、そのようなセンサ値の変化とは無関係なセンサ値の変化とを上手く切り分けられるように、互いに関連性の高いセンサ値の種別に対応する複数のデータ項目を用いつつも、多重共線性現象を回避できる回帰式を構築する必要がある。
 特許文献1,2に記載された方法は、複数のデータ項目を説明変数に用い、その説明変数を合成して得られる潜在変数と目的変数とを用いて回帰式を構築している。しかし、単に複数のデータ項目を説明変数に用いるだけでは、回帰式によって算出される目的変数の予測値にほとんど寄与しないデータ項目が説明変数の中に含まれることがある。そのような場合、少数のデータ項目に影響が現れる異常(より具体的には、異常に伴うセンサ値の変化)を感度良く検知できないという問題があった。
 また、特許文献3に記載された方法は、相関関係の強いデータ項目を除外するため、除外されたデータ項目に現れる異常を検知できないという問題があった。
 また、特許文献4に記載された方法は、あらかじめデータ項目を目的変数用と説明変数用とに分けるため、どのデータ項目が目的変数用に選択されるかで、システムの状態に対する正常か異常かの判定結果が異なるという問題があった。例えば、異常による影響が、目的変数としたデータ項目間または説明変数としたデータ項目間のセンサ値の差異となって現れたとしても、目的変数としたデータ項目と説明変数としたデータ項目間にはセンサ値の差異として現れない場合には、異常を検知できず、システムに何らかの異常が発生しているにも関わらず、システムの状態を正常と判定してしまう。
 さらに、説明変数間の共線性が、通常起こりうるシステムの状態変化に伴うセンサ値の変化によるものであり、異常に伴うセンサ値の変化が説明変数間に共線性がある説明変数間のみに現れる場合、そのようなセンサ値の変化を異常として検知できないことがある。これは、回帰式の説明変数に、説明変数用かつ共線性に分類されたデータ項目が1つしか含まれないために、センサ値の実際の変化から、通常起こりうるシステムの状態変化に伴うセンサ値の変化を除去して、システムの状態変化とは無関係なセンサ値の変化(異常の可能性のあるセンサ値の変化)を抽出できないためである。センサ値の実際の変化からシステムの状態変化に伴うセンサ値の変化を除去して、システムの状態変化とは無関係なセンサ値の変化を抽出するためには、回帰式の説明変数に、説明変数用かつ共線性に分類されたデータ項目が少なくとも2つ以上含まれる必要がある。
 さらに、特許文献1~4に記載された方法では、システムの規模が大きくなり、複雑になった場合に、適切な目的変数および説明変数の選択が難しくなるという問題があった。それは、構造が複雑なシステムでは、気温の変化やシステムの負荷の変化、設定値の変更といった個々の内的要因または外的要因の変化がシステムの状態を示す各センサ値の変化に影響を及ぼす範囲を把握することが難しくなり、目的変数および説明変数に設定すべきデータ項目の絞り込みが難しくなるためである。
 そこで、本発明は、対象システムが複雑であったり、データ項目間に多重共線性があったりしても、精度よく対象システムの状態を分析できるシステム分析装置、分析モデル生成方法、システム分析方法およびシステム分析プログラムを提供することを目的とする。ここで、システムの状態を分析できるとは、少なくともシステムの状態が異常か正常かを判定できることをいう。
 本発明によるシステム分析装置は、対象システムの複数種のデータ項目に関する情報の集合である状態情報を用いて、対象システムの状態を分析するための分析モデルを生成する分析モデル生成手段を備え、分析モデルは、3つ以上のデータ項目を用いて構成される回帰式と、当該回帰式の予測誤差の許容範囲とを少なくとも有する相関モデルである多体相関モデルを1つ以上含み、分析モデル生成手段は、状態情報に含まれるデータ項目群を1つ以上のグループに分類するデータ項目分類手段と、データ項目分類手段によって分類されたグループごとに、該グループに含まれるデータ項目の中から、少なくとも1つの代表データ項目を選出し、選出した代表データ項目を除く該グループに含まれるデータ項目のうちの任意の2つのデータ項目に対する全ての組み合わせについて、当該2つのデータ項目と、代表データ項目とを用いて構成される回帰式を構築するとともに、該回帰式の予測誤差の許容範囲と、該回帰式の優良度とを算出し、構築した回帰式と、該回帰式の予測誤差の許容範囲とを少なくとも有する多体相関モデルを生成する多体相関モデル生成手段と、多体相関モデル生成手段によって生成された多体相関モデル群の中から、回帰式の優良度が予め定められている多体相関モデルの優良モデル条件を満たす多体相関モデルを、分析モデルに含ませる多体相関モデルとして抽出するモデル抽出手段とを含み、データ項目分類手段は、分類後の少なくとも1つのグループにおいて、当該グループに含まれるデータ項目から任意に選択された1つのデータ項目である第1データ項目と、該第1データ項目を除く該第1データ項目と同一のグループに含まれるデータ項目の1つである第2データ項目とを用いて構築される回帰式の優良度を、第1データ項目に対して取りうる第2データ項目の全ての組み合わせについて算出したとき、該回帰式の優良度の少なくとも1つが、所定の優良モデル条件を満たすように、データ項目を分類することを特徴とする。
 また、本発明による分析モデル生成方法は、対象システムの複数種のデータ項目に関する情報の集合である状態情報を用いて、対象システムの状態を分析するための分析モデルを生成する分析モデル生成方法であって、データ項目分類手段が、状態情報に含まれるデータ項目群を、分類後の少なくとも1つのグループにおいて、当該グループに含まれるデータ項目から任意に選択された1つのデータ項目である第1データ項目と、該第1データ項目を除く該第1データ項目と同一のグループに含まれるデータ項目の1つである第2データ項目とを用いて構築される回帰式の優良度を、第1データ項目に対して取りうる第2データ項目の全ての組み合わせについて算出したとき、該回帰式の優良度の少なくとも1つが、所定の優良モデル条件を満たすように、1つ以上のグループに分類し、多体相関モデル生成手段が、状態情報を用いて、分類されたグループごとに、該グループに含まれるデータ項目の中から、少なくとも1つの代表データ項目を選出し、選出した代表データ項目を除く該グループに含まれるデータ項目のうちの任意の2つのデータ項目に対する全ての組み合わせについて、当該2つのデータ項目と、代表データ項目とを用いて構成される回帰式を構築するとともに、該回帰式の予測誤差の許容範囲と、該回帰式の優良度とを算出して、構築した回帰式と、該回帰式の予測誤差の許容範囲とを少なくとも有する多体相関モデルを生成し、モデル抽出手段が、生成された多体相関モデル群の中から、回帰式の優良度が予め定められている多体相関モデルの優良モデル条件を満たす多体相関モデルを、分析モデルに含ませる多体相関モデルとして抽出することを特徴とする。
 また、本発明によるシステム分析方法は、データ項目分類手段が、対象システムの複数種のデータ項目に関する情報の集合である状態情報に含まれるデータ項目群を、分類後の少なくとも1つのグループにおいて、当該グループに含まれるデータ項目から任意に選択された1つのデータ項目である第1データ項目と、該第1データ項目を除く該第1データ項目と同一のグループに含まれるデータ項目の1つである第2データ項目とを用いて構築される回帰式の優良度を、第1データ項目に対して取りうる第2データ項目の全ての組み合わせについて算出したとき、該回帰式の優良度の少なくとも1つが、所定の優良モデル条件を満たすように、1つ以上のグループに分類し、多体相関モデル生成手段が、状態情報を用いて、分類されたグループごとに、該グループに含まれるデータ項目の中から、少なくとも1つの代表データ項目を選出し、選出した代表データ項目を除く該グループに含まれるデータ項目のうちの任意の2つのデータ項目に対する全ての組み合わせについて、当該2つのデータ項目と、代表データ項目とを用いて構成される回帰式を構築するとともに、該回帰式の予測誤差の許容範囲と、該回帰式の優良度とを算出して、構築した回帰式と、該回帰式の予測誤差の許容範囲とを少なくとも有する多体相関モデルを生成し、
 モデル抽出手段が、生成された多体相関モデル群の中から、回帰式の優良度が予め定められている多体相関モデルの優良モデル条件を満たす多体相関モデルを、分析モデルに含ませる多体相関モデルとして抽出し、抽出された多体相関モデル群を含む分析モデルの情報を所定の記憶装置に記憶し、モデル破壊検出手段が、状態情報が新たに取得されると、新たに収集された状態情報を用いて、所定の記憶装置に記憶されている分析モデルの情報により示される分析モデルに含まれる各相関モデルについて、当該相関モデルの回帰式の目的変数の予測値が、当該相関モデルの回帰式の予測誤差の許容範囲を超える現象であるモデル破壊の発生の有無を検出し、異常判定手段が、モデル破壊検出手段による検出結果に基づいて、システムの状態が異常か正常かを判定することを特徴とする。
 また、本発明によるシステム分析プログラムは、コンピュータに、対象システムの複数種のデータ項目に関する情報の集合である状態情報に含まれるデータ項目群を、分類後の少なくとも1つのグループにおいて、当該グループに含まれるデータ項目から任意に選択された1つのデータ項目である第1データ項目と、該第1データ項目を除く該第1データ項目と同一のグループに含まれるデータ項目の1つである第2データ項目とを用いて構築される回帰式の優良度を、第1データ項目に対して取りうる第2データ項目の全ての組み合わせについて算出したとき、該回帰式の優良度の少なくとも1つが、所定の優良モデル条件を満たすように、1つ以上のグループに分類するデータ項目分類処理、状態情報を用いて、分類されたグループごとに、該グループに含まれるデータ項目の中から、少なくとも1つの代表データ項目を選出し、選出した代表データ項目を除く該グループに含まれるデータ項目のうちの任意の2つのデータ項目に対する全ての組み合わせについて、当該2つのデータ項目と、代表データ項目とを用いて構成される回帰式を構築するとともに、該回帰式の予測誤差の許容範囲と、該回帰式の優良度とを算出して、構築した回帰式と、該回帰式の予測誤差の許容範囲とを少なくとも有する多体相関モデルを生成する多体相関モデル生成処理、生成された多体相関モデル群の中から、回帰式の優良度が予め定められている多体相関モデルの優良モデル条件を満たす多体相関モデルを、分析モデルに含ませる多体相関モデルとして抽出するモデル抽出処理、抽出された多体相関モデル群を含む分析モデルの情報を、所定の記憶装置に記憶する処理、状態情報が新たに取得されると、新たに収集された状態情報を用いて、所定の記憶装置に記憶されている分析モデルの情報により示される分析モデルに含まれる各相関モデルについて、当該相関モデルの回帰式の目的変数の予測値が、当該相関モデルの回帰式の予測誤差の許容範囲を超える現象であるモデル破壊の発生の有無を検出するモデル破壊検出処理、およびモデル破壊検出処理での検出結果に基づいて、システムの状態が異常か正常かを判定する異常判定処理を実行させることを特徴とする。
 本発明によれば、対象システムが複雑であったり、データ項目間に多重共線性があったりしても、精度よく対象システムの状態を分析できる。
第1の実施形態のシステム分析装置100の構成例を示すブロック図である。 データ項目分類手段1211による優良相互相関モデルの抽出方法の一例を示す説明図である。 モデル抽出手段122による優良多体相関モデルの抽出方法の一例を示す説明図である。 優良相互相関モデル群のグラフ構造の構築例を示す説明図である。 代表データ項目の選出方法の一例を示す説明図である。 2つ以上のクラスタを有する優良相互相関モデル群のグラフ構造の例を示す説明図である。 優良相互相関モデル群のグラフ構造に2つ以上のクラスタがある場合の代表データ項目の選出方法の例を示す説明図である。 第1の実施形態のシステム分析装置100の動作の一例を示すフローチャートである。 分析モデル生成手段12による分析モデルの生成処理の処理フローの一例を示すフローチャートである。 第2の実施形態における代表データ項目の選出方法の一例を示す説明図である。 第3の実施形態のシステム分析装置300の構成例を示すブロック図である。 第3の実施形態の分析モデル生成手段32の動作の一例を示すフローチャートである。 第4の実施形態のシステム分析装置400の構成例を示すブロック図である。 第4の実施形態のシステム分析装置400の動作の一例を示すフローチャートである。 異常要因候補データ項目群の抽出方法の一例を示す説明図である。 本発明によるシステム分析装置の主要部を示すブロック図である。 本発明によるシステム分析装置の他の構成例を示すブロック図である。
実施形態1.
 以下、本発明の実施形態を図面を参照して説明する。以下の各実施形態では、発電プラントシステムの異常検知に本発明のシステム分析装置を適用した場合を例に用いて説明する。
 図1は、第1の実施形態のシステム分析装置100の構成例を示すブロック図である。図1に示すように、本実施形態のシステム分析装置100は、1つ以上の被監視装置200を含む被監視システムと接続される。被監視装置200は、発電プラントシステムを構成する構成要素としての装置やサブシステムであって、例えば、タービン、給水加熱器、復水器などである。また、被監視装置200には、例えば、配管や信号線など、装置間を接続する要素も含まれる。本実施形態では、被監視システムとして、発電プラントシステムのようにシステム全体を想定するが、被監視システムは、あるシステムの一部であってもよい。すなわち、被監視システムを、タービン、給水加熱器、復水器といった、あるシステムが実現する機能を実現するための構成要素に限定してもよい。
 被監視装置200の各々は、当該被監視装置200で得られるセンサ値を所定周期毎に計測し、システム分析装置100に送信する。本明細書では、通常の計測機器のようにハードウェアとしての実態があるものだけではなく、ソフトセンサや、制御信号もセンサと呼ぶこととする。センサ値はセンサから得られる値である。センサ値の例としては、弁の開度、液面高さ、温度、流量、圧力、電流、電圧等設備に設置された計測機器によって計測される計測値や、該計測値から算出される予測値や、制御信号の値が挙げられる。本実施形態において、各センサ値は、整数や小数といった数値で表されるものとする。
 また、本実施形態では、各被監視装置200から得られるセンサ値に対応するセンサごとに1つのデータ項目が割り当てられる。また、各被監視装置200から同一と見なされるタイミングで収集されたセンサ値の集合を状態情報と呼び、状態情報に含まれるセンサ値に対応するデータ項目の集合を、データ項目群と呼ぶ。ここで、同一と見なされるタイミングで収集されたものの中には、各被監視装置200で同一時刻に計測され、システム分析装置100に送信されたものに限らず、所定範囲内の時刻差の時刻に計測され、システム分析装置100に送信されたものや、システム分析装置100が一連の収集処理によって各被監視装置200から収集したものなども含まれる。また、図示省略しているが、被監視装置200とシステム分析装置100との間に、被監視装置200が取得したセンサ値を記憶する装置、例えば、データサーバや、DCS(Distributed Control System)や、プロセスコンピュータを備えていてもよい。そのような場合には、被監視装置200が任意のタイミングでセンサ値を取得して記憶装置に記憶させ、システム分析装置100が記憶装置に記憶されているセンサ値を所定周期毎に読み出してもよい。
 システム分析装置100は、被監視システムの状態情報を一定間隔で取得しながら、被監視システムの状態を分析するための分析モデルを構築し、また、構築した分析モデルを用いて被監視システムの状態を分析する装置であって、状態情報収集手段11と、分析モデル生成手段12と、分析手段13と、状態情報記憶手段14と、分析モデル記憶手段15とを含む。
 状態情報収集手段11は、被監視システムの状態情報を一定周期毎に収集する。以下、状態情報の時系列データを、状態系列情報という場合がある。
 状態情報記憶手段14は、状態情報収集手段11が収集した状態情報を時系列に沿って記憶する。換言すると、状態情報記憶手段14は、状態情報収集手段11が収集した状態情報を、状態系列情報として記憶する。状態情報記憶手段14は、例えば、収集時間を示す情報と、状態情報(より具体的には、収集されたセンサ値の集合)とを対応づけて記憶してもよい。状態情報は、例えば、収集対象とされたセンサ値が所定の順序で並んだ情報であってもよい。本実施形態の状態情報記憶手段14は、少なくとも所定期間分の状態系列情報を記憶するための記憶領域を有する。
 分析モデル生成手段12は、状態情報記憶手段14に記憶されている所定期間分の状態系列情報をもとに、被監視システムの状態を分析するための分析モデルを生成する。
 本実施形態の分析モデルは、3つ以上のデータ項目を用いて構成される回帰式と、当該回帰式の予測誤差の許容範囲とを有する相関モデルである多体相関モデルを1つ以上含む。より具体的には、本実施形態の分析モデルは、1つ以上の多体相関モデルからなる相関モデルの集合である。
 本発明では、少なくとも、データ項目間の関係を定義した回帰式と、該回帰式の予測誤差の許容範囲とを有するモデルを相関モデルと呼び、そのうちの2つのデータ項目を用いて構成される回帰式を含む相関モデルを「相互相関モデル」と呼び、3つ以上のデータ項目を用いて構成される回帰式を含む相関モデルを「多体相関モデル」と呼ぶ。以下、相互相関モデルと多体相関モデルとを区別する必要がない場合には、単に相関モデルと呼ぶ場合がある。
 分析モデルの生成に用いる状態系列情報の所定期間には、運用者によって障害を含まない任意の期間が設定される。異常検知の感度を高めるという観点からは、被監視システムの経年的な変化による影響を受けないように、できるだけ短い期間とすることが好ましい。例えば、被監視システムのメンテナンスサイクルが1年だとすると、当該所定期間を、それより十分短い、1か月、1週間、1日などの期間としてもよい。なお、このとき、当該期間に、通常起こりうるシステムの状態変化の要因の中で最も多くのセンサ値に大きな変化をもたらす要因によるセンサ値への影響が含まれることが好ましい。一方、被監視システムの状態変化による誤検知を減らすという観点からは、主要な内的要因または外的要因によるセンサ値の変化を網羅的に含むように、できるだけ長い期間を用いることが好ましい。例えば、被監視システムが季節の影響を強く受ける場合は、当該所定期間を、9か月、1年などの期間としてもよい。
 分析モデル記憶手段15は、分析モデル生成手段12が生成した分析モデルの情報である分析モデル情報を記憶する。分析モデル情報は、例えば、分析モデルに含まれる相関モデル(本実施形態では、1つ以上の多体相関モデル)の各々についてのモデル情報の集合であってもよい。モデル情報は、例えば、当該相関モデルの識別子と、当該相関モデルの回帰式の情報(目的変数に用いるデータ項目の情報、説明変数に用いるデータ項目の情報、およびデータ項目間の関係式の情報等)と、該回帰式の予測誤差の許容範囲を示す情報とを含む情報である。また、モデル情報は、さらに回帰式の優良さを表す指標である優良度を含んでいてもよい。
 分析手段13は、状態情報が新たに取得されると、分析モデル生成手段12が生成した分析モデルを用いて、被監視システムの状態を分析する。図1に示すように、分析手段13は、モデル破壊検出手段131と、異常判定手段132とを含む。
 モデル破壊検出手段131は、新たな状態情報が収集されると、分析モデル記憶手段15に記憶されている分析モデル情報によって示される分析モデルに含まれる各相関モデルについて、相関モデルの回帰式の予測誤差が許容範囲を超える現象であるモデル破壊が発生したかどうかを検出する。
 本発明では、このようなモデル破壊の発生を、回帰式の目的変数とされたデータ項目に対応するセンサ値の変化に、通常起こりうるシステムの状態変化に伴うセンサ値の変化(以下、単に通常変化という。)とは無関係なセンサ値の変化が含まれていることを示す指標として用いる。
 モデル破壊検出手段131は、例えば、状態情報記憶手段14に記憶されている最新の状態情報を含む状態系列情報と、分析モデルとを用いて、分析モデルに含まれる各相関モデルについて、当該相関モデルの回帰式の目的変数に対する少なくとも最新の時刻における予測値を算出し、さらに、算出した目的変数の予測値と実際のセンサ値との差である予測誤差を算出し、算出された予測誤差が許容範囲を満たしているか否かを判定することによって、モデル破壊の発生の有無を検出する。また、モデル破壊検出手段131は、モデル破壊の検出結果を、モデル破壊情報として出力する。
 モデル破壊情報は、例えば、分析モデルに含まれる各相関モデルのモデル破壊の状況を示す情報であってもよい。具体的には、モデル破壊情報は、モデル破壊が発生した相関モデルを特定可能な情報であったり、逆に、モデル破壊が発生しなかった相関モデルを特定可能な情報であってもよい。なお、モデル破壊情報は、相関モデルを特定可能な情報に加えてもしくは代えて、該相関モデルから得られる情報(例えば、該モデルの回帰式に含まれるデータ項目の情報や、算出された予測誤差)を含んでいてもよい。
 モデル破壊情報に必要な情報は、警報を発する条件とされる警報条件に依存する。例えば、警報条件が、モデル破壊の発生した相関モデルの数にかかわるものであれば、モデル破壊情報は、モデル破壊が発生した相関モデルの数を特定可能な情報(例えば、分析モデルに含まれる各相関モデルのモデル破壊の有無や、モデル破壊の発生した相関モデルの識別子の集合等)を含んでいればよい。また、例えば、警報条件が、モデル破壊の発生した相関モデルの回帰式の優良度にかかわるものであれば、モデル破壊情報は、モデル破壊が発生した相関モデルの回帰式の優良度を示す情報や、モデル破壊が発生した相関モデルの回帰式の優良度を特定可能な情報(モデル破壊の発生した相関モデルの識別子の集合等)を含んでいればよい。
 異常判定手段132は、モデル破壊検出手段131から得られるモデル破壊情報を基に、分析モデルのモデル破壊の状況が警報条件を満たしているか否かを判定する。また、異常判定手段132は、判定の結果、警報条件を満たしていれば、被監視システムの状態を異常と判定し、判定結果を運用者や被監視システムに通知する。
 警報条件には、例えば、以下の式(1)を用いることができる。
Na>T ・・・(1)
 ここで、Naは分析モデルに含まれる相関モデルのうちモデル破壊が発生した相関モデルの数である。また、Tは許容するモデル破壊の数である。例えば、T=3であったとすると、分析モデルに含まれる各相関モデルに対して回帰式の予測誤差を算出した結果、モデル破壊が発生した相関モデルの数が4以上であった場合には、警報条件を満たすので、異常判定手段132は、被監視システムの状態が異常であると判定し、運用者や被監視システムに異常の発生等を通知する。
 次に、本実施形態の分析モデルの生成方法について説明する。本実施形態の分析モデル生成手段12は、図1に示すように、分析モデル候補生成手段121と、モデル抽出手段122とを含む。また、分析モデル候補生成手段121は、データ項目分類手段1211と、多体相関モデル生成手段1212とを有する。
 分析モデル候補生成手段121は、分析モデルに用いる(含ませる)相関モデルの候補を生成する。なお、本例では、データ項目分類手段1211が、データ項目群を1つ以上のグループに分類し、多体相関モデル生成手段1212が、分類されたグループに基づき、1つ以上の多体相関モデルを生成する。
 データ項目分類手段1211は、状態情報に含まれるデータ項目群を、1つ以上のグループに分類する。より具体的には、データ項目分類手段1211は、分類後の少なくとも1つのグループにおいて、当該グループに含まれるデータ項目から任意に選択された1つのデータ項目である第1データ項目と、その第1データ項目と同一のグループに含まれるデータ項目のうち第1データ項目を除いたデータ項目の1つである第2データ項目とを用いて構成される回帰式の優良度を、任意に選択された第1データ項目に対して全ての第2データ項目の組み合わせについて算出したとき、それら回帰式の優良度の少なくとも1つが、所定の優良モデル条件を満たすように、データ項目を分類する。
 例えば、データ項目分類手段1211は、まず、所定期間分の状態系列情報を用いて、データ項目群のうち任意の2つのデータ項目に対する全ての組み合わせに対して、それぞれ第1の仮の相互相関モデルと、第2の仮の相互相関モデルとを生成する。ここで、第1の仮の相互相関モデルおよび第2の仮の相互相関モデルはいずれも、選択された2つのデータ項目を用いて構成される回帰式と、該回帰式の優良度とを少なくとも含むモデルである。ただし、第2の仮の相互相関モデルは、第1の仮の相互相関モデルに対して、回帰式の目的変数データ項目(後述)と説明変数データ項目(後述)とが入れ替わっている。
 仮の相互相関モデルの回帰式には、例えば、以下の式(2)に示されるようなARX(Auto-Regressive with eXogenous)モデルを用いることができる。
Figure JPOXMLDOC01-appb-M000001
 
 ここで、tは、状態情報のインデックスを表している。状態情報のインデックスtには、状態情報を古い順に並べたとき、古い方から新しい方に向かって、値が増える連番の整数が与えられる。また、N、KおよびMは、任意の整数である。また、y(t)は、状態情報のインデックスがtのときの、データ項目yの値を表している。したがって、y(t-N)はy(t)に比べ、センサ値の収集間隔N回分だけ過去の値を表す。また、式(2)中の「・・・」は、左から右に向かって、tから減じる値を1ずつ大きくした項が、省略されていることを表している。一例として、N=5であれば、ay(t-1)とay(t-5)の間には、ay(t-2)、ay(t-3)、ay(t-4)が省略されていることを表す。また、式(2)において、1つ目の等号の左側にあるハット付きのy(t)が目的変数に相当する。該目的変数は、状態情報のインデックスがtのときの、データ項目yの予測値とされる。また、2つ目の等号の右側にあるy(t-1)~y(t-N)およびu(t-K)~u(t-K-M)が説明変数に相当する。本例の場合、説明変数として、状態情報のインデックスがt-1~t-Nのときのデータ項目yのセンサ値および状態情報のインデックスがt-K~t-K-Nのときのデータ項目uのセンサ値が用いられている。なお、データ項目の観点からは、目的変数に用いられるデータ項目yを「目的変数データ項目」と定義し、説明変数のみに用いられるデータ項目uを「説明変数データ項目」と定義する。また、1番目の等号と2番目の等号の間にあるf(u,y)は、当該回帰式がuとyの2つのデータ項目を用いた関数であることを表している。
 式(2)のパラメータであるa~a,b~b,c,K,N,Mは、当該回帰式の優良度Fが最大となるように決定される。回帰式の優良度Fには、例えば以下の式(3)に示されるような、回帰式の予測精度を用いることができる。式(3)において、バー付きのyは、状態系列情報に含まれる所定期間中(状態情報のインデックスが1~N1の間)における目的変数の平均値を表す。
Figure JPOXMLDOC01-appb-M000002
 
 回帰式の優良さには、予測精度の高さと、汎化誤差の低さという2つの観点がある。上記の例は予測精度の高さの観点から定めた優良度の例であるが、汎化誤差の低さの観点から優良度を定めることも可能である。そのような場合には、例えば、情報量基準を用いればよい。なお、回帰式の優良度は、これらを組み合わせたものであってもよい。
 優良度Fが最大となるパラメータは、例えば、K,N,Mの組に対して優良度Fが最大となるようにa~a,b~b,cを決定し、その後、優良度Fが最大となるK,N,Mの組を選択することで決定される。具体的には、データ項目分類手段1211は、まず、K,N,Mの最大値をそれぞれ設定し、K,N,Mの値の組み合わせごとに回帰式を定式化して、それぞれの回帰式に対して、上記式(3)の第二項の分子が最小になるように、最小二乗法を用いて、パラメータa~a,b~b,cを決定する。次に、データ項目分類手段1211は、回帰式ごとに、優良度Fを算出し、最大の優良度Fをもつ、回帰式のパラメータa~a,b~b,c,K,N,Mを選択する。このようにすれば、所望の回帰式が得られる。ここで、K,N,Mの最大値には、運用者が任意の値を設定すればよい。
 また、データ項目分類手段1211は、そのようにして生成した第1の仮の相互相関モデルの集合である第1仮相互相関モデル群と、第2の仮の相互相関モデルの集合である第2仮相互相関モデル群とから、それぞれのデータ項目の組について、回帰式の優良度Fが高い方を選択することで、任意の2つのデータ項目に対して1つの回帰式を対応させた相互相関モデル群を生成する。ここでは、データ項目分類手段1211は、2つのデータ項目の組の各々について、第1の仮の相互相関モデルと第2の仮の相互相関モデルのうち回帰式の優良度Fが高い方を相互相関モデルとして選択し、そのように選択された任意の2つのデータ項目に対するすべての組の相互相関モデルの集合として相互相関モデル群を得る。
 また、データ項目分類手段1211は、そのようにして得た相互相関モデル群から、各相互相関モデルの回帰式において、優良度Fが、所定の優良モデル条件を満たす相互相関モデルを優良相互相関モデルとして抽出し、抽出した優良相互相関モデルの集合である優良相互相関モデル群を得る。
 優良モデル条件には、例えば、以下の式(4)が用いられる。なお、Fthは回帰式の優良度Fに対する閾値を表している。
F > Fth ・・・(4)
 ここで、回帰式の優良度Fに対する閾値Fthには、運用者が任意の値を設定できる。異常検知の対象範囲を広げるという観点からは、閾値Fthは低く設定されることが好ましい。システムの状態変化等による誤検知を減らすという観点からは、閾値Fthは高く設定されることが好ましい。また、システムの状態変化に埋もれる障害の兆候を精度よく検知するためには、システムの状態変化のパタンごとに代表データ項目を選出した方が好ましいため、閾値Fthは高く設定されることが好ましい。例えば、優良度Fが0~1の値を取るとすると、誤検知を減らすまたは障害の兆候を精度良く検知するためには、閾値Fthは、0.7から1までの値が好ましく、0.8から1までの値がさらに好ましい。
 また、データ項目分類手段1211は、抽出された優良相互相関モデル群のグラフ構造を構築する。グラフ構造は、相互相関モデルの回帰式に含まれるデータ項目を結節点とし、回帰式を線として、ネットーワーク図のように表したものである。以下、グラフ構造において、線を介して3つ以上の結節点がつながったものをクラスタと呼ぶ。
 また、データ項目分類手段1211は、優良相互相関モデル群のグラフ構造に基づいて、グラフ構造のクラスタの各々が、1つのデータ項目のグループであるデータ項目グループに対応するようにデータ項目を分類する。このように分類したとき、グラフ構造の結節点がデータ項目に対応するため、各クラスタ内の結節点に対応するデータ項目が、各データ項目グループに含まれるデータ項目となる。ここで、クラスタに含まれなかったデータ項目は分析モデル構築の対象外とする。
 このようにデータ項目を分類すれば、分類後のデータ項目グループに含まれるデータ項目から任意に選択された1つのデータ項目である第1データ項目と、その第1データ項目と同一のデータ項目グループに含まれるデータ項目のうち第1データ項目を除いたデータ項目の1つである第2データ項目とを用いて構築される回帰式の優良度を、任意に選択された1つの第1データ項目に対して全ての第2データ項目との組み合わせについて算出したとき、その回帰式の優良度の少なくとも1つが、上記の優良モデル条件を満たすように、データ項目が分類される。
 多体相関モデル生成手段1212は、データ項目分類手段1211が分類したデータ項目のグループごとに、そのグループに含まれるデータ項目の中から、少なくとも1つの代表データ項目を選出し、そのグループに含まれるデータ項目のうち代表データ項目を除いた任意の2つのデータ項目に対する全ての組み合わせについて、当該2つのデータ項目と、代表データ項目とを含む回帰式を構築する。また、多体相関モデル生成手段1212は、構築した回帰式の予測誤差の許容範囲と、回帰式の優良度とを算出し、構築した回帰式と、該回帰式の予測誤差の許容範囲とを少なくとも有する多体相関モデルを生成する。なお、多体相関モデル生成手段1212は、回帰式と、該回帰式の予測誤差の許容範囲と、該回帰式の優良度とを含む多体相関モデルを生成してもよい。
 このとき、多体相関モデル生成手段1212は、データ項目分類手段1211によって分類されたデータ項目グループごとに、当該データ項目グループ内の任意の2つのデータ項目の組を用いて構成される回帰式の全てについて算出される回帰式の優良度に基づいて、代表データ項目を選出する。多体相関モデル生成手段1212は、例えば、データ項目グループごとに、当該データ項目グループ内の任意の2つのデータ項目の組を用いて構成される回帰式の全てについて算出された回帰式の優良度から、当該データ項目グループにおけるデータ項目別の統計値を算出し、算出されたデータ項目別の統計値に基づいて、当該データ項目グループにおける代表データ項目を選出してもよい。多体相関モデル生成手段1212は、例えば、統計値の最も高いものを代表データ項目に選出してもよい。なお、代表データ項目は1つとは限らない。多体相関モデル生成手段1212は、複数の代表データ項目を選出する場合には、統計値の高い方から代表データ項目を選出してもよい。
 具体的には、多体相関モデル生成手段1212は、データ項目分類手段1211が生成した相互相関モデル群に含まれる各相互相関モデルの回帰式の優良度をデータ項目ごとに累積し、データ項目グループごとに、当該データ項目グループに属するデータ項目のうち、回帰式の優良度の累積値が最も高いものを代表データ項目としてもよい。当該相互相関モデル群に含まれる各相互相関モデルの回帰式の優良度は、目的変数に用いられるデータ項目および説明変数に用いられるデータ項目に対応づけられているので、多体相関モデル生成手段1212は、累積の際には、両方のデータ項目にその回帰式の優良度を加算する。ここで、回帰式の優良度の累計値が前記統計値に相当する。
 また、多体相関モデルの回帰式には、例えば以下の式(5)に示す回帰式を用いることができる。
Figure JPOXMLDOC01-appb-M000003
 
 ここで、K,N,M,L,P,Q,Sは任意の整数である。また、式(5)においても、1つ目の等号の左側にあるハット付きのy(t)が目的変数に相当する。該目的変数は、状態情報のインデックスがtのときの、データ項目yの予測値とされる。また、2つ目の等号の右側にあるy(t-1)~y(t-N),u(t-K)~u(t-K-M),x(t-L)~x(t-L-Q)およびw(t-P)~w(t-P-S)が説明変数に相当する。本例の場合、説明変数として、状態情報のインデックスがt-1~t-Nのときのデータ項目yのセンサ値、状態情報のインデックスがt-K~t-K-Nのときのデータ項目uのセンサ値、状態情報のインデックスがt-P~t-P-Qのときのデータ項目xのセンサ値および状態情報のインデックスがt-R~t-R-Sのときのデータ項目wのセンサ値が用いられている。ただし、式(2)の場合と同様に、データ項目の観点からは、目的変数に用いられるデータ項目yを「目的変数データ項目」と定義し、説明変数のみに用いられるデータ項目u,x,wを「説明変数データ項目」と定義する。なお、上記例では、4つの説明変数データ項目のうち2つのデータ項目(より具体的には、データ項目xとデータ項目w)が「代表データ項目」に相当する。
 多体相関モデル生成手段1212は、任意の2つのデータ項目と代表データ項目とを用いて回帰式を構築する際に、代表データ項目ではない2つのデータ項目の各々を目的変数とした回帰式を構築し、それらの回帰式のうち回帰式の優良度が最大となる回帰式を選択することで、代表データ項目を除く任意の2つのデータ項目に対して1つの回帰式を対応させた多体相関モデル群を生成する。
 式(5)のパラメータであるa~a,b~b,c,d~d,e~e,K,L,N,M,P,Q,Sは、例えば、PLS回帰を用いて、当該回帰式の優良度Fが最大となるように決定される。当該回帰式の優良度Fには、例えば上記の式(3)で示されるような、回帰式の予測精度の値を用いることができる。
 また、優良度Fが最大となるパラメータは、例えば、K,L,N,M,P,Q,Sの組に対して優良度Fが最大となるようにa~a,b~b,c,d~d,e~eを決定し、その後、優良度Fが最大となるK,L,N,M,P,Q,Sの組を選択することで決定される。具体的には、多体相関モデル生成手段1212は、例えば、K,L,N,M,P,Q,Sの最大値をそれぞれ設定し、K,L,N,M,P,Q,Sの値の組み合わせごとに回帰式を定式化し、それぞれの回帰式に対して、PLS回帰を用いて、パラメータa~a,b~b,c,d~d,e~eを決定する。PLS回帰の成分数は、例えば、PLS回帰の成分数を1から順に増やしたときに、分析モデルの生成に用いた状態系列情報に対する予測誤差の最大値が、減少から、増加に転じる前までの成分数とすればよい。最後に、多体相関モデル生成手段1212は、回帰式ごとに、優良度Fを算出し、最大の優良度Fをもつ、回帰式のパラメータa~a,b~b,c,d~d,e~e,K,L,N,M,P,Q,Sを選択する。このようにすれば、所望の回帰式が得られる。ここで、K,L,N,M,P,Q,Sの最大値には、運用者が任意の値を設定すればよい。
 このようにして得られた多体相関モデル群が、分析モデルとして用いる相関モデルの候補となる。
 また、多体相関モデルの回帰式の予測誤差の許容範囲には、例えば、以下の式(6)および式(7)の両方が満たされる範囲を用いることができる。
≦T ・・・(6)
≧T ・・・(7)
 ここで、Tは予測誤差に対する上限閾値である。また、Tは予測誤差に対する下限閾値である。また、rは当該多体相関モデルの回帰式を用いて算出される目的変数のi番目の時刻での予測誤差である。ここで、iは状態系列情報における時刻の識別子を表している。より具体的には、iはある基準時刻から該当する時刻までの状態情報を昇順または降順で並べたときの並び番号である。例えば、監視開始からi番目の時刻を表すものとしてもよい。
 また、例えば、多体相関モデルの回帰式の予測誤差の許容範囲には、該回帰式の構築に用いられた状態系列情報の期間にわたって算出される予測誤差(以下、算出期間中の予測誤差という。)の絶対値の最大値に-1をかけたものから、同算出期間中の予測誤差の絶対値の最大値までの範囲となるような、以下の式(8)および式(9)で示されるTおよびTを用いることができる。
=max{|R|,|R|,・・・,|RN1|} ・・・(8)
=-T ・・・(9)
 ここで、max{}は入力された数値の中から最大値を出力する関数である。また、|x|はxの絶対値を抽出する演算子である。また、R(i=1~N1)は当該多体相関モデルの回帰式の構築に用いた状態系列情報から算出される目的変数のi番目の時刻の予測誤差を表している。また、N1は当該多体相関モデルの回帰式を用いて該状態系列情報から算出される予測誤差の個数である。
 この他にも、回帰式の構築に用いた状態系列情報の期間にわたって算出された予測誤差R~RN1の平均値と標準偏差とを用いて、例えば、予測誤差の平均値に標準偏差の3倍を足した値をTとし、予測誤差の平均値から標準偏差の3倍を引いた値をTとしてもよい。
 モデル抽出手段122は、分析モデル候補生成手段121が生成した相関モデルの候補の中から、分析モデルに用いる相関モデルを抽出する。モデル抽出手段122は、分析モデル候補生成手段121によって生成された相関モデル群(本実施形態では、多体相関モデル生成手段1212によって生成される多体相関モデル群)の中から、各相関モデルの回帰式の優良度に基づいて、1つ以上の多体相関モデルを抽出する。
 モデル抽出手段122は、例えば、多体相関モデル生成手段1212によって生成される多体相関モデル群から、所定の優良モデル条件を満たす多体相関モデルを優良多体相関モデルとして抽出し、抽出された優良多体相関モデルの集合である優良多体相関モデル群を分析モデルとしてもよい。また、モデル抽出手段122は、抽出した各優良多体相関モデルのモデル情報を含む分析モデル情報を分析モデル記憶手段15に記憶する。
 優良多体相関モデルの抽出に用いる優良モデル条件には、例えば、上記の式(4)を用いることができる。ここで、回帰式の優良度Fに対する閾値Fthには、運用者が任意の値を設定できる。異常検知の対象範囲を広げるという観点からは、閾値Fthを低く設定することが好ましい。システムの状態変化等による誤検知を減らすという観点からは、閾値Fthは高く設定されることが好ましい。仮の相互相関モデルの場合と同様、例えば、誤検知を減らすという観点からは、優良度Fが0~1の値を取るとすると、閾値Fthは、0.7から1までの値が好ましく、0.8から1までの値がさらに好ましい。
 次に、本実施形態における、優良相互相関モデルおよび優良多体相関モデルの抽出について、具体例を用いて説明する。
 以下に示す例では、優良相互相関モデルや優良多体相関モデルの抽出において、抽出する元となるモデル群が相互相関モデル群か多体相関モデル群かにかかわらず、同一の回帰式の優良度の指標および優良モデル条件を用いるが、抽出する元となるモデル群に応じて異なる回帰式の優良度の指標および優良モデル条件を用いてもよい。一例として、相互相関モデルおよび多体相関モデルとも回帰式の優良度Fとして予測精度を用い、相互相関モデルに対する優良モデル条件を「F>0.6」とし、多体相関モデルに対する優良モデル条件を「F>0.7」とする等が挙げられる。
 また、以下に示す例では、優良多体相関モデルの抽出において、抽出する元となる多体相関モデル群に含まれる代表データ項目の数にかかわらず、同一の回帰式の優良度の指標および優良モデル条件を用いるが、抽出する元となる多体相関モデル群に含まれる代表データ項目の数に応じて、異なる回帰式の優良度の指標および優良モデル条件を用いてもよい。一例として、多体相関モデルの回帰式の優良度Fとして代表データ項目の数に関わらず予測精度を用い、多体相関モデルに対する優良モデル条件を「F>0.6×(代表データ項目の数)-1/3」とする等が挙げられる。
 図2は、データ項目分類手段1211による優良相互相関モデルの抽出方法の一例を示す説明図である。図2において、符号701Aは、優良相互相関モデルの抽出元となる相互相関モデル群を表している。また、符号701Bは、抽出された優良相互相関モデル群を表している。また、符号701Cは、本例の優良相互相関モデルの抽出に用いた優良モデル条件を表している。なお、図2の上段および下段の表における「Item 1」および「Item 2」欄は、相互相関モデルの回帰式に用いられた説明変数のデータ項目を表している。また、「Regression equation」欄は、相互相関モデルの回帰式を表している。また、「F」欄は、回帰式の優良度を表している。なお、相互相関モデル群に含まれる各相互相関モデルには、回帰式の予測誤差の許容範囲も含まれうるが、回帰式の予測誤差の許容範囲は優良相互相関モデルの抽出には利用されないため、図中では省略している。以下、他の説明においても、説明に利用されない値を図から省略することがある。
 本例では、データ項目分類手段1211は、状態情報記憶手段14から状態系列情報を取得し、相互相関モデル群701Aを生成する。本例の相互相関モデル群701Aは、5つの相互相関モデルで構成されている。また、本例の相互相関モデル群701Aの生成に用いた状態系列情報に含まれるデータ項目群は、データ項目A、データ項目B、データ項目C、データ項目D、データ項目Gおよびデータ項目Hからなる。相互相関モデル群701Aを構成する5つの相互相関モデルの回帰式は、それぞれB=f(A,B),C=f(A,C),B=f(B,D),C=f(C,D),G=f(G,H)である。ここで、f()はカッコ内に含まれるデータ項目から目的変数データ項目の予測値を算出するための関数である(ここでjは回帰式を識別するための識別子である整数)。その関数の説明変数には、カッコ内に含まれるデータ項目について、状態情報記憶手段14に記憶されている状態系列情報に含まれる該データ項目の値(センサ値)だけではなく、該データ項目を用いて算出される変換値や、過去の値も用いることができる。また、図2には、相互相関モデル群701Aを構成する各相互相関モデルの回帰式B=f(A,B),C=f(A,C),B=f(B,D),C=f(C,D),G=f(G,H)の優良度Fが、それぞれ0.8,0.8,0.9,0.7,0.5であることが示されている。
 データ項目分類手段1211は、相互相関モデル群701Aから、優良モデル条件701Cを満たす優良相互相関モデルを抽出して、優良相互相関モデル群701Bを得る。本例の優良モデル条件701Cは、図2に示されるように「回帰式の優良度F>0.6」である。このため、データ項目分類手段1211は、相互相関モデル群701Aを構成する5つの相互相関モデルのうち、回帰式の優良度Fが0.6を超える相互相関モデルを優良相互相関モデルとして抽出する。本例では、次の4つの回帰式、B=f(A,B),C=f(A,C),B=f(B,D),C=f(C,D)をそれぞれ含む4つの相互相関モデルが抽出されて、優良相互相関モデル群701Bとなる。
 また、図3は、モデル抽出手段122による優良多体相関モデルの抽出方法の一例を示す説明図である。図3において、符号702Aは、優良多体相関モデルの抽出元となる多体相関モデル群を表わしている。また、符号702Bは、抽出された優良多体相関モデル群を表している。また、符号702Cは、本例の優良多体相関モデルの抽出に用いた優良モデル条件を表している。なお、図3の上段および下段の表における「Item 1」および「Item 2」欄は、多体相関モデルの回帰式に用いられた説明変数のデータ項目のうち代表データ項目を除くデータ項目を表している。また、同表における「Representative Item」欄は、多体相関モデルの回帰式に用いられた代表データ項目を表している。
 本例では、モデル抽出手段122は、多体相関モデル生成手段1212から多体相関モデル群702Aを取得する。本例の多体相関モデル群702Aは、2つの多体相関モデルで構成されている。また、本例の多体相関モデル群702Aの生成に用いた状態系列情報に含まれるデータ項目群は、データ項目A、データ項目B、データ項目Cおよびデータ項目Dからなる。多体相関モデル群702Aを構成する2つの多体相関モデルの回帰式は、それぞれC=f10(A,B,C),C=f11(B,C,D)である。また、図3には、多体相関モデル群702Aを構成する各多体相関モデルの回帰式C=f10(A,B,C),C=f11(B,C,D)の優良度Fが、それぞれ0.9,0.8であることが示されている。
 モデル抽出手段122は、多体相関モデル群702Aから、優良モデル条件702Cを満たす優良多体相関モデルを抽出して、優良多体相関モデル群702Bを得る。本例の優良モデル条件702Cは、図3に示されるように「回帰式の優良度F>0.6」である。このため、モデル抽出手段122は、多体相関モデル群702Aを構成する2つの多体相関モデルのうち、回帰式の優良度Fが0.6を超える多体相関モデルを優良多体相関モデルとして抽出する。本例では、次の2つの回帰式、C=f10(A,B,C),C=f11(B,C,D)をそれぞれ含む2つの多体相関モデルが抽出されて、優良多体相関モデル群702Bとなる。
 次に、本実施形態における、相互相関モデル群や多体相関モデル群のグラフ構造を、具体例を用いて説明する。以下に示す例では、対象モデル群に含まれる相関モデルの回帰式に用いられている説明変数データ項目から目的変数データ項目に向かって矢印がつけられる有向グラフとして、グラフ構造を構築する場合を例に用いて説明するが、結節点と結節点の間の線に矢印をつけない無向グラフとして、グラフ構造を構築してもよい。
 図4は、図2に示した優良相互相関モデル群701Bのグラフ構造の構築例を示す説明図である。図4に示されるように、まず、データ項目分類手段1211は、対象モデル群である優良相互相関モデル群701Bに含まれる各優良相互相関モデルの回帰式に用いられているデータ項目を、それぞれ結節点で表す。次いで、その結節点間を、回帰式ごとに、説明変数データ項目(説明変数にのみ用いられているデータ項目)から目的変数データ項目(目的変数に用いられているデータ項目)に向かう矢印付きの線で接続して、グラフ構造701Dを構築する。本例では、データ項目分類手段1211は、データ項目A,データ項目B,データ項目Cおよびデータ項目Dをそれぞれ結節点として表し、それら結節点間を、データ項目Aからデータ項目Bに向かう矢印付きの線,データ項目Aからデータ項目Cに向かう矢印付きの線,データ項目Dからデータ項目Bに向かう矢印付きの線およびデータ項目Dからデータ項目Cに向かう矢印付きの線でそれぞれ接続し、グラフ構造701Dを得る。なお、図4には、1つのクラスタが残る例が示されているが、複数のクラスタが残る場合もある。また、本例では、線を介して2つの結節点しか接続されないような固まりは存在しないため、いずれの結節点も有効とされるが、例えば、線を介して2つの結節点しか接続されないような固まりがあった場合には、当該固まりはクラスタとは認められず、これに含まれる結節点に対応するデータ項目は分析モデル構築の対象外とされる。
 次に、本実施形態における代表データ項目の選出方法を、具体例を用いて説明する。図5は、代表データ項目の選出方法の一例を示す説明図である。多体相関モデル生成手段1212は、例えば、図4に示した優良相互相関モデル群のグラフ構造701Dに基づいて、各クラスタにつき、当該クラスタ内の結節点に対応するデータ項目ごとに、回帰式の優良度Fの累積値を算出する。具体的には、グラフ構造701Dに含まれるクラスタごとに、当該クラスタに含まれる結節点に対応するデータ項目別に、当該結節点に接続された矢印に対応する回帰式の優良度Fを累計して、累積値を得る。そして、得られた累計値を、当該データ項目のスコア701Eとする。そして、各データ項目のうち最大のスコア701Eとなったデータ項目を代表データ項目とする。ここで、スコア701Eが最大となるデータ項目が複数ある場合は、例えば、その中からランダムに代表データ項目を選出すればよい。図5に示す例では、各データ項目のスコア701Eは、データ項目A,データ項目B,データ項目Cおよびデータ項目Dに対して、それぞれ1.6,1.7,1.5および1.6である。よって、代表データ項目には、データ項目Bが選ばれる。換言すると、本例では、データ項目A、データ項目B、データ項目Cおよびデータ項目Dからなるデータ項目グループの代表データ項目として、データ項目Bが選ばれる。なお、本例は、優良多体相関モデル群のグラフ構造701Dにクラスタが1つしかない場合の例であるが、複数のクラスタがある場合は、クラスタごとに、同様の方法により、代表データ項目を選出する。本例の方法によれば、例えば、回帰式の優良度Fとしての予測精度を各回帰式の重みとして用い、スコアを計算することができるので、他のデータ項目を最も精度高く予測できるデータ項目が代表データ項目として選出される。別の見方をすれば、他のデータ項目を最も精度高く予測できるデータ項目は、同一クラスタに属するデータ項目において平均的な振る舞いをしているため、同一クラスタの他のデータ項目を最も精度高く予測できると考えられる。よって、このデータ項目を代表データ項目として回帰式を構築することで、システムの状態変化に伴うセンサ値の変化と、システムの状態変化とは無関係なセンサ値の変化とを分離して予測値を算出することが可能な回帰式を構築できるので、システムの状態変化に埋もれるような障害の兆候を検知できる。
 次に、優良相互相関モデル群のグラフ構造に2つ以上のクラスタがある場合の代表データ項目の選出方法を、具体例を用いて説明する。
 図6は、2つ以上のクラスタを有する優良相互相関モデル群のグラフ構造の例を示す説明図である。図6において、符号703Bは、グラフ構造の構築対象とされる優良相互相関モデル群を表している。また、符号703Dは、優良相互相関モデル群703Bのグラフ構造を表している。また、符号703F1および703F2は、それぞれグラフ構造703Dが有するクラスタを表している。データ項目分類手段1211は、優良相互相関モデル群703Bに含まれる各優良相互相関モデルの回帰式に用いられているデータ項目を、それぞれ結節点で表し、その結節点間を、回帰式ごとに、説明変数データ項目から目的変数データ項目に向かう矢印付きの線で接続して、グラフ構造703Dを得る。図6に示されるように、本例のグラフ構造703Dは、データ項目A、データ項目B、データ項目Cおよびデータ項目Dで構成されるクラスタ703F1と、データ項目K、データ項目Lおよびデータ項目Mで構成されるクラスタ703F2とを有する。
 また、図7は、優良相互相関モデル群のグラフ構造に2つ以上のクラスタがある場合の代表データ項目の選出方法の例を示す説明図である。多体相関モデル生成手段1212は、図7に示される優良相互相関モデル群のグラフ構造703Dに基づいて、例えば、クラスタごとに、当該クラスタに含まれるデータ項目別の回帰式の優良度Fの累積値を算出する。具体的には、グラフ構造703Dに含まれるクラスタごとに、当該クラスタに含まれる結節点に接続された各矢印に対応する回帰式の優良度Fを、当該回帰式に用いられているデータ項目に対して累計する処理を行い、データ項目別の累計値を得る。そして、得られた累積値を当該データ項目のスコアとする。
 図7では、クラスタ703F1を構成する各データ項目のスコアを703E1として示し、クラスタ703F2を構成する各データ項目のスコアを703E2として示している。多体相関モデル生成手段1212は、クラスタごとに、当該クラスタを構成するデータ項目のうち最大のスコアとなるデータ項目を、代表データ項目とする。1つのクラスタ内に、スコアが最大となるデータ項目が複数ある場合には、例えば、その中からランダムに代表データ項目を選択すればよい。図7に示す例では、クラスタ703F1を構成する各データ項目のスコア703E1は、データ項目A,データ項目B,データ項目Cおよびデータ項目Dに対して、それぞれ1.6,1.7,1.5および1.6である。よって、クラスタ703F1の代表データ項目には、データ項目Bが選ばれる。換言すると、データ項目A,データ項目B,データ項目Cおよびデータ項目Dからなるデータ項目グループの代表データ項目として、データ項目Bが選ばれる。また、クラスタ703F2を構成する各データ項目のスコア703E2は、データ項目K,データ項目Lおよびデータ項目Mに対して、それぞれ1.4,0.7および0.7である。よって、クラスタ703F2の代表データ項目には、データ項目Kが選ばれる。換言すると、データ項目K,データ項目Lおよびデータ項目Mからなるデータ項目グループの代表データ項目として、データ項目Kが選ばれる。
 なお、システム分析装置100は、CPUとプログラムを記憶した記憶媒体とを含み、プログラムに基づくCPUの制御によって動作するコンピュータであってもよい。そのような場合、状態情報収集手段11、分析モデル生成手段12および分析手段13は、プログラムに従って動作するCPUによって実現される。また、状態情報記憶手段14および分析モデル記憶手段15は、該コンピュータが備える記憶媒体によって実現される。なお、状態情報記憶手段14および分析モデル記憶手段15は、それぞれ個別の記憶媒体によって実現されてもよく、また1つの記憶媒体によって実現されてもよい。
 次に、本実施形態におけるシステム分析装置100の動作を説明する。図8は、本実施形態のシステム分析装置100の動作の一例を示すフローチャートである。
 図8に示す例では、はじめに、システム分析装置100の状態情報収集手段11が、被監視装置200から状態情報を収集し、状態情報記憶手段14に記憶する(ステップS101)。状態情報収集手段11は、運用を終了するという判断(ステップS108のYes)が与えられるまで、ステップS101の動作を繰り返す。なお、状態情報収集手段11は、ステップS102~ステップS107の動作が行われている間も、所定周期毎に状態情報を収集し、状態情報記憶手段14に記憶する動作を行う。
 次いで、分析モデル生成手段12が、現在のタイミングが分析モデルを生成するタイミングであれば(ステップS102のYes)、分析モデルの生成に用いる所定期間についての状態系列情報を状態情報記憶手段14から取得し、取得した状態系列情報を用いて、分析モデルを生成する(ステップS103)。一方、現在のタイミングが分析モデルを生成するタイミングでなければ(ステップS102のNo)、ステップS104に進む。分析モデルを生成するタイミングであるか否かは、例えば、分析モデルを生成するという判断が与えられたか否かによって判定してもよい。
 ステップS104では、分析手段13は、現在の分析モデルを用いて、対象システムを監視するという判断(ステップS104のYes)が与えられなければ、ステップS101に戻る。一方、現在の分析モデルを用いて、対象システムを監視するという判断(ステップS104のYes)が与えられれば、ステップS105に進む。
 ステップS105では、モデル破壊検出手段131が、状態情報収集手段11により新たに収集された状態情報を用いて、分析モデル記憶手段15に記憶されている分析モデル情報によって示される分析モデルのモデル破壊の状況を検出する。モデル破壊検出手段131は、より具体的には、分析モデルに含まれる各多体相関モデルにモデル破壊が発生しているか否かを判定し、その結果を示すモデル破壊情報を生成する。
 次いで、異常判定手段132が、モデル破壊検出手段131から得られるモデル破壊情報に基づいて、モデル破壊の状況が警報条件を満たしているか否かを判定する。モデル破壊の状況が警報条件を満たしていれば(ステップS106のYes)、異常判定手段132は、判定結果またはモデル破壊の状況を示すモデル破壊情報を運用者または被監視システムに通知し(ステップS107)、ステップS108に進む。一方、モデル破壊の状況が警報条件を満たしていなければ(ステップS106のNo)、異常判定手段132はシステムに異常は検知されなかったとして特に何もせず、ステップS101に戻る。
 システム分析装置100は、運用を終了するという判断(ステップS108のYes)が与えられるまで、上記の動作を継続する。
 また、図9は、分析モデル生成手段12による分析モデルの生成処理(図8のステップS103)の処理フローの一例を示すフローチャートである。図9に示す例では、はじめに、データ項目分類手段1211が、分析モデルの生成に用いる所定期間分の状態系列情報を状態情報記憶手段14から取得し、取得した状態系列情報を用いて、データ項目の分類のための相互相関モデル群を生成する(ステップS201)。
 次いで、データ項目分類手段1211は、所定の優良モデル条件に基づいて、生成された相互相関モデル群から優良相互相関モデルを抽出して、優良相互相関モデル群を得る(ステップS202)。
 次いで、データ項目分類手段1211は、得られた優良相互相関モデル群のグラフ構造を構築する(ステップS203)。ステップS203で、データ項目分類手段1211は、構築されたグラフ構造にもとづいて、データ項目を分類する。データ項目分類手段1211は、グラフ構造に含まれる各クラスタを、各々データ項目グループとする。
 次いで、多体相関モデル生成手段1212が、データ項目分類手段1211によって分類されたデータ項目グループごとに、代表データ項目を選出する(ステップS204)。
 次いで、多体相関モデル生成手段1212は、該データ項目グループごとに、代表データ項目を除く当該データ項目グループに属する任意の2つのデータ項目の全ての組み合わせについて、該2つのデータ項目と代表データ項目とを用いた回帰式と、該回帰式の予測誤差の許容範囲とを少なくとも有する多体相関モデルを生成し、多体相関モデル群を得る(ステップS205)。
 次いで、モデル抽出手段122が、生成された多体相関モデル群から、所定の優良モデル条件に基づいて、優良多体相関モデルを抽出して、優良相互相関モデル群を得る(ステップS206)。
 次いで、モデル抽出手段122は、得られた優良多体相関モデル群を分析モデルとして、分析モデル記憶手段15に分析モデル情報を記憶する(ステップS207)。
 以上のように、本実施形態のシステム分析装置100によれば、対象システムが複雑であったり、データ項目間に多重共線性があったりしても、高感度に異常を検知できる分析モデルを生成できるので、精度よくシステムの異常判定を行うことができる。その理由として、本実施形態の6つの特長が挙げられる。
 1つ目は、データ項目分類手段1211が、相互相関モデル群を生成して、その相互相関モデル群に含まれる相互相関モデルの回帰式の中から優良度が高い回帰式を選び、その回帰式に含まれるデータ項目ごとに、データ項目を分類していることである。この結果、気温、システムへの負荷、設定値など、通常起こりうるシステムの状態変化が、データ項目の値に同様に現れるデータ項目ごとにデータ項目を分類できる。これは、データ項目の値に現れるシステムの状態変化に伴う影響(例えばセンサ値のトレンドとして現れる)が類似するデータ項目を、1つのグループに分類できることを意味する。
 システムの状態変化に伴う影響が類似するデータ項目間では、それを用いた回帰式の予測精度等の回帰式の優良さを表す指標が高くなるため、所望の優良度を得るために必要な回帰式に含まれるデータ項目の数を抑えることができる。回帰式に含まれるデータ項目の数が少ないため、少数のデータ項目に影響が現れる障害の兆候を感度良く検知できる。さらに、回帰式に含まれるデータ項目の数が少ないため、多数のデータ項目を説明変数に用いて回帰式を構築した場合と比べて、異常の発生箇所を特定しやすいという効果も得られる。例えば、特許文献1,2に記載された方法では、予測精度を高めるために、一つの回帰式に説明変数として含まれるデータ項目の数を増やしていくと、異常の影響を受けたデータ項目を特定することが難しくなる問題があったが、このような問題も本実施形態によれば解決できる。
 2つ目は、上記の方法でグループ化されたデータ項目ごとに、代表データ項目を決定し、分析モデルに含ませる相関モデルの回帰式として、代表データ項目と、代表データ項目を除く2つのデータ項目とを含む回帰式を構築していることである。回帰式に、システムの状態変化に伴う影響を表すためのデータ項目を加えると、システムの状態変化に伴う影響を各データ項目から除去するのと同様の効果が得られる。このため、上記の方法で構築された回帰式によれば、システムの状態変化に伴うデータ項目の値の変化と、データ項目固有のデータ項目の値の変化を分離して予測値を算出できる。このように、データ項目固有の変動に注目して予測誤差を算出できるので、センサ値の監視だけではシステムの状態変化に伴うデータ項目の値の変化に埋もれてしまうような障害の兆候によるデータ項目の値の変化であっても、精度よく検出することができる。
 3つ目は、代表データ項目として、優良度の累積値が最も高いデータ項目を少なくとも選出していることである。関係性の強いデータ項目で構成されるクラスタに対応するデータ項目グループにおいて、他のデータ項目への優良度の累積値が最も高いデータ項目は、当該データ項目グループに属するデータ項目のうち、システムの状態変化の平均的な影響が現れたものと考えられる。よって、上記の方法で選出された代表データ項目は、システムの状態変化に伴うセンサ値の変化を表現するためのデータ項目としてふさわしく、よりシステムの状態変化に伴うデータ項目の値の変化と、データ項目固有のデータ項目の値の変化とを分離するのに有効である。
 4つ目は、多重共線性の影響を受けないパラメータ決定の方法を用いていることである。そのため、相関関係の強いデータ項目を除外せずに、分析モデルを生成できる。これにより、相関関係の強いデータ項目間に現れる異常を発見できないといった問題を解決できる。換言すると、相関関係の強いデータ項目間に現れるような異常であっても精度よく検知できる。
 5つ目は、分析モデルにおいて、1種類の目的変数に対して複数個の回帰式が構築されることがあるためである。1種類の目的変数に対して複数の回帰式が構築される場合では、1つの回帰式が、システムに対する正常または異常の判断結果に寄与する割合が小さくなるので、どのデータ項目が目的変数に用いられるかで、システムに対する正常または異常の判断結果が異なる場合があるといった問題を解決できる。換言すると、1種類の目的変数に対して構築される回帰式が1つに限られないため、目的変数を限ったことによる異常検知漏れを防ぐことができる。
 6つ目は、代表データ項目、目的変数、説明変数の選択を、あらかじめ指定せず、センサ値の振る舞い等に基づいて、それらを適切に自動決定している点である。よって、代表データ項目、目的変数、説明変数の選択にかかわる論理がシステムの複雑さの影響を受けない。そのため、適切な目的変数および説明変数の選択が難しくなるといった問題を解決できる。換言すると、対象システムの構成等が複雑であっても、適切な目的変数および説明変数が選択できるので、精度よく対象システムの状態を分析できる。
 また、本実施形態のシステム分析装置100は、上記に加えて、異常要因とされるデータ項目の絞り込み精度が高いという特長がある。関連性の高いデータ項目の集まりであるデータ項目グループ内では回帰式に含まれる代表データ項目が共通しているため、分析モデルに含まれる相関モデルの中の1つのデータ項目グループから生成された優良多体相関モデル群に着目して、例えば、次のような判断ができる。例えば、該優良多体相関モデル群のうちの大半がモデル破壊となったとき、代表データ項目が異常要因とされるデータ項目である可能性が高いという判断ができる。また、逆に、当該優良多体相関モデル群のうちの少数がモデル破壊となったとき、代表データ項目を除くデータ項目が異常要因とされるデータ項目である可能性が高いという判断ができる。
 なお、上記の特長を持つためには、代表データ項目が、データ項目の値に現れるシステムの状態変化に伴う影響が類似のデータ項目ごとにグループ化されたデータ項目グループから、選出される必要があり、さらには、そのグループにおいて、システムの状態変化の平均的な影響が現れたデータ項目であることが好ましい。本実施形態のシステム分析装置100は、そのように代表データ項目を選出できる。具体的には、関係性の強いデータ項目群をまとめたデータ項目グループにおいて、優良度(予測精度)の累積値が最も高いデータ項目が選出されればよい。
 なお、上記説明では、相関モデルの回帰式の例として、説明変数に目的変数の過去の値を含む例(例えば、式(2)や式(5))を示したが、説明変数から目的変数の過去の値を除外してもよい。また、上記の相関モデルの回帰式の例では、目的変数や説明変数にデータ項目の値を用いたが、データ項目の値を数値変換したものを用いてもよい。データ項目の値を数値変換したものの例としては、階差、べき乗、所定の時間幅における状態系列情報の平均値などが挙げられる。
 また、式(2)や式(5)に示した回帰式の生成方法の例として、優良度である予測精度の値が最大となるように各パラメータを決定する例を示したが、目的に応じて他の優良度を用いてもよい。たとえば、回帰式の優良度として、AIC(Akaike‘s Information Criterion)や、BIC(Bayesian Information Criterion)などの情報量基準の逆数を用いて、それらが最大となるように各パラメータを決定してもよい。
 また、上記では、K、N、Mを固定した時の回帰式のパラメータa~a,b~b,c,の決定方法として、式(3)の第二項の分子が最小になるように、最小二乗法を用いてパラメータa~a,b~b,c,を決定する方法を示したが、Lasso(least absolute shrinkage and selection operator)やRidge回帰等で用いられる正則化パラメータ付きの損失関数を用いて、正則化パラメータ付きの損失関数が最小となるように、これらパラメータを決定してもよい。
 また、多体相関モデルの回帰式の例として、代表データ項目を説明変数に用いる例(例えば、式(5))を示したが、代表データ項目は目的変数であってもよい。複数の代表データ項目を目的変数とする場合は、複数の代表データ項目の合成値を目的変数としてもよい。
 また、上記では、式(5)のパラメータであるa~a,b~b,c,d~d,e~e,K,L,N,M,P,Q,Sを決定する際に、PLS回帰の成分数を、PLS回帰の成分数を1から順に増やしたときに、モデル構築に用いた状態系列情報に対する予測誤差の最大値が、減少から増加に転じる前までの成分数とする例を示したが、Wold‘s R criterion、Krzanowski’s W criterion、Osten‘s F criterion等を用いて、これらパラメータを決定してもよい。
 また、上記では、K、L、N、M、P、Q、Sを固定した時の回帰式のパラメータa~a,b~b,c,d~d,e~eの決定方法の例として、PLS回帰を用いる例を示したが、主成分回帰(Principal Component Regression :PCR)等、説明変数間の多重共線性による影響を回避可能な別の方法を用いて、これらパラメータを決定してもよい。
 また、上記では、データ項目グループの代表データ項目の選出方法の例として、回帰式の優良度の累積値が最も高いものを選出する例を示したが、複数個のデータ項目を、回帰式の優良度の累積値が高い方から順に選出し、代表データ項目としてもよい。1つのデータ項目グループに対して複数の代表データ項目を選出する場合は、例えば、運用者によってあらかじめ定められた所定の個数を満たすまで代表データ項目を増やしてもよいし、情報量基準が所定の閾値を超えるまで代表データ項目を増やしてもよい。データ項目グループごとの代表データ項目の数は、異常の検知感度や異常要因データ項目の絞り込みの観点からは、少ない方が望ましく、誤報頻度の観点からは、多い方が望ましい。
 また、上記では、データ項目グループの代表データ項目の選出に、回帰式の優良度の累積値という1種類の指標を用いる例を示したが、複数種類の指標を用いてもよい。複数種類の指標を用いて代表データ項目を選出する方法の一例としては、回帰式の優良度の累積値という指標と、後述する変化点の出現の早さという指標とを用いて、それぞれの指標に対して1つデータ項目を選択し、それらを代表データ項目とする方法が挙げられる。
 また、上記では、データ項目グループの代表データ項目を選出する際に、回帰式の優良度の統計値として累積値を用いる例を示したが、優良度の平均値、中央値、最小値、最大値、など他の統計値を用いてもよい。
 また、上記では、データ項目グループの代表データ項目を選出する際に、回帰式の優良度から統計値を算出する例を示したが、回帰式の優良度の値を数値変換したものを用いてもよい。回帰式の優良度の値を数値変換したものの一例としては、回帰式の優良度の2乗値や、回帰式の優良度を優良モデル条件に基づき、優良モデル条件を満たす回帰式の優良度を1、優良モデル条件を満たさない回帰式の優良度を0に変換したもの等が挙げられる。
 また、上記では、システム分析装置100が、1つの分析モデル(同じ状態系列情報から生成された多体相関モデル群からなる分析モデル)を用いて、被監視システムの状態を監視する例を示したが、収集期間の異なる状態系列情報を用いて複数の分析モデルを作成してもよい。そのような場合に、複数の分析モデルを切り替えながら、被監視システムの状態を監視してもよい。
 また、上記では、システム分析装置100が、分析モデルを一度だけ構築する例を示したが、分析モデルを逐次、再構築してもよい。
 また、上記では、システム分析装置100が、分析モデルに含まれる全ての回帰式をモデル破壊の検出に用いて、被監視システムの状態を監視する例を示したが、分析モデルの一部のみを用いて、被監視システムの状態(例えば、一部の被監視装置200のみ)を監視してもよい。
 また、上記では、警報条件の例として、「モデル破壊が発生した相関モデルの数が、所定の数を超えたとき」といった条件を用いる例を示したが、例えば、「モデル破壊が発生した相関モデルの回帰式の優良度の累積値が、所定の値を超えたとき」といった条件を用いてもよい。また、例えば、あらかじめ設定された所定の値を一般化して警報閾値とした上で、「あらかじめ設定された所定の期間にわたって警報閾値を超えたとき」といった条件を警報条件とすることもできる。このように警報条件には、モデル破壊情報に基づいたあらゆる条件を設定できる。
 また、上記では、被監視システムが発電プラントである場合を例に示したが、被監視システムの状態を示す情報から1つ以上の多体相関モデルを生成でき、生成した1つ以上の多体相関モデルのモデル破壊により異常の発生有無を判定できれば、被監視システムは他のシステムでもよい。例えば、被監視システムは、ITシステム、プラントシステム、構造物、輸送機器等であってもよい。この場合、システム分析装置100は、例えば、これらシステムの状態を示す情報に含まれるデータの種目を、データ項目として分析モデルを生成し、モデル破壊の検出を行う。
実施形態2.
 次に、本発明の第2の実施形態について説明する。本実施形態は、代表データ項目の選出方法を除いて第1の実施形態と同じである。このため、第1の実施形態と同じ部分については同一の符号を付し、説明を省略する。
 本実施形態では、各データ項目グループ内で、時系列上で一番早く値が変化しているデータ項目すなわち最も早く変化点が出現したデータ項目を、代表データ項目として選出する。なお、複数の代表データ項目を選出する場合には、情報の変化点の出現が早い方から代表データ項目を選出してもよい。
 本実施形態の多体相関モデル生成手段1212は、まずデータ項目分類手段1211によって分類されたデータ項目グループに含まれるデータ項目のうち、1つをランダムに選択する。そして、選択されたデータ項目を基準データ項目とし、該基準データ項目と、当該データ項目グループ内の他のデータ項目それぞれとの相互相関係数が、最大となる基準データ項目と他のデータ項目の間の時間シフト量を求める。その時間シフト量が過去の方に向かって、最も大きくなるデータ項目を、当該データ項目グループの代表データ項目とする。
 次に、本実施形態における代表データ項目の選出方法を、具体例を用いて説明する。図10は、本実施形態における代表データ項目の選出方法の一例を示す説明図である。なお、図10に示す例は、図4に示した優良相互相関モデル群701Bのグラフ構造701Dに基づいてグループ分けした結果生成された1つのデータ項目グループから、代表データ項目を選出する場合の例である。
 多体相関モデル生成手段1212は、まず生成されたグラフ構造の各クラスタに対応するデータ項目グループに含まれるデータ項目のうち、一つのデータ項目をランダムに選択する。図10の上部には、分析モデルの生成に用いた状態系列情報におけるデータ項目A,データ項目B,データ項目Cおよびデータ項目Dの時系列変化の様子(時系列データの模式図)が示されている。なお、本例では、データ項目Aが基準データ項目として選出されたものとする。このときの、基準データ項目であるデータ項目Aに対するデータ項目A,データ項目B,データ項目Cおよびデータ項目Dの時間シフト量は、それぞれ0,3,2および-1であった。
 なお、図10には、時間シフト量として、基準データ項目Aと他のデータ項目との相互相関関数が最大値となる条件において、他のデータ項目を時間方向にずらした量が示されている。時間シフト量の単位は、1計測時間間隔である。また、時間シフト量が正の値をとるのは、他のデータ項目を未来に、すなわち紙面右側に移動させたときに、基準データ項目であるデータ項目Aと当該他のデータ項目との相互相関関数が最大値となることを示している。一方、時間シフト量が負の値をとるのは、他のデータ項目を過去に、すなわち紙面左側に移動させたときに、基準データ項目であるデータ項目Aと当該他のデータ項目の相互相関関数が最大値となること示している。したがって、本例では、時間シフト量が最大値を持つデータ項目が代表データ項目に選ばれる。図10に示す例では、データ項目Bが代表データ項目に選ばれる。
 本手法によれば、時間の前後関係も考慮するため、1つのデータ項目グループ内のデータ項目が、類似の波形を持つもののみで構成されている場合に、システム状態の変化の原因となったデータ項目を抽出できる。また、システム状態の変化の原因となったデータ項目を用いて回帰式を構築することで、予測値の算出において、システム状態の変化によるデータ項目値の変化と、データ項目固有のデータ項目値の変化とを分離できるため、センサ値の監視だけではシステムの状態変化に伴うデータ項目の値の変化に埋もれてしまうような障害の兆候によるデータ項目の値の変化を検出することができる。なお、データ項目グループ内のデータ項目を類似の波形を持つもののみで構成するためには、仮の相互相関モデルの回帰式において目的変数の過去値を含ませず、かつ回帰式の優良度の高い回帰式に用いられるデータ項目のみを用いて、グループ内のデータ項目を構成すればよい。
実施形態3.
 次に、本発明の第3の実施形態について説明する。本実施形態は、分析モデルの相関モデルとして、多体相関モデルだけでなく、相互相関モデルを用いる点で上記の各実施形態と異なる。以下では、第1の実施形態の構成に、相互相関モデルを分析モデルとして利用する機能を追加する場合を例に示すが、当該機能は、第2の実施形態に追加されてもよい。以下では、第1の実施形態と同じ部分については同一の符号を付し、説明を省略する。
 図11は、本実施形態のシステム分析装置300の構成例を示すブロック図である。図11に示すシステム分析装置300は、図1に示す第1の実施形態のシステム分析装置100の構成と比べて、分析モデル生成手段12が分析モデル生成手段32となっている点が異なる。
 分析モデル生成手段32は、分析モデル候補生成手段321と、モデル抽出手段322とを含む。また、分析モデル候補生成手段321は、相互相関モデル生成手段3213と、データ項目分類手段1211と、多体相関モデル生成手段1212とを有する。このように、分析モデル生成手段32の分析モデル候補生成手段321が、さらに相互相関モデル生成手段3213を有する点が、第1の実施形態と異なる。なお、モデル抽出手段322の動作も第1の実施形態と異なる。
 相互相関モデル生成手段3213は、分析モデルに含ませる相関モデルの候補となる相互相関モデルを生成する。
 具体的には、相互相関モデル生成手段3213は、任意の2つのデータ項目に対するすべての組み合わせについて、任意の2つのデータ項目を含む回帰式を構築するとともに、該回帰式の予測誤差の許容範囲と、該回帰式の優良度とを算出して、少なくとも、構築した回帰式と、該回帰式の予測誤差の許容範囲とを含む相互相関モデルを生成する。なお、相互相関モデル生成手段3213は、構築した回帰式と、該回帰式の予測誤差の許容範囲と、該回帰式の優良度とを含む相互相関モデルを生成してもよい。以下、相互相関モデル生成手段3213が生成する相互相関モデルを、分析用の相互相関モデルと呼ぶ場合がある。また、分析用の相互相関モデルの集合を分析用相互相関モデル群と呼ぶ場合がある。また、以下では、当該分析用相互相関モデル群と区別するために、第1の実施形態のデータ項目分類手段1211が生成する相互相関モデル群を、分類用相互相関モデル群と呼ぶ場合がある。
 なお、データ項目分類手段1211では、任意の2つのデータ項目に対して、第1の仮の相互相関モデルと、第1の仮の相互相関モデルにおける目的変数データ項目と説明変数データ項目とを入れ替えた第2の仮の相互相関モデルのうち回帰式の優良度Fが高い方を選択することで、任意の2つのデータ項目に対して1つの回帰式を対応させた分類用相互相関モデル群を生成するが、相互相関モデル生成手段3213でも同様の選択処理を行う。すなわち、任意の2つのデータ項目に対して、目的変数データ項目と説明変数データ項目とが入れ替えられている2つの回帰式のうち優良度が高い方の1つの回帰式を対応させた分析用相互相関モデル群を生成する。
 また、本実施形態のモデル抽出手段322は、第1の実施形態のモデル抽出手段122の機能に加えて、次の機能を有する。すなわち、モデル抽出手段322は、相互相関モデル生成手段3213によって生成された分析用相互相関モデル群の中から、所定の優良モデル条件を満たす相互相関モデルを分析用優良相互相関モデルとして抽出し、抽出された分析用優良相互相関モデル群を、分析モデルに含ませる相関モデルとする。したがって、本実施形態の分析モデルは、1つ以上の多体相関モデルに加えて、1つ以上の相互相関モデルを含みうる。
 また、モデル抽出手段322は、抽出の結果、分析モデルに含ませる相関モデルとされた多体相関モデルおよび相互相関モデルの情報を、分析モデル情報として分析モデル記憶手段15に記憶する。
 分析用相互相関モデルと分類用相互相関モデルとは、回帰式、回帰式の優良度の指標および優良モデル条件が同じであってもよいし、異なっていてもよい。また、分析用相互相関モデルと多体相関モデルとは、回帰式の予想誤差の許容範囲の算出方法、回帰式の優良度の指標および優良モデル条件が同じであってもよいし、異なっていてもよい。いずれの場合も、第1の実施形態で示したものを用いることができる。
 なお、分析モデルに含まれる相互相関モデルに対するモデル破壊の検出方法は、多体相関モデルの場合と同様である。したがって、分析手段13のモデル破壊検出手段131は、新たな状態情報が収集されると、分析モデル記憶手段15に記憶されている分析モデル情報によって示される分析モデルに含まれる各相関モデルについて、第1の実施形態と同様の方法で、モデル破壊の発生有無を検出すればよい。
 次に、本実施形態におけるシステム分析装置300の動作を説明する。図12は、本実施形態の分析モデル生成手段32の動作の一例を示すフローチャートである。なお、以下では、図9に示した動作と同一の動作については同一の符号を付し、説明を省略する。
 図12に示すように、本実施形態のシステム分析装置300の分析モデル生成手段32では、はじめに、相互相関モデル生成手段3213が、分析モデルの生成に用いる所定期間についての状態系列情報を状態情報記憶手段14から取得し、その状態系列情報を用いて、分析用相互相関モデル群を生成する(ステップS301)。
 次いで、モデル抽出手段322が、所定の優良モデル条件に基づいて、生成された分析用相互相関モデル群から、分析用優良相互相関モデルを抽出して、分析用優良相互相関モデル群を得る(ステップS302)。
 次いで、第1の実施形態と同様の方法で、データ項目分類手段1211と多体相関モデル生成手段1212とが協働して多体相関モデル群を生成し(ステップS201~S205)、モデル抽出手段322が、所定の優良モデル条件に基づいて、生成された多体相関モデル群から、優良多体相関モデルを抽出して、優良多体相関モデル群を得る(ステップS206)。
 最後に、モデル抽出手段322は、ステップS302で得られた分析用優良相互相関モデル群と、ステップS206で得られた優良多体相関モデル群とを合わせたものを、分析モデルとして、分析モデル記憶手段15に分析モデル情報を記憶する(ステップS303)。
 以上のように、本実施形態によれば、相互相関モデルをデータ項目をグループ分けするためだけに用いるのではなく、分析モデルの相関モデルとしても用いているため、分析対象とするデータ項目の範囲をより広くできる。
 なお、分析用相互相関モデルと分類用相互相関モデルとで、同じ回帰式を用いる場合には、データ項目分類手段1211は、相互相関モデル生成手段3213が生成した分析用相互相関モデル群をそのまま、分類用相互相関モデル群として用いてもよい。また、優良相互相関モデル群の抽出に用いる優良モデル条件も同じものを用いる場合には、優良相互相関モデル群も共用できる。すなわち、分析用優良相互相関モデル群をそのまま、分類用優良相互相関モデル群として用いてもよい。そのような場合、図12中のステップS201~S202の処理は省略される。
実施形態4.
 次に、本発明の第4の実施形態について説明する。本実施形態は、異常要因を抽出する機能を含む点で上記の各実施形態と異なる。以下では、第3の実施形態の構成に、当該機能を追加した場合を例に示すが、当該機能は、第1の実施形態や第2の実施形態に追加されてもよい。以下では、第3の実施形態と同じ部分については同一の符号を付し、説明を省略する。
 図13は、本実施形態のシステム分析装置400の構成例を示すブロック図である。図13に示すシステム分析装置400は、図11に示す第3の実施形態のシステム分析装置300の構成と比べて、分析手段13が分析手段43となっている点が異なる。
 本実施形態の分析手段43は、モデル破壊検出手段131と、異常判定手段132と、異常要因抽出手段433と、モデル破壊記憶手段434とを含む。このように、分析手段43が、さらに異常要因抽出手段433と、モデル破壊記憶手段434とを含む点が第3の実施形態と異なる。
 モデル破壊記憶手段434は、モデル破壊検出手段131により生成されるモデル破壊情報を記憶する。モデル破壊記憶手段434へのモデル破壊情報の登録処理は、例えば、異常判定手段132が、システム状態を異常と判定した場合に行ってもよい。このとき、システム状態が異常か正常かを判断するための警報条件には、第1の実施形態で示したものを用いることができる。
 異常要因抽出手段433は、モデル破壊記憶手段434にモデル破壊情報が新たに追加されると、新たに追加されたモデル破壊情報から、データ項目ごとに異常の度合いを示す異常度を算出する。そして、異常度の高い方から少なくとも1つのデータ項目を抽出し、抽出されたデータ項目の各々を、異常要因の候補となるデータ項目である異常要因候補データ項目とし、その集合である異常要因候補データ項目群を、運用者や被監視システムに通知する。
 異常要因候補データ項目群に含ませるデータ項目の個数、すなわち通知する異常要因候補データ項目の個数には、例えば、異常時に確認するデータ項目の数として、運用者が任意の数を設定できる。通知する異常要因候補データ項目の個数は、障害の原因を見つけられる可能性を高め、障害の全体の状況を把握するという観点からは、多いほど好ましく、誤報が発生したときの調査時間を短縮するという観点からは、少ないほど好ましい。
 データ項目の異常度には、例えば、データ項目ごとに、分析モデルに含まれる相関モデルのうちモデル破壊が発生した相関モデルの回帰式に含まれるデータ項目の数を累積した値や、モデル破壊が発生した相関モデルの回帰式に含まれるデータ項目の数を累積した値とモデル破壊が発生しなかった相関モデルの回帰式に含まれるデータ項目の数を累積した値との比を用いることができる。
 本実施形態におけるモデル破壊情報に必要な情報は、警報条件およびデータ項目の異常度の算出方法に依存する。例えば、警報条件が、モデル破壊の発生した相関モデルの数にかかわるものであれば、モデル破壊情報に、モデル破壊が発生した相関モデルの数を特定可能な情報を含ませればよい。また、データ項目の異常度の算出方法が、データ項目ごとにモデル破壊が発生した回帰式に含まれるデータ項目の数を累積した値を用いるものであれば、モデル破壊情報に、モデル破壊が発生した相関モデルの回帰式に用いたデータ項目を示す情報や、モデル破壊が発生した相関モデルを特定可能な情報を含ませればよい。また、データ項目の異常度の算出方法が、モデル破壊が発生した回帰式に含まれるデータ項目の数にかかわる値(累積値等)と、モデル破壊が発生しなかった回帰式に含まれるデータ項目の数にかかわる値(累積値等)とを用いるもの(例えば、これらの比等)であれば、モデル破壊情報に、モデル破壊が発生した回帰式とモデル破壊が発生しなかった回帰式とを特定可能な情報を含ませればよい。
 次に、本実施形態のシステム分析装置400の動作を説明する。図14は、本実施形態のシステム分析装置400の動作の一例を示すフローチャートである。なお、以下では、図8に示した動作と同一の動作については同一の符号を付し、説明を省略する。
 図14に示すように、本実施形態のシステム分析装置400では、ステップS107で、異常判定手段132がシステムの状態を異常と判定すると、その旨もしくはモデル破壊情報を運用者または被監視システムに通知するとともに、モデル破壊情報をモデル破壊記憶手段434に記憶する。
 次いで、異常要因抽出手段433が、モデル破壊記憶手段434に新たに記憶されたモデル破壊情報に基づいて、1つ以上の異常要因候補データ項目を抽出し、抽出した異常要因候補データ項目群を示す情報を運用者または被監視システムに通知する(ステップS401)。
 次に、本実施形態における異常要因候補データ項目群の抽出方法を、具体例を用いて説明する。以下では、データ項目の異常度を、分析モデルに含まれる相関モデルのうち、モデル破壊が発生した相関モデルの回帰式に含まれるデータ項目の数を累積した値と、モデル破壊が発生しなかった相関モデルの回帰式に含まれるデータ項目の数を累積した値との比とした場合を例に説明する。
 図15は、異常要因候補データ項目群の抽出方法の一例を示す説明図である。本例において、システム分析装置400が用いる分析モデルには、7つの相関モデルが含まれる。分析モデルを構成する7つの相関モデルの回帰式は、それぞれ、B=f(A,B),C=f(A,C),B=f(B,D),C=f(C,D),G=f(G,H),C=f10(A,B,C)およびC=f11(B,C,D)である。なお、図15の上段には、分析モデルに含まれる相関モデル群のグラフ構造(該相関モデル群に用いられるデータ項目の関係を模式的に示した構造図)が示されている。なお、当該グラフ構造では、共通データ項目に対応する結節点は図示省略されている。また、図中の「共通メトリック」は代表データ項目を表している。
 今、データ項目Cに異常に伴う変化が発生し、分析モデルの相関モデルのうち、回帰式C=f(C,D),C=f10(A,B,C),C=f11(B,C,D)を有する相関モデルに、モデル破壊が発生したとする。この場合、データ項目A,B,C,D,GおよびHの異常度は、それぞれ、1/3,2/4,3/4,2/3,0/1および0/1と算出される。各データ項目を、その異常度の降順で並べ替えると、C→D→B→A→{G、H}となる。本例では、この順で、異常要因の可能性が高いといえる。通知する異常要因候補データ項目の個数=2であったとすると、異常要因候補データ項目群を示す情報として、データ項目CおよびDを示す情報(例えば、それらのデータ項目名)が、運用者または被監視システムに通知される。
 以上のように、本実施形態によれば、運用者または被監視システムが、システム分析装置400から通知された情報を基に、異常要因を絞り込むことができる。
 なお、上記では、異常要因候補データ項目群を示す情報として、データ項目名を通知する例を示したが、データ項目名に加えて異常度も通知するようにした方が、確認すべきデータ項目に対して優先度を与えられるので、好ましい。
 図16は、本発明によるシステム分析装置の主要部を示すブロック図である。図16に示すように、本発明によるシステム分析装置は、主要な構成として、分析モデル生成手段51を備える。
 分析モデル生成手段51(例えば、分析モデル生成手段12、分析モデル生成手段32)は、対象システムの複数種のデータ項目に関する情報の集合である状態情報を用いて、対象システムの状態を分析するための分析モデルを生成する手段であって、データ項目分類手段511と、多体相関モデル生成手段512と、モデル抽出手段513とを含む。
 図16に示す構成において、分析モデルは、3つ以上のデータ項目を用いて構成される回帰式と、当該回帰式の予測誤差の許容範囲とを少なくとも有する相関モデルである多体相関モデルを1つ以上含む。
 データ項目分類手段511(例えば、データ項目分類手段1211)は、状態情報に含まれるデータ項目群を1つ以上のグループに分類する。より具体的には、データ項目分類手段511は、分類後の少なくとも1つのグループにおいて、当該グループに含まれるデータ項目から任意に選択された1つのデータ項目である第1データ項目と、該第1データ項目を除く該第1データ項目と同一のグループに含まれるデータ項目の1つである第2データ項目とを用いて構築される回帰式の優良度を、第1データ項目に対して取りうる第2データ項目の全ての組み合わせについて算出したとき、該回帰式の優良度の少なくとも1つが、所定の優良モデル条件を満たすように、データ項目を分類する。
 多体相関モデル生成手段512(例えば、多体相関モデル生成手段1212)は、データ項目分類手段511によって分類されたグループごとに、該グループに含まれるデータ項目の中から、少なくとも1つの代表データ項目を選出し、選出した代表データ項目を除く該グループに含まれるデータ項目のうちの任意の2つのデータ項目に対する全ての組み合わせについて、当該2つのデータ項目と、代表データ項目とを用いて構成される回帰式を構築するとともに、該回帰式の予測誤差の許容範囲と、該回帰式の優良度とを算出し、構築した回帰式と、該回帰式の予測誤差の許容範囲とを少なくとも有する多体相関モデルを生成する。
 モデル抽出手段513(例えば、モデル抽出手段122)は、多体相関モデル生成手段512によって生成された多体相関モデル群の中から、回帰式の優良度が予め定められている多体相関モデルの優良モデル条件を満たす多体相関モデルを、分析モデルに含ませる多体相関モデルとして抽出する。
 このような構成を備えることによって、多重共線性の問題を回避しつつ、データ項目固有の変動に注目して予測誤差を算出できる多体相関モデルを含む分析モデルを生成できるので、そのような分析モデルを用いてシステムの状態を分析することにより、対象システムが複雑であったり、データ項目間に多重共線性があったりしても、精度よく対象システムの状態を分析できる。
 また、図17は、本発明によるシステム分析装置の他の構成例を示すブロック図である。本発明によるシステム分析装置は、例えば、図17に示すような構成であってもよい。図17に示すシステム分析装置は、上述した分析モデル生成手段51に加えて、分析モデル記憶手段52と、分析手段53とを備えている。
 分析モデル記憶手段52(例えば、分析モデル記憶手段15)は、分析モデル生成手段51によって生成された分析モデルの情報を記憶する。
 分析手段53(例えば、分析手段13、分析手段43)は、状態情報が新たに取得されると、前記分析モデル記憶手段に記憶された前記分析モデルを用いて、システムの状態を分析する手段であって、モデル破壊検出手段531と、異常判定手段532とを含む。
 モデル破壊検出手段531(例えば、モデル破壊検出手段131)は、新たに収集された前記状態情報を用いて、前記分析モデル記憶手段に記憶されている分析モデルの情報により示される分析モデルに含まれる各相関モデルについて、当該相関モデルの回帰式の目的変数の予測値が、当該相関モデルの回帰式の予測誤差の許容範囲を超える現象であるモデル破壊の発生の有無を検出する。
 異常判定手段532(例えば、異常判定手段132)は、モデル破壊検出手段531による検出結果に基づいて、システムの状態が異常か正常かを判定する。
 このような構成を有することによって、対象システムが複雑であったり、データ項目間に多重共線性があったりしても、精度よく対象システムの状態を分析できる。
 また、上記の実施形態の一部または全部は、以下の付記のようにも記載されうるが、以下には限られない。
 (付記1)対象システムの複数種のデータ項目に関する情報の集合である状態情報を用いて、対象システムの状態を分析するための分析モデルを生成する分析モデル生成手段を備え、分析モデルは、3つ以上のデータ項目を用いて構成される回帰式と、当該回帰式の予測誤差の許容範囲とを少なくとも有する相関モデルである多体相関モデルを1つ以上含み、分析モデル生成手段は、状態情報に含まれるデータ項目群を1つ以上のグループに分類するデータ項目分類手段と、データ項目分類手段によって分類されたグループごとに、該グループに含まれるデータ項目の中から、少なくとも1つの代表データ項目を選出し、選出した代表データ項目を除く該グループに含まれるデータ項目のうちの任意の2つのデータ項目に対する全ての組み合わせについて、当該2つのデータ項目と、代表データ項目とを用いて構成される回帰式を構築するとともに、該回帰式の予測誤差の許容範囲と、該回帰式の優良度とを算出し、構築した回帰式と、該回帰式の予測誤差の許容範囲とを少なくとも有する多体相関モデルを生成する多体相関モデル生成手段と、多体相関モデル生成手段によって生成された多体相関モデル群の中から、回帰式の優良度が予め定められている多体相関モデルの優良モデル条件を満たす多体相関モデルを、分析モデルに含ませる多体相関モデルとして抽出するモデル抽出手段とを含み、データ項目分類手段は、分類後の少なくとも1つのグループにおいて、当該グループに含まれるデータ項目から任意に選択された1つのデータ項目である第1データ項目と、該第1データ項目を除く該第1データ項目と同一のグループに含まれるデータ項目の1つである第2データ項目とを用いて構築される回帰式の優良度を、第1データ項目に対して取りうる第2データ項目の全ての組み合わせについて算出したとき、該回帰式の優良度の少なくとも1つが、所定の優良モデル条件を満たすように、データ項目を分類することを特徴とする分析モデル生成装置。
 (付記2)コンピュータに、対象システムの複数種のデータ項目に関する情報の集合である状態情報に含まれるデータ項目群を、分類後の少なくとも1つのグループにおいて、当該グループに含まれるデータ項目から任意に選択された1つのデータ項目である第1データ項目と、該第1データ項目を除く該第1データ項目と同一のグループに含まれるデータ項目の1つである第2データ項目とを用いて構築される回帰式の優良度を、第1データ項目に対して取りうる第2データ項目の全ての組み合わせについて算出したとき、該回帰式の優良度の少なくとも1つが、所定の優良モデル条件を満たすように、1つ以上のグループに分類するデータ項目分類処理、および状態情報を用いて、分類されたグループごとに、該グループに含まれるデータ項目の中から、少なくとも1つの代表データ項目を選出し、選出した代表データ項目を除く該グループに含まれるデータ項目のうちの任意の2つのデータ項目に対する全ての組み合わせについて、当該2つのデータ項目と、代表データ項目とを用いて構成される回帰式を構築するとともに、該回帰式の予測誤差の許容範囲と、該回帰式の優良度とを算出して、構築した回帰式と、該回帰式の予測誤差の許容範囲とを少なくとも有する多体相関モデルを生成する多体相関モデル生成処理を実行させるための分析モデル生成プログラム。
 以上、実施形態および実施例を参照して本願発明を説明したが、本願発明は上記の実施形態および実施例に限定されるものではない。本願発明の構成や詳細には、本願発明のスコープ内で当業者が理解し得る様々な変更をすることができる。
 この出願は、2014年3月27日に出願された日本特許出願2014-065120を基礎とする優先権を主張し、その開示の全てをここに取り込む。
 本発明は、システムの障害や障害兆候の検知、およびそれらの要因抽出の用途に好適に適用できる。
 11 状態情報収集手段
 12、32 分析モデル生成手段
 121、321 分析モデル候補生成手段
 1211 データ項目分類手段
 1212 多体相関モデル生成手段
 3213 相互相関モデル生成手段
 122、322 モデル抽出手段
 13、43 分析手段
 131 モデル破壊検出手段
 132 異常判定手段
 433 異常要因抽出手段
 434 モデル破壊記憶手段
 14 状態情報記憶手段
 15 分析モデル記憶手段
 100、300、400 システム分析装置
 200 被監視装置
 51 分析モデル生成手段
 511 データ項目分類手段
 512 多体相関モデル生成手段
 513 モデル抽出手段
 52 分析モデル記憶手段
 53 分析手段
 531 モデル破壊検出手段
 532 異常判定手段
 701A 相互相関モデル群
 701B、703B 優良相互相関モデル群
 701C 優良モデル条件
 701D、703D グラフ構造
 701E、703E1、703E2 スコア
 703F1、703F2 クラスタ
 702A 多体相関モデル群
 702B 優良多体相関モデル群
 702C 優良モデル条件

Claims (10)

  1.  対象システムの複数種のデータ項目に関する情報の集合である状態情報を用いて、前記対象システムの状態を分析するための分析モデルを生成する分析モデル生成手段を備え、
     前記分析モデルは、3つ以上のデータ項目を用いて構成される回帰式と、当該回帰式の予測誤差の許容範囲とを少なくとも有する相関モデルである多体相関モデルを1つ以上含み、
     前記分析モデル生成手段は、
     前記状態情報に含まれるデータ項目群を1つ以上のグループに分類するデータ項目分類手段と、
     前記データ項目分類手段によって分類されたグループごとに、該グループに含まれるデータ項目の中から、少なくとも1つの代表データ項目を選出し、選出した代表データ項目を除く該グループに含まれるデータ項目のうちの任意の2つのデータ項目に対する全ての組み合わせについて、当該2つのデータ項目と、前記代表データ項目とを用いて構成される回帰式を構築するとともに、該回帰式の予測誤差の許容範囲と、該回帰式の優良度とを算出し、構築した前記回帰式と、該回帰式の予測誤差の許容範囲とを少なくとも有する多体相関モデルを生成する多体相関モデル生成手段と、
     前記多体相関モデル生成手段によって生成された多体相関モデル群の中から、回帰式の優良度が予め定められている多体相関モデルの優良モデル条件を満たす多体相関モデルを、前記分析モデルに含ませる多体相関モデルとして抽出するモデル抽出手段とを含み、
     前記データ項目分類手段は、分類後の少なくとも1つのグループにおいて、当該グループに含まれるデータ項目から任意に選択された1つのデータ項目である第1データ項目と、該第1データ項目を除く該第1データ項目と同一のグループに含まれるデータ項目の1つである第2データ項目とを用いて構築される回帰式の優良度を、前記第1データ項目に対して取りうる第2データ項目の全ての組み合わせについて算出したとき、該回帰式の優良度の少なくとも1つが、所定の優良モデル条件を満たすように、データ項目を分類する
     ことを特徴とするシステム分析装置。
  2.  分析モデル生成手段によって生成された分析モデルの情報を記憶する分析モデル記憶手段と、
     状態情報が新たに取得されると、前記分析モデル記憶手段に記憶された前記分析モデルを用いて、システムの状態を分析する分析手段とを備え、
     前記分析手段は、
     新たに収集された前記状態情報を用いて、前記分析モデル記憶手段に記憶されている分析モデルの情報により示される分析モデルに含まれる各相関モデルについて、当該相関モデルの回帰式の目的変数の予測値が、当該相関モデルの回帰式の予測誤差の許容範囲を超える現象であるモデル破壊の発生の有無を検出するモデル破壊検出手段と、
     前記モデル破壊検出手段による検出結果に基づいて、システムの状態が異常か正常かを判定する異常判定手段とを含む
     請求項1に記載のシステム分析装置。
  3.  分析手段は、
     異常判定手段によって異常と判定された場合に、モデル破壊検出手段による検出結果に基づいて、異常要因の候補とするデータ項目を抽出する異常要因抽出手段を含み、
     前記異常要因抽出手段は、前記モデル破壊検出手段による検出の結果示される、データ項目別のモデル破壊の発生状況に基づいて、データ項目別に異常の度合いを示す異常度を算出し、算出したデータ項目別の異常度に基づいて、異常要因の候補とするデータ項目を抽出する
     請求項2に記載のシステム分析装置。
  4.  代表データ項目は、選出対象とされたグループ内の任意の2つのデータ項目を用いて構成される各回帰式の優良度を用いて算出される当該グループに属するデータ項目別の統計値に基づいて、選出される
     請求項1から請求項3のうちのいずれか1項に記載のシステム分析装置。
  5.  データ項目別の統計値は、代表データ項目の選出対象とされたグループに属する各データ項目について、当該グループ内の任意の2つのデータ項目を用いて構成される回帰式のうち当該データ項目を用いて構成される回帰式の優良度を用いて算出される、前記優良度の平均値、中央値、最小値、最大値、累積値のいずれかである
     請求項4に記載のシステム分析装置。
  6.  代表データ項目は、所定期間分の状態情報によって示される、選出対象とされたグループ内の各データ項目の情報の変化点の出現の早さに基づいて選出される
     請求項1から請求項5のうちのいずれか1項に記載のシステム分析装置。
  7.  分析モデルは、2つのデータ項目を用いて構成される回帰式と、当該回帰式の予測誤差の許容範囲とを少なくとも有する相関モデルである相互相関モデルをさらに1つ以上含み、
     分析モデル生成手段は、
     状態情報に含まれるデータ項目群の任意の2つのデータ項目に対する全ての組み合わせについて、当該2つのデータ項目を用いて構成される回帰式を構築するとともに、該回帰式の予測誤差の許容範囲と、該回帰式の優良度とを算出して、構築した前記回帰式と、該回帰式の予測誤差の許容範囲とを少なくとも有する相互相関モデルを生成する相互相関モデル生成手段を含み、
     モデル抽出手段は、多体相関モデル生成手段によって生成された多体相関モデル群の中から、回帰式の優良度が予め定められている多体相関モデルの優良モデル条件を満たす多体相関モデルを、前記分析モデルに含ませる多体相関モデルとして抽出するとともに、前記相互相関モデル生成手段によって生成された相互相関モデル群の中から、回帰式の優良度が予め定められている相互相関モデルの優良モデル条件を満たす相互相関モデルを、前記分析モデルに含ませる相互相関モデルとして抽出する
     請求項1から請求項6のうちのいずれか1項に記載のシステム分析装置。
  8.  データ項目分類手段が、対象システムの複数種のデータ項目に関する情報の集合である状態情報に含まれるデータ項目群を、分類後の少なくとも1つのグループにおいて、当該グループに含まれるデータ項目から任意に選択された1つのデータ項目である第1データ項目と、該第1データ項目を除く該第1データ項目と同一のグループに含まれるデータ項目の1つである第2データ項目とを用いて構築される回帰式の優良度を、前記第1データ項目に対して取りうる第2データ項目の全ての組み合わせについて算出したとき、該回帰式の優良度の少なくとも1つが、所定の優良モデル条件を満たすように、1つ以上のグループに分類し、
     多体相関モデル生成手段が、前記状態情報を用いて、分類された前記グループごとに、該グループに含まれるデータ項目の中から、少なくとも1つの代表データ項目を選出し、選出した代表データ項目を除く該グループに含まれるデータ項目のうちの任意の2つのデータ項目に対する全ての組み合わせについて、当該2つのデータ項目と、前記代表データ項目とを用いて構成される回帰式を構築するとともに、該回帰式の予測誤差の許容範囲と、該回帰式の優良度とを算出して、構築した前記回帰式と、該回帰式の予測誤差の許容範囲とを少なくとも有する多体相関モデルを生成し、
     モデル抽出手段が、生成された前記多体相関モデル群の中から、回帰式の優良度が予め定められている多体相関モデルの優良モデル条件を満たす多体相関モデルを、前記対象システムの状態を分析するための分析モデルに含ませる多体相関モデルとして抽出する
     ことを特徴とする分析モデル生成方法。
  9.  データ項目分類手段が、対象システムの複数種のデータ項目に関する情報の集合である状態情報に含まれるデータ項目群を、分類後の少なくとも1つのグループにおいて、当該グループに含まれるデータ項目から任意に選択された1つのデータ項目である第1データ項目と、該第1データ項目を除く該第1データ項目と同一のグループに含まれるデータ項目の1つである第2データ項目とを用いて構築される回帰式の優良度を、前記第1データ項目に対して取りうる第2データ項目の全ての組み合わせについて算出したとき、該回帰式の優良度の少なくとも1つが、所定の優良モデル条件を満たすように、1つ以上のグループに分類し、
     多体相関モデル生成手段が、前記状態情報を用いて、分類された前記グループごとに、該グループに含まれるデータ項目の中から、少なくとも1つの代表データ項目を選出し、選出した代表データ項目を除く該グループに含まれるデータ項目のうちの任意の2つのデータ項目に対する全ての組み合わせについて、当該2つのデータ項目と、前記代表データ項目とを用いて構成される回帰式を構築するとともに、該回帰式の予測誤差の許容範囲と、該回帰式の優良度とを算出して、構築した前記回帰式と、該回帰式の予測誤差の許容範囲とを少なくとも有する多体相関モデルを生成し、
     モデル抽出手段が、生成された前記多体相関モデル群の中から、回帰式の優良度が予め定められている多体相関モデルの優良モデル条件を満たす多体相関モデルを、分析モデルに含ませる多体相関モデルとして抽出し、抽出された前記多体相関モデル群を含む分析モデルの情報を所定の記憶装置に記憶し、
     モデル破壊検出手段が、状態情報が新たに取得されると、新たに収集された前記状態情報を用いて、前記所定の記憶装置に記憶されている分析モデルの情報により示される分析モデルに含まれる各相関モデルについて、当該相関モデルの回帰式の目的変数の予測値が、当該相関モデルの回帰式の予測誤差の許容範囲を超える現象であるモデル破壊の発生の有無を検出し、
     異常判定手段が、前記モデル破壊検出手段による検出結果に基づいて、システムの状態が異常か正常かを判定する
     ことを特徴とするシステム分析方法。
  10.  コンピュータに、
     対象システムの複数種のデータ項目に関する情報の集合である状態情報に含まれるデータ項目群を、分類後の少なくとも1つのグループにおいて、当該グループに含まれるデータ項目から任意に選択された1つのデータ項目である第1データ項目と、該第1データ項目を除く該第1データ項目と同一のグループに含まれるデータ項目の1つである第2データ項目とを用いて構築される回帰式の優良度を、前記第1データ項目に対して取りうる第2データ項目の全ての組み合わせについて算出したとき、該回帰式の優良度の少なくとも1つが、所定の優良モデル条件を満たすように、1つ以上のグループに分類するデータ項目分類処理、
     前記状態情報を用いて、分類された前記グループごとに、該グループに含まれるデータ項目の中から、少なくとも1つの代表データ項目を選出し、選出した代表データ項目を除く該グループに含まれるデータ項目のうちの任意の2つのデータ項目に対する全ての組み合わせについて、当該2つのデータ項目と、前記代表データ項目とを用いて構成される回帰式を構築するとともに、該回帰式の予測誤差の許容範囲と、該回帰式の優良度とを算出して、構築した前記回帰式と、該回帰式の予測誤差の許容範囲とを少なくとも有する多体相関モデルを生成する多体相関モデル生成処理、
     生成された前記多体相関モデル群の中から、回帰式の優良度が予め定められている多体相関モデルの優良モデル条件を満たす多体相関モデルを、分析モデルに含ませる多体相関モデルとして抽出するモデル抽出処理、
     抽出された前記多体相関モデル群を含む分析モデルの情報を、所定の記憶装置に記憶する処理、
     状態情報が新たに取得されると、新たに収集された前記状態情報を用いて、前記所定の記憶装置に記憶されている分析モデルの情報により示される分析モデルに含まれる各相関モデルについて、当該相関モデルの回帰式の目的変数の予測値が、当該相関モデルの回帰式の予測誤差の許容範囲を超える現象であるモデル破壊の発生の有無を検出するモデル破壊検出処理、および
     前記モデル破壊検出処理での検出結果に基づいて、システムの状態が異常か正常かを判定する異常判定処理
     を実行させるためのシステム分析プログラム。
PCT/JP2014/005336 2014-03-27 2014-10-21 システム分析装置、分析モデル生成方法、システム分析方法およびシステム分析プログラム WO2015145500A1 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2016509613A JP6493389B2 (ja) 2014-03-27 2014-10-21 システム分析装置、分析モデル生成方法、システム分析方法およびシステム分析プログラム
US15/129,402 US20170103148A1 (en) 2014-03-27 2014-10-21 System-analyzing device, analysis-model generation method, system analysis method, and system-analyzing program
EP14887291.4A EP3125057B1 (en) 2014-03-27 2014-10-21 System-analyzing device, analysis-model generation method, system analysis method, and system-analyzing program

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2014-065120 2014-03-27
JP2014065120 2014-03-27

Publications (1)

Publication Number Publication Date
WO2015145500A1 true WO2015145500A1 (ja) 2015-10-01

Family

ID=54194102

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2014/005336 WO2015145500A1 (ja) 2014-03-27 2014-10-21 システム分析装置、分析モデル生成方法、システム分析方法およびシステム分析プログラム

Country Status (4)

Country Link
US (1) US20170103148A1 (ja)
EP (1) EP3125057B1 (ja)
JP (1) JP6493389B2 (ja)
WO (1) WO2015145500A1 (ja)

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017215832A (ja) * 2016-06-01 2017-12-07 株式会社神戸製鋼所 回転機械の運転状態を診断する診断装置及び診断方法
JPWO2017064855A1 (ja) * 2015-10-13 2018-08-02 日本電気株式会社 構造物異常検知システム、構造物異常検知方法及び記録した記録媒体
JP2018180759A (ja) * 2017-04-07 2018-11-15 株式会社日立製作所 システム分析装置、及びシステム分析方法
JP2018538587A (ja) * 2016-02-01 2018-12-27 ▲騰▼▲訊▼科技(深▲セン▼)有限公司 リスク評価方法およびシステム
WO2020105179A1 (ja) * 2018-11-22 2020-05-28 日本電気株式会社 情報処理装置、制御方法、及びプログラム
JPWO2019026193A1 (ja) * 2017-08-02 2020-07-02 日本電気株式会社 情報処理装置、情報処理システム、情報処理方法、及び、プログラム
US10866311B2 (en) 2017-09-15 2020-12-15 Kabushiki Kaisha Toshiba Distance measuring device
JP2021039565A (ja) * 2019-09-03 2021-03-11 東芝情報システム株式会社 状態変動検出補助装置、状態変動検出装置、状態変動検出補助用プログラム、及び状態変動検出用プログラム
JP2021168364A (ja) * 2020-04-13 2021-10-21 キヤノン株式会社 情報処理装置、検出方法、プログラム、基板処理システム、及び物品の製造方法
US11216741B2 (en) 2017-03-13 2022-01-04 Kabushiki Kaisha Toshiba Analysis apparatus, analysis method, and non-transitory computer readable medium
TWI838606B (zh) 2020-04-13 2024-04-11 日商佳能股份有限公司 資訊處理裝置、檢測方法、程式、基板處理系統及物品之製造方法

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11080613B1 (en) * 2016-04-29 2021-08-03 EMC IP Holding Company LLC Process monitoring based on large-scale combination of time series data
JP6879239B2 (ja) 2018-03-14 2021-06-02 オムロン株式会社 異常検知システム、サポート装置およびモデル生成方法
CN108595892A (zh) * 2018-05-11 2018-09-28 南京林业大学 基于时间差分模型的软测量建模方法
JP7124648B2 (ja) * 2018-11-06 2022-08-24 株式会社島津製作所 データ処理装置及びデータ処理プログラム
CN110414713A (zh) * 2019-06-27 2019-11-05 电子科技大学 一种基于同步数据流压缩的径流实时预测方法
WO2023215903A1 (en) * 2022-05-06 2023-11-09 Mapped Inc. Automatic link prediction for devices in commercial and industrial environments

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003314933A (ja) * 2002-04-17 2003-11-06 Tokyo Gas Co Ltd ヒートポンプ熱交換器の異常検出装置
JP2006350698A (ja) * 2005-06-16 2006-12-28 Taiyo Nippon Sanso Corp 異常診断装置、異常診断方法、異常診断プログラム
JP2010218187A (ja) * 2009-03-17 2010-09-30 Fuji Electric Holdings Co Ltd 製造条件調整装置
JP5108116B2 (ja) * 2009-01-14 2012-12-26 株式会社日立製作所 装置異常監視方法及びシステム
WO2013111560A1 (ja) * 2012-01-23 2013-08-01 日本電気株式会社 運用管理装置、運用管理方法、及びプログラム

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5297272B2 (ja) * 2009-06-11 2013-09-25 株式会社日立製作所 装置異常監視方法及びシステム
WO2012086444A1 (ja) * 2010-12-24 2012-06-28 日本電気株式会社 監視データ分析装置、監視データ分析方法および監視データ分析プログラム
JP5284433B2 (ja) * 2011-09-14 2013-09-11 株式会社東芝 プロセス監視・診断・支援装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003314933A (ja) * 2002-04-17 2003-11-06 Tokyo Gas Co Ltd ヒートポンプ熱交換器の異常検出装置
JP2006350698A (ja) * 2005-06-16 2006-12-28 Taiyo Nippon Sanso Corp 異常診断装置、異常診断方法、異常診断プログラム
JP5108116B2 (ja) * 2009-01-14 2012-12-26 株式会社日立製作所 装置異常監視方法及びシステム
JP2010218187A (ja) * 2009-03-17 2010-09-30 Fuji Electric Holdings Co Ltd 製造条件調整装置
WO2013111560A1 (ja) * 2012-01-23 2013-08-01 日本電気株式会社 運用管理装置、運用管理方法、及びプログラム

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
See also references of EP3125057A4 *

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPWO2017064855A1 (ja) * 2015-10-13 2018-08-02 日本電気株式会社 構造物異常検知システム、構造物異常検知方法及び記録した記録媒体
JP2018538587A (ja) * 2016-02-01 2018-12-27 ▲騰▼▲訊▼科技(深▲セン▼)有限公司 リスク評価方法およびシステム
JP2017215832A (ja) * 2016-06-01 2017-12-07 株式会社神戸製鋼所 回転機械の運転状態を診断する診断装置及び診断方法
US11216741B2 (en) 2017-03-13 2022-01-04 Kabushiki Kaisha Toshiba Analysis apparatus, analysis method, and non-transitory computer readable medium
JP2018180759A (ja) * 2017-04-07 2018-11-15 株式会社日立製作所 システム分析装置、及びシステム分析方法
US11941495B2 (en) 2017-08-02 2024-03-26 Nec Corporation Information processing device, information processing method, and recording medium
JPWO2019026193A1 (ja) * 2017-08-02 2020-07-02 日本電気株式会社 情報処理装置、情報処理システム、情報処理方法、及び、プログラム
US10866311B2 (en) 2017-09-15 2020-12-15 Kabushiki Kaisha Toshiba Distance measuring device
JPWO2020105179A1 (ja) * 2018-11-22 2021-09-30 日本電気株式会社 情報処理装置、制御方法、及びプログラム
JP7211429B2 (ja) 2018-11-22 2023-01-24 日本電気株式会社 情報処理装置、制御方法、及びプログラム
WO2020105179A1 (ja) * 2018-11-22 2020-05-28 日本電気株式会社 情報処理装置、制御方法、及びプログラム
JP2021039565A (ja) * 2019-09-03 2021-03-11 東芝情報システム株式会社 状態変動検出補助装置、状態変動検出装置、状態変動検出補助用プログラム、及び状態変動検出用プログラム
JP2021168364A (ja) * 2020-04-13 2021-10-21 キヤノン株式会社 情報処理装置、検出方法、プログラム、基板処理システム、及び物品の製造方法
JP7423396B2 (ja) 2020-04-13 2024-01-29 キヤノン株式会社 情報処理装置、検出方法、プログラム、基板処理システム、及び物品の製造方法
TWI838606B (zh) 2020-04-13 2024-04-11 日商佳能股份有限公司 資訊處理裝置、檢測方法、程式、基板處理系統及物品之製造方法

Also Published As

Publication number Publication date
EP3125057B1 (en) 2019-07-03
JP6493389B2 (ja) 2019-04-03
US20170103148A1 (en) 2017-04-13
EP3125057A4 (en) 2018-06-06
JPWO2015145500A1 (ja) 2017-04-13
EP3125057A1 (en) 2017-02-01

Similar Documents

Publication Publication Date Title
JP6493389B2 (ja) システム分析装置、分析モデル生成方法、システム分析方法およびシステム分析プログラム
JP6658540B2 (ja) システム分析装置、システム分析方法およびプログラム
KR102011620B1 (ko) 이상 데이터의 중요도 판정 장치 및 이상 데이터의 중요도 판정 방법
WO2019142331A1 (ja) 障害予測システムおよび障害予測方法
JP5740459B2 (ja) 設備状態監視方法
JP5431235B2 (ja) 設備状態監視方法およびその装置
JP5538597B2 (ja) 異常検知方法及び異常検知システム
JP5753286B1 (ja) 情報処理装置、診断方法、およびプログラム
JP5868216B2 (ja) クラスタリング装置及びクラスタリングプログラム
JP5875726B1 (ja) 異常予兆診断装置のプリプロセッサ及びその処理方法
WO2010095314A1 (ja) 異常検知方法及び異常検知システム
JP2009536971A (ja) 異常事象検出(aed)技術のポリマープロセスへの適用
JP6164311B1 (ja) 情報処理装置、情報処理方法、及び、プログラム
KR20170078252A (ko) 시계열의 데이터를 모니터링 하는 방법 및 그 장치
JP7469991B2 (ja) 診断装置及びパラメータ調整方法
CN111241683A (zh) 一种基于动态时间规整的设备工况故障预测方法和系统
JPWO2019073512A1 (ja) システム分析方法、システム分析装置、および、プログラム
JP2023518537A (ja) 製油所の単数または複数の蒸留塔の目詰まりの予測方法、コンピュータプログラムおよび関連する予測システム
Hu et al. A multi-feature-based fault diagnosis method based on the weighted timeliness broad learning system
KR20120074630A (ko) 설비 이상을 예측하기 위한 의사 결정 나무 구축 방법 및 그 시스템
JP7330058B2 (ja) 性能診断システム及びその応用システム
JP7012928B2 (ja) 状態変動検出装置及び状態変動検出用プログラム
Viswanathan et al. An Application of Sensor and Streaming Analytics to Oil Production.
JP2017182450A (ja) 管理装置、これを備える管理システム、及び、管理方法

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 14887291

Country of ref document: EP

Kind code of ref document: A1

ENP Entry into the national phase

Ref document number: 2016509613

Country of ref document: JP

Kind code of ref document: A

WWE Wipo information: entry into national phase

Ref document number: 15129402

Country of ref document: US

NENP Non-entry into the national phase

Ref country code: DE

REEP Request for entry into the european phase

Ref document number: 2014887291

Country of ref document: EP

WWE Wipo information: entry into national phase

Ref document number: 2014887291

Country of ref document: EP