WO2019142344A1 - 分析装置、分析方法、及び、記録媒体 - Google Patents

分析装置、分析方法、及び、記録媒体 Download PDF

Info

Publication number
WO2019142344A1
WO2019142344A1 PCT/JP2018/001725 JP2018001725W WO2019142344A1 WO 2019142344 A1 WO2019142344 A1 WO 2019142344A1 JP 2018001725 W JP2018001725 W JP 2018001725W WO 2019142344 A1 WO2019142344 A1 WO 2019142344A1
Authority
WO
WIPO (PCT)
Prior art keywords
time series
explanation
feature
value
influence
Prior art date
Application number
PCT/JP2018/001725
Other languages
English (en)
French (fr)
Inventor
毅彦 溝口
Original Assignee
日本電気株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 日本電気株式会社 filed Critical 日本電気株式会社
Priority to US16/960,687 priority Critical patent/US20200342048A1/en
Priority to PCT/JP2018/001725 priority patent/WO2019142344A1/ja
Priority to JP2019565673A priority patent/JP7028259B2/ja
Publication of WO2019142344A1 publication Critical patent/WO2019142344A1/ja

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2218/00Aspects of pattern recognition specially adapted for signal processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2218/00Aspects of pattern recognition specially adapted for signal processing
    • G06F2218/12Classification; Matching
    • G06F2218/16Classification; Matching by matching signal segments
    • G06F2218/20Classification; Matching by matching signal segments by applying autoregressive analysis

Definitions

  • the present invention relates to an analyzer, an analysis method, and a recording medium.
  • Statistical methods such as regression analysis are widely used as methods for analyzing the state of a system.
  • the relationship between the objective variable related to the index of the system and the other explanatory variables is clarified, and the explanatory variables having a strong influence on the change of the value of the objective variable are specified Be done.
  • the statistical method is applied to the observation values of various items of the system acquired by the sensor to affect the quality of the manufactured product. Influencing factors are identified.
  • multivariate analysis is performed with an item representing quality as an objective variable and other items as explanatory variables. The user determines the degree of influence of each explanatory variable on the change of the value of the objective variable (that is, the degree of influence of each explanatory variable) based on the contribution rate of each explanatory variable, the degree of association, etc. calculated by multivariate analysis Can know).
  • Patent Document 1 describes a method of segmenting data based on nominal scale data included in explanatory variables, and identifying an influence factor by multivariate analysis for each segment. It is done.
  • Patent Document 2 describes a technique for performing factor analysis using a feature time series obtained from the explanation time series in order to clarify appropriate pre-processing to be performed on the explanation time series to be analyzed. ing.
  • the influence degree of the feature time series to the change of the value of the purpose time series is calculated, and the influence degree of the explanation time series to the change of the value of the object time series is calculated based on the influence degree of the feature time series. calculate.
  • Patent Document 3 describes a technique for generating an approximate expression of air temperature and tank water level, and detecting a leak using a difference between the water level predicted from the approximate expression and the actually measured water level.
  • Non-Patent Document 1 describes that when the objective variable is a discrete value, the degree of influence of the explanatory variable can be estimated with high accuracy by a method called L1 regularized logistic regression.
  • Non-Patent Document 2 describes a random forest classifier that configures a classifier by using a plurality of decision trees.
  • an external factor having a significantly strong correlation with changes in the state of the system such as temperature, weather, and climate.
  • an external factor or a factor related to the objective variable may be identified as an influence factor for the objective variable, and an explanatory variable other than the external factor that should be originally detected may not be identified as an influence factor. For this reason, it is not possible to take an appropriate action such as adjusting or controlling the system based on the identified factor.
  • Patent Document 1 and Patent Document 2 described above do not disclose identifying the influential factor in consideration of such external factors.
  • the object of the present invention is to solve the above-mentioned problems, to change the state of the system even when there is an external factor having a strong correlation with the change of the state of the system and the time series to be analyzed require pre-processing. It is an object of the present invention to provide an analyzer, an analysis method, and a recording medium that can accurately identify factors other than external factors that affect.
  • the analysis device is a time difference between a target time series value and a prediction value of the target time series generated based on a first explanation time series value among a plurality of description time series.
  • Time series acquiring means for acquiring one or more second explanation time series among the plurality of explanation time series, and each of the one or more second explanation time series;
  • Feature time series conversion means for extracting a feature quantity from the explanation time series and converting the feature quantity into a feature time series, the one or more second description time series feature time series, and the difference time series
  • An influence degree calculation unit that calculates an influence degree of each of the one or more second explanation time series based on a change in the value of the difference time series;
  • the time difference between the value of the target time series and the predicted value of the target time series generated based on the value of the first explanation time series in the plurality of description time series is used.
  • Series and one or more second explanation time series of the plurality of explanation time series are acquired, and for each of the one or more second explanation time series, a feature amount from the second explanation time series Are extracted, and the feature quantities are converted into feature time series, and based on the one or more second description time series feature time series and the difference time series, the change of the value of the difference time series is performed, The influence degree of each of the one or more second explanation time series is calculated.
  • a recording medium is a computer that includes a target time-series value and a predicted value of the target time-series generated based on a first description time-series value of a plurality of description time series. And one or more second explanation time series of the plurality of explanation time series, and each of the one or more second explanation time series, the second explanation time series concerned Extracting the feature quantity from the feature quantity, converting the feature quantity into a feature time series, and based on the one or more second description time series feature time series and the difference time series, A process is performed to calculate the influence of each of the one or more second explanation time series on the change.
  • the effect of the present invention is that there are external factors that have a strong correlation with changes in the state of the system, and external factors that affect the change in the state of the system even if the time series to be analyzed require pre-processing. Other factors can be identified correctly.
  • FIG. 1 is a block diagram showing the configuration of an analysis system 1 in the first embodiment.
  • the analysis system 1 of the first embodiment is connected to an analyte apparatus 900 by a network or the like.
  • the analyzed device 900 is a device used in the manufacturing process of the manufacturing system.
  • the device to be analyzed 900 acquires values of various items in the manufacturing process by, for example, a sensor and transmits the values to the analysis system 1. Further, the device to be analyzed 900 may acquire a value set by a maintenance worker or the like as the value of the item in the manufacturing process.
  • Items to be analyzed by the device 900 for acquiring values are classified into quality indicators of manufactured products and manufacturing conditions.
  • the quality index is an item indicating the quality of the product or the evaluation of the product, and is, for example, the conductivity of the product, water resistance, heat resistance, or the product state indicating whether or not it operates properly.
  • the value of each item of the quality indicator may be a quantitative value such as integer or decimal, or may be a qualitative (qualitative) value such as “normal / abnormal”.
  • the manufacturing conditions are items that may affect the value of the product quality indicator.
  • the manufacturing conditions further include an item which can control the change of the value directly or indirectly in the device to be analyzed 900, an item which can not control the change of the value, such as an item depending on the environment of the device to be analyzed 900, are categorized.
  • the items that can control the change in value are, for example, temperature, pressure, gas flow rate, voltage, property of material, amount and ratio of material, operation status indicating whether or not a specific operation is performed, and the like.
  • the item which can not control change of a value is air temperature, air pressure, the weather etc., for example.
  • such an item which can not control change of value is also described as an external factor.
  • the values of each item of the manufacturing conditions may also be quantitative values such as integers or decimals, or may be qualitative (qualitative) values such as "normal / abnormal" and "fine / rainy”.
  • the value acquired by the to-be-analyzed apparatus 900 is described as an observed value, and the data which arranged the observed value in time order are described as "time series.”
  • the time series of the items of the quality index is described as “target time series”
  • the time series of the items of the manufacturing conditions is described as “descriptive time series”.
  • the explanation time series of the item of the external factor is also described as "the external factor time series” or "the first explanation time series”, and the explanation time series other than the external factor time series Is also described as a “second explanation time series”.
  • FIG. 2 is a diagram showing an example of explanation time series in the first embodiment.
  • FIG. 3 is a diagram showing an example of a target time series in the first embodiment.
  • ID Identity
  • observation values are associated with each time, and whether the time series is an external factor time series External factor information that indicates is associated.
  • the external factor information is “y”
  • the external factor time series is indicated, and in the case of “n”, an explanatory time series other than the external factor time series is indicated.
  • the observation value is associated with each time for the target time series (ID “0”).
  • the analysis system 1 includes an observation data collection device 100, a time series storage device 200, an external factor reduction device 300, a factor analysis device 400, a display device 600, and a control device 700.
  • the observation data collection device 100 collects observation values from the analyzed device 900.
  • the observation data collection device 100 stores the time series of the collected observation values in the time series storage device 200.
  • the item of the quality index (the item of the objective time series) is set in advance by the user or the like, and the observation data collection device 100 describes the explanatory time series and the objective time series as the time series storage device 200.
  • the time series storage unit 210 and the target time series storage unit 220 are respectively stored.
  • the time series storage device 200 stores the time series of the observation values acquired by the observation data collection device 100.
  • the time-series storage device 200 includes a description time-series storage unit 210 and a target time-series storage unit 220.
  • the explanation time series storage unit 210 stores the explanation time series.
  • the target time series storage unit 220 stores the target time series.
  • the external factor reduction apparatus 300 specifies an external factor time series in the explanation time series. Then, the external factor reduction apparatus 300 estimates the predicted value of the target time series calculated based on the external factor time series and the observed value of the target time series as a time series in which the influence of the external factor is reduced from the target time series. And generate a difference time series.
  • the external factor reducing apparatus 300 includes an external factor identifying unit 310 (hereinafter, also simply described as a identifying unit), a prediction formula generation unit 320, a prediction formula storage unit 330, a difference time series generation unit 340, and a difference time series storage unit. Including 350.
  • the external factor identification unit 310 identifies an external factor time series in the explanation time series.
  • the prediction formula generation unit 320 generates a prediction formula for predicting the value of the target time series from the values of the external factor time series based on the external factor time series and the target time series.
  • the prediction formula storage unit 330 stores the prediction formula generated by the prediction formula generation unit 320.
  • the difference time series generation unit 340 calculates a predicted value of the target time series based on the external factor time series and the prediction formula. Then, the difference time series generation unit 340 generates a difference time series of the prediction value of the target time series and the observation value of the target time series stored in the time series storage device 200.
  • the difference time series storage unit 350 stores the difference time series generated by the difference time series generation unit 340.
  • the factor analysis device 400 (hereinafter, also simply described as an analysis device) is a candidate for explanation time series that affects the change of the value of the target time series among the explanation time series other than the external factor time series (hereinafter also referred to as a factor candidate) Described).
  • the factor analysis device 400 includes a time series acquisition unit 410, an influence degree calculation unit 420, an influence degree storage unit 430, and a factor candidate output unit 440.
  • the time series acquisition unit 410 acquires a description time series other than the external factor time series from the time series storage device 200 and a difference time series from the difference time series storage unit 350 of the external factor reduction device 300.
  • the influence degree calculation unit 420 calculates the influence degree of the explanation time series to the change of the value of the difference time series based on the explanation time series other than the external factor time series and the difference time series acquired by the time series acquisition unit 410 Do.
  • the influence degree storage unit 430 stores the degree of influence calculated by the influence degree calculation unit 420.
  • the factor candidate output unit 440 (hereinafter, also simply described as an output unit) extracts an explanatory time series of the factor candidate based on the degree of influence, and outputs the extracted time series to the display device 600 or the control device 700.
  • the display device 600 outputs the factor candidate output from the factor analysis device 400 to a user or the like.
  • the control device 700 controls the device to be analyzed 900 based on the factor candidate output from the factor analysis device 400.
  • Each device included in the analysis system 1 may be a computer including a central processing unit (CPU) and a recording medium storing a program, and operating under control based on the program.
  • CPU central processing unit
  • recording medium storing a program
  • FIG. 4 is a block diagram showing the configuration of the computer-implemented external factor mitigation apparatus 300 according to the first embodiment.
  • the external factor reduction device 300 includes a CPU 301, a storage device 302 (recording medium), an input / output device 303, and a communication device 304.
  • the CPU 301 executes an instruction (Instruction) of a program for implementing the external factor identification unit 310, the prediction formula generation unit 320, and the difference time series generation unit 340.
  • the storage device 302 is, for example, a hard disk or a memory, and stores data of the prediction formula storage unit 330 and the differential time-series storage unit 350.
  • the input / output device 303 is, for example, a keyboard, a display, and the like, and receives an input of an execution instruction of external factor reduction processing from a user or the like.
  • the communication device 304 receives the external factor time series and the target time series from the time series storage device 200. Also, the communication device 304 transmits the differential time series to the factor analysis device 400.
  • FIG. 5 is a block diagram showing the configuration of a factor analysis apparatus 400 implemented in a computer according to the first embodiment.
  • the factor analysis device 400 includes a CPU 401, a storage device 402 (recording medium), an input / output device 403, and a communication device 404.
  • the CPU 401 executes instructions of a program for mounting the time series acquisition unit 410, the influence degree calculation unit 420, and the factor candidate output unit 440.
  • the storage device 402 stores data of the impact degree storage unit 430.
  • the input / output device 403 receives an input of an execution instruction of factor extraction processing from a user or the like.
  • the communication device 404 receives the explanation time series from the time series storage device 200 and the difference time series from the external factor reducing device 300. Also, the communication device 404 transmits a factor candidate to the display device 600 and the control device 700.
  • a part or all of the components may be implemented by a general-purpose or dedicated circuit or processor, or a combination thereof. These circuits and processors may be configured by a single chip or may be configured by a plurality of chips connected via a bus. In addition, part or all of the components may be implemented by a combination of the circuits and the like described above and a program. When part or all of the components are implemented by a plurality of information processing devices or circuits, the plurality of information processing devices or circuits may be centrally disposed or distributedly disposed. It is also good.
  • the information processing apparatus, the circuit, and the like may be implemented in a form in which each is connected via a communication network, such as a client and server system, a cloud computing system, and the like.
  • the components of a plurality of devices included in the analysis system 1 may be implemented in one physical device.
  • the components of the observation data collection device 100, the time series storage device 200, the external factor reduction device 300, and the factor analysis device 400 may be implemented in one computer.
  • the external factor reduction process is performed based on the external factor time series as a time series in which the external factor time series in the explanation time series is specified and the influence of the external factor is reduced from the target time series. This is a process of generating a difference time series between the predicted value of the time series and the observed value of the target time series. For example, when an abnormality is found in the value of the quality index, the user or the like instructs the external factor reduction device 300 to execute the external factor reduction process prior to the execution of the factor extraction process.
  • FIG. 6 is a flowchart showing external factor mitigation processing in the first embodiment.
  • the external factor identifying unit 310 of the external factor reducing device 300 acquires the explanation time series and the target time series from the time series storage apparatus 200 (step S101).
  • the external factor identification unit 310 identifies the external factor time series in the explanation time series by the external factor identification process (step S102).
  • the external factor is an item which can not control the change of the value, for example, the air temperature, the air pressure, the weather, etc. among the manufacturing conditions.
  • the external factor time is as follows: Identify the series.
  • FIG. 7 is a flowchart showing details of the external factor identification process (step S102) in the first embodiment.
  • the external factor identification unit 310 calculates, for each of the explanation time series, the degree of influence on the change of the value of the target time series (step S1021).
  • the external factor identification unit 310 calculates the degree of influence using, for example, a multivariate analysis method.
  • the external factor identification unit 310 performs multivariate analysis using the target time series as a target variable and the explanatory time series as an explanatory variable.
  • the external factor identification unit 310 may use any method as the multivariate analysis method as long as the influence degree of the explanatory variable on the change of the value of the objective variable can be calculated.
  • the target time series is quantitative data
  • the external factor identification unit 310 can use multiple regression analysis as multivariate analysis.
  • the reciprocal of t-value or t-value calculated for each explanatory variable can be regarded as the degree of influence.
  • logistic regression analysis can be used as multivariate analysis.
  • the reciprocal of the p value calculated for each explanatory variable or the Wald statistic can be regarded as the degree of influence.
  • the external factor identifying unit 310 sets the objective time series (ID “0”) of FIG. 3 as the objective variable, and the explanatory time series (ID “1”,..., “N”) of FIG. Perform a random analysis.
  • the external factor identification unit 310 extracts an explanatory time series of external factor candidates from the explanatory time series based on the degree of influence calculated in step S1021 (step S1022).
  • the external factor specifying unit 310 extracts, for example, a time series whose influence degree is equal to or more than a predetermined value as the explanatory time series of the external factor candidate in the explanation time series.
  • the external factor identifying unit 310 externally sets the explanation time series of the IDs “1” and “2”. Extract as an explanation time series of factor candidates.
  • the external factor identifying unit 310 calculates the explainable degree of the change of the value of the explanation time series due to the change of the value of the target time series for each of the explanation time series of the external factor candidate (step S1023).
  • the external factor specifying unit 310 approximates the relationship between the target time series and the explanatory time series of the external factor candidate, for example, by a predetermined time series model for estimating the explanatory time series from the target time series.
  • the external factor identification unit 310 may use any time series model as long as it can estimate the explanatory time series of the external factor candidate from the target time series.
  • the external factor identifying unit 310 determines the parameters of the ARX model from the target time series and the explanation time series of external factor candidates. Determine the value.
  • the external factor identification unit 310 calculates, for each of the external factor candidate time series, the value of the index indicating the suitability of the time series model as the above-described explainable degree.
  • an index for example, it is possible to use the square error or the fit of the estimated value when the explanation time series of the external factor candidate is estimated from the target time series by the time series model.
  • the external factor identifying unit 310 determines the parameters of the ARX model for estimating each of the explanation factor series (ID “1”, ID “2”) of the external factor candidate from the objective time series (ID “0”) And calculate the fitness of the ARX model.
  • the external factor identification unit 310 identifies an external factor time series among the explanation factor series of the external factor candidate based on the explainable degree calculated in step S1023 (step S1024).
  • the external factor specifying unit 310 specifies, for example, among the explanatory time series of the external factor candidate, an explanatory time series whose explainable degree is less than a predetermined value as the external factor time series.
  • the external factor identification unit 310 sets “y” to the external factor information of the explanation time series extracted as the external factor time series in the explanation time series storage unit 210.
  • the external factor specifying unit 310 specifies the explanation time series as the external factor time series. As shown in FIG. 2, the external factor identification unit 310 sets “y” to the external factor information of the explanation time series of the ID “1”.
  • the external factor time series extracted in this way is based on the above-mentioned premise that "the external factor affects the change of the value of the target time series, but the change of the value of the target time series does not affect the external factor". It is considered to meet.
  • the external factor identifying unit 310 may identify, among the explanatory time series stored in the time series storage device 200, an explanatory time series designated by the user or the like as the external factor time series.
  • the prediction formula generation unit 320 generates a prediction formula for predicting the value of the target time series from the values of the external factor time series (step S103).
  • the prediction formula generation unit 320 generates a prediction formula by performing regression analysis with the target time series as the target variable and the external factor time series as the explanatory variable.
  • the prediction formula generation unit 320 may use any method as a method of regression analysis as long as it can generate a prediction formula for predicting the value of the target time series from the values of the external factor time series.
  • Y (t) is a predicted value of a target time series at time t
  • X (t) is a value of an external factor time series at time t
  • a and b are parameters.
  • the prediction formula generation unit 320 stores the generated prediction formula in the prediction formula storage unit 330.
  • the difference time series generation unit 340 generates a difference time series of the prediction value of the target time series calculated by the prediction formula and the observation value of the target time series (step S104).
  • the difference time series generation unit 340 predicts the target time series at each time of the analysis target period by substituting the value of the external factor time series into the prediction formula stored in the prediction formula storage unit 330. Calculate the value.
  • the difference time series generation unit 340 calculates the difference between the calculated predicted value and the observed value at each time of the analysis target period.
  • the difference time series generation unit 340 stores data in which the calculated differences are arranged in order of time in the difference time series storage unit 350 as a difference time series.
  • FIG. 8 is a diagram showing an example of a differential time series in the first embodiment. For example, using the external factor time series (ID “1”) in FIG. 2 and the target time series (ID “0”) in FIG. Generate a series.
  • ID “1” the external factor time series
  • ID “0” the target time series
  • FIG. 9 is a diagram showing a time-series graph in the first embodiment.
  • the graph of FIG. 9 shows temporal changes in the target time series (ID “0”), the external factor time series (ID “1”), and the difference time series.
  • the differential time series obtained in this manner is considered to be a time series obtained by reducing the influence of external factors from the target time series.
  • the factor extraction process is a process of extracting an explanation time series of factor candidates from an explanation time series other than the external factor time series in the explanation time series. For example, when the external factor reduction processing by the external factor reduction device 300 ends, the user or the like instructs the factor analysis device 400 to execute the factor extraction processing.
  • FIG. 10 is a flowchart showing factor extraction processing in the first embodiment.
  • the time series acquisition unit 410 of the factor analysis device 400 acquires an explanatory time series other than the external factor time series from the time series storage device 200, and acquires a difference time series from the external factor reduction device 300 (step S201). ).
  • the influence degree calculation unit 420 calculates the influence degree with respect to the change of the value of the difference time series for each of the explanation time series other than the external factor time series (step S202).
  • the influence calculation unit 420 calculates the influence using, for example, a multivariate analysis method similar to the multivariate analysis method used in the above-described external factor identification process.
  • the influence degree calculation unit 420 performs multivariate analysis with the difference time series as an objective variable and the explanatory time series other than the external factor time series as an explanatory variable.
  • the influence degree calculation unit 420 stores the calculation result of the influence degree in the influence degree storage unit 430.
  • FIG. 11 is a diagram showing an example of calculation of the degree of influence in the first embodiment.
  • the IDs of the described time series are shown in descending order of the calculated degree of influence.
  • the influence degree calculation unit 420 sets the difference time series of FIG. 8 as the objective variable, and the explanatory time series (ID “2”,..., “N”) other than the external factor time series of FIG. A variable analysis is performed to calculate the degree of influence as shown in FIG.
  • the influence degree calculation part 420 may calculate an influence degree using each of several multivariate analysis methods, and may integrate the calculated influence degree.
  • the influence degree calculation unit 420 normalizes, for example, the influence degree calculated in each multivariate analysis method so that the maximum value is 1 and the minimum value is 0, and the sum of normalized influence degrees, Alternatively, an average may be calculated.
  • an average may be calculated.
  • a simple sum of the influences for each multivariate analysis method may be calculated, or a sum of the influences weighted by a predetermined weight may be calculated for each multivariate analysis method. .
  • the factor candidate output unit 440 extracts the explanation time series of the factor candidate from the influence degree storage unit 430 based on the degree of influence, and outputs the time series to the display device 600 and the control device 700 (step S203).
  • the factor candidate output unit 440 extracts a predetermined number of explanation time series as the explanation time series of the factor candidate in descending order of the degree of influence, and outputs the ID of the explanation time series together with the degree of influence.
  • the factor candidate output unit 440 may extract an explanatory time series whose influence degree is equal to or more than a predetermined value.
  • the factor candidate output unit 440 extracts and outputs three explanatory time-series IDs “2”, “9”, and “8” in descending order of influence degree from the calculation result of the influence degree in FIG.
  • the display device 600 displays the factor candidate output from the factor analysis device 400 to the user or the like (step S204).
  • FIG. 12 is a diagram showing an example of a display screen displayed by the display device 600 in the first embodiment.
  • IDs “2”, “9”, and “8” of the explanation time series received from the factor candidate output unit 440 are displayed as factor candidates in the descending order of the degree of influence.
  • the display device 600 displays a display screen as shown in FIG.
  • control device 700 controls the device to be analyzed 900 based on the factor candidate output from the factor analysis device 400 (step S205).
  • the control device 700 uses the values (values at the time of normality) of the manufacturing conditions when the values of the items of the quality index are normal, which are stored in advance in the storage unit (not shown).
  • the analyzer 900 may be controlled.
  • the control device 700 may control the device to be analyzed 900 such that the value of the item of the manufacturing condition corresponding to the explanatory time series of the factor candidate becomes the value at the normal time.
  • control device 700 controls the analysis device 900 such that the values of the items of the manufacturing conditions corresponding to the explanation time series of the IDs “2”, “9”, and “8” become the values at the normal time. .
  • FIG. 13 is a block diagram showing a characteristic configuration of the first embodiment.
  • the analysis system 1 includes an external factor identification unit 310 (a identification unit), a difference time series generation unit 340, and an influence degree calculation unit 420.
  • the external factor identification unit 310 identifies a first explanatory time series (external factor time series) among the plurality of explanatory time series.
  • the difference time series generation unit 340 generates a difference time series of the value of the target time series and the predicted value of the target time series calculated based on the value of the first explanation time series.
  • the influence degree calculation unit 420 is configured to calculate the difference time series based on one or more second explanation time series (explanation time series other than the external factor time series) of the plurality of explanation time series and the difference time series. The influence of each of the one or more second explanatory time series on the change of the value is calculated.
  • the analysis system 1 generates a differential time series of the target time series value and the target time series predicted value calculated based on the first explanation time series value, and the difference time series value In order to calculate the influence of each of the second explanation time series on the change of.
  • the analysis system 1 extracts and outputs candidates of explanation time series that influence the change of the value of the target time series based on the degree of influence of each of the second explanation time series.
  • the analysis system 1 specifies a description time series that affects the change of the value of the target time series and is not affected by the change of the value of the target time series as the first description time series.
  • Second Embodiment in the factor extraction process, instead of the explanation time series, the explanation time series of the factor candidate is specified using the feature time series which is the time series of the feature quantity extracted from the explanation time series. , Different from the first embodiment.
  • FIG. 14 is a block diagram showing the configuration of the analysis system 1 in the second embodiment.
  • the factor analysis apparatus 400 of the first embodiment is replaced with a factor analysis apparatus 500.
  • the factor analysis apparatus 500 extracts the explanation time series of the factor candidate by the same method as the factor analysis apparatus of Patent Document 3. However, the factor analysis apparatus 500 specifies the explained time series of the factor candidate by using the difference time series instead of the target time series used in the factor analysis apparatus of Patent Document 3.
  • the factor analysis device 500 includes a time series acquisition unit 510, a feature time series conversion unit 520, a feature time series storage unit 530, an influence degree calculation unit 540, an influence degree storage unit 550, a factor candidate output unit 560, and a preprocess candidate output. Part 570 is included.
  • the time-series acquisition unit 510 uses the time-series storage device 200 to explain the time series other than the external factor time series, and the difference of the external factor reduction device 300.
  • the difference time series is acquired from the time series storage unit 350.
  • the feature time series conversion unit 520 extracts feature amounts from the explanation time series other than the external factor time series and converts the feature amount into a feature time series, as in the feature time series conversion unit of Patent Document 3.
  • the feature time series conversion unit 520 includes a feature extraction unit 521 and a feature conversion unit 522.
  • the feature extraction unit 521 extracts a feature amount from the explanation time series acquired by the time series acquisition unit 510.
  • the feature conversion unit 522 generates a feature time series based on the feature amount extracted by the feature extraction unit 521.
  • the feature time series storage unit 530 stores the feature time series generated by the feature time series conversion unit 520.
  • the influence degree calculation unit 540 calculates the influence degree of the explanation time series on the value change of the difference time series.
  • the influence degree calculation unit 540 includes a feature time series influence degree calculation unit 541 and a description time series influence degree calculation unit 542.
  • the feature time series influence degree calculation unit 541 calculates the degree of influence of the feature time series on the difference time series.
  • the explanation time series influence degree calculation unit 542 calculates the influence degree of the explanation time series other than the external factor time series on the difference time series based on the degree of influence of the feature time series.
  • the influence degree storage unit 550 stores the influence degree of the feature time series calculated by the influence degree calculation unit 540 in the same way as the influence degree storage unit of Patent Document 3 and the influence degree of the explanation time series.
  • the influence degree storage unit 550 includes a feature time series influence degree storage unit 551 and a description time series influence degree storage unit 552.
  • the feature time series influence degree storage unit 551 stores the degree of influence of the feature time series.
  • the explanation time series influence degree storage unit 552 stores the degree of influence of the explanation time series.
  • the factor candidate output unit 560 (hereinafter, also described as a first output unit) extracts the explanation time series of the factor candidate based on the degree of influence of the explanation time series similarly to the factor output unit of Patent Document 3, and displays the display device It outputs to 600 and the control apparatus 700.
  • the preprocessing candidate output unit 570 (hereinafter, also described as a second output unit) is a type of feature quantity to be calculated as preprocessing based on the degree of influence of the feature time series, similar to the factor output unit of Patent Document 3.
  • the candidate (hereinafter, also described as a preprocessing candidate) is extracted and output to the display device 600.
  • the factor analysis apparatus 500 may also be a computer that includes a CPU and a recording medium storing a program, and operates under control based on a program, as in the factor analysis apparatus 400 in the first embodiment.
  • the explanation time series of the analysis target period and the target time series as shown in FIG. 2 and FIG. 3 collected by the observation data collection device 100 are time series storage Assume that it is stored in the device 200.
  • the external factor reduction process in the second embodiment is similar to the external factor reduction process in the first embodiment.
  • the explanation time series of the ID “1” is specified as the external factor time series by the external factor reduction process, and the difference time series as shown in FIG. It is assumed that the difference time series storage unit 350 is stored.
  • FIG. 15 is a flowchart showing factor extraction processing in the second embodiment.
  • the time series acquisition unit 510 of the factor analysis device 500 acquires an explanatory time series other than the external factor time series from the time series storage device 200, and acquires a difference time series from the external factor reduction device 300 (step S301). ).
  • the feature extraction unit 521 of the feature time series conversion unit 520 extracts feature quantities at each time for each of the explanation time series other than the external factor time series (step S302).
  • the feature extraction unit 521 uses the partial time series (within the range of the “window”) for a predetermined time width from each time for each explanation time series, and sets one or more types of feature quantities of each. Extract.
  • a type of feature amount for example, a statistic such as average or variance is used.
  • an autoregression coefficient, a frequency distribution, or a correlation coefficient with another explanatory time series may be used.
  • the feature extraction unit 521 shifts the window from the start time to the end time of the description time series to the end time by a predetermined number of time points, and repeats extracting the feature amount at each time until the end time is reached by the window. Good.
  • the feature conversion unit 522 generates a feature time series from the extracted feature amounts for each of the explanation time series other than the external factor time series (step S303).
  • the feature conversion unit 522 generates a feature time series by arranging feature quantities at each time extracted by the feature extraction unit 521 in order of time for each type of feature quantity for each explanation time series. .
  • the feature conversion unit 522 stores the generated feature time series in the feature time series storage unit 530.
  • FIG. 16 is a diagram showing an example of the feature time series in the second embodiment.
  • the feature time series conversion unit 520 is configured to calculate each type (“a”, “b”) of the feature amount for each explanation time series (ID “2”,..., “N”) other than the external factor time series in FIG. ",...), A feature time series as shown in FIG. 16 is generated.
  • each feature time series is provided with a label capable of identifying the description time series of the feature time series generation source and the type of the feature amount.
  • a label “a :: 2” is attached to the feature time series generated for the type “a” of the feature amount.
  • the feature time series influence degree calculating unit 541 of the influence degree calculating unit 540 calculates the degree of influence on the value change of the difference time series for each of the feature time series (step S304).
  • the feature time series influence degree calculation unit 541 calculates the degree of influence of the feature time series using, for example, a multivariate analysis method similar to the multivariate analysis method used in the above-described external factor identification process.
  • the feature time series influence degree calculation unit 541 performs feature time series by performing multivariate analysis using a difference time series as an objective variable and each feature time series as an explanatory variable for each of one or more multivariate analysis methods.
  • the feature time series influence degree calculation unit 541 stores the calculation result of the degree of influence of the feature time series in the feature time series influence degree storage unit 551.
  • the degree of influence of the feature time series is normalized so that, for example, the maximum value is 1 and the minimum value is 0.
  • FIG. 17 is a diagram showing an example of calculation of the degree of influence of the feature time series in the second embodiment.
  • the feature time series influence degree calculation unit 541 uses the difference time series of FIG. Perform multivariate analysis with time series as explanatory variables. Thereby, the feature time series influence degree calculation unit 541 calculates the degree of influence of each feature time series as shown in FIG. In the example of FIG. 17, the feature time series are shown in descending order of the calculated degree of influence.
  • the explanation time series influence degree calculation unit 542 calculates the degree of influence of each of the explanation time series other than the external factor time series to the value change of the difference time series based on the degree of influence of the feature time series (step S305).
  • the explanation time series influence calculation unit 542 is, for example, the sum of the degree of influence of the feature time series calculated for one or more types for each explanation time series, for each of one or more multivariate analysis methods. By calculating, the influence degree of the explanation time series is calculated.
  • the target for calculating the sum may be all types of feature time series calculated for each explanatory time series, or may be a predetermined number of types of feature time series in descending order of the degree of influence.
  • the explanation time series influence degree calculation unit 542 stores the calculation result of the explanation time series influence degree in the explanation time series influence degree storage unit 552.
  • FIG. 18 is a diagram showing an example of calculation of the influence degree of the explanation time series in the second embodiment.
  • the explanation time series influence degree calculation unit 542 uses the influence time of the feature time series in FIG.
  • the degree of influence of the series (ID “2”,..., “N”) is calculated as shown in FIG.
  • the explanation time series are shown in descending order of the calculated degree of influence.
  • the factor candidate output unit 560 extracts the explanation time series of the factor candidate from the explanation time series influence degree storage unit 552 based on the influence degree of the explanation time series, and outputs the explanation time series to the display device 600 and the control device 700 (step S306).
  • the factor candidate output unit 560 determines, for example, the sum of the influential time of the explanation time series calculated for one or more multivariate analysis methods for each of the explanation time series. Integrate.
  • the sum of the degrees of influence a simple sum of the degrees of influence for each multivariate analysis method may be calculated, or a sum of degrees of influence weighted with a predetermined weight may be calculated for each multivariate analysis method.
  • the factor candidate output unit 560 extracts a predetermined number of explanation time series as the explanation time series of factor candidates in descending order of integrated degree of influence, and outputs the ID of the explanation time series together with the degree of influence.
  • the factor candidate output unit 560 may extract an explanatory time series in which the integrated degree of influence is equal to or more than a predetermined value.
  • FIG. 19 is a diagram showing an example of integration of the influence degree of the explanation time series in the second embodiment.
  • the factor candidate output unit 560 integrates the degree of influence of each explanatory time series of FIG. 18 as shown in FIG. In the example of FIG. 19, the explanation time series are shown in descending order of integrated degree of influence.
  • the factor candidate output unit 560 extracts, for example, the IDs “13” and “37” of the explanation time series whose integrated degree of influence is one or more, and outputs as extracted factor candidates.
  • the display device 600 displays the factor candidate output from the factor analysis device 500 to the user or the like (step S307).
  • FIG. 20 is a diagram illustrating an example of a display screen displayed by the display device 600 according to the second embodiment.
  • IDs “13” and “37” of the explanation time series received from the factor candidate output unit 560 are displayed as factor candidates in the descending order of the degree of influence along with the degree of influence.
  • the display device 600 displays a display screen as shown in FIG.
  • control device 700 controls the device to be analyzed 900 based on the factor candidate output from the factor analysis device 500 (step S308).
  • control device 700 controls the analysis device 900 such that the value of the item of manufacturing conditions corresponding to the explanation time series of the IDs “13” and “37” becomes the value at the normal time. Do.
  • the preprocessing candidate output unit 570 extracts the type of the feature amount of the preprocessing candidate from the feature time series influence degree calculation unit 541 based on the degree of influence of the feature time series, and outputs it to the display device 600 (step S309).
  • the pre-processing candidate output unit 570 extracts the type of the feature amount of the feature time series having the large degree of influence as a pre-processing candidate.
  • the pre-processing candidate output unit 570 outputs the feature time series “a :: 13” and the characteristic time series “a :: 37” having a large influence degree.
  • the feature amount type “a” is extracted as a pre-processing candidate.
  • the display device 600 displays the preprocessing candidate output from the factor analysis device 500 to the user or the like (step S310).
  • FIG. 21 is a diagram showing another example of the display screen displayed by the display device 600 in the second embodiment.
  • the type “a” of the feature amount received from the preprocessing candidate output unit 570 is displayed as a preprocessing candidate.
  • the display device 600 displays a display screen as shown in FIG.
  • the user etc. can grasp the appropriate pre-processing (the type of the feature value to be calculated as the pre-processing) to be performed on the explanation time series.
  • FIG. 22 is a block diagram showing a characteristic configuration of the second embodiment.
  • the factor analysis device 500 includes a time series acquisition unit 510, a feature time series conversion unit 520, and an influence degree calculation unit 540.
  • the time series acquisition unit 510 calculates the difference between the predicted value of the target time series generated based on the value of the first explanation time series (external factor time series) among the plurality of explanation time series and the value of the target time series.
  • the time series and the second explanation time series (the explanation time series other than the external factor time series) are acquired.
  • the feature time series conversion unit 520 extracts, for each of the second description time series, a feature quantity from the second description time series, and converts the feature quantity into a feature time series.
  • the influence degree calculation unit 540 calculates the influence degree of each of the second explanation time series with respect to the change of the value of the difference time series based on the feature time series of the second explanation time series and the difference time series.
  • the factor analysis apparatus 500 extracts the feature quantity from the second explanation time series and converts it into the feature time series, and based on the feature time series and the difference time series, the change of the value of the difference time series is The second explanation is to calculate the degree of influence of each of the time series.
  • the difference time series is a difference time series of the value of the target time series and the predicted value of the target time series generated based on the value of the first explanation time series.
  • the factor analysis device 500 extracts and outputs candidates of explanation time series that influence the change of the value of the target time series based on the degree of influence of each of the second explanation time series.
  • the factor analysis device 500 is generated based on the first explanatory time series, which is an explanatory time series that influences the change of the value of the target time series and is not affected by the change of the value of the target time series. This is because the difference time series is used.
  • the factor analysis device 500 extracts the type of feature to be extracted from the second explanatory time series based on the degree of influence of one or more types of characteristic time series of each of the second explanatory time series. To output.
  • the system to be analyzed is a manufacturing system and the device to be analyzed 900 is a device used in a manufacturing process has been described as an example.
  • the system to be analyzed may be another system as long as the values of various items related to the operation of the system can be acquired as the values of the item to be analyzed.
  • the system to be analyzed may be an information technology (IT) system, a plant system, a power generation system, a structure, or a transportation device.
  • IT information technology
  • a time series such as the power consumption and the number of calculations is used as the target time series.
  • CPU resource utilization, memory utilization, computer resource utilization such as disk access frequency, usage, communication network resource usage, usage, etc. are used.
  • the case where the number of external factor time series specified by the external factor reduction apparatus 300 is 1 was demonstrated to an example.
  • the number of external factor time series to be identified may be plural.
  • a prediction formula for predicting the value of the target time series is generated from the values of the plurality of external factor time series by regression analysis, and based on the prediction formula A series is generated.
  • the case where the number of objective time series is 1 was demonstrated to the example.
  • the number of target time series may be more than one.
  • the external factor time series is specified for each of the plurality of target time series, and the difference time series is generated.
  • the factor extraction process for each of the plurality of difference time series, the degree of influence of the explanation time series other than the external factor time series is calculated, and the explanation time series of the factor candidate is extracted.

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Data Mining & Analysis (AREA)
  • Strategic Management (AREA)
  • Mathematical Optimization (AREA)
  • Mathematical Analysis (AREA)
  • Operations Research (AREA)
  • Human Resources & Organizations (AREA)
  • Computational Mathematics (AREA)
  • Pure & Applied Mathematics (AREA)
  • Economics (AREA)
  • Mathematical Physics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Probability & Statistics with Applications (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Tourism & Hospitality (AREA)
  • Quality & Reliability (AREA)
  • Evolutionary Biology (AREA)
  • Marketing (AREA)
  • Entrepreneurship & Innovation (AREA)
  • General Business, Economics & Management (AREA)
  • Game Theory and Decision Science (AREA)
  • Algebra (AREA)
  • Development Economics (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Testing And Monitoring For Control Systems (AREA)
  • Complex Calculations (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

システムの状態変化に強い相関を持つ外的要因が存在し、かつ、分析対象の時系列に前処理が必要な場合でも、システムの状態変化に影響を与える、外的要因以外の要因を正しく特定する。分析装置500は、時系列取得部510、特徴時系列変換部520、及び、影響度算出部540を含む。時系列取得部510は、目的時系列の値と、複数の説明時系列の内の第1の説明時系列の値に基づき生成された目的時系列の予測値と、の差分時系列、及び、第2の説明時系列を取得する。特徴時系列変換部520は、第2の説明時系列の各々について、当該第2の説明時系列から特徴量を抽出し、当該特徴量を特徴時系列に変換する。影響度算出部540は、第2の説明時系列の特徴時系列と、差分時系列と、に基づき、差分時系列の値の変化に対する、第2の説明時系列の各々の影響度を算出する。

Description

分析装置、分析方法、及び、記録媒体
 本発明は、分析装置、分析方法、及び、記録媒体に関する。
 システムの状態を分析する手法として、回帰分析などの統計的手法が、広く利用されている。このような統計的手法では、システムの状態に関する変数の内、システムの指標に関する目的変数とそれ以外の説明変数との関係を明らかにし、目的変数の値の変化に強い影響を持つ説明変数が特定される。
 例えば、分析対象のシステムが、物の製造プロセスを含むシステムの場合、センサにより取得された、システムの様々な項目の観測値に対して統計的手法を適用することにより、製造品の品質に影響を与える影響要因が特定される。この場合、品質を表す項目を目的変数とし、その他の複数の項目を説明変数とした、多変量解析が行われる。ユーザは、多変量解析によって算出された、各説明変数の寄与率や関連の度合い等に基づき、各説明変数の、目的変数の値の変化に与える影響の程度(すなわち、各説明変数の影響度)を知ることができる。
 このような多変量解析を用いた技術として、特許文献1には、説明変数に含まれる名義尺度データに基づいてデータをセグメント化し、各セグメントに対する多変量解析により、影響要因を特定する方法が記載されている。
 また、特許文献2には、分析対象の説明時系列に対して行うべき適切な前処理を明らかにするために、説明時系列から得られる特徴時系列を用いて要因分析を行う技術が記載されている。特許文献2の技術では、目的時系列の値の変化に対する特徴時系列の影響度を算出し、特徴時系列の影響度に基づいて、目的時系列の値の変化に対する説明時系列の影響度を算出する。
 また、関連技術として、特許文献3には、気温とタンクの水位の近似式を生成し、近似式から予測した水位と実測した水位との差分を用いて漏洩を検出する技術が記載されている。非特許文献1には、目的変数が離散値のときに、L1正則化ロジスティック回帰と呼ばれる方法により、説明変数の影響度を高い精度で推定できることが記載されている。非特許文献2には、決定木を複数用いることで分類器を構成する、ランダム森分類器が記載されている。
特開2009-258890号公報 国際公開第2015/136586号 特開2016-102744号公報
ISBN: 1-58113-838-5, Andrew Y. Ng 著「Feature selection, L1 vs. L2 regularization, and rotational invariance」in Proceedings of the 21st International Conference of Machine Learning, pp. 78-85, 2004 ISSN: 0885-6125, Breiman. L 著「Random Forests」, Machine Learning, Vol.45, No.1, pp. 5-32, 2001
 上述の統計的手法を用いたシステム分析において、例えば、気温や天候、気候等、システムの状態変化に著しく強い相関を持つ外的要因が存在する場合が考えられる。この場合、目的変数に対する影響要因として、外的要因、あるいはそれに関連する要因が特定されてしまい、本来検出されるべき、外的要因以外の説明変数が、影響要因として特定されないことがある。このため、特定した要因に基づいてシステムの調整や制御を行うといった、適切なアクションをとることができない。
 上述の特許文献1や特許文献2には、このような外的要因を考慮して、影響要因を特定することは開示されていない。
 本発明の目的は、上述の課題を解決し、システムの状態変化に強い相関を持つ外的要因が存在し、かつ、分析対象の時系列に前処理が必要な場合でも、システムの状態変化に影響を与える、外的要因以外の要因を正しく特定できる、分析装置、分析方法、及び、記録媒体を提供することである。
 本発明の一態様における分析装置は、目的時系列の値と、複数の説明時系列の内の第1の説明時系列の値に基づき生成された前記目的時系列の予測値と、の差分時系列、及び、前記複数の説明時系列の内の1以上の第2の説明時系列を取得する、時系列取得手段と、前記1以上の第2の説明時系列の各々について、当該第2の説明時系列から特徴量を抽出し、当該特徴量を特徴時系列に変換する特徴時系列変換手段と、前記1以上の第2の説明時系列の特徴時系列と、前記差分時系列と、に基づき、前記差分時系列の値の変化に対する、前記1以上の第2の説明時系列の各々の影響度を算出する、影響度算出手段と、を備える。
 本発明の一態様における分析方法は、目的時系列の値と、複数の説明時系列の内の第1の説明時系列の値に基づき生成された前記目的時系列の予測値と、の差分時系列、及び、前記複数の説明時系列の内の1以上の第2の説明時系列を取得し、前記1以上の第2の説明時系列の各々について、当該第2の説明時系列から特徴量を抽出し、当該特徴量を特徴時系列に変換し、前記1以上の第2の説明時系列の特徴時系列と、前記差分時系列と、に基づき、前記差分時系列の値の変化に対する、前記1以上の第2の説明時系列の各々の影響度を算出する。
 本発明の一態様における記録媒体は、コンピュータに、目的時系列の値と、複数の説明時系列の内の第1の説明時系列の値に基づき生成された前記目的時系列の予測値と、の差分時系列、及び、前記複数の説明時系列の内の1以上の第2の説明時系列を取得し、前記1以上の第2の説明時系列の各々について、当該第2の説明時系列から特徴量を抽出し、当該特徴量を特徴時系列に変換し、前記1以上の第2の説明時系列の特徴時系列と、前記差分時系列と、に基づき、前記差分時系列の値の変化に対する、前記1以上の第2の説明時系列の各々の影響度を算出する、処理を実行させる。
 本発明の効果は、システムの状態変化に強い相関を持つ外的要因が存在し、かつ、分析対象の時系列に前処理が必要な場合でも、システムの状態変化に影響を与える、外的要因以外の要因を正しく特定できることである。
第1の実施形態における、分析システム1の構成を示すブロック図である。 第1の実施形態における、説明時系列の例を示す図である。 第1の実施形態における、目的時系列の例を示す図である。 第1の実施形態における、コンピュータに実装された外的要因軽減装置300の構成を示すブロック図である。 第1の実施形態における、コンピュータに実装された要因分析装置400の構成を示すブロック図である。 第1の実施形態における、外的要因軽減処理を示すフローチャートである。 第1の実施形態における、外的要因特定処理(ステップS102)の詳細を示すフローチャートである。 第1の実施形態における、差分時系列の例を示す図である。 第1の実施形態における、時系列のグラフを示す図である。 第1の実施形態における、要因抽出処理を示すフローチャートである。 第1の実施形態における、影響度の算出例を示す図である。 第1の実施形態における、表示装置600により表示される表示画面の例を示す図である。 第1の実施形態の特徴的な構成を示すブロック図である。 第2の実施形態における、分析システム1の構成を示すブロック図である。 第2の実施形態における、要因抽出処理を示すフローチャートである。 第2の実施形態における、特徴時系列の例を示す図である。 第2の実施形態における、特徴時系列の影響度の算出例を示す図である。 第2の実施形態における、説明時系列の影響度の算出例を示す図である。 第2の実施形態における、説明時系列の影響度の統合例を示す図である。 第2の実施形態における、表示装置600により表示される表示画面の例を示す図である。 第2の実施形態における、表示装置600により表示される表示画面の他の例を示す図である。 第2の実施形態の特徴的な構成を示すブロック図である。
 発明を実施するための形態について図面を参照して詳細に説明する。
なお、各図面、及び、明細書記載の各実施形態において、同様の構成要素には同一の符号を付与し、説明を適宜省略する。
 以下、分析対象のシステムが、製造システムである場合を例に、各実施形態を説明する。
 <<第1の実施形態>>
 はじめに、第1の実施の形態の構成について説明する。
 図1は、第1の実施形態における、分析システム1の構成を示すブロック図である。図1を参照すると、第1の実施形態の分析システム1は、被分析装置900と、ネットワーク等により接続される。
 被分析装置900は、製造システムの製造工程で使用される装置である。被分析装置900は、製造工程における様々な項目の値を、例えば、センサにより取得し、分析システム1に送信する。また、被分析装置900は、製造工程における項目の値として、保守員等により設定された値を取得してもよい。
 被分析装置900が値を取得する対象の項目は、製造品の品質指標、及び、製造条件に分類される。
 品質指標とは、製品の品質、または、製品に対する評価を示す項目であり、例えば、製品の導電性や、耐水性、耐熱性、正常に動作するか否かを示す製品状態等である。品質指標の各項目の値は、整数や小数等の量的な値でもよいし、「正常/異常」等の定性的な(質的な)値でもよい。
 製造条件とは、製品の品質指標の値に影響する可能性がある項目である。製造条件は、さらに、被分析装置900において、その値の変化を直接または間接的に制御できる項目と、被分析装置900の環境等に依存する項目等、その値の変化を制御できない項目と、に分類される。値の変化を制御できる項目は、例えば、温度や圧力、ガス流量、電圧、材料の性質、材料の量や割合、特定の操作を行っているか否かを示す操作状況等である。また、値の変化を制御できない項目は、例えば、気温や気圧、天候等である。以下、このような、値の変化を制御できない項目を外的要因とも記載する。なお、製造条件の各項目の値も、整数や小数等の量的な値でもよいし、「正常/異常」、「晴/雨」等の定性的な(質的な)値でもよい。
 以下、被分析装置900によって取得された値を観測値と記載し、観測値を時刻順に並べたデータを「時系列」と記載する。また、品質指標の項目の時系列を「目的時系列」、製造条件の項目の時系列を「説明時系列」と記載する。
 さらに、説明時系列の内、外的要因の項目の説明時系列を「外的要因時系列」、または、「第1の説明時系列」とも記載し、外的要因時系列以外の説明時系列を「第2の説明時系列」とも記載する。
 図2は、第1の実施形態における、説明時系列の例を示す図である。図3は、第1の実施形態における、目的時系列の例を示す図である。図2の例では、説明時系列(ID(Identifier)「1」、…、「N」)の各々について、時刻毎に観測値が関連づけられ、さらに、当該時系列が外的要因時系列かどうかを示す外的要因情報が関連づけられている。ここで、外的要因情報が「y」の場合は外的要因時系列を、「n」の場合は外的要因時系列以外の説明時系列を示す。図3の例でも、目的時系列(ID「0」)について、時刻毎に観測値が関連づけられている。
 分析システム1は、観測データ収集装置100、時系列記憶装置200、外的要因軽減装置300、要因分析装置400、表示装置600、及び、制御装置700を含む。
 観測データ収集装置100は、被分析装置900から観測値を収集する。観測データ収集装置100は、収集した観測値の時系列を、時系列記憶装置200に保存する。ここで、品質指標の項目(目的時系列の項目)は、予め、ユーザ等により設定されており、観測データ収集装置100は、説明時系列と目的時系列とを、時系列記憶装置200の説明時系列記憶部210と目的時系列記憶部220とにそれぞれ保存する。
 時系列記憶装置200は、観測データ収集装置100が取得した観測値の時系列を記憶する。時系列記憶装置200は、説明時系列記憶部210と目的時系列記憶部220とを含む。説明時系列記憶部210は、説明時系列を記憶する。目的時系列記憶部220は、目的時系列を記憶する。
 外的要因軽減装置300は、説明時系列の内の外的要因時系列を特定する。そして、外的要因軽減装置300は、目的時系列から外的要因の影響を軽減した時系列として、外的要因時系列に基づいて算出される目的時系列の予測値と目的時系列の観測値との差分時系列を生成する。外的要因軽減装置300は、外的要因特定部310(以下、単に特定部とも記載)、予測式生成部320、予測式記憶部330、差分時系列生成部340、及び、差分時系列記憶部350を含む。
 外的要因特定部310は、説明時系列の内の外的要因時系列を特定する。
 予測式生成部320は、外的要因時系列と目的時系列とに基づいて、外的要因時系列の値から目的時系列の値を予測するための予測式を生成する。
 予測式記憶部330は、予測式生成部320が生成した予測式を記憶する。
 差分時系列生成部340は、外的要因時系列と予測式とに基づいて、目的時系列の予測値を算出する。そして、差分時系列生成部340は、目的時系列の予測値と時系列記憶装置200に記憶されている目的時系列の観測値との差分時系列を生成する。
 差分時系列記憶部350は、差分時系列生成部340により生成された差分時系列を記憶する。
 要因分析装置400(以下、単に分析装置とも記載)は、外的要因時系列以外の説明時系列の内、目的時系列の値の変化に影響を与える説明時系列の候補(以下、要因候補とも記載)を抽出する。要因分析装置400は、時系列取得部410、影響度算出部420、影響度記憶部430、及び、要因候補出力部440を含む。
 時系列取得部410は、時系列記憶装置200から外的要因時系列以外の説明時系列を、また、外的要因軽減装置300の差分時系列記憶部350から差分時系列を取得する。
 影響度算出部420は、時系列取得部410により取得した、外的要因時系列以外の説明時系列と差分時系列とに基づき、差分時系列の値の変化に対する説明時系列の影響度を算出する。
 影響度記憶部430は、影響度算出部420によって算出された影響度を記憶する。
 要因候補出力部440(以下、単に出力部とも記載)は、影響度に基づき、要因候補の説明時系列を抽出し、表示装置600や制御装置700へ出力する。
 表示装置600は、要因分析装置400から出力された要因候補を、ユーザ等に出力する。
 制御装置700は、要因分析装置400から出力された要因候補に基づき、被分析装置900を制御する。
 なお、分析システム1に含まれる各装置は、CPU(Central Processing Unit)とプログラムを格納した記録媒体とを含み、プログラムに基づく制御によって動作するコンピュータであってもよい。
 以下、例として、コンピュータに実装された外的要因軽減装置300、及び、要因分析装置400の構成を説明する。
 図4は、第1の実施形態における、コンピュータに実装された外的要因軽減装置300の構成を示すブロック図である。
 図4を参照すると、外的要因軽減装置300は、CPU301、記憶デバイス302(記録媒体)、入出力デバイス303、及び、通信デバイス304を含む。CPU301は、外的要因特定部310、予測式生成部320、及び、差分時系列生成部340を実装するためのプログラムの命令(Instruction)を実行する。記憶デバイス302は、例えば、ハードディスクやメモリ等であり、予測式記憶部330、及び、差分時系列記憶部350のデータを記憶する。入出力デバイス303は、例えば、キーボード、ディスプレイ等であり、ユーザ等から、外的要因軽減処理の実行指示の入力を受け付ける。通信デバイス304は、時系列記憶装置200から外的要因時系列や目的時系列を受信する。また、通信デバイス304は、要因分析装置400へ、差分時系列を送信する。
 図5は、第1の実施形態における、コンピュータに実装された要因分析装置400の構成を示すブロック図である。
 図5を参照すると、要因分析装置400は、CPU401、記憶デバイス402(記録媒体)、入出力デバイス403、及び、通信デバイス404を含む。CPU401は、時系列取得部410、影響度算出部420、及び、要因候補出力部440を実装するためのプログラムの命令を実行する。記憶デバイス402は、影響度記憶部430のデータを記憶する。入出力デバイス403は、ユーザ等から、要因抽出処理の実行指示の入力を受け付ける。通信デバイス404は、時系列記憶装置200から説明時系列を、外的要因軽減装置300から差分時系列を受信する。また、通信デバイス404は、表示装置600や制御装置700へ、要因候補を送信する。
 なお、分析システム1に含まれる各装置において、各構成要素の一部、または、全部は、汎用または専用の回路(circuitry)やプロセッサ、これらの組み合わせで実装されてもよい。これらの回路やプロセッサは、単一のチップによって構成されてもよいし、バスを介して接続される複数のチップによって構成されてもよい。また、各構成要素の一部、または、全部は、上述した回路等とプログラムとの組み合わせで実装されてもよい。また、各構成要素の一部、または、全部が、複数の情報処理装置や回路等で実装される場合、複数の情報処理装置や回路等は、集中配置されてもよいし、分散配置されてもよい。例えば、情報処理装置や回路等は、クライアントアンドサーバシステム、クラウドコンピューティングシステム等、各々が通信ネットワークを介して接続される形態で実装されてもよい。
 また、分析システム1に含まれる複数の装置の構成要素が、一つの物理的な装置に実装されてもよい。例えば、観測データ収集装置100、時系列記憶装置200、外的要因軽減装置300、及び、要因分析装置400の構成要素が、一つのコンピュータに実装されてもよい。
 次に、第1の実施形態における分析システム1の動作を説明する。
 ここでは、観測データ収集装置100により収集された、図2、図3のような、分析対象期間の説明時系列、目的時系列が、時系列記憶装置200に保存されていると仮定する。なお、初期状態では、図2における全ての説明時系列について、外的要因情報に「n」が設定されていると仮定する。
 はじめに、第1の実施形態における外的要因軽減処理について説明する。
 外的要因軽減処理は、説明時系列の内の外的要因時系列を特定し、目的時系列から外的要因の影響を軽減した時系列として、外的要因時系列に基づいて算出される目的時系列の予測値と目的時系列の観測値との差分時系列を生成する処理である。ユーザ等は、例えば、品質指標の値に異常が発見された場合等に、要因抽出処理の実行に先立ち、外的要因軽減装置300に、外的要因軽減処理の実行を指示する。
 図6は、第1の実施形態における、外的要因軽減処理を示すフローチャートである。
 はじめに、外的要因軽減装置300の外的要因特定部310は、時系列記憶装置200から、説明時系列と目的時系列を取得する(ステップS101)。
 外的要因特定部310は、外的要因特定処理により、説明時系列の内の外的要因時系列を特定する(ステップS102)。
 上述の通り、外的要因は、製造条件の内、例えば、気温や気圧、天候等、値の変化を制御できない項目である。ここでは、「外的要因は、目的時系列の値の変化に影響するが、目的時系列の値の変化は外的要因に影響しない」という前提に基づき、以下のように、外的要因時系列を特定する。
 図7は、第1の実施形態における、外的要因特定処理(ステップS102)の詳細を示すフローチャートである。
 外的要因特定部310は、説明時系列の各々について、目的時系列の値の変化に対する影響度を算出する(ステップS1021)。ここで、外的要因特定部310は、例えば、多変量解析手法を用いて、影響度を算出する。外的要因特定部310は、目的時系列を目的変数とし、説明時系列を説明変数とした多変量解析を実行する。なお、目的変数の値の変化に対する説明変数の影響度を算出できれば、外的要因特定部310は、多変量解析手法として、どのような手法を用いてもよい。例えば、目的時系列が量的データである場合、外的要因特定部310は、多変量解析として重回帰分析を用いることができる。重回帰分析が用いられた場合、それぞれの説明変数について算出されるp値の逆数またはt値を、影響度と見なすことができる。また、目的時系列が質的データである場合、多変量解析としてロジスティック回帰分析を用いることができる。ロジスティック回帰分析が用いられた場合、例えば、それぞれの説明変数について算出されるp値の逆数またはWald統計量を、影響度と見なすことができる。
 例えば、外的要因特定部310は、図3の目的時系列(ID「0」)を目的変数、図2の説明時系列(ID「1」、…、「N」)を説明変数とした多変量解析を実行する。
 外的要因特定部310は、ステップS1021で算出された影響度に基づき、説明時系列から、外的要因候補の説明時系列を抽出する(ステップS1022)。ここで、外的要因特定部310は、説明時系列の内、例えば、影響度が所定値以上の時系列を、外的要因候補の説明時系列として抽出する。
 例えば、ID「1」、「2」の説明時系列について算出した影響度が所定値以上であれば、外的要因特定部310は、ID「1」、「2」の説明時系列を外的要因候補の説明時系列として抽出する。
 外的要因特定部310は、外的要因候補の説明時系列の各々について、説明時系列の値の変化の目的時系列の値の変化による説明可能度合いを算出する(ステップS1023)。ここで、外的要因特定部310は、例えば、目的時系列から説明時系列を推定するための所定の時系列モデルにより、目的時系列と外的要因候補の説明時系列との関係を近似する。外的要因特定部310は、目的時系列から外的要因候補の説明時系列を推定できれば、どのような時系列モデルを用いてもよい。例えば、所定の時系列モデルとして、ARX(Auto-Regressive eXogeneous)モデルを仮定した場合、外的要因特定部310は、目的時系列と外的要因候補の説明時系列とから、ARXモデルのパラメータの値を決定する。
 そして、外的要因特定部310は、外的要因候補の時系列の各々について、時系列モデルの当てはまりの良さを示す指標の値を、上述の説明可能度合いとして算出する。このような指標として、例えば、時系列モデルにより目的時系列から外的要因候補の説明時系列を推定した場合の推定値の二乗誤差や適合度を用いることができる。
 例えば、外的要因特定部310は、目的時系列(ID「0」)から外的要因候補の説明時系列(ID「1」、ID「2」)の各々を推定するARXモデルのパラメータを決定し、当該ARXモデルの適合度を算出する。
 外的要因特定部310は、ステップS1023で算出された説明可能度合いに基づき、外的要因候補の説明時系列の内の、外的要因時系列を特定する(ステップS1024)。ここで、外的要因特定部310は、例えば、外的要因候補の説明時系列の内、説明可能度合いが所定値未満の説明時系列を、外的要因時系列として特定する。外的要因特定部310は、説明時系列記憶部210における、外的要因時系列として抽出された説明時系列の外的要因情報に「y」を設定する。
 例えば、ID「1」の説明時系列について算出した適合度が所定値未満であれば、外的要因特定部310は、当該説明時系列を外的要因時系列として特定する。外的要因特定部310は、図2に示すように、ID「1」の説明時系列の外的要因情報に「y」を設定する。
 このようにして抽出した外的要因時系列は、上述の前提「外的要因は、目的時系列の値の変化に影響するが、目的時系列の値の変化は外的要因に影響しない」を満たすと考えられる。
 なお、外的要因特定部310は、時系列記憶装置200に記憶されている説明時系列の内、ユーザ等により指定された説明時系列を、外的要因時系列として特定してもよい。
 次に、予測式生成部320は、外的要因時系列の値から目的時系列の値を予測するための予測式を生成する(ステップS103)。ここで、予測式生成部320は、例えば、目的時系列を目的変数とし、外的要因時系列を説明変数とした回帰分析を実行することにより、予測式を生成する。なお、外的要因時系列の値から目的時系列の値を予測するための予測式を生成できれば、予測式生成部320は、回帰分析の手法として、どのような手法を用いてもよい。例えば、予測式生成部320は、線形回帰分析により、Y(t)=aX(t)+bの形式の予測式を生成する。ここで、Y(t)は時刻tの目的時系列の予測値、X(t)は時刻tの外的要因時系列の値、a、bはパラメータである。予測式生成部320は、生成した予測式を、予測式記憶部330に保存する。
 差分時系列生成部340は、予測式により算出される目的時系列の予測値と目的時系列の観測値との差分時系列を生成する(ステップS104)。ここで、差分時系列生成部340は、予測式記憶部330に記憶されている予測式に、外的要因時系列の値を代入することにより、分析対象期間の各時刻における目的時系列の予測値を算出する。そして、差分時系列生成部340は、分析対象期間の各時刻における、算出した予測値と観測値との差分を算出する。差分時系列生成部340は、算出した差分を時刻順に並べたデータを、差分時系列として差分時系列記憶部350に保存する。
 図8は、第1の実施形態における、差分時系列の例を示す図である。例えば、差分時系列生成部340は、図2の外的要因時系列(ID「1」)、及び、図3の目的時系列(ID「0」)を用いて、図8のように差分時系列を生成する。
 図9は、第1の実施形態における、時系列のグラフを示す図である。図9のグラフでは、目的時系列(ID「0」)、外的要因時系列(ID「1」)、及び、差分時系列の時間変化が示されている。
 このようにして得られた差分時系列は、目的時系列から外的要因の影響を軽減した時系列と考えられる。
 次に、第1の実施形態における要因抽出処理について説明する。
 要因抽出処理は、説明時系列の内の外的要因時系列以外の説明時系列から、要因候補の説明時系列を抽出する処理である。ユーザ等は、例えば、外的要因軽減装置300による外的要因軽減処理が終了すると、要因分析装置400に要因抽出処理の実行を指示する。
 図10は、第1の実施形態における、要因抽出処理を示すフローチャートである。
 はじめに、要因分析装置400の時系列取得部410は、時系列記憶装置200から外的要因時系列以外の説明時系列を取得し、外的要因軽減装置300から差分時系列を取得する(ステップS201)。
 影響度算出部420は、外的要因時系列以外の説明時系列の各々について、差分時系列の値の変化に対する影響度を算出する(ステップS202)。ここで、影響度算出部420は、例えば、上述の外的要因特定処理で用いた多変量解析手法と同様の多変量解析手法を用いて、影響度を算出する。影響度算出部420は、差分時系列を目的変数とし、外的要因時系列以外の説明時系列を説明変数とした多変量解析を実行する。影響度算出部420は、影響度の算出結果を影響度記憶部430に保存する。
 図11は、第1の実施形態における、影響度の算出例を示す図である。図11の例では、算出された影響度の大きい順に説明時系列のIDが示されている。例えば、影響度算出部420は、図8の差分時系列を目的変数、図2の外的要因時系列以外の説明時系列(ID「2」、…、「N」)を説明変数とした多変量解析を実行し、図11のように影響度を算出する。
 なお、影響度算出部420は、複数の多変量解析手法の各々を用いて影響度を算出し、算出された影響度を統合してもよい。この場合、影響度算出部420は、例えば、各多変量解析手法において算出された影響度を、最大値が1、最小値が0になるように正規化し、正規化された影響度の和、または、平均を算出してもよい。影響度の和を算出する場合、多変量解析手法毎の影響度の単純和を算出してもよいし、多変量解析手法毎に所定の重みで重み付けした影響度の和を算出してもよい。
 要因候補出力部440は、影響度記憶部430から、影響度に基づき要因候補の説明時系列を抽出し、表示装置600、及び、制御装置700へ出力する(ステップS203)。ここで、要因候補出力部440は、例えば、影響度の大きい順に、所定数の説明時系列を、要因候補の説明時系列として抽出し、当該説明時系列のIDを影響度とともに出力する。また、要因候補出力部440は、影響度が所定値以上の説明時系列を抽出してもよい。
 例えば、要因候補出力部440は、図11の影響度の算出結果から、影響度の大きい順に、3つの説明時系列のID「2」、「9」、「8」を抽出し、出力する。
 表示装置600は、要因分析装置400から出力された要因候補を、ユーザ等に表示する(ステップS204)。
 図12は、第1の実施形態における、表示装置600により表示される表示画面の例を示す図である。図12の例では、要因候補出力部440から受信した説明時系列のID「2」、「9」、「8」が、影響度の大きい順に、影響度とともに、要因候補として表示されている。
 例えば、表示装置600は、図12のような表示画面を表示する。
 これにより、ユーザ等は、目的時系列の値の変化に影響を与える説明時系列の候補を把握できる。
 また、制御装置700は、要因分析装置400から出力された要因候補に基づき、被分析装置900を制御する(ステップS205)。ここで、制御装置700は、例えば、図示しない記憶部に予め記憶されている、品質指標の項目の値が正常な時の製造条件の各項目の値(正常時の値)を用いて、被分析装置900を制御してもよい。この場合、制御装置700は、要因候補の説明時系列に対応する製造条件の項目の値が、正常時の値となるように、被分析装置900を制御してもよい。
 例えば、制御装置700は、ID「2」、「9」、「8」の説明時系列に対応する製造条件の項目の値が、正常時の値となるように、被分析装置900を制御する。
 以上により、第1の実施形態の動作が完了する。
 次に、第1の実施形態の特徴的な構成について説明する。
 図13は、第1の実施形態の特徴的な構成を示すブロック図である。
 図13を参照すると、分析システム1は、外的要因特定部310(特定部)、差分時系列生成部340、及び、影響度算出部420を含む。外的要因特定部310は、複数の説明時系列の内の第1の説明時系列(外的要因時系列)を特定する。差分時系列生成部340は、目的時系列の値と、第1の説明時系列の値に基づき算出された目的時系列の予測値と、の差分時系列を生成する。影響度算出部420は、複数の説明時系列の内の1以上の第2の説明時系列(外的要因時系列以外の説明時系列)と、差分時系列と、に基づき、差分時系列の値の変化に対する、1以上の第2の説明時系列の各々の影響度を算出する。
 次に、第1の実施形態の効果について説明する。
 第1の実施形態によれば、システムの状態変化に強い相関を持つ外的要因が存在する場合でも、システムの状態変化に影響を与える、外的要因以外の要因を正しく特定できる。その理由は、分析システム1が、目的時系列の値と、第1の説明時系列の値に基づき算出された目的時系列の予測値と、の差分時系列を生成し、差分時系列の値の変化に対する第2の説明時系列の各々の影響度を算出するためである。
 また、第1の実施形態によれば、システムの状態変化に影響を与える、外的要因以外の要因を容易に把握できる。その理由は、分析システム1が、第2の説明時系列の各々の影響度に基づき、目的時系列の値の変化に影響を与える説明時系列の候補を抽出し、出力するためである。
 また、第1の実施形態によれば、外的要因が指定されていなくても、システムの状態変化に影響を与える、外的要因以外の要因を正しく特定できる。その理由は、分析システム1が、目的時系列の値の変化に影響し、かつ、目的時系列の値の変化により影響されない説明時系列を、第1の説明時系列として特定するためである。
 <<第2の実施形態>>
 第2の実施形態は、要因抽出処理において、説明時系列の代わりに、説明時系列から抽出された特徴量の時系列である特徴時系列を用いて要因候補の説明時系列を特定する点において、第1の実施形態と異なる。
 はじめに、第2の実施の形態の構成について説明する。
 図14は、第2の実施形態における、分析システム1の構成を示すブロック図である。図14を参照すると、第2の実施形態の分析システム1では、第1の実施形態の要因分析装置400が要因分析装置500に置き換わっている。
 要因分析装置500は、特許文献3の要因分析装置と同様の方法で、要因候補の説明時系列を抽出する。ただし、要因分析装置500は、特許文献3の要因分析装置で用いた目的時系列の代わりに差分時系列を用いて、要因候補の説明時系列を特定する。
 要因分析装置500は、時系列取得部510、特徴時系列変換部520、特徴時系列記憶部530、影響度算出部540、影響度記憶部550、要因候補出力部560、及び、前処理候補出力部570を含む。
 時系列取得部510は、第1の実施形態の時系列取得部410と同様に、時系列記憶装置200から外的要因時系列以外の説明時系列を、また、外的要因軽減装置300の差分時系列記憶部350から差分時系列を取得する。
 特徴時系列変換部520は、特許文献3の特徴時系列変換部と同様に、外的要因時系列以外の説明時系列から特徴量を抽出し、特徴時系列に変換する。特徴時系列変換部520は、特徴抽出部521と特徴変換部522とを含む。特徴抽出部521は、時系列取得部510が取得した説明時系列から特徴量を抽出する。特徴変換部522は、特徴抽出部521で抽出された特徴量に基づき、特徴時系列を生成する。
 特徴時系列記憶部530は、特徴時系列変換部520によって生成された特徴時系列を記憶する。
 影響度算出部540は、特許文献3の影響度算出部と同様に、差分時系列の値変化に対する説明時系列の影響度を算出する。影響度算出部540は、特徴時系列影響度算出部541と説明時系列影響度算出部542とを含む。特徴時系列影響度算出部541は、差分時系列に対する特徴時系列の影響度を算出する。説明時系列影響度算出部542は、特徴時系列の影響度に基づき、差分時系列に対する、外的要因時系列以外の説明時系列の影響度を算出する。
 影響度記憶部550は、特許文献3の影響度記憶部と同様に、影響度算出部540によって算出された特徴時系列の影響度と説明時系列の影響度とを記憶する。影響度記憶部550は、特徴時系列影響度記憶部551と説明時系列影響度記憶部552とを含む。特徴時系列影響度記憶部551は、特徴時系列の影響度を記憶する。説明時系列影響度記憶部552は、説明時系列の影響度を記憶する。
 要因候補出力部560(以下、第1の出力部とも記載)は、特許文献3の要因出力部と同様に、説明時系列の影響度に基づき、要因候補の説明時系列を抽出し、表示装置600や制御装置700へ出力する。
 前処理候補出力部570(以下、第2の出力部とも記載)は、特許文献3の要因出力部と同様に、特徴時系列の影響度に基づき、前処理として算出すべき特徴量の種類の候補(以下、前処理候補とも記載)を抽出し、表示装置600へ出力する。
 なお、要因分析装置500も、第1の実施形態における要因分析装置400と同様に、CPUとプログラムを格納した記録媒体とを含み、プログラムに基づく制御によって動作するコンピュータであってもよい。
 次に、第2の実施形態における分析システム1の動作を説明する。
 ここでは、第1の実施形態の具体例と同様に、観測データ収集装置100により収集された、図2、図3のような、分析対象期間の説明時系列、目的時系列が、時系列記憶装置200に保存されていると仮定する。
 第2の実施形態における外的要因軽減処理は、第1の実施形態における外的要因軽減処理と同様となる。
 ここでは、第1の実施形態の具体例と同様に、外的要因軽減処理により、外的要因時系列として、ID「1」の説明時系列が特定され、図8のような差分時系列が、差分時系列記憶部350に保存されていると仮定する。
 以下、第2の実施形態における要因抽出処理について説明する。
 図15は、第2の実施形態における、要因抽出処理を示すフローチャートである。
 はじめに、要因分析装置500の時系列取得部510は、時系列記憶装置200から外的要因時系列以外の説明時系列を取得し、外的要因軽減装置300から差分時系列を取得する(ステップS301)。
 特徴時系列変換部520の特徴抽出部521は、外的要因時系列以外の説明時系列の各々について、各時刻の特徴量を抽出する(ステップS302)。ここで、特徴抽出部521は、各説明時系列について、各時刻から所定の時間幅分の(「窓」の範囲内の)部分時系列を用いて、1以上の種類の各々の特徴量を抽出する。特徴量の種類としては、例えば、平均や分散等の統計量が用いられる。また、特徴量の種類として、自己回帰係数や、周波数分布、他の説明時系列との相関係数が用いられてもよい。特徴抽出部521は、窓を説明時系列の開始時刻から終了時刻に向けて所定の時点数ずつずらしながら、各時刻における特徴量を抽出することを、窓が終了時刻に到達するまで繰り返してもよい。
 特徴変換部522は、外的要因時系列以外の説明時系列の各々について、抽出された特徴量から特徴時系列を生成する(ステップS303)。ここで、特徴変換部522は、各説明時系列について、特徴量の各種類に対して、特徴抽出部521で抽出された各時刻の特徴量を時刻順に並べることで、特徴時系列を生成する。特徴変換部522は、生成した特徴時系列を特徴時系列記憶部530に保存する。
 図16は、第2の実施形態における、特徴時系列の例を示す図である。例えば、特徴時系列変換部520は、図2における外的要因時系列以外の各説明時系列(ID「2」、…、「N」)について、特徴量の各種類(「a」、「b」、…)に対して、図16のような特徴時系列を生成する。図16の例では、各特徴時系列に、特徴時系列の生成元の説明時系列と特徴量の種類とが識別可能なラベルが付与されている。例えば、ID「2」の説明時系列について、特徴量の種類「a」に対して生成された特徴時系列には、ラベル「a::2」が付与されている。
 影響度算出部540の特徴時系列影響度算出部541は、特徴時系列の各々について、差分時系列の値変化に対する影響度を算出する(ステップS304)。ここで、特徴時系列影響度算出部541は、例えば、上述の外的要因特定処理で用いた多変量解析手法と同様の多変量解析手法を用いて、特徴時系列の影響度を算出する。特徴時系列影響度算出部541は、1以上の多変量解析手法の各々について、差分時系列を目的変数とし、各特徴時系列を説明変数とした多変量解析を実行することにより、特徴時系列の影響度を算出する。特徴時系列影響度算出部541は、特徴時系列の影響度の算出結果を特徴時系列影響度記憶部551に保存する。特徴時系列の影響度は、例えば、最大値が1、最小値が0になるように正規化される。
 図17は、第2の実施形態における、特徴時系列の影響度の算出例を示す図である。例えば、特徴時系列影響度算出部541は、各多変量解析手法「手法I」、「手法II」、「手法III」の各々について、図8の差分時系列を目的変数、図16の各特徴時系列を説明変数とした多変量解析を実行する。これにより、特徴時系列影響度算出部541は、各特徴時系列の影響度を、図17のように算出する。図17の例では、算出された影響度の大きい順に、特徴時系列が示されている。
 説明時系列影響度算出部542は、特徴時系列の影響度に基づき、外的要因時系列以外の説明時系列の各々の、差分時系列の値変化に対する影響度を算出する(ステップS305)。ここで、説明時系列影響度算出部542は、例えば、1以上の多変量解析手法の各々について、説明時系列毎に、1以上の種類に対して算出された特徴時系列の影響度の和を算出することで、説明時系列の影響度を算出する。和を算出する対象は、各説明時系列に対して算出された全種類の特徴時系列でもよいし、影響度が大きい方から所定数の種類の特徴時系列でもよい。説明時系列影響度算出部542は、説明時系列の影響度の算出結果を説明時系列影響度記憶部552に保存する。
 図18は、第2の実施形態における、説明時系列の影響度の算出例を示す図である。例えば、説明時系列影響度算出部542は、多変量解析手法「手法I」、「手法II」、「手法III」の各々について、図17の特徴時系列の影響度を用いて、各説明時系列(ID「2」、…、「N」)の影響度を、図18のように算出する。図18の例では、算出された影響度の大きい順に、説明時系列が示されている。
 要因候補出力部560は、説明時系列影響度記憶部552から、説明時系列の影響度に基づき要因候補の説明時系列を抽出し、表示装置600、及び、制御装置700へ出力する(ステップS306)。ここで、要因候補出力部560は、例えば、説明時系列毎に、1以上の多変量解析手法に対して算出された説明時系列の影響度の和を求めることにより、説明時系列の影響度を統合する。影響度の和として、多変量解析手法毎の影響度の単純和を算出してもよいし、多変量解析手法毎に所定の重みで重み付けした影響度の和を算出してもよい。そして、要因候補出力部560は、例えば、統合された影響度の大きい順に、所定数の説明時系列を要因候補の説明時系列として抽出し、当該説明時系列のIDを影響度とともに出力する。なお、要因候補出力部560は、統合された影響度が所定値以上の説明時系列を抽出してもよい。
 図19は、第2の実施形態における、説明時系列の影響度の統合例を示す図である。例えば、要因候補出力部560は、図18の各説明時系列の影響度を、図19のように統合する。図19の例では、統合された影響度の大きい順に説明時系列が示されている。要因候補出力部560は、例えば、統合された影響度が1以上である説明時系列のID「13」、「37」を抽出し、要因候補として出力する。
 表示装置600は、要因分析装置500から出力された要因候補を、ユーザ等に表示する(ステップS307)。
 図20は、第2の実施形態における、表示装置600により表示される表示画面の例を示す図である。図20の例では、要因候補出力部560から受信した説明時系列のID「13」、「37」が、影響度の大きい順に、影響度とともに、要因候補として表示されている。
 例えば、表示装置600は、図20のような表示画面を表示する。
 これにより、ユーザ等は、目的時系列の値の変化に影響を与える説明時系列の候補を把握できる。
 また、制御装置700は、要因分析装置500から出力された要因候補に基づき、被分析装置900を制御する(ステップS308)。
 例えば、制御装置700は、制御装置700は、ID「13」、「37」の説明時系列に対応する製造条件の項目の値が、正常時の値となるように、被分析装置900を制御する。
 さらに、前処理候補出力部570は、特徴時系列影響度算出部541から、特徴時系列の影響度に基づき、前処理候補の特徴量の種類を抽出し、表示装置600へ出力する(ステップS309)。ここで、前処理候補出力部570は、例えば、特徴時系列の影響度の算出結果において、影響度が大きい特徴時系列の特徴量の種類を、前処理候補として抽出する。
 例えば、前処理候補出力部570は、図17の説明時系列の影響度の算出結果から、影響度が大きい特徴時系列「a::13」、及び、特徴時系列「a::37」の特徴量の種類「a」を、前処理候補として抽出する。
 表示装置600は、要因分析装置500から出力された前処理候補を、ユーザ等に表示する(ステップS310)。
 図21は、第2の実施形態における、表示装置600により表示される表示画面の他の例を示す図である。図21の例では、前処理候補出力部570から受信した特徴量の種類「a」が、前処理候補として表示されている。
 例えば、表示装置600は、図21のような表示画面を表示する。
 これにより、ユーザ等は、説明時系列に対して行うべき適切な前処理(前処理として算出すべき特徴量の種類)を把握できる。
 以上により、第2の実施形態の動作が完了する。
 次に、第2の実施形態の特徴的な構成について説明する。
 図22は、第2の実施形態の特徴的な構成を示すブロック図である。
 図22を参照すると、要因分析装置500は、時系列取得部510、特徴時系列変換部520、及び、影響度算出部540を含む。時系列取得部510は、複数の説明時系列の内の第1の説明時系列(外的要因時系列)の値に基づき生成された目的時系列の予測値と目的時系列の値との差分時系列、及び、第2の説明時系列(外的要因時系列以外の説明時系列)を取得する。特徴時系列変換部520は、第2の説明時系列の各々について、当該第2の説明時系列から特徴量を抽出し、当該特徴量を特徴時系列に変換する。影響度算出部540は、第2の説明時系列の特徴時系列と、差分時系列と、に基づき、差分時系列の値の変化に対する第2の説明時系列の各々の影響度を算出する。
 次に、第2の実施形態の効果について説明する。
 第2の実施形態によれば、システムの状態変化に強い相関を持つ外的要因が存在し、かつ、分析対象の時系列に前処理が必要な場合でも、システムの状態変化に影響を与える、外的要因以外の要因を正しく特定できる。その理由は、要因分析装置500が、第2の説明時系列から特徴量を抽出して特徴時系列に変換し、特徴時系列と差分時系列とに基づき、差分時系列の値の変化に対する、第2の説明時系列の各々の影響度を算出するためである。ここで、差分時系列は、目的時系列の値と、第1の説明時系列の値に基づき生成された目的時系列の予測値と、の差分時系列である。
 また、第2の実施形態によれば、システムの状態変化に影響を与える、外的要因以外の要因を容易に把握できる。その理由は、要因分析装置500が、第2の説明時系列の各々の影響度に基づき、目的時系列の値の変化に影響を与える説明時系列の候補を抽出し、出力するためである。
 また、第2の実施形態によれば、外的要因が指定されていなくても、システムの状態変化に影響を与える、外的要因以外の要因を正しく特定できる。その理由は、要因分析装置500が、目的時系列の値の変化に影響し、かつ、目的時系列の値の変化により影響されない説明時系列である、第1の説明時系列に基づいて生成された差分時系列を用いるためである。
 また、第2の実施形態によれば、説明時系列に対して行うべき適切な前処理を把握できる。その理由は、要因分析装置500が、第2の説明時系列の各々の、1以上の種類の特徴時系列の影響度に基づき、第2の説明時系列から抽出すべき特徴量の種類を抽出し、出力するためである。
 以上、実施形態を参照して本願発明を説明したが、本願発明は上記実施形態に限定されるものではない。本願発明の構成や詳細には、本願発明のスコープ内で当業者が理解し得る様々な変更をすることができる。
 例えば、上述の各実施形態では、分析対象のシステムが、製造システムであり、被分析装置900が、製造工程で使用される装置である場合を例に説明した。しかしながら、システムの運用に係る様々な項目の値を、分析対象の項目の値として取得できれば、分析対象のシステムは、他のシステムでもよい。
 例えば、分析対象のシステムは、IT(Information Technology)システムや、プラントシステム、発電システム、構造物、輸送機器でもよい。分析対象のシステムがITシステムの場合、例えば、目的時系列として、消費電力量や演算回数等の時系列が用いられる。また、説明時系列として、CPU使用率、メモリ使用率、ディスクアクセス頻度等のコンピュータリソースの使用率や使用量、通信ネットワークリソースの使用率や使用量等が用いられる。
 また、上述の各実施形態では、外的要因軽減装置300により特定される外的要因時系列の数が1の場合を例に説明した。しかしながら、特定される外的要因時系列の数は複数でもよい。この場合、外的要因軽減処理では、例えば、回帰分析により、複数の外的要因時系列の値から目的時系列の値を予測するための予測式が生成され、当該予測式に基づき、差分時系列が生成される。
 また、上述の各実施形態では、目的時系列の数が1の場合を例に説明した。しかしながら、目的時系列の数は複数でもよい。この場合、外的要因軽減処理では、例えば、複数の目的時系列の各々について、外的要因時系列が特定され、差分時系列が生成される。そして、要因抽出処理では、複数の差分時系列の各々について、外的要因時系列以外の説明時系列の影響度が算出され、要因候補の説明時系列が抽出される。
 また、外的要因特定処理や、要因抽出処理では、多変量解析手法として、非特許文献1に記載されているL1正則化ロジスティック回帰や、非特許文献2に記載されているランダム森分類器を用いてもよい。
 1  分析システム
 100  観測データ収集装置
 200  時系列記憶装置
 210  説明時系列記憶部
 220  目的時系列記憶部
 300  外的要因軽減装置
 310  外的要因特定部
 320  予測式生成部
 330  予測式記憶部
 340  差分時系列生成部
 350  差分時系列記憶部
 301  CPU
 302  記憶デバイス
 303  入出力デバイス
 304  通信デバイス
 400  要因分析装置
 401  CPU
 402  記憶デバイス
 403  入出力デバイス
 404  通信デバイス
 410  時系列取得部
 420  影響度算出部
 430  影響度記憶部
 440  要因候補出力部
 500  要因分析装置
 510  時系列取得部
 520  特徴時系列変換部
 521  特徴抽出部
 522  特徴変換部
 530  特徴時系列記憶部
 540  影響度算出部
 541  特徴時系列影響度算出部
 542  説明時系列影響度算出部
 550  影響度記憶部
 551  特徴時系列影響度記憶部
 552  説明時系列影響度記憶部
 560  要因候補出力部
 570  前処理候補出力部
 600  表示装置
 700  制御装置
 900  被分析装置

Claims (10)

  1.  目的時系列の値と、複数の説明時系列の内の第1の説明時系列の値に基づき生成された前記目的時系列の予測値と、の差分時系列、及び、前記複数の説明時系列の内の1以上の第2の説明時系列を取得する、時系列取得手段と、
     前記1以上の第2の説明時系列の各々について、当該第2の説明時系列から特徴量を抽出し、当該特徴量を特徴時系列に変換する特徴時系列変換手段と、
     前記1以上の第2の説明時系列の特徴時系列と、前記差分時系列と、に基づき、前記差分時系列の値の変化に対する、前記1以上の第2の説明時系列の各々の影響度を算出する、影響度算出手段と、
     を備える分析装置。
  2.  さらに、前記1以上の第2の説明時系列の各々の影響度に基づき、前記1以上の第2の説明時系列から、前記目的時系列の値の変化に影響する説明時系列の候補を抽出し、出力する、第1の出力手段を備える、
     請求項1に記載の分析装置。
  3.  前記第1の説明時系列は、前記複数の説明時系列の内、前記目的時系列の値の変化に影響し、かつ、前記目的時系列の値の変化により影響されない説明時系列である、
     請求項1または2に記載の分析装置。
  4.  前記影響度算出手段は、
     前記1以上の第2の説明時系列の特徴時系列と、前記差分時系列と、に基づき、前記差分時系列の値の変化に対する、前記1以上の第2の説明時系列の各々の特徴時系列の影響度を算出し、
     前記1以上の第2の説明時系列の各々について、当該第2の説明時系列の特徴時系列の影響度に基づき、前記差分時系列の値の変化に対する当該第2の説明時系列の影響度を算出する、
     請求項1乃至3のいずれかに記載の分析装置。
  5.  前記影響度算出手段は、
     前記1以上の第2の説明時系列の各々について、1以上の種類の各々の特徴量を抽出し、当該1以上の種類の各々の特徴量を特徴時系列に変換し、
     前記1以上の第2の説明時系列の各々の前記1以上の種類の各々の特徴時系列について、前記差分時系列の値の変化に対する、当該特徴時系列の影響度を算出し、
     前記1以上の第2の説明時系列の各々について、当該第2の説明時系列の前記1以上の種類の特徴時系列の影響度に基づき、前記差分時系列の値の変化に対する当該第2の説明時系列の影響度を算出する、
     請求項4に記載の分析装置。
  6.  さらに、前記1以上の第2の説明時系列の各々の前記1以上の種類の特徴時系列の影響度に基づき、前記1以上の第2の説明時系列から抽出すべき特徴量の種類を抽出し、出力する、第2の出力手段を備える、
     請求項5に記載の分析装置。
  7.  目的時系列の値と、複数の説明時系列の内の第1の説明時系列の値に基づき生成された前記目的時系列の予測値と、の差分時系列、及び、前記複数の説明時系列の内の1以上の第2の説明時系列を取得し、
     前記1以上の第2の説明時系列の各々について、当該第2の説明時系列から特徴量を抽出し、当該特徴量を特徴時系列に変換し、
     前記1以上の第2の説明時系列の特徴時系列と、前記差分時系列と、に基づき、前記差分時系列の値の変化に対する、前記1以上の第2の説明時系列の各々の影響度を算出する、
     分析方法。
  8.  さらに、前記1以上の第2の説明時系列の各々の影響度に基づき、前記1以上の第2の説明時系列から、前記目的時系列の値の変化に影響する説明時系列の候補を抽出し、出力する、
     請求項7に記載の分析方法。
  9.  前記第1の説明時系列は、前記複数の説明時系列の内、前記目的時系列の値の変化に影響し、かつ、前記目的時系列の値の変化により影響されない説明時系列である、
     請求項7または8に記載の分析方法。
  10.  コンピュータに、
     目的時系列の値と、複数の説明時系列の内の第1の説明時系列の値に基づき生成された前記目的時系列の予測値と、の差分時系列、及び、前記複数の説明時系列の内の1以上の第2の説明時系列を取得し、
     前記1以上の第2の説明時系列の各々について、当該第2の説明時系列から特徴量を抽出し、当該特徴量を特徴時系列に変換し、
     前記1以上の第2の説明時系列の特徴時系列と、前記差分時系列と、に基づき、前記差分時系列の値の変化に対する、前記1以上の第2の説明時系列の各々の影響度を算出する、
     処理を実行させるプログラムを記憶する記録媒体。
PCT/JP2018/001725 2018-01-22 2018-01-22 分析装置、分析方法、及び、記録媒体 WO2019142344A1 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
US16/960,687 US20200342048A1 (en) 2018-01-22 2018-01-22 Analysis device, analysis method, and recording medium
PCT/JP2018/001725 WO2019142344A1 (ja) 2018-01-22 2018-01-22 分析装置、分析方法、及び、記録媒体
JP2019565673A JP7028259B2 (ja) 2018-01-22 2018-01-22 分析装置、分析方法、及び、プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2018/001725 WO2019142344A1 (ja) 2018-01-22 2018-01-22 分析装置、分析方法、及び、記録媒体

Publications (1)

Publication Number Publication Date
WO2019142344A1 true WO2019142344A1 (ja) 2019-07-25

Family

ID=67301624

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2018/001725 WO2019142344A1 (ja) 2018-01-22 2018-01-22 分析装置、分析方法、及び、記録媒体

Country Status (3)

Country Link
US (1) US20200342048A1 (ja)
JP (1) JP7028259B2 (ja)
WO (1) WO2019142344A1 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11941513B2 (en) * 2018-12-06 2024-03-26 Electronics And Telecommunications Research Institute Device for ensembling data received from prediction devices and operating method thereof

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015136586A1 (ja) * 2014-03-14 2015-09-17 日本電気株式会社 要因分析装置、要因分析方法および要因分析プログラム

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090125155A1 (en) * 2007-11-08 2009-05-14 Thomas Hill Method and System for Optimizing Industrial Furnaces (Boilers) through the Application of Recursive Partitioning (Decision Tree) and Similar Algorithms Applied to Historical Operational and Performance Data
US10207489B2 (en) * 2015-09-30 2019-02-19 Sigma Labs, Inc. Systems and methods for additive manufacturing operations
GB2557653B (en) * 2016-12-14 2019-05-22 Frito Lay Trading Co Gmbh Frying method and apparatus
JP6870312B2 (ja) * 2016-12-19 2021-05-12 富士通株式会社 施策導入効果予測装置、施策導入効果予測プログラム及び施策導入効果予測方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015136586A1 (ja) * 2014-03-14 2015-09-17 日本電気株式会社 要因分析装置、要因分析方法および要因分析プログラム

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
KATAOKA, JUN: "Management for seasonal variation", OPERATIONS RESEARCH AS A MANAGEMENT SCIENCE RESEARCH, vol. 43, no. 8, 1 August 1998 (1998-08-01), pages 436 - 441, ISSN: 0030-3674 *

Also Published As

Publication number Publication date
JPWO2019142344A1 (ja) 2020-12-17
JP7028259B2 (ja) 2022-03-02
US20200342048A1 (en) 2020-10-29

Similar Documents

Publication Publication Date Title
US9658916B2 (en) System analysis device, system analysis method and system analysis program
JP6406261B2 (ja) 情報処理装置、及び、分析方法
US10496730B2 (en) Factor analysis device, factor analysis method, and factor analysis program
KR101948604B1 (ko) 센서 군집화 기반의 설비 건강 모니터링 방법 및 장치
US10599501B2 (en) Information processing device, information processing method, and recording medium
JP6828807B2 (ja) データ解析装置、データ解析方法およびデータ解析プログラム
US20200341454A1 (en) Factor analysis method, factor analysis device, and factor analysis program
JP6183449B2 (ja) システム分析装置、及び、システム分析方法
US20190064789A1 (en) System analyzing device, system analyzing method, and computer-readable recording medium
US20190265088A1 (en) System analysis method, system analysis apparatus, and program
US11004002B2 (en) Information processing system, change point detection method, and recording medium
Lujic et al. Adaptive recovery of incomplete datasets for edge analytics
CN107121943A (zh) 一种用于获得智能仪表的健康预测信息的方法和装置
WO2019142344A1 (ja) 分析装置、分析方法、及び、記録媒体
JP7226542B2 (ja) 時系列データ処理方法、時系列データ処理装置、プログラム
US10157113B2 (en) Information processing device, analysis method, and recording medium
WO2019142346A1 (ja) 分析システム、分析方法、及び、記録媒体
US11580414B2 (en) Factor analysis device, factor analysis method, and storage medium on which program is stored
US20230297095A1 (en) Monitoring device and method for detecting anomalies
JP2019113970A (ja) プロセスの状態診断方法及び状態診断装置
US20220413480A1 (en) Time series data processing method
Jelali et al. Statistical process control
JP7408911B2 (ja) 異常検知装置及び異常検知方法
Galatro et al. Exploratory Data Analysis

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 18901001

Country of ref document: EP

Kind code of ref document: A1

ENP Entry into the national phase

Ref document number: 2019565673

Country of ref document: JP

Kind code of ref document: A

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 18901001

Country of ref document: EP

Kind code of ref document: A1