EP4291957A1 - Vorhersagemodell zum vorhersagen von produktqualitätsparameterwerten - Google Patents

Vorhersagemodell zum vorhersagen von produktqualitätsparameterwerten

Info

Publication number
EP4291957A1
EP4291957A1 EP22709254.1A EP22709254A EP4291957A1 EP 4291957 A1 EP4291957 A1 EP 4291957A1 EP 22709254 A EP22709254 A EP 22709254A EP 4291957 A1 EP4291957 A1 EP 4291957A1
Authority
EP
European Patent Office
Prior art keywords
parameter values
training
product quality
product
process parameter
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
EP22709254.1A
Other languages
English (en)
French (fr)
Inventor
Robert Helterhoff
Heinrich Koch
Matthias Schönnagel
Christopher Seibel
Georg Sieber
Mylène Speisser
Sophie Ruoshan WEI
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Uhde Inventa Fischer GmbH
ThyssenKrupp AG
Original Assignee
Uhde Inventa Fischer GmbH
ThyssenKrupp AG
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Uhde Inventa Fischer GmbH, ThyssenKrupp AG filed Critical Uhde Inventa Fischer GmbH
Publication of EP4291957A1 publication Critical patent/EP4291957A1/de
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation
    • G06N5/022Knowledge engineering; Knowledge acquisition
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B13/00Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
    • G05B13/02Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
    • G05B13/0265Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric the criterion being a learning criterion

Definitions

  • the invention relates to a method for training a machine learning module of a computer-implemented prediction model for predicting product quality parameter values for one or more quality parameters of a chemical product manufactured by a chemical production plant. Furthermore, the invention relates to a method for predicting corresponding product quality parameter values using the computer-implemented prediction model with the trained machine learning module. Finally, the invention relates to computer systems for carrying out the training and the prediction method.
  • machine learning methods make it possible to provide prediction models for the outcome of complex, non-linear process sequences.
  • training data is generally only available to a limited extent, since for a variety of reasons it is not possible or unrealistic to collect lengthy and extensive test runs of data that adequately reflect all possible operating conditions of the systems. Especially since such test runs would have to be repeated every time the system was changed and even if system components were replaced. Due to these limitations, available prediction models based on machine learning methods are either too imprecise in their predictions or too specific in that they are only able to make precise predictions for certain operating conditions.
  • the object of the invention is to create an improved method for training machine learning modules for predicting product quality parameter values for chemical products produced by chemical production plants.
  • Embodiments include a method for training a machine learning module of a computer-implemented prediction model for predicting product quality parameter values for one or more quality parameters of a chemical product manufactured by a chemical production facility, wherein the production facility comprises a plurality of sensors, each of which is configured to do so operation of the production facility process parameter values for one or more process parameters of a chemical process carried out by the production facility to produce the chemical product, the method comprising:
  • the training data for a plurality of product units manufactured by the production plant includes product quality parameter values determined for one or more quality parameters of the respective product unit as training product quality parameter values, with the training product quality parameter values being assigned a production time of the product unit for which they are were agreed, wherein the training data further from each of the sensors each comprise a plurality of process parameter values as training process parameter values, which were recorded during the manufacture of the product units for which the training product quality parameter values were determined, the training process parameter values each having a recording time and an identifier of the recording sensor assigned,
  • Embodiments may have the advantage that time shifts between the acquisition times at which the individual sensors acquire the training process parameter values and the manufacturing time, such as the time at which the manufacturing of the product unit is completed, i.e. the end of the manufacturing process, can be effectively accounted for.
  • Corresponding time delays can be based on the timing of the process flow, i.e. the order and duration of individual process steps, but can also be due to the structure of the production plant.
  • corresponding time delays can depend on transport routes and transport capacities within the production plant. For example, processing and/or reaction speeds, heating and/or cooling speeds, as well as pipeline lengths, pipe cross-sections and/or flow or throughput speeds can influence the time shift.
  • a machine learning module such as an artificial neural network
  • embodiments are able to achieve high accuracy and generalization capabilities in real-world applications, even when only a limited amount and variability of historical data is available.
  • the machine learning module trained in this way enables precise predictions about the quality of intermediate and end products, which are manufactured in production plants, such as polymer production plants, to be made in real time from measured process data of the corresponding production plants.
  • Real-time predictions mean that the corresponding predictions are made, for example, during the production process, ie before the production of the corresponding intermediate and end products, the quality of which is predicted, is completed. This allows, if necessary, for example during the production of the corresponding Intermediate and end products in the production process and to influence the quality of the intermediate and end products. Even if corresponding forecasts are only available at the end of production, for example, they can have the advantage of providing direct information about the quality of the intermediate and end products without the need for time-consuming additional laboratory tests.
  • the product quality of a product is defined by a group of product quality parameters, which are described in terms of quantitative values of material properties of the corresponding product, such as viscosity, purity, turbidity, color scale, etc.
  • parameters such as product composition, proportions, pH value, phase distribution/proportions, hardness, (grain) size distribution and/or density can also play a role.
  • Embodiments may have the advantage of overcoming the fundamental problem of a lack of extensive training data sets with process and product quality data collected under real conditions.
  • Embodiments integrate engineering expertise about the underlying process, such as a physicochemical process, and the plant design specifically as prior knowledge in modeling and training processes to provide a trained prediction model based on artificial intelligence (AI). After successful training, the resulting prediction model is able to precisely depict complex and dynamic relationships between plant operation and the resulting product quality.
  • AI artificial intelligence
  • Industrial manufacturing processes such as polymer manufacturing processes, have a highly complex, non-linear dependency between the operating parameters or process control parameters of the process and properties of the resulting product.
  • the quality of a polymer end product is determined by its material properties, such as viscosity, color and/or purity, which in turn determine the grade of the product. Different grades of the same product lead, for example, to different possible uses and/or prices. Therefore, monitoring, controlling, and optimizing product quality is critical to the overall performance and profitability of a manufacturing facility, such as a polymer manufacturing facility.
  • Embodiments can have the advantage that dynamic effects of the system control and process setting can also be taken into account.
  • tube lengths and diameters are known fixed variables of the production plant.
  • a resulting transport time of process components can also, for example, from measured process parameter values, such as such as a flow rate of the process components transported through the corresponding pipes.
  • the method further includes cleaning the provided training process parameter values, wherein the cleaning includes one or more of the following data processing steps:
  • Non-physical values designate training process parameter values which contradict the physical laws underlying the processes under consideration.
  • physical value ranges can be defined based on the design of the system and the physical and chemical processes taking place in the system, i.e. value ranges that are in accordance with the underlying physical laws. Training process parameter values that are outside of these expected value ranges are considered unphysical, for example. In the case of such non-physical values, it can be assumed that they are based, for example, on errors in the acquisition of the training process parameter values.
  • the system design can, for example, define value ranges for parameter values or training process parameter values for which the system is designed and which can be achieved in the system. If training process parameter values lie outside of these expected value ranges for which the system is designed, the corresponding training process parameter values can be rejected as unphysical.
  • an assessment as to whether a training process parameter value is non-physical is made locally, ie taking into account the local design of the plant and the physical and chemical processes running locally in the plant. For example, a judgment is made as to whether a training process parameter value detected by one sensor is unphysical, taking into account training process parameter values detected by neighboring sensors. For example, cross-sensor plausibility checks can be carried out, implausible values as unphysically identified and removed. For example, training process parameter values recorded by neighboring sensors should not differ from one another, or only to a limited extent, if no process steps, ie physical and/or chemical processes, occur between or in the area of the corresponding sensors, which can lead to a significant change in the corresponding training process parameter values .
  • a significant change means, for example, a change that lies outside of a predefined range of fluctuation, as can be caused, for example, by tolerances in the design of the production system and/or tolerances in the measuring accuracy of the sensors used for measuring.
  • certain developments can be assumed for the training process parameter values. For example, in the absence of exothermic reactions, ie, in the case of no or purely endothermic reactions, without power input to the system, a temperature should decrease due to heat dissipation generally occurring. If successive temperature sensors provide increasing training process parameter values for temperature, although a decrease in temperature is to be expected for these sensors, a plausibility test can lead to a rejection of the increasing training process parameter values as unphysical values.
  • the method also includes for one or more sensors an aggregation of the training process parameter values detected by the respective sensor, with the corresponding training process parameter values being assigned to an aggregation time window using the respectively assigned detection times, with process parameter values assigned to a common aggregation time window being aggregated in each case.
  • Embodiments can have the advantage that the training data is easier to handle and evaluate in an aggregated form.
  • providing input data further includes extracting statistical feature values and/or frequency feature values from the training process parameter values for training the machine learning module.
  • Embodiments may have the advantage that by using statistical feature values such as mean, median, minimum, maximum, variance, etc. and/or frequency feature values such as dominant frequency, low or low frequency content, spectral difference, etc. the amount of data to be processed by the machine learning module is reduced and the learning can therefore be carried out more efficiently and less error-prone.
  • providing input data further includes scaling the extracted feature values to train the machine learning module.
  • Embodiments can have the advantage that suitably scaled, for example standardized, data can be processed more efficiently by the machine learning module.
  • providing output data includes scaling the training product quality parameter values.
  • providing input data further includes reducing the dimensionality of extracted feature values using a transformation of the extracted feature values.
  • a principal component analysis for example, can be used as a transformation technique.
  • Embodiments can have the advantage that the amount of data to be processed by the machine learning module is reduced and the learning can therefore be carried out more efficiently.
  • the method further comprises assigning weighting factors of the machine learning module, which are used for weighting of extracted features, which are based on training process parameters that were acquired for identical process parameters from sensors that are arranged within the same subsystem of the production plant are, to a common weighting group, weighting factors of the same weighting group being equated and trained together.
  • weighting factors of the machine learning module which are used for weighting of extracted features, which are based on training process parameters that were acquired for identical process parameters from sensors that are arranged within the same subsystem of the production plant are, to a common weighting group, weighting factors of the same weighting group being equated and trained together.
  • one or more application-specific loss functions are provided for use by the machine learning module to selectively weight specific prediction errors more than other prediction errors during training.
  • Embodiments can have the advantage that prediction errors can be individually weighted. If the predictions of the prediction model are to be used for quality control of the manufactured products, it can be important that the predicted quality for selected or all product quality parameters is not rated too positively. It can thus be ensured that, using the corresponding predictions, product units of insufficient quality can be sorted out with a high level of reliability and the risk can be minimized that insufficient product units are inadvertently let through due to tolerances in the predictions. For example, a prediction error that predicts product purity too high is scored negatively as a prediction error that predicts product purity too low.
  • test data are provided as a second statistically independent sample, which include test process parameter values and test product quality parameter values, the test data being used to test the prediction precision of the prediction model with the machine learning module trained with the training data, the testing being a Predict product quality parameter values using the Test process parameter values and comparing the resulting predicted product quality parameter values with the expected test product quality parameter values, wherein in the case of widely varying operating conditions of the production plant under which the training data and test data are created, the training data and test data are compiled in such a way that the different operating conditions in the training data and Test data are each proportionally represented equally.
  • Embodiments may have the advantage of enabling effective and reliable testing of the prediction precision of the prediction model.
  • the machine learning module includes an artificial neural network, for example a multilayer perceptron (“Multilayer Perceptron”/IVILP), a convolutional neural network (CNN), a recurrent neural network (RNN) or a long Short-Term Memory Network (LSTM network)
  • an artificial neural network for example a multilayer perceptron (“Multilayer Perceptron”/IVILP), a convolutional neural network (CNN), a recurrent neural network (RNN) or a long Short-Term Memory Network (LSTM network)
  • LSTM network long Short-Term Memory Network
  • the chemical production facility is a large-scale chemical production facility.
  • a large-scale chemical production plant can be a production plant which is designed to produce chemical products on a large-scale, in particular an industrial scale.
  • Such a plant i.e. a chemical production plant and/or large-scale chemical production plant, can be made up of a large number of subsystems (e.g. 5-10 or more).
  • a subsystem is characterized in particular by the fact that it can be an independently functional assembly whose function preferably has a direct influence on production or the production flow.
  • the production facility is a physicochemical production facility, for example a polymer production facility for producing a polymer product.
  • the polymer can be, for example, polyethylene terephthalate (PET), polyamide (PA), polylactide (PLA), polyethylene (PE), polypropylene (PP), polyvinyl chloride (PVC), soft polyethylene (LDPE) or ethylene vinyl acetate -copolymers (EVA).
  • the chemical production facility can be a polymer production facility for producing a polymer, a cement production facility for producing cement, or an aromatics extraction facility for producing or providing aromatics using an extraction process.
  • the product quality parameter values of the product units are product quality parameter values that are determined using samples from the corresponding product units, for example using a product quality analysis method carried out in a laboratory.
  • Embodiments further include a method for predicting product quality parameter values for one or more quality parameters of a chemical product manufactured by a chemical manufacturing facility using a computer-implemented prediction model having a machine learning module trained according to any of the preceding embodiments, the manufacturing facility having a plurality of sensors which are each configured to record process parameter values for one or more process parameters of a chemical process carried out by the production plant for the production of the chemical product during operation of the production plant, the method comprising:
  • Embodiments can have the advantage that a method for data-based online product quality prediction for industrial chemical production plants is provided. Consequently does not have to wait for an analysis, such as a laboratory analysis, of the product quality. Rather, a precise indication of the quality of the corresponding manufactured product can already be given directly upon completion.
  • This enables effective quality monitoring, in the course of which, for example, product units with insufficient quality can be sorted out. Inadequate quality is present, for example, when one or more of the predicted product quality parameters lie outside a predefined permissible tolerance range.
  • predictive-based quality monitoring enables quality monitoring that takes into account the quality of each individual product unit and not just individual statistical samples analyzed in the laboratory.
  • Embodiments use readily available process data to predict product quality.
  • Embodiments can have the advantage of providing a data analysis tool that enables a detailed analysis of historical data and is able to analyze correspondingly large amounts of data efficiently in order to gain relevant insights.
  • embodiments are able to precisely predict the product quality.
  • Embodiments can have the advantage that properties of the end product can be determined completely using process parameters during operation of the production plant, i.e. during the manufacturing process.
  • the production plant collects process data, i.e. process parameter values, for a plurality of process parameters at each manufacturing step in the production operation, i.e. regular operation.
  • Embodiments can have the advantage that, in contrast to known simulation and modeling methods, they are able to precisely derive product quality properties from real-time process data despite nonlinear complexity and multivariance, such as those that occur in polymer manufacturing processes.
  • embodiments can have the advantage, in contrast to known models for quality prediction, of being able to take full account of dynamic fluctuations and external influences, as they always occur in real industrial processes.
  • embodiments can apply all data processing methods of the training process parameter values previously described for the training.
  • the method includes additional training of the trained machine learning module, wherein the additional training includes:
  • the prediction model is configured to account for changing operating conditions.
  • the predictive model captures process data for continuous learning and is thus able to automatically adapt to changing conditions. If the recorded process data includes previously unseen, changed process data resulting from the changed operating conditions, these are used in the course of continued, continuous training of the prediction model and used as training data. Thus, for example, additional training, ie retraining or retraining, of the prediction model is also possible. Taking into account current and possibly previously unseen, changed process and/or product quality data makes it possible to expand the degree of generalization of the predictive ability of the prediction model, which puts it in a position to dynamically adapt to a wide range of future changes in production conditions.
  • the method further includes detecting anomalies in the predicted product quality parameter values, wherein detecting the anomalies includes:
  • the predefined criterion includes exceeding a predefined first threshold value.
  • meeting the predefined criterion includes a confidence level of the deviation falling below a predefined second threshold value.
  • a prerequisite for initiating additional training of the trained machine learning module includes identifying one or more of the predicted product quality parameter values as an anomaly.
  • Embodiments may have the advantage that the machine learning module can be improved if the anomaly is caused by inadequacies in the previous training of the machine learning module.
  • the method further includes: • selecting, from the process parameters for which the sensors of the production plant record process parameter values, a group of controllable process parameters which are controllable by a central control system of the production plant,
  • Embodiments can have the advantage that those process parameters which are decisive for the product quality can be identified from a large number of process parameters.
  • the method further includes:
  • Embodiments can have the advantage that recommendations for improved or optimized control of the production plant can be provided.
  • a method for interactive process optimization in production plants such as industrial or large-scale chemical production plants, can be provided.
  • Embodiments can also have the advantage that they are able to provide sophisticated, data-driven recommendations for setting process parameters to improve, in particular to optimize, plant operation.
  • An improvement, in particular optimization, of plant operation means, for example, an improvement, in particular optimization, of the resulting product quality.
  • An improvement, in particular an optimization can also affect other parameters, such as process parameters, for example in the form of an increase, in particular maximization, throughput, an increase, in particular maximization, an overall profitability of the system and/or a reduction, in particular minimizing the energy consumption of the entire system or individual system areas.
  • the user is provided with an interactive user interface on a display of a user interface.
  • the interactive user interface provides the user with an input and/or selection option for entering and/or selecting desired target values, for example desired product quality values. Using the corresponding input and/or selection values, the interactive user interface provides the user with recommendations for setting process parameters, with the use of which the desired product quality values can be achieved.
  • Embodiments can have the advantage that suboptimal operating conditions of the production plant, such as have frequently occurred in polymer plants up to now, can be avoided. For example, it is possible for embodiments to determine the settings for process control parameters, which ensure a stable and optimal quality of a certain product, even given a plurality of adjustable process control parameters, each of which has a strong interaction with one another and a strong influence on the product quality properties .
  • Embodiments can thus provide a method for controlling and optimizing product quality in addition to online monitoring of various product properties.
  • Embodiments further include a computer system for training a machine learning module of a computer-implemented predictive model to predict product quality parameter values for one or more quality parameters of a chemical product manufactured by a chemical manufacturing facility, the manufacturing facility having a plurality of Includes sensors, each of which is configured to record process parameter values for one or more process parameters of a chemical process carried out by the production plant for producing the chemical product during operation of the production plant, the computer system comprising a processor and a memory, the memory the prediction model is stored with the machine learning module, the memory further storing program instructions, execution of the program instructions by the processor causing the processor to perform a method comprising:
  • the computer system is configured to execute each of the previously described embodiments of the method for training the machine learning module.
  • Figure 1 shows a schematic diagram of an exemplary prediction model
  • Figure 2 shows a schematic flow chart of an exemplary training method for training a prediction model using a priori additional information
  • Figure 3 shows a schematic flowchart of an exemplary method for detecting and analyzing anomalies
  • Figure 4 shows a schematic flowchart of an exemplary method for re-training or retraining the prediction model
  • Figures 5 shows schematic flowcharts of an exemplary improvement method for improving process parameter settings
  • Figures 6 exemplary Time series data of process and product quality parameter values for a PET production plant
  • Figure 7 exemplary diagrams of a comparison of predicted and retrospectively measured product quality parameter values
  • FIG. 10 shows a schematic diagram of an example production plant
  • FIG. 11 shows a schematic flow diagram of an example training method
  • FIG. 12 shows a schematic diagram of an example infrastructure for training a prediction model.
  • C designates a vector of process parameter values which can be directly influenced by a user, ie the operator, of a production facility.
  • C Q denotes a vector of process parameter values which can be influenced directly by the operator of the production plant and which can themselves influence the product quality.
  • C Q ⁇ X C applies.
  • P designates a vector of process parameter values which cannot be directly influenced by the operator of the production plant.
  • X denotes a vector of all process parameter values, i.e.,
  • Figure 1 illustrates a structure of an exemplary predictive model 120 and data preparation performed by the predictive model in the course of its use.
  • the cleaned data is aggregated and shifted to an appropriate frequency using aggregation techniques such as data rolling or resampling (up- or down-sampling).
  • aggregation techniques such as data rolling or resampling (up- or down-sampling).
  • one or more characteristic feature values such as mean, median, minimum, maximum, variance, etc. are extracted from the aggregated groups for the respective group.
  • the extracted feature data is normalized in block 124 using transformation methods such as shifting by means, dividing by standard variation.
  • a principal component analysis (“Principal Components Analysis”/PCA) can optionally be carried out in order to reduce the dimensionality of the normalized feature data, where values of important features are combined and values of unimportant features are removed
  • an artificial neural network model is provided which has been specifically trained to approximate a particular complex non-linear production process, such as a polymer production process, and which is derived from the pre-processed process data Raw output data, i.e. raw product quality parameters values, calculated.
  • the raw artificial neural network output data is transformed and normalized to obtain predictions for product quality parameter values.
  • the training data of the training data sets ⁇ X T , Q j ⁇ 245 can be recorded, for example, during a regular operating phase of the production plant or during a commissioning phase of the production plant. In particular, they can be recorded live and made directly available to the prediction model for training purposes.
  • the untrained prediction model 210 shown in FIG. 2 includes a sequence of modules 211-217.
  • Modules 211 to 215 are, for example, data preparation modules, module 216 is an artificial neural network module and module 217 is a data post-processing module.
  • the data preparation modules include, for example, a data cleansing module 211, a data aggregation module 212, a data transformation module 213, a data normalization module 214 and/or a main component analysis module 215.
  • the module 216 is, for example, a neural network module that contains an artificial provides a neural network, for example a multi-layer perceptron (MLP), a convolutional neural network (CNN), a recurrent neural network (RNN), a long short-term memory network (LSTM network ) etc.
  • MLP multi-layer perceptron
  • CNN convolutional neural network
  • RNN recurrent neural network
  • LSTM network long short-term memory network
  • the training datasets should be as extensive as possible, ie they should cover a sufficiently long period of time in which the production plant has been operated under all possible operating conditions and a wide range of product qualities has been produced.
  • a predictive model can be effectively trained, whereby it learns a set of model parameters in order to optimally map the relationships between input, ie between process data, and output, ie product quality, from the training data.
  • the performance of the predictive model could then be optimized by testing and varying the exact algorithms and hyperparameters used in the model blocks 211-217.
  • Corresponding additional information can provide a priori knowledge or background knowledge based on the process-driven technical construction approach, which is the basis for the plant design of the production plant.
  • This additional information includes, for example, information about the plant design of the production plant and the physicochemical processes running in the production plant.
  • the data-driven machine learning approach can be supplemented with knowledge about the process-driven technical design of the production plant. This additional knowledge enables machine learning to be designed more efficiently and precisely.
  • Process flow diagrams, piping and instrumentation diagrams, triggering and alarm plans, hazard and operability studies, etc. can provide information about the structure and functionality of the production plant, for example, as well as where which physical and chemical processes take place in what form within the plant.
  • time sequence information about a time sequence of the executed process within the production plant can be created from this. For example, processing and/or reaction speeds, heating and/or cooling speeds, as well as pipeline lengths, pipe cross-sections and/or flow or Throughput speeds, which influence the timing of processes within the production plant, are taken.
  • This information can also be used as a priori knowledge or background knowledge, for example to limit or specify data-driven machine learning.
  • the sensors used to acquire process parameter values can be assigned to specific positions and/or physical-chemical processes in the production facility. Consequently, the process parameter values detected by the corresponding sensors can also be assigned to specific physical-chemical processes or sub-processes.
  • This a priori knowledge or background knowledge of the process parameter values can be used to classify the process parameter values, which form the basis of the data-driven machine learning approach, in a procedural, constructive context.
  • This context can be used, for example, for data cleansing and/or for defining dependencies and7or for defining chronological sequences of the data or process parameter values used by the machine learning module for machine learning.
  • corresponding qualitative knowledge for example from experienced engineers or plant operators, can provide information about the structure and functioning of the production plant and about where which physical-chemical processes take place in what form within the plant.
  • additional information 251 of the knowledge domain for data cleansing is provided a priori for the data cleansing block 211 .
  • sensor and device specifications are made available. These specifications indicate, for example, the type, sensitivity and unit, etc. of the corresponding sensors or devices.
  • the data cleaning block 211 can remove outlier values that do not conform to the specifications from the input data, ie the process data values X T 200 of the training data sets ⁇ X T , Q j ⁇ 245, using the sensor and device specifications.
  • the removed outlier values are, for example, process data values which lie outside and/or within an edge area of a predefined measurement or operating area for which sensors or devices are designed.
  • non-physical values based on the plant design can be identified and removed from the process data values X T 200 .
  • the system design can specify value ranges for parameter values for which the system is designed and which can be achieved in the system. If values occur outside of these value ranges for which the system is designed, the corresponding values can be rejected as unphysical.
  • cross-sensor plausibility checks can be carried out, implausible values can be identified and removed from the process data values X T 200. For example, sensor values from neighboring sensors should not differ from one another or only to a limited extent if no process steps, ie physical and/or chemical processes, occur between or in the area of the corresponding sensors that could lead to a significant change in the corresponding sensor values.
  • a significant change in this case means a change which lies outside of a predefined range of fluctuation, as can be caused, for example, by tolerances in the design of the production plant and/or tolerances in the measuring accuracy of the sensors used for measuring. Furthermore, certain developments can be assumed for the measured sensor values. Thus, a temperature should decrease in the absence of exothermic reactions, ie in the case of no or purely endothermic reactions, for example without energy being supplied to the system due to the heat dissipation that generally occurs. If successive temperature sensors measure a temperature increase, although a temperature decrease is to be expected for these sensors, a plausibility test can result in the rejection of a sensor value which, contrary to expectations, indicates a temperature increase.
  • the a priori additional information 251 defines a set of process parameters that affect the product quality parameter values of the resulting end product. For example, process parameters are defined for one or more process steps, on which the final product quality parameter values depend. A completeness check is carried out for the process parameter set defined by the a priori additional information 251 . If one of the training data records ⁇ X T , Q j ⁇ lacks 245 process data values X T for one of the defined process parameters, process data values for this process parameter are added to the input data.
  • the supplemented process parameters are derived, for example, from existing process data values, for example by means of interpolation and/or extrapolation.
  • process data values from other training data sets ⁇ X T , Q j ⁇ 245 can also be used to derive missing process data values.
  • average values from other training data sets ⁇ X T , Q j ⁇ 245 can be used and/or extrapolations from the other training data sets ⁇ X T , Q j ⁇ 245 to the condition of the current training data set.
  • Measured values from other production plants, measured values from test plants and/or test setups, values from numerical computer simulations or values from analytical approximation formulas for describing the relevant process step can also be used as further training data sets for estimating and/or extrapolating missing process data values.
  • Suitable statistical methods can include, for example: Using a last or next valid value of the corresponding sensor, an average value over a past time window, such as the last hour and/or hours, or an interpolation and/or extrapolation from data values from neighboring sensors.
  • additional information 252 of the knowledge domain data aggregation is provided a priori for the data aggregation block 212 .
  • definitions of relevant time scales of the process are provided and used as a basis for an aggregation of the process data values.
  • the relevant time scales define time windows within which measured data are aggregated.
  • the corresponding time windows define a frequency for aggregating the data.
  • additional information 253 of the knowledge domain for feature extraction is provided a priori for the feature extraction block 213 .
  • feature values are calculated for aggregated numeric data during feature extraction.
  • aggregated categorical data is encoded during feature extraction.
  • Calculated feature values can be time-domain features, such as statistical values such as mean, median, minimum, maximum, variance, etc., or frequency-domain features, such as a dominant frequency, low or flat frequency content, spectral difference, etc.
  • Characteristic values are calculated from the aggregated values of one or more process parameters.
  • existing knowledge about the process behavior is encoded in numerical characteristics. Additional features are extracted, for example, from existing parametric models, process simulations or process-specific formulas.
  • additional information 254 of the knowledge domain for data normalization is provided a priori for the data normalization block 214 .
  • the feature values provided by the previous feature extraction are scaled to improve the training of the subsequent neural network.
  • the feature values for the neural network can be handled more efficiently.
  • an individual scaling method is selected for the feature parameters based on the sensor type, the underlying physical process and/or knowledge about the distribution of the process parameter values.
  • additional information 255 of the knowledge domain for data transformation for the purpose of dimensionality reduction is provided a priori for the data transformation block 215 .
  • the transformation in block 215 serves to reduce the dimensionality of the feature values to simplify the learning task for the neural network.
  • PCA principal component analysis
  • LDA linear discriminant analysis
  • shared weights are used to collectively train specific weights in the network based on knowledge of where a specific process step occurs. For example, characteristics of certain types of sensors are assigned the same weight in the same process unit. By training weights together, the efficiency of the training process can be increased.
  • additional information 257 of the knowledge domain for output data normalization is provided a priori for the data normalization block 217 .
  • Product quality parameters are scaled to match the scaling of the neural network output data.
  • the choice of the scaling method is based, for example, on an expected distribution of the corresponding product quality parameter values for each of the product quality parameters.
  • the classification and interpretation of a match as "sufficiently good” and a deviation as “too large” can be realized with different approaches:
  • One approach to a decision rule as to whether agreement between Q'(t) and Q(t) is sufficient or whether it is an anomaly is to use a predefined threshold.
  • Measured product quality parameters Q'(t) are classified as an anomaly event if a deviation between Q'(t) and Q(t) exceeds the predefined threshold.
  • the deviation can be quantified, for example, using the LI or L2 loss function, ie the smallest absolute deviation (Least Absolute Deviation"/LAD)
  • L 1 X[L 1
  • a root cause analysis can be performed, for example, which identifies a most likely cause of the anomaly, e.g., a unit of the production plant or a sensor.
  • Continuous learning for an already trained prediction model f M 120 can be implemented by means of retraining. Even with a prediction model f M 120, which was trained with additional a priori information as described above, the performance of the prediction model when applied to novel real process parameter values depends on the training data sets used for training and the process conditions under which these training data sets were obtained . While the prediction accuracy for operating conditions that are similar to the training conditions is usually very good, the prediction accuracy of the prediction model will decrease significantly if the operating conditions under which the novel real process parameter values were recorded differ significantly from the operating conditions, under which the process parameter values of the training data sets were recorded.
  • the measured process parameter values X(t) or the measured product quality parameter values Q'(t) differ significantly from those of existing training data X T and Q j .
  • the measure of the "difference" can be, for example, a probability value of a clustering model or an index value of a local outlier model (LOF model).
  • LEF model local outlier model
  • the clustering model Clustering or the LOF model was previously trained using the corresponding existing training data X T and Q j .
  • the existing prediction model f M 120 has low confidence for the new observation, ie low statistical certainty.
  • one way to quantify the statistical certainty of the prediction model f M 120 is to use a second neural network that has been trained to predict the accuracy of the first prediction model f M 120 .
  • the existing prediction model f M 120 has a high statistical certainty, but a prediction accuracy of the prediction model f M 120 is low for the new observation, ie there is a large deviation between measured product quality parameter values Q'(t) and from the prediction model f M 120 predicted product quality parameter values Q(t) exceeding a predefined threshold.
  • the mini-batch training method does not use each new observation directly to train the prediction model f M 120, but first collects a predefined minimum number of n new observations and only trains the existing model when this predefined minimum number, i.e the batch size, is reached.
  • a model retrained in this way can have the advantage of using the entire training data able to approximate better globally.
  • a mini-batch training technique can be used in one or more of the following cases:
  • the measured process parameter values X(t) of the production plant and the measured product quality parameter values Q′(t) are comparable with training data X T and Q y that are already available and previously used for training.
  • the existing prediction model f M 120 for the new observations has a high statistical certainty and a high prediction accuracy.
  • the result of the retraining is an updated prediction model f M 420, ie a prediction model with precise algorithms and model parameters in each of the blocks 421-426. In this way, a prediction model can continuously learn from new observations and can thus automatically adapt to future operating conditions of the production plant.
  • Figure 5 illustrates an exemplary improvement method for improving process parameter settings to achieve desired product quality values.
  • 120 creates a method for providing recommendations for adjusting process parameters to improve operation of the manufacturing facility.
  • This method provides the operator of the production plant with suggestions for improved target values for the process parameters, for example, so that target specifications such as product quality, product yield, energy efficiency, etc. can be improved, in particular maximized.
  • the improvement method includes, for example, providing a definition of which process parameter values are to be changed and improved by the operator of the production plant.
  • the entire set of available process parameters X 500 can be divided into process parameters C 502 that can be directly controlled by the operator and process parameters P that cannot be directly controlled by the operator.
  • the set of controllable process parameters C 502 can be divided into two groups: the control parameters C Q 504, which have a direct influence on the product quality, and the remaining control parameters C ⁇ C Q , which either do not affect the product quality or only via its correlation with parameters already defined in C Q.
  • a combination of knowledge about the production plant on the one hand and machine learning on the other hand can be used to determine which process parameters from X 500 belong to the subsets 502 and 504 .
  • the subset C 502 of all controllable process parameters can be un- ter using a rule-based selection algorithm 501 involving information 551 about the production plant in the form of technical documentation of the production plant, such as process flow diagrams, piping and instrumentation diagrams, tripping and alarm plans, hazard and operability studies, etc. are compiled. For example, the know-how of technicians and plant operators can also be incorporated.
  • the subset C Q 504 of all controllable process parameters relevant to the product quality prediction is identified, for example, by means of a search method using a recursive feature elimination algorithm 503 .
  • the search process uses the trained prediction model f M 120 and compares different combinations of subsets of C 502 and evaluates each of their relevance to the model accuracy, ie the accuracy of the prediction of the prediction model 120.
  • Embodiments may have the advantage that in C Q 504 only the controllable process parameters that contribute most to the model accuracy are taken into account.
  • the target specification ie the desired quality of the end product
  • a vector Q * 580 The target specification, ie the desired quality of the end product, is described by a vector Q * 580.
  • a scalar function f R 560 which represents a measure of the difference between the predicted quality and the target quality, can be specified in various ways. For example, f R can be given as the sum of the squared distance of a currently predicted product quality vector Q to the desired product quality vector Q * according to the target:
  • the effects of the individual quality parameters can be controlled using a weight vector w ge .
  • the function f R can be described as:
  • a non-linear optimization algorithm f 0 590 is used to minimize f R ,
  • C Q 504 is iteratively modified (591) to find a set of parameter values C Q such that
  • a Nelder-Mead method or downhill simplex method, a simplex method or an L-BFGS method is used as the optimization algorithm f 0 590 .
  • the parameter space for C Q 504, in which the optimization algorithm f 0 searches for an optimized solution is restricted such that the optimization algorithm can only obtain process parameter values that are physically meaningful and can be set in the production plant.
  • constraints and other hyperparameters of the optimization model are provided by definitions 593 based on information about general physical constraints, manufacturing plant constraints, and/or parameter ranges in historical data.
  • the resulting set of process parameter values C Q 592 represents a recommendation for achieving desired product quality parameter values Q * 580 .
  • a user can enter the desired product quality parameter values Q * 580 via an input function 594 of this interactive user interface 598 and, after the improvement process has been carried out, receives the calculated process parameter values C Q 592 as an output via an output function 596 of the interactive user interface 598 .
  • FIG. 6A shows an excerpt of process parameter values 600 from an exemplary training data set, which is based on historical operating data of an exemplary PET system.
  • the training data set includes, for example, 495 process parameters, of which 13 process parameters are shown in FIG. 6A for reasons of clarity.
  • Figure 6B shows product quality parameters 640 from the same example training data set.
  • the training data record includes 13 product quality parameters for which product quality parameter values are shown in FIG. 6B, which quantitatively describe the quality of the end product.
  • the training data set is cleaned using statistical metrics and process specifications.
  • the process data parameter values are shifted by a time delay of 4 to 24 hours, applying individual delays for each process unit using information about the process flow.
  • the time-shifted process data parameter values are each aggregated into groups of 2 hours. Characteristic values are extracted for each of these groups. Feature values extracted include, for example, mean, standard deviation, and in some cases group-to-group difference. All characteristic values are normalized.
  • z-normalization is used for normally distributed feature values, ie expectation value 0 and its variance/standard deviation 1, while for binary distributed features, for example, min-max normalization is used.
  • the dimensionality of the 495*3 feature parameters is reduced to about 50 dimensions by a main component analysis and neglecting insignificant component contributions.
  • the data is divided into three statistically independent samples, ie a training data set, a test data set and a validation data set.
  • the resulting training data set contains 70% of the data points, the test data set 25% and the validation data set the remaining 5% of the data points.
  • a multilayer neural perceptron-neuron network is used as an artificial neural network, for example, which consists of two hidden layers (“hidden layer”) with a maximum of 200 nodes and a rectified activation function for the input and the hidden layers delle, specifically lasso regression and ridge regression are applied.
  • the prediction model is trained iteratively using the Adam optimizer by minimizing a mean square error of the neural network output compared to the truth values of the training data set For example, iterative minimization is performed for a maximum number of 1000 epochs, however, an early stop criterion is enforced to ensure that the loss function of the validation sample evaluated at the same time is minimal and learning of statistical variations in the training sample is avoided.
  • FIG. 7 shows a comparison of predicted and retrospectively measured product quality values. The high degree of precision of the predictions achieved by the prediction model can be seen from the high degree of agreement.
  • the trained prediction model f ⁇ was evaluated on the independent test data set, where it was determined that the prediction model f ⁇ precisely describes the relationships between process parameter values and product quality parameters of the test data set.
  • Figure 7 shows the measured product quality parameter values 700 of the test data set, the product quality parameter values 730 predicted by the trained prediction model f ⁇ using the process parameter values of the test data set, and the respective confidence intervals 735 for the predictions with the trained prediction model f
  • a subset of, for example, 45 controllable process parameters C Q is determined using information about the process configuration and a feature elimination algorithm based on the prediction model f M .
  • a numerical objective function f R is defined as the squared sum of the deviations of all predicted product quality parameter values Q from the desired product quality parameter values Q * , respectively weighted by an individual factor w.
  • the objective function is minimized using the nonlinear Nelder-Mead minimization algorithm.
  • the initial parameters for the minimizations are determined from the historical data set.
  • the mean values of the process parameter values that result in the best product quality parameter values in a comparison of the desired product quality parameter values, ie come closest to the desired product quality parameter values, are selected as the recommendation. For example, the algorithm typically converges within a few thousand iterations.
  • Figure 8 illustrates an example user interface 598 for entering desired product quality values Q * 594 and providing recommendations for improved process parameter settings to achieve the desired product quality parameter values.
  • the user interface 598 allows the plant operator to interact directly with the optimization model.
  • the user interface 598 provides an input module 820, via which the operator can select a desired product quality Q * 594 by entering or selecting a product quality parameter value 821 and the tolerance range 822 for the product quality parameter value 821.
  • the method for providing improvement recommendations is carried out until an optimized set of controllable process parameters C Q is found.
  • This set of controllable process parameters C Q includes, for example, optimized settings for each of the, for example 45, process parameters displayed in segment 596 of the user interface.
  • the output of the optimized settings includes an output module 840 for each of the controllable process parameters C Q which includes a recommended process parameter value 842 .
  • the output module 840 may optionally include a graphical comparison, for example using histograms, of the recommended process parameter value 842 to the historically used process parameter values 843 for purposes of illustration.
  • FIG. 9 illustrates a schematic structure of an exemplary artificial neural network that can be used as a machine learning module 216 .
  • the artificial neural network shown is the multi-layer neural perceptron-neuron network already described in the context of FIG. 6, with an input layer X, an output layer Y, and two hidden layers (“hidden layers”) Hi and H2.
  • the training process parameter values C ⁇ c
  • the recorded process parameter values PW1 to PWn can be assigned to the product units whose production process they describe or have influenced using the sensor-specific time shifts. These time shifts can be independent of the detected process parameter values PW1 to PWn or depend on one or more of these process parameter values. If the process parameter values include, for example, a value for a flow rate of a material component for manufacturing the product 920 through a pipe, the time shift of the detection times of sensors arranged upstream compared to the completion time Tq of the product 920 can depend on the time that the material component or a part of the material component necessary for the process to flow through the pipe.
  • Figure 11 illustrates a method for training a machine learning module, e.g. an artificial neural network, a computer-implemented prediction model for predicting product quality parameter values for one or more quality parameters of a chemical product produced by a chemical production plant, as for example shown schematically in Figure 10 is illustrated.
  • the production plant comprises a plurality of sensors t, which are each configured to record process parameter values for one or more process parameters of a chemical process carried out by the production plant for producing the chemical product during operation of the production plant.
  • a priori information about the production facility and the process performed by the production facility is summarized.
  • This a priori information includes temporal ones Sequence information about a chronological sequence of the executed process within the production plant.
  • the computer system 930 can use the trained predictive model to predict product quality parameter values of product units currently being manufactured by the manufacturing facility 900 . Furthermore, the trained prediction model can be used to detect anomalies and to determine recommendations for adjusting process parameter values to achieve desired target product quality parameter values. Finally, the computer system 930 can be configured to additionally train the trained prediction model using additional training data. In particular, continuous training of the prediction model can be implemented in this way.

Landscapes

  • Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Automation & Control Theory (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Medical Informatics (AREA)
  • Health & Medical Sciences (AREA)
  • General Factory Administration (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

Die Erfindung betrifft ein Verfahren zum Trainieren eines Machine-Learning-Moduls (216) eines computerimplementierten Vorhersagemodells (210) zum Vorhersagen von Produktqualitätsparameterwerten für ein oder mehrere Qualitätsparameter eines durch eine chemische Produktionsanlage (900) hergestellten chemischen Produkts (920). Die Produktionsanlage umfasst eine Mehrzahl von Sensoren (946), welche jeweils dazu konfiguriert sind, im Betrieb der Produktionsanlage Prozessparameterwerte für ein oder mehrere Prozessparameter eines von der Produktionsanlage ausgeführten chemischen Prozesses zur Herstellung des chemischen Produkts zu erfassen. Es werden a priori Informationen über die Produktionsanlage und den von der Produktionsanlage ausgeführten Prozess genutzt, welche zeitliche Ablaufinformationen über einen zeitlichen Ablauf des ausgeführten Prozesses innerhalb der Produktionsanlage umfassen, für die Sensoren sensorspezifische zeitliche Verschiebungen zwischen einer Erfassungszeit von Trainingsprozessparameterwerte (210) und einer Herstellungszeit einer Produkteinheit, während deren Herstellung der entsprechende Trainingsprozessparameterwert erfasst wurde.

Description

Vorhersagemodell zum Vorhersagen von Produktqualitätsparameterwerten
Beschreibung
Die Erfindung betrifft ein Verfahren zum Trainieren eines Machine-Learning-Moduls eines compu terimplementierten Vorhersagemodells zum Vorhersagen von Produktqualitätsparameterwerten für ein oder mehrere Qualitätsparameter eines durch eine chemische Produktionsanlage hergestell ten chemischen Produkts. Ferner betrifft die Erfindung ein Verfahren zum Vorhersagen von entspre chenden Produktqualitätsparameterwerten unter Verwendung des computerimplementierten Vor hersagemodells mit dem trainierten Machine-Learning-Modul. Schließlich betrifft die Erfindung Computersysteme zum Ausführen des Trainings- und des Vorhersageverfahrens.
Die Qualität von Produkten, welche in chemischen Produktionsanlagen, insbesondere großtechni schen chemischen Produktionsanlagen, hergestellt werden, wird von einer Vielzahl von Prozesspa rametern in einer komplexen, nichtlinearen und mithin kaum vorhersehbaren Weise beeinflusst. Insbesondere ist es äußerst schwer, exakte quantitative Aussagen über die Qualität der resultieren den Produkte zu treffen. Die tatsächliche Qualität der Produkte lässt sich im Allgemeinen erst durch retrospektive Laboranalysen ermitteln. Unter Verwendung moderner leistungsfähiger Computersys teme ermöglichen es Verfahren zum maschinellen Lernen („Machine-Learning-Verfahren") Vorher sagemodelle für das Ergebnis komplexer, nichtlinearer Verfahrensabläufe bereitzustellen.
Im Zuge des maschinellen Lernens (siehe beispielsweise „Maschinelles Lernen" in der Wikipedia; https://de.wikipedia.org/wiki/Maschinelles_Lernen) lernt ein künstliches System aus Beispielen und kann diese nach Beendigung der Lernphase verallgemeinern. Dazu bauen Algorithmen beim maschi nellen Lernen ein statistisches Modell auf, das auf Trainingsdaten beruht. Das heißt, es werden nicht einfach die Beispiele auswendig gelernt, sondern Muster und Gesetzmäßigkeiten in den Lern daten erkannt. So kann das System auch unbekannte Daten beurteilen.
Jedoch hängt der Lernerfolg bzw. die Qualität der Vorhersagen solcher Verfahren in erheblichem Maße von der Qualität und dem Umfang der zum Trainieren verwendeten Trainingsdaten ab. Im Falle chemischer Produktionsanlagen, insbesondere komplex aufgebauter großtechnischer chemi scher Produktionsanlagen, mit möglicherweise einer Vielzahl von Teilsystemen, stehen im Allgemei nen nur in begrenztem Umfang Trainingsdaten zur Verfügung, da es aus vielfältigen Gründen nicht möglich bzw. unrealistisch ist, langwierige und umfangreiche Testläufe zum Sammeln von Daten, welche in ausreichendem Maße alle möglichen Betriebsbedingungen der Anlagen abbilden, durch zuführen. Zumal solche Testläufe bei jeder Veränderung der Anlage und selbst bei einem Austausch von Anlagenkomponenten wiederholt werden müssten. Aufgrund dieser Einschränkungen sind zur Verfügung stehende Vorhersagemodelle basierend auf Verfahren zum maschinellen Lernen entweder zu unpräzise in ihren Vorhersagen oder zu spezifisch, indem sie nur für bestimmte Betriebsbedingungen präzise Vorhersagen zu treffen vermögen.
Der Erfindung liegt die Aufgabe zugrunde, ein verbessertes Verfahren zum Trainieren von Machine- Learning-Modulen zur Vorhersage von Produktqualitätsparameterwerten für durch chemische Pro duktionsanlagen hergestellte chemische Produkte zu schaffen.
Die der Erfindung zugrundeliegende Aufgabe wird jeweils mit den Merkmalen der unabhängigen Patentansprüche gelöst. Ausführungsformen der Erfindung sind in den abhängigen Patentansprü chen angegeben.
Ausführungsformen umfassen ein Verfahren zum Trainieren eines Machine-Learning-Moduls eines computerimplementierten Vorhersagemodells zum Vorhersagen von Produktqualitätsparameter werten für ein oder mehrere Qualitätsparameter eines durch eine chemische Produktionsanlage hergestellten chemischen Produkts, wobei die Produktionsanlage eine Mehrzahl von Sensoren um fasst, welche jeweils dazu konfiguriert sind im Betrieb der Produktionsanlage Prozessparameter werte für ein oder mehrere Prozessparameter eines von der Produktionsanlage ausgeführten che mischen Prozesses zur Herstellung des chemischen Produkts zu erfassen, wobei das Verfahren um fasst:
• Bereitstellen von Trainingsdaten, wobei die Trainingsdaten für eine Mehrzahl von durch die Produktionsanlage hergestellten Produkteinheiten jeweils für ein oder mehrere Qualitätspa rameter der jeweiligen Produkteinheit bestimmte Produktqualitätsparameterwerte als Trai ningsproduktqualitätsparameterwerte umfasst, wobei den Trainingsproduktqualitätsparame terwerten jeweils eine Herstellungszeit der Produkteinheit zugeordnet ist, für welche sie be stimmt wurden, wobei die Trainingsdaten ferner von jedem der Sensoren jeweils eine Mehrzahl von Pro zessparameterwerten als Trainingsprozessparameterwerte umfassen, welche während der Herstellung der Produkteinheiten erfasst wurden, für welche die Trainingsproduktqualitäts parameterwerten bestimmt wurden, wobei den Trainingsprozessparameterwerten jeweils eine Erfassungszeit und ein Identifikator des erfassenden Sensors zugeordnet sind,
• Bereitstellen von a priori Informationen über die Produktionsanlage und den von der Produk tionsanlage ausgeführten Prozess, wobei die a priori Informationen zeitliche Ablaufinformati onen über einen zeitlichen Ablauf des ausgeführten Prozesses innerhalb der Produktionsan lage umfassen,
• für jeden der Sensoren jeweils Bestimmen einer sensorspezifischen zeitlichen Verschiebung zwischen einer Erfassungszeit eines der durch den entsprechenden Sensor erfassten Trai ningsprozessparameterwerte und einer Herstellungszeit der Produkteinheit, während deren Herstellung der entsprechende Trainingsprozessparameterwert erfasst wurde, wobei das Be stimmen jeweils unter Verwendung der zeitlichen Ablaufinformationen erfolgt, wobei die be stimmten sensorspezifischen zeitlichen Verschiebungen der Sensoren jeweils den durch den jeweiligen Sensor erfassten Trainingsprozessparameterwert zugordnet werden, • Zuordnen der Trainingsprozessparameterwerte jeweils zu den ein oder mehreren Trainings produktqualitätsparameterwerten einer der Produkteinheiten, während deren Herstellungs prozess der jeweilige Trainingsprozessparameterwert erfasst wurde, unter Verwendung der Erfassungszeit des jeweiligen Trainingsprozessparameterwerts, der sensorspezifischen zeitli chen Verschiebung des den jeweiligen Trainingsprozessparameterwert erfassenden Sensors und der Herstellungszeit der jeweiligen Produkteinheit,
• Trainieren des Machine-Learning-Moduls unter Verwendung der einander zugeordneten Trai ningsprozessparameterwerte und Trainingsproduktqualitätsparameterwerte, wobei die je weiligen Trainingsproduktqualitätsparameterwerte zum Bereitstellen von Ausgabedaten und die jeweils zugeordneten Trainingsprozessparameterwerte zum Bereitstellen von Eingabeda ten des Machine-Learning-Moduls für das Trainieren verwendet werden.
Ausführungsformen können den Vorteil haben, dass zeitliche Verschiebungen zwischen den Erfas sungszeiten zu denen die individuellen Sensoren die Trainingsprozessparameterwerte erfassen und der Herstellungszeit, etwa der Zeit zu welcher die Herstellung der Produkteinheit abgeschlossen ist, d.h. dem Ende des Herstellungsprozesses, effektiv berücksichtigt werden können. Entsprechende zeitliche Verzögerungen können auf dem zeitlichen Prozessablauf, d.h. der Reihenfolge und zeitli chen Dauer einzelner Prozessschritte, beruhen, aber auch im Aufbau der Produktionsanlage begrün det sein. Beispielsweise können entsprechende zeitliche Verzögerungen von Transportwegen und Transportkapazitäten innerhalb der Produktionsanlage abhängen. So können beispielsweise Verar- beitungs- und/oder Reaktionsgeschwindigkeiten, Erwärmungs- und/oder Abkühlgeschwindigkeiten, ebenso wie Rohrleitungslängen, Rohrquerschnitte und/oder Durchfluss- bzw. Durchsatzgeschwin digkeiten die zeitliche Verschiebung beeinflussen. Grundsätzlich kann ein Machine-Learning-Modul, wie etwa ein künstliches neuronales Netz, zwar auch den Einfluss solcher zeitlichen Verschiebungen erlernen, jedoch wären dazu solch umfangreiche Mengen an Trainingsdaten notwendig, welche rea listischer Weise nicht zur Verfügung stehen. Ausführungsformen ermöglichen daher trotz einer be schränkten Menge an Trainingsdaten, welche beispielsweise im Zuge von Testläufen der Produkti onsanlage, insbesondere einer begrenzten Anzahl an Testläufen, und anschließender Analysen der resultierenden Produkte, etwa in einem Labor, gewonnen werden, ein effektives Trainieren des Ma chine-Learning-Moduls, sodass das Vorhersagemodel zu präzisen Vorhersagen über die Produktqua lität der von der Produktionsanlage hergestellten Produkte in die Lage versetzt wird.
Ausführungsformen vermögen es somit, anders als andere Algorithmen des maschinellen Lernens, eine hohe Genauigkeit und Verallgemeinerungsfähigkeiten in realen Anwendungen zu erzielen, selbst wenn nur eine begrenzte Menge und Variabilität historischer Daten zur Verfügung steht. Das so trainierte Machine-Learning-Modul ermöglicht präzise Vorhersagen über die Qualität von Zwi schen- und Endprodukten, welche in Produktionsanlagen, wie etwa Polymerproduktionsanlagen, hergestellt werden, in Echtzeit aus gemessenen Prozessdaten der entsprechenden Produktionsanla gen zu erzielen. Vorhersagen in Echtzeit bedeuten, dass die entsprechenden Vorhersagen beispiels weise noch während des Produktionsablaufs gemacht werden, d.h. bevor die Produktion der ent sprechenden Zwischen- und Endprodukte, deren Qualität vorhergesagt wird, abgeschlossen ist. Dies ermöglicht es, falls notwendig, beispielsweise noch während der Produktion der entsprechenden Zwischen- und Endprodukte in den Produktionsablauf einzugreifen und die Qualität der Zwischen- und Endprodukte zu beeinflussen. Auch wenn entsprechende Vorhersagen beispielsweise erst mit zum Ende der Produktion vorliegen, können diese den Vorteil haben, direkt eine Aussage über die Qualität der Zwischen- und Endprodukte bereitzustellen, ohne dass erst zeitlich aufwendige zusätz liche Laboruntersuchungen notwendig sind.
Die Produktqualität eines Produkts wird definiert durch eine Gruppe von Produktqualitätsparame tern, welche mittels quantitativer Werte von Materialeigenschaften des entsprechenden Produkts, wie etwa Viskosität, Reinheit, Trübung, Farbskala, usw., beschrieben wird. Daneben können auch Parameter wie die Produktzusammensetzung, -anteile, der pH-Wert, die Phasenverteilung/-anteile, die Härte, (Korn-)Größenverteilung und/oder die Dichte eine Rolle spielen.
Prozessparameterwerte beschreiben Prozessparameter, d.h. Prozesszustandsparameter, welche den Zustand eines Prozesses beschreiben, sowie Prozesssteuerparameter, welche eine Steuerung von Einstellungen einer Produktionsanlage bzw. von Anlagenkomponenten der entsprechenden Produktionsanlage beschreiben. Prozessparameter werden von verschiedenen Sensoren in der An lage während des Betriebs zur Herstellung eines Produkts gemessen und können zum Beispiel Kon zentrationen und Durchflüsse von Rohstoffen und Additiven, Temperaturen, Drücke, Ventileinstel lungen, Drehgeschwindigkeiten, Energien, Volumen, Gewichte usw. umfassen. Daneben können auch Massenströme, Volumenströme, Füllstände, Dichte und/oder Massen wichtige Prozesspara meterwerte sein.
Bei einem Herstellungsprozess kann es sich beispielsweise um einen kontinuierlichen oder diskonti nuierlichen Prozess handeln. Bei einem diskontinuierlichen Batchprozess bezeichnet eine Produkt einheit ein Batch oder eine vordefinierte Teilmenge eines Batches. Im Falle eines kontinuierlichen Prozesses handelt es sich bei einer Produkteinheit um eine vordefinierte Teilmenge, welche bei spielsweise als Stichprobe dem kontinuierlich hergestellten Produkt bzw. Produktstrom entnom men wurde.
Das vorgeschlagene Verfahren basiert auf maschinellem Lernen, bei dem ein Vorhersagemodell mit Sätzen von Trainingsdaten trainiert wird. Die Trainingsdaten umfassen jeweils im Betrieb der Pro duktionsanlage, beispielsweise Testbetrieb und/oder Regelbetrieb, erfasste historische Daten. Diese historischen Daten beinhalten beispielsweise jeweils zum einen Prozessdaten, welche Prozesspara meter beschreiben, und zum anderen aus diesen Prozessdaten resultierende Produktqualitätsda ten, welche Produktqualitätsparameter beschreiben. Bei diesen Produktqualitätsdaten handelt es sich beispielsweise um Daten aus Offline-Labormessungen der hergestellten Produkte.
Ausführungsformen können den Vorteil haben, das grundlegende Problem eines Fehlens umfang reicher Trainingsdatensätze mit unter realen Bedingungen erfassten Prozess- und Produktqualitäts daten zu beheben. Ausführungsformen integrieren ingenieurwissenschaftliches Fachwissen über den zugrundeliegenden Prozess, beispielsweise einen physikochemischen Prozess, und das Anlagen- design gezielt als Vorwissen in Modellierungs- und Trainingsverfahren zum Bereitstellen eines trai nierten, auf künstlicher Intelligenz (Kl) beruhenden Vorhersagemodells. Nach erfolgreichem Trai ning ist das resultierende Vorhersagemodell in der Lage komplexe und dynamische Zusammen hänge zwischen Anlagenbetrieb und resultierender Produktqualität präzise abzubilden.
Das Vorhersagemodell mit dem trainierten Machine-Learning-Modul kann beispielsweise zur effek tiven und präzisen datenbasierten Online-Produktqualitätsvorhersage für industrielle chemische Produktionsanlagen genutzt werden. Hierzu wird Anlagenplanungs- und Ingenieurwissen über pro- zess- und anlagenspezifischen Zeitverzögerungen zwischen Betrieb und Produkt mit Techniken aus der Datenanalytik und dem maschinellen Lernen kombiniert. Zudem können weitere Informationen genutzt werden, wie beispielsweise über Steuerungsparameter, Reichweiten der Steuerungspara meter usw.
Industriellen Herstellungsprozesse, wie beispielsweise Polymerherstellungsprozesse, weisen eine hochkomplexe, nichtlineare Abhängigkeit zwischen den Betriebsparametern bzw. Prozesssteue rungsparametern des Prozesses und Eigenschaften des resultierenden Produkts auf. Beispielsweise wird die Qualität eines Polymer-Endprodukts durch seine Materialeigenschaften, wie etwa Viskosi tät, Farbe und/oder Reinheit bestimmt, welche wiederum den Gütegrad des Produkts bestimmen. Unterschiedliche Gütegrade desselben Produkts führen beispielsweise zu unterschiedlichen Ver wendungsmöglichkeiten und/oder Preisen. Daher ist die Überwachung, Steuerung und Optimierung der Produktqualität entscheidend für die Gesamtleistung und Rentabilität einer Produktionsanlage, wie etwa einer Polymerproduktionsanlage.
Nach Ausführungsformen kann das Verfahren beispielsweise angewendet werden, um den Füll stand auf Absorberböden einer Salpetersäureanlage zu bestimmen. Denkbar ist auch, dass die Drehzahl von Verdichterwellen einer solchen Anlage überwacht wird. Eine weitere Anwendung kann die Überwachung von Drücken in, vor und nach Kompressoeren beziehungsweise Verdichtern sein. Bei der konkreten Anwendung einer Restgasaufbereitung könnte das Verfahren beispielsweise Anwendung für die Gaszusammensetzung vor und nach einem DeNOx/DeN20-Reaktor finden. Tem peraturen in NH3-Konvertern können ebenfalls mit dem Verfahren überwacht werden.
Nach Ausführungsformen werden die sensorspezifischen zeitlichen Verschiebungen eines oder mehreren der Sensoren abhängig von Trainingsprozessparameterwerten, welche von einem oder mehreren im Prozessablauf nachgeordneten Sensoren erfasst wurden, und die entsprechenden Trainingsprozessparameterwerten jeweils zum Bestimmen der jeweiligen von diesen abhängigen sensorspezifischen zeitlichen Verschiebungen verwendet.
Ausführungsformen können den Vorteil haben, dass auch dynamische Effekte der Anlagensteue rung und Prozesseinstellung berücksichtigt werden können. Beispielsweise sind Rohrlängen und Durchmesser bekannte Fixgrößen der Produktionsanlage. Eine resultierende Transportzeit von Pro zesskomponenten kann zudem aber beispielsweise von gemessenen Prozessparameterwerten, wie etwa einer Durchflussgeschwindigkeit der durch die entsprechenden Rohre transportierten Prozess komponenten, abhängig sein.
Nach Ausführungsformen handelt es sich bei den Herstellungszeiten der Produkteinheiten jeweils um eine Abschlusszeit des von der Produktionsanlage zum Herstellen der entsprechenden Produkt einheit ausgeführten Prozesses.
Nach Ausführungsformen umfasst das Verfahren ferner ein Bereinigen der bereitgestellten Trai ningsprozessparameterwerte, wobei das Bereinigen einen oder mehrere der folgenden Datenbear beitungsschritte umfasst:
• Entfernen von Ausreißerwerten aus den Trainingsprozessparameterwerten,
• Entfernen unphysikalischer Werte aus den Trainingsprozessparameterwerten, und/ oder
• Ergänzen fehlender Trainingsprozessparameterwerte, wobei zum Identifizieren fehlender Trainingsprozessparameter die Trainingsdaten auf Vollständigkeit geprüft werden unter Ver wendung von a priori Vollständigkeitsinformationen, welche festlegen, von welchen Sensoren der Produktionsanlage und für welche Prozessparameter die Trainingsdaten Trainingspro zessparameterwerte umfassen sollen.
Ausführungsformen können den Vorteil haben, dass die Trainingsprozessparameterwerte, bei wel chen es sich um im Betrieb der Produktionsanlage erfasste Sensorwerte handelt, eine höhere Quali tät aufweisen und somit ein effektiveres Lernen des Machine-Learning-Moduls ermöglicht wird.
Unphysikalische Werte bezeichnen Trainingsprozessparameterwerte, welche den betrachteten Pro zessen zugrundeliegenden physikalischen Gesetzen widersprechen. Für Trainingsprozessparameter werte können basierend auf der Auslegung der Anlage sowie den in der Anlage ablaufenden physi kalisch und chemischen Prozessen zu physikalische Wertebereiche definiert werden, d.h. Wertebe reiche, welche in Einklang mit den zugrundeliegenden physikalischen Gesetzen stehen. Trainings prozessparameterwerte, welche außerhalb dieser zu erwartenden Wertebereiche liegen, werden beispielsweise als unphysikalisch betrachtet. Bei solchen unphysikalischen Werten ist anzunehmen, dass diese beispielsweise auf Fehlern in der Erfassung der Trainingsprozessparameterwerte beru hen. Die Anlagenauslegung kann beispielsweise Wertebereiche für Parameterwerte bzw. Trainings prozessparameterwerte festlegen, für welche die Anlage ausgelegt ist und welche in der Anlage er reicht werden können. Liegen Trainingsprozessparameterwerte außerhalb dieser zu erwartenden Wertebereiche, für die die Anlage ausgelegt ist, können die entsprechenden Trainingsprozesspara meterwerte als unphysikalisch zurückgewiesen werden.
Beispielsweise erfolgt eine Beurteilung, ob ein Trainingsprozessparameterwert unphysikalisch ist, lokal, d.h. unter Berücksichtigung der lokalen Auslegung der Anlage sowie den in der Anlage lokal ablaufenden physikalisch und chemischen Prozessen. Beispielsweise erfolgt eine Beurteilung, ob ein von einem Sensor erfasster Trainingsprozessparameterwert unphysikalisch ist, unter Berücksichti gung von Trainingsprozessparameterwert, welche benachbarte Sensoren erfassen. So können bei spielsweise sensorübergreifende Plausibilitätsprüfungen ausgeführt werden, unplausible Werte als unphysikalisch identifiziert und entfernt werden. Beispielsweise sollten sich von benachbarten Sen soren erfasste Trainingsprozessparameterwerte nicht oder nur in begrenztem Umfang voneinander unterscheiden, wenn zwischen bzw. im Bereich der entsprechenden Sensoren keine Prozessschritte, d.h. physikalischen und/oder chemischen Prozesse, auftreten, die zu einer signifikanten Änderung der entsprechenden Trainingsprozessparameterwerte führen können. Eine signifikante Änderung bedeutet in diesem Fall beispielsweise eine Änderung, welche außerhalb eines vordefinierten Schwankungsbereichs liegt, wie er beispielsweise durch Toleranzen in der Auslegung der Produkti onsanlage und/oder Toleranzen in der Messgenauigkeit, der zum Messen verwendeten Sensoren, verursacht werden kann. Ferner können für die Trainingsprozessparameterwerte bestimmte Ent wicklungen angenommen werden. So sollte beispielsweise eine Temperatur in Abwesenheit exothermer Reaktionen, d.h. im Falle keiner oder rein endothermer Reaktionen, ohne Energiezufüh rung zu dem System aufgrund der allgemein auftretenden Wärmedissipation abnehmen. Liefern aufeinanderfolgende Temperatursensoren ansteigende Trainingsprozessparameterwerte für die Temperatur, obwohl für diese Sensoren eine Temperaturabnahme zu erwarten ist, kann ein Plausi bilitätstest zu einem Zurückweisen der ansteigenden Trainingsprozessparameterwerte als unphysi kalische Werte führen.
Nach Ausführungsformen umfasst das Verfahren ferner für ein oder mehrere Sensoren jeweils ein Aggregieren der von dem jeweiligen Sensor erfassten Trainingsprozessparameterwerte, wobei die entsprechenden Trainingsprozessparameterwerte unter Verwendung der jeweils zugeordneten Er fassungszeiten einem Aggregationszeitfenster zugeordnet werden, wobei einem gemeinsamen Ag gregationszeitfenster zugeordnete Prozessparameterwerte jeweils aggregiert werden.
Ausführungsformen können den Vorteil haben, dass die Trainingsdaten in aggregierter Form besser zu handhaben und auszuwerten sind.
Nach Ausführungsformen werden die sensorspezifischen zeitlichen Verschiebungen der Sensoren, deren Trainingsprozessparameterwerte aggregiert werden, jeweils für die Aggregationsfenster be stimmt und den aggregierten Trainingsprozessparameterwerten des jeweiligen Aggregationsfens ters zugeordnet. Ausführungsformen können den Vorteil haben, dass Abstände zwischen den Da tenerfassungen der Sensoren beispielsweise so eingestellt sind, dass während der Fierstellung der selben Produkteinheit eine Mehrzahl von Trainingsprozessparameterwerten durch denselben Sen sor erfasst und so effektiv verarbeitet werden.
Nach Ausführungsformen umfasst das Bereitstellen von Eingabedaten ferner ein Extrahieren von statistischen Merkmalswerten und/oder Frequenzmerkmalswerten aus den Trainingsprozesspara meterwerten zum Trainieren des Machine-Learning-Moduls. Ausführungsformen können den Vor teil haben, dass durch eine Verwendung von statistischen Merkmalswerten wie etwa Mittelwert, Median, Minimum, Maximum, Varianz, usw. und/oder Frequenzmerkmalswerten wie etwa eine do minante Frequenz, Nieder- oder Flochfrequenzgehalt, eine spektrale Differenz, usw. die durch das Machine-Learning-Modul zu bearbeitende Datenmenge verringert und das Lernen mithin effizienter und weniger Fehleranfällig ausgeführt werden kann. Nach Ausführungsformen umfasst das Bereitstellen von Eingabedaten ferner ein Skalieren der extrahierten Merkmalswerte zum Trainieren des Machine-Learning-Moduls. Ausführungsformen können den Vorteil haben, dass geeignete skalierte, etwa normierte, Daten von dem Machine-Lear- ning-Modul effizienter verarbeitet werden können. Nach Ausführungsformen umfasst das Bereit stellen von Ausgabedaten ein Skalieren der Trainingsproduktqualitätsparameterwerte.
Nach Ausführungsformen umfasst das Bereitstellen von Eingabedaten ferner ein Reduzieren der Di- mensionalität extrahierter Merkmalswerte unter Verwendung einer Transformation der extrahier ten Merkmalswerte. Als Transformationstechnik kann beispielsweise eine Hauptkomponentenana lyse zur Anwendung kommen. Ausführungsformen können den Vorteil haben, dass die durch das Machine-Learning-Modul zu bearbeitende Datenmenge verringert und das Lernen mithin effizienter ausgeführt werden kann.
Nach Ausführungsformen umfasst das Verfahren ferner ein Zuordnen von Gewichtungsfaktoren des Machine-Learning-Moduls, welche für ein Gewichten von extrahierten Merkmalen verwendet wer den, welche auf Trainingsprozessparameter beruhen, die für identische Prozessparameter von Sen soren erfasst wurden, welche innerhalb desselben Teilsystems der Produktionsanlage angeordnet sind, zu einer gemeinsamen Gewichtungsgruppe, wobei Gewichtungsfaktoren derselben Gewich tungsgruppe gleichgesetzt und gemeinsam trainiert werden. Ausführungsformen können den Vor teil haben, dass so weniger Gewichtungsfaktoren individuell gelernt werden müssen und das Trai nieren somit effektiver ausgestaltet werden kann.
Nach Ausführungsformen werden ein oder mehrere anwendungsindividuellen Verlustfunktion zur Verwendung durch das Machine-Learning-Modul bereitgestellt, um selektiv spezifische Vorhersage fehler im Zuge des Trainings stärker zu gewichten als andere Vorhersagefehler. Ausführungsformen können den Vorteil haben, dass Vorhersagefehler individuell gewichtet werden können. Sollen die Vorhersagen des Vorhersagemodells zur Qualitätskontrolle der hergestellten Produkte verwendet werden, kann es wichtig sein, dass die vorhergesagte Güte für ausgewählte oder alle Produktquali tätsparameter nicht zu positiv bewertet wird. So kann sichergestellt werden, dass unter Verwen dung der entsprechenden Vorhersagen Produkteinheiten mit ungenügender Qualität mit hoher Zu verlässigkeit aussortiert werden können und die Gefahr minimiert werden kann, dass ungenügende Produkteinheiten aufgrund von Toleranzen der Vorhersagen versehentlich durchgelassen werden. Beispielsweise wird ein Vorhersagefehler, welcher eine Produktreinheit zu hoch vorhersagt negati ver bewertet, als ein Vorhersagefehler, welcher eine Produktreinheit zu niedrig vorhersagt.
Nach Ausführungsformen werden neben den Trainingsdaten Testdaten als zweite statistisch unab hängige Stichprobe bereitgestellt, welche Testprozessparameterwerte und Testproduktqualitätspa rameterwerte umfassen, wobei die Testdaten zum Testen der Vorhersagepräzision des Vorhersage modells mit dem mit den Trainingsdaten trainierten Machine-Learning-Modul verwendet werden, wobei das Testen ein Vorhersagen von Produktqualitätsparameterwerten unter Verwendung der Testprozessparameterwerte und ein Vergleichen der resultierenden vorhergesagten Produktquali tätsparameterwerte mit den erwarteten Testproduktqualitätsparameterwerten umfasst, wobei im Falle von stark variierenden Betriebsbedingungen der Produktionsanlage unter denen die Trainingsdaten und Testdaten erstellten werden, die Trainingsdaten und Testdaten so zu sammengestellt werden, dass die verschiedenen Betriebsbedingungen in den Trainingsdaten und Testdaten jeweils proportional gleich vertreten sind.
Ausführungsformen können den Vorteil haben, dass ein effektives und zuverlässiges Testen der Vor hersagepräzision des Vorhersagemodells ermöglicht wird.
Nach Ausführungsformen umfasst das Machine-Learning-Modul ein künstliches neuronales Netz, beispielsweise ein mehrlagiges Perzeptron (engl.: ,,Multilayer-Perzeptron"/IVILP), ein Convolutional Neural Network (CNN), ein Rekurrentes neuronales Netz (RNN) oder ein Long Short-Term Memory Network (LSTM-Netz). Ausführungsformen können den Vorteil haben, dass ein effektives Vorhersa gen von Produktqualitätsparameterwerten ermöglicht wird.
Beispielsweise handelt es sich bei der chemischen Produktionsanlage um eine großtechnische che mische Produktionsanlage. Bei einer großtechnischen chemischen Produktionsanlage kann es sich um eine Produktionsanlage handeln, welche dafür ausgelegt ist einem großtechnischen, insbeson dere industriellen, Maßstab chemische Produkte zu produzieren. Eine solche Anlage, d.h. eine che mische Produktionsanlage und/oder großtechnische chemische Produktionsanlage, kann aus einer Vielzahl von Teilsystemen (z.B. 5 - 10 oder mehr) aufgebaut sein. Ein Teilsystem zeichnet sich insbe sondere dadurch aus, dass es sich um eine eigenständig funktionsfähige Baugruppe handeln kann, deren Funktion vorzugsweise direkten Einfluss auf die Produktion oder den Produktionsfluss hat.
Nach Ausführungsformen handelt es sich bei der Produktionsanlage um eine physikochemische Pro duktionsanlage, beispielsweise eine Polymerproduktionsanlage zur Herstellung eines Polymerpro dukts. Bei dem Polymer kann es sich beispielsweise um Polyethylenterephthalat (PET), Polyamide (PA), Polylactide (PLA), Polyethylen (PE), Polypropylen (PP), Polyvinylchlorid (PVC), Weich-Polyethy- len (LDPE) oder Ethylen-Vinylacetat-Copolymere (EVA) handeln.
Nach Ausführungsformen handelt es sich bei der chemischen Produktanlage um eine großtechni sche chemische Produktionsanlage. Nach Ausführungsformen umfasst die Produktionsanlage eine Mehrzahl von Teilsystemen, beispielsweise 2, 3, 4, 5, 6, 7, 8, 9, 10 oder mehr. Nach Ausführungsfor men umfasst ein Teilsystem eine eigenständig funktionsfähige Baugruppe, deren Funktion vorzugs weise direkten Einfluss auf die Produktion oder den Produktionsfluss der Produktionsanlage besitzt.
Beispielsweise kann es sich bei der chemischen Produktionsanlage um eine Polymerproduktionsan lage zur Herstellung eines Polymers, eine Zementproduktionsanlage zur Herstellung von Zement, oder eine Aromatenextraktionsanlage zum Herstellen bzw. Bereitstellen von Aromaten unter Ver wendung eines Extraktionsverfahrens, handeln. Nach Ausführungsformen handelt es sich bei den Produktqualitätsparameterwerten der Produkt einheiten um Produktqualitätsparameterwerten, welche unter Verwendung von Stichproben aus den entsprechenden Produkteinheiten, beispielsweise unter Verwendung eines in einem Labor aus geführten Produktqualitätsanalyseverfahren, bestimmt werden.
Ausführungsformen umfassen ferner ein Verfahren zum Vorhersagen von Produktqualitätsparame terwerten für ein oder mehrere Qualitätsparameter eines durch eine chemische Produktionsanlage hergestellten chemischen Produkts unter Verwendung eines computerimplementierten Vorher sagemodells mit einem nach einer der voranstehenden Ausführungsformen trainierten Machine- Learning-Modul, wobei die Produktionsanlage eine Mehrzahl von Sensoren umfasst, welche jeweils dazu konfiguriert sind im Betrieb der Produktionsanlage Prozessparameterwerte für ein oder meh rere Prozessparameter eines von der Produktionsanlage ausgeführten chemischen Prozesses zur Herstellung des chemischen Produkts zu erfassen, wobei das Verfahren umfasst:
• Bereitstellen einer Mehrzahl von den Sensoren im Betrieb der Produktionsanlage erfassten Prozessparameterwerten, wobei den Prozessparameterwerten jeweils eine Erfassungszeit und ein Identifikator des erfassenden Sensors zugeordnet sind,
• Bereitstellen von a priori Informationen über die Produktionsanlage und den von der Produk tionsanlage ausgeführten Prozess, wobei die a priori Informationen zeitliche Ablaufinformati onen über einen zeitlichen Ablauf des ausgeführten Prozesses innerhalb der Produktionsan lage umfassen,
• für jeden der Sensoren jeweils Bestimmen einer sensorspezifischen zeitlichen Verschiebung zwischen den Erfassungszeiten der durch den entsprechenden Sensor erfassten Prozesspara meterwerte und einer Herstellungszeit einer Produkteinheit, für welche Produktqualitätspa rameterwerte vorhergesagt werden sollen und während deren Herstellung die jeweiligen Prozessparameterwerte erfasst wurden, wobei das Bestimmen jeweils unter Verwendung der zeitliche Ablaufinformationen erfolgt, wobei die bestimmten sensorspezifischen zeitlichen Verschiebungen der Sensoren jeweils den durch den jeweiligen Sensor erfassten Prozesspara meterwert zugordnet werden,
• zueinander Zuordnen jeweils derjenigen Prozessparameterwerte, welche während der Her stellung derselben Produkteinheit erfasst wurden, wobei die zu aggregierenden Prozesspara meterwerte unter Verwendung der sensorspezifischen zeitlichen Verschiebung bestimmt werden,
• Verwenden jeweils der einander zugeordneten Prozessparameterwerte zum Bereitstellen von Eingabedaten des trainierten Machine-Learning-Moduls für ein Vorhersagen von ein oder mehreren Produktqualitätsparameterwerten,
• Empfangen von ein oder mehreren unter Verwendung des trainierten Machine-Learning-Mo- duls für die Produkteinheit, während deren Herstellung die zum Bereitstellen der Eingabeda ten verwendeten Produktqualitätsparameterwerte erfasst wurden, vorhergesagten Produkt qualitätsparameterwerten als Ausgabe des Vorhersagemodells.
Ausführungsformen können den Vorteil haben, dass ein Verfahren zur datenbasierten Online-Pro- duktqualitätsvorhersage für industrielle chemische Produktionsanlagen bereitgestellt wird. Somit muss nicht erst auf eine Analyse, etwa eine Laboranalyse, der Produktqualität gewartet werden. Vielmehr kann bereits direkt bei Fertigstellung des entsprechenden hergestellten Produkts eine prä zise Angabe zu dessen Qualität gemacht werden. Dies ermöglicht eine effektive Qualitätsüberwa chung, in Zuge derer beispielsweise Produkteinheiten mit ungenügender Qualität aussortiert wer den können. Eine ungenügende Qualität liegt beispielsweise vor, wenn ein oder mehrere der vor hergesagten Produktqualitätsparameter außerhalb eines vordefinierten zulässigen Toleranzbereichs liegen. Insbesondere ermöglicht eine vorhersagebasierte Qualitätsüberwachung eine Qualitätsüber wachung, bei welcher die Qualität jeder einzelnen Produkteinheit berücksichtigt wird und nicht nur einzelner im Labor analysierter statistische Stichproben.
Ausführungsformen nutzen zur Vorhersage der Produktqualität leicht zu erfassende Prozessdaten. Ausführungsformen können dabei den Vorteil haben, ein Datenanalysetool bereitzustellen, welches eine detaillierte Analyse historischer Daten ermöglicht und entsprechend große Datenmengen effi zient zu analysieren vermag, um relevante Erkenntnisse zu gewinnen. Trotz der nichtlinearen Kom plexität und der multivariaten Natur entsprechender Produktionsprozesse vermögen es Ausfüh rungsformen im Gegensatz zu konventionellen Simulationsmodellen die Produktqualität präzise vorherzusagen.
Ausführungsformen können den Vorteil haben, dass keine oder allenfalls noch sporadische Offline- Labormessungen zur Ermittlung von Qualitätseigenschaften der von der Anlage hergestellten Pro dukten, wie beispielsweise Polymerprodukten, benötigt werden. Solche Labormessungen sind zu meist arbeits- und kostenintensiv. Ergebnisse liegen dabei im Allgemeinen erst mit einer erhebli chen Zeitverzögerung von beispielsweise mehreren Stunden oder bis zu einem Tag vor.
Ausführungsformen können den Vorteil haben, dass Eigenschaften des Endprodukts während des Betriebs der Produktionsanlage, d.h. während des Herstellungsprozesses, vollständig unter Verwen dung von Prozessparametern bestimmt werden können.
Nach Ausführungsformen sammelt die Produktionsanlagen bei jedem Herstellungsschritt im Pro duktionsbetrieb, d.h. Regelbetrieb, Prozessdaten, d.h. Prozessparameterwerte, für eine Mehrzahl von Prozessparametern.
Ausführungsformen können den Vorteil haben, dass das sie im Gegensatz zu bekannten Simulati- ons- und Modellierungsmethoden trotz einer nichtlinearen Komplexität und Multivarianz, wie sie beispielsweise bei Polymerherstellungsprozessen auftreten, in der Lage sind Produktqualitätseigen schaften aus Echtzeit-Prozessdaten präzise abzuleiten. Insbesondere können Ausführungsformen den Vorteil haben im Gegensatz zu bekannten Modellen zur Qualitätsvorhersage dynamische Schwankungen und externe Einflüsse, wie sie in realen industriellen Prozessen stets auftreten, voll ständig berücksichtigen zu können. Ausführungsformen können im Zuge des Bereitstellens der Eingabedaten auf die erfassten Pro zessparameterwerte alle zuvor für das Trainieren beschriebenen Datenverarbeitungsverfahren der Trainingsprozessparameterwerte anwenden.
Nach Ausführungsformen umfasst das Verfahren ein zusätzliches Trainieren des trainierten Ma- chine-Learning-Moduls, wobei das zusätzliche Trainieren umfasst:
• Bereitstellen von Produktqualitätsparameterwerten als zusätzliche Trainingsproduktqualitäts parameterwerte, welche unter Verwendung von ein oder mehreren der von Produktionsan lage hergestellten Produkteinheiten bestimmt wurden, für welche Produktqualitätsparame terwerte vorhergesagt wurden,
• Zuordnen der bereitgestellten Prozessparameterwerte, welche während der Herstellung der jeweiligen Produkteinheiten erfasst wurden, für welche die zusätzlichen Trainingsprodukt qualitätsparameterwerte bereitgestellt werden, als zusätzliche Trainingsprozessparameter werte zu den zusätzlichen Trainingsproduktqualitätsparameterwerten, wobei die Prozesspa rameterwerte, welche während der Herstellung der jeweiligen Produkteinheiten erfasst wur den, unter Verwendung der Erfassungszeit der jeweiligen Prozessparameterwerte, der sen sorspezifischen zeitlichen Verschiebungen der die jeweiligen Prozessparameterwerte erfas senden Sensoren und der Herstellungszeiten der jeweiligen hergestellten Produkteinheiten bestimmt werden,
• zusätzliches Trainieren des Machine-Learning-Moduls unter Verwendung der zusätzlichen Trainingsproduktqualitätsparameterwerte und der zugeordneten zusätzlichen Trainingspro zessparameterwerte, wobei die jeweiligen zusätzlichen Trainingsproduktqualitätsparameter werte zum Bereitstellen von zusätzlichen Ausgabedaten und die jeweils zugeordneten zusätz lichen Trainingsprozessparameterwerte zum Bereitstellen von zusätzlichen Eingabedaten des Machine-Learning-Moduls für das zusätzliche Trainieren verwendet werden.
Ausführungsformen können den Vorteil haben, dass durch ein wiederholtes Trainieren des Ma chine-Learning-Moduls die Vorhersagegenauigkeit und die Vorhersagebreite des Vorhersagemo dells sukzessive verbessert werden kann.
Nach Ausführungsformen ist das Vorhersagemodell dazu konfiguriert, sich verändernde Betriebsbe dingungen zu berücksichtigt. Das Vorhersagemodell erfasst Prozessdaten für ein kontinuierliches Lernen und ist so in der Lage, sich automatisch an veränderte Bedingungen anzupassen. Umfassen die erfassten Prozessdaten bisher ungesehene, veränderte Prozessdaten, welche aus den veränder ten Betriebsbedingungen resultieren, werden diese im Zuge eines fortgesetzten, kontinuierlichen Trainierens des Vorhersagemodells herangezogen und als Trainingsdaten genutzt. Somit ist bei spielsweise auch ein zusätzliches Trainieren, d.h. ein Retrainieren bzw. Umtrainieren, des Vorher sagemodells möglich. Die Berücksichtigung aktueller und gegebenenfalls bisher ungesehener, ver änderter Prozess- und/oder Produktqualitätsdaten ermöglicht es den Verallgemeinerungsgrad der Vorhersagefähigkeit des Vorhersagemodells zu erweitern, womit dieses in die Lage versetzt wird, sich an vielfältige zukünftige Veränderungen der Produktionsbedingungen dynamisch anzupassen. Nach Ausführungsformen umfasst das Verfahren ferner ein Erfassen von Anomalien der vorherge sagten Produktqualitätsparameterwerte, wobei das Erfassen der Anomalien umfasst:
• Vergleichen der unter Verwendung der von der Produktionsanlage hergestellten Produktein heiten bestimmten Produktqualitätsparameterwerten mit den für die jeweilige Produktein heit vorhergesagten Produktqualitätsparameterwerten,
• falls eine Abweichung zwischen den für dieselbe Produkteinheit bestimmten und vorherge sagten Produktqualitätsparameterwerten ein vordefiniertes Kriterium erfüllt, Identifizieren der vorhergesagten Produktqualitätsparameterwerte als Anomalien,
• falls eine oder mehrere der vorhergesagten Produktqualitätsparameterwerte als Anomalie identifiziert werden, Ausgaben eines Anomaliehinweises.
Ausführungsformen können den Vorteil haben, dass Anomalien effektiv erfasst werden können. Entsprechende Anomalien können durch die Produktionsanlage oder durch das Vorhersagemodell verursacht werden. Ausführungsformen können den Vorteil haben, dass sie dazu in der Lage sind, anomale und fehlerhafte Anlagenbetriebsabläufen, wie zum Beispiel Reaktorverschmutzungen, Zer setzungsprozesse, Ausfälle bestimmter Komponenten usw., zu erkennen und wahrscheinliche Grundursachen für die erkannten Anomalien zu identifizieren. Hierzu werden beispielsweise Abwei chungen zwischen Modellvorhersagen und retrospektiv gemessenen Produktqualitätsdaten ausge wertet. Überschreiten die Abweichungen, beispielsweise einzeln oder in Kombination, einen vorde finierten Schwellenwert, so weist dies auf ein Vorliegen einer Anomalie oder Fehlers im Anlagenbe trieb hin. Ebenso können so beispielsweise Unzulänglichkeiten des Vorhersagemodells identifiziert werden.
Nach Ausführungsformen umfasst das vordefinierte Kriterium ein Überschreiten eines vordefinier ten ersten Schwellenwerts. Nach Ausführungsformen umfasst ein Erfüllen des vordefinierten Krite riums, dass ein Vertrauensniveau der Abweichung einen vordefinierten zweiten Schwellenwert un terschreitet.
Nach Ausführungsformen umfasst eine Voraussetzung für ein Initiieren eines zusätzlichen Trainie- rens des trainierten Machine-Learning-Moduls ein Identifizieren von ein oder mehreren der vorher gesagten Produktqualitätsparameterwerte als Anomalie. Ausführungsformen können den Vorteil haben, dass das Machine-Learning-Modul verbessert werden kann, falls die Anomalie durch Unzu länglichkeiten des bisherigen Trainings des Machine-Learning-Moduls verursacht wird.
Nach Ausführungsformen umfasst eine Voraussetzung für ein Initiieren eines zusätzlichen Trainie- rens des trainierten Machine-Learning-Moduls ein Ansammeln von zusätzliche Trainingsprodukt qualitätsparameterwerten und zusätzliche Trainingsprozessparameterwerten für eine vordefinierte Anzahl an hergestellten Produkteinheiten. Ausführungsformen können den Vorteil haben, dass das Machine-Learning-Modul fortwährend verbessert werden kann.
Nach Ausführungsformen umfasst das Verfahren ferner: • Auswählen, aus den Prozessparameter für welche die Sensoren der Produktionsanlage Pro zessparameterwerte erfassen, eine Gruppe von steuerbaren Prozessparametern, welche durch ein zentrales Steuersystem der Produktionsanlage steuerbar sind,
• Identifizieren einer Untergruppe der steuerbaren Prozessparametern deren Variation die un ter Verwendung des trainierten Machine-Learning-Moduls vorhergesagten Produktqualitäts parameterwerten am stärksten beeinflusst, wobei das Identifizieren ein Variieren unter schiedlicher Untergruppen der steuerbaren Prozessparameter und ein Vergleichen der resul tierenden vorhergesagten Produktqualitätsparameterwerte umfasst.
Ausführungsformen können den Vorteil haben, dass aus einer Vielzahl von Prozessparametern die jenigen Prozessparameter identifiziert werden können, welche für die Produktqualität maßgeblich sind.
Nach Ausführungsformen umfasst das Verfahren ferner:
• Empfangen eines Satzes von Zielproduktqualitätsparameterwerten für ein oder mehrere Produktqualitätsparameter des von der Produktionsanlage herzustellenden Produkts,
• Bestimmen von Prozessparameterwerten für die steuerbaren Prozessparameter der Unter gruppe, für welche eine Gesamtabweichung zwischen den unter Verwendung des trainier ten Machine-Learning-Moduls vorhergesagten Produktqualitätsparameterwerten und den empfangenen Zielproduktqualitätsparametern einen vordefinierten dritten Schwellenwert unterschreitet, wobei das Bestimmen ein Variieren der steuerbaren Prozessparameter der Untergruppe unter Verwendung eines nichtlinearen Minimierungsverfahrensverfahrens umfasst,
• Ausgabe der bestimmten Prozessparameterwerte als Empfehlung für ein Einstellen der steuerbaren Prozessparameter unter Verwendung des Steuersystems zum Herstellen von Produkteinheiten des herzustellenden Produkts, welche die Zielproduktqualitätsparameter werte aufweisen.
Ausführungsformen können den Vorteil haben, dass Empfehlungen zur verbesserten bzw. optimier ten Steuerung der Produktionsanlage bereitgestellt werden können. Mit anderen Worten kann ein Verfahren zur interaktiven Prozessoptimierung in Produktionsanlagen, wie etwa industriellen bzw. großtechnischen chemischen Produktionsanlagen, bereitgestellt werden.
Ausführungsformen können ferner den Vorteil haben, dass sie anspruchsvolle datengetriebene Empfehlungen für Einstellungen von Prozessparametern zur Verbesserung, insbesondere Optimie rung, des Anlagenbetriebs bereitzustellen vermögen. Eine Verbesserung, insbesondere Optimie rung, des Anlagenbetriebs bedeutet beispielsweise eine Verbesserung, insbesondere Optimierung, der resultierenden Produktqualität. Eine Verbesserung, insbesondere Optimierung, kann sich bei spielsweise auch auf andere Parameter, etwa Prozessparameter, auswirken, wie zum Beispiel in Form einer Erhöhung, insbesondere Maximierung, eines Durchsatzes, einer Erhöhung, insbesondere Maximierung, einer Gesamtwirtschaftlichkeit der Anlage und/oder einer Verringerung, insbeson dere Minimierung, des Energieverbrauchs der gesamten Anlage oder einzelner Anlagenbereiche. Nach Ausführungsformen wird dem Nutzer eine interaktive Nutzeroberfläche auf einem Display ei ner Nutzerschnittstelle bereitgestellt. Die interaktive Nutzeroberfläche stellt dem Nutzer eine Ein gabe- und/oder Auswahlmöglichkeit zur Eingabe und/oder Auswahl gewünschter Zielwerte, bei spielsweise gewünschte Produktqualitätswerte, bereit. Unter Verwendung der entsprechenden Ein gabe- und/oder Auswahlwerte gibt die interaktive Nutzeroberfläche für den Nutzer Empfehlungen zur Einstellung von Prozessparametern aus, mit deren Verwendung die gewünschten Produktquali tätswerte zu erreichen sind.
Ausführungsformen können den Vorteil haben, dass suboptimale Betriebsbedingungen der Produk tionsanlage, wie sie etwa bei Polymeranlagen bisher häufig auftreten, vermieden werden können. So ist es für Ausführungsformen beispielsweise möglich selbst angesichts einer Mehrzahl von ein stellbaren Prozesssteuerungsparametern, welche jeweils eine starke Wechselwirkung untereinan der sowie einen starken Einfluss auf die Produktqualitätseigenschaften aufweisen, die Einstellungen für Prozesssteuerungsparameter zu bestimmen, welche eine stabile und optimale Qualität eines be stimmten Produkts sicherstellen.
Ein Bestimmen der besten Einstellungen für Prozesssteuerungsparameter stellt selbst für erfahrene Anlagenbediener bei einer Mehrzahl von einstellbaren Prozesssteuerungsparametern mit starken Wechselwirkungen eine große Herausforderung dar, welche es schwierig macht, die besten Einstel lungen für die Prozesssteuerungsparameter zu bestimmen. Bisher finden beispielsweise sogenannte Rezepte Verwendung, welche für eine Auswahl der wichtigsten Prozesssteuerungsparameter emp fohlene Werte angeben, um eine bestimmte Qualität und/oder Gütegrad für bestimmte Produkte zu erreichen. Diese Angaben beruhen jedoch meist nur auf sehr allgemeinen und vagen Schätzun gen von Werten der Prozesssteuerungsparameter, um vorgegebene Grenzwerte für Qualität und/o der Gütegrad der Produkte zu erfüllen. Ferner lassen sich entsprechende Rezepte nur eingeschränkt von einer Anlage auf eine andere übertragen.
Ferner treten tatsächliche Auswirkungen von Änderungen der Prozesssteuerungsparameter typi scherweise erst mit einer prozessspezifischen, individuellen Zeitverzögerung auf. Diese Zeitverzöge rung kann je nach Prozess und je nach geändertem Prozesssteuerungsparameter mehreren Stunden bis zu einem Tag und länger dauern. Eine Optimierung der Prozess-, Leistungs- und Qualitätspara meter kann durch diese Zeitverzögerung erheblich erschwert werden.
Ausführungsformen können somit neben einer Online-Überwachung verschiedener Produkteigen schaften ein Verfahren zur Kontrolle und Optimierung der Produktqualität bereitstellen.
Ausführungsformen umfassen ferner ein Computersystem zum Trainieren eines Machine-Learning- Moduls eines computerimplementierten Vorhersagemodells zum Vorhersagen von Produktquali tätsparameterwerten für ein oder mehrere Qualitätsparameter eines durch eine chemische Produk tionsanlage hergestellten chemischen Produkts, wobei die Produktionsanlage eine Mehrzahl von Sensoren umfasst, welche jeweils dazu konfiguriert sind, im Betrieb der Produktionsanlage Pro zessparameterwerte für ein oder mehrere Prozessparameter eines von der Produktionsanlage aus geführten chemischen Prozesses zur Herstellung des chemischen Produkts zu erfassen, wobei das Computersystem einen Prozessor und einen Speicher umfasst, wobei in dem Speicher das Vorhersagemodell mit dem Machine-Learning-Modul gespeichert ist, wobei in dem Speicher ferner Programminstruktionen gespeichert sind, wobei ein Ausführen der Programminstruktionen durch den Prozessor den Prozessor dazu veranlasst, ein Verfahren auszuführen, welches umfasst:
• Bereitstellen von Trainingsdaten, wobei die Trainingsdaten für eine Mehrzahl von durch die Produktionsanlage hergestellten Produkteinheiten jeweils für ein oder mehrere Qualitätspa rameter der jeweiligen Produkteinheit bestimmte Produktqualitätsparameterwerte als Trai ningsproduktqualitätsparameterwerte umfasst, wobei den Trainingsproduktqualitätsparame terwerten jeweils eine Herstellungszeit der Produkteinheit zugeordnet ist, für welche sie be stimmt wurden, wobei die Trainingsdaten ferner von jedem der Sensoren jeweils eine Mehrzahl von Pro zessparameterwerten als Trainingsprozessparameterwerte umfassen, welche während der Herstellung der Produkteinheiten erfasst wurden, für welche die Trainingsproduktqualitäts parameterwerten bestimmt wurden, wobei den Trainingsprozessparameterwerten jeweils eine Erfassungszeit und ein Identifikator des erfassenden Sensors zugeordnet sind,
• Bereitstellen von a priori Informationen über die Produktionsanlage und den von der Produk tionsanlage ausgeführten Prozess, wobei die a priori Informationen zeitliche Ablaufinformati onen über einen zeitlichen Ablauf des ausgeführten Prozesses innerhalb der Produktionsan lage umfassen,
• für jeden der Sensoren jeweils Bestimmen einer sensorspezifischen zeitlichen Verschiebung zwischen einer Erfassungszeit eines der durch den entsprechenden Sensor erfassten Trai ningsprozessparameterwerte und einer Herstellungszeit der Produkteinheit, während deren Herstellung der entsprechende Trainingsprozessparameterwert erfasst wurde, wobei das Be stimmen jeweils unter Verwendung der zeitliche Ablaufinformationen erfolgt, wobei die be stimmten sensorspezifischen zeitlichen Verschiebungen der Sensoren jeweils den durch den jeweiligen Sensor erfassten Trainingsprozessparameterwert zugordnet werden,
• Zuordnen der Trainingsprozessparameterwerte jeweils zu den ein oder mehreren Trainings produktqualitätsparameterwerten einer der Produkteinheiten, während deren Herstellungs prozess der jeweilige Trainingsprozessparameterwert erfasst wurde, unter Verwendung der Erfassungszeit des jeweiligen Trainingsprozessparameterwerts, der sensorspezifischen zeitli chen Verschiebung des den jeweiligen Trainingsprozessparameterwert erfassenden Sensors und der Herstellungszeit der jeweiligen Produkteinheit,
• Trainieren des Machine-Learning-Moduls unter Verwendung der einander zugeordneten Trai ningsprozessparameterwerte und Trainingsproduktqualitätsparameterwerte, wobei die je weiligen Trainingsproduktqualitätsparameterwerte zum Bereitstellen von Ausgabedaten und die jeweils zugeordneten Trainingsprozessparameterwerte zum Bereitstellen von Eingabeda ten des Machine-Learning-Moduls für das Trainieren verwendet werden. Nach Ausführungsformen ist das Computersystem dazu konfiguriert, jede der zuvor beschriebenen Ausführungsformen des Verfahrens zum Trainieren des Machine-Learning-Moduls auszuführen.
Ausführungsformen umfassen ferner Computersystem zum Vorhersagen von Produktqualitätspara meterwerten für ein oder mehrere Qualitätsparameter eines durch eine chemische Produktionsan lage hergestellten chemischen Produkts unter Verwendung eines computerimplementierten Vor hersagemodells mit einem nach einer der voranstehenden Ausführungsformen trainierten Ma- chine-Learning-Modul, wobei die Produktionsanlage eine Mehrzahl von Sensoren umfasst, welche jeweils dazu konfiguriert sind, im Betrieb der Produktionsanlage Prozessparameterwerte für ein o- der mehrere Prozessparameter eines von der Produktionsanlage ausgeführten chemischen Prozes ses zur Herstellung des chemischen Produkts zu erfassen, wobei das Computersystem einen Prozessor und einen Speicher umfasst, wobei in dem Speicher das Vorhersagemodell mit dem trainierten Machine-Learning-Modul gespeichert ist, wobei in dem Speicher ferner Programminstruktionen gespeichert sind, wobei ein Ausführen der Program minstruktionen durch den Prozessor den Prozessor dazu veranlasst ein Verfahren auszuführen, wel ches umfasst:
• Bereitstellen einer Mehrzahl von den Sensoren im Betrieb der Produktionsanlage erfassten Prozessparameterwerten, wobei den Prozessparameterwerten jeweils eine Erfassungszeit und ein Identifikator des erfassenden Sensors zugeordnet sind,
• Bereitstellen von a priori Informationen über die Produktionsanlage und den von der Produk tionsanlage ausgeführten Prozess, wobei die a priori Informationen zeitliche Ablaufinformati onen über einen zeitlichen Ablauf des ausgeführten Prozesses innerhalb der Produktionsan lage umfassen,
• für jeden der Sensoren jeweils Bestimmen einer sensorspezifischen zeitlichen Verschiebung zwischen den Erfassungszeiten der durch den entsprechenden Sensor erfassten Prozesspara meterwerten und einer Herstellungszeit einer Produkteinheit, für welche Produktqualitätspa rameterwerte vorhergesagt werden sollen und während deren Herstellung die jeweiligen Prozessparameterwert erfasst wurden, wobei das Bestimmen jeweils unter Verwendung der zeitliche Ablaufinformationen erfolgt, wobei die bestimmten sensorspezifischen zeitlichen Verschiebungen der Sensoren jeweils den durch den jeweiligen Sensor erfassten Prozesspara meterwert zugeordnet werden,
• zueinander Zuordnen jeweils derjenigen Prozessparameterwerte, welche während der Her stellung derselben Produkteinheit erfasst wurden, wobei die zu aggregierenden Prozesspara meterwerte unter Verwendung der sensorspezifischen zeitlichen Verschiebung bestimmt werden,
• Verwenden jeweils der einander zugeordneten Prozessparameterwerte zum Bereitstellen von Eingabedaten des trainierten Machine-Learning-Moduls für ein Vorhersagen von ein oder mehreren Produktqualitätsparameterwerten,
• Empfangen von ein oder mehreren unter Verwendung des trainierten Machine-Learning-Mo duls für die Produkteinheit, während deren Herstellung die zum Bereitstellen der Eingabeda ten verwendeten Produktqualitätsparameterwerte erfasst wurden, vorhergesagten Produkt qualitätsparameterwerten als Ausgabe des Vorhersagemodells. Nach Ausführungsformen ist das Computersystem dazu konfiguriert jede der zuvor beschrieben Ausführungsformen des Verfahrens zum Vorhersagen von Produktparameterwerten unter Verwen dung des trainierten Machine-Learning-Moduls auszuführen. Ferner kann das Computersystem dazu konfiguriert werden, jede der zuvor beschrieben Ausführungsformen des Verfahrens zum Er fassen von Anomalien und/oder zum Bereitstellen von Empfehlen für ein Einstellen von steuerbaren Prozessparameter auszuführen.
Im Weiteren werden Ausführungsformen der Erfindung mit Bezugnahme auf die Zeichnungen näher erläutert. Es zeigen:
Figur 1 ein schematisches Diagramm eines exemplarischen Vorhersagemodells, Figur 2 ein schematisches Ablaufdiagramm eines exemplarischen Trainingsverfahrens zum Trainieren eines Vorhersagemodells unter Verwendung von a priori Zusatzinformatio nen,
Figur 3 ein schematisches Ablaufdiagramm eines exemplarischen Verfahrens zum Erkennen und Analysieren von Anomalien, Figur 4 ein schematisches Ablaufdiagramm eines exemplarischen Verfahrens zum Re-trainie- ren bzw. Umtrainieren des Vorhersagemodells, Figuren 5 schematische Ablaufdiagramme eines exemplarischen Verbesserungsverfahrens zum Verbessern von Prozessparametereinstellungen, Figuren 6 exemplarische Zeitreihendaten von Prozess- und Produktqualitätsparameterwerten für eine PET-Produktionsanlage, Figur 7 exemplarische Diagramme eines Vergleichs von vorhergesagten und retrospektiv ge messenen Produktqualitätsparameterwerten,
Figur 8 ein schematisches Diagramm einer exemplarischen Nutzeroberfläche zur Eingabe ge wünschter Produktqualitätsparameterwerte und zum Bereitstellen von Empfehlungen für verbesserte Prozessparametereinstellungen zum Erreichen der gewünschter Pro duktqualitätsparameterwerte,
Figur 9 ein schematisches Diagramm eines exemplarischen Machine-Learning-Moduls in Form eines künstlichen neuronalen Netzes,
Figur 10 ein schematisches Diagramm einer exemplarischen Produktionsanlage, Figur 11 schematisches Ablaufdiagramm eines exemplarischen Trainingsverfahrens, und Figur 12 ein schematisches Diagramm einer exemplarischen Infrastruktur zum Trainieren eines Vorhersagemodells.
Elemente der nachfolgenden Ausführungsformen, die einander entsprechen, werden mit denselben Bezugszeichen gekennzeichnet.
Folgende Notation wird im Zuge der vorliegenden Beschreibung verwendet: C bezeichnet einen Vektor von Prozessparameterwerten, welche von einem Nutzer, d.h. dem Bedie ner, einer Produktionsanlage direkt beeinflusst werden können. CQ bezeichnet einen Vektor von Prozessparameterwerten, welche vom Bediener der Produktionsanlage direkt beeinflusst werden können und welche selbst die Produktqualität beeinflussen können. Dabei gilt CQ <X C. P bezeichnet einen Vektor von Prozessparameterwerten, welche von dem Bediener der Produktionsanlage nicht direkt beeinflusst werden können. X bezeichnet einen Vektor aller Prozessparameterwerte, d.h.,
X = C n P = CQ n (C \ CQ) n P.
Q bezeichnet einen Vektor von vorhergesagten Produktqualitätsparameterwerten, welche das Vor hersagemodell vorhersagt. Q' bezeichnet einen Vektor von gemessenen Produktqualitätsparame terwerten. Bei den entsprechenden Messungen handelte es sich beispielsweise um retrospektiv vorgenommene Labormessungen an Produktproben. Q* bezeichnet einen Vektor von gewünschten Produktqualitätsparameterwerten, welche von dem Bediener der Produktionsanlage festgelegt werden. CQ bezeichnet einen Vektor von empfohlenen Prozessparameterwerden, welche ein Pro zessverbesserungsmodell empfiehlt, um die gewünschte Produktqualitätswerte Q* zu erreichen.
Figur 1 veranschaulicht eine Struktur eines exemplarischen Vorhersagemodells 120 und einer von dem Vorhersagemodell im Zuge seiner Verwendung vorgenommenen Datenaufbereitung.
In das Vorhersagemodell 120 werden Prozessdaten X 100, d.h. Prozessparameterwerte mit X = {C, P}, als Eingabe eingegeben. Diese Prozessdaten 100 können mithin Prozessparameterwerte C umfassen, welche von einem Bediener einer Produktionsanlage direkt beeinflusst bzw. eingestellt werden können und/oder Prozessparameterwerte P, welche von einem Bediener einer Produkti onsanlage direkt beeinflusst bzw. eingestellt werden können.
Die Prozessdaten X 100 werden, beispielsweise kontinuierlich oder periodisch, während des Be triebs einer Produktionsanlage aufgezeichnet. Die Prozessdaten X 100 umfassen beispielsweise Sen sorwerte, Konzentrationswerte von Grundbestandteilen und Additiven, und Durchflusswerte von Grundbestandteilen und Additiven, Temperaturen, Drücke, Ventilstellungen, aggregierte und/oder berechnete Datenwerte aus der Anlagensteuerung, usw.
Das Vorhersagemodell 120 verwendet die Prozessparameterwerte X 100 als Eingabewerte und prognostiziert resultierende Produktqualitätsparameterwerte Q 130, beispielsweise Materialeigen schaften wie etwa Viskosität, Reinheit, Trübung, Farbskala usw., als Ausgabewerte. Das Vorhersage modell 120 lässt sich als eine Funktion fM beschreiben, welche für einen Vektor oder Satz von Pro zessparameterwerten X einen Vektor oder Satz von Produktqualitätsparameterwerten Q ausgibt: fM00 = Q
Das Vorhersagemodell 120 ist beispielsweise strukturiert in einer Folge von Datenverarbeitungs schritten der Blöcke 121-125, welche nacheinander ausgeführt werden zur Aufbereitung der Einga bedaten, d.h. der Prozessdaten X 100, gefolgt von einem künstlichen neuronalen Netzalgorithmus in Block 126 und einer Datennachbearbeitung in Block 127 der Ausgabedaten des neuronalen Netzes 126. Ergebnis der Datennachbearbeitung 127 sind beispielsweise vorhergesagten Produktqualitäts daten, d.h. Produktqualitätsparameterwerte Q.
In Block 121 wird ein Bereinigungsschritt ausgeführt, welcher beispielsweise ein Validieren von Roh prozessdaten, ein Entfernen von unphysikalischen Ausreißern und/oder ein Berechnen fehlender Prozessdaten umfasst.
Bei manchen Prozessen, wie beispielsweise einer Polymerisation, handelt es sich um vergleichs weise langsame Prozesse. In diesem Fall zeigt sich ein Einfluss von Änderungen der Prozessparame terwerte auf die Qualität des Endprodukts bzw. die Produktqualitätsparameterwerte erst mit einer Zeitverzögerung. Um diesem Zeitverzögerungseffekt Rechnung zu tragen, werden die bereinigten Daten aggregiert und unter Verwendung von Aggregationstechniken wie etwa Data Rolling oder Resampling (Up- oder Downsampling) auf eine geeignete Frequenz verschoben. In Block 123 wer den aus den aggregierten Gruppen jeweils für die entsprechende Gruppe ein oder mehrere charak teristische Merkmalswerte wie etwa Mittelwert, Median, Minimum, Maximum, Varianz usw. extra hiert. Die extrahierten Merkmalsdaten werden in Block 124 normalisiert mit Hilfe von Transformati onsverfahren, wie beispielsweise einem Verschieben gemäß dem Mittelwert (engl.: „Shifting by Me- ans"), einem Dividieren durch die Standardabweichung (engl.: „Dividing by Standard Variation") o- der einer Transformation des MinMax-Bereichs auf das Intervall [0, 1] Optional kann in Block 125 beispielsweise eine Flauptkomponentenanalyse (engl.: „Principal Components Analysis"/PCA) durchgeführt werden, um die Dimensionalität der normierten Merkmalsdaten zu reduzieren, wobei Werte wichtiger Merkmale kombiniert und Werte unwichtiger Merkmale entfernt werden. In Block 126 wird ein Modell mit einem künstlichen neuronalen Netz bereitgestellt, welches gezielt dazu trainiert wurde, einen bestimmten komplexen nichtlinearen Produktionsprozess, wie beispielsweise einen Polymerproduktionsprozess, zu approximieren und welches aus den vorverarbeiteten Pro zessdaten Rohausgabedaten, d.h. Rohproduktqualitätsparameterwerte, berechnet. In Block 127 werden die Rohausgabedaten des künstlichen neuronalen Netzes transformiert und normiert, um Vorhersagen für Produktqualitätsparameterwerte zu erhalten.
Die bei der vorangehend beschriebenen Datenverarbeitung, Nachbearbeitung und im künstlichen neuronalen Netz verwendeten genauen Algorithmen und Modellparameter, werden im Zuge eines Trainingsverfahrens bestimmt.
Figur 2 veranschaulicht ein exemplarisches Trainingsverfahren zum Trainieren eines Vorhersagemo dells unter Verwendung von a priori Zusatzinformationen. Das Vorhersagemodell umfasst ein künst liches neuronales Netz. Das a priori Zusatzinformationen umfasst beispielsweise Ingenieurs- und/o der Prozesswissen.
Im Zuge des Trainingsverfahrens lernt das untrainierte Vorhersagemodell 210 geeignete Modellpa rameterwerte unter Verwendung historischer Trainingsdatensätze {XT, Qj} 245. Diese Trainingsda tensätze umfassen jeweils reale historische, d.h. zuvor gemessene, Prozessdatenwerte XT 200 als auch reale historische Produktqualitätsdatenwerte Qj 240, welche aus den historischen Prozessda tenwerten XT 200 des entsprechenden Trainingsdatensatzes {XT, Qj} 245 resultieren. Die Prozess datenwerte XT 200 wurden beispielsweise während einer Betriebsphase eines Test- und/oder Re gelbetriebs der Produktionsanlage gemessen, während die historischen Produktqualitätsdaten werte Qj 240 beispielsweise mittels Offline-Labormessungen der resultierenden Endprodukte be stimmt wurden. Nach Ausführungsformen können die Trainingsdaten der Trainingsdatensätze {XT, Qj} 245 beispielsweise während einer regulären Betriebsphase der Produktionsanlage oder während einer Inbetriebnahmephase der Produktionsanlage aufgezeichnet werden. Insbesondere können sie live aufgezeichnet und dem Vorhersagemodell zu Trainingszwecken direkt zur Verfügung gestellt werden.
Das in Figur 2 gezeigte untrainierte Vorhersagemodell 210 umfasst eine Folge von Modulen 211- 217. Bei den Modulen 211 bis 215 handelt es sich beispielsweise um Datenaufbereitungsmodule, bei Modul 216 um ein künstliches neuronales Netzmodul und bei Modul 217 um ein Datennachbe arbeitungsmodul. Die Datenaufbereitungsmodule umfassen beispielsweise ein Datenbereinigungs modul 211, ein Datenaggregationsmodul 212, ein Datentransformationsmodul 213, ein Datennor malisierungsmodul 214 und/oder ein Flauptkomponentenanalysemodul 215. Bei dem Module 216 handelt es sich beispielsweise um ein Neuronales-Netz-Modul, welches ein zu trainierendes künstli ches neuronales Netzwerk bereitstellt, beispielsweise ein mehrlagiges Perzeptron (engl.: „Mul- tilayer-Perzeptron"/MLP), ein Convolutional Neural Network (CNN), ein Rekurrentes neuronales Netz (RNN), ein Long Short-Term Memory Network (LSTM-Netz) usw. Schließlich umfasst das zu trainierende Vorhersagemodel ein Datennormalisierungsmodul 217.
Für das Trainingsverfahren werden beispielsweise Flyperparameter festgelegt, d.h. algorithmusspe zifische Werte, die den Lernprozess des Vorhersagemodells im Zuge des Trainingsverfahrens steu ern, wie zum Beispiel Lernrate, Toleranz usw. Ferner werden Modellparameterwerte aus den Trai ningsdaten gelernt, d.h. Werte, welche bestimmen, wie der Algorithmus des künstlichen neurona len Netzes eine Ausgabe berechnet. Bei den Modellparametern handelt es sich beispielsweise um Gewichte und Koeffizienten des künstlichen neuronalen Netzes.
In einem idealen Szenario sollten die Trainingsdatensätze so umfangreich wie möglich sein, d.h. sie sollten einen ausreichend langen Zeitraum abdecken, in welchem die Produktionsanlage unter allen möglichen Betriebsbedingungen betrieben wurde und eine breite Palette von Produktqualitäten produziert wurde. In einem solchen idealen Szenario kann ein Vorhersagemodell effektiv trainiert werden, wodurch es einen Satz von Modellparametern lernt, um die Beziehungen zwischen Input, d.h. zwischen Prozessdaten, und Output, d.h. Produktqualität, aus den Trainingsdaten optimal abzu bilden. Die Leistung des Vorhersagemodells könnte dann durch Testen und Variieren der genauen Algorithmen und Hyperparameter, welche in den Modellblöcken 211-217 verwendet werden, opti miert werden. In der Praxis, d.h. in realen Szenarien, ist es jedoch nicht möglich, so umfangreiche Trainingsdaten sätze zu sammeln, dass ein einfacher, direkter Lernprozess allein auf Basis der umfangreiche Trai ningsdatensätze möglich wäre. Infolgedessen sind bisherige, allein auf Basis von Trainingsdatensät zen trainierte Vorhersagemodelle entweder zu ungenau oder zu spezialisiert, um in realen Anwen dungen tatsächlich nützlich zu sein. Darüber hinaus gibt es unzählige Optionen für die Wahl der Al gorithmen und Hyperparameter in jedem der Modellblöcke 211 bis 217, wodurch das Auffinden ei nes optimalen Satzes von Algorithmen und Hyperparametern extrem erschwert wird.
Ausführungsformen stellen ein Verfahren bereit zum Integrieren von a priori Zusatzinformationen 250 über physikochemische Prozesse sowie das Anlagendesign der Produktionsanlage, welche dem Produktionsverfahren zugrunde liegen, in das Trainingsverfahren. Durch das Verwenden von a priori Zusatzinformationen kann der Werteraum für mögliche Modellalgorithmen und Hyperparameter deutlich verkleinert werden und das resultierende trainierte Vorhersagemodell vereint die Vorteile des prozessgetriebenen technischen Konstruktionsansatzes und des datengetriebenen maschinellen Lernansatzes.
Nach Ausführungsformen können die Zusatzinformationen beispielsweise auf technischen Doku mentationen in Form von Prozessflussdiagrammen, Rohrleitungs- und Instrumentierungsdiagram men, Auslöse- und Alarmplänen, Gefahren- und Betriebsfähigkeitsstudien usw. sowie auf qualitati ves Wissen erfahrener Ingenieure oder Anlagenbediener, beruhen. Diese Zusatzinformationen las sen sich unterschiedlichen Domänen 251 bis 257 zuordnen und werden während des Modellauf baus und des Modelltrainings miteinbezogen, um geeignete Algorithmen und Hyperparameter in jedem der Blöcke 211 bis 217 des Trainingsverfahrens zu ermitteln.
Entsprechende Zusatzinformationen können a priori Wissen bzw. Hintergrundwissen bereitstellen basierend auf dem prozessgetriebenen technischen Konstruktionsansatz, welcher dem Anlagende sign der Produktionsanlage zugrunde liegt. Diese Zusatzinformationen umfassen beispielsweise In formationen über das Anlagendesign der Produktionsanlage sowie die in der Produktionsanlage ab laufenden physikochemischen Prozesse. Mit diesem a priori Wissen bzw. Hintergrundwissen kann der datengetriebenen maschinellen Lernansatz um Wissen über die prozessgetriebene technische Konstruktion der Produktionsanlage ergänzt werden. Dieses zusätzliche Wissen ermöglicht es das maschinelle Lernen effizienter und präziser auszugestalten.
Prozessflussdiagrammen, Rohrleitungs- und Instrumentierungsdiagrammen, Auslöse- und Alarmplä nen, Gefahren- und Betriebsfähigkeitsstudien usw. können beispielsweise Informationen über den Aufbau und die Funktionsweise der Produktionsanlage sowie darüber entnommen werden, wo wel che physikalisch chemischen Prozesse in welcher Form innerhalb der Anlage ablaufen. Beispiels weise lassen sich hieraus zeitliche Ablaufinformationen über einen zeitlichen Ablauf des ausgeführ ten Prozesses innerhalb der Produktionsanlage erstellen. Beispielsweise können den vorgenannten Unterlagen Verarbeitungs- und/oder Reaktionsgeschwindigkeiten, Erwärmungs- und/oder Abkühl geschwindigkeiten, ebenso wie Rohrleitungslängen, Rohrquerschnitte und/oder Durchfluss- bzw. Durchsatzgeschwindigkeiten, welche die zeitlichen Abläufe innerhalb der Produktionsanlage beein flussen, entnommen werden. Diese Informationen können ferner als a priori Wissen bzw. Hinter grundwissen beispielsweise zur Einschränkung bzw. Konkretisierung des datengetriebenen maschi nellen Lernens verwendet werden. Anhand der vorgenannten Informationen können beispielsweise die zum Erfassen von Prozessparameterwerte verwendeten Sensoren bestimmten Positionen und/oder physikalisch chemischen Prozessen in der Produktionsanlage zugeordnet werden. Mithin können auch die von den entsprechenden Sensoren erfassten Prozessparameterwerten bestimm ten physikalisch chemischen Prozessen bzw. Teilprozessen zugeordnet werden. Dieses a priori Wis sen bzw. Hintergrundwissen zu den Prozessparameterwerte kann dazu verwendet werde die Pro zessparameterwerte, welche die Grundlage des datengetriebenen maschinellen Lernansatzes dar stellen, in einen prozessualen, konstruktiven Kontext einzuordnen. Dieser Kontext kann beispiels weise zur Datenbereinigung und/oder zu Definition von Abhängigkeiten und7oder zur Definition von zeitlichen Reihenfolgen der von dem Machine-Learning-Modul zum maschinellen Lernen ver wendeten Daten bzw. Prozessparameterwerten verwendet werden. Ebenso kann entsprechendes qualitatives Wissen etwa erfahrener Ingenieure oder Anlagenbediener Informationen über den Auf bau und die Funktionsweise der Produktionsanlage sowie darüber liefern, wo welche physikalisch chemischen Prozesse in welcher Form innerhalb der Anlage ablaufen.
Für den Datenbereinigungsblock 211 wird beispielsweise a priori Zusatzinformationen 251 der Wis sensdomäne zur Datenbereinigung bereitgestellt. Beispielsweise werden Sensor- und Gerätespezifi kationen zur Verfügung gestellt. Diese Spezifikationen geben beispielsweise Typ, Empfindlichkeit und Einheit, usw. der entsprechenden Sensoren bzw. Geräte an.
Beispielsweise kann der Datenbereinigungsblock 211 Ausreißerwerte, welche nicht in Einklang mit den Spezifikationen stehen, aus den Eingabedaten, d.h. den Prozessdatenwerte XT 200 der Trai ningsdatensätze {XT, Qj} 245, unter Verwendung der Sensor- und Gerätespezifikationen entfernen. Bei den entfernten Ausreißerwerten handelt es sich beispielsweise um Prozessdatenwerte, welche außerhalb und/oder innerhalb eines Randbereichs eines vordefinierten Mess- bzw. Betriebsbereichs liegen, für welchen Sensoren bzw. Geräte ausgelegt sind.
Ferner können unphysikalische Werte basierend auf der Anlagenauslegung identifiziert und aus den Prozessdatenwerten XT 200 entfernt werden. Die Anlagenauslegung kann Wertebereiche für Para meterwerte festlegen, für welche die Anlage ausgelegt ist und welche in der Anlage erreicht werden können. Treten Werte außerhalb dieser Wertebereiche auf, für die die Anlage ausgelegt ist, können die entsprechenden Werte als unphysikalisch zurückgewiesen werden. Des Weiteren können sen- sorübergreifende Plausibilitätsprüfungen ausgeführt werden, unplausible Werte identifiziert und aus den Prozessdatenwerten XT 200 entfernt werden. Beispielsweise sollten sich Sensorwerte be nachbarter Sensoren nicht oder nur in begrenztem Umfang voneinander unterscheiden, wenn zwi schen bzw. im Bereich der entsprechenden Sensoren keine Prozessschritte, d.h. physikalischen und/oder chemischen Prozesse, auftreten, die zu einer signifikanten Änderung der entsprechenden Sensorwerte führen können. Eine signifikante Änderung bedeutet in diesem Fall eine Änderung, welche außerhalb eines vordefinierten Schwankungsbereichs liegt, wie er beispielsweise durch To leranzen in der Auslegung der Produktionsanlage und/oder Toleranzen in der Messgenauigkeit, der zum Messen verwendeten Sensoren, verursacht werden kann. Ferner können für die gemessenen Sensorwerte bestimmte Entwicklungen angenommen werden. So sollte eine Temperatur in Abwe senheit exothermer Reaktionen, d.h. im Falle keiner oder rein endothermer Reaktionen, beispiels weise ohne Energiezuführung zu dem System aufgrund der allgemein auftretenden Wärmedissipa tion abnehmen. Messen aufeinanderfolgende Temperatursensoren einen Temperaturanstieg, ob wohl für diese Sensoren eine Temperaturabnahme zu erwarten ist, kann ein Plausibilitätstest zu ei nem Zurückweisen eines Sensorwerts führen, welcher wider Erwarten eine Temperaturzunahme anzeigt.
Nach Ausführungsformen definieren die a priori Zusatzinformationen 251 einen Satz von Prozesspa rametern, welche die Produktqualitätsparameterwerte des resultierenden Endprodukts beeinflus sen. Beispielsweise werden für ein oder mehrere Prozessschritte jeweils Prozessparameter defi niert, von welchen die finalen Produktqualitätsparameterwerte abhängen. Für den von den a priori Zusatzinformationen 251 definierten Prozessparametersatz wird eine Vollständigkeitsprüfung aus geführt. Fehlen in einem der Trainingsdatensätze {XT, Qj} 245 Prozessdatenwerte XT zu einem der definierten Prozessparameter, werden Prozessdatenwerte zu diesem Prozessparameter in den Ein gabedaten ergänzt. Die ergänzten Prozessparameter werden beispielsweise aus vorliegenden Pro zessdatenwerten abgeleitet, etwa mittels Interpolation und/oder Extrapolation. Beispielsweise kön nen zum Ableiten fehlender Prozessdatenwerte auch Prozessdatenwerte aus anderen Trainingsda tensätzen {XT, Qj} 245 herangezogen werden. Beispielsweise können Durchschnittswerte aus ande ren Trainingsdatensätzen {XT, Qj} 245 verwendet werden und/oder Extrapolationen von den ande ren Trainingsdatensätzen {XT, Qj} 245 auf die Bedingung des aktuellen Trainingsdatensatzes. Als weiteren Trainingsdatensätze zum Schätzen und/oder Extrapolieren fehlender Prozessdatenwerte können beispielsweise auch gemessene Werte aus anderen Produktionsanlagen herangezogen wer den, gemessene Werte aus Versuchsanlagen und/oder Versuchsaufbauten, Werte aus numerischen Computersimulationen oder Werte aus analytischen Näherungsformeln zur Beschreibung des rele vanten Prozessschritts.
Fehlende oder aufgrund einer Identifizierung als fehlerhaft entfernte Datenwerte können beispiels weise durch Entwurfsvorgaben oder durch geeignete statistische Verfahren ergänzt werden. Geeig nete statistische Verfahren können beispielsweise umfassen: Ein Verwenden eines letzten oder nächstgültigen Werts des entsprechenden Sensors, einen Mittelwert über ein zurückliegendes Zeit fenster, wie etwa die letzte Stunde und/ oder Stunden, oder eine Interpolation und/oder Extrapola tion aus Datenwerten benachbarter Sensoren.
Für den Datenaggregationsblock 212 werden beispielsweise a priori Zusatzinformationen 252 der Wissensdomäne Datenaggregation bereitgestellt. Nach Ausführungsformen werden Definitionen relevanter Zeitskalen des Prozesses bereitgestellt und als Grundlage für eine Aggregation der Prozessdatenwerte verwendet. Die relevanten Zeitska len definieren Zeitfenster, innerhalb derer gemessene Daten aggregiert werden. Die entsprechen den Zeitfenster definieren eine Frequenz für das Aggregieren der Daten.
Nach Ausführungsformen werden Prozessdatenwerte zeitverzögerter Prozesse, welche zu unter schiedlichen Zeiten gemessen wurden, demselben Prozessdurchlauf zugeordnet und zusammen gruppiert. Zeitverzögerungen in einem zeitverzögerten Prozess basierend beispielsweise auf einer Abfolge zeitlich aufeinanderfolgender Prozessschritte, einer Prozessbetriebsart, wie etwa einem Batchbetrieb oder einem Dauerbetrieb, einem dynamischen Verhalten des Prozesses oder einer Re aktionskinetik des Prozesses. Zur Definition von Zeitverzögerungen des Prozesses werden beispiels weise Prozessflussdiagramme bereitgestellt, aus welchen sich Beziehungen zwischen unterschiedli chen Anlagenabschnitten ergeben, welche zeitversetzt zu ein und demselben Prozessdurchlauf bei tragen.
Für den Merkmalsextraktionsblock 213 werden beispielsweise a priori Zusatzinformationen 253 der Wissensdomäne zur Merkmalsextraktion bereitgestellt. Im Zuge der Merkmalsextraktion werden für aggregierte numerische Daten beispielsweise Merkmalswerte berechnet. Aggregierte kategori sche Daten werden beispielsweise im Zuge der Merkmalsextraktion kodiert. Berechnete Merkmals werte können Merkmale des Zeitbereichs sein, etwa statistische Werte wie Mittelwert, Median, Mi nimum, Maximum, Varianz, usw., oder Merkmale des Frequenzbereichs, wie etwa eine dominante Frequenz, Nieder- oder Flochfrequenzgehalt, eine spektrale Differenz, usw. Diese Merkmalswerte werden aus den aggregierten Werten ein oder mehrerer Prozessparameter berechnet. Beispiels weise wird vorhandenes Wissen über das Prozessverhalten in numerische Merkmale kodiert. Zu sätzliche Merkmale werden beispielsweise aus bestehenden parametrischen Modellen, Prozesssi mulationen oder prozessspezifischen Formeln extrahiert.
Für den Datennormalisierungsblock 214 werden beispielsweise a priori Zusatzinformationen 254 der Wissensdomäne zur Datennormalisierung bereitgestellt. Die Merkmalwerte, welche die voran gehende Merkmalsextraktion bereitstellt, werden zur Verbesserung des Trainings des nachfolgen den neuronalen Netzes skaliert. So werden die Merkmalswerte für das neuronale Netz beispiels weise effizienter handhabbar. Nach Ausführungsformen werden für die Merkmalsparameter bei spielsweise jeweils ein individuelles Skalierungsverfahren gewählt basierend auf dem Sensortyp, dem zugrundeliegenden physikalischen Prozess und/oder Wissen über die Verteilung der Pro zessparameterwerte.
Für den Datentransformationsblock 215 werden beispielsweise a priori Zusatzinformationen 255 der Wissensdomäne zur Datentransformation zwecks Dimensionalitätsreduktion bereitgestellt. Die Transformation in Block 215 dient einer Reduzierung der Dimensionalität der Merkmalwerte zur Vereinfachung der Lernaufgabe für das neuronale Netz. Zur Reduzierung der Dimensionalität der Eingabedaten des neuronalen Netzes werden beispielsweise Transformationstechniken der Haupt komponentenanalyse (engl.: „Principal Component Analysis"/PCA), wie etwa lineare PCA, Kernel- PCA, usw. oder Diskriminanzanalyse (engl.: „Linear discriminant analysis"/LDA), genutzt.
Mittels der Transformation können Merkmale, die nur geringe prädiktive Informationen enthalten, identifiziert und die zugehörigen Merkmalswerte kombiniert oder eliminiert werden. Ebenso kön nen Merkmale, die viele prädiktive Informationen enthalten, etwa Grundlage der Prozessspezifika tion, hervorgehoben werden.
Für das künstliche neuronale Netz 216 werden beispielsweise a priori Zusatzinformationen 256 der Wissensdomäne zu neuronalen Netzen bereitgestellt. Nach Ausführungsformen wird ein geeigneter neuronaler Netztyp, wie beispielsweise MLP, CNN, RNN oder LSTM-Netz, ausgewählt. Ausgewählt wird beispielsweise ferner die Architektur des künstlichen neuronalen Netzes, d.h. die verwendete Anordnung und Anzahl von Schichten und Knoten, Aktivierungsfunktionen, eine Verlustfunktion und/oder Hyperparameter bzw. ein Unterraum von Hyperparametern. Die Auswahl erfolgt bei spielsweise unter Verwendung von Kenntnissen über den zugrundeliegenden Produktionsprozess, über die Eingabedaten und/oder über die Ausgabedaten. Beispielsweise werden unterschiedliche Typen von künstlichen neuronalen Netzen und/oder Netzen mit unterschiedlichen Konfigurationen durchgetestet.
Beispielsweise wird das Training des neuronalen Netzes unterstützt durch Bereitstellen von Definiti onen, bezüglich welcher Prozessparameter das neuronale Netz invariant sein soll. Diese Definitio nen können dazu genutzt werden, dass neuronale Netz mit zusätzlichen simulierten Daten zu trai nieren, welche mit diesen zielerhaltenden Transformationen stochastisch gestört werden.
Beispielsweise werden gemeinsam genutzte Gewichte verwendet, um bestimmte Gewichte im Netzwerk gemeinsam zu trainieren, basierend auf dem Wissen über den Ort, an welchem ein be stimmter Prozessschritt abläuft. So werden beispielsweise Merkmale von bestimmten Sensortypen in derselben Prozesseinheit das gleiche Gewicht zugeordnet. Durch das gemeinsame Trainieren von Gewichten, kann die Effizienz des Trainingsverfahrens erhöht werden.
Beispielsweise wird eine Gewichtungsreduktion zur Normalisierung von Gewichten durch Einbezie hung von Prozesswissen zur Glättung der Datenzuordnung (Data Mapping) verwendet. Gilt bei spielsweise Xx = X2 für alle, außer ggf. einzelne Prozessparametern, dann sollte auch fivi(Xi) = fM(Xz) gelten.
Beispielsweise wird eine anwendungsindividuelle Verlustfunktion konstruiert, anstelle einer indiffe renten Verwendung der typischen mittleren quadratischen Abweichungsfunktion (engl.: „mean squared error function"/MISE), um bestimmte fehlerhafte, etwa widersprüchliche oder unphysikali sche, Vorhersagen spezifisch zu bestrafen. Beispielsweise werden im Hinblick auf Verunreinigungs konzentrationen mittlere quadratische oder absolute logarithmische Abweichungen verwendet, um große oder große negative Abweichungen stärker zu bestrafen. Beispielsweise werden Warmstartverfahren verwendet, um initiale Modellgewichte basierend auf vortrainierten Modellen auszuwählen. So werden zur Initialisierung von Gewichten beispielsweise Gewichte eines neuronalen Netzes verwendet, welches mit vereinfachten Trainingsdatensätzen derselben Produktionsanlage oder einer ähnlichen Produktionsanlage trainiert wurde. Auch können Gewichte eines neuronalen Netzes verwendet werden, welches mit Trainingsdatensätzen derselben Produktionsanlage vor einem Umbau trainiert wurde.
Für den Datennormalisierungsblock 217 wird beispielsweise a priori Zusatzinformationen 257 der Wissensdomäne zur Ausgabedatennormalisierung bereitgestellt. Produktqualitätsparameter wer den so skaliert, dass sie mit der Skalierung der Ausgabedaten des neuronalen Netzes übereinstim men. Die Wahl der Skalierungsmethode basiert beispielsweise für jeden der Produktqualitätspara meter jeweils auf einer erwarteten Verteilung der entsprechenden Produktqualitätsparameter werte.
Unter Einbeziehung von ein oder mehreren der Blöcke 251 bis 257 wird das Trainingsverfahren zum Training des Vorhersagemodells unter Verwendung der Trainingsdatensätze {XT, Qj} 245 beispiels weise mittels Cross-Validierung durchgeführt. Die Trainingsdatensätze werden gemischt und in Un tergruppen für das Training, für ein Validieren und ein Testen aufgeteilt. Diese Untergruppen wer den zum Trainieren und Benchmarking der Leistung des Modells verwendet.
Sind die gegebenen Trainingsdatensätze hinsichtlich der Betriebsbedingungen für welche sie gemes sen wurden stark unausgewogen, wird das Aufteilen in die Untergruppen unter Verwendung einer dem Betriebszustand bzw. den Betriebsbedingungen entsprechende Variable gesteuert. Eine Un ausgewogenheit der Betriebsbedingungen kann beispielsweise darauf beruhen, dass die Produkti onsanlage in welcher die entsprechenden Trainingsdatenwerte gemessen werden nur unter weni gen Bedingungen und kaum unter anderen betrieben wird. Bei der entsprechenden Variablen kann es sich beispielsweise um einen direkt gemessenen Prozessparameter, einen aus Berechnungen ab geleiteten Parameter oder ein Ergebnis eines zusätzlichen Schritts einer Clusteranalyse der Be triebsbedingungen handeln. Dabei kann eine prozentuale Zusammensetzung der Untergruppen hin sichtlich Trainingsdatensätzen der unterschiedlichen Betriebsbedingungen sichergestellt werden. Gleichfalls erfolgt das Aufteilen in die Untergruppen bei einer starken Unausgewogenheit der Trai ningsdatensätze hinsichtlich der Zielvariablen beispielsweise unter Verwendung einer der Zielvari ablen oder einer zusätzlichen Metrik einer Clusteranalyse der Produktqualitätsparameter. Eine Un ausgewogenheit der Betriebsbedingungen kann beispielsweise darauf beruhen, dass die Produkti onsanlage hauptsächlich Endprodukte mit sehr ähnlicher Produktqualität herstellt.
Die Validierungsdatensätze werden zur weiteren Abstimmung des neuronalen Netzes verwendet. Hyperparameter-Optimierungsansätze, wie etwa eine Grid-Suche oder Zufallssuche, nehmen einen Teilbereich von Hyperparameterbereichen und geben ein Tupel von Hyperparametern zurück, wel che die Eingabedaten optimal auf die Ausgabedaten abbilden, d.h. die Prozessparameterwerte auf die Produktqualitätsparameterwerte. Das Ergebnis des Trainingsverfahrens ist ein trainiertes Vorhersagemodell fM 120, d.h. ein Vorher sagemodell mit präzisen Algorithmen und Modellparametern für jeden der Blöcke 121-127 des ent sprechenden Vorhersagemodells, so dass für jeden neuen Datensatz von Prozessparameterwerten X als Eingabedaten ein Datensatz von Produktqualitätsparameterwerten Q als Ausgabedaten be rechnet werden kann. Dieses trainierte Vorhersagemodell fM 120 kann beispielsweise während ei nes Betriebs der Produktionsanlage dazu verwendet werden, kontinuierlich in Echtzeit zu erwar tende Qualitätseigenschaften vorherzusagen und diese zu überwachen, ohne auf Labormessungen warten zu müssen.
Figur 3 veranschaulicht ein exemplarisches Verfahren zum Erkennen von Anomalien unter Verwen dung des Vorhersagemodells.
Nach erfolgreichem Training kann das trainierte Vorhersagemodell fM 120 den Produktionsprozess, beispielsweise einen Polymerproduktionsprozess, präzise abbilden und ausgehend von Prozesspara meterwerten X 100 der Produktionsanlage resultierende Produktqualitätsparameterwerte Q 130 beispielsweise während des Betriebs unmittelbar Vorhersagen.
Aus retrospektiven Labormessungen resultierende Produktqualitätsparameterwerte Q' 340 können genutzt werden, um weitere Einblicke in den Betrieb der Produktionsanlage zu erhalten. Insbeson dere unter Verwendung solcher gemessener Produktqualitätsparameterwerte Q' 340 kann ein Ano malieerkennungsverfahren implementiert werden, welches zur Erkennung eines anomalen und feh lerhaften Betriebs der Produktionsanlage dient. Eine solche Anomalie kann beispielsweise Reaktor verschmutzungen, auftretende Zersetzungsprozesse innerhalb der Produktionsanlage, Ausfälle von Komponenten der Produktionsanlage, usw. umfassen. Selbst im Falle einer Verwendung eines sol chen Vorhersagemodells fM 120, welches präzise Vorhersagen für die Produktqualität zu liefern ver mag, kann es nach wie vor notwendig sein, entsprechende retrospektive Labormessungen der Pro duktqualität, etwa für Zertifizierung der Produktqualität, auszuführen. Auch wenn solche Labormes sungen, wenn ein präzises Vorhersagemodell fM 120 zur Verfügung steht, wesentlich seltener durchzuführen sind als dies etwa aktuell in Produktionsanlagen üblich ist.
Zu einem gegebenen Zeitpunkt t werden gemessene Produktqualitätsparameter Q'(t) 340 mit den für diesen Zeitpunkt t vorhergesagten Produktqualitätsparameter Q(t) 330 unter Verwendung einer Klassifizierungsfunktion fA(Q', Q) 360 verglichen. Abhängig von dem Maß einer Abweichung zwi schen Q'(t) und Q(t) klassifiziert fA jeden Zeitpunkt t entweder als normal, fall die Vorhersage Q(t) ausreichend gut mit der Messung Q'(t) übereinstimmt, oder als Anomalieereignis 362, falls eine Ab weichung zu zwischen Q'(t) und Q(t) groß ist.
Die Klassifizierung und Interpretation einer Übereinstimmung als „ausreichend gut" und einer Ab weichung als „zu groß" kann mit verschiedenen Ansätzen realisiert werden: Ein Ansatz für eine Entscheidungsregel, ob eine Übereinstimmung zwischen Q'(t) und Q(t) ausrei chend ist oder ob es sich um eine Anomalie handelt, ist eine Verwendung eines vordefinierten Schwellenwert. Gemessene Produktqualitätsparameter Q'(t) werden als ein Anomalieereignis klas sifiziert, falls eine Abweichung zwischen Q'(t) und Q(t) den vordefinierten Schwellenwert über schreitet. Die Abweichung kann beispielsweise unter Verwendung der LI- oder L2-Verlustfunktion quantifiziert werden, d.h. der kleinsten absoluten Abweichung (engl.: „Least Absolute Devia- tion"/LAD) L1= X[L1|Q'i(t)-Qi(t)| oder der kleinsten Quadratabweichungen (engl.: „Least Square Er-
Ein weiterer Ansatz für die Klassifizierung basiert beispielsweise auf einer Bewertung des Vertrau ens, d.h. der statistischen Sicherheit des Vorhersagemodells. Gemessene Produktqualitätsparame ter Q'(t) werden als ein Anomalieereignis klassifiziert, falls eine Abweichung zwischen Q'(t) und Q(t), beispielsweise quantifiziert durch die LI- oder L2-Verlustfunktion, außerhalb eines statisti schen Sicherheitsbereichs bzw. Konfidenzintervall des entsprechenden Vorhersagemodells liegt.
Eine Möglichkeit, die statistische Sicherheit des Vorhersagemodells zu quantifizieren, besteht bei spielsweise darin, ein zweites neuronales Netz zu verwenden, das trainiert wurde, um die Genauig keit des ersten Vorhersagemodells vorherzusagen.
Wird ein Ereignis zum Zeitpunkt t als ein Anomalieereignis 362 klassifiziert, kann beispielsweise eine Ursachenanalyse durchgeführt werden, welche eine wahrscheinlichste Ursache der Anomalie iden tifiziert, z.B. eine Einheit der Produktionsanlage oder einen Sensor.
Figur 4 veranschaulicht ein exemplarisches Trainingsverfahren zum Retrainieren bzw. Umtrainieren des Vorhersagemodells unter Verwendung aktueller Prozess- und Produktqualitätsdaten als Trai ningsdaten.
Mittels Retrainieren kann ein kontinuierliches Lernen für ein bereits trainiertes Vorhersagemodell fM 120 implementiert werden. Selbst bei einem Vorhersagemodell fM 120, welches wie zuvor be schrieben mit a priori Zusatzinformationen trainiert wurde, ist die Leistung des Vorhersagemodells bei Anwendung auf neuartige reale Prozessparameterwerte abhängig von den zum Trainieren ver wendeten Trainingsdatensätzen und den Prozessbedingungen, unter denen diese Trainingsdaten sätze erhalten wurden. Während die Vorhersagegenauigkeit für Betriebsbedingungen, die den Trai ningsbedingungen ähneln, in der Regel sehr gut ist, wird die Vorhersagegenauigkeit des Vorhersage modells deutlich abnehmen, falls sich die Betriebsbedingungen, unter denen die neuartigen realen Prozessparameterwerte erfasst wurden, deutlich von den Betriebsbedingungen unterscheiden, un ter denen die Prozessparameterwerte der Trainingsdatensätze erfasst wurden.
Nach Ausführungsformen kann eine solche Beschränkung reduziert werden mittels eines Verfah rens zum kontinuierlichen Retrainieren des Vorhersagemodells mit neu gewonnenen Daten als Trai ningsdaten, falls sich die Betriebsbedingungen der Produktionsanlage zeitlich ändern. Die Prozessparameterwerte X 100 der Produktionsanlage werden kontinuierlich als Eingabedaten für das bereits trainierte Vorhersagemodell fM 120 verwendet, welches vorhergesagte Produktqua litätsparameterwerte Q 130 in Echtzeit als Ausgabedaten zurückgibt. Darüber hinaus stellen gele gentlich vorgenommene retrospektive Labormessungen gemessene Produktqualitätsparameter werte Q' 340 zur Verfügung.
Zu jedem Zeitpunkt t bestimmt eine Klassifizierungsfunktion fu(X, Q', Q)) 460, wie die neue Be obachtung zum Retraining des Vorhersagemodells fM 120 verwendet werden soll. Mögliche Formen des Retrainings sind beispielsweise ein Online- oder ein Mini-Batch-Trainingsverfahren.
Beispielsweise nutzt das Online-Trainingsverfahren jede neue Beobachtung, um das bestehende Vorhersagemodell sequentiell mittels einer Backpropagation zu trainieren. Das auf diese Weise neu trainierte Modell wird dynamisch angepasst, wobei es dazu neigt, aktuelle Beobachtungen stärker hervorzuheben als ältere Daten. Ein solches Online-Trainingsverfahren kann beispielsweise in ein oder mehreren der folgenden Fälle eingesetzt werden:
Beispielsweise unterscheiden sich entweder die gemessenen Prozessparameterwerte X(t) oder die gemessenen Produktqualitätsparameterwerte Q'(t) erheblich von denen vorhandener Trainingsda ten XT und Qj. Das Maß für den „Unterschied" kann beispielsweise ein Wahrscheinlichkeitswert ei nes Clustering-Modells oder ein Indexwert eines lokalen Ausreißermodells (engl.: „Local Outlier Fac tor Model"/LOF-Modell) sein. In diesem Fall wurden beispielsweise das Clustering-Modell Clustering bzw. das LOF-Modell zuvor unter Verwendung der entsprechenden vorhandenen Trainingsdaten XT und Qj trainiert.
Beispielsweise weist das bestehende Vorhersagemodell fM 120 für die neue Beobachtung ein gerin ges Vertrauen, d.h. eine geringe statistische Sicherheit, auf. Eine Möglichkeit, die statistische Sicher heit des Vorhersagemodells fM 120 zu quantifizieren, besteht beispielsweise darin, ein zweites neu ronales Netz zu verwenden, das trainiert wurde, um die Genauigkeit des ersten Vorhersagemodells fM 120 vorherzusagen.
Beispielsweise weist das bestehende Vorhersagemodell fM 120 eine hohe statistische Sicherheit auf, aber eine Vorhersagegenauigkeit des Vorhersagemodells fM 120 ist gering für die neue Be obachtung, d.h. es gibt eine große Abweichung zwischen gemessenen Produktqualitätsparameter werten Q'(t) und von dem Vorhersagemodell fM 120 vorhergesagten Produktqualitätsparameter werten Q(t), welche einen vordefinierten Schwellwert überschreitet.
Im Gegensatz zum Online-Trainingsverfahren verwendet das Mini-Batch-Trainingsverfahren nicht jede neue Beobachtung direkt zum Training des Vorhersagemodells fM 120, sondern sammelt zu nächst eine vordefinierte Mindestanzahl von n neuen Beobachtungen und trainiert das bestehende Modell erst, wenn diese vordefinierte Mindestanzahl, d.h. die Batch-Größe, erreicht ist. Ein auf diese Weise neu trainiertes Modell kann den Vorteil haben, dass es die gesamten Trainingsdaten global besser zu approximieren vermag. Ein Mini-Batch-Trainingsverfahren kann beispielsweise in ein oder mehreren der folgenden Fälle eingesetzt werden:
Beispielsweise sind die gemessenen Prozessparameterwerte X(t) der Produktionsanlage und die gemessenen Produktqualitätsparameterwerte Q'(t) vergleichbar mit bereits vorhandenen und zu vor zum Training verwendeten Trainingsdaten XT und Qy.
Beispielsweise weist das bestehende Vorhersagemodell fM 120 für die neuen Beobachtungen eine hohe statistische Sicherheit und eine hohe Vorhersagegenauigkeit auf.
Die neuen Daten {XT(t), Qj(t)} oder im Falle von Mini-Batch-Trainingsverfahrens die Sammlung bzw. der Stapel neuer Daten werden als Eingabedaten 462 und Ausgabedaten 464 zum Training des bestehenden Modells fM 120 verwendet. Das Ergebnis des Retrainings ist ein aktualisiertes Vorher sagemodell fM 420, d.h. ein Vorhersagemodell mit präzisen Algorithmen und Modellparametern in jedem der Blöcke 421-426. Auf diese Weise kann ein Vorhersagemodell kontinuierlich aus neuen Beobachtungen lernen und kann sich so automatisch an zukünftige Betriebsbedingungen der Pro duktionsanlage anpassen.
Figur 5 veranschaulicht ein exemplarisches Verbesserungsverfahren zum Verbessern von Prozesspa rametereinstellungen zum Erzielen gewünschter Produktqualitätswerte.
Nach Ausführungsmodellen wird zum Zwecke einer Prozessoptimierung basierend auf dem Quali tätsvorhersagemodell f|\/| 120 ein Verfahren zum Bereitstellen von Empfehlungen erstellt für das Ein stellen von Prozessparametern zum Verbessern des Betriebs der Produktionsanlage. Dieses Verfah ren stellt dem Bediener der Produktionsanlage beispielsweise Vorschläge für verbesserte Sollwerte für die Prozessparameter bereit, so dass Zielvorgaben wie Produktqualität, Produktausbeute, Ener gieeffizienz usw. verbessert, insbesondere maximiert, werden können.
Das Verbesserungsverfahren umfasst beispielsweise ein Bereitstellen einer Definition, welche Pro zessparameterwerte vom Bediener der Produktionsanlage zu ändern und zu verbessern sind. Im All gemeinen kann der gesamte Satz an zur Verfügung stehenden Prozessparametern X 500 in die Pro zessparameter C 502 unterteilt werden, die direkt von dem Bediener gesteuert werden können, und Prozessparameter P, welche von dem Bediener nicht direkt gesteuert werden können. Der Satz der steuerbaren Prozessparameter C 502 kann in zwei Gruppen unterteilt werden: die Steuerungs parameter CQ 504, die einen direkten Einfluss auf die Produktqualität haben und die übrigen Steue rungsparameter C \ CQ, die entweder die Produktqualität nicht oder nur über ihre Korrelation mit bereits in CQ definierten Parametern beeinflussen.
Durch eine Kombination aus Wissen über die Produktionsanlage einerseits und maschinellem Ler nen andererseits kann bestimmt werden, welche Prozessparameter aus X 500 zu den Teilmengen 502 und 504 gehören. Die Teilmenge C 502 aller steuerbaren Prozessparameter kann aus X 500 un- ter Verwendung eines regelbasierten Auswahlalgorithmus 501 unter Einbeziehung von Informatio nen 551 über die Produktionsanlage in Form von technischen Dokumentationen der Produktionsan lage, wie etwa Prozessflussdiagramme, Rohrleitungs- und Instrumentierungsdiagramme, Auslöse- und Alarmpläne, Gefahren- und Betriebsfähigkeitsstudien usw. zusammengestellt werden. Bei spielsweise kann zudem Know-how von Technikern und Anlagenbedienern mit einfließen.
Die Teilmenge CQ 504 aller für die Produktqualitätsvorhersage relevanten steuerbaren Prozesspara meter wird beispielsweise mittels eines Suchverfahrens unter Verwendung eines rekursiven Merk malseliminierungsalgorithmus 503 identifiziert. Der Suchprozess verwendet das trainierte Vorher sagemodell fM 120 und vergleicht verschiedene Kombinationen von Teilmengen von C 502 und be wertet jeweils deren Relevanz für die Modellgenauigkeit, d.h. die Genauigkeit der Vorhersage des Vorhersagemodells 120. Ausführungsformen können den Vorteil haben, dass in CQ 504 nur die steu erbaren Prozessparameter berücksichtigt werden, welche am meisten zur Modellgenauigkeit beitra gen.
Nach der Definition der Teilmenge CQ 504 ergibt sich, dass alle anderen Prozessparameter X \ CQ keinen oder nur einen geringen Einfluss auf die Qualitätsvorhersage haben. Beispielsweise wird ein statistisches Maß 555, etwa ein Mittelwert oder eine Verteilungsfunktion verwendet, um diese Pro zessparameter in den nachfolgenden Schritten des Verbesserungsverfahrens zu modellieren. Unter Verwendung einiger Anfangswerte für CQ 504 kann das trainierte Vorhersagemodell fM 120 verwen det werden, um die Produktqualitätsparameterwerte Q 530 aus Eingabedaten X = {cQ, X \ CQ} 500 vorherzusagen.
Die Zielvorgabe, d.h. die gewünschte Qualität des Endprodukts, wird durch einen Vektor Q* 580 be schrieben. Eine skalare Funktion fR 560, welche ein Maß für die Differenz zwischen der vorhergesag ten Qualität und der Zielqualität darstellt, kann in verschiedener Hinsicht festgelegt werden. So kann beispielsweise fR als Summe der quadratischen Entfernung eines aktuell vorhergesagten Pro duktqualitätsvektors Q zum gewünschten Produktqualitätsvektor Q* gemäß Zielvorgabe angegeben werden:
Die Auswirkungen der einzelnen Qualitätsparameter können mit Hilfe eines Gewichtsvektors w ge steuert werden.
Mit dem Vorhersagemodell fM(X) 120, kann die Funktion fR beschrieben werden als: Um einen verbesserten, beispielsweise optimalen Satz von Parameterwerten CQ ZU finden, welche eine geringere bzw. eine geringste Abweichung zu Zielvorgabe Q* aufweisen, wird ein nichtlinearer Optimierungsalgorithmus f0 590 verwendet zum Minimieren von fR,
Hierbei wird CQ 504 iterativ modifiziert (591), um einen Satz von Parameterwerten CQ ZU finden, so dass gilt
^(^M({^-O< X \ CQ}), Q ) — fR(fivi({CQ, X \ CQ}), Q ) für alle CQ.
Als Optimierungsalgorithmus f0 590 wird beispielsweise ein Nelder-Mead-Verfahren bzw. Downhill- Simplex-Verfahren, ein Simplex-Verfahren oder ein L-BFGS-Verfahren (Limited-memory Broyden- Fletcher-Goldfarb-Shanno-Verfahren) verwendet.
Nach Ausführungsformen wird der Parameterraum für CQ 504, in dem der Optimierungsalgorithmus f0 nach einer optimierten Lösung sucht, so eingeschränkt, dass durch den Optimierungsalgorithmus nur physikalisch sinnvolle und in der Produktionsanlage einstellbare Prozessparameterwerte erhal ten werden können. Diese Einschränkungen und andere Hyperparameter des Optimierungsmodells werden bereitgestellt durch Definitionen 593 basierend auf Informationen über allgemeine physika lische Einschränkungen, Einschränkungen der Produktionsanlage und/oder Parameterbereiche in historischen Daten.
Der resultierende Satz von Prozessparameterwerten CQ 592 stellt eine Empfehlung zum Erreichen gewünschter Produktqualitätsparameterwerte Q* 580 dar. Die Ein- und Ausgabe des Optimierungs algorithmus f0 590 kann in eine übergreifende interaktive Benutzeroberfläche 598 integriert wer den. Über eine Eingabefunktion 594 dieser interaktiven Benutzeroberfläche 598 kann ein Nutzer die gewünschten Produktqualitätsparameterwerte Q* 580 eingeben und erhält nach Ausführung der Verbesserungsverfahrens die berechneten Prozessparameterwerten CQ 592 als Ausgabe über eine Ausgabefunktion 596 der interaktiven Benutzeroberfläche 598 zurück.
Figuren 6 zeigen exemplarische Zeitreihendaten von Prozess- und Produktqualitätsparametern für eine exemplarische Polyethylenterephthalat(PET)-Produktionsanlage, für welche der vorgeschla gene Ansatz exemplarisch angewendet werden kann. Figur 6A zeigt einen Auszug von Prozesspara meterwerten 600 aus einem exemplarischen Trainingsdatensatz, welcher auf historischen Betriebs daten einer exemplarischen PET-Anlage beruht. Der Trainingsdatensatz umfasst beispielsweise 495 Prozessparameter, von denen in Figur 6A aus Gründen der Übersichtlichkeit 13 Prozessparameter gezeigt sind. Figur 6B zeigt Produktqualitätsparameter 640 aus demselben exemplarischen Trai ningsdatensatz. Der Trainingsdatensatz umfasst 13 Produktqualitätsparameter zu denen in Figur 6B jeweils Produktqualitätsparameterwerte gezeigt werden, welche die Qualität des Endprodukts quantitativ beschreiben. Die meisten Prozessparameter wurden beispielsweise mit einer Häufigkeit von 1 Stunde abgetastet, während Labormessungen der Produktqualitätsparameter alle 4 bis 24 Stunden durchgeführt wurden. Im Zuge eines Trennungsverfahrens zum Trainieren eines Vorher sagemodells nach einer der hierin beschriebene Ausführungsformen wird der Trainingsdatensatz unter Verwendung statistischer Kennzahlen und Prozessspezifikationen bereinigt. Anschließend werden die Prozessdatenparameterwerte um eine Zeitverzögerung von 4 bis 24 Stunden verscho ben, wobei für jede Prozesseinheit unter Verwendung von Informationen über den Prozessablauf individuelle Verzögerungen angewendet werden. Die zeitlich verschobenen Prozessdatenparame terwerte werden jeweils zu Gruppen von 2 Stunden aggregiert. Für diese Gruppen werden jeweils Merkmalswerte extrahiert. Zu den extrahierten Merkmalswerten gehören beispielsweise Mittel wert, Standardabweichung und in einigen Fällen die Differenz von Gruppe zu Gruppe. Alle Merk malswerte sind normiert. Für normalverteilte Merkmalswerte wird beispielsweise eine z-Normali- sierung verwendet, d.h. Erwartungswert 0 und deren Varianz/Standardabweichung 1, während für binäre verteilte Merkmale beispielsweise eine Min-Max-Normalisierung verwendet wird. Die Di- mensionalität der 495*3 Merkmalsparameter wird durch eine Flauptkomponentenanalyse und ein Vernachlässigen unbedeutender Komponentenbeiträge auf etwa 50 Dimensionen reduziert. Die Da ten werden in drei statistisch unabhängige Stichproben unterteilt, d.h. einen Trainingsdatensatz, einen Testdatensatz und einen Validierungsdatensatz unterteilt. Der so resultierende Trainingsda tensatz umfasst 70% der Datenpunkte, der Testdatensatz 25% und der Validierungsdatensatz die restlichen 5% der Datenpunkte. Als künstliches neuronales Netz wird beispielsweise ein mehrschich tiges neuronales Perzeptron-Neuronennetz verwendet, das aus zwei verborgenen Schichten („Hid- den Layer") mit maximal 200 Knoten und einer gleichgerichteten Aktivierungsfunktion für den Ein gang und die verborgenen Schichten besteht. Zusätzlich werden beispielsweise Regularisierungsmo delle, insbesondere Lasso-Regression und Ridge-Regression, angewendet. Das Training des Vorher sagemodells erfolgt iterativ unter Verwendung des Adam-Optimierers, indem ein mittlerer quadra tischer Fehler der Ausgabe des neuronalen Netzes im Vergleich zu den Wahrheitswerten des Trai ningsdatensatzes minimiert wird. Die iterative Minimierung wird beispielsweise für eine maximale Anzahl von 1000 Epochen durchgeführt. Es wird jedoch ein Frühstoppkriterium durchgesetzt, um sicherzustellen, dass die Verlustfunktion der gleichzeitig ausgewerteten Validierungsprobe minimal ist und ein Erlernen von statistischen Schwankungen in der Trainingsprobe vermieden wird.
Figur 7 zeigt einen Vergleich von vorhergesagten und retrospektiv gemessenen Produktqualitäts werten. Anhand des hohen Übereinstimmungsgrads lässt sich die von dem Vorhersagemodell er reichte hohe Maß an Präzision der Vorhersagen ablesen.
Das trainierte Vorhersagemodell f^ wurde an dem unabhängigen Testdatensatz ausgewertet, wo bei festgestellt wurde, dass das Vorhersagemodell f^ die Zusammenhänge zwischen Prozesspara meterwerten und Produktqualitätsparametern des Testdatensatzes präzise beschreibt. Figur 7 zeigt die gemessenen Produktqualitätsparameterwerte 700 des Testdatensatzes, die von dem trainierten Vorhersagemodell f^ unter Verwendung der Prozessparameterwerte des Testdatensatzes vorherge sagte Produktqualitätsparameterwerte 730 sowie die jeweiligen Vertrauensintervalle 735 für die Vorhersagen mit dem trainierten Vorhersagemodell f|^. Für ein Verfahren zum Bereitstellen von Verbesserungsempfehlungen unter Verwendung des trai nierten Vorhersagemodells fM wird eine Teilmenge von beispielsweise 45 steuerbaren Prozesspara metern CQ mit Hilfe von Informationen über die Prozesskonfiguration und einem Feature-Eliminie- rungsalgorithmus basierend auf dem Vorhersagemodells fM bestimmt. Um einen optimierten Satz von Prozessparameterwerten zum Erreichen gewünschter Produktqualitätsparameterwerte Q*, bei spielsweise fünf Qualitätsparameter und die Anlagenkapazität, zu bestimmen, wird eine numeri sche Zielfunktion fR definiert als die quadratische Summe der Abweichungen aller vorhergesagten Produktqualitätsparameterwerte Q von den gewünschten Produktqualitätsparameterwerten Q*, jeweils gewichtet mit einem individuellen Faktor w. Die Zielfunktion wird mit dem nichtlinearen Nelder-Mead-Minimierungsalgorithmus minimiert. Um die Konvergenzzeit der Minimierung zu ver bessern, werden die Ausgangsparameter für die Minimierungen aus dem historischen Datensatz er mittelt. Als Empfehlung werden jeweils die Mittelwerte der Prozessparameterwerte gewählt, die im Vergleich der gewünschten Produktqualitätsparameterwerten in den besten Produktqualitätspara meterwerten resultieren, d.h. den gewünschten Produktqualitätsparameterwerten am nächsten kommen. Beispielsweise konvergiert der Algorithmus typischerweise innerhalb weniger tausend Ite rationen.
Figur 8 veranschaulicht eine exemplarischen Nutzeroberfläche 598 zur Eingabe gewünschter Pro duktqualitätswerte Q* 594 und zum Bereitstellen von Empfehlungen für verbesserte Prozesspara metereinstellungen zum Erreichen der gewünschten Produktqualitätsparameterwerte. Die Nutzer oberfläche 598 ermöglicht es dem Anlagenbediener, direkt mit dem Optimierungsmodell zu intera gieren. Dazu stellt die Nutzeroberfläche 598 ein Eingabemodul 820 bereit, über welches der Bedie ner eine gewünschte Produktqualität Q* 594 auswählen kann durch Eingabe bzw. Auswahl eines Produktqualitätsparameterwertes 821 und des Toleranzbereichs 822 für den Produktqualitätspara meterwert 821. Nach Empfang der Angabe der Produktqualität Q* 594 wird das Verfahren zum Be reitstellen von Verbesserungsempfehlungen, wie es beispielsweise in der Figur 7 beschrieben wird, ausgeführt, bis ein optimierter Satz von steuerbaren Prozessparametern CQ gefunden ist. Dieser Satz von steuerbaren Prozessparametern CQ umfasst beispielsweise optimierte Einstellungen für jeden der, beispielsweise 45, Prozessparameter, welche in Segment 596 der Nutzeroberfläche ange zeigt wird. Die Ausgabe der optimierten Einstellungen umfasst für jeden der steuerbaren Prozesspa rameter CQ ein Ausgabemodul 840, welches einen empfohlenen Prozessparameterwert 842 um fasst. Zusätzlich zu dem empfohlenen Prozessparameterwert 842 kann das Ausgabemodul 840 zu Veranschaulichungszwecken optional einen graphischen Vergleich, beispielsweise unter Verwen dung von Histogrammen, des empfohlenen Prozessparameterwerts 842 mit den historisch verwen deten Prozessparameterwerten 843 umfassen.
Figur 9 veranschaulicht eine schematische Struktur eines exemplarischen künstlichen neuronalen Netzes, welches als Machine-Learning-Modul 216 verwendet werden kann. Bei dem gezeigten künstlichen neuronalen Netz handelt es sich um das bereits im Kontext der Figur 6 beschriebenen mehrschichtigen neuronalen Perzeptron-Neuronennetz mit einer Eingabeschicht X, einer Ausgabe schicht Y, sowie zwei verborgenen Schichten („Hidden Layer") Hi und H2. Für die Eingabeschicht und die verborgenen Schichten wird jeweils eine gleichgerichtete Aktivierungsfunktion verwendet. Es wird eine Mehrzahl von m Trainingssamples bzw. Trainingsdatensätzen, beispielsweise mehrere hundert (z.B. m = 907), bereitgestellt. Jeder der Trainingsdatensätze umfasst Trainingsprozesspara meterwerte X={x]}=(x1, ...,xm) für eine Mehrzahl von n Prozessparametern, beispielsweise mehrere hundert (z.B. n = 493), mit i = 1, ..., n und j = 1, ..., m. Ferner umfassen die Trainingsdatensätze Pro duktqualitätsparameterwerte Y={xJ k}=(y1, ..., ym) für eine Mehrzahl von I Produktqualitätsparame tern, beispielsweise I = 10, mit k = 1, ..., I und j = 1, ..., m. Die Trainingsprozessparameterwerte C={c|}=(c1, ...,c1Ώ) werden als Eingabedaten für die Eingabeschicht verwendet, wozu sie beispiels- weise unter Verwendung einer Z-Normalisierung norm skaliert werden, mit xi= jx| / m und Die Produktqualitätsparameterwerte werden als durch das künstliche neu ronale Netz vorherzusagende Ausgabedaten bereitgestellt. Aufgrund der Z-Normalisierung der Ein gabedaten, ist auf die aus dem künstlichen neuronalen Netz resultierenden Werte eine inverse Z-
Normalisierung yJ k=y^+norm(yJ k) ok mit y^= j Xk / m und ak= Xj(x{ - xj ) / m anzuwenden, damit die Ergebnisse mit den als Ausgabedaten bereitgestellten Produktqualitätsparameterwerten ver gleichbar sind. Im Zuge des künstlichen neuronalen Netzes werden Gewichtungsfaktoren WH1, WH2, WY der Verbindungen zwischen den Knoten der Schichten angepasst, so dass bei einem Durchlauf der Eingabedaten X durch das künstliche neuronale Netz, diese von Schicht zu Schicht, d.h. auf der ersten verborgenen Schicht H1=Xi=1...n w^ -u xj und der zweiten verborgenen Schicht H2= X=i...u wu ..v h'i- so verarbeitet werden, dass sie auf der Ausgabeschicht in Ausgabedatenwerten U= resultieren, welche nach einer Rückskalierung, beispielsweise in Form der inver sen Z-Normalisierung mit den Trainingsproduktqualitätsparametern übereinstimmen.
Figur 10 veranschaulicht schematisch eine exemplarische chemische Produktionsanlage 900, welche aus einer Mehrzahl von chemischen Edukten 910, 912 ein chemisches Produkt 920 herstellt. Die Edukte 910, 912 können dem Prozess initial oder zu unterschiedlichen Zeitpunkten im Verlauf des Prozesses zugeführt werden. Aus den Edukten 910, 912 kann direkt das Produkt 920 hergestellt werden, oder es werden ein oder mehrere Zwischenprodukte hergestellt, aus welchen das Produkt 920 als Endprodukt hergestellt wird. Das Produkt 920 kann analysiert werden zum Bestimmen von Produktqualitätsparameterwerten QW. Wenn die Edukte 910, 912 unterschiedliche Prozessstufen innerhalb der Produktionsanlage 900 durchlaufen, werden Prozessparameterwerte von ein oder mehreren Prozessparametern PW1 bis PWn durch Sensoren S1 bis Sn der Produktionsanlage 900 erfasst. Diese Prozessparameterwerte PW1 bis PWn werden zu identischen und/oder verschiede nen Zeiten TI bis Tn erfasst. Dem aus den Edukten 910, 912 hergestellten Produkt ist eine Fierstel lungszeit Tq, beispielsweise der Zeitpunkt der Fertigstellung des Produkts zugeordnet. Anhand von Informationen über die Produktionsanlage und den von der Produktionsanlage ausgeführten Pro zess kann für jeden der Sensoren S1 bis Sn jeweils eine sensorspezifische zeitliche Verschiebung zwi schen einem Zeitpunkt TI bis Tn eines Erfassens eines Prozessparameterwerts PW1 bis PWn durch den entsprechenden Sensor S1 bis Sn und einem Fertigstellen einer Einheit des Produkts 920, wäh rend deren Fierstellung der entsprechende Prozessparameterwerte PW1 bis PWn erfasst wurde. So- mit lassen sich die erfassten Prozessparameterwerte PW1 bis PWn unter Verwendung der sensor spezifischen zeitlichen Verschiebungen zeitlich den Produkteinheiten zuordnen deren Produktions prozess sie beschreiben bzw. beeinflusst haben. Dies zeitlichen Verschiebungen können unabhängig von den erfassten Prozessparameterwerte PW1 bis PWn sein oder von einem oder mehreren dieser Prozessparameterwerte abhängen. Umfassen die Prozessparameterwerte beispielsweise einen Wert für eine Durchflussgeschwindigkeit einer Materialkomponente zum Herstellen des Produkts 920 durch ein Rohr, so kann die zeitliche Verschiebung der Erfassungszeiten flussaufwärts angeord neter Sensoren gegenüber dem Fertigstellungszeitpunkt Tq des Produkts 920 von der Zeit abhän gen, welche die Materialkomponente bzw. ein für den Prozess notwendiger Teil der Materialkom ponente zum Durchfluss durch das Rohr benötigt. Bei dem Prozess kann es sich um einen Batchpro zess handeln, in welchem vordefinierte Batches der Edukte 910, 912 bereitgestellt werden und aus diesen ein Batch des Produkts 920 hergestellt wird. In diesem Fall kann es sich bei einer Produktein heit beispielsweise um einen Batch des Produkts 920 handeln. Alternativ kann es sich um einen kon tinuierlichen Produktionsprozess handeln, bei welchem Edukte 910, 912 als kontinuierliche Materi alströme zugeführt und das hergestellte Produkt als ein kontinuierlicher Materialstrom gewonnen wird. In diesem Fall kann es sich bei einer Produkteinheit beispielsweise um eine Stichprobe aus dem Produktmaterialstrom handeln.
Figur 11 veranschaulicht ein Verfahren zum Trainieren eines Machine-Learning-Moduls, beispiels weise eines künstlichen neuronalen Netzes, eines computerimplementierten Vorhersagemodells zum Vorhersagen von Produktqualitätsparameterwerten für ein oder mehrere Qualitätsparameter eines durch eine chemische Produktionsanlage hergestellten chemischen Produkts, wie sie bei spielsweise schematisch in Figur 10 veranschaulicht wird. Die Produktionsanlage umfasst eine Mehrzahl von Sensoren t, welche jeweils dazu konfiguriert sind im Betrieb der Produktionsanlage Prozessparameterwerte für ein oder mehrere Prozessparameter eines von der Produktionsanlage ausgeführten chemischen Prozesses zur Herstellung des chemischen Produkts zu erfassen.
In Block 1000 werden Trainingsdaten für das Trainieren des Machine-Learning-Moduls bereitge stellt. Diese Trainingsdaten umfassen für eine Mehrzahl von durch die Produktionsanlage herge stellten Produkteinheiten jeweils für ein oder mehrere Qualitätsparameter der jeweiligen Produkt einheit bestimmte Produktqualitätsparameterwerte als Trainingsproduktqualitätsparameterwerte. Diese Produktqualitätsparameterwerte werden beispielsweise im Zuge einer Qualitätsanalyse her gestellter Produkteinheiten, etwa in einem Labor, bestimmt. Diesen Trainingsproduktqualitätspara meterwerten ist beispielsweise jeweils eine Herstellungszeit der Produkteinheit, für welche sie be stimmt wurden, zugeordnet. Ferner können die Trainingsdaten von jedem der Sensoren jeweils eine Mehrzahl von Prozessparameterwerte als Trainingsprozessparameterwerte umfassen, welche wäh rend der Herstellung der Produkteinheiten erfasst wurden, für welche die Trainingsproduktquali tätsparameterwerten bestimmt wurden. Den Trainingsprozessparameterwerten sind beispielsweise jeweils eine Erfassungszeit und ein Identifikator des erfassenden Sensors zugeordnet.
In Block 1002 werden a priori Informationen über die Produktionsanlage und den von der Produkti onsanlage ausgeführten Prozess zusammengefasst. Diese a priori Informationen umfassen zeitliche Ablaufinformationen über einen zeitlichen Ablauf des ausgeführten Prozesses innerhalb der Pro duktionsanlage.
In Block 1004, wird für jeden der Sensoren jeweils eine sensorspezifische zeitliche Verschiebung zwischen einer Erfassungszeit eines der durch den entsprechenden Sensor erfassten Trainingspro zessparameterwerte und einer Herstellungszeit der Produkteinheit, während deren Herstellung der entsprechende Trainingsprozessparameterwert erfasst wurde, bestimmt. Diese Verschiebung kann von ein oder mehreren der gewählten Prozessparameterwerten abhängen oder von diesen unab hängig sein. Das Bestimmen erfolgt jeweils unter Verwendung der zeitlichen Ablaufinformationen und die bestimmten sensorspezifischen zeitlichen Verschiebungen der Sensoren werden jeweils den durch den jeweiligen Sensor erfassten Trainingsprozessparameterwert zugordnet.
In Block 1006 werden die Trainingsprozessparameterwerte jeweils zu den ein oder mehreren Trai ningsproduktqualitätsparameterwerten einer der Produkteinheiten zugeordnet, während deren Herstellungsprozess der jeweilige Trainingsprozessparameterwert erfasst wurde. Das Zuordnen er folgt unter Verwendung der Erfassungszeit des jeweiligen Trainingsprozessparameterwerts, der sensorspezifischen zeitlichen Verschiebung des den jeweiligen Trainingsprozessparameterwert er fassenden Sensors und der Herstellungszeit der jeweiligen Produkteinheit.
In Block 1008 wird schließlich das Machine-Learning-Modul unter Verwendung der einander zuge ordneten Trainingsprozessparameterwerte und Trainingsproduktqualitätsparameterwerte trainiert. Dabei werden die jeweiligen Trainingsproduktqualitätsparameterwerte zum Bereitstellen von Aus gabedaten und die jeweils zugeordneten Trainingsprozessparameterwerte zum Bereitstellen von Eingabedaten des Machine-Learning-Moduls für das Trainieren verwendet.
Figur 12 zeigt ein exemplarisches Computersystem 930 zum Trainieren eines Machine-Learning-Mo- duls eines computerimplementierten Vorhersagemodells 210 zum Vorhersagen von Produktquali tätsparameterwerten. Das Computersystem 930 umfasst einen Prozessor 932 und einen Speicher 934. In dem Speicher 934 ist beispielsweise das zu trainierende Vorhersagemodell 210 gespeichert. Ferner sind in dem Speicher Programminstruktionen gespeichert, deren Ausführen der durch den Prozessor 932 das Computersystem 930 dazu veranlassen, ein Verfahren zum Trainieren des Vor hersagemodells 210 auszuführen. Das Computersystem 930 kann ferner eine Nutzerschnittstelle 936 umfassen, welche Eingabe- und Ausgabevorrichtungen für eine Interaktion eines Nutzers mit dem Computersystem 930 bereitstellt. Ferner kann das Computersystem 930 eine Kommunikati onsschnittstelle 939 umfassen, über welche das Computersystem 930 Trainingsdaten zum Trainie ren des Vorhersagemodells 210 empfangen kann. Diese Trainingsdaten umfassen Prozessparame terwerte 200, welche von Sensoren 946 einer von einem Steuersystem 942 gesteuerten Produkti onsanlage 900 erfasst wurden, sowie von einem Analysesystem 950, etwa in einem Labor, be stimmte Produktqualitätsparameterwerte 240 von Produkteinheit, für deren Herstellungsprozess die Prozessparameterwerte 200 erfasst wurden. Die Prozessparameterwerte 200 werden beispiels weise in einer Speichervorrichtung 944 der Produktionsanlage 900 gespeichert und dem Computer system 930 über eine Kommunikationsverbindung, z.B. über ein Netzwerk, bereitgestellt. Alternativ kann das Computersystem 930 auch Bestandteil der Produktionsanlage 900, etwa von deren Steu ersystem 942, sein. Nach einer weiteren alternativen Ausführungsform werden die Prozessparame terwerte 200 in einer externen Speichervorrichtung, etwa in der Cloud, gespeichert, aus welcher das Computersystem 930 die Prozessparameterwerte 200 herunterladen kann. Die Produktquali- tätsparameterwerte 240 werden beispielsweise in einer Speichervorrichtung 954 des Analysesys tems 950 gespeichert und dem Computersystem 930 über eine Kommunikationsverbindung, z.B. über ein Netzwerk, bereitgestellt. Alternativ werden die Produktqualitätsparameterwerte 240 in ei ner externen Speichervorrichtung, etwa in der Cloud, gespeichert, aus welcher das Computersystem 930 die Produktqualitätsparameterwerte 240 herunterladen kann.
Nachdem das Vorhersagemodell 210 trainiert ist, kann das Computersystem 930, das trainierte Vor hersagemodell zum Vorhersagen von Produktqualitätsparameterwert aktuell durch die Produkti onsanlage 900 hergestellter Produkteinheiten nutzen. Ferner kann das trainierte Vorhersagemodell zum Detektieren von Anomalien und zum Bestimmen von Empfehlungen zum Einstellen von Pro- zessparameterwerten zum erzielen gewünschter Zielproduktqualitätsparameterwerte verwendet werden. Schließlich kann das Computersystem 930 dazu konfiguriert sein, dass trainierte Vorher sagemodell unter Verwendung weiterer Trainingsdaten zusätzlich zu trainieren. Insbesondere kann so ein kontinuierliches Trainieren des Vorhersagemodells implementiert werden.
Bezugszeichenliste
100 Prozessparameterwerte
120 Trainiertes Vorhersagemodel
121 Datenbereinigungsmodul
122 Datenaggregationsmodul
123 Merkmalsextraktionsmodul
124 Datennormalisierungsmodul
125 Hauptkomponentenanalysemodul
126 Machine-Learning-Modul
127 Normalisierungsmodul
130 vorhergesagte Produktqualitätsdaten 200 Trainingsprozessparameterwerte
210 untrainiertes Vorhersagemodul
211 Datenbereinigungsmodul
212 Datenaggregationsmodul
213 Merkmalsextraktionsmodul
214 Datennormalisierungsmodul
215 Hauptkomponentenanalysemodul
216 Machine-Learning-Modul
217 Datennormalisierungsmodul
240 gemessene Trainingsproduktqualitätsparameterwerte 245 Trainingsdatensatz
250 a priori Zusatzinformationen
251 a priori Zusatzinformationen (Datenbereinigung)
252 a priori Zusatzinformationen (Datenaggregation)
253 a priori Zusatzinformationen (Merkmalsextraktion)
254 a priori Zusatzinformationen (Datennormalisierung)
255 a priori Zusatzinformationen (Hauptkomponentenanalyse)
256 a priori Zusatzinformationen (Machine-Learning)
257 a priori Zusatzinformationen (Datennormalisierung)
340 gemessene Produktqualitätsparameterwerte 360 Klassifizierungsfunktion 362 Anomalieereignis
420 zusätzlich trainiertes Vorhersagemodel
421 Datenbereinigungsmodul
422 Datenaggregationsmodul
423 Merkmalsextraktionsmodul
424 Datennormalisierungsmodul
425 Hauptkomponentenanalysemodul
426 Neuronales-Netz-Modul
427 Normalisierungsmodul 460 Klassifizierungsfunktion 462 Eingabe
464 Ausgabe
500 Prozessparameterwerte
501 Auswahlalgorithmus
502 steuerbare Prozessparameter
503 Merkmalseliminierungsalgorithmus
504 steuerbare Prozessparameter (Einfluss auf Qualitätsvorhersage) 530 Produktqualitätsparameterwerte
551 Informationen über Produktionsanlage 555 statistisches Maß 560 skalare Funktion
580 gewünschte Produktqualitätsparameterwerte
590 Optimierungsalgorithmus
591 iteratives Anpassen
592 empfohlene Prozessparameterwerte
593 Einschränkungen
594 Eingabefunktion 596 Ausgabefunktion 598 Benutzeroberfläche 600 Prozessparameterwerte
640 Produktqualitätsparameterwerte
700 gemessener Produktqualitätsparameterwert 730 vorhergesagter Produktqualitätsparameterwert 735 Vertrauensintervall
820 Eingabemodul
821 Produktqualitätsparameterwert 822 Toleranzbereich
840 Ausgabemodul
842 empfohlener Prozessparameterwert
843 verwendete Prozessparameterwerte 900 Produktionsanlage 910 Edukt
912 Edukt 920 Produkt 930 Computersystem 932 Prozessor 934 Speicher
936 Nutzerschnittstelle 938 Kommunikationsschnittstelle 942 Steuersystem 944 Speicher 946 Sensoren
950 Qualitätsanalysesystem 952 Computersystem 954 Speicher

Claims

Patentansprüche
1. Verfahren zum Trainieren eines Machine-Learning-Moduls (216) eines computerimplemen tierten Vorhersagemodells (210) zum Vorhersagen von Produktqualitätsparameterwerten für ein oder mehrere Qualitätsparameter eines durch eine chemische Produktionsanlage (900) hergestell ten chemischen Produkts (920), wobei die Produktionsanlage eine Mehrzahl von Sensoren (946) umfasst, welche jeweils dazu konfiguriert sind, im Betrieb der Produktionsanlage Prozessparameter werte für ein oder mehrere Prozessparameter eines von der Produktionsanlage ausgeführten che mischen Prozesses zur Herstellung des chemischen Produkts zu erfassen, wobei das Verfahren um fasst:
• Bereitstellen von Trainingsdaten (245), wobei die Trainingsdaten für eine Mehrzahl von durch die Produktionsanlage hergestellten Produkteinheiten jeweils für ein oder mehrere Qualitäts parameter der jeweiligen Produkteinheit bestimmte Produktqualitätsparameterwerte als Trainingsproduktqualitätsparameterwerte (240) umfasst, wobei den Trainingsproduktquali tätsparameterwerten jeweils eine Herstellungszeit der Produkteinheit zugeordnet ist, für wel che sie bestimmt wurden, wobei die Trainingsdaten ferner von jedem der Sensoren jeweils eine Mehrzahl von Pro zessparameterwerte als Trainingsprozessparameterwerte (200) umfassen, welche während der Herstellung der Produkteinheiten erfasst wurden, für welche die Trainingsproduktquali tätsparameterwerten bestimmt wurden, wobei den Trainingsprozessparameterwerten je weils eine Erfassungszeit und ein Identifikator des erfassenden Sensors zugeordnet sind,
• Bereitstellen von a priori Informationen über die Produktionsanlage und den von der Produk tionsanlage ausgeführten Prozess, wobei die a priori Informationen zeitliche Ablaufinformati onen über einen zeitlichen Ablauf des ausgeführten Prozesses innerhalb der Produktionsan lage umfassen,
• für jeden der Sensoren jeweils Bestimmen einer sensorspezifischen zeitlichen Verschiebung zwischen einer Erfassungszeit eines der durch den entsprechenden Sensor erfassten Trai ningsprozessparameterwerte und einer Herstellungszeit der Produkteinheit, während deren Herstellung der entsprechende Trainingsprozessparameterwert erfasst wurde, wobei das Be stimmen jeweils unter Verwendung der zeitliche Ablaufinformationen erfolgt, wobei die be stimmten sensorspezifischen zeitlichen Verschiebungen der Sensoren jeweils den durch den jeweiligen Sensor erfassten Trainingsprozessparameterwert zugordnet werden,
• Zuordnen der Trainingsprozessparameterwerten jeweils zu den ein oder mehreren Trainings produktqualitätsparameterwerten einer der Produkteinheiten, während deren Herstellungs prozess der jeweilige Trainingsprozessparameterwert erfasst wurde, unter Verwendung der Erfassungszeit des jeweiligen Trainingsprozessparameterwerts, der sensorspezifischen zeitli chen Verschiebung des den jeweiligen Trainingsprozessparameterwert erfassenden Sensors und der Herstellungszeit der jeweiligen Produkteinheit,
• Trainieren des Machine-Learning-Moduls unter Verwendung der einander zugeordneten Trai ningsprozessparameterwerte und Trainingsproduktqualitätsparameterwerte, wobei die je weiligen Trainingsproduktqualitätsparameterwerte zum Bereitstellen von Ausgabedaten und die jeweils zugeordneten Trainingsprozessparameterwerte zum Bereitstellen von Eingabeda ten des Machine-Learning-Moduls für das Trainieren verwendet werden.
2. Verfahren nach Anspruch 1, wobei die sensorspezifischen zeitlichen Verschiebungen ein o- der mehreren der Sensoren abhängig sind von Trainingsprozessparameterwerten, welche von ei nem oder mehreren im Prozessablauf nachgeordneten Sensoren erfasst wurden, und die entspre chenden Trainingsprozessparameterwerten jeweils zum Bestimmen der jeweiligen von diesen ab hängigen sensorspezifischen zeitlichen Verschiebungen verwendet werden.
3. Verfahren nach einem der voranstehenden Ansprüche, wobei es sich bei den Herstellungs zeiten der Produkteinheiten jeweils um eine Abschlusszeit des von der Produktionsanlage zum Her stellen der entsprechenden Produkteinheit ausgeführten Prozesses handelt.
4. Verfahren nach einem der voranstehenden Ansprüche, wobei das Verfahren ferner ein Be reinigen der bereitgestellten Trainingsprozessparameterwerte umfasst, wobei das Bereinigen ein oder mehrere der folgenden Datenbearbeitungsschritte umfasst:
• Entfernen von Ausreißerwerten aus den Trainingsprozessparameterwerten,
• Entfernen unphysikalischer Werte aus den Trainingsprozessparameterwerten, und/oder
• Ergänzen fehlender Trainingsprozessparameterwerte, wobei zum Identifizieren fehlender Trainingsprozessparameter die Trainingsdaten auf Vollständigkeit geprüft werden unter Ver wendung von a priori Vollständigkeitsinformationen, welche festlegen von welchen Sensoren der Produktionsanlage und für welche Prozessparameter die Trainingsdaten Trainingspro zessparameterwerte umfassen sollen.
5. Verfahren nach einem der voranstehenden Ansprüche, wobei das Verfahren ferner für ein oder mehrere Sensoren jeweils ein Aggregieren der von dem jeweiligen Sensor erfassten Trainings prozessparameterwerte umfasst, wobei die entsprechenden Trainingsprozessparameterwerte unter Verwendung der jeweils zugeordneten Erfassungszeiten einem Aggregationszeitfenster zugeordnet werden, wobei einem gemeinsamen Aggregationszeitfester zugeordnete Prozessparameterwerte jeweils aggregiert werden.
6. Verfahren nach Anspruch 5, wobei die sensorspezifischen zeitlichen Verschiebungen der Sensoren, deren Trainingsprozessparameterwerte aggregiert werden, jeweils für die Aggregations fenster bestimmt und den aggregierten Trainingsprozessparameterwerte desjeweiligen Aggregati onsfenster zugeordnet werden.
7. Verfahren nach einem der voranstehenden Ansprüche, wobei das Bereitstellen von Einga bedaten ferner ein Extrahieren von statistischen Merkmalswerten und/oder Frequenzmerkmals werten aus den Trainingsprozessparameterwerten zum Trainieren des Machine-Learning-Moduls umfasst.
8. Verfahren nach Anspruch 7, wobei das Bereitstellen von Eingabedaten ferner ein Skalieren der extrahierten Merkmalswerte zum Trainieren des Machine-Learning-Moduls umfasst.
9. Verfahren nach Anspruch 8, wobei das Bereitstellen von Ausgabedaten ein Skalieren der Trainingsproduktqualitätsparameterwerte umfasst.
10. Verfahren nach einem der Ansprüche 7 bis 9, wobei das Bereitstellen von Eingabedaten fer ner ein Reduzieren der Dimensionalität extrahierten Merkmalswerte unter Verwendung einer Transformation der extrahierten Merkmalswerte umfasst.
11. Verfahren nach einem der vorangehenden Ansprüche, wobei das Verfahren ferner ein Zu ordnen von Gewichtungsfaktoren des Machine-Learning-Moduls, welche für ein Gewichten von extrahierten Merkmalen verwendet werden, welche auf Trainingsprozessparameter beruhen, die für identische Prozessparameter von Sensoren erfasst wurden, welche innerhalb desselben Teilsys tems der Produktionsanlage angeordnet sind, zu einer gemeinsamen Gewichtungsgruppe umfasst, wobei Gewichtungsfaktoren derselben Gewichtungsgruppe gleichgesetzt und gemeinsam trainiert werden.
12. Verfahren nach einem der vorangehenden Ansprüche, wobei ein oder mehrere anwen dungsindividuellen Verlustfunktion zur Verwendung durch das Machine-Learning-Modul bereitge stellt werden, um selektiv spezifische Vorhersagefehler im Zuge des Trainings stärker zu gewichten als andere Vorhersagefehler.
13. Verfahren nach einem der vorangehenden Ansprüche, wobei neben den Trainingsdaten Testdaten als zweite statistisch unabhängige Stichprobe bereitgestellt werden, welche Testpro zessparameterwerte und Testproduktqualitätsparameterwerte umfassen, wobei die Testaten zum Testen der Vorhersagepräzision des Vorhersagemodells mit dem mit den Trainingsdaten trainierten Machine-Learning-Modul verwendet werden, wobei das Testen ein Vorhersagen von Produktquali tätsparameterwerte unter Verwendung der Testprozessparameterwerte und ein Vergleichen der resultierenden vorhergesagten Produktqualitätsparameterwerte mit den erwarteten Testprodukt qualitätsparameterwerte umfasst, wobei im Falle von stark variierender Betriebsbedingungen der Produktionsanlage unter de nen die Trainingsdaten und Testdaten erstellten werden, die Trainingsdaten und Testdaten so zu sammengestellt, dass die verschiedenen Betriebsbedingungen in den Trainingsdaten und Testdaten jeweils proportional gleich vertreten sind.
14. Verfahren nach einem der vorangehenden Ansprüche, wobei das Machine-Learning-Modul ein künstliches neuronales Netz umfasst.
15. Verfahren nach einem der vorangehenden Ansprüche, wobei es sich bei der Produktionsan lage um eine Polymerproduktionsanlage zur Herstellung eines Polymerprodukts handelt.
16. Verfahren zum Vorhersagen von Produktqualitätsparameterwerten (130) für ein oder meh rere Qualitätsparameter eines durch eine chemische Produktionsanlage (900) hergestellten chemi schen Produkts (920) unter Verwendung eines computerimplementierten Vorhersagemodells (120) mit einem nach einem der voranstehenden Ansprüchen trainierten Machine-Learning-Modul (126), wobei die Produktionsanlage eine Mehrzahl von Sensoren (946) umfasst, welche jeweils dazu konfi guriert sind im Betrieb der Produktionsanlage Prozessparameterwerte für ein oder mehrere Pro zessparameter eines von der Produktionsanlage ausgeführten chemischen Prozesses zur Herstel lung des chemischen Produkts zu erfassen, wobei das Verfahren umfasst:
• Bereitstellen einer Mehrzahl von den Sensoren im Betrieb der Produktionsanlage erfassten Prozessparameterwerten (100), wobei den Prozessparameterwerten jeweils eine Erfassungs zeit und ein Identifikator des erfassenden Sensors zugeordnet sind,
• Bereitstellen von a priori Informationen über die Produktionsanlage und den von der Produk tionsanlage ausgeführten Prozess, wobei die a priori Informationen zeitliche Ablaufinformati onen über einen zeitlichen Ablauf des ausgeführten Prozesses innerhalb der Produktionsan lage umfassen,
• für jeden der Sensoren jeweils Bestimmen einer sensorspezifischen zeitlichen Verschiebung zwischen den Erfassungszeiten der durch den entsprechenden Sensor erfassten Prozesspara meterwerte und einer Herstellungszeit einer Produkteinheit, für welche Produktqualitätspa rameterwerte vorhergesagt werden sollen und während deren Herstellung die jeweiligen Prozessparameterwert erfasst wurden, wobei das Bestimmen jeweils unter Verwendung der zeitliche Ablaufinformationen erfolgt, wobei die bestimmten sensorspezifischen zeitlichen Verschiebungen der Sensoren jeweils den durch den jeweiligen Sensor erfassten Prozesspara meterwert zugordnet werden,
• zueinander Zuordnen jeweils derjenigen Prozessparameterwerte, welche während der Her stellung derselben Produkteinheit erfasst wurden, wobei die zu aggregierenden Prozesspara meterwerte unter Verwendung der sensorspezifischen zeitlichen Verschiebung bestimmt werden,
• Verwenden jeweils der einander zugeordneten Prozessparameterwerte zum Bereitstellen von Eingabedaten des trainierten Machine-Learning-Moduls für ein Vorhersagen von ein oder mehreren Produktqualitätsparameterwerten,
• Empfangen von ein oder mehreren unter Verwendung des trainierten Machine-Learning-Mo- duls für die Produkteinheit, während deren Herstellung die zum Bereitstellen der Eingabeda ten verwendeten Produktqualitätsparameterwerte erfasst wurden, vorhergesagten Produkt qualitätsparameterwerten als Ausgabe des Vorhersagemodells.
17. Verfahren nach Anspruch 16, wobei das Verfahren ein zusätzliches Trainieren des trainier ten Machine-Learning-Moduls umfasst, wobei das zusätzliche Trainieren umfasst:
• Bereitstellen von Produktqualitätsparameterwerten als zusätzliche Trainingsproduktqualitäts parameterwerte, welche unter Verwendung von ein oder mehreren der von Produktionsan lage hergestellten Produkteinheiten bestimmt wurden, für welche Produktqualitätsparame terwerte vorhergesagt wurden, • Zuordnen der bereitgestellten Prozessparameterwerte, welche während der Herstellung der jeweiligen Produkteinheiten erfasst wurden, für welche die zusätzlichen Trainingsprodukt qualitätsparameterwerte bereitgestellt werden, als zusätzliche Trainingsprozessparameter werte zu den zusätzlichen Trainingsproduktqualitätsparameterwerten, wobei die Prozesspa rameterwerte, welche während der Herstellung der jeweiligen Produkteinheiten erfasst wur den, unter Verwendung der Erfassungszeit der jeweiligen Prozessparameterwerte, der sen sorspezifischen zeitlichen Verschiebungen der die jeweiligen Prozessparameterwerte erfas senden Sensoren und der Herstellungszeiten der jeweiligen hergestellten Produkteinheiten bestimmt werden,
• zusätzliches Trainieren des Machine-Learning-Moduls unter Verwendung der zusätzlichen Trainingsproduktqualitätsparameterwerte und der zugeordneten zusätzlichen Trainingspro zessparameterwerte, wobei die jeweiligen zusätzlichen Trainingsproduktqualitätsparameter werte zum Bereitstellen von zusätzlichen Ausgabedaten und die jeweils zugeordneten zusätz lichen Trainingsprozessparameterwerte zum Bereitstellen von zusätzlichen Eingabedaten des Machine-Learning-Moduls für das zusätzliche Trainieren verwendet werden.
18. Verfahren nach einem der Ansprüche 16 bis 17, wobei das Verfahren ferner ein Erfassen von Anomalien (362) der vorhergesagten Produktqualitätsparameterwerte umfasst, wobei das Er fassen der Anomalien umfasst:
• Vergleichen der unter Verwendung der von der Produktionsanlage hergestellten Produktein heiten bestimmten Produktqualitätsparameterwerten mit den für die jeweilige Produktein heit vorhergesagten Produktqualitätsparameterwerten,
• falls eine Abweichung zwischen den für dieselbe Produkteinheit bestimmten und vorherge sagten Produktqualitätsparameterwerten ein vordefiniertes Kriterium erfüllt, Identifizieren der vorhergesagten Produktqualitätsparameterwerte als Anomalien,
• falls eine oder mehrere der vorhergesagten Produktqualitätsparameterwerte als Anomalie identifiziert werden, Ausgaben eines Anomaliehinweises.
19. Verfahren nach Anspruch 18, wobei das vordefinierte Kriterium ein Überschreiten eines vor definierten ersten Schwellenwerts umfasst.
20. Verfahren nach Anspruch 19, wobei ein Erfüllen des vordefinierten Kriteriums umfasst, dass ein Vertrauensniveau der Abweichung einen vordefinierten zweiten Schwellenwert unterschreitet.
21. Verfahren nach einem der Ansprüche 18 bis 20, wobei eine Voraussetzung für ein Initiieren eines zusätzlichen Trainierens des trainierten Machine-Learning-Moduls ein Identifizieren von ein oder mehreren der vorhergesagten Produktqualitätsparameterwerte als Anomalie umfasst.
22. Verfahren nach einem der Ansprüche 18 bis 20, wobei eine Voraussetzung für ein Initiieren eines zusätzlichen Trainierens des trainierten Machine-Learning-Moduls ein Ansammeln von zusätz liche Trainingsproduktqualitätsparameterwerten und zusätzliche Trainingsprozessparameterwerten für eine vordefinierte Anzahl an hergestellten Produkteinheit umfasst.
23. Verfahren nach einem der vorangehenden Ansprüche 16 bis 22, wobei das Verfahren ferner umfasst:
• Auswählen aus den Prozessparameter für welche die Sensoren der Produktionsanlage Pro zessparameterwerte erfassen eine Gruppe von steuerbaren Prozessparametern, welche durch ein zentrales Steuersystem der Produktionsanlage steuerbar sind,
• Identifizieren einer Untergruppe der steuerbaren Prozessparameter, deren Variation die un ter Verwendung des trainierten Machine-Learning-Moduls vorhergesagten Produktqualitäts parameterwerte am stärksten beeinflusst, wobei das Identifizieren ein Variieren unterschied licher Untergruppen der steuerbaren Prozessparameter und ein Vergleichen der resultieren den vorhergesagten Produktqualitätsparameterwerte umfasst.
24. Verfahren nach Anspruch 23, wobei das Verfahren ferner umfasst:
• Empfangen eines Satzes von Zielproduktqualitätsparameterwerten (821) für ein oder meh rere Produktqualitätsparameter des von der Produktionsanlage herzustellenden Produkts,
• Bestimmen von Prozessparameterwerten für die steuerbaren Prozessparameter der Unter gruppe, für welche eine Gesamtabweichung zwischen den unter Verwendung des trainier ten Machine-Learning-Modul vorhergesagten Produktqualitätsparameterwerten und den empfangenen Zielproduktqualitätsparametern einen vordefinierten dritten Schwellenwert unterschreitet, wobei das Bestimmen ein Variieren der steuerbaren Prozessparameter der Untergruppe unter Verwendung eines nichtlinearen Minimierungsverfahrensverfahrens umfasst,
• Ausgabe der bestimmten Prozessparameterwerte (842) als Empfehlung für ein Einstellen der steuerbaren Prozessparameter unter Verwendung des Steuersystems zum Herstellen von Produkteinheiten des herzustellenden Produkts, welche die Zielproduktqualitätspara meterwerte aufweisen.
25. Computersystem (930) zum Trainieren eines Machine-Learning-Moduls (216) eines compu terimplementierten Vorhersagemodells (210) zum Vorhersagen von Produktqualitätsparameter werten für ein oder mehrere Qualitätsparameter eines durch eine chemische Produktionsanlage (900) hergestellten chemischen Produkts (920), wobei die Produktionsanlage eine Mehrzahl von Sensoren (946) umfasst, welche jeweils dazu konfiguriert sind im Betrieb der Produktionsanlage Prozessparameterwerte für ein oder mehrere Prozessparameter eines von der Produktionsanlage ausgeführten chemischen Prozesses zur Herstellung des chemischen Produkts zu erfassen, wobei das Computersystem einen Prozessor (932) und einen Speicher (934) umfasst, wobei in dem Speicher das Vorhersagemodell mit dem Machine-Learning-Modul gespeichert ist, wobei in dem Speicher ferner Programminstruktionen gespeichert sind, wobei ein Ausführen der Program minstruktionen durch den Prozessor den Prozessor dazu veranlasst ein Verfahren auszuführen, wel ches umfasst:
• Bereitstellen von Trainingsdaten (945), wobei die Trainingsdaten für eine Mehrzahl von durch die Produktionsanlage hergestellten Produkteinheiten jeweils für ein oder mehrere Qualitäts parameter der jeweiligen Produkteinheit bestimmte Produktqualitätsparameterwerte als Trainingsproduktqualitätsparameterwerte (240) umfasst, wobei den Trainingsproduktquali tätsparameterwerten jeweils eine Herstellungszeit der Produkteinheit zugeordnet ist, für wel che sie bestimmt wurden, wobei die Trainingsdaten ferner von jedem der Sensoren jeweils eine Mehrzahl von Pro zessparameterwerte als Trainingsprozessparameterwerte (200) umfassen, welche während der Herstellung der Produkteinheiten erfasst wurden, für welche die Trainingsproduktquali tätsparameterwerten bestimmt wurden, wobei den Trainingsprozessparameterwerten je weils eine Erfassungszeit und ein Identifikator des erfassenden Sensors zugeordnet sind,
• Bereitstellen von a priori Informationen über die Produktionsanlage und den von der Produk tionsanlage ausgeführten Prozess, wobei die a priori Informationen zeitliche Ablaufinformati onen über einen zeitlichen Ablauf des ausgeführten Prozesses innerhalb der Produktionsan lage umfassen,
• für jeden der Sensoren jeweils Bestimmen einer sensorspezifischen zeitlichen Verschiebung zwischen einer Erfassungszeit eines der durch den entsprechenden Sensor erfassten Trai ningsprozessparameterwerte und einer Herstellungszeit der Produkteinheit, während deren Herstellung der entsprechende Trainingsprozessparameterwert erfasst wurde, wobei das Be stimmen jeweils unter Verwendung der zeitliche Ablaufinformationen erfolgt, wobei die be stimmten sensorspezifischen zeitlichen Verschiebungen der Sensoren jeweils den durch den jeweiligen Sensor erfassten Trainingsprozessparameterwert zugordnet werden,
• Zuordnen der Trainingsprozessparameterwerten jeweils zu den ein oder mehreren Trainings produktqualitätsparameterwerten einer der Produkteinheiten, während deren Herstellungs prozess der jeweilige Trainingsprozessparameterwert erfasst wurde, unter Verwendung der Erfassungszeit des jeweiligen Trainingsprozessparameterwerts, der sensorspezifischen zeitli chen Verschiebung des den jeweiligen Trainingsprozessparameterwert erfassenden Sensors und der Herstellungszeit der jeweiligen Produkteinheit,
• Trainieren des Machine-Learning-Moduls unter Verwendung der einander zugeordneten Trai ningsprozessparameterwerte und Trainingsproduktqualitätsparameterwerte, wobei die je weiligen Trainingsproduktqualitätsparameterwerte zum Bereitstellen von Ausgabedaten und die jeweils zugeordneten Trainingsprozessparameterwerte zum Bereitstellen von Eingabeda ten des Machine-Learning-Moduls für das Trainieren verwendet werden.
26. Computersystem (930) zum Vorhersagen von Produktqualitätsparameterwerten (130) für ein oder mehrere Qualitätsparameter eines durch eine chemische Produktionsanlage (900) herge stellten chemischen Produkts (920) unter Verwendung eines computerimplementierten Vorher sagemodells (120) mit einem nach einem der Ansprüche 1 bis 15 trainierten Machine-Learning-Mo- dul (126), wobei die Produktionsanlage eine Mehrzahl von Sensoren (946) umfasst, welche jeweils dazu konfiguriert sind im Betrieb der Produktionsanlage Prozessparameterwerte für ein oder meh rere Prozessparameter eines von der Produktionsanlage ausgeführten chemischen Prozesses zur Herstellung des chemischen Produkts zu erfassen, wobei das Computersystem einen Prozessor (932) und einen Speicher (934) umfasst, wobei in dem Speicher das Vorhersagemodell mit dem trainierten Machine-Learning-Modul gespeichert ist, wobei in dem Speicher ferner Programminstruktionen gespeichert sind, wobei ein Ausführen der Programminstruktionen durch den Prozessor den Prozessor dazu veranlasst ein Verfahren aus zuführen, welches umfasst:
• Bereitstellen einer Mehrzahl von den Sensoren im Betrieb der Produktionsanlage erfassten Prozessparameterwerten (100), wobei den Prozessparameterwerten jeweils eine Erfassungs zeit und ein Identifikator des erfassenden Sensors zugeordnet sind,
• Bereitstellen von a priori Informationen über die Produktionsanlage und den von der Produk tionsanlage ausgeführten Prozess, wobei die a priori Informationen zeitliche Ablaufinformati onen über einen zeitlichen Ablauf des ausgeführten Prozesses innerhalb der Produktionsan lage umfassen,
• für jeden der Sensoren jeweils Bestimmen einer sensorspezifischen zeitlichen Verschiebung zwischen den Erfassungszeiten der durch den entsprechenden Sensor erfassten Prozesspara meterwerte und einer Herstellungszeit einer Produkteinheit, für welche Produktqualitätspa rameterwerte vorhergesagt werden sollen und während deren Herstellung die jeweiligen Prozessparameterwert erfasst wurden, wobei das Bestimmen jeweils unter Verwendung der zeitliche Ablaufinformationen erfolgt, wobei die bestimmten sensorspezifischen zeitlichen Verschiebungen der Sensoren jeweils den durch den jeweiligen Sensor erfassten Prozesspara meterwert zugordnet werden,
• zueinander Zuordnen jeweils derjenigen Prozessparameterwerte, welche während der Her stellung derselben Produkteinheit erfasst wurden, wobei die zu aggregierenden Prozesspara meterwerte unter Verwendung der sensorspezifischen zeitlichen Verschiebung bestimmt werden,
• Verwenden jeweils der einander zugeordneten Prozessparameterwerte zum Bereitstellen von Eingabedaten des trainierten Machine-Learning-Moduls für ein Vorhersagen von ein oder mehreren Produktqualitätsparameterwerten,
• Empfangen von ein oder mehreren unter Verwendung des trainierten Machine-Learning-Mo- duls für die Produkteinheit, während deren Herstellung die zum Bereitstellen der Eingabeda ten verwendeten Produktqualitätsparameterwerte erfasst wurden, vorhergesagten Produkt qualitätsparameterwerten als Ausgabe des Vorhersagemodells.
EP22709254.1A 2021-02-11 2022-02-11 Vorhersagemodell zum vorhersagen von produktqualitätsparameterwerten Pending EP4291957A1 (de)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
DE102021201296.5A DE102021201296A1 (de) 2021-02-11 2021-02-11 Vorhersagemodell zum Vorhersagen von Produktqualitätsparameterwerten
PCT/EP2022/053351 WO2022171788A1 (de) 2021-02-11 2022-02-11 Vorhersagemodell zum vorhersagen von produktqualitätsparameterwerten

Publications (1)

Publication Number Publication Date
EP4291957A1 true EP4291957A1 (de) 2023-12-20

Family

ID=80685453

Family Applications (1)

Application Number Title Priority Date Filing Date
EP22709254.1A Pending EP4291957A1 (de) 2021-02-11 2022-02-11 Vorhersagemodell zum vorhersagen von produktqualitätsparameterwerten

Country Status (4)

Country Link
US (1) US20240144043A1 (de)
EP (1) EP4291957A1 (de)
DE (1) DE102021201296A1 (de)
WO (1) WO2022171788A1 (de)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102022201649A1 (de) 2022-02-17 2023-08-17 Robert Bosch Gesellschaft mit beschränkter Haftung Verfahren zur Wartezeit-Vorhersage in einer Halbleiterfabrik
DE102022208654A1 (de) 2022-08-22 2024-02-22 Robert Bosch Gesellschaft mit beschränkter Haftung Verfahren und Vorrichtung zum Ermitteln, ob in einem technischen Gerät eine Anomalie vorliegt, mittels Wissensgraphen und maschinellem Lernen
CN115237054B (zh) * 2022-09-21 2022-12-16 中科航迈数控软件(深圳)有限公司 一种主轴驱动电机控制方法、装置、终端及存储介质
CN116362599B (zh) * 2022-12-12 2023-11-10 武汉同捷信息技术有限公司 一种基于mes系统的质量数据采集方法与装置
CN116595883B (zh) * 2023-05-24 2024-03-01 上海交通大学 数值反应堆实时在线系统状态修正方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5212765A (en) 1990-08-03 1993-05-18 E. I. Du Pont De Nemours & Co., Inc. On-line training neural network system for process control
US9110452B2 (en) * 2011-09-19 2015-08-18 Fisher-Rosemount Systems, Inc. Inferential process modeling, quality prediction and fault detection using multi-stage data segregation

Also Published As

Publication number Publication date
US20240144043A1 (en) 2024-05-02
WO2022171788A1 (de) 2022-08-18
DE102021201296A1 (de) 2022-08-11

Similar Documents

Publication Publication Date Title
EP4291957A1 (de) Vorhersagemodell zum vorhersagen von produktqualitätsparameterwerten
US10739752B2 (en) Computer system and method for causality analysis using hybrid first-principles and inferential model
CN102208028B (zh) 一种适用于动态复杂系统的故障预测和诊断方法
DE60212121T2 (de) Erzeugung von prozessverwandten daten
CN103914064B (zh) 基于多分类器和d-s证据融合的工业过程故障诊断方法
CN108763729B (zh) 基于网络结构熵的流程工业机电系统耦合状态评估方法
CN104537415B (zh) 一种基于压缩感知和dros‑elm的非线性过程工业故障预测及识别方法
Lindemann et al. Anomaly detection and prediction in discrete manufacturing based on cooperative LSTM networks
CN112131212A (zh) 基于集成学习技术面向混合云场景的时序数据异常预测方法
DE112011101738T5 (de) Mehrstufiges Prozessmodellierungsverfahren
DE102011102034A1 (de) Online-Abbgleich eines prozessanalytischen Modells mit effektivem Prozessbetrieb
CN103901880A (zh) 基于多分类器和d-s证据融合的工业过程故障检测方法
EP3077878B1 (de) Computer-implementiertes verfahren und system zur automatischen überwachung und statusermittlung ganzer prozessabschnitte in einer process unit
CN106649479A (zh) 一种基于概率图的变压器状态关联规则挖掘方法
DE102019217613A1 (de) Verfahren zur diagnose eines motorzustands und diagnostisches modellierungsverfahren dafür
CN111122811A (zh) 一种oica和rnn融合模型的污水处理过程故障监测方法
Kim et al. Inspection schedule for prognostics with uncertainty management
CN112904810B (zh) 基于有效特征选择的流程工业非线性过程监测方法
CN116386756A (zh) 一种基于集成神经网络可信度估计与加权学习的软测量建模方法
EP3413153A1 (de) Verfahren und verteiltes steuerungssystem zur durchführung eines automatisierten industriellen prozesses
DE102019214546B4 (de) Computerimplementiertes Verfahren und Vorrichtung zur Optimierung einer Architektur eines künstlichen neuronalen Netzwerks
CN114841000B (zh) 一种基于模态共有特征分离的软测量建模方法
Wang et al. Complex equipment diagnostic reasoning based on neural network algorithm
CN117870034B (zh) 洁净室环境参数的控制方法、装置及系统
DE102019123447B4 (de) Verfahren zum Betrieb von Fahrzeugkomponenten

Legal Events

Date Code Title Description
STAA Information on the status of an ep patent application or granted ep patent

Free format text: STATUS: UNKNOWN

STAA Information on the status of an ep patent application or granted ep patent

Free format text: STATUS: THE INTERNATIONAL PUBLICATION HAS BEEN MADE

PUAI Public reference made under article 153(3) epc to a published international application that has entered the european phase

Free format text: ORIGINAL CODE: 0009012

STAA Information on the status of an ep patent application or granted ep patent

Free format text: STATUS: REQUEST FOR EXAMINATION WAS MADE

17P Request for examination filed

Effective date: 20230911

AK Designated contracting states

Kind code of ref document: A1

Designated state(s): AL AT BE BG CH CY CZ DE DK EE ES FI FR GB GR HR HU IE IS IT LI LT LU LV MC MK MT NL NO PL PT RO RS SE SI SK SM TR

DAV Request for validation of the european patent (deleted)
DAX Request for extension of the european patent (deleted)