RU2575328C2 - Method for computer-aided generation of data-controlled model of engineering system, particularly gas turbine or wind turbine - Google Patents
Method for computer-aided generation of data-controlled model of engineering system, particularly gas turbine or wind turbine Download PDFInfo
- Publication number
- RU2575328C2 RU2575328C2 RU2013157156/11A RU2013157156A RU2575328C2 RU 2575328 C2 RU2575328 C2 RU 2575328C2 RU 2013157156/11 A RU2013157156/11 A RU 2013157156/11A RU 2013157156 A RU2013157156 A RU 2013157156A RU 2575328 C2 RU2575328 C2 RU 2575328C2
- Authority
- RU
- Russia
- Prior art keywords
- data
- model
- technical system
- data sets
- training
- Prior art date
Links
- 230000000875 corresponding Effects 0.000 claims abstract description 68
- 238000002485 combustion reaction Methods 0.000 claims abstract description 7
- 239000007789 gas Substances 0.000 claims description 52
- 230000001537 neural Effects 0.000 claims description 43
- 238000005457 optimization Methods 0.000 claims description 10
- 238000004422 calculation algorithm Methods 0.000 claims description 6
- 230000001105 regulatory Effects 0.000 claims description 6
- 230000000306 recurrent Effects 0.000 claims description 5
- MWUXSHHQAYIFBG-UHFFFAOYSA-N Nitrogen oxide Substances O=[N] MWUXSHHQAYIFBG-UHFFFAOYSA-N 0.000 claims description 4
- 238000005452 bending Methods 0.000 claims description 4
- 230000002787 reinforcement Effects 0.000 claims description 3
- 231100000614 Poison Toxicity 0.000 claims description 2
- UGFAIRIUMAVXCW-UHFFFAOYSA-N carbon monoxide Chemical compound [O+]#[C-] UGFAIRIUMAVXCW-UHFFFAOYSA-N 0.000 claims description 2
- 229910002091 carbon monoxide Inorganic materials 0.000 claims description 2
- 239000000446 fuel Substances 0.000 claims description 2
- 238000009434 installation Methods 0.000 claims description 2
- 229910052813 nitrogen oxide Inorganic materials 0.000 claims description 2
- 230000004044 response Effects 0.000 claims description 2
- 239000003440 toxic substance Substances 0.000 claims description 2
- 230000000694 effects Effects 0.000 abstract 1
- 230000002035 prolonged Effects 0.000 abstract 1
- 239000000126 substance Substances 0.000 abstract 1
- 230000002588 toxic Effects 0.000 abstract 1
- 231100000331 toxic Toxicity 0.000 abstract 1
- 230000006399 behavior Effects 0.000 description 7
- 238000005070 sampling Methods 0.000 description 6
- 238000004364 calculation method Methods 0.000 description 5
- 238000010606 normalization Methods 0.000 description 5
- 238000004590 computer program Methods 0.000 description 2
- 230000001276 controlling effect Effects 0.000 description 2
- 230000001419 dependent Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000000034 method Methods 0.000 description 2
- 125000002066 L-histidyl group Chemical group [H]N1C([H])=NC(C([H])([H])[C@](C(=O)[*])([H])N([H])[H])=C1[H] 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000006011 modification reaction Methods 0.000 description 1
- 230000003287 optical Effects 0.000 description 1
- 238000011045 prefiltration Methods 0.000 description 1
- 230000000087 stabilizing Effects 0.000 description 1
- 230000036962 time dependent Effects 0.000 description 1
Images
Abstract
Description
Изобретение относится к способу компьютерной генерации управляемой данными модели технической системы, в частности газовой турбины или ветрогенератора, а также к соответствующему компьютерному программному продукту.The invention relates to a method for computer generation of a data-driven model of a technical system, in particular a gas turbine or wind generator, as well as to a corresponding computer program product.
Для автоматической эксплуатации технической системы могут использоваться управляемые данными модели, обучаемые на основе соответствующих тренировочных данных, которые представляют собой эксплуатационные параметры технической системы. При этом такая обученная, управляемая данными модель должна отражать поведение технической системы и может использоваться затем для разработки моделей контроля и/или регулирования соответствующей технической системы. Эти модели контроля и регулирования могут использоваться затем в реальной работе технической системы для настройки ее соответствующих управляющих переменных на основе текущих эксплуатационных параметров или для эксплуатационных параметров автоматического определения ее ложных эксплуатационных состояний.For the automatic operation of a technical system, data-driven models can be used, trained on the basis of the corresponding training data, which are the operational parameters of the technical system. Moreover, such a trained, data-driven model should reflect the behavior of the technical system and can then be used to develop models for monitoring and / or regulating the corresponding technical system. These control and regulation models can then be used in the actual operation of a technical system to adjust its corresponding control variables based on current operational parameters or for operational parameters to automatically determine its false operational states.
Как правило, тренировочные данные, с помощью которых обучается управляемая данными модель, распределены в пространстве состояний эксплуатационных параметров технической системы неравномерно. Обычно в эксплуатационных диапазонах технической системы, представляющих нормальный режим, имеется существенно больше данных, чем в граничных диапазонах эксплуатации или для ложных эксплуатационных состояний технической системы. Эта проблема возникает, в частности, при управлении газовыми турбинами и ветрогенераторами, которые во избежание повреждений не эксплуатируются, как правило, в граничных диапазонах. Таким образом, в часто используемых эксплуатационных диапазонах газовой турбины или ветрогенератора существует большое число полезных наборов тренировочных данных, однако их информационное содержание является большей частью избыточным. Для редко используемых эксплуатационных режимов, напротив, имеется мало данных.As a rule, training data, with the help of which a data-driven model is trained, are distributed unevenly in the state space of operational parameters of the technical system. Typically, there is significantly more data available in the operating ranges of a technical system that represent normal operation than in the boundary ranges of operation or for spurious operating states of a technical system. This problem arises, in particular, when controlling gas turbines and wind generators which, in order to avoid damage, are not operated, as a rule, in boundary ranges. Thus, in the frequently used operating ranges of a gas turbine or wind generator, there are a large number of useful training data sets, but their information content is mostly redundant. For rarely used operating modes, on the contrary, there is little data.
Таким образом, для тренировочных данных, используемых для обучения управляемой данными модели, существуют диапазоны разной плотности данных. Обычно эта плотность данных не учитывается при отборе соответствующих тренировочных данных и основанной на них генерации модели соответствующей технической системы.Thus, for training data used to train a data-driven model, ranges of different data densities exist. Usually this data density is not taken into account when selecting the appropriate training data and the generation of the model of the corresponding technical system based on them.
Вследствие этого соответствующие модели регулирования и контроля, рассчитываемые на основе управляемых данными моделей, могут при работе технической системы выдавать неправильные или субоптимальные регулирующие действия или неправильные предупреждения. Так, например, возможно, что понижения температуры, возникающие при работе газовой турбины или ветрогенератора и отсутствующие на тренировочном этапе управляемой данными модели, приведут к срабатыванию ложной тревоги. Точно так же управляемая данными модель, обучаемая только с помощью тренировочных данных для типичных эксплуатационных состояний, может привести к увеличению сбоев, так что основанная на этом модель регулирования или управления в реальной работе технической системы неоптимально настраивает соответствующие управляющие переменные, например количество подаваемого газа или положение входных направляющих лопаток в газовой турбине. Это может привести к снижению мощности или к.п.д. или срока службы технической системы.As a result, the corresponding regulatory and control models, calculated on the basis of data-driven models, may generate incorrect or suboptimal regulatory actions or incorrect warnings during the operation of the technical system. So, for example, it is possible that temperature drops that occur during the operation of a gas turbine or wind generator and are absent at the training stage of the data-driven model will trigger a false alarm. Similarly, a data-driven model, trained only with training data for typical operational conditions, can lead to an increase in malfunctions, so that the model of regulation or control based on this in the actual operation of the technical system does not optimally adjust the corresponding control variables, for example, the amount of gas supplied or the position input guide vanes in a gas turbine. This may result in reduced power or efficiency. or the life of the technical system.
Традиционным образом при генерации управляемой данными модели технической системы после устранения резко выпадающих значений и ошибок используются либо все наборы тренировочных данных, либо случайный отбор этих наборов данных. Принятие во внимание всех тренировочных данных создает их очень большое и все более возрастающее количество, которое может замедлить генерацию соответствующей управляемой данными модели и привести к ресурсным проблемам компьютера или компьютеров (например, нехватке размера основной памяти). Простое ограничение случайным отбором наборов тренировочных данных ускоряет, правда, расчет управляемой данными модели, однако повышает риск потери релевантной информации через техническую систему. Эта проблема у управляемых данными моделей, представляющих динамическое поведение технической системы, усиливается за счет того, что при обучении модели приходится сообща учитывать определенное количество взаимосвязанных по времени наборов данных.In the traditional way, when generating a data-driven model of a technical system after eliminating sharply falling out values and errors, either all training data sets or a random selection of these data sets are used. Taking into account all the training data creates a very large and increasing amount of it, which can slow down the generation of the corresponding data-driven model and lead to resource problems of the computer or computers (for example, lack of main memory size). A simple restriction to the random selection of training data sets speeds up, however, the calculation of a data-driven model, but increases the risk of losing relevant information through a technical system. This problem in data-driven models that represent the dynamic behavior of a technical system is aggravated by the fact that when training a model, we have to take into account together a certain number of time-related data sets.
Задачей изобретения является создание способа компьютерной генерации управляемой данными модели, которая с помощью меньшего объема вычислительного ресурса позволила бы обучить хорошую управляемую данными модель технической системы.The objective of the invention is to provide a method for computer-generated generation of a data-driven model, which, using a smaller amount of computing resource, would allow to train a good data-driven model of a technical system.
Эта задача решается посредством независимых пунктов формулы изобретения. Варианты его осуществления приведены в зависимых пунктах.This problem is solved by means of the independent claims. Options for its implementation are given in dependent clauses.
Предложенный способ служит для компьютерной генерации управляемой данными модели технической системы, в частности газовой турбины или ветрогенератора. Управляемая данными модель служит преимущественно для использования в целях решения автоматизированных задач контроля, и/или прогнозирования, и/или регулирования в технической системе и создается на основе тренировочных данных, включающих в себя большое число наборов данных, представляющих соответственно несколько эксплуатационных параметров технической системы. Под несколькими эксплуатационными параметрами следует понимать измеряемые величины и при необходимости управляющие переменные технической системы. При этом измеряемыми величинами являются величины, которые определяются на или в окружении технической системы подходящими датчиками или выводятся из значений датчиков. Управляющими переменными являются такие эксплуатационные параметры технической системы, которые можно настраивать или изменять, чтобы за счет этого влиять на ее работу.The proposed method is used for computer generation of a data-driven model of a technical system, in particular a gas turbine or a wind generator. The data-driven model is mainly used for solving automated control and / or forecasting and / or regulation tasks in a technical system and is created on the basis of training data, which includes a large number of data sets representing several operational parameters of a technical system, respectively. Several operational parameters should be understood as measured values and, if necessary, control variables of a technical system. The measured values are those which are determined on or in the environment of the technical system by suitable sensors or derived from the values of the sensors. Control variables are such operational parameters of a technical system that can be adjusted or changed to thereby influence its operation.
Предложенный способ протекает итеративно, причем для некоторого числа этапов итерации посредством наборов тренировочных данных обучаются соответственно управляемая данными модель и оценщик плотности. Обученная по завершении итерации управляемая данными модель является тогда генерированной предложенным способом управляемой данными моделью. (Обученный) оценщик плотности выдает для наборов тренировочных данных соответственно доверительный уровень, который тем выше, чем выше схожесть соответствующего набора данных с другими наборами тренировочных данных. Схожесть наборов данных описывается в предпочтительном варианте соответствующим расстоянием в пространстве между представляющими наборы данных точками данных. При этом оценщик плотности за счет своего доверительного уровня указывает, имеют ли место для соответствующего набора данных высокая плотность в пространстве данных и, тем самым, много схожих наборов тренировочных данных. Методы, с помощью которых можно реализовать описанный оценщик плотности, достаточно известны из уровня техники и поэтому подробно не поясняются. В одном предпочтительном варианте в качестве оценщика плотности применяется метод, основанный на нейронных облаках. При этом применяется преимущественно метод, описанный в источнике информации [1]. Все раскрытое содержание этого источника информации путем ссылки включено в содержание данной заявки.The proposed method proceeds iteratively, moreover, for a number of iteration steps, data-driven model and density estimator are trained using sets of training data. The data-driven model trained at the end of the iteration is then the data-driven model generated by the proposed method. The (trained) density evaluator gives a confidence level for training data sets, which is the higher, the higher the similarity of the corresponding data set with other training data sets. The similarity of the data sets is preferably described by the corresponding distance in space between the data points representing the data sets. At the same time, the density estimator, due to his confidence level, indicates whether there is a high density in the data space for the corresponding data set and, therefore, many similar training data sets. The methods by which the described density estimator can be implemented are well known in the art and therefore are not explained in detail. In one preferred embodiment, a neural cloud based method is used as a density estimator. In this case, the method described in the source of information is mainly used [1]. All disclosed content of this source of information by reference is included in the content of this application.
Обученная в предложенном способе на одном этапе итерации управляемая данными модель служит для воспроизведения наборов тренировочных данных. При этом возникает модельная ошибка, представляющая собой различие между воспроизведенными наборами данных и фактическими наборами тренировочных данных. Эта ошибка качественно хорошей, управляемой данными модели должна быть минимальной. При этом управляемая данными модель выполнена, в частности, таким образом, что первая часть эксплуатационных параметров соответствующих наборов тренировочных данных представляет собой ввод управляемой данными модели, а ее выводом является вторая часть содержащихся в соответствующих наборах данных эксплуатационных параметров. В этом случае модельная ошибка возникает за счет различия между второй частью эксплуатационных параметров, выдаваемых управляемой данными моделью, и соответствующей второй частью эксплуатационных параметров соответствующих наборов тренировочных данных.Trained in the proposed method at one stage of iteration, the data-driven model serves to reproduce sets of training data. In this case, a model error arises, which is the difference between the reproduced data sets and the actual training data sets. This error of a qualitatively good, data-driven model should be minimal. Moreover, the data-driven model is made, in particular, in such a way that the first part of the operational parameters of the corresponding training data sets is the input of the data-driven model, and its output is the second part of the operational parameters contained in the corresponding data sets. In this case, a model error arises due to the difference between the second part of the operational parameters produced by the data-driven model and the corresponding second part of the operational parameters of the corresponding training data sets.
В рамках предложенного способа посредством оценщика данных и управляемой данными модели, которые были обучены на соответствующем этапе итерации, отбираются или взвешиваются наборы тренировочных данных для обучения на следующем этапе итерации, причем подборки тренировочных данных с низким доверительным уровнем и большими модельными ошибками отбираются скорее или взвешиваются выше. Это значит, что набор тренировочных данных, который при равной модельной ошибке имеет более низкий доверительный уровень, чем другой набор данных, отбирается скорее или взвешивается выше, чем другой набор данных. Точно так же набор данных, который при равном доверительном уровне имеет большую модельную ошибку, чем другой набор данных, отбирается предпочтительно или взвешивается выше, чем другой набор данных.In the framework of the proposed method, by means of a data evaluator and a data-driven model that were trained at the corresponding stage of iteration, sets of training data for training at the next stage of iteration are selected or weighted, and collections of training data with a low confidence level and large model errors are selected rather or weighted higher . This means that a training data set that, with an equal model error has a lower confidence level than another data set, is selected more quickly or weighed than another data set. Similarly, a dataset that, at an equal confidence level, has a larger model error than another dataset, is preferably selected or weighted higher than another dataset.
Изобретение основано на том факте, что особенно эффективное обучение управляемой данными модели технической системы достигается тогда, когда используются тренировочные данные, имеющие высокую степень «новизны», т.е. доверительный уровень которых низок и для которых вследствие этого существует мало схожих наборов данных. Точно так же интерес для методов обучения представляют те диапазоны тренировочных данных, для которых модель еще ошибочна, т.е. для которых возникают еще большие модельные ошибки. За счет моделирования подходящей взаимосвязи, при которой наборы данных с низким доверительным уровнем или большими модельными ошибками на новом этапе итерации учитываются сильнее, достигается, тем самым, обучение, обеспечивающее эффективную генерацию хорошей управляемой данными модели технической системы.The invention is based on the fact that particularly effective training of a data-driven model of a technical system is achieved when training data having a high degree of “novelty” is used, i.e. whose confidence level is low and for which, as a result, there are few similar data sets. Similarly, for training methods, those ranges of training data are for which the model is still erroneous, i.e. for which even larger model errors arise. By modeling a suitable relationship, in which data sets with a low confidence level or large model errors are taken into account more strongly at the new stage of iteration, training is achieved, which ensures the efficient generation of a good data-driven model of the technical system.
Предложенным способом можно подходящим образом экстрагировать имеющиеся в больших количествах тренировочных данных взаимосвязи и использовать их для моделирования поведения технической системы и, в частности, газовой турбины или ветрогенератора. Хорошее моделирование соответствующей технической системы обеспечивается при этом даже тогда, когда наборы тренировочных данных содержат мало эксплуатационных параметров или количество тренировочных данных распределено по немногим наборам. В предложенном способе используются лишь важные информационно-релевантные наборы данных или диапазоны тренировочных данных, так что соответствующую модель можно создать быстро и с малыми вычислительными ресурсами. Кроме того, за счет предложенного способа оптимизируется процентильное представление генерированной управляемой данными модели. Это предпочтительно особенно тогда, когда управляемая данными модель используется в рамках компьютерного управления технической системой или ее контроля.By the proposed method, it is possible to appropriately extract the relationships existing in large amounts of training data and use them to simulate the behavior of a technical system and, in particular, a gas turbine or wind generator. In this case, good modeling of the corresponding technical system is ensured even when training data sets contain few operational parameters or the amount of training data is distributed over a few sets. In the proposed method, only important information-relevant data sets or training data ranges are used, so that the corresponding model can be created quickly and with little computing resources. In addition, due to the proposed method, the percentile representation of the generated data-driven model is optimized. This is preferable especially when the data-driven model is used as part of the computer control of a technical system or its control.
Предложенный способ имеет далее то преимущество, что он создает обученный оценщик плотности, который может быть затем интегрирован при расчете модели управления и/или регулирования или модели контроля технической системы. При этом оценщик плотности дает информацию о достоверности текущих эксплуатационных параметров технической системы. В частности, могут быть динамически согласованы соответствующие информационные пороги или максимальные значения изменений управляющих переменных. Таким образом, можно избежать ложных тревог при контроле технических систем в реальном времени и, в частности, газовых турбин или ветрогенераторов. Далее авторизацию генерированной управляемой данными модели можно сделать зависимой от доверительного уровня и, тем самым, от плотности соответствующего набора данных текущих эксплуатационных параметров технической системы, т.е. только при достаточной плотности данных начинается работа управляемой данными модели или продолжается работа технической системы. Таким образом, можно избежать настроек управляющих переменных на технической системе, которые, например, за счет слишком большой динамики сгорания в газовой турбине приводят к повреждению технической системы.The proposed method further has the advantage that it creates a trained density estimator, which can then be integrated in the calculation of the control and / or regulation model or the control model of the technical system. At the same time, the density estimator provides information on the reliability of the current operational parameters of the technical system. In particular, the corresponding information thresholds or maximum values of changes in control variables can be dynamically matched. Thus, false alarms can be avoided when monitoring technical systems in real time and, in particular, gas turbines or wind generators. Further, the authorization of the generated data-driven model can be made dependent on the confidence level and, thus, on the density of the corresponding data set of the current operational parameters of the technical system, i.e. only with sufficient data density does the work of a data-driven model begin or the operation of a technical system continues. Thus, it is possible to avoid the settings of control variables on the technical system, which, for example, due to too large combustion dynamics in the gas turbine lead to damage to the technical system.
С помощью генерированной предложенным способом управляемой данными модели можно моделировать, в частности, также динамическое (т.е. зависимое от времени) поведение технической системы. В этом случае набор данных включает в себя не только эксплуатационные параметры в один и тот же момент времени, но и последовательность эксплуатационных параметров связанных друг с другом моментов времени в соответствии с архитектурой управляемой данными модели.Using the data-driven model generated by the proposed method, it is possible to model, in particular, also the dynamic (i.e., time-dependent) behavior of the technical system. In this case, the data set includes not only operational parameters at the same moment in time, but also a sequence of operational parameters of interconnected time points in accordance with the architecture of the data-driven model.
Предложенным способом в качестве управляемой данными модели обучается преимущественно нейронная сеть и, в частности, рекуррентная нейронная сеть. Такая рекуррентная нейронная сеть позволяет очень хорошо воспроизводить поведение технической системы на основе соответствующих тренировочных данных. Обучение нейронной сети происходит преимущественно известным методом обратного распространения ошибки. В одном особенно предпочтительном варианте в качестве нейронной сети используется описанная в DE 102010011221 А1 сеть, которая называется также марковской сетью (марковский процесс принятия решений).The proposed method, as a data-driven model, learns mainly a neural network and, in particular, a recurrent neural network. Such a recurrent neural network makes it possible to very well reproduce the behavior of a technical system based on relevant training data. Neural network training is predominantly a well-known method of back propagation of error. In one particularly preferred embodiment, the network described in DE 102010011221 A1, which is also called the Markov network (Markov decision process), is used as a neural network.
Предложенный способ особенно хорошо подходит для моделирования газовой турбины. Ее подходящие измеряемые параметры, учитываемые в качестве эксплуатационных параметров технической системы в наборах данных, включают в себя один или несколько следующих параметров:The proposed method is particularly suitable for modeling a gas turbine. Its suitable measured parameters, taken into account as operational parameters of the technical system in the data sets, include one or more of the following parameters:
- температуру окружающего пространства, в котором эксплуатируется газовая турбина;- the temperature of the environment in which the gas turbine is operated;
- влажность воздуха окружающего пространства, в котором эксплуатируется газовая турбина;- air humidity of the surrounding space in which the gas turbine is operated;
- давление воздуха в окружающем пространстве, в котором эксплуатируется газовая турбина;- air pressure in the surrounding space in which the gas turbine is operated;
- мощность газовой турбины, в частности процентное значение мощности;- the power of the gas turbine, in particular the percentage value of power;
- качество топлива газовой турбины;- fuel quality of a gas turbine;
- выброс газовой турбиной токсичных веществ, в частности выброс оксидов азота и/или моноксида углерода;- emission by a gas turbine of toxic substances, in particular emission of nitrogen oxides and / or carbon monoxide;
- температуру отходящих газов газовой турбины;- temperature of the exhaust gases of the gas turbine;
- динамику сгорания в газовой турбине.- the dynamics of combustion in a gas turbine.
Термин «динамика сгорания» касается зарегистрированных подходящими датчиками амплитудных значений колебаний давления в газовой турбине.The term “combustion dynamics” refers to the amplitude values of the pressure fluctuations recorded in a gas turbine recorded by suitable sensors.
В противоположность этому для газовой турбины особенно подходящими оказались следующие управляющие переменные в качестве эксплуатационных параметров в наборах данных:In contrast, the following control variables were found to be particularly suitable for a gas turbine as operational parameters in data sets:
- положение одной или нескольких направляющих лопаток газовой турбины;- the position of one or more guide vanes of the gas turbine;
- количество подаваемого в газовую турбину газа;- the amount of gas supplied to the gas turbine;
- заданное значение температуры отходящих газов газовой турбины.- set value of the temperature of the exhaust gases of a gas turbine.
При этом следует обратить внимание на то, что в газовых турбинах нужное значение температуры отходящих газов можно устанавливать с помощью подходящего регулятора. Это значение соответствует упомянутому заданному значению.In this case, you should pay attention to the fact that in gas turbines the desired value of the temperature of the exhaust gases can be set using a suitable controller. This value corresponds to the specified setpoint.
Другой предпочтительной областью применения предложенного способа является создание управляемой данными модели ветрогенератора. При этом в качестве измеряемых эксплуатационных параметров в наборах данных используются преимущественно один или несколько следующих параметров:Another preferred area of application of the proposed method is the creation of a data-driven model of a wind generator. Moreover, as measured operational parameters in data sets, one or more of the following parameters are used predominantly:
- выработанная ветрогенератором электрическая мощность;- electric power generated by the wind generator;
- скорость ветра в окружающем пространстве, в котором эксплуатируется ветрогенератор;- wind speed in the surrounding space in which the wind generator is operated;
- частота вращения ветрогенератора;- rotational speed of the wind generator;
- изгибающие усилия и/или отклонения и/или знакопеременные нагрузки на лопастях ветрогенератора;- bending forces and / or deviations and / or alternating loads on the blades of the wind generator;
- вращение башни ветрогенератора.- rotation of the tower of the wind generator.
В качестве управляющих переменных эксплуатационных параметров ветрогенератора в наборах данных используются преимущественно одна или несколько следующих переменных:As control variables of the operating parameters of the wind generator in the data sets, one or more of the following variables are mainly used:
- угол установки лопастей ветрогенератора;- the angle of installation of the blades of the wind generator;
- параметрическое поле ветрогенератора, которое представляет взаимосвязь между частотой вращения и выработанной ветрогенератором мощностью.- the parametric field of the wind generator, which represents the relationship between the rotational speed and the power generated by the wind generator.
В другом особенно предпочтительном варианте с помощью генерированной предложенным способом управляемой данными модели рассчитывается модель управления и/или регулирования эксплуатации технической системы на основе одного или нескольких критериев оптимизации. Эта рассчитанная модель управления и/или регулирования указывает изменения одной или нескольких управляющих переменных эксплуатационных параметров технической системы в зависимости от одной или нескольких измеряемых величин эксплуатационных параметров технической системы и обеспечивает за счет этого в ее реальной работе подходящую настройку управляющих переменных.In another particularly preferred embodiment, using the data-driven model generated by the proposed method, a model for controlling and / or regulating the operation of a technical system is calculated based on one or more optimization criteria. This calculated model of control and / or regulation indicates changes in one or more control variables of the operational parameters of the technical system depending on one or more measured values of the operational parameters of the technical system and, due to this, ensures proper adjustment of control variables in its real work.
Если рассчитывается модель управления и/или регулирования газовой турбины, то критерий/критерии оптимизации включает/включают в себя преимущественно минимальный выброс и/или минимальную динамику сгорания или же максимально высокий к.п.д. или максимально высокую мощность. Таким образом, гарантируется экологичная работа газовой турбины или длительный срок ее службы.If a gas turbine control and / or regulation model is calculated, the optimization criterion / criteria includes / include mainly the minimum emission and / or minimum combustion dynamics or the highest efficiency. or the highest possible power. Thus, the environmentally friendly operation of the gas turbine or its long service life is guaranteed.
Если рассчитывается модель управления и/или регулирования ветрогенератора, то критерий/критерии оптимизации включает/включают в себя, в частности, его максимально высокий к.п.д. и/или минимальные изгибающие усилия на его лопастях. Это гарантирует оптимальную работу или также длительный срок службы ветрогенератора.If a wind generator control and / or regulation model is calculated, then the optimization criterion / criteria includes / includes, in particular, its maximum high efficiency and / or minimal bending forces on its blades. This ensures optimum operation or also a long service life of the wind generator.
В другом особенно предпочтительном варианте модель управления и/или регулирования выполняется таким образом, что с помощью обученного оценщика плотности соответствующие доверительные уровни наборов данных возникающих при работе технической системы эксплуатационных параметров определяются, причем ограничивается изменение одной или нескольких управляющих переменных эксплуатационных параметров и/или работа связанной с управляемой данными моделью функции и/или технической системы прерывается или вообще не начинается, если соответствующий доверительный уровень ниже заданного порога. Таким образом, обученный в рамках предложенного способа оценщик плотности может использоваться также для авторизации работы технической системы только тогда, когда эксплуатационные параметры технической системы лежат в диапазоне достаточно высокой плотности данных.In another particularly preferred embodiment, the control and / or regulation model is implemented in such a way that, with the help of a trained density evaluator, the corresponding confidence levels of the data sets of the operational parameters arising during the operation of the technical system are determined, and the change in one or more control variables of the operational parameters and / or the operation of the associated one is limited with a data-driven model of a function and / or technical system, it is interrupted or does not start at all, if a confidence level below a predetermined threshold. Thus, a density estimator trained in the framework of the proposed method can also be used to authorize the operation of a technical system only when the operational parameters of the technical system lie in the range of a sufficiently high data density.
В другом варианте предложенного способа с помощью обученной, управляемой данными модели рассчитывается модель контроля, которая в случае, если один или несколько возникающих при работе технической системы эксплуатационных параметров более чем на заданную меру отличаются от соответствующего или соответствующих, воспроизведенных генерированной управляемой данными моделью эксплуатационных параметров, выдает предупредительный и/или тревожный сигнал и/или вызывает автоматическое срабатывание меры безопасности технической системы. Преимущественно в такой модели контроля можно подходящим образом учесть также обученный оценщик плотности. В этом случае модель контроля выполнена таким образом, что соответствующие доверительные уровни для наборов данных из возникающих при работе технической системы эксплуатационных параметров определяются с помощью обученного оценщика плотности, причем заданный уровень, на основе которого вырабатывается предупредительный сигнал, настраивается тем выше, чем ниже соответствующий доверительный уровень входных параметров модели. Следовательно, подходящим образом повышается сигнальный порог для наборов данных меньшей плотности. При необходимости в случае, если соответствующий доверительный уровень ниже заданного порогового значения, выдается также сигнал о том, что из-за слишком малой плотности данных не могут выдаваться никакие предупредительные сигналы и, тем самым, невозможен никакой контроль.In another variant of the proposed method, using the trained, data-driven model, a control model is calculated that, if one or more operational parameters arising during the operation of the technical system, differ by more than a specified measure from the corresponding or corresponding operating parameters generated by the data-driven model, gives a warning and / or alarm signal and / or causes an automatic response of a safety measure of the technical system. Advantageously, in such a control model, a trained density evaluator can also be appropriately taken into account. In this case, the control model is made in such a way that the corresponding confidence levels for the data sets from the operational parameters arising during the operation of the technical system are determined using a trained density estimator, and the specified level, on the basis of which the warning signal is generated, is adjusted the higher, the lower the corresponding confidence level level of input model parameters. Therefore, the signal threshold for lower density data sets is suitably raised. If necessary, if the corresponding confidence level is below a predetermined threshold value, a signal is also issued that, due to too low data density, no warning signals can be issued and, therefore, no monitoring is possible.
В одном особенно предпочтительном варианте модель управления и/или регулирования и/или модель контроля рассчитывается на основе метода обучения с подкреплением и/или метода модельно-предикативного регулирования, и/или метода оптимизации. Методы обучения с подкреплением и модельно-предикативного регулирования достаточно известны из уровня техники. Точно так же известны соответствующие методы оптимизации. Например, метод оптимизации может быть осуществлен основанным на градиенте или стохастическим методом поиска соответственно определенного оптимального значения согласно модели управления или регулирования или модели контроля. В другом, особенно предпочтительном варианте модель управления и/или регулирования и/или модель контроля обучается на основе нейронной сети, в частности рекуррентной нейронной сети.In one particularly preferred embodiment, the control and / or regulation model and / or the control model is calculated based on the reinforced learning method and / or the model-predicative regulation method and / or optimization method. Reinforcement learning methods and model-predicative regulation are well known in the art. Correspondingly, corresponding optimization methods are known. For example, the optimization method may be implemented by a gradient-based or stochastic method of searching for a correspondingly determined optimum value according to a control or regulation model or control model. In another, particularly preferred embodiment, the control and / or regulation model and / or the control model is trained based on a neural network, in particular a recurrent neural network.
В качестве техники расчета соответствующей модели управления и/или регулирования и/или модели контроля подходят, в частности, методы, описанные в публикациях DE 102007001025 Al (Reccurent-Control-Neural-Network), DE 102007017259 Al (Neural-Rewards-Regression) и DE 102007042440 B3 (Policy-Gradient-Neural-Rewards-Regression). Точно так же для расчета соответствующих моделей управления и/или регулирования и/или моделей контроля может применяться известный метод Neural-Fitted-Q-Iteration [2].As a calculation technique for the corresponding control and / or regulation model and / or control model, in particular, the methods described in DE 102007001025 Al (Reccurent-Control-Neural-Network), DE 102007017259 Al (Neural-Rewards-Regression) and DE 102007042440 B3 (Policy-Gradient-Neural-Rewards-Regression). Similarly, the well-known Neural-Fitted-Q-Iteration method [2] can be used to calculate the corresponding control and / or regulation models and / or control models.
При необходимости при обучении модели управления и/или регулирования и/или модели контроля с помощью нейронной сети могут применяться методы регуляризации. Например, помимо ошибки для соответствующего набора данных может быть добавлен так называемый штрафной терм для весов в нейронной сети (англ.: weight penalty term), так что в областях с низкой плотностью данных создаются скорее линейные и, тем самым, лучше экстраполирующие модели. Точно так же могут быть отрезаны веса нейронной сети, отбираемые с помощью известной функции оценки Inverse Kurtosis, благодаря чему стабилизируется поведение в областях с низкой плотностью данных. Это предпочтительно, в частности, при расчете модели управления и/или регулирования и/или модели контроля для газовой турбины или ветрогенератора.If necessary, when training a control and / or regulation model and / or a control model using a neural network, regularization methods can be applied. For example, in addition to the error for the corresponding data set, the so-called penalty term for weights in the neural network can be added (English: weight penalty term), so that in areas with low data density rather linear and, therefore, better extrapolating models are created. Likewise, neural network weights can be cut off using the well-known Inverse Kurtosis score function, thereby stabilizing behavior in areas of low data density. This is preferred, in particular, in the calculation of the control and / or regulation model and / or the control model for a gas turbine or wind generator.
В одном предпочтительном варианте взаимосвязь между доверительными уровнями или модельными ошибками и отбором или взвешиванием наборов данных моделируется при генерации управляемой данными модели посредством функции. При этом определяется функция, зависимая от доверительного уровня и модельной ошибки, причем функция на основе доверительного уровня и модельной ошибки устанавливает, отбирается ли набор данных или насколько высоко его взвешивание. В зависимости от случая применения функция может быть разной. Конкретное установление такой функции лежит в рамках действий специалиста. Например, функция может моделировать соответствующие взаимосвязи дискретно посредством лестниц или подходящим образом непрерывно.In one preferred embodiment, the relationship between confidence levels or model errors and the selection or weighting of data sets is modeled when generating a data-driven model through a function. In this case, a function is determined depending on the confidence level and model error, and the function, based on the confidence level and model error, determines whether the data set is selected or how high its weighting is. Depending on the application, the function may be different. The concrete establishment of such a function lies within the framework of the specialist. For example, a function may model the corresponding relationships discretely by means of ladders or suitably continuously.
В другом предпочтительном варианте предложенного способа наборы данных при генерации управляемой данными модели отбираются для следующего этапа итерации на основе соответствующих наборам данных вероятностей посредством взятия выборок. Это значит, что наборам данных на основе соответствующих доверительных уровней или модельных ошибок подходящим образом присваиваются вероятности, которые затем учитываются в рамках выборки. Присвоение вероятностей может осуществляться, например, посредством описанной функции.In another preferred embodiment of the proposed method, data sets during the generation of a data-driven model are selected for the next iteration step based on the probabilities corresponding to the data sets by sampling. This means that data sets are appropriately assigned probabilities based on the corresponding confidence levels or model errors, which are then taken into account in the sample. The assignment of probabilities can be carried out, for example, by means of the described function.
В другом варианте предложенного способа наборам тренировочных данных присваиваются веса, которые учитываются при обучении оценщика плотности и управляемой данными модели, причем веса посредством оценщика плотности и управляемой данными модели, обученных на соответствующем этапе итерации, актуализируются таким образом, что наборы тренировочных данных с более низкими доверительными уровнями и большими модельными ошибками приобретают более высокие веса. Веса могут учитываться оценщиком плотности и управляемой данными моделью по-разному. В одном варианте осуществления изобретения веса представляют вероятности, обрабатываемые оценщиком плотности и управляемой данными моделью. Например, посредством оценщика плотности и/или управляемой данными модели можно отбирать для обучения наборы тренировочных данных на основе вероятностей. Вероятности можно учитывать подходящим образом также в рамках обучения, например методом стохастического градиентного подъема, который применятся оценщиком плотности и управляемой данными моделью.In another embodiment of the proposed method, training data sets are assigned weights that are taken into account when training a density estimator and a data-driven model, and weights are updated by means of a density estimator and data-driven model trained in the corresponding iteration stage so that training data sets with lower confidence levels and large model errors acquire higher weights. Weights can be considered differently by a density estimator and a data-driven model. In one embodiment of the invention, weights represent probabilities processed by the density estimator and the data-driven model. For example, using a density estimator and / or a data-driven model, probabilistic training data sets can be selected for training. Probabilities can also be appropriately taken into account in the framework of training, for example, using the stochastic gradient rise method, which is used by a density estimator and a data-driven model.
Предложенный способ можно инициализировать по-разному. В одном варианте способ инициализируется частичным количеством наборов тренировочных данных, установленным, например, случайно. Точно так же способ может инициализироваться со всеми наборами тренировочных данных с подходящим образом установленными начальными весами.The proposed method can be initialized in different ways. In one embodiment, the method is initialized with a partial number of training data sets, set, for example, by chance. Similarly, a method can be initialized with all training data sets with suitably set initial weights.
Выявленные в рамках предложенного способа модельные ошибки могут быть представлены, например, абсолютной величиной отклонения воспроизведенного посредством управляемой данными модели набора данных или воспроизведенных эксплуатационных параметров набора данных от соответствующего набора тренировочных данных и соответствующих эксплуатационных параметров этого набора данных. Точно так же модельные ошибки могут представлять собой относительные отклонения, в случае которых определяется абсолютная величина отклонения по отношению к стандартному отклонению всех модельных ошибок наборов данных, воспроизводимых на соответствующем этапе итерации.Identified within the proposed method, model errors can be represented, for example, by the absolute deviation of the data set reproduced by the data-driven model or the reproduced operational data set parameters from the corresponding training data set and the corresponding operational parameters of this data set. Similarly, model errors can be relative deviations, in which case the absolute deviation is determined with respect to the standard deviation of all model errors of the data sets reproduced at the corresponding iteration stage.
Выдаваемый в предложенном способе доверительный уровень может быть также подходящим образом нормирован, например, по интервалу между нулем и единицей, причем значение «нуль» не представляет никакого доверия (т.е. низкую плотность данных), а значение «единица» - высокое доверие (т.е. высокую плотность данных).The confidence level issued in the proposed method can also be appropriately normalized, for example, by the interval between zero and one, and the value “zero” does not represent any confidence (ie, low data density), and the value “one” represents high confidence ( i.e. high data density).
Осуществляемая в рамках предложенного способа итерация может быть завершена на основе различных критериев. В одном предпочтительном варианте итерация завершается тогда, когда, по меньшей мере, одна заданная доля модельных ошибок наборов данных, отобранных или взвешенных для следующего этапа итерации, лежит ниже заданного порога, и/или когда, по меньшей мере, одна заданная доля доверительных уровней наборов данных, отобранных или взвешенных для следующего этапа итерации, лежит выше заданного порога. Таким образом, гарантируется окончание способа по достижению определенного минимального качества обученной, управляемой данными модели. При этом заданная доля может составлять, например, 95 или 99% или более всех модельных ошибок или доверительных уровней.The iteration carried out within the framework of the proposed method can be completed based on various criteria. In one preferred embodiment, the iteration ends when at least one predetermined fraction of the model errors of the data sets selected or weighted for the next iteration step lies below a predetermined threshold, and / or when at least one predetermined fraction of the confidence levels of the sets data selected or weighted for the next stage of the iteration lies above a predetermined threshold. Thus, the end of the method is guaranteed to achieve a certain minimum quality of a trained, data-driven model. In this case, a given fraction can be, for example, 95 or 99% or more of all model errors or confidence levels.
В другом варианте предложенного способа итерация завершается тогда, когда средняя модельная ошибка наборов данных, отобранных или взвешенных для следующего этапа итерации, больше не уменьшается по сравнению с предшествующим этапом итерации и/или когда все доверительные уровни наборов данных, отобранных или взвешенных для следующего этапа итерации, лежат выше заданного порога.In another embodiment of the proposed method, the iteration ends when the average model error of the data sets selected or weighted for the next iteration step no longer decreases compared to the previous iteration step and / or when all confidence levels of the data sets selected or weighted for the next iteration step lie above a given threshold.
Помимо описанного выше способа генерации управляемой данными модели изобретение относится далее к способу эксплуатации технической системы, при котором управляемая данными модель генерируется предложенным способом или генерирована его одним или несколькими предпочтительными вариантами, а затем используется для анализа эксплуатации технической системы и/или для воздействия (в частности, прямого воздействия) на нее.In addition to the method of generating a data-driven model described above, the invention further relates to a method of operating a technical system, in which a data-driven model is generated by the proposed method or generated by one or more preferred options, and then used to analyze the operation of the technical system and / or for exposure (in particular direct impact) on her.
В этом способе используется, тем самым, генерированная, согласно изобретению, управляемая данными модель в рамках реальной работы технической системы. При этом для генерации управляемой данными модели используется преимущественно вариант, в котором рассчитывается модель управления и/или регулирования или модель контроля. В этом случае техническая система регулируется и/или управляется с помощью модели управления и/или регулирования и/или контролируется с помощью модели контроля.This method uses, thereby, a model generated according to the invention, controlled by data, in the framework of the actual operation of a technical system. In this case, to generate a data-driven model, the predominant version is used in which a control and / or regulation model or control model is calculated. In this case, the technical system is regulated and / or controlled by the control and / or regulation model and / or controlled by the control model.
Помимо описанных способов изобретение относится далее к компьютерному программному продукту с хранящимся на машиночитаемом носителе программным кодом для осуществления предложенного способа или его одного или нескольких вариантов, если программный код выполняется на компьютере.In addition to the described methods, the invention further relates to a computer program product with program code stored on a computer-readable medium for implementing the proposed method or one or more variants thereof, if the program code is executed on a computer.
Примеры осуществления изобретения подробно описаны ниже со ссылкой на прилагаемые чертежи.Embodiments of the invention are described in detail below with reference to the accompanying drawings.
На фиг.1 изображена блок-схема первого варианта предложенного способа;Figure 1 shows a block diagram of a first variant of the proposed method;
на фиг.2 - блок-схема второго варианта предложенного способа.figure 2 is a block diagram of a second variant of the proposed method.
Описанные ниже варианты служат для генерации управляемой данными модели технической системы с использованием тренировочных данных, включающих в себя большое число наборов данных. Генерированные с помощью этих вариантов управляемые данными модели могут использоваться затем подходящим образом для расчета соответствующих моделей управления и/или регулирования или моделей контроля для технической системы, как это описано выше. Эти модели управления и/или регулирования или модели контроля могут затем использоваться в реальной работе технической системы, как это также описано выше. Особенно предпочтительным применением описанных ниже вариантов является при этом генерация управляемой данными модели газовой турбины или ветрогенератора.The options described below are used to generate a data-driven model of a technical system using training data, which includes a large number of data sets. The data-driven models generated using these options can then be used appropriately to calculate the appropriate control and / or regulation models or control models for the technical system, as described above. These control and / or regulation models or control models can then be used in the actual operation of the technical system, as also described above. A particularly preferred application of the options described below is the generation of a data-driven model of a gas turbine or wind generator.
В описанном здесь варианте отдельные наборы данных представляют собой векторы, включающие в себя большое число эксплуатационных параметров технической системы. Примеры таких эксплуатационных параметров были приведены выше для газовых турбин и ветрогенераторов. Эксплуатационные параметры векторов представляют собой в одном варианте следующие друг за другом по времени измеряемые величины и управляющие переменные технической системы, так что с помощью управляемой данными модели обучается динамическое поведение технической системы. Эксплуатационные параметры в тренировочных данных регистрировались в ее реальной работе и сохранялись в базе данных.In the embodiment described here, the individual data sets are vectors that include a large number of operational parameters of a technical system. Examples of such operational parameters were given above for gas turbines and wind generators. The operational parameters of the vectors are, in one embodiment, measured values and control variables of the technical system following one after another in time, so that the dynamic behavior of the technical system is trained using the data-driven model. The operational parameters in the training data were recorded in its real work and stored in the database.
Целью предложенного способа является извлечение релевантной информации из тренировочных данных и устранение избыточной информации для повышения качества управляемой данными модели, обучаемой с помощью тренировочных данных. В частности, при этом должно быть улучшено так называемое процентильное представление обученной модели. Это значит, что качество управляемой данными модели в рабочих диапазонах технической системы должно быть повышено с небольшим числом наборов данных.The aim of the proposed method is to extract relevant information from the training data and eliminate redundant information to improve the quality of the data-driven model that is trained using training data. In particular, the so-called percentile representation of the trained model should be improved. This means that the quality of the data-driven model in the operating ranges of the technical system should be improved with a small number of data sets.
На фиг.1 изображен вариант предложенного способа, при котором обрабатываются тренировочные данные TD, хранящиеся в соответствующей базе данных. Как уже сказано, эти тренировочные данные относятся к наборам данных в виде эксплуатационных параметров технической системы, причем при необходимости было предпринято предварительное фильтрование, так что обрабатываются только определенные, релевантные для управляемой данными модели эксплуатационные параметры наборов данных или только определенные наборы данных. Вариант на фиг.1 основан на той идее, что для обучения управляемой данными модели подходящим образом посредством выборки (т.е. взятия выборок) из тренировочных данных TD отбираются их частичные количества. При инициализации способа сначала происходит случайный отбор частичного количества тренировочных данных на этапе RS (Random Sampling - случайная выборка). Это частичное количество обозначено на фиг.1 RD (Reduced Dataset - уменьшенный набор данных). С помощью этого уменьшенного частичного количества обучается управляемая данными модель в виде нейронной сети или нейронной модели NM, причем для этого применяются известные методы обучения, например метод обучения с подкреплением.Figure 1 shows a variant of the proposed method, in which the training data TD stored in the corresponding database is processed. As already mentioned, this training data refers to data sets in the form of operational parameters of a technical system, and preliminary filtering was undertaken if necessary, so that only certain data set operational parameters relevant to the data-driven model or only certain data sets are processed. The embodiment of FIG. 1 is based on the idea that, for training a data-driven model in an appropriate manner, by sampling (i.e., taking samples) from the training data TD, partial quantities thereof are selected. When the method is initialized, the partial amount of training data is randomly selected at the RS stage (Random Sampling). This partial amount is indicated in FIG. 1 RD (Reduced Dataset - Reduced Dataset). Using this reduced partial amount, a data-driven model is trained in the form of a neural network or NM neural model, and for this, well-known teaching methods, for example, the reinforced learning method, are used.
Параллельно с помощью частичного количества обучается оценщик плотности или инкапсюлятор данных DE. В описанном здесь варианте в качестве инкапсюлятора данных используется известный из [1] оценщик плотности на основе нейронных облаков. Оценка плотности на основе этого метода известна и потому подробно не описана. Целью оценки плотности является определение для соответствующего набора или точки данных его/ее «новизны» в том отношении, насколько другие наборы тренировочных данных схожи с рассматриваемым набором данных, причем схожесть описывается расстоянием между наборами данных. Это расстояние определяется евклидовым расстоянием между точками данных в пространстве данных. С помощью оценщика плотности из [1] сначала осуществляется нормализация отдельных наборов или точек данных на основе метода нормализации по минимуму и максимуму. Затем происходит кластеризация точек данных на основе видоизменения известного из уровня техники алгоритма k-means (алгоритм k-средних), называемого также «продвинутый алгоритм k-means». Этот алгоритм создает центры кластеров в пространстве точек данных. На следующем этапе через центры прокладываются гауссовы колокола, после чего происходит их нормализация. В качестве конечного результата алгоритма получают обученный инкапсюлятор данных, определяющий доверие для соответствующего набора данных, которое представляет его схожесть с наборами тренировочных данных и оценивается в [1] как вероятность выхода из строя рассматриваемой технической системы.In parallel, a density estimator or DE data encapsulator is trained using a partial amount. In the embodiment described here, a density estimator based on neural clouds known from [1] is used as a data encapsulator. The density estimate based on this method is known and therefore not described in detail. The purpose of the density assessment is to determine for the corresponding data set or data point his / her “novelty” in the sense that other training data sets are similar to the data set in question, and the similarity is described by the distance between the data sets. This distance is determined by the Euclidean distance between data points in the data space. Using the density estimator from [1], normalization of individual data sets or data points is first carried out on the basis of the minimum and maximum normalization method. Then, data points are clustered based on a modification of the k-means algorithm known in the prior art (k-means algorithm), also called the “advanced k-means algorithm”. This algorithm creates cluster centers in the data point space. At the next stage, Gaussian bells are laid through the centers, after which they normalize. As the final result of the algorithm, a trained data encapsulator is obtained that determines the confidence for the corresponding data set, which represents its similarity to the training data sets and is estimated in [1] as the probability of failure of the technical system under consideration.
По окончании обучения нейронной сети NM наборы тренировочных данных воспроизводятся до модельной ошибки. При этом определенная доля эксплуатационных параметров набора данных обрабатывается в виде вектора ввода нейронной сети. Последняя выдает тогда иные эксплуатационные параметры соответствующего набора данных в виде вектора вывода. В результате различия между фактическим вектором вывода в соответствии с тренировочными данными и рассчитанным посредством нейронной сети вектором вывода возникает соответствующая модельная ошибка.Upon completion of training of the neural network NM, training data sets are reproduced before the model error. In this case, a certain fraction of the operational parameters of the data set is processed in the form of a neural network input vector. The latter then produces other operational parameters of the corresponding data set in the form of an output vector. As a result of the difference between the actual output vector in accordance with the training data and the output vector calculated by the neural network, a corresponding model error occurs.
В варианте на фиг.1 соответствующие доверительные уровни СМ инкапсюлятора данных DE и соответствующие модельные ошибки ME нейронной сети NM используются для осуществления взвешенной выборки WS. Для взвешенной выборки для всех наборов тренировочных данных TD определяются возникающая с обученной нейронной сетью модельная ошибка и возникающий за счет инкапсюлятора данных доверительный уровень. Для каждой комбинации этих значений для соответствующего набора данных устанавливается вероятность, причем вероятности для всех наборов данных нормированы на 1. При этом вероятности определяются подходящим образом так, что набор данных с низким доверительным уровнем имеет более высокую вероятность, чем набор данных с более высоким доверительным уровнем при одинаковой модельной ошибке. Кроме того, вероятности установлены таким образом, что набор данных с большой модельной ошибкой имеет большую вероятность, чем набор данных с меньшей модельной ошибкой при одинаковом доверительном уровне. Затем с этими вероятностями осуществляется выборка WS. При этом в результате выборки из тренировочных данных отбираются, скорее, такие наборы данных, которые имеют высокую степень новизны за счет низкого доверительного уровня или которые плохо воспроизводятся управляемой данными моделью.In the embodiment of FIG. 1, the corresponding CM confidence levels of the DE data encapsulator and the corresponding model errors ME of the NM neural network NM are used to carry out weighted sampling WS. For a weighted sample for all sets of training data TD, the model error that arises with the trained neural network and the confidence level that arises from the data encapsulator are determined. For each combination of these values, a probability is set for the corresponding data set, and the probabilities for all data sets are normalized to 1. Moreover, the probabilities are determined in such a way that a data set with a low confidence level has a higher probability than a data set with a higher confidence level with the same model error. In addition, the probabilities are established in such a way that a data set with a large model error has a higher probability than a data set with a lower model error at the same confidence level. Then, with these probabilities, WS is sampled. Moreover, as a result of sampling from training data, such data sets are selected that have a high degree of novelty due to the low confidence level or which are poorly reproduced by the data-driven model.
По окончании взвешенной выборки WS получают новое частичное количество наборов данных RD, которые на следующем этапе итерации используются для дальнейшего обучения инкапсюлятора данных DE и нейронной сети NM. После этого опять осуществляется новая взвешенная выборка WS, однако для этого соответствующие вероятности для нее устанавливаются заново посредством еще раз обученного инкапсюлятора данных и еще раз обученной нейронной сети. Наконец способ продолжается с заново генерированным частичным количеством наборов данных на следующем этапе итерации.At the end of the weighted sample WS, a new partial number of RD data sets is obtained, which in the next iteration step are used to further train the DE data encapsulator and the NM neural network. After this, a new weighted sample of WS is again carried out, however, for this, the corresponding probabilities for it are established again by means of the trained data encapsulator and the trained neural network. Finally, the method continues with the newly generated partial number of data sets in the next iteration step.
Итеративное обучение инкапсюлятора данных и нейронной сети завершается на основе подходящего критерия прекращения. Этот критерий установлен таким образом, что способ завершается тогда, когда для всех наборов данных заново генерированного частичного количества соответствующие модельные ошибки меньше заданного порогового значения, а соответствующие доверительные уровни выше заданного порогового значения. В качестве конечного результата способа получают обученную нейронную сеть, которая затем может быть использована для расчета модели управления и/или регулирования или модели контроля технической системы.The iterative training of the data encapsulator and neural network is completed based on an appropriate termination criterion. This criterion is established in such a way that the method ends when, for all data sets of the newly generated partial quantity, the corresponding model errors are less than the specified threshold value, and the corresponding confidence levels are higher than the specified threshold value. As the end result of the method, a trained neural network is obtained, which can then be used to calculate a control and / or regulation model or control model of a technical system.
На фиг.2 изображен второй вариант предложенного способа. В отличие от варианта на фиг.1 при обучении инкапсюлятора данных DE и нейронной сети NM всегда используются все наборы тренировочных данных TD (при необходимости подходящим образом предварительно отфильтрованных). Однако наборы данных подходящим образом взвешиваются с использованием обученных инкапсюлятора данных и нейронной сети. На фиг.2 способ вначале подходящим образом инициализируется, причем в рамках инициализации определяются соответствующие веса w1, w2, …, wN для N рассматриваемых наборов данных. Веса могут инициализироваться, например, случайно или со значением 1/N. Веса представляют собой в описанном варианте вероятности, которые учитываются инкапсюлятором данных DE и нейронной сетью NM.Figure 2 shows a second variant of the proposed method. In contrast to the embodiment of FIG. 1, when training an DE data encapsulator and an NM neural network, all TD training data sets (suitably pre-filtered if necessary) are always used. However, the data sets are suitably weighed using a trained data encapsulator and neural network. In Fig. 2, the method is initially initialized in a suitable manner, and within the initialization, the corresponding weights w1, w2, ..., wN are determined for the N data sets under consideration. Weights can be initialized, for example, randomly or with a value of 1 / N. Weights are probabilities in the described embodiment, which are taken into account by the DE data encapsulator and the NM neural network.
В отличие от варианта на фиг.1 все тренировочные данные учитываются без предварительного отбора. Посредством представленных весами вероятностей инкапсюлятор данных, соответствующий оценщику данных в [1], отбирает соответствующие наборы данных. Вероятности могут использоваться в инкапсюляторе данных при описанной выше нормализации, причем в соответствии с вероятностями отбираются наборы данных, учитываемые при нормализации. Точно так же вероятности могут использоваться при описанной выше кластеризации. При этом посредством вероятностей отбирается, какие наборы данных используются при нахождении центров кластеров. Точно так же вероятности могут использоваться при используемом в инкапсюляторе данных расчете расстояний между центрами кластеров. Также в этом случае посредством вероятностей устанавливается, какие наборы данных учитываются при расчете расстояний. В рамках нормализации, кластеризации и расчета расстояний соответственно используемые наборы данных могут определяться одноразово или заново отдельно для каждого из этих этапов.In contrast to the variant in figure 1, all training data are taken into account without prior selection. Using the probabilities weights presented, the data encapsulator corresponding to the data evaluator in [1] selects the corresponding data sets. Probabilities can be used in the data encapsulator in the normalization described above, and in accordance with the probabilities, the data sets taken into account during normalization are selected. Similarly, probabilities can be used in the clustering described above. In this case, using probabilities, which data sets are used to find the centers of the clusters. In the same way, probabilities can be used when calculating the distances between the centers of the clusters used in the data encapsulator. Also in this case, using probabilities, it is established which data sets are taken into account when calculating distances. As part of normalization, clustering, and distance calculation, the data sets used, respectively, can be determined once or again separately for each of these stages.
Кроме того, посредством весов отбираются наборы данных, учитываемые в рамках обучения нейронной сети. Например, при обучении на основе отбора наборов данных градиент может определяться известным методом стохастического градиентного подъема.In addition, by means of weights, data sets are taken into account as part of the training of a neural network. For example, when training based on the selection of data sets, the gradient can be determined by the well-known stochastic gradient rise method.
После обучения инкапсюлятора данных и нейронной сети осуществляется этап актуализации UP, на котором на основе обученных инкапсюлятора данных и нейронной сети заново рассчитываются первоначальные инициализированные веса. Это происходит по аналогии с фиг.1 за счет того, что для всех наборов тренировочных данных определяются соответствующие доверительные уровни инкапсюлятора данных и соответствующие модельные ошибки нейронной сети, за счет чего веса и вероятности выводятся таким образом, что вероятность тем выше, чем ниже доверительный уровень и чем больше модельная ошибка рассматриваемого набора данных. Установление соответствующей взаимосвязи, например, на основе функции, лежит в рамках действий специалиста. Например, посредством соответствующей функции можно моделировать линейную взаимосвязь.After training the data encapsulator and the neural network, the UP update stage is carried out, on which the initial initialized weights are re-calculated based on the trained data encapsulator and the neural network. This happens by analogy with figure 1 due to the fact that for all sets of training data the corresponding confidence levels of the data encapsulator and the corresponding model errors of the neural network are determined, due to which weights and probabilities are derived in such a way that the probability is higher, the lower the confidence level and the larger the model error of the dataset in question. The establishment of an appropriate relationship, for example, on the basis of a function, lies within the framework of the actions of a specialist. For example, a linear relationship can be modeled using the corresponding function.
Вариант на фиг.2 продолжается с актуализированными на этапе UP весами на следующем этапе итерации. На нем инкапсюлятор данных и нейронная сеть еще раз обучаются с учетом новых весов, а затем с обученными инкапсюлятором данных и нейронной сетью происходит новая актуализация весов. Этот итеративный способ завершается с помощью подходящего критерия прекращения, причем он по аналогии с фиг.1 установлен таким образом, что способ завершается тогда, когда возникающие для соответствующих наборов данных доверительные уровни инкапсюлятора данных лежат выше заданного порогового значения или возникающие для соответствующих наборов данных модельные ошибки нейронной сети лежат ниже заданного порогового значения. Обученная таким образом нейронная сеть может затем использоваться также для расчета модели управления или контроля соответствующей технической системы.The embodiment of FIG. 2 continues with the weights updated in the UP step in the next iteration step. On it, the data encapsulator and the neural network are once again trained with the new weights in mind, and then with the trained data encapsulator and the neural network, a new update of the weights takes place. This iterative method is completed using a suitable termination criterion, and it is set by analogy with FIG. 1 so that the method ends when the confidence levels of the data encapsulator for the corresponding data sets are higher than the specified threshold value or model errors occurring for the corresponding data sets neural networks lie below a predetermined threshold value. The neural network trained in this way can then also be used to calculate the control model or control of the corresponding technical system.
Описанные выше варианты предложенного способа обладают рядом преимуществ. В частности, из большого количества тренировочных данных можно выделить такие наборы данных, которые позволяют хорошо описать лежащую в основе наборов данных техническую систему. При этом за счет подходящего отбора частичных количеств наборов данных или взвешивания наборов данных можно обучить управляемую данными модель, которая лучше учитывает области с малым количеством наборов данных. Таким образом, лучше учитываются такие эксплуатационные состояния технической системы, которые отличаются от нормального эксплуатационного режима.The above options for the proposed method have several advantages. In particular, from a large amount of training data, one can distinguish such data sets that allow a good description of the underlying technical system. In this case, due to the appropriate selection of partial amounts of data sets or the weighting of data sets, it is possible to train a data-driven model that better takes into account areas with a small number of data sets. Thus, such operational conditions of the technical system that differ from the normal operating mode are better taken into account.
С помощью предложенного способа можно за счет отбора релевантных наборов данных достичь на основе тренировочных данных более быстрого обучения соответствующей управляемой данными модели. Кроме того, обученная, управляемая данными модель имеет лучшее процентильное представление, поскольку обучение происходит предпочтительно в областях с малым объемом данных. Хорошее процентильное представление имеет значение при корректном прогнозе ошибок во время работы технической системы.Using the proposed method, it is possible, through the selection of relevant data sets, to achieve, on the basis of training data, faster training of the corresponding data-driven model. In addition, a trained, data-driven model has a better percentile representation, since training takes place preferably in areas with a small amount of data. A good percentile representation is important with the correct prediction of errors during operation of the technical system.
Список литературыBibliography
[1] В. Lang et al., Neural Clouds for Monitoring of Complex Systems, Optical Memory and Neural Networks (Information Optics), 2008, Vol.17, No.3, S.183-192.[1] B. Lang et al., Neural Clouds for Monitoring of Complex Systems, Optical Memory and Neural Networks (Information Optics), 2008, Vol.17, No.3, S.183-192.
[2] M. Riedmiller, Neural Fitted Q Iteration - First Experiences with a Data Efficient Neural Reinforcement Learning Method, Proc. of the Eurorean Conf. on Machine Learning, 2005, S.317-328.[2] M. Riedmiller, Neural Fitted Q Iteration - First Experiences with a Data Efficient Neural Reinforcement Learning Method, Proc. of the Eurorean Conf. on Machine Learning, 2005, S.317-328.
Claims (24)
- для определенного числа этапов итерации посредством наборов данных из тренировочных данных (TD) обучают соответственно управляемую данными модель (NM) и оценщик плотности (DE), причем оценщик плотности (DE) выдает для наборов данных из тренировочных данных соответственно доверительный уровень (СМ), который тем выше, чем больше схожесть соответствующего набора данных с другими наборами данных из тренировочных данных (TD), и причем посредством управляемой данными модели (NM) воспроизводят наборы тренировочных данных соответственно с модельной ошибкой (ME),
- посредством оценщика плотности (DE) и управляемой данными модели (NM), обученными на соответствующем этапе итерации, отбирают или взвешивают наборы данных из тренировочных данных (TD) для обучения на следующем этапе итерации, причем наборы данных из тренировочных данных (TD) с низкими доверительными уровнями (СМ) и большими модельными ошибками (ME) отбирают скорее или взвешивают выше.1. A method for computer-generated generation of a data-driven model (NM) of a technical system, in particular a gas turbine or wind generator, for solving automated control and / or forecasting and / or regulation tasks, the data-driven model being generated based on training data, including a large number of data sets, which respectively represent several operational parameters of a technical system, in which:
- for a certain number of iteration steps, using a dataset from training data (TD), a data-driven model (NM) and a density estimator (DE) are trained respectively, and the density estimator (DE) generates a confidence level (CM) for the data sets from the training data, which is the higher, the greater the similarity of the corresponding data set with other data sets from training data (TD), and moreover, using the data-driven model (NM), training data sets are reproduced, respectively, with model data error (ME),
- by means of a density estimator (DE) and a data-driven model (NM) trained at the corresponding stage of iteration, data sets from training data (TD) are selected or weighted for training in the next stage of iteration, and data sets from training data (TD) with low confidence levels (CM) and large model errors (ME) are selected faster or weighted higher.
- температуру окружающего пространства, в котором эксплуатируют газовую турбину,
- влажность воздуха окружающего пространства, в котором эксплуатируют газовую турбину;
- давление воздуха в окружающем пространстве, в котором эксплуатируют газовую турбину;
- мощность газовой турбины, в частности процентное значение мощности;
- качество топлива газовой турбины;
- выброс газовой турбиной токсичных веществ, в частности выброс оксидов азота и/или моноксида углерода;
- температуру отходящих газов газовой турбины;
- динамику сгорания в газовой турбине.3. The method according to claim 1 or 2, in which the operational parameters of the technical system include one or more of the following measured values of a gas turbine:
- the temperature of the environment in which the gas turbine is operated,
- air humidity of the surrounding space in which the gas turbine is operated;
- air pressure in the surrounding space in which the gas turbine is operated;
- the power of the gas turbine, in particular the percentage value of power;
- fuel quality of a gas turbine;
- emission by a gas turbine of toxic substances, in particular emission of nitrogen oxides and / or carbon monoxide;
- temperature of the exhaust gases of the gas turbine;
- the dynamics of combustion in a gas turbine.
- положение одной или нескольких направляющих лопаток газовой турбины;
- количество подаваемого в газовую турбину газа;
- заданное значение температуры отходящих газов газовой турбины.4. The method according to claim 1 or 2, in which the operational parameters of the technical system include one or more of the following control variables of a gas turbine:
- the position of one or more guide vanes of the gas turbine;
- the amount of gas supplied to the gas turbine;
- set value of the temperature of the exhaust gases of a gas turbine.
- выработанную ветрогенератором электрическую мощность;
- скорость ветра в окружающем пространстве, в котором эксплуатируют ветрогенератор;
- частоту вращения ветрогенератора;
- изгибающие усилия, и/или отклонения, и/или знакопеременные нагрузки на лопастях ветрогенератора;
- вращение башни ветрогенератора.5. The method according to claim 1 or 2, in which the operational parameters of the technical system include one or more of the following measured values of a wind generator:
- electric power generated by the wind generator;
- wind speed in the surrounding space in which the wind generator is operated;
- frequency of rotation of the wind generator;
- bending forces, and / or deviations, and / or alternating loads on the blades of the wind generator;
- rotation of the tower of the wind generator.
- угол установки лопастей ветрогенератора;
- параметрическое поле ветрогенератора, которое представляет взаимосвязь между частотой вращения и выработанной ветрогенератором электрической мощностью.6. The method according to claim 1 or 2, in which the operational parameters of the technical system include one or more of the following control variables of the wind generator:
- the angle of installation of the blades of the wind generator;
- the parametric field of the wind generator, which represents the relationship between the rotational speed and the electric power generated by the wind generator.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE102011076936.6 | 2011-06-03 | ||
DE102011076936 | 2011-06-03 | ||
PCT/EP2012/060400 WO2012164075A2 (en) | 2011-06-03 | 2012-06-01 | Method for the computer-supported generation of a data-driven model of a technical system, in particular of a gas turbine or wind turbine |
Publications (2)
Publication Number | Publication Date |
---|---|
RU2013157156A RU2013157156A (en) | 2015-07-20 |
RU2575328C2 true RU2575328C2 (en) | 2016-02-20 |
Family
ID=
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5335291A (en) * | 1991-09-20 | 1994-08-02 | Massachusetts Institute Of Technology | Method and apparatus for pattern mapping system with self-reliability check |
RU2008152896A (en) * | 2008-01-08 | 2010-07-10 | Дженерал Электрик Компани (US) | METHODS AND SYSTEMS FOR MODELING NEURAL NETWORKS OF TURBINE COMPONENTS |
CN101819411A (en) * | 2010-03-17 | 2010-09-01 | 燕山大学 | GPU-based equipment fault early-warning and diagnosis method for improving weighted association rules |
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5335291A (en) * | 1991-09-20 | 1994-08-02 | Massachusetts Institute Of Technology | Method and apparatus for pattern mapping system with self-reliability check |
RU2008152896A (en) * | 2008-01-08 | 2010-07-10 | Дженерал Электрик Компани (US) | METHODS AND SYSTEMS FOR MODELING NEURAL NETWORKS OF TURBINE COMPONENTS |
CN101819411A (en) * | 2010-03-17 | 2010-09-01 | 燕山大学 | GPU-based equipment fault early-warning and diagnosis method for improving weighted association rules |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5832644B2 (en) | A computer-aided method for forming data-driven models of technical systems, in particular gas turbines or wind turbines | |
US20210383041A1 (en) | In-situ thermodynamic model training | |
Cui et al. | Wind power ramp event forecasting using a stochastic scenario generation method | |
CN107944648B (en) | Large ship speed and oil consumption rate prediction method | |
Yin et al. | Big data driven multi-objective predictions for offshore wind farm based on machine learning algorithms | |
CN110023850B (en) | Method and control device for controlling a technical system | |
JP7379833B2 (en) | Reinforcement learning methods, reinforcement learning programs, and reinforcement learning systems | |
US12037981B2 (en) | Wind turbine yaw offset control based on reinforcement learning | |
CN105046045B (en) | A kind of Web service QoS Forecasting Methodologies based on Bayes's combination | |
US20220186709A1 (en) | Reinforcement learning-based real time robust variable pitch control of wind turbine systems | |
EP3842635B1 (en) | Operating a wind turbine with sensors implemented by a trained machine learning model | |
CN113826125A (en) | Training machine learning models using unsupervised data enhancement | |
CN114696351A (en) | Dynamic optimization method and device for battery energy storage system, electronic equipment and storage medium | |
CN113906353A (en) | Method for computer-implemented determination of a drag coefficient of a wind turbine | |
CN113191526A (en) | Short-term wind speed interval multi-objective optimization prediction method and system based on random sensitivity | |
US20230366377A1 (en) | Method for controlling noise generated by a wind farm | |
RU2575328C2 (en) | Method for computer-aided generation of data-controlled model of engineering system, particularly gas turbine or wind turbine | |
CN109829591A (en) | A kind of dispatching method of wind-electricity integration, device, equipment and storage medium | |
KR20230076067A (en) | Energy menagement method and apparatus based on reinforcement learning | |
CN111245008B (en) | Wind field cooperative control method and device | |
CN117390418B (en) | Transient stability evaluation method, system and equipment for wind power grid-connected system | |
CN118012004B (en) | Multi-target test data generation method based on self-adaptive resonance topological network | |
EP3739525A1 (en) | Informed imperceptible exploration based on control-policies | |
Hamedon et al. | Optimizing photovoltaic output performance prediction: a deep learning approach with LSTM neural networks and Adam optimizer | |
CN118103855A (en) | Learning device, prediction system, learning method, prediction method, and prediction program |