RU2116663C1 - Method for regulation of dynamic objects - Google Patents

Method for regulation of dynamic objects Download PDF

Info

Publication number
RU2116663C1
RU2116663C1 RU95117260A RU95117260A RU2116663C1 RU 2116663 C1 RU2116663 C1 RU 2116663C1 RU 95117260 A RU95117260 A RU 95117260A RU 95117260 A RU95117260 A RU 95117260A RU 2116663 C1 RU2116663 C1 RU 2116663C1
Authority
RU
Russia
Prior art keywords
control
output coordinate
value
state
action
Prior art date
Application number
RU95117260A
Other languages
Russian (ru)
Other versions
RU95117260A (en
Inventor
Г.Г. Куликов
В.Ю. Арьков
Т.В. Брейкин
Original Assignee
Уфимский государственный авиационный технический университет
Куликов Геннадий Григорьевич
Арьков Валентин Юльевич
Брейкин Тимофей Витальевич
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Уфимский государственный авиационный технический университет, Куликов Геннадий Григорьевич, Арьков Валентин Юльевич, Брейкин Тимофей Витальевич filed Critical Уфимский государственный авиационный технический университет
Priority to RU95117260A priority Critical patent/RU2116663C1/en
Publication of RU95117260A publication Critical patent/RU95117260A/en
Application granted granted Critical
Publication of RU2116663C1 publication Critical patent/RU2116663C1/en

Links

Abstract

FIELD: automatic control of output coordinate of dynamic objects. SUBSTANCE: stochastic regulator is introduced into control circuit in order to take into account random fluctuations of environment and object characteristics. Method involves generation of linear array of constants X={x} which length is M and which covers complete range of output coordinate values x, and linear array of control actions U={u} which length is N. Then method involves generation of two- dimensional array of transition probabilities P= {p} which size is NxM. Each element P jk of this array represents estimation of probability of transition of controlled object from state {x k} during i-th control step to control objective, i.e. state
Figure 00000005
at control step (i+1), if control action u j has been applied at i-th step. Values of probabilistic estimations P are detected by analysis of a priori statistic data about operations of this instance of dynamic object. Then i-th control step uses output coordinate x(t i) for choice of value k which conforms to condition
Figure 00000006
and generation of control action U(ti+1) = Uj, using Monte Carlo method. Then this control action is applied to controlled object. Value of probabilistic estimation P jk is updated at step (i+1) using recurrent equation Pjk(ti+1) = λPjk(ti)+(1-λ)A(ti+1), where (ti+1)=1 for
Figure 00000007
and A(ti+1) = 0 otherwise, λ is a priori constant. These operations are repeated during each control step. EFFECT: increased dynamic precision of regulation of output coordinate of complex dynamic objects in steady-state condition. 1 dwg

Description

Изобретение относится к области автоматического регулирования, а именно к регулированию выходной координаты сложных динамических объектов. The invention relates to the field of automatic control, namely to control the output coordinate of complex dynamic objects.

Известен способ регулирования и устройство для его реализации, содержащее объект управления, выход которого соединен с инвертирующим входом блока сравнения выходной координаты с заданным значением, выход которого соединен с входом аналогового регулятора, выход которого соединен с входом объекта управления [1,с.269]. A known method of regulation and a device for its implementation, containing a control object, the output of which is connected to the inverting input of the comparison unit, the output coordinate with a given value, the output of which is connected to the input of an analog controller, the output of which is connected to the input of the control object [1, p.269].

Недостатком указанных способа и устройства является недостаточная точность регулирования. The disadvantage of this method and device is the lack of accuracy of regulation.

Наиболее близким техническим решением, выбранным за прототип, является способ регулирования путем измерения выходной координаты, сравнения измеренного значения с заданным, формирования управляющего сигнала на объект управления в соответствии с ошибкой регулирования выходной координаты [2, с. 250]. The closest technical solution chosen for the prototype is a control method by measuring the output coordinate, comparing the measured value with the given one, generating a control signal to the control object in accordance with the error of regulating the output coordinate [2, p. 250].

Операции этого способа осуществляются устройством [2. с. 250, рис. 7.4(б)] , содержащим объект управления, выход которого соединен с инвертирующим входом блока сравнения выходной координаты с заданным значением, выход которого соединен с входом детерминированного цифрового регулятора, выход которого соединен с входом объекта управления. The operations of this method are carried out by the device [2. from. 250, fig. 7.4 (b)], containing the control object, the output of which is connected to the inverting input of the unit for comparing the output coordinate with the set value, the output of which is connected to the input of the deterministic digital controller, the output of which is connected to the input of the control object.

Недостатком указанного способа является недостаточная точность регулирования, поскольку он не учитывает влияния случайных возмущений и флуктуаций внешней среды. The disadvantage of this method is the lack of accuracy of regulation, since it does not take into account the influence of random disturbances and fluctuations in the external environment.

Недостатком указанного устройства является то, что оно не позволяет учесть случайные возмущения и получить высокую точность регулирования, так как содержит детерминированный цифровой регулятор, а не стохастический. The disadvantage of this device is that it does not allow to take into account random disturbances and to obtain high accuracy of regulation, since it contains a deterministic digital controller, and not a stochastic one.

Задачей, на решение которой направлено заявляемое изобретение, является повышение динамической точности регулирования выходной координаты сложных динамических объектов на установившихся режимах за счет введения в контур управления адаптивного стохастического регулятора, учитывающего случайные флуктуации внешней среды и параметров объекта. The problem to which the invention is directed is to increase the dynamic accuracy of controlling the output coordinate of complex dynamic objects in steady-state conditions by introducing an adaptive stochastic controller into the control loop that takes into account random fluctuations in the external environment and object parameters.

Поставленная задача решается способом регулирования динамических объектов путем измерения выходной координаты x объекта управления, сравнения измеренного значения с заданным, формирования управляющего сигнала на объект управления в соответствии с ошибкой регулирования выходной координаты εx, в отличие от прототипа сначала формируют одномерный массив постоянных значений Х={x} размерностью М, охватывающий весь диапазон возможных изменений выходной координаты объекта управления x, и одномерный массив значений управляющего воздействия U={u} размерностью N, на основании этих двух одномерных массивов строят двумерный массив переходных вероятностей P={P}, размерностью NxM, каждый элемент которого Pjk отражает оценку вероятности перехода объекта управления из состояния {xk} на i-том шаге управления в цель управления, то есть в состояние

Figure 00000008
на (i+1)-м шаге управления под действием на i-том шаге управления управляющего воздействия Uj, причем значения оценок вероятностей P определяют из анализа априорных статистических данных о работе данного конкретного динамического объекта, затем на установившихся режимах на каждом i-том шаге управления по величине выходной координаты x(ti) выбирают значение k из условия
Figure 00000009
и формируют значение управляющей координаты U(ti+1)=Uj на основе метода Монте-Карло, после чего подают его на объект управления, причем на каждом (i+1)-м шаге управления обновляют значение оценки вероятности Pjk по рекурентной формуле Pjk(ti+1) = λPjk(ti)+(1-λ)A(ti+1), где A(ti+1)= 1 при выполнении условия
Figure 00000010
и A(tj+1)=0 во всех остальных случаях, а λ - заранее заданная постоянная величина, причем перечисленные операции повторяют на каждом шаге управления.The problem is solved by the method of controlling dynamic objects by measuring the output coordinate x of the control object, comparing the measured value with the given one, generating a control signal on the control object in accordance with the control error of the output coordinate ε x , in contrast to the prototype, first create a one-dimensional array of constant values X = { x} dimension M, covering the entire range of possible changes in the output coordinate of the control object x, and a one-dimensional array of values of the control action U = {u} dimension N, based on the two-dimensional arrays build a two-dimensional array of transition probabilities P = {P}, dimension NxM, each element P jk reflects the estimate of the probability of transition of the control object from the state {x k} for i-that step control in the goal of management, that is, in the state
Figure 00000008
at the (i + 1) th control step under the action of the control action U j at the i-th control step, and the values of the probability estimates P are determined from the analysis of a priori statistical data on the operation of this particular dynamic object, then at steady-state modes at each i-th the control step by the value of the output coordinate x (t i ) select the value of k from the condition
Figure 00000009
and form the value of the control coordinate U (t i + 1 ) = U j based on the Monte Carlo method, after which it is fed to the control object, and at each (i + 1) th control step, the value of the probability estimate P jk by the formula P jk (t i + 1 ) = λP jk (t i ) + (1-λ) A (t i + 1 ), where A (t i + 1 ) = 1 under the condition
Figure 00000010
and A (t j + 1 ) = 0 in all other cases, and λ is a predetermined constant, and the above operations are repeated at each control step.

На чертеже представлена блок-схема устройства, реализующего заявляемый способ. The drawing shows a block diagram of a device that implements the inventive method.

Устройство содержит (см. фиг. 1) объект управления 1, выход которого соединен с инвертирующим входом блока сравнения 2 выходной координаты x с заданным значением xзад, выход которого соединен с входом детерминированного регулятора 3, выход которого соединен с первым входом ключа 4, второй вход которого соединен с выходом стохастического регулятора 5, а выход соединен с входом объекта управления 1, выход которого соединен также с первым входом стохастического регулятора 5 и с входом схемы управления ключом 6, выход которой соединен с управляющим входом ключа 4, а второй вход стохастического регулятора 5 соединен с выходом генератора 7 случайных чисел.The device contains (see Fig. 1) a control object 1, the output of which is connected to the inverting input of the comparison unit 2, the output coordinate x with the given value x ass , the output of which is connected to the input of the deterministic controller 3, the output of which is connected to the first input of the key 4, the second the input of which is connected to the output of the stochastic controller 5, and the output is connected to the input of the control object 1, the output of which is also connected to the first input of the stochastic controller 5 and to the input of the control circuit of key 6, the output of which is connected to the control m key input 4, and the second input of the stochastic controller 5 is connected to the output of the random number generator 7.

Способ реализуют следующим образом. Сигнал, соответствующий выходной координате, с объекта управления 1 поступает на блок сравнения 2 выходной координаты x с заданным значением xзад, где формируется сигнал, соответствующий ошибке регулирования выходной координаты εx , который поступает в детерминированный регулятор 3, где формируется управляющий сигнал, который через ключ 4 подается на объект управления 1. На установившихся режимах работы объекта управления схема управления ключом 6 переключает ключ 4 и в контур управления включается стохастический регулятор 5, в котором заранее из анализа априорной информации о работе данного конкретного объекта управления на данном установившемся режиме формируют одномерный массив постоянных значений X= { x} размерностью М, охватывающий весь диапазон возможных изменений выходной координаты объекта управления x, и одномерный массив значений управляющего воздействия U= {u} размерностью N, на основании этих двух одномерных массивов строят двумерный массив переходных вероятностей P={P}, размерностью NxM, каждый элемент которого Pjk отражает оценку вероятности перехода объекта управления из состояния {xk} на i-том шаге управления в цель управления, то есть в состояние

Figure 00000011
- заранее заданная постоянная величина) на (i+1)-м шаге управления под действием на i-том шаге управления управляющего воздействия uj, причем значения оценок вероятностей P также определяют из анализа априорных статистических данных о работе данного конкретного динамического объекта на данном установившемся режиме. Затем на каждом i-том шаге управления по величине выходной координаты x(ti) выбирают значение k из условия
Figure 00000012
и формируют значение управляющей координаты u(ti+1)=uj на основе метода Монте-Карло [3, c.87-91], после чего подают его через ключ на объект управления. Генератор 7 случайных чисел служит для реализации метода Монте-Карло. Он генерирует на каждом шаге управления сигнал, соответствующий случайной переменной, равномерно распределенной на интервале от 0 до 1. Этот сигнал поступает в стохастический регулятор 5, где на основе величины этого сигнала и вектора оценок вероятностей PJk, с известным значением индекса k определяется значение индекса j, а по значению индекса j определяется значение управляющего воздействия на (i+1)-м шаге (u(ti+1)= uj, которое подается на объект управления. Далее на каждом (i+1)-м шаге управления обновляют оценки вероятности Pjk по рекурентной формуле Pjk(ti+1) = λPjk(ti)+(1-λ)A(ti+1) , где A(ti+1)=1 при выполнении условия
Figure 00000013
и A(ti+1)=0 во всех остальных случаях, а λ - заранее заданная постоянная величина. Затем повторяют процесс управления, выполняя на каждом его шаге описанную последовательность действий.The method is implemented as follows. The signal corresponding to the output coordinate from control object 1 is sent to the comparison unit 2 of the output coordinate x with a given value x ass , where a signal is generated corresponding to the control error of the output coordinate ε x , which enters the deterministic controller 3, where a control signal is generated, which the key 4 is supplied to the control object 1. At steady state operating modes of the control object, the key management circuit 6 switches the key 4 and the stochastic controller 5 is turned on in the control loop, in which Then, from the analysis of a priori information about the operation of this particular control object in this steady state, a one-dimensional array of constant values X = {x} of dimension M is formed, covering the entire range of possible changes in the output coordinate of the control object x, and a one-dimensional array of values of the control action U = {u} dimension N, on the basis of these two one-dimensional arrays, construct a two-dimensional array of transition probabilities P = {P}, dimension NxM, each element of which P jk reflects an estimate of the probability of transition of the object of control failures from the state {x k } at the i-th control step to the control target, that is, to the state
Figure 00000011
- a predetermined constant value) at the (i + 1) -th control step under the action of the control action u j at the i-th control step, and the values of probability estimates P are also determined from the analysis of a priori statistical data on the operation of this particular dynamic object at a given steady state mode. Then, at each i-th control step, the value of the output coordinate x (t i ) selects the value k from the condition
Figure 00000012
and form the value of the control coordinate u (t i + 1 ) = u j based on the Monte Carlo method [3, p. 87-91], and then feed it through the key to the control object. 7 random number generator is used to implement the Monte Carlo method. It generates at each control step a signal corresponding to a random variable uniformly distributed over the interval from 0 to 1. This signal enters the stochastic controller 5, where, based on the magnitude of this signal and the probability estimation vector P Jk , the index value is determined with the known index value k j, and from the value of index j, the value of the control action at the (i + 1) -th step (u (t i + 1 ) = u j , which is supplied to the control object, is determined. Then, at each (i + 1) -th control step update the probability estimates P jk for the recurrence form the mule P jk (t i + 1 ) = λP jk (t i ) + (1-λ) A (t i + 1 ), where A (t i + 1 ) = 1 under the condition
Figure 00000013
and A (t i + 1 ) = 0 in all other cases, and λ is a predetermined constant. Then the control process is repeated, performing at each step the described sequence of actions.

Использование предлагаемого способа регулирования динамических объектов обеспечивает по сравнению с прототипом следующие преимущества:
а) обеспечивается более высокая точность регулирования на установившихся режимах:
б) режим работы объекта управления приближается к оптимальному, вследствие чего увеличивается его долговечность.
Using the proposed method for regulating dynamic objects provides the following advantages compared to the prototype:
a) provides higher accuracy control at steady state:
b) the operating mode of the control object approaches optimal, as a result of which its durability increases.

Источники информации, принятые во внимание
1. Теория автоматического управления. Ч.1. Под ред. А.В.Нетушила. М.: Высшая шкала, 1967.
Sources of information taken into account
1. Theory of automatic control. Part 1. Ed. A.V. Netushila. M .: Highest scale, 1967.

2. Многоуровневое управление динамическими объектами. Васильев В.И. и др. М.: Наука, 1987. 2. Multilevel management of dynamic objects. Vasiliev V.I. et al. M .: Nauka, 1987.

3. Шеннон Р. Имитационное моделирование систем - искусство и наука. М.: Мир, 1978. 3. Shannon R. Simulation systems - art and science. M .: Mir, 1978.

Claims (1)

Способ регулирования динамических объектов путем измерения выходной координаты х, сравнения измеренного значения с заданным, формирования управляющего воздействия на объект управления в соответствии с ошибкой регулирования выходной координаты εx, отличающийся тем, что сначала формируют одномерный массив постоянных значений Х = {х} размерностью М, охватывающий весь диапазон возможных изменений выходной координаты объекта управления х, и одномерный массив значений управляющего воздействия U = {u} размерностью N, на основании этих двух одномерных массивов строят двумерный массив переходных вероятностей Р = {Р} размерностью N x M, каждый элемент которого Рjk отражает оценку вероятности перехода объекта управления из состояния {xk} на i-том шаге управления в состояние
Figure 00000014
на (i + 1)-том шаге управления под действием на i-том шаге управления управляющего воздействия Uj, причем значения оценок вероятностей Р определяют из анализа априорных статистических данных о работе данного конкретного динамического объекта, затем на установившихся режимах на каждом i-том шаге управления по величине измеренной выходной координаты x(ti) выбирают значение k из условия k = arg min/x(ti) - xk/ и формируют значение управляющего воздействия U(ti+1) = Uj на объект управления на основе метода Монте-Карло, причем на каждом (i+1)-том шаге управления обновляют значение оценки вероятности Pjk по рекурентной формуле
Pjk(ti+1) = λPjk(ti)+(1-λ)A(ti+1),
где A(ti+1) = 1 при выполнении условия
Figure 00000015
и A(ti+1) = 0 во всех остальных случаях;
λ - заранее заданная постоянная величина.
The method of regulating dynamic objects by measuring the output coordinate x, comparing the measured value with the given one, generating a control action on the control object in accordance with the error in regulating the output coordinate ε x , characterized in that they first form a one-dimensional array of constant values X = {x} of dimension M, covering the entire range of possible changes in the output coordinate of the control object x, and a one-dimensional array of control values U = {u} of dimension N, based on these two number arrays construct a two-dimensional array of transition probabilities P = {P} of dimension N x M, each element of which P jk reflects an estimate of the probability of transition of the control object from state {x k } at the i-th control step to the state
Figure 00000014
at the (i + 1) -th control step under the action of the control action U j at the i-th control step, and the values of the probability estimates P are determined from the analysis of a priori statistical data on the operation of this particular dynamic object, then at steady-state conditions on each i-th the control step by the value of the measured output coordinate x (t i ) select the value of k from the condition k = arg min / x (t i ) - x k / and form the value of the control action U (t i + 1 ) = U j on the control object based on the Monte Carlo method, and at each (i + 1) -th step is controlled I update the value estimating the probability P jk of recurrently formula
P jk (t i + 1 ) = λP jk (t i ) + (1-λ) A (t i + 1 ),
where A (t i + 1 ) = 1 under the condition
Figure 00000015
and A (t i + 1 ) = 0 in all other cases;
λ is a predetermined constant.
RU95117260A 1995-10-10 1995-10-10 Method for regulation of dynamic objects RU2116663C1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
RU95117260A RU2116663C1 (en) 1995-10-10 1995-10-10 Method for regulation of dynamic objects

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
RU95117260A RU2116663C1 (en) 1995-10-10 1995-10-10 Method for regulation of dynamic objects

Publications (2)

Publication Number Publication Date
RU95117260A RU95117260A (en) 1998-02-20
RU2116663C1 true RU2116663C1 (en) 1998-07-27

Family

ID=20172703

Family Applications (1)

Application Number Title Priority Date Filing Date
RU95117260A RU2116663C1 (en) 1995-10-10 1995-10-10 Method for regulation of dynamic objects

Country Status (1)

Country Link
RU (1) RU2116663C1 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2623464C2 (en) * 2015-07-22 2017-06-26 Акционерное общество "Научно-производственное объединение автоматики имени академика Н.А. Семихатова" Method of identifying characteristics and disturbances of dynamic objects in stochastic automatic control systems

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Васильев В.И. и др. Многоуровневое управление динамическими объектами. - М.: Наука, 1987, с. 250. *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2623464C2 (en) * 2015-07-22 2017-06-26 Акционерное общество "Научно-производственное объединение автоматики имени академика Н.А. Семихатова" Method of identifying characteristics and disturbances of dynamic objects in stochastic automatic control systems

Similar Documents

Publication Publication Date Title
Wang et al. Adaptive Gaussian process approximation for Bayesian inference with expensive likelihood functions
CA2104949C (en) Dynamical system analyser
Zhang et al. Analytical distribution and tunability of noise in a model of promoter progress
EP0631212B1 (en) Chaos feedback system
JPH11509344A (en) A method for optimal scaling of variables in a multivariable predictive controller using range control
Sutton et al. On step-size and bias in temporal-difference learning
EP0938711B1 (en) Improved neural network
Hanuka et al. Online tuning and light source control using a physics-informed Gaussian process Adi
Espinoza et al. A comparative study of LS-SVM’s applied to the silver box identification problem
RU2116663C1 (en) Method for regulation of dynamic objects
Höskuldsson The H-principle in modelling with applications to chemometrics
US5963888A (en) Fast method and apparatus for nonlinearly transforming mean and covariance estimates
Dodd Slow annealing versus multiple fast annealing runs—an empirical investigation
US6029157A (en) Method for determining state parameters of a chemical reactor with artificial neural networks
Ueda et al. A broadcast-probability approach to the control of vast DOF cellular actuators
RU2094837C1 (en) Method for control of dynamic objects
CN114819113A (en) SNN training method and device, storage medium, chip and electronic device
JPH0793289A (en) Chaos processor
US11747774B2 (en) Search device, search program, and plasma processing apparatus
Gao et al. Total decay width of $ H\to gg $ using the infinite-order scale-setting approach based on the intrinsic conformality
RU2675281C1 (en) Method of identification of linear dynamic system
RU95117260A (en) METHOD FOR REGULATING DYNAMIC OBJECTS AND DEVICE FOR ITS IMPLEMENTATION
Jaurigue Chaotic attractor reconstruction using small reservoirs-the influence of topology
EP0620526A1 (en) Method and apparatus for estimating unknown numeric quantity
Ko et al. Homotopy-based training of NeuralODEs for accurate dynamics discovery