ES2297964B1

ES2297964B1 - Filtro incremental inteligente.

Info

Publication number: ES2297964B1
Application number: ES200500492A
Authority: ES
Inventors: Angel Carpeño Velayos
Original assignee: Individual
Current assignee: Individual
Priority date: 2005-03-03
Filing date: 2005-03-03
Publication date: 2009-08-25
Anticipated expiration: 2025-03-03
Also published as: ES2297964A1

Abstract

Filtro incremental inteligente.

Nuevo sistema de procesamiento digital de señales en tiempo real o nueva clase de filtro IIR adaptativo, dirigido al modelado robusto y estable de cualquier tipo de proceso con el fin de realizar su aplicación principalmente en el campo del control automático de sistemas, caracterizado porque:

a) La estructura del filtro para modelar o predecir en tiempo real la dinámica instantánea de cualquier sistema físico mono o multivariable es un modelo lineal que utiliza valores incrementales de los vectores de entrada y salida del proceso.

b) La trayectoria guía de referencia o de aprendizaje tiene que ser limitada y físicamente realizable con ganancia estática unidad, y tiene que reinicializarse constantemente con las salidas medidas del proceso.

c) El nuevo algoritmo de aprendizaje se obtiene de hacer nulo el error instantáneo de estimación entre el incremento de la salida del proceso y el incremento de la salida producida por el modelo incremental del filtro.

Description

Filtro incremental inteligente.

Sector de la técnica

La presente invención se encuadra en el sector técnico del tratamiento digital de señales en tiempo real, dirigido al modelado robusto y estable de cualquier tipo de proceso con el fin de realizar su aplicación principalmente en el campo del control automático de sistemas.

Estado de la técnica

El tratamiento digital de señales en tiempo real dirigido al modelado lineal de procesos, implementa métodos recursivos de aprendizaje que intentan la rápida convergencia entre la salida del proceso y la salida predicha por sus modelos cuando ambos son sometidos a la misma señal de excitación o control con el fin de hacer seguir al proceso una determinada trayectoria de referencia hacia un valor constante de consigna u operación del sistema, siendo el error instantáneo entre la salida del proceso y la trayectoria de referencia la base para el ajuste recursivo de los parámetros de los modelos lineales de estos métodos.

Actualmente, estos métodos están basados en la perspectiva de la optimización, cuyos ejemplos más significativos son el de los Mínimos Cuadrados y el Filtro de Kalman, o en la estimación paramétrica del gradiente, cuyos ejemplos más significativos son el Filtro de Wiener, LMS (Least Mean Square) y RLS (Recursive Least Squares).

Los métodos basados en la perspectiva de la optimización dan el mismo peso a toda la información de entradas y salidas en la minimización de su índice de rendimiento, en consecuencia, estos métodos pierden con el tiempo su capacidad de aprendizaje y no se puede esperar de ellos un rendimiento satisfactorio si los parámetros del proceso varían a lo largo del tiempo.

Es decir, estos métodos van perdiendo su capacidad de aprendizaje cuando el proceso no cumple las condiciones de filtrado óptimo, las cuales requieren la invariabilidad o estacionariedad del proceso.

La introducción del denominado Factor de Olvido intenta superar la problemática previamente descrita, dando menos peso a la información pasada e impidiendo la tendencia de disminución de la capacidad de aprendizaje de estos algoritmos de optimización. Sin embargo, de esta forma, se puede dar menos peso o dejar de tener en cuenta información valiosa para la identificación de los parámetros del modelo lineal del proceso y dar más peso o llegar a resolver la minimización del índice de rendimiento con información poco significativa.

Los métodos del gradiente están basados en que la actualización de los parámetros del modelo del proceso se realiza tomando la dirección contraria del gradiente de la hipersuperficie de error cuadrático medio en función de los parámetros del modelo en el correspondiente valor actual de estos parámetros y moverse sobre dicha hipersuperficie en la citada dirección una determinada cantidad, con el fin de ir acercándose al mínimo de dicha hipersuperficie. La anterior cantidad se denomina "step-size" o paso de adaptación y determina la velocidad de aprendizaje que se desea imprimir al sistema.

Los métodos de gradiente no presentan problemas cuando el proceso puede ser modelado mediante un Filtro de Respuesta Impulsiva Finita (FIR), ya que la función de transferencia de estos filtros no tiene polos y en consecuencia la hipersuperficie de error cuadrático medio tiene un único mínimo.

No obstante, los FIRs en si mismo presentan algunas limitaciones, que hacen pensar en la necesidad de utilizar Filtros de Respuesta Impulsiva Infinita (IIRs), filtros con ceros y polos en su función de transferencia.

Por ejemplo, supóngase que un canal utilizado para transmitir una señal d(n) introduce un eco, de forma que la señal recibida es:

1

donde |\alpha| < 1 es la atenuación y N es el retardo asociado al canal.

La función de transferencia en el Plano Z de la señal recibida es:

\vskip1.000000\baselineskip

2

Si \alpha y N fueran conocidos, el cancelador ideal para recuperar la señal d(n) de la señal recibida u(n) sería un filtro IIR con una función de transferencia de la forma:

3

Como generalmente \alpha y N no son conocidos y posiblemente varíen con el tiempo, sería más apropiado utilizar para el cancelador de eco un filtro IIR adaptativo que un filtro FIR.

Aunque sería posible utilizar un filtro FIR, el orden del mismo para lograr una buena estimación de d(n) sería demasiado alto. Para observar esta afirmación, se puede expandir H(z) en una serie geométrica de la siguiente
forma:

\vskip1.000000\baselineskip

4

\vskip1.000000\baselineskip

Si p es suficientemente grande, de modo que |\alpha|^{p} << 1, se puede truncar la serie anterior, obteniéndose una aproximación con un número finito de términos:

5

A partir de esta función de transferencia se puede considerar para el cancelador de eco un filtro FIR adaptativo o variable con el tiempo de la forma:

6

donde b_{n} (i) es el coeficiente i en el instante de tiempo n.

Sin embargo, si \alpha \approx 1 (lo que origina que p sea grande), o si N >> 1, entonces el orden del filtro N_{p} necesario para obtener una buena aproximación sería demasiado alto como para considerarlo una solución viable.

Además, el gran número de coeficientes implica costos computacionales altos, mucha memoria, y acumulación de errores numéricos asociados a la gran cantidad de parámetros ajustables. En cambio, un filtro IIR con pocos parámetros, consiguientemente con poca carga computacional, lograría resultados notoriamente mejores, al contener implícitamente todos los términos de la serie.

Sin embargo, los IIRs adaptativos o variables con el tiempo presentan algunas dificultades que limitan, en un principio, su utilización en filtrado con aprendizaje, principalmente se presentan dos problemas:

\bullet: Estabilidad: Al presentar una función de transferencia con polos, cuyos coeficientes son recalculados en cada iteración del algoritmo de aprendizaje del gradiente, en principio, no se puede asegurar que el filtro permanezca estable.

: Los polos y ceros de la función de transferencia se irán moviendo en el plano complejo conforme se aplica el algoritmo, para garantizar la estabilidad tanto de la función de transferencia del modelo [y(z)/u(z)] como de su inversa [u(z)/y(z)] estos polos y ceros deberán permanecer dentro del circulo unidad, sino, el filtro y su inversa se volverán inestables.

: Es por esto, que frecuentemente se hace necesario, un mecanismo de monitoreo de la ubicación de los polos y ceros del filtro, para asegurar su estabilidad directa e inversa, lo que implica un mayor número de cálculos a realizar en cada iteración.

\bullet: Convergencia: Las hipersuperficies de error cuadrático medio de los IIRs adaptativos no presentan un único mínimo como en el caso de los FIRs. Son en general superficies no conexas, que presentan por lo tanto mínimos locales. Como los algoritmos del gradiente son sensibles a las condiciones iniciales, la solución puede converger a un mínimo local, resultando una solución sub-óptima.

Con frecuencia multitud de procesos críticos en el mundo del control automático son de dinámica variable con el tiempo e incluso desconocida, multivariables con interacciones desconocidas entre sus entradas y salidas, no lineales, con retardos variables con el tiempo y están sometidos a ruidos y perturbaciones aleatorias. En este contexto cabe la pregunta: ¿Existe actualmente metodologías de procesamiento digital de señales o filtrado que puedan garantizar de forma práctica y sencilla el modelado robusto y estable en tiempo real de este tipo de procesos sin presentar los problemas de perdida de capacidad de aprendizaje de los métodos basados en la perspectiva de la optimización, o los problemas de estabilidad y convergencia de los métodos basados en el algoritmo del gradiente?. El objetivo del Filtro Incremental Inteligente objeto de esta patente es responder a esta pregunta, lo que se presenta como una línea de interés estratégico en el mundo del control automático.

Descripción detallada de la invención

El Filtro Incremental Inteligente es una nueva clase de Filtro IIR Adaptativo o método de procesamiento digital de señales en tiempo real caracterizado porque:

a): La estructura del modelo o filtro seleccionada para modelar o predecir en tiempo real la dinámica instantánea de cualquier sistema físico mono o multivariable utiliza valores incrementales de los vectores de control, salida y perturbaciones medibles con respecto a sus valores en un instante o varios instantes de filtrado o control anteriores, y tiene en cuenta los retardos puros o variables de las variables de entrada (vectores de control y de las perturbaciones medibles) al proceso respecto a sus variables de salida.

b): Selecciona una trayectoria guía de referencia con ganancia estática unidad para guiar al proceso hasta cualquier valor constante de consigna u operación, que pude variar su velocidad de aproximación a dicho punto de consigna durante la operación de filtrado, pero que durante esta operación de filtrado se reinicializa constantemente con las salidas medidas del proceso.

Como se demostrará posteriormente el cumplimiento conjunto de estas dos primeras características del Filtro Incremental Inteligente asegurará que no sea necesario conocer ninguna característica del proceso para garantizar que la salida de éste tienda hacia el constante punto de consigna deseado, es decir, para garantizar la estabilidad y la convergencia, y también garantizará la cancelación de perturbaciones constantes que darían lugar a potenciales desviaciones del punto de consigna, sin hacer ninguna suposición sobre los errores de modelado lo que da robustez a esta metodología de filtrado.

Todo esto justifica porque el Filtro Incremental Inteligente objeto de esta patente selecciona esta estructura incremental para modelar las interrelaciones entre las variables de entrada y salida del proceso, y esta estructura variable para la trayectoria guía de referencia.

c): Definiendo:

\bullet: El Error de Estimación "a priori" [e(k/k-1)] como la diferencia entre el incremento de la salida del proceso y el incremento de la salida producida por el modelo incremental de este filtro sin ajustar por el mecanismo de aprendizaje cuando ambos reciben el mismo incremento de la señal de control calculada en un instante de filtrado o de control anterior con el fin de guiar al proceso según cualquier trayectoria guía de referencia limitada y físicamente realizable.

\bullet: Y el Error de estimación "a posteriori" [e(k/k)] como la diferencia entre el incremento de la salida del proceso y el incremento de la salida producida por el modelo incremental de este filtro ya ajustado por el mecanismo de aprendizaje cuando ambos reciben el mismo incremento de la señal de control calculada en un instante de filtrado o de control anterior con el fin de guiar al proceso según cualquier trayectoria guía de referencia limitada y físicamente realizable.

El nuevo mecanismo de aprendizaje no responde a ningún algoritmo de identificación paramétrica basado en la perspectiva de optimación o en el algoritmo del gradiente, sino a un nuevo algoritmo de ajuste paramétrico basado en garantizar en cada instante consecutivo de filtrado la reducción del error de estimación "a posteriori" [e(k/k)], independientemente de la invariabilidad o estacionariedad del proceso, mediante la descomposición del vector error de estimación "a priori" [e(k/k-1)] en la combinación lineal de dos sumandos que verifiquen las siguientes condiciones:

1.: Uno de los sumandos producto de esta descomposición cumplirá en cada instante de filtrado o de control la condición de hacer nulo el error de estimación "a priori" [e(k/k-1)].

2.: Y el otro sumando producto de esta descomposición en cada instante de filtrado o de control cumplirá la condición de ser igual al error de estimación "a priori" [e(k/k-1)] definido anteriormente.

Del cumplimiento de la primera condición se deducirá el nuevo algoritmo de aprendizaje.

Modelo del filtro incremental inteligente

Para modelar el sistema o predecir su salida en cada instante de filtrado o de control, se utilizará un modelo lineal para representar las interrelaciones entre las variables de entrada y salida del proceso, esta linealización estará representada por el siguiente modelo en incrementos Autorregresivo de Promedios Móviles (ARMA) o Filtro IIR en Incrementos:

7

donde:

8

En este modelo lineal instantáneo seleccionado para el proceso:

\bullet: \Delta\hat{y}(k +1/k) representa la estimación del incremento de la variable de salida del proceso (el circunflejo sobre \Deltay(k+1/k) es el distintivo de "estimada") en el instante de filtrado o de control k+1, con los datos obtenidos hasta el instante de control anterior k, y se obtiene a partir del valor en k de los parámetros de adaptación del modelo del proceso, a_{i}(k), b_{i}(k) y c_{i}(k), y de los valores medidos de los incrementos de la salida del proceso \Deltay(k+1-i) y de las perturbaciones medibles que actúan sobre dicha salida \Deltaw(k+1-i-Rw) y de los calculados de la señal de control \Deltau(k+1-i- Ru), en los sucesivos instantes de tiempo (k+1-i).

: Todos los parámetros anteriores pueden ser escalares (Procesos Monovariables, SISO: Single Input-Single Output o MISO: Múltiple Inputs-Single Output) o vectores (Procesos Multivariables o MIMO: Multiple Inputs-Multiple Outputs). Identificando estos modelos de la forma Y x Z, donde Y es el número de entradas (variables de control y/o perturbaciones medibles) y Z es el número de salidas del proceso.

\bullet: k representa el número de períodos de filtrado o de control, es decir, si T es el período de filtrado o de control, que suele elegirse constante para facilitar la programación de este algoritmo, aunque no es indispensable, cuando nos referimos al instante k, nos estamos refiriendo al instante de tiempo kT, y cuando nos referimos a los instantes (k+1-i) nos estamos refiriendo a los instantes de tiempo (k+1-i)T.

\bullet: Se llama retardo puro (RP) de una variable de entrada respecto a la variable de salida del proceso, al número de períodos de filtrado o de control transcurridos desde que se produce un cambio en dicha variable de entrada hasta que comienza la correspondiente respuesta de la variable de salida del proceso. Entonces, si las variables de control y de perturbación medible tienen retardos puros variables conocidos, Ru y Rw serán respectivamente, como se explicará más adelante, sus mínimos retardos puros.

\bullet: Y \Delta(k) representa el efecto de las perturbaciones no medibles en la salida del proceso en el instante k.

Este modelo matemático lineal en diferencias o incrementos describirá la dinámica instantánea del proceso.

Propagación del Modelo del Filtro: Horizonte de Predicción (\lambda)

El horizonte de predicción [k, k+\lambda] no representa durante el cálculo de la propagación del modelo incremental del proceso un tiempo real, sino un escenario ficticio utilizado solamente para evaluar la evolución futura del proceso.

Obteniéndose fácilmente el siguiente algoritmo recursivo para calcular el incremento de la salida predicha del proceso en el instante k+\lambda:

\vskip1.000000\baselineskip

9

\vskip1.000000\baselineskip

En estas ecuaciones:

\vskip1.000000\baselineskip

10

\vskip1.000000\baselineskip

son los incrementos futuros de estas variables de entrada al proceso y en consecuencia desconocidos.

Por lo que imponiendo la condición de que los incrementos de la acción de control y de las perturbaciones medibles se mantengan constantes durante el horizonte de predicción \lambda:

\vskip1.000000\baselineskip

11

\newpage

para calcular el incremento de la salida predicha del proceso en cada instante k+j como función de los incrementos de las variables de entrada y salida del proceso hasta el instante k, se deduce que:

12

Teniendo en cuenta que:

13

se deduce que:

14

donde:

15

Trayectoria guía de referencia

La trayectoria guía de referencia guiará al proceso hasta su punto óptimo de operación y podría ser, en un principio, cualquiera, pero para garantizar la estabilidad y la convergencia en el aprendizaje de este filtro, como se demostrará más adelante, deberá ser limitada y físicamente realizable, con ganancia estática unidad, siendo la entrada de su función de transferencia cualquier punto de consigna constante que se desee que alcance el proceso, y durante la operación de filtrado tiene que reinicializarse constantemente con las salidas medidas del proceso.

Esta metodología de filtrado tomará, por su simplicidad, como dinámica de la trayectoria guía de referencia:

16

donde:

\bullet: y_{r}(k + \lambda/k) representa la salida del proceso deseada al final del horizonte de predicción (\lambda), con los datos obtenidos hasta el instante k.

\bullet: y(k) representa la salida medida del proceso en el instante k.

\bullet: y_{sp} (k + \lambda) representa el punto de operación constante que se desea que alcance el proceso durante el mantenimiento del horizonte de predicción (\lambda).

\bullet: 0 < \eta < 1 representa la velocidad de cambio de aproximación a la consigna instantánea:

-: Si \eta = 0 \Rightarrow y_{r} (k + \lambda/k) = y_{sp} (k + \lambda), es decir, el punto de consigna deseado al final del horizonte de predicción se alcanza en un único instante de filtrado o control.

-: Si \eta = 1 \Rightarrow y_{r} (k + \lambda/k) = y(k), es decir, el punto de consigna deseado al final del horizonte de predicción se alcanzaría en infinitos instantes de control.

Por tanto, cuanto más pequeño sea el valor de \eta mayor será la velocidad de cambio de aproximación al punto de consigna instantáneo deseado.

Si además, se específica un Incremento Máximo de la Trayectoria Guía de Referencia entre dos Instantes Consecutivos de Control (IMT_{máx} = \Deltay_{r-máx}), entonces para un determinado valor del horizonte de predicción (\lambda) si el incremento de la trayectoria guía de referencia entre dos instantes consecutivos de control a lo largo del anterior horizonte de predicción es superior al valor seleccionado para esta variable, dicho incremento será limitado al valor de dicha variable. De esta forma se garantiza que la evolución de la variable de salida del proceso, en cada transición en su aproximación hacia la consigna, no sobrepase éste valor, deduciéndose que:

17

si:

500

En general, si a lo largo del horizonte de predicción se detecta que el incremento de la señal de salida del proceso entre dos instantes consecutivos de control es superior a IMT_{máx}, se recomienda, si es posible, que en vez de utilizar la expresión anteriormente deducida se aumente el valor de la Velocidad de Cambio de Aproximación, con el fin de disminuir el incremento de la señal de salida del proceso entre dos instantes consecutivos de control, siempre que no sea critico el tiempo requerido para que el proceso alcance el punto de consigna, ya que la anterior acción aumentará este tiempo.

En consecuencia la ecuación de la trayectoria guía seleccionada:

\bullet: Reinicializa permanente la salida deseada para el aprendizaje a partir de la evolución del proceso.

\bullet: Permite modificar en cada instante la consigna haciendo seguir al proceso trayectorias que optimicen alguna o todas las variables que influyen en su rendimiento.

\bullet: Permite modificar en cada instante la velocidad de cambio de aproximación a la consigna instantánea controlando el esfuerzo de las acciones de control.

Estabilidad, convergencia y robustez de la formulación incremental del modelo del sistema junto con la estructura variable selecciona para la trayectoria guía de referencia

Pasando al plano Z, la dinámica del proceso y las anteriores ecuaciones de la salida predicha, suponiendo nulas, sin perdida de generalidad, las perturbaciones medibles, y de la trayectoria guía de referencia en el instante de filtrado o de control k+\lambda, se obtiene que:

\bullet: Suponiendo que la dinámica del proceso se describe por la siguiente ecuación temporal y función de transferencia discreta en el Plano Z, con una perturbación desconocida p(z) que se sumará a la acción de control:

18

: donde:

19

\bullet: Ecuación de la salida predicha en el instante de control k+\lambda:

20

: donde:

\vskip1.000000\baselineskip

21

\newpage

: Pasando al plano Z esta última ecuaciones, teniendo en cuenta que:

22

: se obtiene:

23

: donde:

24

: Despejando de esta ecuación u(z), se obtiene:

25

: y sustituyendo este valor en la ecuación de la función de transferencia del proceso:

26

: se obtiene:

\vskip1.000000\baselineskip

27

\vskip1.000000\baselineskip

: donde \Psi*_{\lambda} (z^{-1}) es el polinomio característico:

\vskip1.000000\baselineskip

28

\vskip1.000000\baselineskip

\bullet: Ecuación de la salida deseada de referencia en el instante de control k+\lambda:

\vskip1.000000\baselineskip

29

: donde:

\vskip1.000000\baselineskip

30

\vskip1.000000\baselineskip

: Sustituyendo y_{r}(z) = H_{\lambda}(z^{-1})y(z) + F_{\lambda}(z^{-1})y_{sp}(z) en las últimas ecuaciones por y_{p}(z), se obtiene:

\vskip1.000000\baselineskip

31

\vskip1.000000\baselineskip

: donde \Psi_{\lambda}(z^{-1}) es el polinomio característico:

\vskip1.000000\baselineskip

32

\vskip1.000000\baselineskip

: La estabilidad de la función de transferencia y(z)/y_{sp}(z), suponiendo nula la perturbación p(z), significa que, dada una secuencia limitada de puntos de consigna, las salidas del proceso también serán limitadas. Y la estabilidad de la función de transferencia u(z)/y_{sp}(z), suponiendo también nula la perturbación p(z), implica que la acción de control generada para obtener una limitada secuencia de puntos de consigna es también limitada. En ambos casos la condición de estabilidad es que el polinomio \Psi_{\lambda}(z^{-1}) tenga sus raíces dentro del circulo de radio unidad z = 1.

: Una similar consideración puede hacerse para las funciones de transferencia y(z)/y_{p}(z) e u(z)/y_{p}(z). El polinomio característico que determina la estabilidad en este caso es \Psi*_{\lambda}(z^{-1}). Comparando las ecuaciones de estos dos polinomios característicos:

\vskip1.000000\baselineskip

33

\vskip1.000000\baselineskip

: puede observarse que su diferencia esta en el término H_{\lambda}(z^{-1}), que es seleccionado para definir la trayectoria guía de referencia.

Para examinar el efecto que tiene el hacer el horizonte de predicción mayor que uno sobre la estabilidad, convergencia y robustez, se hará que \lambda tienda a infinito.

Haciendo tender \lambda a infinito, teniendo en cuenta el teorema del valor final, se tiene que:

34

Como:

\vskip1.000000\baselineskip

35

\vskip1.000000\baselineskip

lo que verifica que la trayectoria de referencia tiene ganancia estática igual a 1, es decir que:

\vskip1.000000\baselineskip

36

\vskip1.000000\baselineskip

en consecuencia se tendrá que:

37

aquí se verifica que los requisitos que han de imponerse a la trayectoria guía de referencia es que debe reinicializarse constantemente con las salidas medidas del proceso y tener ganancia estática unidad.

Este análisis determina que no es necesario conocer ninguna característica del proceso para garantizar que la salida de éste tienda hacia el constante punto de consigna y que se cancelan las perturbaciones constantes que darían lugar a potenciales desviaciones del punto de consigna si se utiliza una formulación incremental del modelo del proceso y una trayectoria guía de referencia que se reinicialice constantemente con las salidas medidas del proceso y tenga ganancia estática unidad.

También es importante señalar la robustez de este resultado, ya que no se ha hecho ninguna suposición sobre las condiciones iniciales y sobre los errores de modelado.

Este resultado, por tanto, elimina de forma práctica y sencilla el problema de convergencia de los métodos basados en la estimación paramétrica del gradiente.

Ahora haciendo de nuevo tender \lambda a infinito, teniendo en cuenta el teorema del valor final, se tiene que:

\vskip1.000000\baselineskip

38

\vskip1.000000\baselineskip

como:

39

La Ganancia Estática del Proceso se define como:

40

en consecuencia:

41

De aquí se deduce que las raíces de estos dos polinomios característicos tienden hacia las raíces del polinomio característico de la función de transferencia del proceso A(z^{-1}), que es el denominador de dicha función de transferencia, y como por definición éste es estable sus raíces estarán dentro del circulo de radio unidad z = 1.

Además, se dice que un proceso tiene Inversa Inestable:

42

cuando el polinomio B(z^{-1}) tiene sus raíces fuera del circulo de radio unidad z = 1, lo que significa que la señal de control aplicada al proceso para que éste siga una trayectoria de referencia alejada de su

\hbox{propia dinámica tenderá  a
infinito.}

Por lo tanto, de acuerdo con el anterior resultado, existirá un \lambda_{0} a partir del cual (\lambda \geq \lambda_{0}) las raíces de los dos polinomios característicos:

43

estarán dentro del circulo de radio unidad z = 1, y en consecuencia las funciones de transferencia:

44

serán estables, es decir, que a partir de ser \lambda \geq \lambda_{0} cualquiera que sea el deseado punto del consigna y la perturbación, siempre que ésta sea limitada, la salida del proceso y(z) y la señal de control u(z) para seguir a dicho punto de consigna serán limitadas independientemente de si proceso tiene o no "Inversa Inestable", es decir, si las raíces del polinomio B(z^{-1}) de la función de transferencia del proceso tiene sus raíces fuera del circulo unidad.

Este resultado, por tanto, también elimina de forma práctica y sencilla el problema de estabilidad tanto directa como inversa de los métodos basados en la estimación paramétrica del gradiente.

Estas características de la formulación incremental del modelo del proceso y de la trayectoria guía de referencia son las que justifican la elección de dicho modelo y dicha trayectoria para la aplicación de esta nueva metodología de filtrado adaptativo.

Mecanismo de aprendizaje

En este apartado se deduce el algoritmo de aprendizaje o de adaptación, que es la clave del éxito y la verdadera innovación del Filtro Incremental Inteligente objeto de esta patente.

Según el análisis efectuado hasta el momento, se pueden extraer dos características esenciales asociadas con la aplicación de esta tecnología de filtrado. Una es que en cada instante consecutivo de filtrado o control el incremento de la salida del proceso siga los sucesivos incrementos de la salida predicha por el modelo incremental del filtro producidos por el incremento de la señal de control calculada, en un instante de filtrado o control anterior, para que el incremento de la trayectoria guía de referencia y el incremento de la salida predicha por el modelo incremental del filtro coincidan al final del horizonte de predicción, dando lugar a la "Trayectoria del Proceso", para alcanzar el punto de consigna, y la otra es que la trayectoria guía de referencia, además de verificar las condiciones anteriormente expuestas, deberá ser limitada y físicamente realizable, lo que significa que el incremento de la señal de control aplicada al proceso para que éste siga dicha trayectoria tiene que ser también limitada.

En la práctica, si se dispone a priori de un "buen" modelo que describa la relación dinámica entre los incrementos de las entradas y salidas del proceso, y dicha relación dinámica no variará en el tiempo, éste modelo podría utilizarse para hacer seguir a la variable de salida del proceso la salida deseada para la misma, mediante el sencillo calculo de los incrementos de la variable de control, es decir, se podría fácilmente controlar el proceso.

Sin embargo, en la mayoría de los casos es difícil obtener a priori información precisa sobre el proceso. No obstante, incluso si dicha información estuviera disponible, el proceso podría variar frecuentemente su dinámica y en consecuencia su evolución temporal.

Por tanto, el propósito de agregar un mecanismo de aprendizaje es el de identificar dichos cambios, en estos procesos variables con el tiempo, con el fin de alcanzar resultados satisfactorios en el guiado de la variable de salida del proceso, los cuales serían obtenidos si la dinámica instantánea del proceso fuese conocida.

En consecuencia los objetivos que se puede esperar obtener del Filtrado Incremental Inteligente pueden resumirse en los dos puntos siguientes:

1.: Después de un cierto tiempo de aprendizaje, el incremento de la salida del proceso seguirá al incremento de la salida predicha por el modelo incremental del filtro, producido por el incremento de la señal de control calculada, en un instante de filtrado o control anterior, para que el incremento de la trayectoria guía de referencia y el incremento de la salida predicha por el modelo incremental del filtro coincidan al final del horizonte de predicción, con un error de seguimiento que será siempre limitado, irá disminuyendo y será cero o estará acotado en el límite.

2.: La trayectoria guía de referencia debe ser limitada y físicamente realizable, lo que significa, como se indicó anteriormente, que la acción de control aplicada al proceso para que éste siga dicha trayectoria además de tener que ser también limitada debe de ser capaz de cumplir el primer objetivo de esta tecnología de filtrado.

: De hecho, el límite de la acción de control considerada en este segundo objetivo en las aplicaciones prácticas es físicamente impuesta por los límites del actuador. Por otra parte, el límite de la trayectoria guía de referencia esta asociada con el limitado rango de variación de los sensores que permiten la medida de las variables del proceso.

Ahora se traducirán los anteriores intuitivos objetivos de filtrado a su formulación matemática.

El primer aspecto a considerar concierne al mecanismo de aprendizaje que ajusta los parámetros del modelo incremental del proceso, con el propósito de hacer que en cada instante el incremento de la salida producida por este modelo esté lo más cerca posible del incremento de la salida del proceso cuando ambos reciben el mismo incremento de la señal de control. Por lo que parece lógico caracterizar la actuación del mecanismo de aprendizaje por la diferencia entre los incrementos de las salidas del proceso y del modelo incremental del proceso.

Esta diferencia es representada por el error de estimación "a posteriori" e(k/k) definido como:

45

donde el subíndice m significa variable medida.

Una buena solución para diseñar el mecanismo de aprendizaje es, como ya se ha visto que el error e(k/k) \rightarrow 0 cuando k \rightarrow \infty desde cualesquiera condiciones iniciales.

Sin embargo, este resultado sólo cumple el primer objetivo deseado para la actuación del mecanismo de aprendizaje. De hecho, el segundo objetivo conduce a establecer la condición de que las entradas y salidas del proceso estén limitadas. Así si el modelo del proceso en su formulación incremental:

46

se expresa en forma matricial:

47

donde:

48

el cumplimiento del segundo objetivo es equivalente a decir que \Delta\phi (k) este limitado.

Como según el primer objetivo una buena solución para diseñar el mecanismo de aprendizaje sería que el error "a posteriori" e(k/k) \rightarrow 0 cuando k \rightarrow \infty desde cualesquiera condiciones iniciales, donde:

49

lo que equivale a que las salidas del modelo se irán aproximando a las del proceso real, y como los incrementos de la trayectoria guía de referencia tenderán también a cero a medida que el proceso se aproxima al constante punto de consigna, es decir, como:

50

se deduce que los incrementos de las entradas y salidas del proceso deben tender también a cero a medida que nos aproximamos al constante punto de consigna, es decir:

51

lo que se traduce en que:

52

Si 501 entonces se verificará el criterio de actuación:

53

ya que desde que la suma de los cuadrados del error s(k_{t}) es una secuencia no decreciente que puede empezar a crecer desde el instante en que empieza a operar el mecanismo de aprendizaje, esta secuencia estará limitada ya que sus incrementos tienden a cero, es decir, ya que 502.

Este criterio de actuación se utilizará para demostrar que el algoritmo de aprendizaje, en el caso ideal en el que no existen ruidos ni perturbaciones aleatorias que actúen sobre el proceso, asegura que el 503.

Es importante observar que este error puede tender a cero, e incluso llegar a ser cero, sin que la función s(k_{t}) haya alcanzado su limite superior, e incluso estando significativamente alejado de él. Es decir, la función s(k_{t}) es no decreciente, pero al menos en intervalos puede ser no creciente al ser nulo el error de predicción.

Si el proceso es descrito por la ecuación:

54

se tendrá que:

\vskip1.000000\baselineskip

55

\vskip1.000000\baselineskip

donde:

\bullet: [\theta – \theta(k)]^{T} es el Vector de Error de Identificación Paramétrica en el instante de filtrado o de control k.

\bullet: \Delta\phi(k - 1) es el Vector de Incrementos de las Entradas y Salidas en el instante de filtrado o control k-1.

La ortogonalidad entre [\theta – \theta(k)]^{T} y \Delta\phi(k - 1) implica que:

\vskip1.000000\baselineskip

56

\vskip1.000000\baselineskip

esto significa que el sistema a alcanzado un punto de equilibrio local, el punto de equilibrio absoluto será alcanzado cuando \theta(k) =\theta cumpliéndose la condición de que el criterio de actuación:

57

haya alcanzado su valor máximo.

Cuando [\theta – \theta(k)]^{T} y \Delta\phi(k - 1) son ortogonales, es decir, cuando se alcanza la condición de ortogonalidad, significa que \theta(k) no tenderá hacia \theta cuando k \rightarrow \infty. Esta es la razón porque, desde el punto de vista de la identificación, esta condición de ortogonalidad ha sido considerada indeseable. Pero es importante subrayar que en la metodología de filtrado objeto de esta patente la condición de ortogonalidad hace posible el control del proceso de la forma deseada sin una completa identificación de sus parámetros. En consecuencia, más que identificar el proceso, lo importante es predecir bien.

Algoritmo de Aprendizaje

Si el modelo incremental del proceso es descrito por la ecuación:

58

en el instante de filtrado o de control k, después de aplicar al proceso el incremento de la señal de control \Deltau(k - 1) que hace que el incremento de la salida predicha del modelo incremental del proceso sea igual al incremento de la salida deseada en ese instante, y después de medir el incremento de la salida del proceso \Deltay_{m}(k) y de calcular el error "a priori" e(k/k - 1) = \Deltay_{m}(k) - \Delta\hat{\mathit{y}}(k/k - 1), los únicos datos de que se disponen son:

59

Si se consideran, en un principio, nulas las perturbaciones no medibles y los ruidos, es decir, si se consideran únicamente errores de modelado, y se puede determinar un vector \theta_{p}(k) que cumpla la condición de ortogonalidad:

60

entonces cualquier vector \theta(k) perteneciente al hiperplano:

\vskip1.000000\baselineskip

61

\vskip1.000000\baselineskip

cumplirá también la condición de ortogonalidad, por lo que el vector de parámetros, que multiplican al vector de incrementos de entradas y salidas \Delta\phi(k - 1), del modelo real del proceso será un vector de dicho hiperplano, en el supuesto que el modelo real del proceso sea del mismo orden que su modelo incremental.

Tomando un modelo incremental de primer orden para deducir el algoritmo de aprendizaje, extendiendo posteriormente, sin perdida de generalidad, los resultados a sistemas de cualquier orden, se tendrá que:

\vskip1.000000\baselineskip

62

\vskip1.000000\baselineskip

de donde:

\vskip1.000000\baselineskip

63

\vskip1.000000\baselineskip

donde \alpha_{a}(k) y \alpha_{b}(k) pueden tener, en un principio, cualquier valor distinto de cero.

\global\parskip0.900000\baselineskip

Ahora, el vector \Psi(k) se descompondrá en la combinación lineal de un vector paralelo a \Gamma(k)[\Phi(k)] más otro P(k) perpendicular también a \Gamma(k), por lo que este último vector será el vector buscado por cumplir la condición de ortogonalidad, es decir:

64

donde:

65

en consecuencia, si se encuentran estos dos vectores se cumplirán las condiciones impuestas para la descomposición del error de estimación "a priori" e(k/k - 1).

Por tanto, si:

66

y si:

67

entonces:

68

\newpage

\global\parskip1.000000\baselineskip

es decir, \Omega^{T} (k) = [\Deltay(k) a(k) b(k)] es el vector que se busca, por cumplir la condición de ortogonalidad, es decir, la primera condición impuesta a la descomposición del error de estimación "a priori" e(k/k - 1) ya que:

\vskip1.000000\baselineskip

69

\vskip1.000000\baselineskip

Por tanto, se tendrá que:

\vskip1.000000\baselineskip

70

\vskip1.000000\baselineskip

como \Gamma(k) es perpendicular a P(k) \Rightarrow \Gamma^{T} (k)P(k) = 0, se deduce:

\vskip1.000000\baselineskip

\vskip1.000000\baselineskip

71

\vskip1.000000\baselineskip

\vskip1.000000\baselineskip

en consecuencia, si:

\vskip1.000000\baselineskip

\vskip1.000000\baselineskip

72

73

\vskip1.000000\baselineskip

En consecuencia:

\vskip1.000000\baselineskip

74

\vskip1.000000\baselineskip

cumpliéndose la segunda condición impuesta para la descomposición de e(k/k - 1).

Ahora, se tendrá que:

\vskip1.000000\baselineskip

75

76

\newpage

Si:

\vskip1.000000\baselineskip

\vskip1.000000\baselineskip

504

\vskip1.000000\baselineskip

\vskip1.000000\baselineskip

donde:

\vskip1.000000\baselineskip

\vskip1.000000\baselineskip

77

\vskip1.000000\baselineskip

\vskip1.000000\baselineskip

entonces:

\vskip1.000000\baselineskip

\vskip1.000000\baselineskip

78

79

\vskip1.000000\baselineskip

Por tanto:

\vskip1.000000\baselineskip

80

\vskip1.000000\baselineskip

Como:

\vskip1.000000\baselineskip

81

82

En consecuencia:

83

De aquí, también se deduce que:

84

En consecuencia:

85

Generalizando, se tendrá que:

\vskip1.000000\baselineskip

86

\vskip1.000000\baselineskip

Estas son las expresiones del Algoritmo de Aprendizaje del Filtro Incremental Inteligente, donde G(k) se denominará Ganancia de Adaptación.

De estas ecuaciones se deduce que si se selecciona B(k) =0 no se produce la actualización de los parámetros de adaptación \theta(k) en ese instante de filtrado o de control k \Rightarrow B(k) \neq 0.

Además para el Vector de Error de Identificación \theta - \theta(k)se tendrá que:

\vskip1.000000\baselineskip

87

\vskip1.000000\baselineskip

Imponiendo la condición de que [\theta - \theta(k)] < [\theta - \theta(k -1)] se tendrá que:

: [I + B(k)\Delta\phi(k - 1)\Delta\phi^{T} (k - 1)] > 1 \Rightarrow Su determinante tiene que ser mayor que 1:

\vskip1.000000\baselineskip

88

En consecuencia con este nuevo algoritmo de aprendizaje siempre se cumplirá que [\theta - \theta(k)] \leq [\theta - \theta(k - 1)] ya que B(k) \geq 0.

Como se ha mencionado anteriormente, si 505 se verificará el criterio de actuación:

\vskip1.000000\baselineskip

89

\vskip1.000000\baselineskip

ya que desde que la suma de los cuadrados del error s(k_{t}) es una secuencia no decreciente que puede empezar a crecer desde el instante en que empieza a operar el mecanismo de aprendizaje, esta secuencia estará limitada ya que sus incrementos tienden a cero, es decir, ya que 506. Este criterio de actuación se utilizará para demostrar que el algoritmo adaptativo de filtrado garantiza que 507.

Es importante observar que este error puede tender a cero, e incluso llegar a ser cero, sin que la función s(k_{t}) haya alcanzado su limite superior, e incluso estando significativamente alejado de él. Es decir, la función s(k_{t}) es no decreciente, pero al menos en intervalos puede ser no creciente al ser nulo el error de predicción. Esta circunstancia implicaría, en el caso de que el vector de incrementos de entradas/salidas sea acotado, que el incremento de la salida del proceso fuera, por lo tanto, igual al incremento de la salida deseada.

En consecuencia, se ha deducido que alcanzar el objetivo de filtrado deseado no requiere necesariamente que los parámetros de adaptación del modelo incremental coincidan con los parámetros del proceso. Es decir, que para controlar adecuadamente, no es necesario que el error de identificación paramétrica sea nulo, y por tanto, también no es necesario que el orden del modelo incremental del filtro y del proceso coincidan.

Ahora se va a demostrar que como:

\vskip1.000000\baselineskip

90

\vskip1.000000\baselineskip

se cumple la anterior premisa ya que:

\vskip1.000000\baselineskip

91

\vskip1.000000\baselineskip

si el proceso es descrito por la ecuación:

\vskip1.000000\baselineskip

92

\newpage

se tendrá que:

93

Si:

94

Este resultado prueba que el límite \delta^{2} = \delta^{2} [B(k)] depende del tamaño del error de los parámetros de identificación en el instante inicial y de la matriz B(k).

Si:

95

intuitivamente se puede asociar la distancia de s(k_{t}) al límite \delta^{2} con la mitad del cuadrado de la norma euclídea del error de los parámetros de identificación, como esta distancia decrece, puede deducirse que el cuadrado de la norma del error de los parámetros de identificación también disminuirá, y como esta norma es siempre positiva, sus incrementos tienen que tender a cero, lo que implica que los incrementos de los parámetros del modelo incremental del filtro tiendan también a cero, o lo que es lo mismo que:

96

Lo cual también se podía haber deducido de la relación:

97

ya que si:

98

Por tanto, dando una adecuada secuencia de incrementos de señales de control se tendrá que el incremento de la salida predicha seguirá al incremento de la trayectoria guía de referencia:

99

De las ecuaciones:

100

se deduce que cuanto más grande sea B(k) menor será el valor de \delta^{2} [B(k)] y de \delta^{2}(k), por lo que se reducirá el número de actualizaciones de los parámetros de adaptación, es decir, el mecanismo de aprendizaje perderá su capacidad de adaptación, lo que es equivalente a decir que si:

101

Como:

102

si:

103

y según de las anteriores deducciones, se tendrá que:

508

si:

104

en consecuencia al ser \alpha(k) \geq 0, la función \alpha(k) = f [B(k)] tendrá un máximo \alpha_{máx} (k) = f [B_{máx} (k)] y este valor B_{máx} (k) podría utilizarse en cada instante de filtrado o de control para calcular la Ganancia de Adaptación G(k) ya que en este caso la magnitud de las adaptaciones serían máximas con el fin de lograr una convergencia de los parámetros del modelo incremental lo más rápida posible.

Ahora, parece necesario introducir una valoración para determinar si la información de entradas y salidas del proceso que recibe el Mecanismo de Aprendizaje en cada instante de control es "buena" para la adaptación o, por el contrario, puede ser "perjudicial".

En el caso ideal obviamente toda la información recibida es buena. Para este caso, la ganancia variable G(k) nunca tiende a cero, es decir, el mecanismo de adaptación nunca pierde su capacidad de adaptación y los incrementos de los parámetros del modelo incremental tenderán a cero únicamente en el caso que el error de estimación tienda a cero. De esta forma, si cambiaran los parámetros del proceso, el mecanismo de aprendizaje volvería a utilizar su capacidad de adaptación para obtener la convergencia en términos de error de estimación e incremento paramétrico.

Una característica importante a observar en el Mecanismo de Aprendizaje es que se ejecuta continuamente en cada instante k, es decir, ajusta los parámetros de adaptación en cada instante k. En el caso ideal, el único origen del error de estimación es el error de estimación paramétrica. Por ello es lógico adaptar los parámetros de forma continua para lograr una convergencia lo más rápida posible.

La situación es diferente en presencia de ruidos y perturbaciones aleatorios, dado que ellos también contribuyen al error de estimación. El problema nace justamente del hecho de que su contribución es impredecible, dado que los ruidos y perturbaciones aquí considerados no son medibles.

Si se tuviera un cierto conocimiento de la magnitud del ruido y perturbaciones que puedan afectar de forma impredecible a la salida del proceso, se tendría que:

\bullet: Si el error de estimación "a priori" fuera del mismo orden, o inferior, que el máximo nivel que puede alcanzar la señal de perturbación, es posible que dicho error fuese debido más a la señal de perturbación que al error de identificación paramétrica. En este caso, la adaptación debería pararse.

\bullet: Si el error de estimación "a priori" fuese mayor que dicho nivel máximo, podría asegurarse que dicho error de estimación es debido principalmente al error de identificación paramétrica y, en consecuencia, la adaptación debería ejecutarse.

De acuerdo con toda esta exposición parece razonable establecer un criterio de parada o de ejecución de la adaptación. El Filtrado Incremental Inteligente realizará esta valoración, ya que a priori es imposible tener un conocimiento aproximado del máximo nivel de ruidos y perturbaciones aleatorias que actuarán sobre el proceso a controlar, de tal forma que, cuando se ejecute la adaptación, se garantice la mejora de un índice de rendimiento preestablecido.

Este índice de rendimiento podría ser, en un principio, la Reducción del Valor Absoluto del Error de Identificación Paramétrica en cada ejecución del Mecanismo de Aprendizaje. Por tanto, la ganancia variable G(k) nunca tendería hacia cero y, en consecuencia, el mecanismo adaptativo de filtrado nunca perdería su capacidad de adaptación. Pero esta condición:

105

como ya se ha demostrado se verifica siempre que el proceso (\theta) no varíe entre dos instantes consecutivos de ejecución del algoritmo de aprendizaje debido a la estructura de éste, y en ausencia de ruidos y perturbaciones aleatorias, en consecuencia, este índice de rendimiento no servirá como criterio para parar o activar la adaptación, ya que no se sabría si su incumplimiento es debido a una variación temporal del proceso, no teniéndose que parar en este caso la adaptación, o a ruidos y perturbaciones aleatorias.

En el Filtrado Incremental Inteligente como la Ganancia Variable de Adaptación obedece a la expresión:

106

donde:

509

para garantizar que G(k) \rightarrow 0 únicamente cuando el error de estimación "a posteriori" tienda a cero (e(k/k) \rightarrow 0), entonces e(k/k - 1) deberá ser un cero del mismo o mayor orden que \Delta\phi(k - 1), es decir, e(k/k - 1) deberá tender a cero igual o más rápidamente que \Delta\phi(k -1).

En consecuencia, el Filtrado Incremental Inteligente tomará como índice de rendimiento para parar la adaptación que se verifique la condición que:

\vskip1.000000\baselineskip

107

\vskip1.000000\baselineskip

de esta forma, se detectarán los ruidos y las perturbaciones que harían que G(k) \rightarrow 0 por la tendencia a cero del vector de incrementos de entradas y salidas del proceso más que por la tendencia a cero de los errores de estimación de identificación paramétrica.

En estos casos, se mantendrá el valor de los parámetros de adaptación hasta el siguiente instante de control o se reinicializarán a sus valores iniciales.

De esta forma, también se elimina el problema de la perdida de capacidad de aprendizaje de los métodos basados en la perspectiva de la optimización.

Determinación Automática de Retardos Variables

Se llama retardo puro (RP) de una variable de entrada respecto a la variable de salida del proceso, al número de períodos de filtrado o control transcurridos desde que se produce un cambio en la variable de entrada hasta que comienza la correspondiente respuesta de la variable de salida del proceso.

Si RP es nulo o pequeño comparado con el período de filtrado o de control, el efecto de la variable de entrada del instante k sobre la salida del proceso se detectará en el siguiente período de control k + 1. Sin embargo, si RP tiene un valor determinado de períodos de control, el efecto de la variable de entrada del instante k sobre la salida del proceso no se detectará hasta el instante k + RP + 1, es decir, para que el efecto de un cambio en la señal de entrada se detectará en la salida del proceso en el instante k + 1 habría que producir dicho cambio en el instante k-RP.

El mecanismo de aprendizaje del filtro será capaz de determinar automáticamente la magnitud en períodos de control de los retardos puros de un determinado proceso, siendo el número de parámetros de adaptación b_{i}(k) iguales a cero igual al número de períodos de control del retardo puro de la variable de control, y el número de parámetros de adaptación c_{i}(k) iguales a cero igual al número de períodos de control del retardo puro de la perturbación
medible.

Si los tiempos de retardo puro, medidos en períodos de control, de las entradas al proceso no varían con el tiempo, la elección del período de control será igual o mayor que el mayor de esos retardos puros y el número de parámetros para las diferentes señales de entrada/salida del modelo del proceso, en la mayor parte de los casos será igual a 2, es decir, el modelo del proceso será de 2° orden.

Sin embargo, si el tiempo de retardo puro para las señales de entrada al proceso varia a lo largo de la operación del Filtro Incremental Inteligente, se elegirá un número de parámetros para estas señales que permita al mecanismo de aprendizaje de los correspondientes parámetros b_{i} y c_{i} seguir de forma adecuada las variaciones de dicho tiempo de retardo.

Por lo tanto, si se quieren retener Z parámetros b_{i} en el modelo del proceso distintos de cero, es aconsejable elegir el período de control (T), el número de estos parámetros (NB) y el valor del retardo puro (RP) de la siguiente forma:

\vskip1.000000\baselineskip

108

\vskip1.000000\baselineskip

donde RP_{\text{mín}} y RP_{máx} son los límites mínimo y máximo, respectivamente, del posible rango de variación del retardo puro medido en períodos de control.

En el modelo del proceso, el número de retardos puros de \Deltau que efectivamente existen quedará definido por la ecuación:

\vskip1.000000\baselineskip

510

En consecuencia, aún en el caso más desfavorable en el que el número de retardos puros fuera igual a RP_{máx}, todavía quedarían Z parámetros b_{i} para identificar la dinámica del proceso:

511

Una consideración análoga es válida para la elección del número de parámetros y de retardos puros relacionados con otras señales de entrada.

Con el fin de independizar la elección del período de control de los retardos puros de las variables de entrada al proceso, el modelo del proceso para la aplicación del filtro será de la siguiente forma:

109

donde Ru y Rw son los límites mínimos, respectivamente, del posible rango de variación del retardo puro de la señal de control y de la perturbación medible medido en períodos de control.

Por tanto, para un horizonte de predicción \lambda, suponiendo nulas las perturbaciones medibles, el incremento de la salida predicha del proceso tendrá la expresión:

110

Es importante señalar que la elección del número de parámetros b_{i}(k) (NB) debe siempre garantizar la existencia de algún b_{i} (k) \neq 0, con el fin de poder calcular el incremento de la señal de control.

Breve explicación de los dibujos

La Figura representa el Diagrama de Bloques del Filtro Incremental Inteligente aplicado al Control de Sistemas.

Modo de realización del filtro incremental inteligente aplicado al control de sistemas

Como se ha demostrado hasta ahora el Filtro Incremental Inteligente puede ser utilizado para el modelado robusto y estable en tiempo real de cualquier tipo de procesos incluidos los procesos con dinámica variable con el tiempo e incluso desconocida, multivariables con interacciones desconocidas entre sus entradas y salidas, no lineales, con retardos variables con el tiempo y estando sometidos a ruidos y perturbaciones aleatorias sin presentar los problemas de perdida de capacidad de aprendizaje de los métodos basados en la perspectiva de la optimización, o los problemas de estabilidad y convergencia de los métodos basados en el algoritmo del gradiente.

Para explicar el modo de realización del Filtro Incremental Inteligente en el campo del control automático se explicará su aplicación en el control de un sistema SISO (Single Input/Single Out) genérico.

Debido a la imposibilidad de tener un conocimiento preciso "a priori" de los retardos variables de las entradas del proceso y del horizonte de predicción mínimo que garantice una evolución estable del proceso, la estrategia del Filtro Incremental Inteligente por defecto, será:

Parámetros de operación

Los parámetros de operación que se deben seleccionar para cada proceso a filtrar son:

\bullet: El Período de Muestreo [P_{M} (sg)], que es el intervalo de tiempo entre sucesivas tomas de valores de la variable de salida del proceso y de la perturbación medible, cuando esta exista, es decir, este período determina la frecuencia con que el filtro recibirá información procesada de los sensores.

\bullet: El Período de Control [P_{C} (sg)], el Período de Control determina la frecuencia con que el filtro realizará las acciones de filtrado, por lo que el Período de Control también puede definirse como el número de períodos de muestreo entre dos acciones consecutivas de control.

\bullet: El Punto de Consigna (SP).

\newpage

\bullet: El tiempo en que se requiere, sólo en el caso que se requiera, que el proceso alcance el punto de consigna (t_{sp}).

\bullet: Y los límites de la señal de control establecidos por las restricciones del actuador, es decir, el máximo valor de la señal de control (u_{máx}) y el mínimo valor de la señal de control (u_{\text{mín}}) que produzca una variación en la salida del proceso.

Trayectoria guía de referencia

Para conducir la salida del proceso hacia el punto de consigna se tomará como trayectoria guía de referencia:

\vskip1.000000\baselineskip

111

\vskip1.000000\baselineskip

Los datos de entrada de la Trayectoria Guía de Referencia serán:

\bullet Iniciales:

\ding{226}: El Incremento Máximo de la Trayectoria Guía de Referencia entre dos Instantes Consecutivos de Control (IMT_{máx} = \Deltay_{r - máx}).

\ding{226}: Velocidad de Cambio de Aproximación al constante Punto de Consigna al final del Horizonte de Predicción (\eta), que dependerá del tiempo en que se requiera que el proceso alcance el punto de consigna y del Incremento Máximo de la Trayectoria Guía de Referencia entre dos instantes consecutivos de control.

\ding{226}: Horizonte de Predicción (HP: En Períodos de Control):

: El criterio recomendado para seleccionar el valor del Horizonte de Predicción, será elegir para este valor algo más de la mitad de los períodos de control requeridos para que el proceso alcance el punto de consigna.

\bullet Recursivos:

\ding{226}: La última salida medida del proceso y_{m}(k).

Los datos de salida de la Trayectoria Guía de Referencia será el incremento de la salida deseada al finalizar el horizonte de predicción:

112

Modelo incremental del filtro inteligente

Este bloque será el encargado de calcular el incremento de la señal de control de forma que el incremento de la salida del proceso sea igual al incremento de la trayectoria guía de referencia al final del horizonte de predicción.

Los datos de entrada del Modelo Incremental del Filtro serán:

\bullet Recursivos:

\ding{226}: De la Trayectoria Guía de Referencia, el incremento de la salida deseada al final del horizonte de predicción:

113

\ding{226}: Del Mecanismo de Aprendizaje, el valor de todos los parámetros que intervienen en la expresión:

114

\newpage

: donde:

\vskip1.000000\baselineskip

115

\vskip1.000000\baselineskip

: Los datos de salida del Modelo Incremental del Filtro será el incremento de la señal de control que hace que el incremento de la salida del proceso sea igual al incremento de ta salida de la trayectoria guía de referencia al final del horizonte de predicción:

\vskip1.000000\baselineskip

116

\vskip1.000000\baselineskip

: Como:

117

: para que r^{\lambda} (k) \neq 0 con el fin de poder calcular \Deltau(k) alguno de los parámetros b_{i}(k) del modelo filtro deberá ser distinto de cero.

: En el caso que u_{\text{mín}} > u(k) = u(k - 1) + \Deltau(k) > u_{máx} el Modelo Incremental del Filtro informará a la Trayectoria Guía de Referencia de estas anomalías para que éste disminuya, cuando u_{\text{mín}} > u(k), o aumente, cuando u(k) > u_{máx}, la longitud del horizonte de predicción, y con el nuevo valor de la longitud del horizonte de predicción se repetirán los cálculos anteriores en el Modelo Incremental del Filtro hasta conseguir que la señal de control este dentro de su rango de variación.

: Esta última señal de control será la que aplicará el Modelo Incremental del Filtro al proceso.

Mecanismo de aprendizaje

Los datos de entrada del Mecanismo de Aprendizaje serán:

\bullet Iniciales:

\ding{226}: Número de Parámetros y Retardos Puros del Modelo Incremental:

: Para configurar la estructura del modelo incremental del filtro, se debe fijar el número de parámetros correspondientes a las distintas variables que intervienen en el modelo, a_{i}(k) (NA), b_{i}(k) (NB) y y c_{i}(k) (NC), así como los retardos puros o tiempos muertos de las variables de entrada al proceso (Ru y Rw).

\ding{226}: Valores Iniciales de los Parámetros del Modelo Incremental del Filtro:

: En el caso que no se conozcan se supondrán estos valores iniciales nulos se dará al proceso un incremento de la señal de control dentro de su rango de variación y se iniciará el proceso de aprendizaje, con el fin de identificar estos valores iniciales antes de empezar a realizar las acciones de control.

: Siempre es preferible, si es posible, actuar el Filtro Incremental Inteligente durante un "Período de Entrenamiento" para establecer estos parámetros iniciales.

\ding{226}: Nivel de Ruido (NR):

: Este valor indica las máximas variaciones que pueden observarse en el incremento de la salida del proceso medida cuando éste se encuentra centrado alrededor del punto de consigna, sin que actúe el mecanismo de aprendizaje.

: Este parámetro debe elegirse aproximadamente igual a la amplitud de la banda en la que oscila la salida del proceso de forma estacionaria, cuando la variable o variables de entrada al proceso se encuentran en equilibrio, y tendrá como objeto el parar la actuación del mecanismo de aprendizaje siempre que la señal de salida del proceso se encuentre dentro de este nivel de ruido.

\ding{226}: Constante de Filtrado (CF):

: En general, tanto las medidas de la variable del proceso como de las perturbaciones medibles contendrán ruido de medida variable y perturbaciones aleatorias. Por ello cada una de ellas deberá filtrarse con el fin de obtener una mejor estimación de las mismas, por lo que será necesario establecerse para cada variable medible una constante de filtrado. El filtrado realizado para cada variable en cuestión será de primer orden y se ejecutará en cada instante de muestreo, de acuerdo con la siguiente ecuación:

118

: El nuevo valor filtrado es pues el resultado de una medida ponderada entre el valor medido y el valor filtrado previo. El valor que se puede asignar a CF está entre 0 y 1. Cuando este valor es igual a 1, el nuevo valor filtrado será igual al medido y, en consecuencia, se habrá puesto toda la confianza en la variable medida y en la práctica no se filtrará. En el extremo opuesto, si el valor de CF fuera igual a 0, el valor de la variable filtrada nunca variaría, es decir, no se tendría ninguna confianza en el valor medido de la variable.

: La utilización de este simple mecanismo de filtrado es generalmente de gran utilidad cuando existe un elevado nivel de ruido en la medida y al mismo tiempo existe un número significativo de instantes de muestreo en el período de control, obteniéndose un valor filtrado que será ventajoso utilizar para mejorar el rendimiento del mecanismo de aprendizaje.

: La elección del valor de CF no suele ser critica y podrá ser modificada durante la operación de este Filtro Adaptativo.

\ding{226}: Velocidad de Aprendizaje (VA):

: Esta variable multiplicará a la Ganancia de Adaptación [G(k)] permitiendo reducir su valor. En consecuencia, el valor de este parámetro podrá variar entre 0 y 1, si su valor se elige igual a O, la adaptación se inhibirá, si su valor se elige igual a 1, la adaptación tendrá lugar de acuerdo con el algoritmo de aprendizaje, y si se elige un valor intermedio para VA, el valor de la ganancia de adaptación se reducirá proporcionalmente.

: La elección de este parámetro dependerá del nivel del ruido presente en la información que procesa el mecanismo de aprendizaje. En presencia de un nivel de ruido reducido, la velocidad de adaptación podrá elegirse alta (cercana a 1), o máxima (igual a 1). Sin embargo, cuando el nivel de ruido es considerable, es aconsejable reducir la velocidad de adaptación, tanto más cuanto mayor sea et nivel de ruido. De esta forma, se pretende minimizar las excursiones erróneas en la evolución del vector de parámetros del modelo incremental, que podrían producirse debido a la presencia del mencionado nivel de ruido en la información de entradas/salidas que procesa el mecanismo de aprendizaje. Al reducir la velocidad de adaptación, el algoritmo de aprendizaje guiará la evolución de los parámetros del modelo incremental de forma prudente en la buena dirección, con menores desviaciones, que tendrán un menor impacto negativo en la acción de control.

\bullet Recursivos:

\ding{226}: La última salida medida del proceso y_{m}(k + 1).

\ding{226}: El incremento de la salida deseada al final del horizonte de predicción calculada por la Trayectoria Guía de Referencia.

\ding{226}: El Incremento Instantáneo de la Señal de Control \Deltau(k)

: Como seguridad el Mecanismo de Aprendizaje calculará cada vez que actualice los parámetros de adaptación el Signo de la Ganancia Estática (SG) del Modelo Incremental actualizado:

119

Entonces si:

\bullet SG > 0:

\ding{226}: \Deltau > 0:

-: \Deltay_{m} > 0 \Rightarrow No será necesario reinicializar los parámetros de adaptación.

-: \Deltay_{m} < 0 \Rightarrow Será necesario reinicializar a sus valores iniciales los parámetros de adaptación.

\ding{226}: \Deltau < 0:

-: \Deltay_{m} > 0 \Rightarrow Será necesario reinicializar a sus valores iniciales los parámetros de adaptación.

-: \Deltay_{m} < 0 \Rightarrow No será necesario reinicializar los parámetros de adaptación.

\bullet SG < 0:

\ding{226}: \Deltau > 0:

\ding{226}: \Deltau < 0:

: En cada período de filtrado o control (k) el Mecanismo de Aprendizaje determinará, con el incremento de la salida de control calculada por el Modelo Incremental del Filtro, para que el incremento de la salida deseada y el incremento de la salida predicha del proceso coincidan al final del Horizonte de Predicción (\lambda), el incremento predicho de la salida del proceso en el siguiente período de control (k+ 1):

120

: donde:

121

: se aplicará al proceso dicho incremento de la señal de control y se medirá y filtrará su salida durante los períodos de muestreo para determinar su incremento en el siguiente instante de control (k+1).

: Con el error el Mecanismo de Aprendizaje actualizará los parámetros del modelo del filtro, con la salida del proceso la Trayectoria Guía de Referencia determinará el incremento de la salida deseada en el instante \lambda + 1 y el Modelo Incremental, con los nuevos valores de los parámetros de adaptación, calculará el nuevo incremento de la señal de control \Deltau(k + 1) = \Deltau(k + \lambda + 1) para que el incremento de la salida deseada y el incremento de la salida predicha del proceso manteniendo esta señal de control coincidan en el instante \lambda + 1, y así sucesivamente.

: Es decir, el Filtro objeto de esta patente utilizará los incrementos predichos por el modelo incremental durante el Horizonte de Predicción como incrementos de la salida deseada, es decir, la dinámica predicha del proceso, recurriendo únicamente a la expresión de los incrementos de la salida deseada de la Trayectoria Guía de Referencia para determinar el incremento de la señal de control para que el incremento de la salida deseada en los sucesivos instantes de control (\lambda + k) coincida con el incremento predicho de la salida del proceso en dichos instantes.

: En consecuencia, la estrategia del Filtro Incremental Inteligente es capaz de mantener la estabilidad del sistema de control ante procesos con inversa inestable y de tener en cuenta retardos desconocidos o variables con el tiempo con tal de que el horizonte de predicción sea suficientemente largo y se establezca un número de parámetros b_{i} en el modelo incremental que permita al Mecanismo de Aprendizaje identificar el retardo desconocido y variable mediante la estimación a cero de los correspondientes primeros parámetros b_{i}.

: Por tanto, la operación del Filtro Incremental Inteligente se representarse en el diagrama de bloques de la Figura.

Claims

1. Nuevo sistema de procesamiento digital adaptativo de señales o nueva clase de filtro IIR adaptativo, denominado Filtro Incremental Inteligente, para el modelado robusto y estable en tiempo real de cualquier tipo de proceso, procesos con dinámica invariable o variable con el tiempo e incluso desconocida, mono o multivariables, con interacciones conocidas o desconocidas entre sus entradas y salidas, lineales o no lineales, sin o con retardos fijos o variables con el tiempo y sometidos o no a ruidos y perturbaciones aleatorias, sin presentar los problemas de perdida de capacidad de aprendizaje de los métodos de estimación paramétrica basados en la perspectiva de la optimización, o los problemas de estabilidad y convergencia de los métodos basados en el algoritmo del gradiente, caracterizado porque:

a): La estructura del filtro para modelar o predecir en tiempo real la dinámica instantánea de cualquier sistema físico mono o multivariable es un modelo lineal que utiliza valores incrementales de los vectores de control, perturbaciones medibles y salida del proceso con respecto a sus valores en un instante o varios instantes de filtrado o control anteriores, y tiene en cuenta los retardos fijos o variables de las variables de entrada (vectores de control y de las perturbaciones medibles) al proceso respecto a sus variables de salida.

b): La trayectoria guía de referencia, que sólo determinará la salida deseada del proceso al final de un determinado horizonte de predicción (que no representa un tiempo real sino un escenario ficticio utilizado solamente para evaluar la evolución futura del proceso) de varios períodos de filtrado o control, tiene que ser limitada y físicamente realizable con ganancia estática unidad, siendo la entrada de su función de transferencia cualquier punto de consigna constante que se desee que alcance el proceso, y durante la operación de filtrado tiene que reinicializarse constantemente con las salidas medidas del proceso.

En esta trayectoria el punto de consigna constante que se desea que alcance el proceso podrá ser modificado en cada instante para hacer seguir al proceso trayectorias que optimicen alguna o todas las variables que influyen en su rendimiento, y se podrá variar su velocidad de aproximación a dicho punto de consigna durante la operación de filtrado.

c): En cada instante consecutivo de filtrado o control el incremento de la salida deseada para el proceso no será el valor del incremento de la trayectoria guía de referencia en ese instante, sino el incremento de la salida predicha por el modelo incremental del filtro en ese mismo instante de control producido por el incremento de la señal de control calculada, en un instante de filtrado o control anterior, para que el incremento de la trayectoria guía de referencia y el incremento de la salida predicha por el modelo incremental del filtro coincidan al final del horizonte de predicción.

d): Definiendo la diferencia entre el incremento de la salida del proceso y el incremento de la salida producida por el modelo incremental de este filtro, cuando ambos reciben el mismo incremento de la señal de control calculada en un instante de filtrado o de control anterior con el fin de que el incremento de la trayectoria guía de referencia y el incremento de la salida predicha por et modelo incremental del filtro coincidan al final del horizonte de predicción, cuando el modelo del filtro esta sin ajustar por el mecanismo de aprendizaje como Error de Estimación "a priori" [e(k/k - 1)], y cuando esta ajustado como Error de estimación "a posteriori" [e(k/k)].

El nuevo mecanismo de aprendizaje no responde a ningún algoritmo de estimación paramétrica basado en la perspectiva de optimación o en el algoritmo del gradiente, sino a un nuevo algoritmo de ajuste paramétrico basado en garantizar en cada instante consecutivo de filtrado la reducción del error de estimación "a posteriori" [e(k/k)] mediante la descomposición del vector error de estimación "a priori" [e(k/k - 1)] en la combinación lineal de dos sumandos que verifiquen las siguientes condiciones:

1.: Uno de los sumandos producto de esta descomposición cumplirá en cada instante de filtrado o de control la condición de hacer nulo el error de estimación "a priori" [e(k/k - 1)].

2.: Y el otro sumando producto de esta descomposición en cada instante de filtrado o de control cumplirá la condición de ser igual al error de estimación "a priori" [e(k/k - 1)] definido anteriormente.

Del cumplimiento de la primera condición se deduce el nuevo algoritmo de aprendizaje.

e): El criterio seleccionado para detener el mecanismo de aprendizaje manteniendo o reinicializando los parámetros de adaptación del modelo incremental del filtro, con el fin de no perder su capacidad de aprendizaje, es que el valor absoluto del error de estimación "a priori" [e(k/k - 1)] sea mayor que la norma euclídea del vector de incrementos de entradas/salidas del proceso.

2. Sistema de procesamiento digital adaptativo de señales en tiempo real, según la reivindicación 1, caracterizado porque el software desarrollado para su aplicación práctica, tanto en tiempo real (on-line) u off-line, podrá implementarse en cualquier tipo de plataforma hardware de cálculo digital (microprocesador, ordenador, etc) y con cualquier tipo de sistema operativo.