ES2913725T3 - Método y sistema para controlar un dispositivo de vehículo autónomo para seguir repetidamente una misma trayectoria predeterminada - Google Patents

Método y sistema para controlar un dispositivo de vehículo autónomo para seguir repetidamente una misma trayectoria predeterminada Download PDF

Info

Publication number
ES2913725T3
ES2913725T3 ES18730284T ES18730284T ES2913725T3 ES 2913725 T3 ES2913725 T3 ES 2913725T3 ES 18730284 T ES18730284 T ES 18730284T ES 18730284 T ES18730284 T ES 18730284T ES 2913725 T3 ES2913725 T3 ES 2913725T3
Authority
ES
Spain
Prior art keywords
signal
control
control signal
autonomous vehicle
trajectory
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES18730284T
Other languages
English (en)
Inventor
Son Tong
Van Lanh Nguyen
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Siemens Industry Software NV
Original Assignee
Siemens Industry Software NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Siemens Industry Software NV filed Critical Siemens Industry Software NV
Application granted granted Critical
Publication of ES2913725T3 publication Critical patent/ES2913725T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05DSYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
    • G05D1/00Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots
    • G05D1/02Control of position or course in two dimensions
    • G05D1/021Control of position or course in two dimensions specially adapted to land vehicles
    • G05D1/0212Control of position or course in two dimensions specially adapted to land vehicles with means for defining a desired trajectory
    • G05D1/0221Control of position or course in two dimensions specially adapted to land vehicles with means for defining a desired trajectory involving a learning process
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B62LAND VEHICLES FOR TRAVELLING OTHERWISE THAN ON RAILS
    • B62DMOTOR VEHICLES; TRAILERS
    • B62D15/00Steering not otherwise provided for
    • B62D15/02Steering position indicators ; Steering position determination; Steering aids

Landscapes

  • Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Automation & Control Theory (AREA)
  • Remote Sensing (AREA)
  • Aviation & Aerospace Engineering (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Mechanical Engineering (AREA)
  • Combustion & Propulsion (AREA)
  • Chemical & Material Sciences (AREA)
  • Transportation (AREA)
  • Control Of Driving Devices And Active Controlling Of Vehicle (AREA)
  • Steering Control In Accordance With Driving Conditions (AREA)
  • Traffic Control Systems (AREA)
  • Control Of Position, Course, Altitude, Or Attitude Of Moving Bodies (AREA)

Abstract

Un método para controlar un dispositivo de vehículo autónomo para seguir repetidamente una misma trayectoria predeterminada, el método que comprende: a) recibir (S10) una señal de trayectoria objetivo (d) indicativa de la trayectoria predeterminada; b) generar (S20) una señal de control (u) adaptada para dirigir el dispositivo de vehículo autónomo a lo largo de la trayectoria predeterminada; y, para al menos una de un número de iteraciones: c) dirigir (S31) el dispositivo de vehículo autónomo a lo largo de la trayectoria predeterminada mediante la alimentación de la señal de control (u) al dispositivo de vehículo autónomo; d) medir (S32) una trayectoria real seguida por el dispositivo de vehículo autónomo en respuesta a la dirección de acuerdo con la señal de control (u); e) registrar (S33) una señal de trayectoria real (y) indicativa de la trayectoria real medida; f) usar (S40) un dispositivo de control de aprendizaje iterativo (40) para determinar una señal de control alterada (uu) con base en al menos la señal de control (u), la señal de trayectoria real (y) y la señal de trayectoria objetivo (d), en donde el dispositivo de control de aprendizaje iterativo comprende un modelo de control adaptado para generar una señal de trayectoria prevista a partir de una señal de control, caracterizado porque el paso f) comprende: f1) alterar el modelo de control con base a la señal de control y la señal de trayectoria real; y f2) alterar la señal de control con base al modelo de control alterado, en donde el paso f1) comprende alterar el modelo de control (43) para reducir una desviación entre la señal de trayectoria real (y) y la señal de trayectoria predicha generada por el modelo de control (43) desde la señal de control (u), en donde el paso f2) comprende alterar la señal de control (u) para reducir una desviación entre la señal de trayectoria predicha, generada por el modelo de control alterado (43) de la señal de control alterada (uu), y la señal de trayectoria objetivo (d)

Description

DESCRIPCIÓN
Método y sistema para controlar un dispositivo de vehículo autónomo para seguir repetidamente una misma trayectoria predeterminada
La presente invención se refiere al campo de la conducción autónoma y, más en particular, a un método y un sistema para controlar un dispositivo de vehículo autónomo para seguir repetidamente una misma trayectoria predeterminada.
Se han utilizado métodos de control tal como control de derivada integral proporcional (PID), control de estado-espacio, control de retroalimentación y control predictivo de modelo (MPC) para controlar un vehículo autónomo para seguir una trayectoria deseada.
En escenarios tal como estacionamiento en casa o valet en un estacionamiento predeterminado, carreras de vueltas autónomas y similares, un vehículo autónomo se controla repetidamente para seguir una misma trayectoria predeterminada, tal como una trayectoria en un estacionamiento específico o una trayectoria alrededor de una vuelta.
Se conoce un método del tipo definido anteriormente a partir de Kapania Nitin r et al: “Path tracking of highly dynamic autonomous vehicle trajectories via iterative learning control", 2015 American Control Conference (ACC), American Automatic Control Council, 1 de julio de 2015 (2015-07-01), páginas 2753-2758, XP033185259.
Se conoce una descripción similar de Manoharan PS et al: “Tracking Trajectory Using Iterative Learning Control", Process Automation, Control and Computing (PACC), 2011 International Conference On, IEEE, 20 de julio de 2011 (2011-07-20), páginas 1-5, XP031928422, DOI: 10.1109 /PACC.2011.5978963, ISBN: 978-1-61284-765-8.
Un objeto de la presente invención es mejorar un rendimiento cuando se controla un vehículo autónomo para seguir repetidamente una misma trayectoria predeterminada.
De acuerdo con un primer aspecto, un método para controlar un dispositivo de vehículo autónomo para seguir repetidamente una misma trayectoria predeterminada comprende: a) recibir una señal de trayectoria objetivo, indicativa de la trayectoria predeterminada; y b) generar una señal de control adaptada para dirigir el dispositivo de vehículo autónomo a lo largo de la trayectoria predeterminada. El método comprende además, para al menos una de un número de iteraciones: c) dirigir el dispositivo de vehículo autónomo a lo largo de la trayectoria predeterminada mediante la alimentación de la señal de control al dispositivo de vehículo autónomo; d) medir una trayectoria real seguida por el dispositivo de vehículo autónomo en respuesta a ser dirigido de acuerdo con la señal de control; e) registrar una señal de trayectoria real indicativa de la trayectoria real medida; y f) usar un dispositivo de control de aprendizaje iterativo para determinar una señal de control alterada con base en al menos la señal de control, la señal de trayectoria real y la señal de trayectoria objetivo.
El método propuesto permite ventajosamente aprovechar el control de aprendizaje iterativo (ILC) para mejorar un rendimiento de seguimiento del dispositivo de vehículo autónomo durante una iteración posterior de la dirección del dispositivo de vehículo autónomo a lo largo de la misma trayectoria predeterminada.
Un "rendimiento de seguimiento" puede ser, por ejemplo, un error de seguimiento o una desviación entre la trayectoria predeterminada y la trayectoria real, y "optimizar el rendimiento de seguimiento" se puede referir a reducir el error de seguimiento.
El dispositivo de vehículo autónomo puede ser un vehículo autónomo real. El dispositivo de vehículo autónomo también puede ser un modelo simulado de un vehículo. “Autónomo", como se usa en la presente, se puede referir a la capacidad del dispositivo de vehículo autónomo para seguir la trayectoria predeterminada sin intervención humana.
El término "señal" se puede referir a una serie temporal de lecturas o valores. La serie temporal puede ser continua o discreta. Una serie temporal discreta puede ser equidistante o no equidistante. En la señal de control, los valores pueden comprender aceleración y ángulo de dirección. En una señal de trayectoria respectiva, los valores pueden comprender coordenadas bidimensionales o tridimensionales y una señal respectiva puede comprender además un código de tiempo que indica un tiempo para cada valor.
La trayectoria predeterminada puede ser una vía o ruta deseada que se espera que siga el vehículo. Los ejemplos para la trayectoria predeterminada son una trayectoria desde una entrada de un estacionamiento valet (punto de inicio) hasta un espacio de estacionamiento predeterminado (punto final), o una trayectoria alrededor, o desde una línea de inicio (punto de inicio) hasta una línea de llegada (punto final) de una vuelta de un sitio de carreras.
En el paso a), la trayectoria predeterminada se puede recibir, por ejemplo, de una unidad de control estacionaria, tal como un controlador de estacionamiento y/o un controlador de sitio de carreras, y/o de una unidad de control a bordo del vehículo autónomo, tal como un controlador de navegación en el automóvil, y/o de un dispositivo móvil.
En el paso b), la señal de control adaptada para dirigir el dispositivo de vehículo autónomo a lo largo de la trayectoria predeterminada se puede generar mediante la detección y grabación de una serie temporal de entradas de control, tal como aceleración y ángulo de dirección, proporcionadas al automóvil por un conductor humano, un controlador PID o similares en respuesta a la recepción de la señal de trayectoria objetivo. Alternativamente, la señal de control se puede generar mediante cálculo.
La frase "direccionar/dirigir el dispositivo de vehículo autónomo a lo largo de la trayectoria predeterminada" en la presente se puede referir a controlar el dispositivo de vehículo autónomo para seguir, o mover/conducir a lo largo de, una trayectoria real que se puede desviar de la trayectoria predeterminada por un error de seguimiento permitido.
Un "número de iteraciones" se puede referir a un número de uno o más.
Una iteración respectiva puede referirse a una instancia respectiva de dirección del dispositivo de vehículo autónomo desde el punto de inicio de la trayectoria predeterminada hasta el punto final a lo largo de la trayectoria predeterminada de acuerdo con una señal de control respectiva. Específicamente, en una primera iteración, los pasos c), d), e) y f) se pueden realizar en respuesta a la señal de control generada en el paso b). En cualquier iteración adicional, los pasos c), d), e) y f) se pueden realizar en respuesta a la señal de control alterada generada en el paso f) como la señal de control. La alimentación de la señal de control al dispositivo de vehículo autónomo en el paso c) se puede referir repetidamente, para cada una de una pluralidad de instancias de tiempo, a proporcionar un respectivo de los valores comprendidos por la señal de control al dispositivo de vehículo autónomo, tal como a un dispositivo de dirección del dispositivo de vehículo autónomo.
Del mismo modo, la medición en el paso d) y la grabación en el paso e) también se pueden realizar repetidamente durante al menos parte de la pluralidad de instancias de tiempo. Es decir, los pasos d) y e) se pueden realizar en paralelo y/o sincrónicamente con el paso c).
La medición del paso d) se puede referir al uso de un dispositivo de ubicación tal como un receptor GPS, utilizando comunicación de radio con señales distribuidas a lo largo de la trayectoria predeterminada o similares, para adquirir valores de coordenadas bidimensionales y/o tridimensionales.
En el paso e), la grabación se puede referir a la formación de una señal a partir de una pluralidad de los valores medidos en el paso d) para una pluralidad de las instancias de tiempo.
En el paso f), el dispositivo de control de aprendizaje iterativo puede ser un dispositivo configurado para utilizar el control de aprendizaje iterativo (ILC) para proporcionar una señal de control alterada (actualizada, mejorada, optimizada) para una iteración posterior basada en la señal de control y la señal de trayectoria real (señal de trayectoria real registrada) de una iteración actual.
Más particularmente, "basado en la señal de control y la señal de trayectoria objetivo" puede significar "basado en una señal de error de seguimiento real que indica un error de seguimiento entre la señal de trayectoria real y la señal de trayectoria objetivo". La señal de error de seguimiento real se puede obtener restando la señal de trayectoria real de la señal de trayectoria objetivo. “Error de seguimiento" se puede referir a una desviación, tal como una distancia cuadrática media o media, entre las señales respectivas.
"Basado en una señal", puede, en particular, referirse a "usar la señal como una entrada".
Aún más particularmente, el dispositivo de control de aprendizaje iterativo se puede configurar para aprender iterativamente, al usarse repetidamente para cada una de las iteraciones, una señal de control óptima que optimiza el rendimiento de seguimiento. En particular, optimizar el rendimiento de seguimiento se puede referir a reducir o minimizar la señal de error de seguimiento real (un contenido de energía, valor promedio de tiempo o media cuadrática del mismo). Específicamente, "aprendizaje" se puede referir a alterar repetidamente (actualizar, optimizar) datos almacenados en el dispositivo de control de aprendizaje iterativo, tal como un parámetro, operador o modelo de control.
Se señala que el paso f) no se limita de ninguna manera a una realización en donde se utiliza un valor respectivo de la señal de control, un valor correspondiente de la señal de trayectoria real y un valor correspondiente de la señal de valor objetivo para determinar un valor correspondiente de la señal de control alterada, en donde todos los valores son valores relacionados con una misma instancia de tiempo.
Más bien, el paso f) puede funcionar preferentemente usando señales completas. Es decir, cada uno de los valores de la señal de control alterada para cada una de la pluralidad de instancias de tiempo se puede determinar dependiendo de una porción correspondiente a un intervalo de instancias de tiempo o a todas las instancias de tiempo de una serie de tiempo de cada una de la señal de control, la señal de trayectoria real y la señal de valor objetivo y/o la señal de error de seguimiento real.
De acuerdo con una realización, el paso e) comprende registrar la señal de trayectoria real en un dispositivo de memoria mientras se dirige el dispositivo de vehículo autónomo, y al menos el paso f) se lleva a cabo después de que el dispositivo de vehículo autónomo se ha dirigido en el paso c).
Es decir, el dispositivo de control de aprendizaje iterativo se puede usar fuera de línea, es decir, después de que se haya completado la dirección del dispositivo de vehículo autónomo a lo largo de la trayectoria predeterminada, para prepararse para una iteración posterior de la dirección del dispositivo de vehículo autónomo a lo largo de la trayectoria predeterminada.
En comparación con la operación en línea crítica en el tiempo, la operación fuera de línea del dispositivo de control de aprendizaje iterativo puede ofrecer la ventaja de ser capaz de utilizar un algoritmo de control más sofisticado (parámetros más sofisticados, operadores o un modelo de control más sofisticado e informático) en el dispositivo de control de aprendizaje iterativo. Por lo tanto, puede ser posible optimizar aún más el rendimiento de seguimiento.
En particular, la señal de trayectoria real se puede registrar almacenando, para cada una de al menos algunas de la pluralidad de instancias de tiempo para las cuales se mide la trayectoria real, un valor de posición (valores de coordenadas) en el dispositivo de memoria.
El dispositivo de memoria puede ser una memoria volátil o no volátil, tal como una RAM, una memoria flash, una unidad de disco duro, y similares.
De acuerdo con una realización adicional, el método comprende además usar la señal de control alterada como la señal de control para una iteración posterior del número de iteraciones.
Mediante el uso repetido de la señal de control alterada como la señal de control para una iteración posterior del número de iteraciones de los pasos c) a f), después de un número de las iteraciones, ventajosamente, se puede determinar una señal de control óptima para maximizar el rendimiento de seguimiento.
Una "iteración posterior" se puede referir a una próxima iteración que sigue inmediatamente después de la iteración actual y/o se puede referir a una próxima pero una o a cualquier otra iteración posterior que se lleve a cabo en un momento posterior a la iteración actual.
Se señala que los pasos de una pluralidad de las iteraciones pueden superponerse parcialmente. Por ejemplo, en un caso donde una iteración posterior de dirigir el vehículo a lo largo de la trayectoria predeterminada sigue inmediatamente después de una iteración actual, como por ejemplo en una carrera de vueltas, la siguiente iteración que sigue inmediatamente después de la iteración actual puede usar la misma señal de control u que se utilizó para la iteración actual, y la señal de control alterada uu determinada en el paso f) se puede proporcionar no a la siguiente iteración, sino a una iteración posterior que sigue después de la siguiente iteración (próxima pero una iteración).
Al paralelizar el paso f) y los pasos c), d), e) de esta manera, el control de aprendizaje iterativo fuera de línea con un modelo sofisticado se puede utilizar ventajosamente incluso en un escenario de carrera de vueltas.
De acuerdo con la invención, el dispositivo de control de aprendizaje iterativo comprende un modelo de control adaptado para generar una señal de trayectoria predicha a partir de una señal de control, y el paso f) comprende: f1) alterar el modelo de control con base a la señal de control y la señal de trayectoria real; y f2) alterar la señal de control con base al modelo de control alterado.
Es decir, la señal de salida alterada se determina con base en la señal de control, la señal de trayectoria real, la señal de trayectoria objetivo y el modelo alterado.
En otras palabras, el método de control de acuerdo con la presente realización se puede describir como una combinación de control de retroalimentación, control basado en modelos y control de aprendizaje. Esta combinación puede ser ventajosa en el sentido de que el rendimiento de seguimiento se puede optimizar adicionalmente.
En particular, en el paso f1), el modelo de control se puede alterar con base en la información sobre el dispositivo de vehículo autónomo que se puede derivar de la señal de control y la señal de trayectoria real.
El paso f1) se puede describir por lo tanto como un paso de aprendizaje en el que el modelo de control aprende nueva información sobre el dispositivo de vehículo autónomo, y el paso f2) se puede describir como un paso de aplicación en el que la información aprendida se utiliza para determinar una señal de control alterada mientras se aplica la información aprendida.
De acuerdo con la invención, el paso f1) comprende alterar el modelo de control para reducir una desviación entre la señal de trayectoria real y la señal de trayectoria predicha generada por el modelo de control de la señal de control.
De este modo, ventajosamente, el modelo de control comprendido por el controlador de aprendizaje iterativo se optimiza para predecir con mayor precisión la señal de trayectoria real.
Específicamente, el paso f1) puede comprender resolver un problema de optimización. El problema de optimización puede constituir la determinación de parámetros alterados del módulo de control que reducen o minimizan la desviación. Un mínimo puede ser un mínimo local o un mínimo global.
De acuerdo con la invención, el paso f2) comprende alterar la señal de control para reducir una desviación entre la señal de trayectoria predicha, generada por el modelo de control alterado a partir de la señal de control alterada, y la señal de trayectoria objetivo.
De este modo, ventajosamente, se reduce el error de seguimiento predicho (desviación entre la señal de trayectoria predicha y la señal de trayectoria objetivo) de una iteración posterior realizada utilizando la señal de control alterada. Por lo tanto, ventajosamente, también se puede reducir un error de seguimiento real de la iteración posterior.
Específicamente, el paso f2) puede comprender resolver un problema de optimización. El problema de optimización puede ser determinar una señal de control alterada que reduce o minimiza la desviación. Un mínimo puede ser un mínimo local o un mínimo global.
De acuerdo con una realización adicional, esta alteración realizada en el paso f1) y/o en el paso f2) se realiza bajo una restricción impuesta en el dispositivo de vehículo autónomo.
Un ejemplo de una restricción puede ser un ángulo de dirección máximo, una aceleración máxima y similares. La restricción se puede aplicar al resolver un problema de optimización respectivo.
De este modo, ventajosamente, la señal de control alterada se puede ajustar a las propiedades y/o un comportamiento deseado del dispositivo de vehículo autónomo.
De acuerdo con una realización adicional, el paso d) comprende determinar un parámetro real relacionado con la trayectoria real. El modelo de control se adapta además para generar un parámetro predicho relacionado con la trayectoria predicha. El paso f1) comprende alterar el modelo de control para reducir una desviación entre el parámetro real y el parámetro predicho generado por el modelo de control; y/o el paso f2) comprende alterar la señal de control para reducir una desviación entre el parámetro predicho generado por el modelo de control y un objetivo de parámetro predeterminado. Un parámetro respectivo relacionado con una trayectoria respectiva es un parámetro que indica una propiedad física de la trayectoria respectiva y/o el dispositivo de vehículo autónomo y/o un comportamiento de este cuando se sigue la trayectoria respectiva.
Por lo tanto, "optimizar el rendimiento de seguimiento" puede no referirse solo a reducir un error o desviación de seguimiento entre las coordenadas de posición de la trayectoria real y las coordenadas de la trayectoria predeterminada. Más bien, ventajosamente, se puede reducir una desviación entre cualquier parámetro deseado relacionado con las trayectorias respectivas. El parámetro deseado puede ser uno de error de seguimiento, consumo de combustible, desgaste de una parte del vehículo, tiempo de conducción total y similares.
Se observa que de acuerdo con las realizaciones en donde el paso f) comprende resolver un problema de optimización, una desviación que se desea reducir tanto como sea posible se puede establecer como una función objetiva del problema de optimización, mientras que una desviación que se desea no exceder un cierto límite máximo se puede establecer como una restricción al resolver el problema de optimización. Por ejemplo, el consumo de combustible se puede usar como función objetiva y el error de seguimiento se puede usar como una restricción para optimizar el consumo de combustible. Alternativamente, el consumo de combustible se puede usar como una restricción y el error de seguimiento se puede usar como una función objetiva para optimizar la precisión del seguimiento.
De acuerdo con una realización adicional, el parámetro predicho relacionado con la trayectoria predicha y el parámetro real relacionado con la trayectoria real cada uno son indicativos de al menos uno de un tiempo utilizado por el dispositivo de vehículo autónomo para seguir la trayectoria respectiva y una cantidad de combustible consumido por el dispositivo de vehículo autónomo mientras sigue la trayectoria respectiva.
En particular, el parámetro respectivo puede ser indicativo del tiempo o combustible utilizado mientras se sigue una porción predeterminada de la trayectoria respectiva, tal como desde su punto de inicio hasta su punto final.
De acuerdo con una realización adicional, en el paso f1) y/o en el paso f2), el modelo de control y/o la señal de control se altera en una serie de iteraciones.
Es decir, un problema de optimización resuelto en el paso f1) y/o el paso f2) puede ser un problema no analítico. Resolver el problema de optimización no analítica puede implicar resolver iterativamente el problema de optimización. La resolución iterativa puede comprender el uso de un método de descenso más pronunciado o similares. Las iteraciones se pueden repetir hasta que una desviación respectiva se encuentre por debajo de un valor umbral predeterminado y/o hasta que una desviación respectiva cambie menos que un umbral predeterminado entre iteraciones consecutivas y/o hasta que un gradiente más pronunciado se encuentre por debajo de un umbral predeterminado. En otras palabras, las iteraciones se pueden repetir hasta que se alcance la convergencia en un mínimo global o local.
De este modo, ventajosamente, se puede utilizar un modelo de control sofisticado que puede no ser solucionable analíticamente y puede requerir una solución iterativa, para mejorar aún más el rendimiento de seguimiento.
De acuerdo con una realización adicional, el dispositivo de vehículo autónomo es un vehículo de motor autónomo. En la presente, "autónomo" se puede referir a un vehículo de motor completamente autónomo, un vehículo de motor semiautónomo o un vehículo de motor convencional equipado con funcionalidad de asistencia de conducción.
El vehículo de motor autónomo puede ser un automóvil tal como un automóvil eléctrico, un automóvil híbrido, un automóvil de motor de combustión interna y similares.
El método de control de acuerdo con la presente realización se puede realizar ventajosamente siempre que el vehículo se dirija a lo largo de una misma trayectoria predeterminada. Por ejemplo, el automóvil se puede proporcionar con una señal de trayectoria objetivo mediante un estacionamiento automatizado o un sitio de carreras en el paso a). En respuesta a la señal de trayectoria objetivo, un humano o un controlador PID puede generar una señal de control para dirigir el vehículo a lo largo de la trayectoria objetivo en el paso b). Luego, se puede dirigir el vehículo a lo largo de la trayectoria objetivo de acuerdo con la señal de control y su trayectoria real se registra en los pasos c), d) y e). A partir de entonces, el paso f) se puede ejecutar para mejorar el rendimiento de seguimiento. La próxima vez que se proporcione al automóvil la misma trayectoria objetivo, el automóvil puede repetir los pasos c) a e) para dirigir el automóvil de forma autónoma a lo largo de la trayectoria objetivo con un rendimiento de seguimiento mejorado y el paso f) para mejorar aún más el rendimiento de seguimiento. De este modo, con el tiempo, mediante el empleo de control de aprendizaje iterativo, se puede optimizar (reducir) el número de operaciones de dirección, el tiempo utilizado y/o la cantidad de combustible consumido para dirigir el automóvil a lo largo de la trayectoria predeterminada.
De acuerdo con una realización adicional, el dispositivo de vehículo autónomo es un dispositivo de simulación configurado para simular un vehículo de motor en diseño.
El vehículo de motor en diseño puede ser un vehículo autónomo o un vehículo convencional; en este último caso, "autónomo" en "dispositivo de vehículo autónomo" se puede relacionar con el hecho de que el dispositivo simulador (pero no necesariamente el vehículo de motor final) se puede operar automáticamente sin intervención humana. [
El dispositivo simulador se puede materializar en software y/o hardware. En particular, el dispositivo simulador puede ser un modelo dinámico de vehículo de alta fidelidad creado usando un software de simulación tal como Siemens Imagine.Lab Amesim.
Un ingeniero puede utilizar el método de control propuesto para simular repetidamente la dirección del vehículo de motor simulado a lo largo de una trayectoria predeterminada y para determinar una entrada de control óptima para esta dirección. Esto puede permitir que el ingeniero evalúe el rendimiento óptimo del modelo dinámico del vehículo. El ingeniero puede entonces alterar el dispositivo simulador (alterar el modelo del vehículo de motor en diseño) y repetir el proceso, hasta que se logre un modelo con propiedades deseadas.
Por lo tanto, el método propuesto se puede usar con ventaja como una ayuda en el desarrollo de vehículos de motor en etapa temprana.
De acuerdo con una realización adicional, el paso b) comprende generar la señal de control a partir de la entrada de control obtenida mediante la dirección manual y/o autónoma del dispositivo de vehículo autónomo.
La entrada de control puede ser, por ejemplo, ángulo de dirección y aceleración.
"Dirección manual" se puede referir a la dirección por un conductor humano.
"Dirección autónoma", cuando se hace referencia al paso b), puede hacer referencia a la dirección usando un método de control de conducción autónoma tal como control de derivada integral proporcional (PID), control de estado-espacio, control de retroalimentación o control predictivo de modelo (MPC).
Cualquier realización del primer aspecto se puede combinar con cualquier realización del primer aspecto para obtener otra realización del primer aspecto.
De acuerdo con un segundo aspecto, la invención se refiere a un producto de programa de computadora que comprende un código de programa para ejecutar el método descrito anteriormente para controlar un dispositivo de vehículo autónomo cuando se ejecuta en al menos una computadora.
Un producto de programa de computadora, tal como un medio de programa de computadora, se puede representar como una tarjeta de memoria, memoria USB, CD-ROM, DVD o como un archivo que se puede descargar de un servidor en una red. Por ejemplo, este archivo se puede proporcionar mediante la transferencia del archivo que comprende el producto de programa de computadora de una red de comunicación inalámbrica.
De acuerdo con un tercer aspecto, un sistema para controlar un dispositivo de vehículo autónomo para seguir repetidamente una misma trayectoria predeterminada comprende: un primer dispositivo configurado para a) recibir una señal de trayectoria objetivo que indica la trayectoria predeterminada; un segundo dispositivo configurado para b) generar una señal de control adaptada para dirigir el dispositivo de vehículo autónomo a lo largo de la trayectoria predeterminada; y un tercer dispositivo configurado para, para al menos una de una serie de iteraciones: c) dirigir el dispositivo de vehículo autónomo a lo largo de la trayectoria predeterminada alimentando la señal de control al dispositivo de vehículo autónomo; d) medir una trayectoria real seguida por el dispositivo de vehículo autónomo en respuesta a ser dirigido de acuerdo con la señal de control; y e) registrar una señal de trayectoria real indicativa de la trayectoria real medida; y un cuarto dispositivo configurado para, para al menos uno de un número de iteraciones, f) utilizar control de aprendizaje iterativo para determinar una señal de control actualizada con base en al menos la señal de control, la señal de trayectoria real y la señal de trayectoria objetivo.
Las realizaciones y características descritas con referencia al método del primer aspecto se aplican mutatis mutandis al sistema del aspecto adicional. El sistema del tercer aspecto se puede implementar para ejecutar el método del primer aspecto o el método de cualquiera de las realizaciones del primer aspecto.
El dispositivo respectivo, por ejemplo, el primer, segundo, tercer y/o cuarto dispositivo, se puede implementar en hardware y/o en software. Si este dispositivo se implementa en hardware, se puede incorporar, por ejemplo, como una computadora o como un procesador o como parte de un sistema, por ejemplo, un sistema informático. Si este dispositivo se implementa en software, se puede incorporar como un producto de programa de computadora, como una función, como una rutina, como un código de programa o como un objeto ejecutable.
Otras posibles implementaciones o soluciones alternativas de la invención también abarcan combinaciones - que no se mencionan explícitamente en la presente - de características descritas anteriormente o a continuación con respecto a las realizaciones. El experto en la técnica también puede agregar aspectos y características individuales o aislados a la forma más básica de la invención.
Otras realizaciones, características y ventajas de la presente invención llegarán a ser evidentes a partir de la siguiente descripción y reivindicaciones dependientes, tomadas en conjunto con las figuras anexas, en las cuales:
La figura 1 muestra un diagrama de flujo que ilustra un método de acuerdo con una primera realización;
La figura 2 muestra un diagrama de bloques que ilustra un sistema de acuerdo con la primera realización; y
La figura 3 muestra un diagrama de bloques que ilustra un sistema de acuerdo con una segunda realización.
En las figuras, los números de referencia similares designan elementos similares o funcionalmente equivalentes, a menos que se indique lo contrario.
La figura 1 muestra un diagrama de flujo que ilustra un método de acuerdo con una primera realización para controlar un dispositivo de vehículo autónomo para seguir repetidamente una misma trayectoria predeterminada ("método de control" a continuación). La figura 2 muestra un diagrama de bloques que ilustra un sistema 1 para controlar un dispositivo de vehículo autónomo para seguir repetidamente una misma trayectoria predeterminada ("sistema de control" a continuación) de acuerdo con la primera realización. Se hará referencia a la figura 1 y a la figura 2.
El sistema de control 1 comprende un receptor de trayectoria (primer dispositivo) 10, un controlador de conducción autónoma (segundo dispositivo) 20, un montaje de interfaz de vehículo (tercer dispositivo) 30 y un dispositivo de control de aprendizaje iterativo (cuarto dispositivo) 40.
El sistema de control 1 está asociado con (tal como instalado en, o conectado comunicativamente a) un dispositivo de vehículo autónomo tal como un carro autónomo ("carro" a continuación; no se muestra).
En el paso S10 del método de control, el receptor de trayectoria 10 recibe una señal de trayectoria d objetivo de una entidad externa (no mostrada) tal como, por ejemplo, un transmisor instalado en un estacionamiento valet (no mostrado). La señal de trayectoria d indica una trayectoria predeterminada que se espera que siga el carro.
Simplemente como un ejemplo, la trayectoria predeterminada puede ser una trayectoria que conduce desde una entrada del estacionamiento valet a un espacio de estacionamiento predeterminado del estacionamiento valet.
En el paso S20 del método de control, el controlador de conducción autónoma 20 se proporciona con la señal de trayectoria d objetivo. El controlador de conducción autónoma 20 puede ser un controlador PID en la presente realización. Los detalles del control PID se omiten para brevedad. En respuesta a que se le proporciona la señal de trayectoria d objetivo, el controlador de conducción autónoma genera una señal de control u y proporciona la señal de control u al montaje de interfaz del vehículo 30.
En respuesta a que se le proporciona la señal de control u, el montaje de interfaz del vehículo 30 realiza los siguientes tres pasos S31, S32 y S33:
En el paso S31, la señal de control u se alimenta al dispositivo de vehículo autónomo. Por lo tanto, el dispositivo de vehículo autónomo se dirige a lo largo de la trayectoria predeterminada.
En el paso S32, se mide una trayectoria real seguida por el dispositivo de vehículo autónomo en respuesta a ser dirigido de acuerdo con la señal de control u.
En el paso S33, se registra una señal de trayectoria real e indicativa de la trayectoria real medida.
El montaje de interfaz de vehículo 30 proporciona la señal de trayectoria real y al dispositivo de control de aprendizaje iterativo 40. Asimismo, la señal de control u y la trayectoria d objetivo también se proporcionan al dispositivo de control de aprendizaje iterativo 40.
En el paso S40, el dispositivo 40 de control de aprendizaje iterativo utiliza un control de aprendizaje iterativo (ILC) para determinar una señal uu de control alterada con base en la señal u de control, la señal y de trayectoria real y la señal d de trayectoria objetivo.
Los pasos S31, S32, S33 y S40 constituyen, por lo tanto, una primera iteración en la que el vehículo se ha dirigido a lo largo de la trayectoria predeterminada desde un punto de inicio hasta un punto final del mismo en el paso S31, se ha medido una trayectoria real en el paso S32, se ha registrado una señal de trayectoria real y en el paso S33, y se ha determinado una señal de control alterada uu en el paso S40 con base en la señal de trayectoria real y, la señal de trayectoria objetivo d y la señal de controles u.
Por lo tanto, durante la primera iteración, se ha determinado una señal de control alterada uu en la que, ventajosamente, un rendimiento de seguimiento del vehículo automatizado puede haber sido mejorado por el control de aprendizaje iterativo.
De acuerdo con una variante preferida, después del paso S40, la señal de control alterada uu se puede retroalimentar al montaje de interfaz del vehículo 30 para usarse como la señal de control u durante una o más iteraciones posteriores de los pasos S31, S32, S33 y S40.
La figura 3 muestra un diagrama de bloques ilustrativo de un sistema de control 1 de acuerdo con una segunda realización. La siguiente descripción se centra en las diferencias entre el sistema de control de la figura 3 y el sistema de control 1 de la figura 1. Se hará referencia a la figura 3 y a la figura 1.
Además del receptor de trayectoria 10, el controlador de conducción autónoma 20, el montaje de interfaz de vehículo 30 y el dispositivo de control de aprendizaje iterativo 40, el sistema 1 de la figura 3 comprende además una base de datos 50.
La base de datos 50 está configurada para almacenar una pluralidad de señales de control y señales de trayectoria objetivo en asociación entre sí.
El montaje de interfaz de vehículo 30 comprende un dispositivo de dirección 31, un dispositivo de medición 32, un dispositivo de memoria 33 y un medidor de consumo 34. El medidor de consumo puede comprender un medidor de combustible.
El dispositivo de control de aprendizaje iterativo 40 comprende un sustractor 41 y un controlador de aprendizaje iterativo 42. El controlador de aprendizaje iterativo 42 comprende un modelo de control 43.
El sistema 1 de acuerdo con la segunda realización puede funcionar de la siguiente manera:
En el paso S10, el receptor de trayectoria 10 recibe una señal de trayectoria d objetivo de la entidad externa. La señal de trayectoria objetivo d comprende una serie de valores de posición objetivo d(k), con k=1...K, en donde k es un índice de discretización tal como un tiempo discretizado, y K es el número total de valores comprendidos por la señal de trayectoria objetivo d. El receptor de trayectoria 10 proporciona la señal de trayectoria objetivo d(k), con k=1..K, al controlador de conducción autónoma 20 que se utilizará para generar la señal de control u como se describe a continuación, a la base de datos 50 que se almacenará en esta en asociación con una señal de control alterada uu como se describe a continuación, y al dispositivo de control de aprendizaje iterativo 40 que se utilizará para determinar una señal de error de seguimiento predicho y una señal de error de seguimiento real e.
El controlador de conducción autónoma 20 se puede configurar para generar, en el paso S20, la señal de control u que se suministrará al montaje de interfaz del vehículo 30 de una de dos maneras:
Específicamente, el controlador de conducción autónoma 20 se acopla de manera comunicativa a la base de datos 50. Al recibir la señal de trayectoria d objetivo, el controlador de conducción autónoma 20 puede consultar la base de datos 50 para determinar si la base de datos 50 almacena una señal de control en asociación con la señal de trayectoria objetivo d (o una señal de control u almacenada en asociación con una señal de trayectoria objetivo que indica una misma trayectoria predeterminada que la señal de trayectoria objetivo d).
Si la base de datos 50 comprende una señal de control u almacenada en asociación con la señal de trayectoria d objetivo, el controlador de conducción autónoma 20 puede saber que se desea una iteración posterior de la dirección del carro a lo largo de la trayectoria predeterminada indicada por la señal de trayectoria d objetivo. En este caso, la señal de control almacenada puede ser una señal de control alterada (actualizada, mejorada, optimizada) uu para dirigir el automóvil a lo largo de la trayectoria predeterminada indicada por la señal de trayectoria d. Por lo tanto, el controlador de conducción autónoma 20 puede generar la señal de control u al suministrar la señal de control uu que se almacena en la base de datos 50 en asociación con la señal de trayectoria d objetivo como la señal de control u al montaje de interfaz del vehículo 30.
Si la base de datos 50 no comprende una señal de control almacenada en asociación con la señal de trayectoria d objetivo, el controlador de conducción autónoma 20 puede utilizar el control PID o similar para generar la señal de control u y suministrar la señal de control u al ensamblaje de interfaz de vehículo 30.
En el dispositivo de interfaz de vehículo 30, en respuesta a que se suministra con la señal de control u, se realizan los siguientes pasos:
Para dirigir el automóvil a lo largo de la trayectoria predeterminada en el paso S31, para cada tiempo k discretizado, se suministra un valor correspondiente u(k) de la señal de control u al dispositivo de dirección 31. El valor u(k) puede comprender una aceleración y un ángulo de dirección. El valor u(k) se proporciona además al dispositivo de memoria 33 para que se almacene en el mismo. De esta manera, la señal de control u se puede grabar en el dispositivo de memoria 33.
Mientras que el vehículo se dirige a lo largo de la trayectoria predeterminada, para cada tiempo k discretizado, el dispositivo de medición 32 mide las coordenadas de corriente de la trayectoria real seguida por el vehículo en respuesta a ser dirigido de acuerdo con la señal de control u en el paso S32. Las coordenadas actuales se proporcionan al dispositivo de memoria 33 para que sean almacenadas en el mismo. De este modo, se puede registrar una señal de trayectoria real y en el dispositivo de memoria 33 (paso S33, figura 1).
Además, un parámetro p indicativo de una cantidad de combustible consumido por el automóvil mientras se sigue la trayectoria real (un ejemplo para un parámetro real relacionado con la trayectoria real) se almacena en la memoria 33. El parámetro p se determina y actualiza por el medidor de combustible 34 en intervalos regulares, tal como para cada tiempo discretizado k.
Después de que se haya completado la dirección del vehículo a lo largo de la trayectoria predeterminada, es decir, cuando se ha alcanzado el tiempo discretizado K, la señal de control registrada ur(k), con k=1..K, la señal de trayectoria real registrada yr(k), con k=1..K, y el parámetro real registrado pr se proporcionan al dispositivo de control de aprendizaje iterativo 40.
Más específicamente, la señal de trayectoria real yr registrada se puede proporcionar al sustractor 41 del dispositivo de control de aprendizaje iterativo 40. La señal de trayectoria d objetivo también se puede proporcionar al sustractor 41. El sustractor 41 puede restar la señal de trayectoria real registrada yr(k) de la señal de trayectoria objetivo d(k) para lograr una señal de error de seguimiento real e(k). La señal de error de seguimiento real e(k), con k=1..K, se puede proporcionar al controlador de aprendizaje iterativo 42 junto con la señal de control registrada ur(k) y el parámetro registrado pr.
El controlador de aprendizaje iterativo 42 comprende un modelo de control 43 de un sistema controlado que incluye el carro.
Específicamente, en el paso S40, el controlador de aprendizaje iterativo 42 puede determinar una señal de control alterada uu(k) usando el modelo de control 43 mediante la evaluación de una función de aprendizaje f. La función de aprendizaje f puede ser una función del error de seguimiento real e(k), la señal de control real registrada ur(k) y la señal de parámetro registrada pr: uu(k) = f[ur(k), e(k), pr], con k=1...K
En particular, la función f puede ser una función no analítica.
Específicamente, evaluar la función f puede comprender el procesamiento de aprendizaje, en el que el modelo de control 43 se altera con base en el conocimiento aprendido de la señal de error de seguimiento real e(k), la señal de parámetro real registrada pr(k) y la señal de control real ur(k). La evaluación de la función f puede comprender además el procesamiento de optimización, en el que se determina una señal de control alterada uu(k) con base en el modelo de control alterado 43 alterado en el procesamiento de aprendizaje.
El problema de optimización puede comprender una función objetiva y una restricción. La función objetiva puede ser reducir un error de seguimiento, y la restricción puede ser un consumo de combustible máximo permitido. Por el contrario, la función objetiva puede ser reducir el consumo de combustible, y la restricción puede ser un error de seguimiento máximo permitido.
Cuando se ha determinado de esta manera la señal de control alterada uu(k), se proporciona la señal de control alterada uu(k) a la base de datos 50 y se almacena en esta en asociación con la señal de trayectoria d(k).
De esta manera, la señal de control alterada uu(k) está disponible para su uso por el controlador de conducción autónoma 20 durante iteraciones posteriores en las que el receptor de trayectoria 10 recibe la misma señal de trayectoria objetivo d(k).
Por lo tanto, un rendimiento de seguimiento, tal como el error de seguimiento experimentado, el combustible consumido o el tiempo utilizado por el vehículo cuando se sigue la misma trayectoria predeterminada, se puede mejorar iterativamente durante iteraciones posteriores.
Ahora se utilizará una variante preferida de la segunda realización para describir una variante preferida del paso S40 con más detalle. De acuerdo con una variante preferida de la segunda realización, el modelo de control 43 se puede configurar para generar una señal de trayectoria predicha con base en una señal de control proporcionada al modelo de control 43. El modelo de control 43 se puede configurar adicionalmente para generar un parámetro predicho con base en la señal de control.
Es decir, de acuerdo con la variante preferida, el controlador de aprendizaje iterativo 42 puede realizar los siguientes pasos para evaluar la función de aprendizaje f usando el modelo de control 43 en el paso S40. En un primer subpaso (f1), que es un ejemplo para el procesamiento de aprendizaje mencionado anteriormente, el controlador de aprendizaje iterativo (42) puede alterar el modelo de control (43) en un número de iteraciones.
En cada iteración, el controlador de aprendizaje iterativo 42 puede utilizar el modelo de control 43 para determinar una señal de trayectoria predicha yp(k) y un parámetro predicho pp con base en la señal de control registrada ur(k).
En la presente, el parámetro predicho pp puede ser una cantidad predicha de combustible consumido por el automóvil mientras se sigue la trayectoria predicha indicada por la señal de trayectoria predicha yp(k) (un ejemplo para un parámetro predicho relacionado con la trayectoria predicha).
En las iteraciones respectivas, el controlador de aprendizaje iterativo 42 puede alterar el modelo de control 43 de acuerdo con una estrategia de optimización iterativa tal como un método de descenso más pronunciado. Una función objetiva de la estrategia de optimización puede ser reducir o minimizar una desviación entre la trayectoria predicha yp(k) y la trayectoria registrada yr(k) y/o reducir o minimizar una desviación entre el parámetro predicho pp y el parámetro recodificado pr.
Se observa en la presente memoria que reducir una desviación entre la señal de trayectoria predicha yp(k) y la señal de trayectoria registrada yr(k) puede ser funcionalmente equivalente a reducir una desviación entre una señal de error de seguimiento predicha determinada restando la señal de trayectoria predicha yp(k) de la señal de trayectoria objetivo d(k) y la señal de error de seguimiento real e(k). El sustractor 41 se puede usar para determinar la señal de error de seguimiento predicha, aunque esto no se muestra explícitamente en la figura 3.
El controlador de aprendizaje iterativo 42 puede alterar el modelo de control 43 alterando uno o más parámetros del mismo. El controlador de aprendizaje iterativo 42 puede continuar alterando iterativamente el modelo de control 43 hasta que se alcance la convergencia de la desviación en un mínimo local o global.
En otras palabras, en el procesamiento de aprendizaje del primer subpaso f1), el controlador de aprendizaje iterativo 42 puede resolver un problema de optimización para que el modelo de control 43 esté mejor de acuerdo con un comportamiento observado del sistema controlado que comprende el carro, que está modelado por el modelo de control 43. En la presente, el comportamiento observado se puede indicar mediante la señal de control registrada ur(k), el parámetro registrado pr y la señal de trayectoria real registrada yr(k) (la señal de error de seguimiento real e(k)).
En un segundo subpaso f2) del paso S40, el controlador de aprendizaje iterativo 42 puede determinar iterativamente una señal de control alterada uu(k). Específicamente, el controlador de aprendizaje iterativo 42 puede utilizar primero la señal de control registrada ur(k) como la señal de control alterada uu(k) y alterar iterativamente la señal de control alterada uu(k) en un número de iteraciones.
En cada iteración, el controlador de aprendizaje iterativo 42 puede utilizar el modelo de control alterado 43 para determinar una trayectoria objetivo predicha yp(k) y un parámetro predicho pp en función de la señal de control alterada actual uu(k). En las iteraciones respectivas, el controlador de aprendizaje iterativo 42 puede alterar la señal de control alterada uu(k) de acuerdo con una estrategia de optimización iterativa tal como un método de descenso más pronunciado. Una función objetiva de la estrategia de optimización puede ser reducir o minimizar una desviación entre la trayectoria predicha yp(k) y la trayectoria deseada d(k) (también denominada reducción o minimización de un error de seguimiento), y/o reducir o minimizar una desviación entre el parámetro predicho pp y un parámetro objetivo predeterminado. Específicamente, el objetivo de parámetros predeterminado puede ser un consumo total máximo de combustible permitido.
El controlador de aprendizaje iterativo 42 puede continuar alterando iterativamente el modelo de control 43 hasta que se alcance la convergencia de la desviación en un mínimo local o global.
En la presente, si la desviación a minimizar se selecciona para que sea la desviación entre la trayectoria predicha yp(k) y la trayectoria objetivo d(k), el controlador de aprendizaje iterativo 42 optimiza eficazmente un error de seguimiento predicho (un ejemplo de un rendimiento de seguimiento predicho a ser optimizado). Si se selecciona la desviación a minimizar para que sea la desviación entre el parámetro predicho pp y el parámetro objetivo predeterminado, el controlador de aprendizaje iterativo 42 optimiza de manera eficaz un parámetro predicho relacionado con la trayectoria predicha tal como una cantidad predicha de combustible consumido por el carro cuando se sigue la trayectoria predicha (otro ejemplo para un rendimiento de seguimiento predicho).
Mientras se optimiza un error de seguimiento predicho, un consumo máximo de combustible permitido se puede considerar como una restricción al alterar la señal de control alterada uu(k). Por el contrario, al optimizar un consumo de combustible predicho, un error de seguimiento máximo permitido se puede considerar como una restricción al alterar la señal de control alterada uu(k).
Otras restricciones consideradas cuando se altera la señal de control alterada uu(k) pueden ser restricciones que se imponen por las propiedades del carro, tal como un ángulo de dirección máximo permitido, o una aceleración máxima permitida.
En otras palabras, en el procesamiento de optimización del segundo subpaso (f2), el controlador de aprendizaje iterativo (42) puede resolver un problema de optimización para determinar una señal de control alterada (k) que se espera, con base en las predicciones generadas por el modelo de control alterado (43), que produzca un rendimiento de seguimiento mejorado u optimizado (tal como un error de seguimiento mínimo o un consumo mínimo de combustible) bajo un conjunto predeterminado de restricciones.
De esta manera, cuando el paso S40 se lleva a cabo después de que el carro se ha dirigido a lo largo de la trayectoria predeterminada indicada por la señal de trayectoria d(k) recibida, en el paso f1), el modelo de control 43 se altera por aprendizaje, y en el paso f2), la señal de control se altera optimizando un rendimiento de seguimiento predicho.
Al llevar a cabo repetidamente el paso S40 en cada una de las iteraciones (iteraciones en las que el carro se dirige a lo largo de la misma trayectoria predeterminada, es decir, de acuerdo con los pasos S31, S32 y S33, figura 1), ventajosamente, se puede mejorar un rendimiento de seguimiento real sobre las iteraciones posteriores a través del aprendizaje iterativo.
Aunque la presente invención se ha descrito de acuerdo con realizaciones preferidas, es obvio para el experto en la técnica que las modificaciones son posibles en todas las realizaciones.
Las realizaciones se han descrito principalmente en vista de un escenario de estacionamiento valet, sin embargo, las enseñanzas divulgadas son igualmente aplicables a un escenario de carreras de vueltas, un escenario de estacionamiento en el hogar y cualquier otro escenario en el que un dispositivo de vehículo autónomo se dirige repetidamente a lo largo de una misma trayectoria predeterminada.
Las realizaciones se han descrito en vista de un vehículo de motor autónomo tal como un carro como un ejemplo del dispositivo de vehículo autónomo. Sin embargo, las enseñanzas descritas son igualmente aplicables a un escenario de desarrollo en el que el dispositivo de vehículo autónomo es un dispositivo de simulación configurado para simular un vehículo de motor en diseño.
El parámetro relacionado con una trayectoria no se limita a una cantidad de combustible consumido, sino que también puede incluir una cantidad de desgaste ejercido sobre una parte del vehículo, un tiempo utilizado para completar la dirección del vehículo desde un punto de inicio hasta un punto final de la trayectoria predeterminada y similares.
Se observa que, de acuerdo con la segunda realización, una pluralidad de señales de trayectoria objetivo y señales de control alteradas asociadas se pueden almacenar en la base de datos 50. Preferentemente, la base de datos 50 también puede almacenar múltiples instancias del modelo de control 43, cada una asociada con una de las señales de trayectoria objetivo. En la presente, una instancia del modelo de control puede ser, por ejemplo, un conjunto de parámetros de modelo. Más precisamente, para cada ejecución del paso (S40), el dispositivo de control de aprendizaje iterativo (S40) puede cargar la instancia correspondiente del modelo de control (43), que corresponde a una señal de trayectoria objetivo actual, en el controlador de aprendizaje iterativo (42), antes de ejecutar el procesamiento de aprendizaje y el procesamiento de optimización del paso (S40), y puede escribir el modelo de control alterado (43) (instancia del mismo) de vuelta a la base de datos (50) después de completar el paso (S40). Es decir, se pueden enseñar (alterar) diferentes instancias del modelo de control 43 de acuerdo con diferentes señales de trayectoria objetivo (diferentes escenarios de conducción).
Sin embargo, la base de datos 50 es una característica opcional no limitante, y también se contempla la retroalimentación directa de la señal de control alterada uu a la interfaz del vehículo 30 para una interfaz posterior. Una realización sin base de datos 50 se puede usar de forma beneficiosa en un escenario de carreras de vueltas donde el vehículo autónomo se almacena repetidamente a lo largo de una misma vuelta y se optimiza el rendimiento de seguimiento a lo largo de la carrera. Una vez finalizada la carrera, la información aprendida ya no es necesaria y, por lo tanto, no hay necesidad de almacenar la información en una base de datos.
Porciones de, o todas, los pasos S31, S32, S33 y S40 pueden ser paralelas a discreción del experto en la técnica.
Las diversas señales descritas en la segunda realización, tal como la señal de trayectoria real y y la señal deseada d, no necesitan necesariamente parametrizarse usando un mismo índice de discretización k, pero cada una puede parametrizarse usando diferentes discretizaciones.

Claims (12)

REIVINDICACIONES
1. Un método para controlar un dispositivo de vehículo autónomo para seguir repetidamente una misma trayectoria predeterminada, el método que comprende:
a) recibir (S10) una señal de trayectoria objetivo (d) indicativa de la trayectoria predeterminada;
b) generar (S20) una señal de control (u) adaptada para dirigir el dispositivo de vehículo autónomo a lo largo de la trayectoria predeterminada; y, para al menos una de un número de iteraciones:
c) dirigir (S31) el dispositivo de vehículo autónomo a lo largo de la trayectoria predeterminada mediante la alimentación de la señal de control (u) al dispositivo de vehículo autónomo;
d) medir (S32) una trayectoria real seguida por el dispositivo de vehículo autónomo en respuesta a la dirección de acuerdo con la señal de control (u);
e) registrar (S33) una señal de trayectoria real (y) indicativa de la trayectoria real medida;
f) usar (S40) un dispositivo de control de aprendizaje iterativo (40) para determinar una señal de control alterada (uu) con base en al menos la señal de control (u), la señal de trayectoria real (y) y la señal de trayectoria objetivo (d),
en donde el dispositivo de control de aprendizaje iterativo comprende un modelo de control adaptado para generar una señal de trayectoria prevista a partir de una señal de control, caracterizado porque el paso f) comprende:
f1) alterar el modelo de control con base a la señal de control y la señal de trayectoria real; y
f2) alterar la señal de control con base al modelo de control alterado,
en donde el paso f1) comprende alterar el modelo de control (43) para reducir una desviación entre la señal de trayectoria real (y) y la señal de trayectoria predicha generada por el modelo de control (43) desde la señal de control (u), en donde el paso f2) comprende alterar la señal de control (u) para reducir una desviación entre la señal de trayectoria predicha, generada por el modelo de control alterado (43) de la señal de control alterada (uu), y la señal de trayectoria objetivo (d)
2. El método de acuerdo con la reivindicación 1,
en donde el paso e) comprende registrar la señal de trayectoria real (y) en un dispositivo de memoria (33) mientras se dirige el dispositivo de vehículo autónomo, y al menos el paso f) se lleva a cabo después de que el dispositivo de vehículo autónomo se ha dirigido en el paso c).
3. El método de acuerdo con la reivindicación 1 o 2, en donde el método comprende además
h) usar la señal de control alterada (uu) como la señal de control (u) para una iteración posterior del número de iteraciones.
4. El método de acuerdo con una de las reivindicaciones 1 a 3,
en donde la alteración realizada en el paso f1) y/o en el paso f2) se realiza bajo una restricción impuesta en el dispositivo de vehículo autónomo.
5. El método de acuerdo con una de las reivindicaciones 1 - 4
en donde el paso d) comprende determinar un parámetro real relacionado con la trayectoria real,
el modelo de control (43) que se adapta adicionalmente para generar un parámetro predicho relacionado con la trayectoria predicha; y el paso f1) comprende alterar el modelo de control (43) para reducir una desviación entre el parámetro real y el parámetro predicho generado por el modelo de control (43); y/o el paso f2) comprende alterar la señal de control para reducir una desviación entre el parámetro predicho generado por el modelo de control (43) y un parámetro objetivo predeterminado; en donde un parámetro respectivo relacionado con una trayectoria respectiva es un parámetro indicativo de una propiedad física de la trayectoria respectiva y/o el dispositivo de vehículo autónomo y/o un comportamiento del mismo cuando se sigue la trayectoria respectiva.
6. El método de acuerdo con la reivindicación 5,
en donde el parámetro predicho relacionado con la trayectoria predicha y el parámetro real relacionado con la trayectoria real cada uno son indicativos de al menos uno de un tiempo utilizado por el dispositivo de vehículo autónomo para seguir la trayectoria respectiva y una cantidad de combustible consumido por el dispositivo de vehículo autónomo mientras se sigue la trayectoria respectiva.
7. El método de acuerdo con una de las reivindicaciones 1 - 6,
en donde en el paso f1) y/o en el paso f2), el modelo de control (43) y/o la señal de control (u) se altera en un número de iteraciones.
8. El método de acuerdo con una de las reivindicaciones 1 - 7,
en donde el dispositivo de vehículo autónomo es un vehículo automotor autónomo.
9. El método de acuerdo con una de las reivindicaciones 1 - 7,
en donde el dispositivo de vehículo autónomo es un dispositivo simulador configurado para simular un vehículo automotor en diseño.
10. El método según una de las reivindicaciones 1 - 9,
en donde la etapa b) comprende generar la señal de control (u) a partir de la entrada de control obtenida mediante la dirección manual manualmente y/o autónomamente el dispositivo de vehículo autónomo dispositivo.
11. Un producto de programa de computadora que comprende un código de programa para ejecutar el método de acuerdo con una de las reivindicaciones 1 - 10 cuando se ejecuta en al menos una computadora.
12. Un sistema (1) para controlar un dispositivo de vehículo autónomo para seguir repetidamente una misma trayectoria predeterminada, el sistema que comprende:
un primer dispositivo (10) configurado para a) recibir una señal de trayectoria objetivo (d) indicativa de la trayectoria predeterminada;
un segundo dispositivo (20) configurado para b) generar una señal de control (u) adaptada para dirigir el dispositivo de vehículo autónomo a lo largo de la trayectoria predeterminada; y
un tercer dispositivo (30) configurado para, para al menos uno de un número de iteraciones:
c) dirigir el dispositivo de vehículo autónomo a lo largo de la trayectoria predeterminada alimentando la señal de control (u) al dispositivo de vehículo autónomo;
d) medir una trayectoria real seguida por el dispositivo de vehículo autónomo en respuesta a la dirección de acuerdo con la señal de control (u); y
e) registrar una señal de trayectoria real (y) indicativa de la trayectoria real medida; y
un cuarto dispositivo (40) configurado para, para al menos uno de un número de iteraciones,
f) usar control de aprendizaje iterativo para determinar una señal de control actualizada (uu) con base en al menos la señal de control (u), la señal de trayectoria real (y) y la señal de trayectoria objetivo (d),
en donde el dispositivo de control de aprendizaje iterativo comprende un modelo de control adaptado para generar una señal de trayectoria prevista a partir de una señal de control, caracterizado porque el paso f) comprende:
f1) alterar el modelo de control con base a la señal de control y la señal de trayectoria real; y
f2) alterar la señal de control con base al modelo de control alterado,
en donde el paso f1) comprende alterar el modelo de control (43) para reducir una desviación entre la señal de trayectoria real (y) y la señal de trayectoria predicha generada por el modelo de control (43) desde la señal de control (u), en donde el paso f2) comprende alterar la señal de control (u) para reducir una desviación entre la señal de trayectoria predicha, generada por el modelo de control alterado (43) de la señal de control alterada (uu), y la señal de trayectoria objetivo (d).
ES18730284T 2018-05-30 2018-05-30 Método y sistema para controlar un dispositivo de vehículo autónomo para seguir repetidamente una misma trayectoria predeterminada Active ES2913725T3 (es)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/EP2018/064238 WO2019228626A1 (en) 2018-05-30 2018-05-30 Method and system for controlling an autonomous vehicle device to repeatedly follow a same predetermined trajectory

Publications (1)

Publication Number Publication Date
ES2913725T3 true ES2913725T3 (es) 2022-06-06

Family

ID=62567628

Family Applications (1)

Application Number Title Priority Date Filing Date
ES18730284T Active ES2913725T3 (es) 2018-05-30 2018-05-30 Método y sistema para controlar un dispositivo de vehículo autónomo para seguir repetidamente una misma trayectoria predeterminada

Country Status (6)

Country Link
US (1) US11249485B2 (es)
EP (1) EP3776127B1 (es)
JP (1) JP6976484B2 (es)
CN (1) CN112236732B (es)
ES (1) ES2913725T3 (es)
WO (1) WO2019228626A1 (es)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20200363816A1 (en) * 2019-05-16 2020-11-19 WeRide Corp. System and method for controlling autonomous vehicles
US11300967B2 (en) * 2019-10-25 2022-04-12 Toyota Research Institute, Inc. System and method for collection of performance data by a vehicle
DE102020001887A1 (de) 2020-03-23 2021-09-23 Scania Cv Ab Verfahren und Steuerungsanordnung zur Bewegungssteuerung eines autonomen Fahrzeugs
US11453409B2 (en) * 2020-04-21 2022-09-27 Baidu Usa Llc Extended model reference adaptive control algorithm for the vehicle actuation time-latency
US20220227397A1 (en) * 2021-01-19 2022-07-21 Baidu Usa Llc Dynamic model evaluation package for autonomous driving vehicles
CN114255594B (zh) * 2021-12-28 2024-03-15 吉林大学 一种自主代客泊车运动规划与运动控制方法
GB2618341A (en) * 2022-05-03 2023-11-08 Oxa Autonomy Ltd Controlling an autonomous vehicle

Family Cites Families (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06127407A (ja) * 1992-10-15 1994-05-10 Mitsubishi Motors Corp 前後輪操舵式車両の後輪操舵制御装置
JP2940372B2 (ja) * 1993-12-27 1999-08-25 日産自動車株式会社 車両用補助舵角制御装置
JPH09252608A (ja) * 1996-03-22 1997-09-30 Seibutsukei Tokutei Sangyo Gijutsu Kenkyu Suishin Kiko 作業車両の遠隔操作装置
JP2009280097A (ja) * 2008-05-22 2009-12-03 Fuji Heavy Ind Ltd ステアリングパラメータ最適化システム
JP6299415B2 (ja) * 2014-05-16 2018-03-28 株式会社ジェイテクト ステアリング装置
CN105035090B (zh) 2015-06-06 2017-10-13 吉林大学 基于交通信号灯的自主驾驶车辆轨迹预测控制方法
DE102016219594A1 (de) 2016-10-10 2018-04-12 Volkswagen Aktiengesellschaft Verfahren und Vorrichtung zur Fahrdynamikregelung für ein Kraftfahrzeug
US10345812B2 (en) * 2017-01-10 2019-07-09 GM Global Technology Operations LLC Methods and apparatus for optimizing a trajectory for an autonomous vehicle
US10829149B1 (en) * 2017-03-01 2020-11-10 Zoox, Inc. Steering control for vehicles
CN107161207B (zh) 2017-05-08 2023-08-22 江苏大学 一种基于主动安全的智能汽车轨迹跟踪控制系统及控制方法
US10725470B2 (en) * 2017-06-13 2020-07-28 GM Global Technology Operations LLC Autonomous vehicle driving systems and methods for critical conditions
US10521974B2 (en) * 2017-08-28 2019-12-31 GM Global Technology Operations LLC Method and apparatus for monitoring an autonomous vehicle
US10782694B2 (en) * 2017-09-07 2020-09-22 Tusimple, Inc. Prediction-based system and method for trajectory planning of autonomous vehicles
US10782693B2 (en) * 2017-09-07 2020-09-22 Tusimple, Inc. Prediction-based system and method for trajectory planning of autonomous vehicles
US20190129831A1 (en) * 2017-10-27 2019-05-02 Uber Technologies, Inc. Autonomous Vehicle Simulation Testing Systems and Methods
US10562538B2 (en) * 2017-11-22 2020-02-18 Uatc, Llc Object interaction prediction systems and methods for autonomous vehicles
US10933869B2 (en) * 2017-11-29 2021-03-02 Uatc, Llc Autonomous vehicle motion control systems and methods
US11169528B2 (en) * 2018-05-11 2021-11-09 Uatc, Llc Initial trajectory generator for motion planning system of autonomous vehicles
US11755018B2 (en) * 2018-11-16 2023-09-12 Uatc, Llc End-to-end interpretable motion planner for autonomous vehicles
US20200278686A1 (en) * 2019-02-28 2020-09-03 University Of South Carolina Iterative Feedback Motion Planning

Also Published As

Publication number Publication date
CN112236732A (zh) 2021-01-15
EP3776127A1 (en) 2021-02-17
WO2019228626A1 (en) 2019-12-05
JP2021526480A (ja) 2021-10-07
JP6976484B2 (ja) 2021-12-08
EP3776127B1 (en) 2022-03-02
US11249485B2 (en) 2022-02-15
US20210208596A1 (en) 2021-07-08
CN112236732B (zh) 2022-04-19

Similar Documents

Publication Publication Date Title
ES2913725T3 (es) Método y sistema para controlar un dispositivo de vehículo autónomo para seguir repetidamente una misma trayectoria predeterminada
JP6913723B2 (ja) 車両制御パラメータのキャリブレーション方法、装置、車載コントローラ及び無人車両
Zhang et al. 2D Lidar‐based SLAM and path planning for indoor rescue using mobile robots
Ostafew et al. Learning‐based nonlinear model predictive control to improve vision‐based mobile robot path tracking
JP4942817B2 (ja) 移動体の慣性ユニットの機能検査方法
WO2007105077A2 (en) Trajectory tracking control system and method for mobile unit
CN110968088B (zh) 车辆控制参数的确定方法、装置、车载控制器和无人车
WO2022142858A9 (zh) 机器人移动路径规划方法、确定规划的路径点偏离历史路径程度的方法、装置、机器人及计算机可读存储介质
JP2012242967A (ja) 地図処理方法及びプログラム、並びにロボットシステム
US20130262353A1 (en) Optimal online adaptive controller
Guillet et al. Formation control of agricultural mobile robots: A bidirectional weighted constraints approach
CN111731307A (zh) 一种车辆转弯控制方法、装置、车辆及存储介质
JP2011511940A (ja) 移動体の慣性ユニットを検査するための方法およびシステム
da Silva et al. A dynamic programming approach for the motion control of autonomous vehicles
CN113741176B (zh) 基于Koopman分析的船舶靠离泊控制方法、装置及存储介质
CN111290406B (zh) 一种路径规划的方法、机器人及存储介质
CN104345637B (zh) 用于自适应基于数据的函数模型的方法和设备
Seegmiller et al. Online calibration of vehicle powertrain and pose estimation parameters using integrated dynamics
Minnerup et al. Testing autonomous driving systems against sensor and actuator error combinations
CN111561944B (zh) 一种运梁车运行路径规划方法及自动驾驶运行控制方法
Bishnu Autonomous Controls System for Global Formula Racing
Doran et al. Autonomic wheel alignment for mobile robots
CN114061566B (zh) 弧线导航方法、装置、设备及计算机可读存储介质
Bradford et al. Racing With ROS 2 A Navigation System for an Autonomous Formula Student Race Car
Bakirci et al. Improving position-time trajectory accuracy in vehicle stop-and-go scenarios by using a mobile robot as a testbed