FR3077666B1 - Procede de configuration automatique d’un generateur de recompenses utilisees par des strategies de conduite d’un vehicule a conduite automatisee - Google Patents

Procede de configuration automatique d’un generateur de recompenses utilisees par des strategies de conduite d’un vehicule a conduite automatisee Download PDF

Info

Publication number
FR3077666B1
FR3077666B1 FR1850950A FR1850950A FR3077666B1 FR 3077666 B1 FR3077666 B1 FR 3077666B1 FR 1850950 A FR1850950 A FR 1850950A FR 1850950 A FR1850950 A FR 1850950A FR 3077666 B1 FR3077666 B1 FR 3077666B1
Authority
FR
France
Prior art keywords
driving
vehicle
action
difference
automatic configuration
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
FR1850950A
Other languages
English (en)
Other versions
FR3077666A1 (fr
Inventor
Patrick Boutard
Frederic Large
Jose Antonio Flores Gonzalez
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Stellantis Auto Sas Fr
Original Assignee
PSA Automobiles SA
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by PSA Automobiles SA filed Critical PSA Automobiles SA
Priority to FR1850950A priority Critical patent/FR3077666B1/fr
Publication of FR3077666A1 publication Critical patent/FR3077666A1/fr
Application granted granted Critical
Publication of FR3077666B1 publication Critical patent/FR3077666B1/fr
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/004Artificial life, i.e. computing arrangements simulating life
    • G06N3/006Artificial life, i.e. computing arrangements simulating life based on simulated virtual individual or collective life forms, e.g. social simulations or particle swarm optimisation [PSO]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Molecular Biology (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Feedback Control In General (AREA)
  • Electric Propulsion And Braking For Vehicles (AREA)
  • Current-Collector Devices For Electrically Propelled Vehicles (AREA)

Abstract

Un procédé configure automatiquement un dispositif (DG) de génération de récompenses r(t) attribuées à des actions a(t) permettant de conduire un véhicule à conduite automatisée prenant différents états s(t), et comprend une étape où : - on alimente un réseau de neurones (R3), configurable par des valeurs de coefficients, avec des définitions d'action connue ac(t) et d'état connu sc(t) du véhicule, faisant partie d'un triplet connu (ac(t), sc(t), rc(t)) comprenant une récompense connue rc(t) attribuée à l'action connue ac(t), pour générer une récompense r(t), puis - on détermine la différence entre les récompenses générée r(t) et connue rc(t), puis - on modifie les valeurs des coefficients lorsque cette différence est supérieure à un seuil, et - on déclenche une nouvelle alimentation du réseau de neurones (R3) avec des définitions d'action connue ac(t) et d'état connu sc(t) d'autres triplets connus tant que chaque différence déterminée est inférieure à un seuil.
FR1850950A 2018-02-05 2018-02-05 Procede de configuration automatique d’un generateur de recompenses utilisees par des strategies de conduite d’un vehicule a conduite automatisee Active FR3077666B1 (fr)

Priority Applications (1)

Application Number Priority Date Filing Date Title
FR1850950A FR3077666B1 (fr) 2018-02-05 2018-02-05 Procede de configuration automatique d’un generateur de recompenses utilisees par des strategies de conduite d’un vehicule a conduite automatisee

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
FR1850950 2018-02-05
FR1850950A FR3077666B1 (fr) 2018-02-05 2018-02-05 Procede de configuration automatique d’un generateur de recompenses utilisees par des strategies de conduite d’un vehicule a conduite automatisee

Publications (2)

Publication Number Publication Date
FR3077666A1 FR3077666A1 (fr) 2019-08-09
FR3077666B1 true FR3077666B1 (fr) 2020-01-17

Family

ID=62167504

Family Applications (1)

Application Number Title Priority Date Filing Date
FR1850950A Active FR3077666B1 (fr) 2018-02-05 2018-02-05 Procede de configuration automatique d’un generateur de recompenses utilisees par des strategies de conduite d’un vehicule a conduite automatisee

Country Status (1)

Country Link
FR (1) FR3077666B1 (fr)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR3115594B1 (fr) * 2020-10-27 2022-09-23 Thales Sa Système électronique pour la mise en œuvre d’une fonction critique, procédé et programme d’ordinateur associés

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7080811B2 (ja) * 2015-09-11 2022-06-06 グーグル エルエルシー 強化学習ニューラルネットワークのトレーニング

Also Published As

Publication number Publication date
FR3077666A1 (fr) 2019-08-09

Similar Documents

Publication Publication Date Title
US11022965B2 (en) Controlling multi-stage manufacturing process based on internet of things (IOT) sensors and cognitive rule induction
US9887661B2 (en) Machine learning method and machine learning apparatus learning operating command to electric motor and controller and electric motor apparatus including machine learning apparatus
FR3077666B1 (fr) Procede de configuration automatique d’un generateur de recompenses utilisees par des strategies de conduite d’un vehicule a conduite automatisee
Xu et al. Optimo: Online probabilistic trust inference model for asymmetric human-robot collaborations
US9283572B2 (en) Centrifuge with automatic sampling and control and method thereof
US20170090428A1 (en) Machine learning apparatus for optimizing cycle processing time of processing machine, motor control apparatus, processing machine, and machine learning method
JP2017045300A (ja) びびり或いは工具摩耗/破損の発生を抑制する加工条件調整機能を有する数値制御装置
US20210240145A1 (en) Automatic step bit detection
CN104907700A (zh) 用于配置激光加工装置的方法
US20170300041A1 (en) Production system for executing production plan
Keegan et al. Strategies for bridging the research-practice ‘gap’in sport and exercise psychology
CN103422527A (zh) 自适应控制方法及装置
FR3060124B1 (fr) Procede de controle de la concentration de composes organiques dans un fluide d'un reseau de fluide
WO2021001859A3 (fr) Procédé et système d'optimisation d'agglomération de minerais
FR3058342B1 (fr) Procede de percage comprenant une mesure de trainee(s), et dispositif de percage correspondant
CN112292642A (zh) 用于控制技术系统的控制装置和用于配置控制装置的方法
FR3051757B1 (fr) Dispositif de suivi des habitudes de conduite d'un conducteur d'un vehicule de transport et procede correspondant
MX2022002917A (es) Sistema de soporte de vehículo basado en ia y método para su uso.
CN107901903B (zh) 行车过程中自动调整离合器滑磨点的方法及混合动力车辆
EP0692751B1 (fr) Procédé et dispositif de régulation sur une plage admissible avec anticipation sur contextes utilisant la logique floue
Dumesnil et al. Single SNN architecture for classical and operant conditioning using reinforcement learning
US20230202169A1 (en) Fault diagnosis in a continuous ink jet printer
FR3088126B1 (fr) Procede de parametrage d'un dispositif d'eclairage de vision industrielle
US11556111B2 (en) Human-plausible automated control of an industrial process
KR102311704B1 (ko) 운전자 감정에 따른 운전자와 차량간의 상호작용 제공 장치 및 그 방법

Legal Events

Date Code Title Description
PLFP Fee payment

Year of fee payment: 2

PLSC Publication of the preliminary search report

Effective date: 20190809

PLFP Fee payment

Year of fee payment: 3

PLFP Fee payment

Year of fee payment: 4

PLFP Fee payment

Year of fee payment: 5

PLFP Fee payment

Year of fee payment: 6

PLFP Fee payment

Year of fee payment: 7

CD Change of name or company name

Owner name: STELLANTIS AUTO SAS, FR

Effective date: 20240423