FR3077666B1 - Procede de configuration automatique d’un generateur de recompenses utilisees par des strategies de conduite d’un vehicule a conduite automatisee - Google Patents
Procede de configuration automatique d’un generateur de recompenses utilisees par des strategies de conduite d’un vehicule a conduite automatisee Download PDFInfo
- Publication number
- FR3077666B1 FR3077666B1 FR1850950A FR1850950A FR3077666B1 FR 3077666 B1 FR3077666 B1 FR 3077666B1 FR 1850950 A FR1850950 A FR 1850950A FR 1850950 A FR1850950 A FR 1850950A FR 3077666 B1 FR3077666 B1 FR 3077666B1
- Authority
- FR
- France
- Prior art keywords
- driving
- vehicle
- action
- difference
- automatic configuration
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title abstract 2
- 238000013528 artificial neural network Methods 0.000 abstract 2
- 230000001960 triggered effect Effects 0.000 abstract 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/004—Artificial life, i.e. computing arrangements simulating life
- G06N3/006—Artificial life, i.e. computing arrangements simulating life based on simulated virtual individual or collective life forms, e.g. social simulations or particle swarm optimisation [PSO]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Molecular Biology (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Feedback Control In General (AREA)
- Electric Propulsion And Braking For Vehicles (AREA)
- Current-Collector Devices For Electrically Propelled Vehicles (AREA)
Abstract
Un procédé configure automatiquement un dispositif (DG) de génération de récompenses r(t) attribuées à des actions a(t) permettant de conduire un véhicule à conduite automatisée prenant différents états s(t), et comprend une étape où : - on alimente un réseau de neurones (R3), configurable par des valeurs de coefficients, avec des définitions d'action connue ac(t) et d'état connu sc(t) du véhicule, faisant partie d'un triplet connu (ac(t), sc(t), rc(t)) comprenant une récompense connue rc(t) attribuée à l'action connue ac(t), pour générer une récompense r(t), puis - on détermine la différence entre les récompenses générée r(t) et connue rc(t), puis - on modifie les valeurs des coefficients lorsque cette différence est supérieure à un seuil, et - on déclenche une nouvelle alimentation du réseau de neurones (R3) avec des définitions d'action connue ac(t) et d'état connu sc(t) d'autres triplets connus tant que chaque différence déterminée est inférieure à un seuil.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
FR1850950A FR3077666B1 (fr) | 2018-02-05 | 2018-02-05 | Procede de configuration automatique d’un generateur de recompenses utilisees par des strategies de conduite d’un vehicule a conduite automatisee |
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
FR1850950 | 2018-02-05 | ||
FR1850950A FR3077666B1 (fr) | 2018-02-05 | 2018-02-05 | Procede de configuration automatique d’un generateur de recompenses utilisees par des strategies de conduite d’un vehicule a conduite automatisee |
Publications (2)
Publication Number | Publication Date |
---|---|
FR3077666A1 FR3077666A1 (fr) | 2019-08-09 |
FR3077666B1 true FR3077666B1 (fr) | 2020-01-17 |
Family
ID=62167504
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
FR1850950A Active FR3077666B1 (fr) | 2018-02-05 | 2018-02-05 | Procede de configuration automatique d’un generateur de recompenses utilisees par des strategies de conduite d’un vehicule a conduite automatisee |
Country Status (1)
Country | Link |
---|---|
FR (1) | FR3077666B1 (fr) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
FR3115594B1 (fr) * | 2020-10-27 | 2022-09-23 | Thales Sa | Système électronique pour la mise en œuvre d’une fonction critique, procédé et programme d’ordinateur associés |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7080811B2 (ja) * | 2015-09-11 | 2022-06-06 | グーグル エルエルシー | 強化学習ニューラルネットワークのトレーニング |
-
2018
- 2018-02-05 FR FR1850950A patent/FR3077666B1/fr active Active
Also Published As
Publication number | Publication date |
---|---|
FR3077666A1 (fr) | 2019-08-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11022965B2 (en) | Controlling multi-stage manufacturing process based on internet of things (IOT) sensors and cognitive rule induction | |
US9887661B2 (en) | Machine learning method and machine learning apparatus learning operating command to electric motor and controller and electric motor apparatus including machine learning apparatus | |
FR3077666B1 (fr) | Procede de configuration automatique d’un generateur de recompenses utilisees par des strategies de conduite d’un vehicule a conduite automatisee | |
Xu et al. | Optimo: Online probabilistic trust inference model for asymmetric human-robot collaborations | |
US9283572B2 (en) | Centrifuge with automatic sampling and control and method thereof | |
US20170090428A1 (en) | Machine learning apparatus for optimizing cycle processing time of processing machine, motor control apparatus, processing machine, and machine learning method | |
JP2017045300A (ja) | びびり或いは工具摩耗/破損の発生を抑制する加工条件調整機能を有する数値制御装置 | |
US20210240145A1 (en) | Automatic step bit detection | |
CN104907700A (zh) | 用于配置激光加工装置的方法 | |
US20170300041A1 (en) | Production system for executing production plan | |
Keegan et al. | Strategies for bridging the research-practice ‘gap’in sport and exercise psychology | |
CN103422527A (zh) | 自适应控制方法及装置 | |
FR3060124B1 (fr) | Procede de controle de la concentration de composes organiques dans un fluide d'un reseau de fluide | |
WO2021001859A3 (fr) | Procédé et système d'optimisation d'agglomération de minerais | |
FR3058342B1 (fr) | Procede de percage comprenant une mesure de trainee(s), et dispositif de percage correspondant | |
CN112292642A (zh) | 用于控制技术系统的控制装置和用于配置控制装置的方法 | |
FR3051757B1 (fr) | Dispositif de suivi des habitudes de conduite d'un conducteur d'un vehicule de transport et procede correspondant | |
MX2022002917A (es) | Sistema de soporte de vehículo basado en ia y método para su uso. | |
CN107901903B (zh) | 行车过程中自动调整离合器滑磨点的方法及混合动力车辆 | |
EP0692751B1 (fr) | Procédé et dispositif de régulation sur une plage admissible avec anticipation sur contextes utilisant la logique floue | |
Dumesnil et al. | Single SNN architecture for classical and operant conditioning using reinforcement learning | |
US20230202169A1 (en) | Fault diagnosis in a continuous ink jet printer | |
FR3088126B1 (fr) | Procede de parametrage d'un dispositif d'eclairage de vision industrielle | |
US11556111B2 (en) | Human-plausible automated control of an industrial process | |
KR102311704B1 (ko) | 운전자 감정에 따른 운전자와 차량간의 상호작용 제공 장치 및 그 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PLFP | Fee payment |
Year of fee payment: 2 |
|
PLSC | Publication of the preliminary search report |
Effective date: 20190809 |
|
PLFP | Fee payment |
Year of fee payment: 3 |
|
PLFP | Fee payment |
Year of fee payment: 4 |
|
PLFP | Fee payment |
Year of fee payment: 5 |
|
PLFP | Fee payment |
Year of fee payment: 6 |
|
PLFP | Fee payment |
Year of fee payment: 7 |
|
CD | Change of name or company name |
Owner name: STELLANTIS AUTO SAS, FR Effective date: 20240423 |