KR20200095590A - 심층강화학습과 운전자보조시스템을 이용한 자율주행차량의 제어 방법 및 장치 - Google Patents
심층강화학습과 운전자보조시스템을 이용한 자율주행차량의 제어 방법 및 장치 Download PDFInfo
- Publication number
- KR20200095590A KR20200095590A KR1020190007345A KR20190007345A KR20200095590A KR 20200095590 A KR20200095590 A KR 20200095590A KR 1020190007345 A KR1020190007345 A KR 1020190007345A KR 20190007345 A KR20190007345 A KR 20190007345A KR 20200095590 A KR20200095590 A KR 20200095590A
- Authority
- KR
- South Korea
- Prior art keywords
- reinforcement learning
- driver assistance
- vehicle
- assistance system
- image data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000002787 reinforcement Effects 0.000 title claims abstract description 121
- 238000000034 method Methods 0.000 title claims abstract description 62
- 230000009471 action Effects 0.000 claims abstract description 75
- 238000013527 convolutional neural network Methods 0.000 claims description 21
- 230000006399 behavior Effects 0.000 claims description 20
- 230000008901 benefit Effects 0.000 claims description 19
- 230000003542 behavioural effect Effects 0.000 claims description 7
- 230000003247 decreasing effect Effects 0.000 claims description 6
- 230000006403 short-term memory Effects 0.000 claims description 6
- 238000000746 purification Methods 0.000 claims description 4
- 238000010586 diagram Methods 0.000 description 16
- 230000008859 change Effects 0.000 description 15
- 238000012545 processing Methods 0.000 description 13
- 230000006870 function Effects 0.000 description 12
- 238000013528 artificial neural network Methods 0.000 description 5
- 239000003795 chemical substances by application Substances 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- 238000004088 simulation Methods 0.000 description 5
- 238000013461 design Methods 0.000 description 4
- 230000015654 memory Effects 0.000 description 4
- 230000007423 decrease Effects 0.000 description 3
- 239000002245 particle Substances 0.000 description 3
- 238000007670 refining Methods 0.000 description 3
- 230000001133 acceleration Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 230000004913 activation Effects 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000003930 cognitive ability Effects 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000010304 firing Methods 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 229910052709 silver Inorganic materials 0.000 description 1
- 239000004332 silver Substances 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Images
Classifications
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B60—VEHICLES IN GENERAL
- B60W—CONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
- B60W30/00—Purposes of road vehicle drive control systems not related to the control of a particular sub-unit, e.g. of systems using conjoint control of vehicle sub-units
- B60W30/14—Adaptive cruise control
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B60—VEHICLES IN GENERAL
- B60W—CONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
- B60W30/00—Purposes of road vehicle drive control systems not related to the control of a particular sub-unit, e.g. of systems using conjoint control of vehicle sub-units
- B60W30/18—Propelling the vehicle
- B60W30/18009—Propelling the vehicle related to particular drive situations
- B60W30/18163—Lane change; Overtaking manoeuvres
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B60—VEHICLES IN GENERAL
- B60W—CONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
- B60W40/00—Estimation or calculation of non-directly measurable driving parameters for road vehicle drive control systems not related to the control of a particular sub unit, e.g. by using mathematical models
- B60W40/02—Estimation or calculation of non-directly measurable driving parameters for road vehicle drive control systems not related to the control of a particular sub unit, e.g. by using mathematical models related to ambient conditions
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B60—VEHICLES IN GENERAL
- B60W—CONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
- B60W40/00—Estimation or calculation of non-directly measurable driving parameters for road vehicle drive control systems not related to the control of a particular sub unit, e.g. by using mathematical models
- B60W40/10—Estimation or calculation of non-directly measurable driving parameters for road vehicle drive control systems not related to the control of a particular sub unit, e.g. by using mathematical models related to vehicle motion
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B60—VEHICLES IN GENERAL
- B60W—CONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
- B60W2420/00—Indexing codes relating to the type of sensors based on the principle of their operation
- B60W2420/40—Photo, light or radio wave sensitive means, e.g. infrared sensors
- B60W2420/403—Image sensing, e.g. optical camera
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B60—VEHICLES IN GENERAL
- B60W—CONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
- B60W2420/00—Indexing codes relating to the type of sensors based on the principle of their operation
- B60W2420/40—Photo, light or radio wave sensitive means, e.g. infrared sensors
- B60W2420/408—Radar; Laser, e.g. lidar
-
- B60W2420/42—
-
- B60W2420/52—
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B60—VEHICLES IN GENERAL
- B60W—CONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
- B60W2520/00—Input parameters relating to overall vehicle dynamics
- B60W2520/06—Direction of travel
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B60—VEHICLES IN GENERAL
- B60W—CONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
- B60W2520/00—Input parameters relating to overall vehicle dynamics
- B60W2520/10—Longitudinal speed
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B60—VEHICLES IN GENERAL
- B60W—CONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
- B60W2520/00—Input parameters relating to overall vehicle dynamics
- B60W2520/12—Lateral speed
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B60—VEHICLES IN GENERAL
- B60Y—INDEXING SCHEME RELATING TO ASPECTS CROSS-CUTTING VEHICLE TECHNOLOGY
- B60Y2300/00—Purposes or special features of road vehicle drive control systems
- B60Y2300/14—Cruise control
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B60—VEHICLES IN GENERAL
- B60Y—INDEXING SCHEME RELATING TO ASPECTS CROSS-CUTTING VEHICLE TECHNOLOGY
- B60Y2300/00—Purposes or special features of road vehicle drive control systems
- B60Y2300/18—Propelling the vehicle
- B60Y2300/18008—Propelling the vehicle related to particular drive situations
- B60Y2300/18166—Overtaking, changing lanes
Landscapes
- Engineering & Computer Science (AREA)
- Automation & Control Theory (AREA)
- Transportation (AREA)
- Mechanical Engineering (AREA)
- Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Traffic Control Systems (AREA)
Abstract
Description
도 2는 일 실시예에 따른 주변 차량에 대한 LIDAR 센서의 예를 설명하기 위한 도면이다.
도 3은 일 실시예에 따른 느린 차량의 추월에 따른 즉각적인 보상을 설명하기 위한 도면이다.
도 4는 일 실시예에 따른 시뮬레이터 예시를 나타내는 도면이다.
도 5는 일 실시예에 따른 심층강화학습과 운전자보조시스템을 이용한 자율주행차량의 제어 방법을 나타내는 흐름도이다.
도 6은 일 실시예에 따른 심층강화학습과 운전자보조시스템을 이용한 자율주행차량의 제어 장치의 구조를 개략적으로 나타내는 도면이다.
도 7은 일 실시예에 따른 운전 정책을 결정하는 알고리즘을 통한 평균 속도의 예를 나타내는 도면이다.
도 8은 일 실시예에 따른 운전 정책을 결정하는 알고리즘을 통한 평균 차선 변경 횟수의 예를 나타내는 도면이다.
도 9는 일 실시예에 따른 운전 정책을 결정하는 알고리즘을 통한 평균 추월 수의 예를 나타내는 도면이다.
Claims (15)
- 측정된 센서 데이터 및 촬영된 이미지 데이터를 심층강화학습(deep reinforcement learning) 알고리즘으로 입력 받는 단계;
상기 심층강화학습 알고리즘에서 입력 받은 상기 센서 데이터 및 상기 이미지 데이터를 이용하여 차량 제어를 위한 행동을 결정하는 단계; 및
결정된 상기 행동에 따라 운전자보조시스템(Driver Assistance Systems, DAS)을 선택하여 차량을 제어하는 단계
를 포함하는, 심층강화학습과 운전자보조시스템을 이용한 자율주행차량의 제어 방법. - 제1항에 있어서,
상기 측정된 센서 데이터 및 촬영된 이미지 데이터를 심층강화학습 알고리즘으로 입력 받는 단계는,
차량에 구성된 LIDAR 센서를 통해 측정된 상기 센서 데이터와 카메라를 통해 촬영된 이미지 데이터를 심층강화학습 알고리즘으로 입력 받는 것
을 특징으로 하는, 심층강화학습과 운전자보조시스템을 이용한 자율주행차량의 제어 방법. - 제1항에 있어서,
상기 차량 제어를 위한 행동을 결정하는 단계는,
입력 받은 상기 센서 데이터 및 상기 이미지 데이터를 각각 정제하는 단계;
정제된 상기 센서 데이터 및 상기 이미지 데이터를 연결하여 연결된 데이터를 형성하는 단계;
상기 연결된 데이터를 상기 심층강화학습 알고리즘의 완전히 연결된 레이어(fully connected layer)에 입력하여 Q 값을 구하는 단계; 및
상기 Q 값에 따라 행동을 결정하는 단계
를 포함하는, 심층강화학습과 운전자보조시스템을 이용한 자율주행차량의 제어 방법. - 제3항에 있어서,
상기 센서 데이터 및 상기 이미지 데이터를 각각 정제하는 단계는,
상기 센서 데이터를 LSTM(Long Short-Term Memory)을 사용하여 정제하는 단계; 및
상기 이미지 데이터를 CNN(Convolutional Neural Network)을 사용하여 정제하는 단계
를 포함하는, 심층강화학습과 운전자보조시스템을 이용한 자율주행차량의 제어 방법. - 제3항에 있어서,
상기 완전히 연결된 레이어에 입력하여 Q 값을 구하는 단계는,
상기 완전히 연결된 레이어를 상태 값과 각 행동에 대한 이점을 평가하는 행동 이점의 2 개의 파트로 나눈 네트워크를 이용하고, 상기 상태 값과 상기 행동 이점을 통합하여 상기 Q 값을 구하는 것
을 특징으로 하는, 심층강화학습과 운전자보조시스템을 이용한 자율주행차량의 제어 방법. - 제1항에 있어서,
상기 차량 제어를 위한 행동을 결정하는 단계는,
차량이 종 방향과 횡 방향으로 동시에 운전 가능하도록, 목표 속도 증가, 목표 속도 감소, 좌측으로 차선 변경, 우측으로 차선 변경, 현재 상태 유지의 5가지 행동을 포함하는 것
을 특징으로 하는, 심층강화학습과 운전자보조시스템을 이용한 자율주행차량의 제어 방법. - 제1항에 있어서,
상기 심층강화학습 알고리즘을 최적의 운전 정책으로 학습시키는 단계
를 더 포함하는, 심층강화학습과 운전자보조시스템을 이용한 자율주행차량의 제어 방법. - 제7항에 있어서,
상기 심층강화학습 알고리즘을 최적의 운전 정책으로 학습시키는 단계는,
상기 행동의 결과에 따라 보상을 설계하여 차량의 고속 주행, 충돌하지 않는 궤적으로의 주행 및 불필요한 차선 변경 배제에 기반한 최적의 운전 정책을 찾고, 상기 운전 정책으로 상기 심층강화학습 알고리즘을 학습시키는 것
을 특징으로 하는, 심층강화학습과 운전자보조시스템을 이용한 자율주행차량의 제어 방법. - 측정된 센서 데이터 및 촬영된 이미지 데이터를 심층강화학습(deep reinforcement learning) 알고리즘으로 입력 받는 입력부;
상기 심층강화학습 알고리즘에서 입력 받은 상기 센서 데이터 및 상기 이미지 데이터를 이용하여 차량 제어를 위한 행동을 결정하는 심층강화학습부; 및
결정된 상기 행동에 따라 운전자보조시스템(Driver Assistance Systems, DAS)을 선택하여 차량을 제어하는 차량 제어부
를 포함하는, 심층강화학습과 운전자보조시스템을 이용한 자율주행차량의 제어 장치. - 제9항에 있어서,
상기 입력부는,
차량에 구성된 LIDAR 센서를 통해 측정된 상기 센서 데이터와 카메라를 통해 촬영된 이미지 데이터를 심층강화학습 알고리즘으로 입력 받는 것
을 특징으로 하는, 심층강화학습과 운전자보조시스템을 이용한 자율주행차량의 제어 장치. - 제9항에 있어서,
상기 심층강화학습부는,
입력 받은 상기 센서 데이터를 정제하는 센서 데이터 정제부;
입력 받은 상기 이미지 데이터를 정제하는 이미지 데이터 정제부;
정제된 상기 센서 데이터 및 상기 이미지 데이터를 연결하여 연결된 데이터를 형성하는 연결 데이터 형성부;
상기 연결된 데이터를 상기 심층강화학습 알고리즘의 완전히 연결된 레이어(fully connected layer)에 입력하여 Q 값을 구하는 완전히 연결된 레이어부; 및
상기 Q 값에 따라 행동을 결정하는 행동 결정부
를 포함하는, 심층강화학습과 운전자보조시스템을 이용한 자율주행차량의 제어 장치. - 제11항에 있어서,
상기 센서 데이터 정제부는,
상기 센서 데이터를 LSTM(Long Short-Term Memory)을 사용하여 정제하고,
상기 이미지 데이터 정제부는,
상기 이미지 데이터를 CNN(Convolutional Neural Network)을 사용하여 정제하는 것
을 특징으로 하는, 심층강화학습과 운전자보조시스템을 이용한 자율주행차량의 제어 장치. - 제11항에 있어서,
상기 완전히 연결된 레이어부는,
상기 완전히 연결된 레이어를 상태 값과 각 행동에 대한 이점을 평가하는 행동 이점의 2 개의 파트로 나눈 네트워크를 이용하고, 상기 상태 값과 상기 행동 이점을 통합하여 상기 Q 값을 구하는 것
을 특징으로 하는, 심층강화학습과 운전자보조시스템을 이용한 자율주행차량의 제어 장치. - 제9항에 있어서,
상기 차량 제어부는,
차량이 종 방향과 횡 방향으로 동시에 운전 가능하도록, 목표 속도 증가, 목표 속도 감소, 좌측으로 차선 변경, 우측으로 차선 변경, 현재 상태 유지의 5가지 행동을 포함하는 것
을 특징으로 하는, 심층강화학습과 운전자보조시스템을 이용한 자율주행차량의 제어 장치. - 제9항에 있어서,
상기 심층강화학습부는,
상기 행동의 결과에 따라 보상을 설계하여 차량의 고속 주행, 충돌하지 않는 궤적으로의 주행 및 불필요한 차선 변경 배제에 기반한 최적의 운전 정책을 찾고, 상기 운전 정책으로 상기 심층강화학습 알고리즘을 학습시키는 것
을 특징으로 하는, 심층강화학습과 운전자보조시스템을 이용한 자율주행차량의 제어 장치.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020190007345A KR102166811B1 (ko) | 2019-01-21 | 2019-01-21 | 심층강화학습과 운전자보조시스템을 이용한 자율주행차량의 제어 방법 및 장치 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020190007345A KR102166811B1 (ko) | 2019-01-21 | 2019-01-21 | 심층강화학습과 운전자보조시스템을 이용한 자율주행차량의 제어 방법 및 장치 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20200095590A true KR20200095590A (ko) | 2020-08-11 |
KR102166811B1 KR102166811B1 (ko) | 2020-10-19 |
Family
ID=72048105
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020190007345A Active KR102166811B1 (ko) | 2019-01-21 | 2019-01-21 | 심층강화학습과 운전자보조시스템을 이용한 자율주행차량의 제어 방법 및 장치 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR102166811B1 (ko) |
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112590792A (zh) * | 2020-12-18 | 2021-04-02 | 的卢技术有限公司 | 一种基于深度强化学习算法的车辆汇合控制方法 |
KR20220066711A (ko) * | 2020-11-16 | 2022-05-24 | (주)이노시뮬레이션 | 자율주행 분산 시뮬레이션 동기 제어 방법 |
CN114655211A (zh) * | 2022-03-31 | 2022-06-24 | 中国科学院深圳先进技术研究院 | 一种基于深度强化学习的自动驾驶车辆超车决策方法 |
CN114802248A (zh) * | 2022-04-25 | 2022-07-29 | 中汽院智能网联科技有限公司 | 基于深度强化学习的自动驾驶车辆换道决策系统及方法 |
CN114859893A (zh) * | 2022-04-06 | 2022-08-05 | 吉林大学 | 智能网联电动汽车在不同交通状态下的节能学习控制方法 |
CN115158349A (zh) * | 2022-06-13 | 2022-10-11 | 哈尔滨工业大学重庆研究院 | 一种基于dqn系列强化学习算法的自动驾驶变道决策与控制方法 |
CN115402319A (zh) * | 2022-09-14 | 2022-11-29 | 中南大学 | 一种自动驾驶变道速度控制方法、计算机设备及存储介质 |
KR20230042430A (ko) * | 2021-09-20 | 2023-03-28 | 모셔널 에이디 엘엘씨 | 자율 주행 차량에 대한 안전이 중요한 시나리오의 식별을 위한 학습 |
KR20230053628A (ko) * | 2020-09-15 | 2023-04-21 | 엘지전자 주식회사 | 자율 주행 시스템에서 v2x 통신 장치의 강화 학습 수행 방법 |
CN116382150A (zh) * | 2023-02-13 | 2023-07-04 | 北京洛必德科技有限公司 | 一种基于深度强化学习决策系统的远程驾驶方法和装置、电子设备 |
CN117474295A (zh) * | 2023-12-26 | 2024-01-30 | 长春工业大学 | 一种基于Dueling DQN算法的多AGV负载均衡与任务调度方法 |
CN118860163A (zh) * | 2024-09-26 | 2024-10-29 | 易显智能科技有限责任公司 | 应用于车辆hud的驾驶培训人机交互方法及系统 |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112249032B (zh) * | 2020-10-29 | 2022-02-18 | 浪潮(北京)电子信息产业有限公司 | 一种自动驾驶决策方法、系统、设备及计算机存储介质 |
KR102331807B1 (ko) * | 2021-04-16 | 2021-12-02 | 국방과학연구소 | 차량의 주행을 위한 전자 장치 및 그의 동작 방법 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20180029543A (ko) * | 2016-09-13 | 2018-03-21 | 오토시맨틱스 주식회사 | 딥러닝을 통한 자동차 상태 진단 방법 |
KR20180055571A (ko) * | 2016-11-17 | 2018-05-25 | 삼성전자주식회사 | 이동 로봇 시스템, 이동 로봇 및 이동 로봇 시스템의 제어 방법 |
KR20180072523A (ko) * | 2016-12-21 | 2018-06-29 | 삼성전자주식회사 | 전자 장치 및 그 동작 방법 |
KR20180091841A (ko) * | 2015-11-12 | 2018-08-16 | 딥마인드 테크놀로지스 리미티드 | 결투 심층 신경 네트워크 |
JP2018190045A (ja) * | 2017-04-28 | 2018-11-29 | 日立オートモティブシステムズ株式会社 | 車両電子制御装置 |
-
2019
- 2019-01-21 KR KR1020190007345A patent/KR102166811B1/ko active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20180091841A (ko) * | 2015-11-12 | 2018-08-16 | 딥마인드 테크놀로지스 리미티드 | 결투 심층 신경 네트워크 |
KR20180029543A (ko) * | 2016-09-13 | 2018-03-21 | 오토시맨틱스 주식회사 | 딥러닝을 통한 자동차 상태 진단 방법 |
KR20180055571A (ko) * | 2016-11-17 | 2018-05-25 | 삼성전자주식회사 | 이동 로봇 시스템, 이동 로봇 및 이동 로봇 시스템의 제어 방법 |
KR20180072523A (ko) * | 2016-12-21 | 2018-06-29 | 삼성전자주식회사 | 전자 장치 및 그 동작 방법 |
JP2018190045A (ja) * | 2017-04-28 | 2018-11-29 | 日立オートモティブシステムズ株式会社 | 車両電子制御装置 |
Non-Patent Citations (5)
Title |
---|
D. P. Kingma and J. Ba, "Adam: A method for stochastic optimization," arXiv preprint arXiv:1412.6980, 2014. |
H. Van Hasselt, A. Guez, and D. Silver, "Deep reinforcement learning with double q-learning." in AAAI, vol. 16, 2016, pp. 2094-2100. |
M. Abadi, P. Barham, J. Chen, Z. Chen, A. Davis, J. Dean, M. Devin, S. Ghemawat, G. Irving, M. Isard, et al., "Tensorflow: A system for large-scale machine learning." in OSDI, vol. 16, 2016, pp. 265-283. |
V. Mnih, K. Kavukcuoglu, D. Silver, A. A. Rusu, J. Veness, M. G. Bellemare, A. Graves, M. Riedmiller, A. K. Fidjeland, G. Ostrovski, et al., "Human-level control through deep reinforcement learning," Nature, vol. 518, no. 7540, p. 529, 2015. |
Z. Wang, T. Schaul, M. Hessel, H. Van Hasselt, M. Lanctot, and N. De Freitas, "Dueling network architectures for deep reinforcement learning," arXiv preprint arXiv:1511.06581, 2015. |
Cited By (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20230053628A (ko) * | 2020-09-15 | 2023-04-21 | 엘지전자 주식회사 | 자율 주행 시스템에서 v2x 통신 장치의 강화 학습 수행 방법 |
KR20220066711A (ko) * | 2020-11-16 | 2022-05-24 | (주)이노시뮬레이션 | 자율주행 분산 시뮬레이션 동기 제어 방법 |
CN112590792B (zh) * | 2020-12-18 | 2024-05-10 | 的卢技术有限公司 | 一种基于深度强化学习算法的车辆汇合控制方法 |
CN112590792A (zh) * | 2020-12-18 | 2021-04-02 | 的卢技术有限公司 | 一种基于深度强化学习算法的车辆汇合控制方法 |
KR20230042430A (ko) * | 2021-09-20 | 2023-03-28 | 모셔널 에이디 엘엘씨 | 자율 주행 차량에 대한 안전이 중요한 시나리오의 식별을 위한 학습 |
CN114655211A (zh) * | 2022-03-31 | 2022-06-24 | 中国科学院深圳先进技术研究院 | 一种基于深度强化学习的自动驾驶车辆超车决策方法 |
CN114859893A (zh) * | 2022-04-06 | 2022-08-05 | 吉林大学 | 智能网联电动汽车在不同交通状态下的节能学习控制方法 |
CN114802248A (zh) * | 2022-04-25 | 2022-07-29 | 中汽院智能网联科技有限公司 | 基于深度强化学习的自动驾驶车辆换道决策系统及方法 |
CN115158349A (zh) * | 2022-06-13 | 2022-10-11 | 哈尔滨工业大学重庆研究院 | 一种基于dqn系列强化学习算法的自动驾驶变道决策与控制方法 |
CN115402319A (zh) * | 2022-09-14 | 2022-11-29 | 中南大学 | 一种自动驾驶变道速度控制方法、计算机设备及存储介质 |
CN116382150A (zh) * | 2023-02-13 | 2023-07-04 | 北京洛必德科技有限公司 | 一种基于深度强化学习决策系统的远程驾驶方法和装置、电子设备 |
CN117474295A (zh) * | 2023-12-26 | 2024-01-30 | 长春工业大学 | 一种基于Dueling DQN算法的多AGV负载均衡与任务调度方法 |
CN117474295B (zh) * | 2023-12-26 | 2024-04-26 | 长春工业大学 | 一种基于Dueling DQN算法的多AGV负载均衡与任务调度方法 |
CN118860163A (zh) * | 2024-09-26 | 2024-10-29 | 易显智能科技有限责任公司 | 应用于车辆hud的驾驶培训人机交互方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
KR102166811B1 (ko) | 2020-10-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102166811B1 (ko) | 심층강화학습과 운전자보조시스템을 이용한 자율주행차량의 제어 방법 및 장치 | |
JP7532615B2 (ja) | 自律型車両の計画 | |
JP7621333B2 (ja) | コストベースの経路決定 | |
EP3678911B1 (en) | Pedestrian behavior predictions for autonomous vehicles | |
Chae et al. | Autonomous braking system via deep reinforcement learning | |
Min et al. | Deep Q learning based high level driving policy determination | |
CN112051855B (zh) | 用于主车辆的导航系统、自主车辆及导航自主车辆的方法 | |
US11465650B2 (en) | Model-free reinforcement learning | |
CN115175841A (zh) | 自主车辆的行为规划 | |
KR20190099088A (ko) | 차량 움직임에 기반한 항법 | |
US12187324B2 (en) | Trajectory prediction based on a decision tree | |
CN114435351A (zh) | 用于基于神经网络的自动驾驶的系统和方法 | |
Siboo et al. | An empirical study of DDPG and PPO-based reinforcement learning algorithms for autonomous driving | |
JP7266684B2 (ja) | アシスタントシステムの軌道計画を実施するための方法 | |
JP6880224B2 (ja) | 車両制御装置 | |
US11364934B2 (en) | Training a generator unit and a discriminator unit for collision-aware trajectory prediction | |
CN114987498A (zh) | 自动驾驶车辆的拟人化轨迹规划方法、装置、车辆及介质 | |
Guo et al. | Toward human-like behavior generation in urban environment based on Markov decision process with hybrid potential maps | |
CN117312841A (zh) | 自动驾驶车辆训练数据的制定方法、电子设备和介质 | |
Youssef et al. | Comparative study of end-to-end deep learning methods for self-driving car | |
CN115700626A (zh) | 用于车辆的奖励函数 | |
WO2024249080A1 (en) | Vehicle trajectory tree structure including learned trajectories | |
Cao et al. | Lane change algorithm using rule-based control method based on look-ahead concept for the scenario when emergency vehicle approaching | |
Molaie et al. | Auto-driving policies in highway based on distributional deep reinforcement learning | |
KR20250083227A (ko) | 차량에 대한 다중-정책 차선 변경 보조 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PA0109 | Patent application |
Patent event code: PA01091R01D Comment text: Patent Application Patent event date: 20190121 |
|
PA0201 | Request for examination | ||
PE0902 | Notice of grounds for rejection |
Comment text: Notification of reason for refusal Patent event date: 20200202 Patent event code: PE09021S01D |
|
E701 | Decision to grant or registration of patent right | ||
PE0701 | Decision of registration |
Patent event code: PE07011S01D Comment text: Decision to Grant Registration Patent event date: 20200729 |
|
PG1501 | Laying open of application | ||
GRNT | Written decision to grant | ||
PR0701 | Registration of establishment |
Comment text: Registration of Establishment Patent event date: 20201012 Patent event code: PR07011E01D |
|
PR1002 | Payment of registration fee |
Payment date: 20201013 End annual number: 3 Start annual number: 1 |
|
PG1601 | Publication of registration | ||
PR1001 | Payment of annual fee |
Payment date: 20230921 Start annual number: 4 End annual number: 4 |