WO2020180014A3

WO2020180014A3 - 심층 강화 학습에 기반한 자율주행 에이전트의 학습 방법 및 시스템

Info

Publication number: WO2020180014A3
Application number: PCT/KR2020/001692
Authority: WO
Inventors: 최진영; 박경식; 김민수; 석상옥; 서준호
Original assignee: 네이버랩스 주식회사
Priority date: 2019-03-05
Filing date: 2020-02-06
Publication date: 2020-12-03
Also published as: US20210397961A1; KR102267316B1; EP3936963A2; JP7271702B2; WO2020180014A2; JP2022524494A; KR20200108527A; EP3936963A4

Abstract

심층 강화 학습에 기반한 자율주행 에이전트의 학습 방법 및 시스템을 개시한다. 일실시예에 따른 에이전트 학습 방법은, 심층 강화 학습(Deep Reinforcement Learning, DRL)을 위한 시뮬레이션상에서 액터-크리틱(actor-critic) 알고리즘을 통해 에이전트를 학습시키는 단계를 포함할 수 있다. 이때, 학습시키는 단계는, 상기 액터-크리틱 알고리즘에서 에이전트의 행동을 결정하는 평가망인 액터 네트워크에 제1 정보를, 상기 행동이 기설정된 보상을 최대화하는데 얼마나 도움이 되는가를 평가하는 가치망인 크리틱에 제2 정보를 입력하는 것을 특징으로 할 수 있다. 여기서, 상기 제2 정보는 상기 제1 정보와 추가 정보를 포함할 수 있다.