KR102467013B1 - 자율주행 차량으로부터 획득된 운행 데이터 및 자율주행 차량의 탑승자로부터 획득된 피드백 데이터를 이용하여 자율주행 차량의 자율주행 네트워크를 학습할 수 있도록 지원하는 방법 및 장치 - Google Patents

자율주행 차량으로부터 획득된 운행 데이터 및 자율주행 차량의 탑승자로부터 획득된 피드백 데이터를 이용하여 자율주행 차량의 자율주행 네트워크를 학습할 수 있도록 지원하는 방법 및 장치 Download PDF

Info

Publication number
KR102467013B1
KR102467013B1 KR1020200159366A KR20200159366A KR102467013B1 KR 102467013 B1 KR102467013 B1 KR 102467013B1 KR 1020200159366 A KR1020200159366 A KR 1020200159366A KR 20200159366 A KR20200159366 A KR 20200159366A KR 102467013 B1 KR102467013 B1 KR 102467013B1
Authority
KR
South Korea
Prior art keywords
nth
occupant
feedback data
data
autonomous vehicle
Prior art date
Application number
KR1020200159366A
Other languages
English (en)
Other versions
KR20220072126A (ko
Inventor
이영석
이학진
Original Assignee
주식회사 오비고
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 오비고 filed Critical 주식회사 오비고
Priority to KR1020200159366A priority Critical patent/KR102467013B1/ko
Publication of KR20220072126A publication Critical patent/KR20220072126A/ko
Application granted granted Critical
Publication of KR102467013B1 publication Critical patent/KR102467013B1/ko

Links

Images

Classifications

    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60WCONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
    • B60W60/00Drive control systems specially adapted for autonomous road vehicles
    • B60W60/001Planning or execution of driving tasks
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60KARRANGEMENT OR MOUNTING OF PROPULSION UNITS OR OF TRANSMISSIONS IN VEHICLES; ARRANGEMENT OR MOUNTING OF PLURAL DIVERSE PRIME-MOVERS IN VEHICLES; AUXILIARY DRIVES FOR VEHICLES; INSTRUMENTATION OR DASHBOARDS FOR VEHICLES; ARRANGEMENTS IN CONNECTION WITH COOLING, AIR INTAKE, GAS EXHAUST OR FUEL SUPPLY OF PROPULSION UNITS IN VEHICLES
    • B60K35/00Instruments specially adapted for vehicles; Arrangement of instruments in or on vehicles
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60KARRANGEMENT OR MOUNTING OF PROPULSION UNITS OR OF TRANSMISSIONS IN VEHICLES; ARRANGEMENT OR MOUNTING OF PLURAL DIVERSE PRIME-MOVERS IN VEHICLES; AUXILIARY DRIVES FOR VEHICLES; INSTRUMENTATION OR DASHBOARDS FOR VEHICLES; ARRANGEMENTS IN CONNECTION WITH COOLING, AIR INTAKE, GAS EXHAUST OR FUEL SUPPLY OF PROPULSION UNITS IN VEHICLES
    • B60K35/00Instruments specially adapted for vehicles; Arrangement of instruments in or on vehicles
    • B60K35/20Output arrangements, i.e. from vehicle to user, associated with vehicle functions or specially adapted therefor
    • B60K35/21Output arrangements, i.e. from vehicle to user, associated with vehicle functions or specially adapted therefor using visual output, e.g. blinking lights or matrix displays
    • B60K35/22Display screens
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60KARRANGEMENT OR MOUNTING OF PROPULSION UNITS OR OF TRANSMISSIONS IN VEHICLES; ARRANGEMENT OR MOUNTING OF PLURAL DIVERSE PRIME-MOVERS IN VEHICLES; AUXILIARY DRIVES FOR VEHICLES; INSTRUMENTATION OR DASHBOARDS FOR VEHICLES; ARRANGEMENTS IN CONNECTION WITH COOLING, AIR INTAKE, GAS EXHAUST OR FUEL SUPPLY OF PROPULSION UNITS IN VEHICLES
    • B60K35/00Instruments specially adapted for vehicles; Arrangement of instruments in or on vehicles
    • B60K35/20Output arrangements, i.e. from vehicle to user, associated with vehicle functions or specially adapted therefor
    • B60K35/28Output arrangements, i.e. from vehicle to user, associated with vehicle functions or specially adapted therefor characterised by the type of the output information, e.g. video entertainment or vehicle dynamics information; characterised by the purpose of the output information, e.g. for attracting the attention of the driver
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60WCONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
    • B60W30/00Purposes of road vehicle drive control systems not related to the control of a particular sub-unit, e.g. of systems using conjoint control of vehicle sub-units
    • B60W30/10Path keeping
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60WCONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
    • B60W40/00Estimation or calculation of non-directly measurable driving parameters for road vehicle drive control systems not related to the control of a particular sub unit, e.g. by using mathematical models
    • B60W40/08Estimation or calculation of non-directly measurable driving parameters for road vehicle drive control systems not related to the control of a particular sub unit, e.g. by using mathematical models related to drivers or passengers
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60WCONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
    • B60W40/00Estimation or calculation of non-directly measurable driving parameters for road vehicle drive control systems not related to the control of a particular sub unit, e.g. by using mathematical models
    • B60W40/10Estimation or calculation of non-directly measurable driving parameters for road vehicle drive control systems not related to the control of a particular sub unit, e.g. by using mathematical models related to vehicle motion
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60WCONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
    • B60W50/00Details of control systems for road vehicle drive control not related to the control of a particular sub-unit, e.g. process diagnostic or vehicle driver interfaces
    • B60W50/08Interaction between the driver and the control system
    • B60W50/14Means for informing the driver, warning the driver or prompting a driver intervention
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05DSYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
    • G05D1/00Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots
    • G05D1/0088Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots characterized by the autonomous decision making process, e.g. artificial intelligence, predefined behaviours
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60WCONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
    • B60W40/00Estimation or calculation of non-directly measurable driving parameters for road vehicle drive control systems not related to the control of a particular sub unit, e.g. by using mathematical models
    • B60W40/08Estimation or calculation of non-directly measurable driving parameters for road vehicle drive control systems not related to the control of a particular sub unit, e.g. by using mathematical models related to drivers or passengers
    • B60W2040/0872Driver physiology
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60WCONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
    • B60W50/00Details of control systems for road vehicle drive control not related to the control of a particular sub-unit, e.g. process diagnostic or vehicle driver interfaces
    • B60W2050/0001Details of the control system
    • B60W2050/0002Automatic control, details of type of controller or control system architecture
    • B60W2050/0004In digital systems, e.g. discrete-time systems involving sampling
    • B60W2050/0005Processor details or data handling, e.g. memory registers or chip architecture
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60WCONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
    • B60W50/00Details of control systems for road vehicle drive control not related to the control of a particular sub-unit, e.g. process diagnostic or vehicle driver interfaces
    • B60W2050/0001Details of the control system
    • B60W2050/0002Automatic control, details of type of controller or control system architecture
    • B60W2050/0008Feedback, closed loop systems or details of feedback error signal
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60WCONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
    • B60W50/00Details of control systems for road vehicle drive control not related to the control of a particular sub-unit, e.g. process diagnostic or vehicle driver interfaces
    • B60W50/08Interaction between the driver and the control system
    • B60W50/14Means for informing the driver, warning the driver or prompting a driver intervention
    • B60W2050/146Display means
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60WCONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
    • B60W2540/00Input parameters relating to occupants
    • B60W2540/221Physiology, e.g. weight, heartbeat, health or special needs
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60YINDEXING SCHEME RELATING TO ASPECTS CROSS-CUTTING VEHICLE TECHNOLOGY
    • B60Y2300/00Purposes or special features of road vehicle drive control systems
    • B60Y2300/10Path keeping

Landscapes

  • Engineering & Computer Science (AREA)
  • Transportation (AREA)
  • Mechanical Engineering (AREA)
  • Automation & Control Theory (AREA)
  • Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Human Computer Interaction (AREA)
  • Chemical & Material Sciences (AREA)
  • Combustion & Propulsion (AREA)
  • Health & Medical Sciences (AREA)
  • Business, Economics & Management (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Game Theory and Decision Science (AREA)
  • Medical Informatics (AREA)
  • Aviation & Aerospace Engineering (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Remote Sensing (AREA)
  • General Physics & Mathematics (AREA)
  • User Interface Of Digital Computer (AREA)
  • Navigation (AREA)

Abstract

소정 경로를 운행하는 자율주행 차량으로부터 획득된 운행 데이터 및 상기 자율주행 차량의 탑승자로부터 획득된 피드백 데이터를 이용하여 상기 자율주행 차량의 자율주행 네트워크를 학습할 수 있도록 지원하는 방법이 개시된다. 즉, (a) 컴퓨팅 장치가, (i) 상기 자율주행 차량이 상기 경로의 제1 내지 제N 지점 - N은 1 이상의 정수임 - 에서 일어난 제1 내지 제N 이벤트에 대해 수행한 제1 내지 제N 동작에 대응하는 제1 내지 제N 리액션 데이터를 획득하는 프로세스 및 (ii) 상기 자율주행 차량에 탑승한 상기 탑승자의 탑승자 단말로부터, (ii-1) 상기 제1 내지 제N 동작에 대한 상기 탑승자의 주관적 경험에 대응하는 제1 내지 제N 매뉴얼 피드백 데이터, (ii-2) 상기 제1 내지 제N 동작에 대한 상기 탑승자의 객관적 물리량에 대응하는 제1 내지 제N 피지컬 피드백 데이터 및 (ii-3) 상기 제1 내지 제N 동작에 대한 상기 탑승자의 신체적 반응에 대응하는 제1 내지 제N 바이오 피드백 데이터 중 적어도 일부를 참조로 하여 생성된 제1 내지 제N 탑승자 피드백 데이터를 획득하는 프로세스를 수행하는 단계; (b) 상기 컴퓨팅 장치가, 상기 제1 내지 제N 이벤트, 상기 제1 내지 제N 리액션 데이터 및 상기 제1 내지 제N 탑승자 피드백 데이터를 참조하여 학습 데이터를 생성한 후, 상기 학습 데이터를 이용하여 상기 자율주행 네트워크를 학습할 수 있도록 지원하는 단계를 포함하는 것을 특징으로 하는 방법이 개시된다.

Description

자율주행 차량으로부터 획득된 운행 데이터 및 자율주행 차량의 탑승자로부터 획득된 피드백 데이터를 이용하여 자율주행 차량의 자율주행 네트워크를 학습할 수 있도록 지원하는 방법 및 장치{METHOD AND DEVICE FOR SUPPORTING AUTONOMOUS DRIVING NETWORK OF AUTONOMOUS VEHICLE TO LEARN ITS PARAMETERS BY USING DRIVING DATA ACQUIRED FROM AUTONOMOUS VEHICLE AND FEEDBACK DATA ACQUIRED FROM PASSENGER OF AUTONOMOUS VEHICLE}
본 발명은 자율주행 차량으로부터 획득된 운행 데이터 및 자율주행 차량의 탑승자로부터 획득된 피드백 데이터를 이용하여 자율주행 차량의 자율주행 네트워크를 학습할 수 있도록 지원하는 방법 및 장치에 관한 것이다.
자율주행 기술은 수 년 전만 하여도 가까운 시일 내에 사용하기는 어려운 미래의 기술로 치부되었으나, 최근 Tesla社의 오토파일럿 기술을 시작으로 차츰 상용화되고 있다. 다만, 아직 상용화의 시작 단계이다 보니 기술의 수준이 충분히 높지 않아 여전히 자율 주행 기술의 기본적인 부분, 즉 안전하게 승객을 수송하는 기술에 대한 연구가 주로 이루어지고 있는 실정이다.
하지만, 추후 자율주행 기술의 기본적인 토대가 마련되고 나면, 자율주행 분야에서 중요하게 연구될 것은 분명 승객의 주관적 경험의 질을 높이는 분야가 될 것이다. 즉, 지금은 자율주행 자체가 이루어지는 것에 초점이 맞추어져 있다면, 추후에는 승객이 얼마나 편안하게 자율주행을 통해 이동했는지가 중요해질 것이라는 것이다.
하지만, 안전하게 승객을 수송하는 기술에 대한 연구만 주로 이루어지다 보니, 이와 같이 승객이 편안할 수 있도록 하는 학습 데이터를 획득하는 기술에 대해서는 많이 연구가 되지 않았다
본 발명은 상술한 문제점을 해결하는 것을 목적으로 한다.
또한 본 발명은 자율주행 차량으로부터 획득된 운행 데이터 및 자율주행 차량의 탑승자로부터 획득된 피드백 데이터를 이용하여 자율주행 차량의 자율주행 네트워크를 학습할 수 있도록 지원하는 방법을 제공하는 것을 목적으로 한다.
또한 본 발명은 탑승자가 과거의 피드백에 따른 자율 주행의 변화 과정을 참조하여 자율주행 중의 주관적 경험을 입력할 수 있도록 지원함으로써 보다 풍부한 피드백 데이터를 획득할 수 있도록 하는 것을 목적으로 한다.
또한 본 발명은 탑승자의 주관적 경험에 대응하는 매뉴얼 피드백 데이터, 탑승자의 객관적 물리량에 대응하는 피지컬 피드백 데이터 및 탑승자의 신체적 반응에 대응하는 바이오 피드백 데이터 중 적어도 일부를 획득할 수 있는 방법을 제공하는 것을 목적으로 한다.
상기한 바와 같은 본 발명의 목적을 달성하고, 후술하는 본 발명의 특징적인 효과를 실현하기 위한 본 발명의 특징적인 구성은 하기와 같다.
본 발명의 일 태양에 따르면, 소정 경로를 운행하는 자율주행 차량으로부터 획득된 운행 데이터 및 상기 자율주행 차량의 탑승자로부터 획득된 피드백 데이터를 이용하여 상기 자율주행 차량의 자율주행 네트워크를 학습할 수 있도록 지원하는 방법에 있어서, (a) 컴퓨팅 장치가, (i) 상기 자율주행 차량이 상기 경로의 제1 내지 제N 지점 - N은 1 이상의 정수임 - 에서 일어난 제1 내지 제N 이벤트에 대해 수행한 제1 내지 제N 동작에 대응하는 제1 내지 제N 리액션 데이터를 획득하는 프로세스 및 (ii) 상기 자율주행 차량에 탑승한 상기 탑승자의 탑승자 단말로부터, (ii-1) 상기 제1 내지 제N 동작에 대한 상기 탑승자의 주관적 경험에 대응하는 제1 내지 제N 매뉴얼 피드백 데이터, (ii-2) 상기 제1 내지 제N 동작에 대한 상기 탑승자의 객관적 물리량에 대응하는 제1 내지 제N 피지컬 피드백 데이터 및 (ii-3) 상기 제1 내지 제N 동작에 대한 상기 탑승자의 신체적 반응에 대응하는 제1 내지 제N 바이오 피드백 데이터 중 적어도 일부를 참조로 하여 생성된 제1 내지 제N 탑승자 피드백 데이터를 획득하는 프로세스를 수행하는 단계; (b) 상기 컴퓨팅 장치가, 상기 제1 내지 제N 이벤트, 상기 제1 내지 제N 리액션 데이터 및 상기 제1 내지 제N 탑승자 피드백 데이터를 참조하여 학습 데이터를 생성한 후, 상기 학습 데이터를 이용하여 상기 자율주행 네트워크를 학습할 수 있도록 지원하는 단계를 포함하는 것을 특징으로 하는 방법이 개시된다.
일례로서, 상기 (a) 단계는, 상기 컴퓨팅 장치가, 상기 탑승자 단말로 하여금, (i) 상기 제1 내지 상기 제N 지점 중 하나인 제P 지점 - P는 1 이상 N 이하의 정수임 - 에서 수행된 제P 동작에 대한 정보를 상기 탑승자 단말과 연동하여 동작하는 탑승자 디스플레이의 제1 영역에 디스플레이하고, (ii) 상기 제P 동작에 대한 상기 탑승자의 상기 주관적 경험 정보를 입력할 수 있는 제1 내지 제M 피드백 옵션 - M은 1 이상의 정수임 - 을 상기 제1 영역과 인접한 상기 탑승자 디스플레이의 제2 영역에 디스플레이함으로써 상기 탑승자로부터 제P 매뉴얼 피드백 데이터의 적어도 일부인 제P_1 매뉴얼 피드백 데이터를 획득하는 것을 특징으로 하는 방법이 개시된다.
일례로서, 상기 (a) 단계는, 상기 컴퓨팅 장치가, 상기 탑승자 단말로 하여금, (i) 상기 제1 내지 상기 제N 지점 중 하나인 제P 지점 - P는 1 이상 N 이하의 정수임 - 에서 수행된 제P 동작에 대한 정보를 상기 탑승자 단말과 연동하여 동작하는 탑승자 디스플레이의 제1_1 영역에 디스플레이하고, (ii) 제P 이벤트에 대해 상기 자율주행 차량이 과거에 수행한 적어도 하나의 동작들에 대해 상기 탑승자가 과거에 피드백한 정보에 대응하는 제P 과거 매뉴얼 피드백 정보를 상기 탑승자 디스플레이의 제1_2 영역에 디스플레이하며, (iii) 상기 제P 동작에 대하여, 상기 제P 과거 매뉴얼 피드백 정보를 기반으로 한 상기 탑승자의 상기 주관적 경험 정보를 입력할 수 있는 제1 내지 제M 피드백 옵션 - M은 1 이상의 정수임 - 을 상기 제1_1 영역 및 상기 제1_2 영역을 포함하는 제1 영역과 인접한 상기 탑승자 디스플레이의 제2 영역에 디스플레이함으로써 상기 탑승자로부터 상기 제P 매뉴얼 피드백 데이터의 적어도 일부인 제P_2 매뉴얼 피드백 데이터를 획득하는 것을 특징으로 하는 방법이 개시된다.
일례로서, 상기 (a) 단계는, 상기 컴퓨팅 장치가, 상기 탑승자 단말로 하여금, 상기 제P 동작에 대해 과거에 피드백한 정보의 통계치를 나타내는 정보인 제P_1 과거 매뉴얼 피드백 정보를 상기 제1_2 영역의 적어도 일부에 디스플레이하고, 상기 제P 이벤트에 대해 상기 자율주행 차량이 과거에 수행한 적어도 하나의 동작들에 대한 적어도 하나의 과거의 피드백에 따라 제P 이벤트에 대해 상기 자율주행 차량의 동작이 어떻게 시계열적으로 변화해 왔는지를 나타내는 정보인 제 P_2 과거 매뉴얼 피드백 정보를 상기 제1_2 영역의 적어도 일부에 디스플레이하는 것을 특징으로 하는 방법이 개시된다.
일례로서, 상기 (b) 단계는, 상기 컴퓨팅 장치가, 상기 자율주행 네트워크로 하여금, 상기 제1 내지 제N 이벤트 중 하나인 제S 이벤트 - S는 1 이상 N 이하의 정수임 - 를 입력받아 제S 동작을 생성한 상기 자율주행 네트워크의 적어도 일부인 제S Recurrent Neural Network(RNN)을, 상기 제S 동작에 대한 제S 탑승자 피드백 데이터를 참조하여 Fine-tuning(파인-튜닝)하는 것을 특징으로 하는 방법이 개시된다.
일례로서, 상기 (b) 단계는, 상기 컴퓨팅 장치가, (i) 상기 제S RNN으로 하여금, 현재의 시점에 상기 제S 동작을 생성하면서 제S 히든 스테이트 값을 업데이트하도록 하고, (ii) 상기 Fine-tuning된 상기 제S RNN으로 하여금, 미래의 시점에 입력될 제S 미래 이벤트 및 상기 제S 히든 스테이트 값을 참조로 하여 상기 제S 미래 이벤트에 대한 제S 미래 동작을 생성하도록 하는 것을 특징으로 하는 방법이 개시된다.
일례로서, 상기 (a) 단계는, 상기 컴퓨팅 장치가, 상기 탑승자 단말을 통해, (i) 심장 박동 센서, (ii) 혈압 센서, (iii) 말초 산소포화도 센서 및 (iv) 심전도 센서 중 적어도 일부를 사용하여, 상기 제1 내지 제N 동작에 의한 상기 탑승자의 심장 박동 변화, 혈압 변화, 산소포화도 변화 및 심전도 변화 중 적어도 일부를 포함하는 상기 신체적 반응에 대한 상기 제1 내지 제N 바이오 피드백 데이터를 획득하는 것을 특징으로 하는 방법이 개시된다.
일례로서, 상기 (b) 단계는, 상기 컴퓨팅 장치가, (i) 상기 제1 내지 제N 매뉴얼 피드백 데이터 중 하나인 제R - R은 1 이상 N 이하의 정수임 - 매뉴얼 피드백 데이터, (ii) 상기 제1 내지 제N 피지컬 피드백 데이터 중 하나인 제R 피지컬 피드백 데이터 및 (iii) 상기 제1 내지 제N 바이오 피드백 데이터 중 하나인 제R 바이오 피드백 데이터를 가중합함으로써 제R 탑승자 피드백 데이터를 획득하는 것을 특징으로 하는 방법이 개시된다.
일례로서, 상기 (b) 단계는, 상기 컴퓨팅 장치가, 상기 자율주행 네트워크로 하여금, (i) 이에 포함된, 강화 학습 방법론을 기반으로 설계된 동작 결정 네트워크에 상기 제1 내지 제N 이벤트 중 하나인 특정 이벤트를 입력함으로써 특정 동작 지시값을 획득하도록 하고, (ii) 상기 특정 동작 지시값을 상기 강화 학습 방법론을 기반으로 설계된 보상 에이전트에 입력함으로써 상기 특정 동작 지시값에 대한 특정 보상 스코어를 획득하도록 하며, (iii) 로스 유닛에 상기 특정 동작 지시값 및 상기 특정 보상 스코어를 입력함으로써 로스를 생성한 후 상기 로스를 참조로 하여 상기 동작 결정 네트워크의 파라미터를 학습하도록 하는 것을 특징으로 하는 방법이 개시된다.
일례로서, 상기 (b) 단계는, 상기 보상 에이전트는, 자신에 상기 특정 동작 지시값이 입력되면, 상기 제1 내지 제N 이벤트, 상기 제1 내지 제N 리액션 데이터 및 상기 제1 내지 제N 탑승자 피드백 데이터를 사용하여 상기 특정 동작 지시값에 대응하는 특정 보상 스코어를 출력하는 것을 특징으로 하는 방법이 개시된다.
본 발명의 다른 태양에 따르면, 소정 경로를 운행하는 자율주행 차량으로부터 획득된 운행 데이터 및 상기 자율주행 차량의 탑승자로부터 획득된 피드백 데이터를 이용하여 상기 자율주행 차량의 자율주행 네트워크를 학습할 수 있도록 지원하는 방법을 수행하는 컴퓨팅 장치에 있어서, 인스트럭션들을 저장하는 하나 이상의 메모리; 및 상기 인스트럭션들을 수행하도록 설정된 하나 이상의 프로세서를 포함하되, 상기 프로세서는, (I) (i) 상기 자율주행 차량이 상기 경로의 제1 내지 제N 지점 - N은 1 이상의 정수임 - 에서 일어난 제1 내지 제N 이벤트에 대해 수행한 제1 내지 제N 동작에 대응하는 제1 내지 제N 리액션 데이터를 획득하는 프로세스 및 (ii) 상기 자율주행 차량에 탑승한 상기 탑승자의 탑승자 단말로부터, (ii-1) 상기 제1 내지 제N 동작에 대한 상기 탑승자의 주관적 경험에 대응하는 제1 내지 제N 매뉴얼 피드백 데이터, (ii-2) 상기 제1 내지 제N 동작에 대한 상기 탑승자의 객관적 물리량에 대응하는 제1 내지 제N 피지컬 피드백 데이터 및 (ii-3) 상기 제1 내지 제N 동작에 대한 상기 탑승자의 신체적 반응에 대응하는 제1 내지 제N 바이오 피드백 데이터 중 적어도 일부를 참조로 하여 생성된 제1 내지 제N 탑승자 피드백 데이터를 획득하는 프로세스를 수행하는 프로세스; (II) 상기 제1 내지 제N 이벤트, 상기 제1 내지 제N 리액션 데이터 및 상기 제1 내지 제N 탑승자 피드백 데이터를 참조하여 학습 데이터를 생성한 후, 상기 학습 데이터를 이용하여 상기 자율주행 네트워크를 학습할 수 있도록 지원하는 프로세스를 수행하도록 설정된 것을 특징으로 하는 장치가 개시된다.
일례로서, 상기 (I) 프로세스는, 상기 프로세서가, 상기 탑승자 단말로 하여금, (i) 상기 제1 내지 상기 제N 지점 중 하나인 제P 지점 - P는 1 이상 N 이하의 정수임 - 에서 수행된 제P 동작에 대한 정보를 상기 탑승자 단말과 연동하여 동작하는 탑승자 디스플레이의 제1 영역에 디스플레이하고, (ii) 상기 제P 동작에 대한 상기 탑승자의 상기 주관적 경험 정보를 입력할 수 있는 제1 내지 제M 피드백 옵션 - M은 1 이상의 정수임 - 을 상기 제1 영역과 인접한 상기 탑승자 디스플레이의 제2 영역에 디스플레이함으로써 상기 탑승자로부터 제P 매뉴얼 피드백 데이터의 적어도 일부인 제P_1 매뉴얼 피드백 데이터를 획득하는 것을 특징으로 하는 장치가 개시된다.
일례로서, 상기 (I) 프로세스는, 상기 프로세서가, 상기 탑승자 단말로 하여금, (i) 상기 제1 내지 상기 제N 지점 중 하나인 제P 지점 - P는 1 이상 N 이하의 정수임 - 에서 수행된 제P 동작에 대한 정보를 상기 탑승자 단말과 연동하여 동작하는 탑승자 디스플레이의 제1_1 영역에 디스플레이하고, (ii) 제P 이벤트에 대해 상기 자율주행 차량이 과거에 수행한 적어도 하나의 동작들에 대해 상기 탑승자가 과거에 피드백한 정보에 대응하는 제P 과거 매뉴얼 피드백 정보를 상기 탑승자 디스플레이의 제1_2 영역에 디스플레이하며, (iii) 상기 제P 동작에 대하여, 상기 제P 과거 매뉴얼 피드백 정보를 기반으로 한 상기 탑승자의 상기 주관적 경험 정보를 입력할 수 있는 제1 내지 제M 피드백 옵션 - M은 1 이상의 정수임 - 을 상기 제1_1 영역 및 상기 제1_2 영역을 포함하는 제1 영역과 인접한 상기 탑승자 디스플레이의 제2 영역에 디스플레이함으로써 상기 탑승자로부터 상기 제P 매뉴얼 피드백 데이터의 적어도 일부인 제P_2 매뉴얼 피드백 데이터를 획득하는 것을 특징으로 하는 장치가 개시된다.
일례로서, 상기 (I) 프로세스는, 상기 프로세서가, 상기 탑승자 단말로 하여금, 상기 제P 동작에 대해 과거에 피드백한 정보의 통계치를 나타내는 정보인 제P_1 과거 매뉴얼 피드백 정보를 상기 제1_2 영역의 적어도 일부에 디스플레이하고, 상기 제P 이벤트에 대해 상기 자율주행 차량이 과거에 수행한 적어도 하나의 동작들에 대한 적어도 하나의 과거의 피드백에 따라 제P 이벤트에 대해 상기 자율주행 차량의 동작이 어떻게 시계열적으로 변화해 왔는지를 나타내는 정보인 제 P_2 과거 매뉴얼 피드백 정보를 상기 제1_2 영역의 적어도 일부에 디스플레이하는 것을 특징으로 하는 장치가 개시된다.
일례로서, 상기 (II) 프로세스는, 상기 프로세서가, 상기 자율주행 네트워크로 하여금, 상기 제1 내지 제N 이벤트 중 하나인 제S 이벤트 - S는 1 이상 N 이하의 정수임 - 를 입력받아 제S 동작을 생성한 상기 자율주행 네트워크의 적어도 일부인 제S Recurrent Neural Network(RNN)을, 상기 제S 동작에 대한 제S 탑승자 피드백 데이터를 참조하여 Fine-tuning(파인-튜닝)하는 것을 특징으로 하는 장치가 개시된다.
일례로서, 상기 (II) 프로세스는, 상기 프로세서가, (i) 상기 제S RNN으로 하여금, 현재의 시점에 상기 제S 동작을 생성하면서 제S 히든 스테이트 값을 업데이트하도록 하고, (ii) 상기 Fine-tuning된 상기 제S RNN으로 하여금, 미래의 시점에 입력될 제S 미래 이벤트 및 상기 제S 히든 스테이트 값을 참조로 하여 상기 제S 미래 이벤트에 대한 제S 미래 동작을 생성하도록 하는 것을 특징으로 하는 장치가 개시된다.
일례로서, 상기 (I) 프로세스는, 상기 프로세서가, 상기 탑승자 단말을 통해, (i) 심장 박동 센서, (ii) 혈압 센서, (iii) 말초 산소포화도 센서 및 (iv) 심전도 센서 중 적어도 일부를 사용하여, 상기 제1 내지 제N 동작에 의한 상기 탑승자의 심장 박동 변화, 혈압 변화, 산소포화도 변화 및 심전도 변화 중 적어도 일부를 포함하는 상기 신체적 반응에 대한 상기 제1 내지 제N 바이오 피드백 데이터를 획득하는 것을 특징으로 하는 장치가 개시된다.
일례로서, 상기 (II) 프로세스는, 상기 프로세서가, (i) 상기 제1 내지 제N 매뉴얼 피드백 데이터 중 하나인 제R - R은 1 이상 N 이하의 정수임 - 매뉴얼 피드백 데이터, (ii) 상기 제1 내지 제N 피지컬 피드백 데이터 중 하나인 제R 피지컬 피드백 데이터 및 (iii) 상기 제1 내지 제N 바이오 피드백 데이터 중 하나인 제R 바이오 피드백 데이터를 가중합함으로써 제R 탑승자 피드백 데이터를 획득하는 것을 특징으로 하는 장치가 개시된다.
일례로서, 상기 (II) 프로세스는, 상기 프로세서가, 상기 자율주행 네트워크로 하여금, (i) 이에 포함된, 강화 학습 방법론을 기반으로 설계된 동작 결정 네트워크에 상기 제1 내지 제N 이벤트 중 하나인 특정 이벤트를 입력함으로써 특정 동작 지시값을 획득하도록 하고, (ii) 상기 특정 동작 지시값을 상기 강화 학습 방법론을 기반으로 설계된 보상 에이전트에 입력함으로써 상기 특정 동작 지시값에 대한 특정 보상 스코어를 획득하도록 하며, (iii) 로스 유닛에 상기 특정 동작 지시값 및 상기 특정 보상 스코어를 입력함으로써 로스를 생성한 후 상기 로스를 참조로 하여 상기 동작 결정 네트워크의 파라미터를 학습하도록 하는 것을 특징으로 하는 장치가 개시된다.
일례로서, 상기 (II) 프로세스는, 상기 프로세서가, 자신에 상기 특정 동작 지시값이 입력되면, 상기 제1 내지 제N 이벤트, 상기 제1 내지 제N 리액션 데이터 및 상기 제1 내지 제N 탑승자 피드백 데이터를 사용하여 상기 특정 동작 지시값에 대응하는 특정 보상 스코어를 출력하는 것을 특징으로 하는 장치가 개시된다.
본 발명은 자율주행 차량으로부터 획득된 운행 데이터 및 자율주행 차량의 탑승자로부터 획득된 피드백 데이터를 이용하여 자율주행 차량의 자율주행 네트워크를 학습할 수 있도록 지원할 수 있는 효과가 있다.
또한 본 발명은 탑승자가 과거의 피드백에 따른 자율 주행의 변화 과정을 참조하여 자율주행 중의 주관적 경험을 입력할 수 있도록 지원함으로써 보다 풍부한 피드백 데이터를 획득할 수 있는 효과가 있다.
또한 본 발명은 탑승자의 주관적 경험에 대응하는 매뉴얼 피드백 데이터, 탑승자의 객관적 물리량에 대응하는 피지컬 피드백 데이터 및 탑승자의 신체적 반응에 대응하는 바이오 피드백 데이터 중 적어도 일부를 획득할 수 있는 방법을 제공할 수 있는 효과가 있다.
도 1은 본 발명의 일 실시예에 따른 소정 경로를 운행하는 자율주행 차량으로부터 획득된 운행 데이터 및 자율주행 차량의 탑승자로부터 획득된 피드백 데이터를 이용하여 자율주행 차량의 자율주행 네트워크를 학습할 수 있도록 지원하는 방법을 수행하는 컴퓨팅 장치를 나타낸 도면이다.
도 2는 본 발명의 일 실시예에 따른 소정 경로를 운행하는 자율주행 차량으로부터 획득된 운행 데이터 및 자율주행 차량의 탑승자로부터 획득된 피드백 데이터를 이용하여 자율주행 차량의 자율주행 네트워크를 학습할 수 있도록 지원하는 방법을 나타낸 흐름도이다.
도 3은 본 발명의 일 실시예에 따른 소정 경로를 운행하는 자율주행 차량으로부터 획득된 운행 데이터 및 자율주행 차량의 탑승자로부터 획득된 피드백 데이터를 이용하여 자율주행 차량의 자율주행 네트워크를 학습할 수 있도록 지원하는 방법을 수행하기 위해 사용되는, 제1 내지 제N 매뉴얼 피드백 데이터를 획득하기 위한 UI의 제1 예시를 나타낸 도면이다.
도 4는 본 발명의 일 실시예에 따른 소정 경로를 운행하는 자율주행 차량으로부터 획득된 운행 데이터 및 자율주행 차량의 탑승자로부터 획득된 피드백 데이터를 이용하여 자율주행 차량의 자율주행 네트워크를 학습할 수 있도록 지원하는 방법을 수행하기 위해 사용되는, 제1 내지 제N 매뉴얼 피드백 데이터를 획득하기 위한 UI의 제2 예시를 나타낸 도면이다.
도 5는 본 발명의 일 실시예에 따른 소정 경로를 운행하는 자율주행 차량으로부터 획득된 운행 데이터 및 자율주행 차량의 탑승자로부터 획득된 피드백 데이터를 이용하여 자율주행 차량의 자율주행 네트워크를 학습할 수 있도록 지원하는 방법을 수행하기 위해 사용되는, 제1 내지 제N 매뉴얼 피드백 데이터를 획득하기 위한 UI의 제3 예시를 나타낸 도면이다.
도 6은 본 발명의 일 실시예에 따른 소정 경로를 운행하는 자율주행 차량으로부터 획득된 운행 데이터 및 자율주행 차량의 탑승자로부터 획득된 피드백 데이터를 이용하여 자율주행 차량의 자율주행 네트워크를 학습할 수 있도록 지원하는 방법을 수행하기 위해 사용되는 자율주행 네트워크의 RNN을 사용한 실시예를 나타낸 도면이다.
도 7은 본 발명의 일 실시예에 따른 소정 경로를 운행하는 자율주행 차량으로부터 획득된 운행 데이터 및 자율주행 차량의 탑승자로부터 획득된 피드백 데이터를 이용하여 자율주행 차량의 자율주행 네트워크를 학습할 수 있도록 지원하는 방법을 수행하기 위해 사용되는 자율주행 네트워크의 RNN을 탑승자 피드백 데이터를 사용하여 재학습하는 실시예를 나타낸 도면이다.
도 8은 본 발명의 일 실시예에 따른 소정 경로를 운행하는 자율주행 차량으로부터 획득된 운행 데이터 및 자율주행 차량의 탑승자로부터 획득된 피드백 데이터를 이용하여 자율주행 차량의 자율주행 네트워크를 학습할 수 있도록 지원하는 방법을 수행하기 위해 사용되는 자율주행 네트워크를 강화학습을 통해 구현한 실시예를 나타낸 도면이다.
후술하는 본 발명에 대한 상세한 설명은, 본 발명이 실시될 수 있는 특정 실시예를 예시로서 도시하는 첨부 도면을 참조한다. 이들 실시예는 당업자가 본 발명을 실시할 수 있기에 충분하도록 상세히 설명된다. 본 발명의 다양한 실시예는 서로 다르지만 상호 배타적일 필요는 없음이 이해되어야 한다. 예를 들어, 여기에 기재되어 있는 특정 형상, 구조 및 특성은 일 실시예에 관련하여 본 발명의 정신 및 범위를 벗어나지 않으면서 다른 실시예로 구현될 수 있다. 또한, 각각의 개시된 실시예 내의 개별 구성요소의 위치 또는 배치는 본 발명의 정신 및 범위를 벗어나지 않으면서 변경될 수 있음이 이해되어야 한다. 따라서, 후술하는 상세한 설명은 한정적인 의미로서 취하려는 것이 아니며, 본 발명의 범위는, 적절하게 설명된다면, 그 청구항들이 주장하는 것과 균등한 모든 범위와 더불어 첨부된 청구항에 의해서만 한정된다. 도면에서 유사한 참조부호는 여러 측면에 걸쳐서 동일하거나 유사한 기능을 지칭한다.
이하, 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자가 본 발명을 용이하게 실시할 수 있도록 하기 위하여, 본 발명의 바람직한 실시예들에 관하여 첨부된 도면을 참조하여 상세히 설명하기로 한다.
도 1은 본 발명의 일 실시예에 따른 소정 경로를 운행하는 자율주행 차량으로부터 획득된 운행 데이터 및 자율주행 차량의 탑승자로부터 획득된 피드백 데이터를 이용하여 자율주행 차량의 자율주행 네트워크를 학습할 수 있도록 지원하는 방법을 수행하는 컴퓨팅 장치를 나타낸 도면이다.
도 1을 참조하면, 컴퓨팅 장치(100)는 통신부(110) 및 프로세서(120)를 포함할 수 있다. 이 때, 컴퓨팅 장치(100)의 입출력 및 연산 과정은 각각 통신부(110) 및 프로세서(120)에 의해 이루어질 수 있다. 다만, 도 1에서는 통신부(110) 및 프로세서(120)의 구체적인 연결 관계를 생략하였다. 또한, 메모리(115)는 후술할 여러 가지 인스트럭션들을 저장한 상태일 수 있고, 프로세서(120)는 메모리에 저장된 인스트럭션들을 수행하도록 됨으로써 추후 설명할 프로세스들을 수행하여 본 발명을 수행할 수 있다. 이와 같이 컴퓨팅 장치(100)가 묘사되었다고 하여, 컴퓨팅 장치(100)가 본 발명을 실시하기 위한 미디엄, 프로세서 및 메모리가 통합된 형태인 integrated 프로세서를 포함하는 경우를 배제하는 것은 아니다.
또한, 이와 같은 컴퓨팅 장치(100)는 자율주행 네트워크(200) 및 사용자 단말(300)과 연동하여 동작할 수 있다. 먼저 사용자 단말(300)은, 소정 사용자가 착용하고 있는 스마트폰 등의 통신 기기 및 스마트 워치 등과 같은 IOT 기기일 수 있다. 또한, 자율주행 네트워크(200)는, 사용자 단말(300)을 사용하는 사용자가 탑승한 자율주행 차량의 자율주행을 관장하는 뉴럴 네트워크일 수 있는데, 이는 자율주행 차량 자체에 탑재되거나, 또는 자율주행 차량과 연결된 서버에 탑재된 것일 수 있다. 추후 설명하겠지만, 자율주행 네트워크(200)는, Convolutional Neural Network(CNN), Recurrent Neural Network(RNN) 및 Reinforcement Learning(RL, 강화학습) 등을 통해 구현될 수 있으나, 이에 한정될 것은 아니다. 이상 본 발명의 일 실시예에 따른 컴퓨팅 장치(100)의 구성 및 이의 연동 관계에 대해 설명한 바, 본 발명의 일 실시예에 따른, 자율주행 네트워크(200) 학습 지원 방법에 대해 구체적으로 살필 것이다. 이를 위해 도 2를 참조하도록 한다.
도 2는 본 발명의 일 실시예에 따른 소정 경로를 운행하는 자율주행 차량으로부터 획득된 운행 데이터 및 자율주행 차량의 탑승자로부터 획득된 피드백 데이터를 이용하여 자율주행 차량의 자율주행 네트워크를 학습할 수 있도록 지원하는 방법을 나타낸 흐름도이다.
도 2를 참조하면, 컴퓨팅 장치(100)는 두 프로세스를 병렬적으로 수행할 수 있다. 즉, 컴퓨팅 장치(100)는, 자율주행 차량이 소정 경로의 제1 내지 제N 지점(N은 1 이상의 정수임)에 일어난 제1 내지 제N 이벤트에 대해 수행한 제1 내지 제N 동작에 대응하는 제1 내지 제N 리액션 데이터를 획득할 수 있다(S01-1). 이와 병렬적으로, 컴퓨팅 장치(100)는, 자율주행 차량에 탑승한 탑승자의 탑승자 단말(300)로부터, (i) 제1 내지 제N 동작에 대한 탑승자의 주관적 경험에 대응하는 제1 내지 제N 매뉴얼 피드백 데이터, (ii) 제1 내지 제N 동작에 대한 탑승자의 객관적 물리량에 대응하는 제1 내지 제N 피지컬 피드백 데이터 및 (iii) 제1 내지 제N 동작에 대한 탑승자의 신체적 반응에 대응하는 제1 내지 제N 바이오 피드백 데이터 중 적어도 일부를 참조로 하여 생성된 제1 내지 제N 탑승자 피드백 데이터를 획득할 수 있다(S01-2). 이후, 컴퓨팅 장치(100)는, 제1 내지 제N 이벤트, 제1 내지 제N 리액션 데이터 및 제1 내지 제N 탑승자 피드백 데이터를 참조하여 학습 데이터를 생성한 후, 학습 데이터를 이용하여 자율주행 네트워크(200)를 학습할 수 있도록 지원할 수 있다(S02). 이하 각각의 단계에 대해 더욱 자세히 설명하도록 한다.
먼저, 컴퓨팅 장치(100)는, 전술한 바와 같이 제1 내지 제N 리액션 데이터를 획득할 수 있다. 여기서 제1 내지 제N 리액션 데이터는, 정해진 경로를 반복적으로 주행하는 자율주행 차량이, 해당 경로의 제1 내지 제N 지점에서 일어난 제1 내지 제N 이벤트에 대해 수행한 제1 내지 제N 동작에 대한 정보일 수 있다. 예를 들어, 학동역-언주역-신논현역-강남역을 왕복 운행하는 자율주행 셔틀버스가 있다고 가정하면, 각각의 역이 제1 내지 제7 지점일 수 있고, 각각의 지점에서 회전 허용 신호를 받는 것이 각각의 제1 내지 제7 이벤트일 수 있다. 여기서 학동역(제1 지점)에서 좌회전 신호를 받는 것이 제1 이벤트, 언주역(제2 지점)에서 우회전 차로에 위치하는 것이 제2 이벤트, 신논현역(제3 지점)에서 좌회전 신호를 받는 것이 제3 이벤트, 강남역(제4 지점)에서 유턴 신호를 받는 것이 제4 이벤트이고, 이를 역순 및 반대 방향으로 학동역까지 반복하는 것이 제5 내지 제7 이벤트일 수 있다. 또한, 이와 같은 각각의 이벤트들에 대응하여 좌회전, 우회전 및 유턴 등의 동작을 수행한 것이 제1 내지 제7 동작이며, 이들에 대한 정보가 제1 내지 제7 리액션 데이터일 수 있다. 여기서는 설명의 편의를 위해 각 교차로에서 회전하는 경우에 대해서만 설명하였는데, 이외에 위협적인 차량 또는 예기치 못한 보행자 등에 대응하기 위해 회피 기동을 하거나 급정지 기동을 하는 경우도 포함될 수 있을 것이다. 이에 따라, 제1 내지 제N 동작은, 스티어링 각도, 가속도 및 속도 등의 물리량 지시 값들을 포함하는 개념일 수 있다.
또한, 컴퓨팅 장치(100)는, 제1 내지 제N 동작에 대한 (i) 제1 내지 제N 매뉴얼 피드백 데이터, (ii) 제1 내지 제N 피지컬 피드백 데이터 및 (iii) 제1 내지 제N 바이오 피드백 데이터를 탑승자 단말(300)로부터 획득할 수 있다. 먼저 1 내지 제N 매뉴얼 피드백 데이터, 즉 자율주행 차량의 주행에 대한 탑승자의 주관적 경험에 대응하는 정보를 획득하는 과정에 대해 설명하도록 한다.
먼저, 컴퓨팅 장치(100)는, 탑승자 단말(300)로 하여금, (i) 제1 내지 상기 제N 지점 중 하나인 제P 지점(P는 1 이상 N 이하의 정수임)에 수행된 제P 동작에 대한 정보를 탑승자 단말(300)과 연동하여 동작하는 탑승자 디스플레이의 제1 영역에 디스플레이하고, (ii) 제P 동작에 대한 탑승자의 주관적 경험 정보를 입력할 수 있는 제1 내지 제M 피드백 옵션(M은 1 이상의 정수임)을 제1 영역과 인접한 탑승자 디스플레이의 제2 영역에 디스플레이할 수 있다. 이에 대해 설명하기 위해 도 3을 참조하도록 한다.
도 3은 본 발명의 일 실시예에 따른 소정 경로를 운행하는 자율주행 차량으로부터 획득된 운행 데이터 및 자율주행 차량의 탑승자로부터 획득된 피드백 데이터를 이용하여 자율주행 차량의 자율주행 네트워크를 학습할 수 있도록 지원하는 방법을 수행하기 위해 사용되는, 제1 내지 제N 매뉴얼 피드백 데이터를 획득하기 위한 UI의 제1 예시를 나타낸 도면이다.
도 3을 참조하면, 탑승자 단말(300)자체에 탑승자 디스플레이가 탑재된 경우에, 제1 영역(310)에 제P 지점, 즉 강남역에서 수행된 제P 동작, 즉 유턴 동작에 대한 정보를 디스플레이함으로써 탑승자에게 해당 정보를 제공하고, 제2 영역(320)에, 탑승자가 제P 동작에 대해 평가할 수 있도록 Good, Okay 및 Bad의 선택지를 제공하는 실시예에 대해 확인할 수 있다. 탑승자는 이와 같은 UI를 통해 제P 동작에 대한 제P 매뉴얼 피드백 정보를 용이하게 생성할 수 있을 것이다. 여기서, 탑승자가 참고할 수 있는 다른 정보를 포함하는 다른 UI를 사용하는 것도 가능한 바 이하 설명한다.
즉, 컴퓨팅 장치(100)는, 탑승자 단말(300)로 하여금, (i) 제1 내지 상기 제N 지점 중 하나인 제P 지점에서 수행된 제P 동작에 대한 정보를 상기 탑승자 단말과 연동하여 동작하는 탑승자 디스플레이의 제1_1 영역에 디스플레이하고, (ii) 제P 이벤트에 대해 자율주행 차량이 과거에 수행한 적어도 하나의 동작들에 대해 과거에 피드백한 정보에 대응하는 제P 과거 매뉴얼 피드백 정보를 탑승자 디스플레이의 제1_2 영역에 디스플레이하고, (iii) 제P 동작에 대하여, 제P 과거 매뉴얼 피드백 정보를 기반으로 한 탑승자의 주관적 경험 정보를 입력할 수 있는 제1 내지 제M 피드백 옵션을, 상기 제1_1 영역 및 상기 제1_2 영역을 포함하는 제1 영역과 인접한 상기 탑승자 디스플레이의 제2 영역에 디스플레이할 수 있다. 이에 대한 일 예시를 살피기 위해 도 4를 참조하도록 한다.
도 4는 본 발명의 일 실시예에 따른 소정 경로를 운행하는 자율주행 차량으로부터 획득된 운행 데이터 및 자율주행 차량의 탑승자로부터 획득된 피드백 데이터를 이용하여 자율주행 차량의 자율주행 네트워크를 학습할 수 있도록 지원하는 방법을 수행하기 위해 사용되는, 제1 내지 제N 매뉴얼 피드백 데이터를 획득하기 위한 UI의 제2 예시를 나타낸 도면이다.
도 4를 참조하면, 도 3과 달리, 제1_1 영역(311)에 디스플레이된 "강남역 사거리에서의 유턴" 동작에 대한 정보 외에, 과거에 강남역 사거리에서 유턴했을 때에 탑승자가 어떻게 피드백했는지가 제1_2 영역(312)에 디스플레이되었음을 확인할 수 있다. 탑승자는 이를 추가로 참조로 하여, 즉 12일과 13일에는 유턴이 다소 불쾌하게 이루어졌으나, 14일에는 피드백에 따라 주행 스타일이 바뀌어 유턴이 무난하게 이루어졌던 점을 참조로 하여 해당 시점의 유턴 동작에 대한 매뉴얼 피드백 정보를 생성할 수 있을 것이다. 이와 같은 맥락의 실시예이나, 탑승자에게 더 많은 정보를 제공하는 다른 실시예가 있으므로 이에 대하여 본다.
즉, 컴퓨팅 장치(100)는, 탑승자 단말(300)로 하여금, 제P 동작에 대해 과거에 피드백한 정보의 통계치를 나타내는 정보인 제P_1 과거 매뉴얼 피드백 정보를 제1_2 영역의 적어도 일부에 디스플레이하고, 제P 이벤트에 대해 자율주행 차량이 과거에 수행한 적어도 하나의 동작들에 대한 적어도 하나의 과거의 피드백에 따라 제P 이벤트에 대해 자율주행 차량의 동작이 어떻게 시계열적으로 변화해 왔는지를 나타내는 정보인 제 P_2 과거 매뉴얼 피드백 정보를 상기 제1_2 영역의 적어도 일부에 디스플레이할 수 있다. 이에 대한 일 예시를 살피기 위해 도 5를 참조하도록 한다.
도 5는 본 발명의 일 실시예에 따른 소정 경로를 운행하는 자율주행 차량으로부터 획득된 운행 데이터 및 자율주행 차량의 탑승자로부터 획득된 피드백 데이터를 이용하여 자율주행 차량의 자율주행 네트워크를 학습할 수 있도록 지원하는 방법을 수행하기 위해 사용되는, 제1 내지 제N 매뉴얼 피드백 데이터를 획득하기 위한 UI의 제3 예시를 나타낸 도면이다.
도 5를 참조하면, 도 4와 달리, 제1_2 영역에 단순히 과거에 강남역 사거리에서 유턴했을 때에 탑승자가 어떻게 피드백했는지만 디스플레이되는 것이 아니라, 과거의 피드백 수준의 평균이 얼마였는지, 또한 각각의 피드백에 따라 자율주행 차량이 어떻게 자신의 동작을 수정했는지를 확인할 수 있음을 알 수 있다. 즉, 제1_2 영역의 일부(312_1)에, 현재까지 "강남역 사거리에서의 유턴" 동작에 대해 탑승자가 피드백한 것의 평균이 Bad임이 디스플레이되었고, 제1_2 영역의 다른 일부(312_2)에, 12일에 BAD로 피드백한 결과를 반영하여 턴 시의 속도를 더욱 줄이고, 13일에 BAD로 피드백한 결과를 다시 반영하여 턴 시의 각도를 더욱 완만하게 조절하였음이 디스플레이되었음을 확인할 수 있다. 이와 같은 정보를 추가적으로 참조하여 탑승자는 더욱 적절한 매뉴얼 피드백 정보를 입력할 수 있을 것이다.
여기서 도 3 내지 5의 실시예들은 함께 사용될 수도 있고, 따로 사용될 수도 있다. 즉, 도 3, 도 4 및 도 5 중의 하나의 UI만을 각 탑승자에게 디스플레이하여, 해당 실시예 중 하나를 통해서만 제P 동작에 대한 제P 매뉴얼 피드백 정보를 획득할 수 있다. 또는, 도 3과 도 4 또는 도 5의 실시예를 함께 사용할 수도 있다. 즉, 도 3의 실시예에 따른 UI를 탑승자에게 제공하여 1차적으로 제P 동작에 대한 제P_1 매뉴얼 피드백 데이터를 획득하고, 도 4 또는 도 5의 실시예에 따른 UI를 탑승자에게 제공하여 2차적으로 제P 동작에 대한 제P_2 매뉴얼 피드백 데이터를 획득할 수도 있을 것이다. 이후, 제P_1 매뉴얼 피드백 데이터와 제P_2 매뉴얼 피드백 데이터를 적절히 통합하여 사용할 수도 있을 것이다.
이상 제1 내지 제N 매뉴얼 피드백 데이터를 획득하는 과정에 대해 설명한 바, 이하 제1 내지 제N 피지컬 피드백 데이터를 획득하는 과정에 대해 설명하도록 한다. 제1 내지 제N 매뉴얼 피드백 데이터가 탑승자에 의해 수동적으로 획득된 것과 달리, 제1 내지 제N 피지컬 피드백 데이터는 탑승자의 객관적 물리량에 대한 정보를 자동적으로 획득한 것일 수 있다. 이를 위해 탑승자 단말(300)을 사용할 수 있다.
즉, 컴퓨팅 장치(100)는, 탑승자 단말(300)에 탑재된 센서들, 즉 (i) 가속 센서, (ii) 자이로 센서, (iii) 근접 센서 및 (iv) 모션 센서 중 적어도 일부를 포함하는 센서들을 사용하여, 제1 내지 제N 동작에 의해 탑승자 단말(300)에 가해진 가속도를 획득함으로써 제1 내지 제N 피지컬 피드백 데이터를 획득할 수 있다. 급정거 또는 급회전 등의 동작이 탑승자에게 불쾌감을 불러일으키는 이유는, 이와 같은 동작들이 탑승자에게 큰 가속도를 가하기 때문이다. 따라서, 탑승자 단말(300)에 포함된 상기 센서들 중 적어도 일부를 사용하여 탑승자 단말(300)에 가해진 가속도를 획득함으로써 탑승자에게 가해진 가속도를 추정할 수 있고, 이를 통해 탑승자의 자율주행에 대한 객관적 경험에 대한 정보를 획득할 수 있다. 구체적으로는, 제1 내지 제N 동작에 의해 발생한 각각의 가속도가 복수 개의 범위 중 어느 범위에 속하는지를 찾음으로써, 해당 동작이 탑승자에게 어느 정도의 불쾌감을 불러일으켰는지를 추정함으로써 제1 내지 제N 피지컬 피드백 데이터를 획득할 수 있다.
이하 제1 내지 제N 바이오 피드백 데이터를 획득하는 과정에 대해 설명하도록 한다. 제1 내지 제N 매뉴얼 피드백 데이터가 탑승자에 의해 수동적으로 획득된 것과 달리, 제1 내지 제N 바이오 피드백 데이터는 탑승자의 객관적 신체적 반응에 대한 정보를 자동적으로 획득한 것일 수 있다. 이를 위해 탑승자 단말(300)을 사용할 수 있다.
즉, 컴퓨팅 장치(100)는, 탑승자 단말(300)에 탑재된 센서들, 즉 (i) 심장 박동 센서, (ii) 혈압 센서, (iii) 말초 산소포화도 센서 및 (iv) 심전도 센서 중 적어도 일부를 포함하는 센서들을 사용하여, 제1 내지 제N 동작에 의한 상기 탑승자의 심장 박동 변화, 혈압 변화, 산소포화도 변화 및 심전도 변화 중 적어도 일부를 포함하는 상기 신체적 반응에 대한 상기 제1 내지 제N 바이오 피드백 데이터를 획득할 수 있다. 탑승자가 제1 내지 제N 동작 중 적어도 일부에 의해 놀람 또는 두려움 등의 부정적인 감정을 느꼈다면, 이는 심장 박동, 혈압, 산소포화도 및 심전도 중 적어도 일부에 영향을 끼칠 수 있다. 컴퓨팅 장치(100)는, 이와 같은 값들이 여러 개의 범위 중 어느 범위에 포함되는지를 찾음으로써 해당 동작이 탑승자에게 어느 정도의 불쾌감을 불러일으켰는지를 추정하여 제1 내지 제N 바이오 피드백 데이터를 획득할 수 있다.
이와 같이 제1 내지 제N 매뉴얼 피드백 데이터, 제1 내지 제N 피지컬 피드백 데이터 및 제1 내지 제N 바이오 피드백 데이터가 획득되면, 컴퓨팅 장치(100)는, 이들을 각각 가중합함으로써 제1 내지 제N 탑승자 피드백 데이터를 획득할 수 있다. 즉, 제R 매뉴얼 피드백 데이터(R은 1 이상 N 이하의 정수임)가 OKAY(3점)이고, 제R 피지컬 피드백 데이터가 BAD(1점)이며 제R 바이오 피드백 데이터가 BAD(1점)이되 가중치가 2:1:1이라면, 제R 탑승자 피드백 데이터는 2.33점으로 도출될 수 있다. 이와 같은 방식을 통해 제1 내지 제N 탑승자 피드백 데이터가 획득될 수 있을 것이다.
다만, 위와 같이 세 종류의 피드백 데이터를 모두 사용하는 대신, 이들 중 선택하여 사용할 수도 있을 것이다. 즉, 매뉴얼 피드백 데이터만 사용하거나, 피지컬 피드백 데이터만 사용하거나, 또는 바이오 피드백 데이터만 사용하는 실시예가 가능하고, 나아가 2개씩 사용하는 것도 가능할 것이다. 이들 모두 본 발명의 실시예에 포함됨을 밝혀 둔다.
이하 이와 같이 획득된 탑승자 피드백 데이터를 어떻게 활용하여 자율주행 네트워크(200)을 학습할 수 있는지에 대해서 설명하도록 한다. 전술한 바와 같이, 자율주행 네트워크(200)는 RNN 또는 강화학습을 통해 구현될 수 있는데, 먼저 RNN을 사용한 실시예에 대해 설명하도록 한다. 이를 위해 도 6을 참조하도록 한다.
도 6은 본 발명의 일 실시예에 따른 소정 경로를 운행하는 자율주행 차량으로부터 획득된 운행 데이터 및 자율주행 차량의 탑승자로부터 획득된 피드백 데이터를 이용하여 자율주행 차량의 자율주행 네트워크를 학습할 수 있도록 지원하는 방법을 수행하기 위해 사용되는 자율주행 네트워크의 RNN을 사용한 실시예를 나타낸 도면이다.
도 6을 참조하면, 자율주행 네트워크(200)는, 제1 내지 제N RNN(210-1 내지 210-N)을 포함할 수 있으며, 각각이 제1 내지 제N 이벤트를 입력받아 제1 내지 제N 동작을 출력하는 것을 확인할 수 있다. 즉, 제1 내지 제N RNN(210-1 내지 210-N)은 전술한 소정 루트를 운행하기 위해 지정된 RNN들일 수 있다. 이와 같은 RNN들이 어떻게 탑승자 피드백 데이터를 반영할 수 있는지 아래 설명하도록 한다.
도 7은 본 발명의 일 실시예에 따른 소정 경로를 운행하는 자율주행 차량으로부터 획득된 운행 데이터 및 자율주행 차량의 탑승자로부터 획득된 피드백 데이터를 이용하여 자율주행 차량의 자율주행 네트워크를 학습할 수 있도록 지원하는 방법을 수행하기 위해 사용되는 자율주행 네트워크의 RNN을 탑승자 피드백 데이터를 사용하여 재학습하는 실시예를 나타낸 도면이다.
도 7을 참조하면, 제S RNN(210-S)가, 11월 17일에 제S 이벤트를 입력받아 제S 동작을 결정한 것을 확인할 수 있다. 이와 같은 제S RNN(210-S)는, 11월 17일에 제S 동작에 대해 피드백된 데이터인 제S 탑승자 피드백 데이터를 사용하여 fine-tuning 또는 재학습될 수 있고, 이와 같이 탑승자 피드백 데이터가 반영된 제S RNN(210-S)는 그 다음날인 11월 18일에 같은 제S 지점에서 제S 이벤트를 입력받아, 제S 탑승자 피드백 데이터가 반영된 새로운 제S 동작을 생성할 수 있다. 이 때 RNN의 기본적인 동작 원리대로, 11월 17일에 제S 동작을 생성할 때에 업데이트된 히든 스테이트 값이 함께 참조됨은 자명한 것이다. 이와 같은 방식으로 제1 내지 제N RNN(210-1 내지 210-N)을 재학습함으로써 탑승자의 니즈가 반영된 자율주행을 수행할 수 있게 된다.
앞에서 살펴본 예시를 본 RNN 의 학습에 적용하면 다음과 같다.
이를 다시 언급하면, 예를 들어, 학동역-언주역-신논현역-강남역을 왕복 운행하는 자율주행 셔틀버스가 있다고 가정하면, 상기 경로 내의 제1 지점 내지 제7 지점을 상정하고, 각각의 지점에서 소정 신호를 받는 것이 각각의 제1 내지 제7 이벤트일 수 있다.
이와 같은 상태에서, 오늘 제1 내지 제7 지점 각각에서 수행한 동작이 a1->b1->c1->d1->e1->f1->g1 이고, 같은 경로에 대해 다음날 제1 내지 제7 지점 각각에서 수행한 동작이 a2->b2->c2->d2->e2->f2->g2라고 하자.
이때, 제1 지점만 생각하면, 오늘 이후로 제1 지점에서 수행되는 동작은, a1, a2, a3 등과 같이 나열할 수 있고, 제2 지점만 생각하면 b1, b2, b3 등과 같이 나열할 수 있을 것이다.
따라서, 제1 지점에서 제1 RNN 이 a1 이라는 동작을 결정하고 이에 따라 피드백된 데이터를 통해 제1 RNN이 학습되고, 그 다음날 동일한 제1 지점에서 a1을 바탕으로 a2 동작을 결정하고 이에 따라 피드백된 데이터를 통해 또 다시 제1 RNN이 학습되는 등의 과정을 거칠 것이다.
마찬가지로, 제2 지점에서 제2 RNN 이 b1 이라는 동작을 결정하고 이에 따라 피드백된 데이터를 통해 제2 RNN이 학습되고, 그 다음날 동일한 제2 지점에서 b1을 바탕으로 b2 동작을 결정하고 이에 따라 피드백된 데이터를 통해 또 다시 제2 RNN이 학습되는 등의 과정을 거칠 것이다.
이와 같이 일반적인 RNN과는 다르게 복합적으로 RNN 을 구성함으로써 보다 정확도가 높은 학습이 가능하도록 할 것이다. 참고로, 일반적인 RNN 은 이와 같이 제1 RNN 내지 제7 RNN으로 구성되는 것이 아니라 단일 RNN 으로 구성되며, 일반적인 RNN 은 단순히 시계열적으로 연속적인 이벤트를 상정할뿐이지만, 본 발명에서는 시계열적으로 연속적이지 않은 데이터들을 각각의 지점별로 그룹핑한 데이터들을 바탕으로 하여, 각각의 지점에 대응되는 RNN을 학습한다는 특징이 있다.
이하 다른 실시예로, 강화학습을 사용하여 자율주행을 구현한 예시에 대해 설명하도록 한다. 이를 위해 도 8을 참조하도록 한다.
도 8은 본 발명의 일 실시예에 따른 소정 경로를 운행하는 자율주행 차량으로부터 획득된 운행 데이터 및 자율주행 차량의 탑승자로부터 획득된 피드백 데이터를 이용하여 자율주행 차량의 자율주행 네트워크를 학습할 수 있도록 지원하는 방법을 수행하기 위해 사용되는 자율주행 네트워크를 강화학습을 통해 구현한 실시예를 나타낸 도면이다.
도 8을 참조하면, 강화학습을 사용한 경우, 자율주행 네트워크(200)는 동작 결정 네트워크(220) 및 보상 에이전트(230)를 포함할 수 있다. 강화학습은 학습과 동작이 동시에 이루어지는 방식으로서, 동작 결정 네트워크(220)는 특정 이벤트를 입력받아 이에 대응하는 특정 동작 지시값을 출력하고, 보상 에이전트(230)는 동작 지시값을 입력받아 해당 특정 동작 지시값에 대응하는 특정 보상 스코어를 출력하게 된다. 이와 같은 특정 보상 스코어는 다시 로스 유닛(240)에 의해 연산되어 로스로 변환되고, 이는 동작 결정 네트워크(220)를 학습하는 데에 사용된다. 여기서 특정 보상 스코어가 높을 경우 동작 결정 네트워크(220)의 파라미터 변화가 적고, 낮을 경우 파라미터 변화가 클 수 있다.
여기서 보상 에이전트(230)를 구현할 때 제1 내지 제N 이벤트, 제1 내지 제N 리액션 데이터 및 제1 내지 제N 탑승자 피드백 데이터를 사용할 수 있다. 즉, 특정 동작 지시값이 입력되면, 보상 에이전트(230)는 제1 내지 제N 이벤트 및 제1 내지 제N 리액션 데이터를 사용해, 특정 동작 지시값이 어떤 상황의 어떤 동작에 가장 가까운지를 찾을 수 있다. 이후, 특정 동작 지시값과 가장 가까운 특정 동작에 대한 특정 탑승자 피드백 데이터를 찾아, 이에 따라 특정 보상 스코어를 출력할 수 있다. 해당 프로세스는 머신러닝을 이용해서 구현될 수도 있고, 단순 수치계산을 통해 구현될 수도 있을 것이다. 이와 같은 과정을 통해, 탑승자 피드백 데이터가 동작 결정 네트워크(220)의 학습에 영향을 끼칠 수 있다.
다만, 이상 자율주행 네트워크(200)의 두 가지 실시예는 단순히 예시적인 것일 뿐으로, 본 발명의 주된 목적은 임의의 자율주행 네트워크(200)를 학습하기 위한 학습 데이터를 생성하기 위한 것인 바, 어떠한 자율주행 네트워크(200)의 구현 방식도 사용될 수 있음은 자명하다.
이상 설명된 본 발명에 따른 실시예들은 다양한 컴퓨터 구성요소를 통하여 수행될 수 있는 프로그램 명령어의 형태로 구현되어 컴퓨터 판독 가능한 기록 매체에 기록될 수 있다. 상기 컴퓨터 판독 가능한 기록 매체는 프로그램 명령어, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 상기 컴퓨터 판독 가능한 기록 매체에 기록되는 프로그램 명령어는 본 발명을 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 분야의 당업자에게 공지되어 사용 가능한 것일 수도 있다. 컴퓨터 판독 가능한 기록 매체의 예에는, 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체, CD-ROM, DVD와 같은 광기록 매체, 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media), 및 ROM, RAM, 플래시 메모리 등과 같은 프로그램 명령어를 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다. 프로그램 명령어의 예에는, 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드도 포함된다. 상기 하드웨어 장치는 본 발명에 따른 처리를 수행하기 위해 하나 이상의 소프트웨어 모듈로서 작동하도록 구성될 수 있으며, 그 역도 마찬가지이다.
이상에서 본 발명이 구체적인 구성요소 등과 같은 특정 사항들과 한정된 실시예 및 도면에 의해 설명되었으나, 이는 본 발명의 보다 전반적인 이해를 돕기 위해서 제공된 것일 뿐, 본 발명이 상기 실시예들에 한정되는 것은 아니며, 본 발명이 속하는 기술분야에서 통상적인 지식을 가진 자라면 이러한 기계로부터 다양한 수정 및 변형을 꾀할 수 있다.
따라서, 본 발명의 사상은 상기 설명된 실시예에 국한되어 정해져서는 아니 되며, 후술하는 특허청구범위 뿐만 아니라 이 특허청구범위와 균등하게 또는 등가적으로 변형된 모든 것들은 본 발명의 사상의 범주에 속한다고 할 것이다.

Claims (20)

  1. 소정 경로를 운행하는 자율주행 차량으로부터 획득된 운행 데이터 및 상기 자율주행 차량의 탑승자로부터 획득된 피드백 데이터를 이용하여 상기 자율주행 차량의 자율주행 네트워크를 학습할 수 있도록 지원하는 방법에 있어서,
    (a) 컴퓨팅 장치가, (i) 상기 자율주행 차량이 상기 경로의 제1 내지 제N 지점 - N은 1 이상의 정수임 - 에서 일어난 제1 내지 제N 이벤트에 대해 수행한 제1 내지 제N 동작에 대응하는 제1 내지 제N 리액션 데이터를 획득하는 프로세스 및 (ii) 상기 자율주행 차량에 탑승한 상기 탑승자의 탑승자 단말로부터, (ii-1) 상기 제1 내지 제N 동작에 대한 상기 탑승자의 주관적 경험에 대응하는 제1 내지 제N 매뉴얼 피드백 데이터, (ii-2) 상기 제1 내지 제N 동작에 대한 상기 탑승자의 객관적 물리량에 대응하는 제1 내지 제N 피지컬 피드백 데이터 및 (ii-3) 상기 제1 내지 제N 동작에 대한 상기 탑승자의 신체적 반응에 대응하는 제1 내지 제N 바이오 피드백 데이터 중 적어도 일부를 참조로 하여 생성된 제1 내지 제N 탑승자 피드백 데이터를 획득하는 프로세스를 수행하는 단계;
    (b) 상기 컴퓨팅 장치가, 상기 제1 내지 제N 이벤트, 상기 제1 내지 제N 리액션 데이터 및 상기 제1 내지 제N 탑승자 피드백 데이터를 참조하여 학습 데이터를 생성한 후, 상기 학습 데이터를 이용하여 상기 자율주행 네트워크를 학습할 수 있도록 지원하는 단계
    를 포함하는 것을 특징으로 하고,
    상기 (b) 단계는,
    상기 컴퓨팅 장치가, 상기 자율주행 네트워크로 하여금, (i) 이에 포함된, 강화 학습 방법론을 기반으로 설계된 동작 결정 네트워크에 상기 제1 내지 제N 이벤트 중 하나인 특정 이벤트를 입력함으로써 특정 동작 지시값을 획득하도록 하고, (ii) 상기 특정 동작 지시값을 상기 강화 학습 방법론을 기반으로 설계된 보상 에이전트에 입력함으로써 상기 특정 동작 지시값에 대한 특정 보상 스코어를 획득하도록 하며, (iii) 로스 유닛에 상기 특정 동작 지시값 및 상기 특정 보상 스코어를 입력함으로써 로스를 생성한 후 상기 로스를 참조로 하여 상기 동작 결정 네트워크의 파라미터를 학습하도록 하는 것을 특징으로 하는 방법.
  2. 제1항에 있어서,
    상기 (a) 단계는,
    상기 컴퓨팅 장치가, 상기 탑승자 단말로 하여금, (i) 상기 제1 내지 상기 제N 지점 중 하나인 제P 지점 - P는 1 이상 N 이하의 정수임 - 에서 수행된 제P 동작에 대한 정보를 상기 탑승자 단말과 연동하여 동작하는 탑승자 디스플레이의 제1 영역에 디스플레이하고, (ii) 상기 제P 동작에 대한 상기 탑승자의 상기 주관적 경험 정보를 입력할 수 있는 제1 내지 제M 피드백 옵션 - M은 1 이상의 정수임 - 을 상기 제1 영역과 인접한 상기 탑승자 디스플레이의 제2 영역에 디스플레이함으로써 상기 탑승자로부터 제P 매뉴얼 피드백 데이터의 적어도 일부인 제P_1 매뉴얼 피드백 데이터를 획득하는 것을 특징으로 하는 방법.
  3. 제1항에 있어서,
    상기 (a) 단계는,
    상기 컴퓨팅 장치가, 상기 탑승자 단말로 하여금, (i) 상기 제1 내지 상기 제N 지점 중 하나인 제P 지점 - P는 1 이상 N 이하의 정수임 - 에서 수행된 제P 동작에 대한 정보를 상기 탑승자 단말과 연동하여 동작하는 탑승자 디스플레이의 제1_1 영역에 디스플레이하고, (ii) 제P 이벤트에 대해 상기 자율주행 차량이 과거에 수행한 적어도 하나의 동작들에 대해 상기 탑승자가 과거에 피드백한 정보에 대응하는 제P 과거 매뉴얼 피드백 정보를 상기 탑승자 디스플레이의 제1_2 영역에 디스플레이하며, (iii) 상기 제P 동작에 대하여, 상기 제P 과거 매뉴얼 피드백 정보를 기반으로 한 상기 탑승자의 상기 주관적 경험 정보를 입력할 수 있는 제1 내지 제M 피드백 옵션 - M은 1 이상의 정수임 - 을 상기 제1_1 영역 및 상기 제1_2 영역을 포함하는 제1 영역과 인접한 상기 탑승자 디스플레이의 제2 영역에 디스플레이함으로써 상기 탑승자로부터 제P 매뉴얼 피드백 데이터의 적어도 일부인 제P_2 매뉴얼 피드백 데이터를 획득하는 것을 특징으로 하는 방법.
  4. 제3항에 있어서,
    상기 (a) 단계는,
    상기 컴퓨팅 장치가, 상기 탑승자 단말로 하여금, 상기 제P 동작에 대해 과거에 피드백한 정보의 통계치를 나타내는 정보인 제P_1 과거 매뉴얼 피드백 정보를 상기 제1_2 영역의 적어도 일부에 디스플레이하고, 상기 제P 이벤트에 대해 상기 자율주행 차량이 과거에 수행한 적어도 하나의 동작들에 대한 적어도 하나의 과거의 피드백에 따라 제P 이벤트에 대해 상기 자율주행 차량의 동작이 어떻게 시계열적으로 변화해 왔는지를 나타내는 정보인 제 P_2 과거 매뉴얼 피드백 정보를 상기 제1_2 영역의 적어도 일부에 디스플레이하는 것을 특징으로 하는 방법.
  5. 삭제
  6. 삭제
  7. 제1항에 있어서,
    상기 (a) 단계는,
    상기 컴퓨팅 장치가, 상기 탑승자 단말을 통해, (i) 심장 박동 센서, (ii) 혈압 센서, (iii) 말초 산소포화도 센서 및 (iv) 심전도 센서 중 적어도 일부를 사용하여, 상기 제1 내지 제N 동작에 의한 상기 탑승자의 심장 박동 변화, 혈압 변화, 산소포화도 변화 및 심전도 변화 중 적어도 일부를 포함하는 상기 신체적 반응에 대한 상기 제1 내지 제N 바이오 피드백 데이터를 획득하는 것을 특징으로 하는 방법.
  8. 제1항에 있어서,
    상기 (b) 단계는,
    상기 컴퓨팅 장치가, (i) 상기 제1 내지 제N 매뉴얼 피드백 데이터 중 하나인 제R - R은 1 이상 N 이하의 정수임 - 매뉴얼 피드백 데이터, (ii) 상기 제1 내지 제N 피지컬 피드백 데이터 중 하나인 제R 피지컬 피드백 데이터 및 (iii) 상기 제1 내지 제N 바이오 피드백 데이터 중 하나인 제R 바이오 피드백 데이터를 가중합함으로써 제R 탑승자 피드백 데이터를 획득하는 것을 특징으로 하는 방법.
  9. 삭제
  10. 제1항에 있어서,
    상기 (b) 단계는,
    상기 보상 에이전트는, 자신에 상기 특정 동작 지시값이 입력되면, 상기 제1 내지 제N 이벤트, 상기 제1 내지 제N 리액션 데이터 및 상기 제1 내지 제N 탑승자 피드백 데이터를 사용하여 상기 특정 동작 지시값에 대응하는 특정 보상 스코어를 출력하는 것을 특징으로 하는 방법.
  11. 소정 경로를 운행하는 자율주행 차량으로부터 획득된 운행 데이터 및 상기 자율주행 차량의 탑승자로부터 획득된 피드백 데이터를 이용하여 상기 자율주행 차량의 자율주행 네트워크를 학습할 수 있도록 지원하는 방법을 수행하는 컴퓨팅 장치에 있어서,
    인스트럭션들을 저장하는 하나 이상의 메모리; 및
    상기 인스트럭션들을 수행하도록 설정된 하나 이상의 프로세서를 포함하되, 상기 프로세서는, (I) (i) 상기 자율주행 차량이 상기 경로의 제1 내지 제N 지점 - N은 1 이상의 정수임 - 에서 일어난 제1 내지 제N 이벤트에 대해 수행한 제1 내지 제N 동작에 대응하는 제1 내지 제N 리액션 데이터를 획득하는 프로세스 및 (ii) 상기 자율주행 차량에 탑승한 상기 탑승자의 탑승자 단말로부터, (ii-1) 상기 제1 내지 제N 동작에 대한 상기 탑승자의 주관적 경험에 대응하는 제1 내지 제N 매뉴얼 피드백 데이터, (ii-2) 상기 제1 내지 제N 동작에 대한 상기 탑승자의 객관적 물리량에 대응하는 제1 내지 제N 피지컬 피드백 데이터 및 (ii-3) 상기 제1 내지 제N 동작에 대한 상기 탑승자의 신체적 반응에 대응하는 제1 내지 제N 바이오 피드백 데이터 중 적어도 일부를 참조로 하여 생성된 제1 내지 제N 탑승자 피드백 데이터를 획득하는 프로세스를 수행하는 프로세스; (II) 상기 제1 내지 제N 이벤트, 상기 제1 내지 제N 리액션 데이터 및 상기 제1 내지 제N 탑승자 피드백 데이터를 참조하여 학습 데이터를 생성한 후, 상기 학습 데이터를 이용하여 상기 자율주행 네트워크를 학습할 수 있도록 지원하는 프로세스를 수행하도록 설정된 것을 특징으로 하고,
    상기 (II) 프로세스는,
    상기 프로세서가, 상기 자율주행 네트워크로 하여금, (i) 이에 포함된, 강화 학습 방법론을 기반으로 설계된 동작 결정 네트워크에 상기 제1 내지 제N 이벤트 중 하나인 특정 이벤트를 입력함으로써 특정 동작 지시값을 획득하도록 하고, (ii) 상기 특정 동작 지시값을 상기 강화 학습 방법론을 기반으로 설계된 보상 에이전트에 입력함으로써 상기 특정 동작 지시값에 대한 특정 보상 스코어를 획득하도록 하며, (iii) 로스 유닛에 상기 특정 동작 지시값 및 상기 특정 보상 스코어를 입력함으로써 로스를 생성한 후 상기 로스를 참조로 하여 상기 동작 결정 네트워크의 파라미터를 학습하도록 하는 것을 특징으로 하는 장치.
  12. 제11항에 있어서,
    상기 (I) 프로세스는,
    상기 프로세서가, 상기 탑승자 단말로 하여금, (i) 상기 제1 내지 상기 제N 지점 중 하나인 제P 지점 - P는 1 이상 N 이하의 정수임 - 에서 수행된 제P 동작에 대한 정보를 상기 탑승자 단말과 연동하여 동작하는 탑승자 디스플레이의 제1 영역에 디스플레이하고, (ii) 상기 제P 동작에 대한 상기 탑승자의 상기 주관적 경험 정보를 입력할 수 있는 제1 내지 제M 피드백 옵션 - M은 1 이상의 정수임 - 을 상기 제1 영역과 인접한 상기 탑승자 디스플레이의 제2 영역에 디스플레이함으로써 상기 탑승자로부터 제P 매뉴얼 피드백 데이터의 적어도 일부인 제P_1 매뉴얼 피드백 데이터를 획득하는 것을 특징으로 하는 장치.
  13. 제11항에 있어서,
    상기 (I) 프로세스는,
    상기 프로세서가, 상기 탑승자 단말로 하여금, (i) 상기 제1 내지 상기 제N 지점 중 하나인 제P 지점 - P는 1 이상 N 이하의 정수임 - 에서 수행된 제P 동작에 대한 정보를 상기 탑승자 단말과 연동하여 동작하는 탑승자 디스플레이의 제1_1 영역에 디스플레이하고, (ii) 제P 이벤트에 대해 상기 자율주행 차량이 과거에 수행한 적어도 하나의 동작들에 대해 상기 탑승자가 과거에 피드백한 정보에 대응하는 제P 과거 매뉴얼 피드백 정보를 상기 탑승자 디스플레이의 제1_2 영역에 디스플레이하며, (iii) 상기 제P 동작에 대하여, 상기 제P 과거 매뉴얼 피드백 정보를 기반으로 한 상기 탑승자의 상기 주관적 경험 정보를 입력할 수 있는 제1 내지 제M 피드백 옵션 - M은 1 이상의 정수임 - 을 상기 제1_1 영역 및 상기 제1_2 영역을 포함하는 제1 영역과 인접한 상기 탑승자 디스플레이의 제2 영역에 디스플레이함으로써 상기 탑승자로부터 제P 매뉴얼 피드백 데이터의 적어도 일부인 제P_2 매뉴얼 피드백 데이터를 획득하는 것을 특징으로 하는 장치.
  14. 제13항에 있어서,
    상기 (I) 프로세스는,
    상기 프로세서가, 상기 탑승자 단말로 하여금, 상기 제P 동작에 대해 과거에 피드백한 정보의 통계치를 나타내는 정보인 제P_1 과거 매뉴얼 피드백 정보를 상기 제1_2 영역의 적어도 일부에 디스플레이하고, 상기 제P 이벤트에 대해 상기 자율주행 차량이 과거에 수행한 적어도 하나의 동작들에 대한 적어도 하나의 과거의 피드백에 따라 제P 이벤트에 대해 상기 자율주행 차량의 동작이 어떻게 시계열적으로 변화해 왔는지를 나타내는 정보인 제 P_2 과거 매뉴얼 피드백 정보를 상기 제1_2 영역의 적어도 일부에 디스플레이하는 것을 특징으로 하는 장치.
  15. 삭제
  16. 삭제
  17. 제11항에 있어서,
    상기 (I) 프로세스는,
    상기 프로세서가, 상기 탑승자 단말을 통해, (i) 심장 박동 센서, (ii) 혈압 센서, (iii) 말초 산소포화도 센서 및 (iv) 심전도 센서 중 적어도 일부를 사용하여, 상기 제1 내지 제N 동작에 의한 상기 탑승자의 심장 박동 변화, 혈압 변화, 산소포화도 변화 및 심전도 변화 중 적어도 일부를 포함하는 상기 신체적 반응에 대한 상기 제1 내지 제N 바이오 피드백 데이터를 획득하는 것을 특징으로 하는 장치.
  18. 제11항에 있어서,
    상기 (II) 프로세스는,
    상기 프로세서가, (i) 상기 제1 내지 제N 매뉴얼 피드백 데이터 중 하나인 제R - R은 1 이상 N 이하의 정수임 - 매뉴얼 피드백 데이터, (ii) 상기 제1 내지 제N 피지컬 피드백 데이터 중 하나인 제R 피지컬 피드백 데이터 및 (iii) 상기 제1 내지 제N 바이오 피드백 데이터 중 하나인 제R 바이오 피드백 데이터를 가중합함으로써 제R 탑승자 피드백 데이터를 획득하는 것을 특징으로 하는 장치.
  19. 삭제
  20. 제11항에 있어서,
    상기 (II) 프로세스는,
    상기 프로세서가, 자신에 상기 특정 동작 지시값이 입력되면, 상기 제1 내지 제N 이벤트, 상기 제1 내지 제N 리액션 데이터 및 상기 제1 내지 제N 탑승자 피드백 데이터를 사용하여 상기 특정 동작 지시값에 대응하는 특정 보상 스코어를 출력하는 것을 특징으로 하는 장치.
KR1020200159366A 2020-11-24 2020-11-24 자율주행 차량으로부터 획득된 운행 데이터 및 자율주행 차량의 탑승자로부터 획득된 피드백 데이터를 이용하여 자율주행 차량의 자율주행 네트워크를 학습할 수 있도록 지원하는 방법 및 장치 KR102467013B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020200159366A KR102467013B1 (ko) 2020-11-24 2020-11-24 자율주행 차량으로부터 획득된 운행 데이터 및 자율주행 차량의 탑승자로부터 획득된 피드백 데이터를 이용하여 자율주행 차량의 자율주행 네트워크를 학습할 수 있도록 지원하는 방법 및 장치

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020200159366A KR102467013B1 (ko) 2020-11-24 2020-11-24 자율주행 차량으로부터 획득된 운행 데이터 및 자율주행 차량의 탑승자로부터 획득된 피드백 데이터를 이용하여 자율주행 차량의 자율주행 네트워크를 학습할 수 있도록 지원하는 방법 및 장치

Publications (2)

Publication Number Publication Date
KR20220072126A KR20220072126A (ko) 2022-06-02
KR102467013B1 true KR102467013B1 (ko) 2022-11-15

Family

ID=81985224

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020200159366A KR102467013B1 (ko) 2020-11-24 2020-11-24 자율주행 차량으로부터 획득된 운행 데이터 및 자율주행 차량의 탑승자로부터 획득된 피드백 데이터를 이용하여 자율주행 차량의 자율주행 네트워크를 학습할 수 있도록 지원하는 방법 및 장치

Country Status (1)

Country Link
KR (1) KR102467013B1 (ko)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019182046A (ja) * 2018-04-04 2019-10-24 株式会社デンソー 自動運転装置、方法及びプログラム、並びに、車両及びシステム
JP2020030688A (ja) * 2018-08-23 2020-02-27 オムロン株式会社 運転制御調整装置および運転制御調整方法
JP2020042642A (ja) * 2018-09-12 2020-03-19 トヨタ自動車株式会社 運転評価装置、運転評価システム、運転評価方法、及び運転評価用コンピュータプログラム
JP2020524632A (ja) * 2017-06-16 2020-08-20 ユーエーティーシー, エルエルシー 自律車両運転イベントに応答して乗車者フィードバックを取得するシステムおよび方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20180060784A (ko) * 2016-11-29 2018-06-07 삼성전자주식회사 비정상 객체 판단 방법 및 장치

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020524632A (ja) * 2017-06-16 2020-08-20 ユーエーティーシー, エルエルシー 自律車両運転イベントに応答して乗車者フィードバックを取得するシステムおよび方法
JP2019182046A (ja) * 2018-04-04 2019-10-24 株式会社デンソー 自動運転装置、方法及びプログラム、並びに、車両及びシステム
JP2020030688A (ja) * 2018-08-23 2020-02-27 オムロン株式会社 運転制御調整装置および運転制御調整方法
JP2020042642A (ja) * 2018-09-12 2020-03-19 トヨタ自動車株式会社 運転評価装置、運転評価システム、運転評価方法、及び運転評価用コンピュータプログラム

Also Published As

Publication number Publication date
KR20220072126A (ko) 2022-06-02

Similar Documents

Publication Publication Date Title
US11636305B2 (en) Situation aware personal assistant
US9539944B2 (en) Systems and methods of improving driver experience
US11040712B2 (en) Information processing apparatus and information processing method
JP6639444B2 (ja) 情報提供装置及び情報提供方法
CN102652250B (zh) 导航装置
JP5353040B2 (ja) 運転シミュレーション装置、運転シミュレーション方法、およびプログラム
CN110843798A (zh) 协调通知到车辆驾驶员的递送以减少注意力分散
US20230303118A1 (en) Affective-cognitive load based digital assistant
CN114502445B (zh) 适应用户驾驶偏好控制自主车辆
JP7328828B2 (ja) 状態推定装置、状態推定プログラムおよび状態推定方法
US11887009B2 (en) Autonomous driving control method, apparatus and device, and readable storage medium
KR102467013B1 (ko) 자율주행 차량으로부터 획득된 운행 데이터 및 자율주행 차량의 탑승자로부터 획득된 피드백 데이터를 이용하여 자율주행 차량의 자율주행 네트워크를 학습할 수 있도록 지원하는 방법 및 장치
CN105579294A (zh) 座位状态校正系统、方法以及程序
US20240034344A1 (en) Detecting and handling driving event sounds during a navigation session
US11891046B2 (en) Information processing method, information processing system, and control device
US20200082820A1 (en) Voice interaction device, control method of voice interaction device, and non-transitory recording medium storing program
JP6657048B2 (ja) 処理結果異常検出装置、処理結果異常検出プログラム、処理結果異常検出方法及び移動体
JPWO2008038375A1 (ja) 情報処理装置、情報処理方法、情報処理プログラムおよびコンピュータに読み取り可能な記録媒体
CN111939559A (zh) 车载语音游戏的控制方法和装置
JP2019207544A (ja) 走行制御装置、走行制御方法、及び走行制御プログラム
CN115129065A (zh) 机器人移动速度确定方法及装置
US10915768B2 (en) Vehicle and method of controlling the same
CN108733962A (zh) 一种无人车的拟人驾驶员控制模型的建立方法和系统
CN107835475A (zh) 智能后视镜的收声模式调整方法及装置
US11498576B2 (en) Onboard device, traveling state estimation method, server device, information processing method, and traveling state estimation system

Legal Events

Date Code Title Description
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant