KR102566603B1 - 자율 주행을 위한 속도 계획 방법, 장치, 설비, 매체 및 차량 - Google Patents

자율 주행을 위한 속도 계획 방법, 장치, 설비, 매체 및 차량 Download PDF

Info

Publication number
KR102566603B1
KR102566603B1 KR1020210098514A KR20210098514A KR102566603B1 KR 102566603 B1 KR102566603 B1 KR 102566603B1 KR 1020210098514 A KR1020210098514 A KR 1020210098514A KR 20210098514 A KR20210098514 A KR 20210098514A KR 102566603 B1 KR102566603 B1 KR 102566603B1
Authority
KR
South Korea
Prior art keywords
state
grid
interpolation
current
autonomous driving
Prior art date
Application number
KR1020210098514A
Other languages
English (en)
Other versions
KR20210101172A (ko
Inventor
웬추앙 친
Original Assignee
바이두 온라인 네트웍 테크놀러지 (베이징) 캄파니 리미티드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 바이두 온라인 네트웍 테크놀러지 (베이징) 캄파니 리미티드 filed Critical 바이두 온라인 네트웍 테크놀러지 (베이징) 캄파니 리미티드
Publication of KR20210101172A publication Critical patent/KR20210101172A/ko
Application granted granted Critical
Publication of KR102566603B1 publication Critical patent/KR102566603B1/ko

Links

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05DSYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
    • G05D1/00Control of position, course or altitude of land, water, air, or space vehicles, e.g. automatic pilot
    • G05D1/02Control of position or course in two dimensions
    • G05D1/021Control of position or course in two dimensions specially adapted to land vehicles
    • G05D1/0212Control of position or course in two dimensions specially adapted to land vehicles with means for defining a desired trajectory
    • G05D1/0223Control of position or course in two dimensions specially adapted to land vehicles with means for defining a desired trajectory involving speed control of the vehicle
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60WCONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
    • B60W60/00Drive control systems specially adapted for autonomous road vehicles
    • B60W60/001Planning or execution of driving tasks
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60RVEHICLES, VEHICLE FITTINGS, OR VEHICLE PARTS, NOT OTHERWISE PROVIDED FOR
    • B60R11/00Arrangements for holding or mounting articles, not otherwise provided for
    • B60R11/02Arrangements for holding or mounting articles, not otherwise provided for for radio sets, television sets, telephones, or the like; Arrangement of controls thereof
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60WCONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
    • B60W30/00Purposes of road vehicle drive control systems not related to the control of a particular sub-unit, e.g. of systems using conjoint control of vehicle sub-units, or advanced driver assistance systems for ensuring comfort, stability and safety or drive control systems for propelling or retarding the vehicle
    • B60W30/14Adaptive cruise control
    • B60W30/143Speed control
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60WCONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
    • B60W40/00Estimation or calculation of non-directly measurable driving parameters for road vehicle drive control systems not related to the control of a particular sub unit, e.g. by using mathematical models
    • B60W40/10Estimation or calculation of non-directly measurable driving parameters for road vehicle drive control systems not related to the control of a particular sub unit, e.g. by using mathematical models related to vehicle motion
    • B60W40/105Speed
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60WCONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
    • B60W40/00Estimation or calculation of non-directly measurable driving parameters for road vehicle drive control systems not related to the control of a particular sub unit, e.g. by using mathematical models
    • B60W40/10Estimation or calculation of non-directly measurable driving parameters for road vehicle drive control systems not related to the control of a particular sub unit, e.g. by using mathematical models related to vehicle motion
    • B60W40/107Longitudinal acceleration
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60WCONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
    • B60W50/00Details of control systems for road vehicle drive control not related to the control of a particular sub-unit, e.g. process diagnostic or vehicle driver interfaces
    • B60W50/08Interaction between the driver and the control system
    • B60W50/14Means for informing the driver, warning the driver or prompting a driver intervention
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05DSYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
    • G05D1/00Control of position, course or altitude of land, water, air, or space vehicles, e.g. automatic pilot
    • G05D1/02Control of position or course in two dimensions
    • G05D1/021Control of position or course in two dimensions specially adapted to land vehicles
    • G05D1/0212Control of position or course in two dimensions specially adapted to land vehicles with means for defining a desired trajectory
    • G05D1/0214Control of position or course in two dimensions specially adapted to land vehicles with means for defining a desired trajectory in accordance with safety or protection criteria, e.g. avoiding hazardous areas
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05DSYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
    • G05D1/00Control of position, course or altitude of land, water, air, or space vehicles, e.g. automatic pilot
    • G05D1/02Control of position or course in two dimensions
    • G05D1/021Control of position or course in two dimensions specially adapted to land vehicles
    • G05D1/0212Control of position or course in two dimensions specially adapted to land vehicles with means for defining a desired trajectory
    • G05D1/0221Control of position or course in two dimensions specially adapted to land vehicles with means for defining a desired trajectory involving a learning process
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05DSYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
    • G05D1/00Control of position, course or altitude of land, water, air, or space vehicles, e.g. automatic pilot
    • G05D1/02Control of position or course in two dimensions
    • G05D1/021Control of position or course in two dimensions specially adapted to land vehicles
    • G05D1/0276Control of position or course in two dimensions specially adapted to land vehicles using signals provided by a source external to the vehicle
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/004Artificial life, i.e. computing arrangements simulating life
    • G06N3/006Artificial life, i.e. computing arrangements simulating life based on simulated virtual individual or collective life forms, e.g. social simulations or particle swarm optimisation [PSO]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60WCONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
    • B60W50/00Details of control systems for road vehicle drive control not related to the control of a particular sub-unit, e.g. process diagnostic or vehicle driver interfaces
    • B60W2050/0001Details of the control system
    • B60W2050/0002Automatic control, details of type of controller or control system architecture
    • B60W2050/0004In digital systems, e.g. discrete-time systems involving sampling
    • B60W2050/0005Processor details or data handling, e.g. memory registers or chip architecture
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60WCONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
    • B60W50/00Details of control systems for road vehicle drive control not related to the control of a particular sub-unit, e.g. process diagnostic or vehicle driver interfaces
    • B60W2050/0001Details of the control system
    • B60W2050/0019Control system elements or transfer functions
    • B60W2050/0026Lookup tables or parameter maps
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60WCONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
    • B60W50/00Details of control systems for road vehicle drive control not related to the control of a particular sub-unit, e.g. process diagnostic or vehicle driver interfaces
    • B60W50/08Interaction between the driver and the control system
    • B60W50/14Means for informing the driver, warning the driver or prompting a driver intervention
    • B60W2050/146Display means
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60WCONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
    • B60W2520/00Input parameters relating to overall vehicle dynamics
    • B60W2520/10Longitudinal speed
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60WCONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
    • B60W2520/00Input parameters relating to overall vehicle dynamics
    • B60W2520/10Longitudinal speed
    • B60W2520/105Longitudinal acceleration
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60WCONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
    • B60W2530/00Input parameters relating to vehicle conditions or values, not covered by groups B60W2510/00 or B60W2520/00
    • B60W2530/10Weight
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60WCONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
    • B60W2530/00Input parameters relating to vehicle conditions or values, not covered by groups B60W2510/00 or B60W2520/00
    • B60W2530/18Distance travelled
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60WCONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
    • B60W2720/00Output or target parameters relating to overall vehicle dynamics
    • B60W2720/10Longitudinal speed
    • B60W2720/106Longitudinal acceleration

Landscapes

  • Engineering & Computer Science (AREA)
  • Automation & Control Theory (AREA)
  • Physics & Mathematics (AREA)
  • Mechanical Engineering (AREA)
  • Transportation (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Remote Sensing (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Aviation & Aerospace Engineering (AREA)
  • Human Computer Interaction (AREA)
  • Biomedical Technology (AREA)
  • Computational Linguistics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Medical Informatics (AREA)
  • Traffic Control Systems (AREA)
  • Control Of Driving Devices And Active Controlling Of Vehicle (AREA)

Abstract

본 발명은 자율 주행을 위한 속도 계획 방법, 장치, 설비, 매체를 개시하고, 자율 주행 및 딥 러닝 등 인공 지능 기술에 관한 것이다. 구체적인 구현 방안은, 차량의 현재 상태를 획득하며, 상기 현재 상태는 적어도 나머지 주행 거리와 현재 속도를 포함하고, 상기 현재 상태 및 사전 결정된 상태표에 따라, 동작을 보간하여, 상기 현재 상태의 목표 동작을 획득하며, 상기 상태표는 학습 강화 방법에 기반하여 결정되고, 복수의 상태와 각 상태에서 실행되는 동작을 포함하며, 상기 동작은 적어도 가속도를 포함하는 것이다. 본 발명은 룩업 테이블의 방식을 사용하여 신경망을 대체하며, 우선 오프라인으로 상태표를 결정하고, 그 다음 온라인 조회 방식을 통해 현재 상태의 목표 동작을 결정할 수 있으므로, 대량의 컴퓨팅 자원을 점용하지 않는 전제하에, 속도 계획의 글로벌 최적해를 획득하도록 확보할 수 있다.

Description

자율 주행을 위한 속도 계획 방법, 장치, 설비, 매체 및 차량{SPEED PLANNING METHOD, DEVICE, EQUIPMENT, MEDIUM AND VEHICLE FOR AUTONOMOUS DRIVING}
본 발명은 인공 지능 기술 분야, 특히는 자율 주행 및 딥 러닝 기술에 관한 것으로, 구체적으로 자율 주행을 위한 속도 계획 방법, 장치, 설비, 매체 및 차량에 관한 것이다.
자율 주행 분야에서, 자율 주행 차량에 대해 속도 계획을 수행해야 한다. 종래 기술에서 속도 계획 알고리즘은 일반적으로 단일 시점 제어와 다중 시점 계획으로 구분된다.
여기서, 단일 시점 제어는 현재 시점의 거리 및 속도 정보에 따라, 도달해야 하는 원하는 속도를 계산하는 것을 의미한다. 그러나, 해당 방법은 속도의 글로벌 최적해(optimum solution)를 확보할 수 없고, 종점 근처에서 과도하게 제동하는 등 잠재적인 위험이 존재한다. 다중 시점 계획 방법은 최적화 알고리즘, 또는 온라인 트랙 스크리닝 등 알고리즘을 사용해야 하지만, 이러한 알고리즘은 계산량이 많고, 계산 시간이 제한되는 상황이 존재하며, 마찬가지로, 속도의 글로벌 최적해를 획득하는 것을 확보할 수 없게 된다.
본 발명은 자율 주행을 위한 속도 계획 방법, 장치, 설비, 매체 및 차량을 제공하여, 대량의 컴퓨팅 자원을 점용하지 않는 전제하에, 속도 계획의 글로벌 최적해를 획득하도록 확보한다.
제1 측면으로, 본 발명은 자율 주행을 위한 속도 계획 방법을 제공하고, 상기 방법은, 차량의 현재 상태를 획득하는 단계 - 상기 현재 상태는 적어도 나머지 주행 거리와 현재 속도를 포함함-, 상기 현재 상태 및 기결정된 상태표에 따라, 동작을 보간하여, 상기 현재 상태의 목표 동작을 획득하는 단계 - 상기 상태표는 학습 강화 방법에 기반하여 결정되고, 복수의 상태와 각 상태에서 실행되는 동작을 포함하며, 상기 동작은 적어도 가속도를 포함함 - 를 포함한다.
제2 측면으로, 본 발명은 자율 주행을 위한 속도 계획 장치를 더 제공하고, 상기 장치는, 차량의 현재 상태를 획득하는 상태 획득 모듈 - 상기 현재 상태는 적어도 나머지 주행 거리와 현재 속도를 포함함-, 상기 현재 상태 및 기결정된 상태표에 따라, 동작을 보간하여, 상기 현재 상태의 목표 동작을 획득하는 보간 모듈 - 상기 상태표는 학습 강화 방법에 기반하여 결정되고, 복수의 상태와 각 상태에서 실행되는 동작을 포함하며, 상기 동작은 적어도 가속도를 포함함 - 을 포함한다.
제3 측면으로, 본 발명은 전자 설비를 더 제공하고, 상기 설비는, 적어도 하나의 프로세서 및 상기 적어도 하나의 프로세서와 통신 연결하는 메모리를 포함하며, 상기 메모리는 상기 적어도 하나의 프로세서에 의해 실행 가능한 명령을 저장하고, 상기 명령은 상기 적어도 하나의 프로세서에 의해 실행되어, 상기 적어도 하나의 프로세서가 본 발명의 임의의 실시예에 따른 자율 주행을 위한 속도 계획 방법을 실행할 수 있도록 한다.
제4 측면으로, 본 발명은 컴퓨터 명령을 저장하는 비일시적 컴퓨터 판독가능 저장매체를 더 제공하고, 상기 컴퓨터 명령은 상기 컴퓨터가 본 출원의 임의의 실시예에 따른 자율 주행을 위한 속도 계획 방법을 수행하도록 한다.
제5 측면으로, 본 발명은 차량을 더 제공하고, 상기 차량은 차체를 포함하며, 상기 차체에는 본 발명의 임의의 실시예에 따른 전자 설비가 설치된다.
본 발명의 기술 방안에 따라, 룩업 테이블의 방식을 사용하여 신경망을 대체하며, 우선 학습 강화 방법에 기반하여 오프라인으로 상태표를 결정하며, 그 다음 온라인 조회의 방식을 통해 현재 상태의 목표 동작을 결정할 수 있으므로, 대량의 컴퓨팅 자원을 점용하지 않는 전제하에, 속도 계획의 글로벌 최적해를 획득하도록 확보할 수 있다.
이해해야 할 것은, 해당 부분에서 설명된 내용은 본 발명의 핵심 또는 중요한 특징을 식별하기 위한 것이 아니며, 본 발명의 범위를 제한하는데 사용되지 않는다. 본 발명의 기타 특징은 다음의 설명을 통해 쉽게 이해될 것이며, 상기 선택 가능한 방식이 구비하는 기타 효과는 아래에서 구체적 실시예를 결합하여 설명한다.
도면은 본 발명을 보다 잘 이해하는 데 사용되며, 본 발명에 대한 제한을 구성하지 않는다. 여기서,
도 1은 본 발명의 실시예에 따른 자율 주행을 위한 속도 계획 방법의 흐름 개략도이다.
도 2는 본 발명의 실시예에 따른 자율 주행을 위한 속도 계획 방법의 흐름 개략도이다.
도 3은 본 발명의 실시예에 따른 자율 주행을 위한 속도 계획 장치의 구조 개략도이다.
도 4는 본 발명의 실시예의 자율 주행을 위한 속도 계획 방법을 구현하기 위한 전자 설비의 블록도이다.
이하 도면을 결합하여 본 발명의 예시적인 실시예를 설명하며, 이해를 돕기 위해 본 발명의 실시예의 각 세부 사항을 포함하나, 이는 단지 예시적인 것으로 간주해야 한다. 따라서, 본 분야의 당업자는, 본 발명의 범위 및 사상을 벗어나지 않는 한, 여기에 설명된 실시예에 대해 여러 가지 변경 및 수정을 진행할 수 있음을 인식해야 한다. 마찬가지로, 명확성과 간결성을 위해, 이하의 설명에서는 공지된 기능 및 구조에 대한 설명을 생략한다.
도 1은 본 발명의 실시예에 따른 자율 주행을 위한 속도 계획 방법의 흐름 개략도이고, 본 실시예는 자율 주행 설비를 위해 운행 가속도를 계획하는 것과 같은 속도 계획을 제공하는 상황에 적용될 수 있으며, 자율 주행 및 딥 러닝과 같은 인공 지능 기술에 관한 것이다. 해당 방법은 자율 주행을 위한 속도 계획 장치에 의해 실행될 수 있으며, 해당 장치는 소프트웨어 및/또는 하드웨어로 구현되고, 바람직하게는 컴퓨터 설비와 같은 전자 설비에 구성된다. 도 1에 도시된 바와 같이, 해당 방법은 구체적으로 다음의 단계를 포함한다.
단계(S101)에서, 차량의 현재 상태를 획득하며, 여기서 현재 상태는 적어도 나머지 주행 거리와 현재 속도를 포함한다.
자율 주행의 속도 계획은 일반적으로 가속도에 대한 계획을 의미할 수 있으며, 글로벌 계획의 관점에서 가속도 계획 수행시, 차량의 현재 상태, 즉 나머지 주행 거리와 현재 속도에 의거하며, 상이한 상태에 대응하는 속도 계획 또한 상이하다.
여기서, 나머지 주행 거리는 자율 주행 차량이 전방의 고정 포인트(목적지)까지 주행하는 거리일 수 있으며, 이때, 상태에서의 속도는 절대 속도이며, 즉 자율 주행 차량의 현재 주행 속도이다. 또한, 자율 주행 차량 전방의 장애물에 대해 감지하는 기초상에, 나머지 주행 거리는 전방의 장애물과의 상대적인 거리일 수도 있으며, 전방의 장애물 또한 주행중인 차량인 경우, 이때 상태에서의 속도는 상대적인 속도이며, 즉 전방에 나타난 장애물 차량인 경우, 자율 주행 차량과 전방에 나타난 장애물 차량 사이의 상대적인 속도이다. 따라서, 구체적인 응용 시나리오가 상이함에 따라, 자율 주행 차량의 현재 상태를 유연하게 결정할 수 있다.
또한, 상태는 도로의 구배(gradient)라는 하나의 디멘션을 더 포함할 수도 있으며, 나머지 주행 거리, 현재 속도 및 구배에 따라 추후의 룩업 테이블을 수행하여, 구배를 구비하는 도로에 적용됨으로써, 구배를 구비하는 도로에서 정확한 속도 계획을 구현할 수 있다. 물론, 응용 시나리오가 상이함에 따라, 더 복잡한 도로 상황에서 주행할 때, 실제상황에 따라 상태에 기타 디멘션을 추가할 수도 있으며, 본 발명의 실시예는 이에 대해 한정하지 않는다.
단계(S102), 현재 상태 및 사전 결정된 상태표에 따라, 동작을 보간하여, 현재 상태의 목표 동작을 획득한다. 여기서, 상태표는 학습 강화 방법에 기반하여 결정되고, 복수의 상태와 각 상태에서 실행되는 동작을 포함하며, 동작은 적어도 가속도를 포함한다.
구체적으로, 상태표는 미리 오프라인으로 결정될 수 있으며, 이로써, 실시간 속도 계획을 온라인으로 수행할 때, 컴퓨팅 자원을 과다 점용하는 것을 방지할 수 있다. 상태표에는 복수의 상태와 각 상태에서 실행되는 동작이 포함되며, 즉, 학습 강화 방법에 기반하여, 우선 글로벌 계획에서 상이한 상태에서 실행되는 최적의 동작을 결정하고, 상태표를 형성하며, 해당 동작은 가속도를 포함할 수 있다. 이로써, 온라인에서 실시간으로 룩업 테이블의 방식을 통해 현재 상태에서 선택해야 하는 최적의 동작을 결정할 수 있다.
설명해야 할 것은, 실제시나리오에서의 상태는 연속적이나, 오프라인으로 결정된 상태표 중의 각 상태는 이산적이므로 보간 방식을 통해 목표 동작을 더 결정해야 한다. 구체적으로, 우선 룩업 테이블을 통해, 상태표 중에서의 현재 상태의 위치를 결정하고, 그 다음 현재 상태에 인접한 상태에 대응하는 동작을 결정하며, 마지막으로, 이러한 동작을 보간하여 현재 상태에 대응하는 목표 동작을 결정한다.
따라서, 본 발명의 실시예는 전통적인 신경망을 대체하고, 학습 강화 방법에 기반하여 오프라인으로 상태표를 계산하며, 온라인으로 룩업 테이블을 통해 속도 계획을 수행한다. 이로써, 컴퓨팅 자원을 저감할뿐만 아니라, 불완전한 신경망 훈련으로 인해 예측 결과를 예측할 수 없는 문제를 방지한다. 아울러, 가시적인 상태표로 인해, 실제 응용에서 해석성이 강하여, 기술자가 수시로 수정하는데 편리하고, 제어성과 설계성이 비교적 강하며, 적용 범위가 보다 넓다.
본 발명의 실시예의 기술 방안은, 우선 학습 강화 방법에 기반하여 글로벌 계획의 상태표를 오프라인으로 결정하고, 룩업 테이블의 방식을 사용하여 전통적인 방법에서의 신경망을 대체하며, 그 다음 온라인으로 룩업 테이블을 수행하고 동작을 보간하는 방식을 통해 현재 상태의 목표 동작을 결정할 수 있다. 따라서, 컴퓨팅 자원을 과다로 점용하지 않을 뿐만 아니라, 속도 계획의 글로벌 최적해를 획득하도록 확보할 수 있으며, 동시에 해석성을 확보하고, 대량 생산이 가능하다.
도 2는 본 발명의 실시예에 따른 자율 주행을 위한 속도 계획 방법의 흐름 개략도이고, 본 발명의 실시예는 상술된 실시예의 기초 상에 추가로 최적화를 수행한다. 도 2에 도시된 바와 같이, 해당 방법은 구체적으로 다음의 단계를 포함한다.
단계(S201)에서, 이산화된 상태를 기반으로 상태 그리드를 생성한다. 여기서, 상태 그리드에는 복수의 서브 그리드가 포함되며, 각 서브 그리드의 정점은 하나의 상태를 표시한다.
구체적으로, 거리 경계와 속도 경계를 미리 획득하고, 그 다음 해당 경계에 의해 구성된 거리 구간과 속도 구간 내에서, 거리와 속도를 각각 이산화하고, 이러한 이산화된 거리와 속도로 복수의 이산화된 상태를 구성하며, 그 다음 이러한 이산화된 상태로 상태 그리드를 구성한다. 예를 들어, 수평축은 거리를 표시하고, 수직축은 속도를 표시하며, 이산화된 후 수평축과 수직축 상의 이산화된 점에 따라 하나의 그리드를 구성할 수 있으며, 그리드 내의 각 점은 하나의 상태를 표시할 수 있고, 인접한 4개의 점마다 하나의 서브 그리드를 구성할 수 있다.
또한, 실제 사용에서, 알고리즘 계산의 편의를 위해, 상태 그리드는 2차원 상태의 매트릭스로 처리될 수 있으며, 하나의 디멘션은 거리이고, 다른 하나의 디멘션은 속도이다.
단계(S202)에서, 이산화된 동작에 기반하여, 상태 그리드 중의 상태를 보간하여, 상태 보간 정보를 획득한다. 여기서, 상태 보간 정보는 상태 그리드 중의 상태에 동작을 인가하여 획득한, 다음 상태를 표시한다.
구체적으로, 상기와 같이 동작 경계를 미리 획득할 수 있으며, 해당 동작 경계에 대응하는 동작 구간 내에서 동작을 이산화하여, 복수의 이산화된 동작을 획득한다. 이후, 상태 그리드 중의 각 이산 상태에 모든 이산 동작을 각각 인가하며, 이로써, 인가된 각 이산 동작에 대해, 상태 그리드 중 모든 상태의 다음 상태를 획득할 수 있다. 해당 다음 상태는, 상태 그리드 중의 상태를 보간하여, 상태 보간 정보를 결정하는 방식을 통해 기록되므로, 상태 보간 정보는 상태 그리드 중의 상태에 동작을 인가하여 획득한, 다음 상태를 표시할 수 있으며, 각 이산 동작을 인가한 후, 모두 대응되게 상태 보간 정보가 기록된다. 또한, 초기 이산화 상태 그리드에 대해 보간을 수행하면, 보다 연속적인 상태를 획득할 수 있으며, 추후 기초 상에 값 반복 알고리즘(Value Iteration Algorithm)을 추가로 수행하여 최적의 동작을 결정함으로써, 계획된 동작의 연속성을 확보하고, 나아가, 속도 계획의 정확성을 확보할 수 있다.
일 실시 형태에서, 이산화된 동작에 기반하여, 상태 그리드 중의 상태에 대해 무게중심 보간을 수행하여, 상태 보간 정보를 획득한다. 무게중심 보간은 보간 다항식을 계산할 필요가 없으며, 계산 복잡도가 낮고, 보간 정확도가 높으며, 보간 연속성을 확보할 수 있다. 예를 들어, 특정 동작을 인가하여 획득한 다음 상태는, 일반적으로 상태 그리드 내 또는 상태 그리드 상에 놓이며, 즉 상태 그리드 중의 서브 그리드 내 또는 서브 그리드 상에 놓인다. 하나의 서브 그리드에는 4개의 정점이 있으며, 따라서, 무게중심 보간에 기반하여, 왼쪽 상부의 3개의 정점을 선택하고, 해당 3개의 정점의 상태에 따라 무게중심 보간을 수행하여, 다음 상태의 상태 보간 정보를 획득할 수 있으며, 3개의 정점의 상태가 전체 상태에서의 인덱스 및 다음 상태의 점과 3개의 정점 사이의 위치 관계를 상태 보간 정보에 기록한다.
단계(S203)에서, 값 반복 알고리즘을 사용하여, 기설정된 최적화 목표에 대응하는 목표 비용 함수에 따라, 상태 그리드 중의 상태 및 상태 보간 정보가 표시하는 상태를 기반으로 값 반복을 수행하여, 상태 그리드 중 각 상태에 대응하는 계획 동작을 결정한다.
여기서, 값 반복의 최적화 목표는 반복을 통해 상태 그리드에서 이산 상태에 대응하는 최적의 동작을 획득하는 것을 의미한다. 목표 비용 함수는 상태 비용 함수와 동작 비용 함수를 포함하며, 예를 들어, 최종 목표 비용 함수를 획득하기 위해, 상태 비용 함수와 동작 비용 함수를 가중 합산할 수 있다. 또한, 비용 함수의 설정은 2차로 한정되지 않고, 고차 또는 tanh와 같은 비선형 비용 함수일 수 있다.
전체적으로, 반복 과정에서, 모든 이산 동작 a(n)을 각 이산 상태 s(n)에 인가하여, 모든 상태의 다음 상태 s(n+1)을 획득하며, 목표 비용 함수에 따라 다음 상태의 평가값을 계산하며, 그 다음 반복을 통해, 모든 평가값 중에서 최적값(예를 들어, 최대값)에 대응하는 동작 a(n+1)을 선택하며, a(n)은 a(n+1)로 대체 및 업데이트된다. 두 번의 반복에서 평가값의 차이가 1e-6보다 작으면, 최적의 평가값과 대응하는 동작을 획득한 것으로 간주한다. 값 반복에 대한 구체적인 알고리즘 및 과정은, 여기서 더 이상 구체적으로 반복하여 설명하지 않는다.
단계(S204)에서, 상태 그리드 중의 각 상태 및 그에 대응하는 계획 동작을 상태표로 한다. 값 반복 알고리즘을 통해, 글로벌 계획의 동작을 획득하며, 즉 상태 그리드 중 각 상태에서 실행되는 최적의 동작을 획득할 수 있다.
단계(S205)에서, 차량의 현재 상태를 획득하며, 현재 상태는 적어도 나머지 주행 거리와 현재 속도를 포함한다.
단계(S206)에서, 기결정된 상태표에서 현재 상태가 속하는 상태 범위를 결정한다.
단계(S207)에서, 상태 범위 내의 각 상태에 대응하는 동작에 대해 무게중심 보간을 수행하여, 현재 상태의 목표 동작을 획득한다.
상태표 중의 상태와 동작은 이산적이나, 실제 응용에서의 상태는 연속적이므로, 동작을 보간해야만 각 실시간 상태에 대응하는 목표 동작을 결정할 수 있다. 구체적으로, 룩업 테이블을 통해 상태표 중에서의 현재 상태의 위치를 결정할 수 있고, 예를 들어, 현재 상태가 상태표 중의 어느 서브 그리드에 놓이는지를 결정하고, 해당 서브 그리드의 4개의 정점에 따라 현재 상태가 속하는 상태 범위를 결정할 수 있다. 이후, 현재 상태가 해당 서브 그리드 중에서의 위치와 해당 서브 그리드 중 왼쪽 상부의 3개의 정점에 대응하는 동작에 따라, 동작에 대해 무게중심 보간을 수행하여, 현재 상태에서 최적의 목표 동작을 획득한다.
본 발명의 실시예의 기술 방안은, 네트워크 모델에 기반하는 전통적인 학습 강화 방법을 포기하고, 룩업 테이블의 방식을 사용하여 신경망을 대체하며, 오프라인으로 상태표를 계산하고, 온라인으로 룩업 테이블 방식을 통해 속도 계획을 수행할 수 있다. 따라서, 대량의 컴퓨팅 자원을 점용하지 않는 전제하에, 속도 계획의 글로벌 최적해를 획득하는 것을 확보하고, 동시에 해석성을 확보하고, 대량 생산이 가능한 것을 구현한다. 또한, 값 반복 알고리즘을 실행할 때, 초기의 상태 그리드를 보간하여, 보다 연속적인 상태를 획득하고, 이 기초 상에 값 반복 알고리즘을 추가로 수행하여 최적의 동작을 결정함으로써, 계획된 동작의 연속성을 확보하고, 속도 계획의 정확성을 확보할 수 있다.
도 3은 본 출원의 실시예에 따른 자율 주행을 위한 속도 계획 장치의 구조 구조 개략도이고, 본 실시예는 자율 주행 설비를 위해 운행 가속도를 계획하는 것과 같은 속도 계획을 제공하는 상황에 적용될 수 있으며, 자율 주행 및 딥 러닝과 같은 인공 지능 기술에 관한 것이다. 해당 장치는 본 발명의 임의의 실시예에 따른 자율 주행을 위한 속도 계획 방법을 구현할 수 있다.
도 3에 도시된 바와 같이, 해당 장치(300)는 구체적으로, 차량의 현재 상태를 획득하는 상태 획득 모듈(301) - 여기서, 현재 상태는 적어도 나머지 주행 거리와 현재 속도를 포함함 -, 현재 상태 및 사전 결정된 상태표에 따라, 동작을 보간하여, 현재 상태의 목표 동작을 획득하는 보간 모듈(302) - 여기서, 상태표는 학습 강화 방법에 기반하여 결정되고, 복수의 상태와 각 상태에서 실행되는 동작을 포함하며, 동작은 적어도 가속도를 포함함 - 을 포함한다.
선택적으로, 장치는 상태표 결정 모듈을 더 포함하고, 상태표 결정 모듈은 구체적으로, 이산화된 상태에 기반하여 상태 그리드를 생성하는 상태 그리드 생성 유닛 - 여기서, 상태 그리드에는 복수의 서브 그리드가 포함되며, 각 서브 그리드의 정점은 하나의 상태를 표시함-, 이산화된 동작에 기반하여, 상태 그리드 중의 상태를 보간하여, 상태 보간 정보를 획득하는 상태 보간 유닛 - 여기서, 상태 보간 정보는 상태 그리드 중의 상태에 동작을 인가하여 획득한, 다음 상태를 표시함-, 값 반복 알고리즘을 사용하여, 사전 설정된 최적화 목표에 대응하는 목표 비용 함수에 따라, 상태 그리드 중의 상태 및 상태 보간 정보가 표시하는 상태를 기반으로 값 반복을 수행하여, 상태 그리드 중 각 상태에 대응하는 계획 동작을 결정하는 값 반복 유닛, 상태 그리드 중의 각 상태 및 그에 대응하는 계획 동작을 상태표로 하는 상태표 결정 유닛을 포함한다.
선택적으로, 상태 보간 유닛은 구체적으로, 이산화된 동작에 기반하여, 상태 그리드 중의 상태에 대해 무게중심 보간을 수행하여, 상태 보간 정보를 획득하는데 사용된다.
선택적으로, 목표 비용 함수에는 상태 비용 함수와 동작 비용 함수가 포함된다.
선택적으로, 보간 모듈(302)은, 사전 결정된 상태표에서 현재 상태가 속하는 상태 범위를 결정하는 룩업 테이블 유닛, 상태 범위 내의 각 상태에 대응하는 동작에 대해 무게중심 보간을 수행하여, 현재 상태의 목표 동작을 획득하는 동작 보간 유닛을 포함한다.
본 발명의 실시예에서 제공하는 자율 주행을 위한 속도 계획 장치(300)는 본 발명의 임의의 실시예에서 제공하는 자율 주행을 위한 속도 계획 방법을 실행할 수 있으며, 실행 방법에 상응하는 기능 모듈과 유익한 효과를 구비한다. 본 실시예에서 상세하게 설명되지 않은 내용에 대해서는, 본 발명의 임의의 방법 실시예의 설명을 참조할 수 있다.
본 발명의 실시예에 따라, 본 발명은 전자 설비 및 판독가능 저장매체를 더 제공한다.
도 4는 도시된 바와 같이, 본 발명의 실시예의 자율 주행을 위한 속도 계획 방법에 따른 전자 설비의 블록도이다. 전자 설비는 여러 가지 형태의 디지털 컴퓨터를 표시하며, 예를 들어, 랩톱 컴퓨터, 데스크톱 컴퓨터, 워크스테이션, 개인용 정보 단말기(Personal Digital Assistant), 서버, 블레이드 서버, 메인프레임 컴퓨터 및 기타 적합한 컴퓨터를 표시한다. 전자 설비는 또한 여러 가지 형태의 모바일 장치를 표시할 수 있으며, 예를 들어, 개인 휴대 단말기, 셀 폰, 스마트 폰, 웨어러블 설비 및 기타 유사한 컴퓨팅 장치를 표시할 수 있다. 본문에 서술된 부재, 이들의 연결과 관계, 및 이들의 기능은 단지 예시적인 것일 뿐, 본문에서 설명되는 및/또는 요구되는 본 출원의 구현을 제한하지 않는다.
도 4에 도시된 바와 같이, 해당 전자 설비는, 하나 또는 복수의 프로세서(401), 메모리(402), 및 각각의 부재를 연결하기 위한 인터페이스를 포함하며, 인터페이스는 고속 인터페이스 및 저속 인터페이스를 포함한다. 각각의 부재는 상이한 버스를 이용하여 서로 연결되며, 공공 메인보드 상에 설치되거나 수요에 따라 기타 방식으로 설치될 수 있다. 프로세서는 전자 설비 내에서 실행되는 명령에 대해 처리할 수 있으며, 명령은 외부 입력/출력 장치(예를 들면, 인터페이스에 연결된 디스플레이 설비)상에 GUI의 그래픽 정보를 디스플레이하기 위해 메모리 중 또는 메모리 상에 저장된 명령을 포함한다. 기타 실시 형태에서, 필요한 경우, 복수의 프로세서 및/또는 복수의 버스는 복수의 메모리와 함께 사용될 수 있다. 마찬가지로, 복수의 전자 설비가 연결될 수 있으며, 각각의 설비는, 예를 들면, 서버 어레이, 하나의 그룹의 블레이드 서버 또는 멀티 프로세서 시스템으로서, 일부분의 필요한 동작을 제공한다. 도 4에서는 하나의 프로세서(401)로 예를 들어 설명한다.
메모리(402)는 본 발명에서 제공하는 비일시적 컴퓨터 판독가능 저장매체이다. 여기서, 메모리는 적어도 하나의 프로세서에 의해 실행 가능한 명령을 저장하여, 적어도 하나의 프로세서가 본 발명에서 제공하는 자율 주행을 위한 속도 계획 방법을 실행하도록 한다. 본 발명의 비일시적 컴퓨터 판독가능 저장매체에는 컴퓨터 명령이 저장되며, 해당 컴퓨터 명령은 컴퓨터가 본 출원에서 제공하는 자율 주행을 위한 속도 계획 방법을 실행하도록 한다.
메모리(402)는 비일시적 컴퓨터 판독가능 저장매체로서, 비일시적 소프트웨어 프로그램, 비일시적 컴퓨터 실행가능 프로그램 및 모듈을 저장하는 데 사용되며, 예를 들어, 본 발명의 실시예에서의 자율 주행을 위한 속도 계획 방법에 대응되는 프로그램 명령/모듈(예를 들어, 도 3에 도시된 상태 획득 모듈(301) 및 보간 모듈(302))을 저장하는 데 사용된다. 프로세서(401)는 메모리(402)에 저장된 비일시적 소프트웨어 프로그램, 명령 및 모듈을 실행하여, 서버의 여러 가지 기능적 응용 및 데이터 처리를 수행하여, 방법 실시예에서의 자율 주행을 위한 속도 계획 방법을 구현한다.
메모리(402)는 프로그램 저장 영역과 데이터 저장 영역을 포함할 수 있으며, 여기서, 프로그램 저장 영역은 운영 시스템(operation system), 적어도 하나의 기능에 필요한 애플리케이션을 저장할 수 있고, 데이터 저장 영역은 본 발명의 실시예의 자율 주행을 위한 속도 계획 방법을 구현하기 위한 전자 설비의 사용에 따라 생성된 데이터 등을 저장할 수 있다. 또한, 메모리(402)는 고속 랜덤 액세스 메모리를 포함할 수 있고, 비일시적 메모리를 더 포함할 수 있으며, 예를 들어, 적어도 하나의 자기 디스크 저장 소자, 플래시 저장 소자 또는 기타 비일시적인 솔리드 스테이트 저장 소자를 포함할 수 있다. 일부 실시예에서, 메모리(402)는 프로세서(401)에 대해 원격으로 설치된 메모리를 선택적으로 포함하고, 이러한 원격 메모리는 네트워크를 통해 본 출원의 실시예의 자율 주행을 위한 속도 계획 방법을 구현하는 전자 설비에 연결될 수 있다. 네트워크의 예시로는 인터넷, 인트라넷, 근거리 통신망, 이동 통신망 및 이들의 조합이 포함되지만 이에 제한되지 않는다.
본 발명의 실시예의 자율 주행을 위한 속도 계획 방법을 구현하는 전자 설비는, 입력 장치(403) 및 출력 장치(404)를 더 포함할 수 있다. 프로세서(401), 메모리(402), 입력 장치(403) 및 출력 장치(404)는 버스 또는 기타 방식을 통해 연결될 수 있으며, 도 4에서는 버스를 통해 연결되는 것을 예로 들어 설명한다.
입력 장치(403)는 입력되는 디지털 또는 문자(Character) 정보를 수신하고, 본 발명의 실시예의 자율 주행을 위한 속도 계획 방법을 구현하는 전자 설비의 사용자 설정 및 기능 제어와 관련된 키 신호 입력을 생성할 수 있으며, 예를 들어, 입력 장치(403)는 터치 스크린, 키패드, 마우스, 트랙 패드, 터치 패드, 포인팅 스틱, 하나 또는 복수의 마우스 버튼, 트랙볼, 조작레버 등 입력 장치이다. 출력 장치(404)는 디스플레이 설비, 보조 조명 장치(예를 들어, LED) 및 햅틱 피드백 장치(haptic feedback device)(예를 들어, 진동 모터) 등을 포함할 수 있다. 해당 디스플레이 설비는 액정 디스플레이 장치(LCD), 발광 다이오드(LED) 디스플레이 장치 및 플라즈마 디스플레이 장치를 포함할 수 있지만 이에 제한되지 않는다. 일부 실시예에서, 디스플레이 설비는 터치스크린일 수 있다.
여기서 설명된 시스템 및 기술의 여러 가지 실시 형태는 디지털 전자 회로 시스템, 집적 회로 시스템, 주문형 ASIC(주문형 집적 회로), 컴퓨터 하드웨어, 펌웨어, 소프트웨어 및/또는 이들의 조합에서 구현될 수 있다. 이러한 여러 가지 실시 형태는, 하나 또는 복수의 컴퓨터 프로그램에서 구현되는 방식을 포함할 수 있으며, 해당 하나 또는 복수의 컴퓨터 프로그램은 적어도 하나의 프로그램 가능한 프로세서를 포함하는 프로그램 가능한 시스템에서 실행 및/또는 해석(interpretating)될 수 있으며, 해당 프로그램 가능한 프로세서는 전용 또는 범용 프로그램 가능한 프로세서일 수 있고, 저장 시스템, 적어도 하나의 입력 장치 및 적어도 하나의 출력 장치로부터 데이터 및 명령을 수신할 수 있으며, 데이터 및 명령을 저장 시스템, 적어도 하나의 입력 장치 및 적어도 하나의 출력 장치로 전송할 수 있다.
이러한 컴퓨팅 프로그램(프로그램, 소프트웨어, 소프트웨어 애플리케이션 또는 코드라고도 함)은 프로그램 가능한 프로세서의 기계 명령을 포함하고, 이러한 컴퓨팅 프로그램을 실행하기 위해 고급 프로세스 및/또는 객체 지향 프로그램 언어 및/또는 어셈블리/기계 언어를 이용할 수 있다. 본문에서 사용되는 용어 "기계 판독가능 매체" 및 "컴퓨터 판독가능 매체"는 기계 명령 및/또는 데이터를 프로그램 가능한 프로세서에 제공하기 위한 임의의 컴퓨터 프로그램 제품, 설비, 및/또는 장치(예를 들어, 디스크, 콤팩트디스크, 메모리, 프로그램 가능한 로직 장치(PLD))를 나타내며, 기계 판독가능 신호로서 기계 명령을 수신하는 기계 판독가능 매체를 포함한다. 용어 "기계 판독가능 신호"는 기계 명령 및/또는 데이터를 프로그램 가능한 프로세서에 제공하기 위한 임의의 신호를 나타낸다.
사용자와의 상호 작용을 제공하기 위해, 여기서 서술된 시스템 및 기술은 컴퓨터 상에서 구현될 수 있으며, 해당 컴퓨터는, 사용자에게 정보를 디스플레이 하기 위한 디스플레이 장치(예를 들어, 음극선관(CRT) 또는 액정디스플레이(LCD) 모니터) 및 키보드와 포인팅 장치(예를 들어, 마우스 또는 트랙볼)를 구비하며, 사용자는 해당 키보드 및 해당 포인팅 장치를 통해 컴퓨터에 입력을 제공할 수 있다. 기타 유형의 장치도 사용자와의 상호 작용을 제공할 수 있는데, 예를 들어, 사용자에게 제공되는 피드백은 임의의 형태의 센싱 피드백(예를 들어, 시각 피드백, 청각 피드백 또는 햅틱 피드백)일 수 있으며, 임의의 형태(사운드 입력, 음성 입력 또는 햅틱 입력을 포함함)를 사용하여 사용자 입력을 수신할 수 있다.
여기에서 서술된 시스템 및 기술은 백엔드 구성 요소(back-end component)를 포함하는 컴퓨팅 시스템(예를 들어, 데이터 서버)에서 구현될 수 있거나, 미들웨어 구성 요소(middleware component)를 포함하는 컴퓨팅 시스템(예를 들어, 애플리케이션 서버)에서 구현될 수 있거나, 프론트엔드 구성 요소(front-end component)를 포함하는 컴퓨팅 시스템(예를 들어, 그래픽 사용자 인터페이스 또는 웹브라우저를 구비한 사용자 컴퓨터, 사용자는 해당 그래픽 사용자 인터페이스 또는 해당 웹브라우저를 통해 여기에서 서술된 시스템 및 기술의 실시형태와 상호 작용할 수 있음)에서 구현될 수 있거나, 이러한 백엔드 구성 요소, 미들웨어 구성 요소 또는 프론트엔드 구성 요소의 임의의 조합을 포함하는 컴퓨팅 시스템에서 구현될 수 있다. 시스템의 구성 요소는 임의의 형태 또는 매체의 디지털 데이터 통신(예를 들어, 통신 네트워크)을 통해 서로 연결될 수 있다. 통신 네트워크의 예시에는 근거리 통신망(LAN), 원거리 통신망(WAN), 인터넷 및 블록 체인 네트워크가 포함된다.
컴퓨터 시스템에는 클라이언트단과 서버가 포함될 수 있다. 클라이언트단과 서버는 일반적으로 서로 멀리 떨어져 있으며, 통상적으로 통신 네트워크를 통해 상호 작용을 수행한다. 클라이언트단과 서버 간의 관계는 대응되는 컴퓨터상에서 실행되고 서로 클라이언트단-서버 관계를 구비하는 컴퓨터 프로그램을 통해 발생한다. 서버는 클라우드 서버일 수 있으며, 클라우드 컴퓨팅 서버 또는 클라우드 호스트라고도 한다. 클라우드 서버는 클라우드 컴퓨팅 서비스 체계 중의 하나의 호스트 제품으로, 전통적인 물리적 호스트 및 VPS 서비스에 존재하는 관리 난이도가 크고, 트래픽 확장성이 약한 결함을 해결한다.
또한, 본 발명의 실시예는 자율 주행 차량과 같은 차량을 더 제공하고, 차량은 차체를 포함하며, 여기서, 차체에는 본 출원의 임의의 실시예에 따른 전자 설비가 설치된다. 해당 전자 설비를 통해, 본 발명의 실시예의 자율 주행 차량은 본 발명의 실시예의 속도 계획 방법에 따라 속도 계획을 수행할 수 있고, 예를 들어, 포인트 투 포인트 주행 임무를 실행하는 과정에서 글로벌 속도 계획을 수행한다. 또한, 차량 감지를 위한 임의의 하나 또는 복수의 센서 및 감지 모듈이 차체에 더 설치될 수 있으며, 주변 환경 및 장애물에 대한 감지를 통해, 본 발명의 실시예의 속도 계획 방법과 결합하여 글로벌 속도 계획을 수행하여, 자율 주행 차량의 안전한 주행을 구현한다.
본 발명의 실시예의 기술 방안에 따라, 네트워크 모델에 기반하는 전통적인 학습 강화 방법을 포기하고, 룩업 테이블의 방식을 사용하여 신경망을 대체하며, 오프라인으로 상태표를 계산하고, 온라인으로 룩업 테이블 방식을 통해 속도 계획을 수행할 수 있다. 따라서, 대량의 컴퓨팅 자원을 점용하지 않는 전제하에, 속도 계획의 글로벌 최적해를 획득하는 것을 확보하고, 동시에 해석성을 확보하고, 대량 생산이 가능한 것을 구현한다. 또한, 값 반복 알고리즘을 실행할 때, 초기의 상태 그리드를 보간하여, 보다 연속적인 상태를 획득하고, 이 기초 상에 값 반복 알고리즘을 추가로 수행하여 최적의 동작을 결정함으로써, 계획된 동작의 연속성을 확보하고, 속도 계획의 정확성을 확보할 수 있다.
위에 설명된 여러 가지 형태의 프로세스를 사용하여, 재 정렬하거나, 단계를 추가 또는 삭제할 수 있음을 이해해야 한다. 예를 들어, 본 출원에서 기재된 각 단계들은 병행되어 수행될 수 있거나, 순차적으로 수행될 수 있거나, 상이한 순서로 수행될 수 있으며, 본 출원에 개시된 기술 방안이 원하는 결과를 구현할 수만 있으면, 본문에서는 이에 대해 제한하지 않는다.
상기 구체적 실시 형태는, 본 발명의 보호 범위에 대한 제한을 구성하지 않는다. 본 분야의 당업자는 설계 요구 및 기타 요소에 따라, 여러 가지 수정, 조합, 서브 조합 및 대체를 수행할 수 있음을 알아야 한다. 본 발명의 사상과 원칙 내에서 수행하는 임의의 수정, 동등한 대체 및 개선 등은, 본 발명의 보호 범위에 포함되어야 한다.

Claims (14)

  1. 차량의 현재 상태를 획득하는 단계-여기서, 상기 현재 상태는 적어도 나머지 주행 거리와 현재 속도를 포함함-;
    상기 현재 상태 및 기결정된 상태표에 따라, 동작을 보간하여, 상기 현재 상태의 목표 동작을 획득하는 단계-여기서, 상기 상태표는 학습 강화 방법에 기반하여 결정되고, 복수의 상태와 각 상태에서 실행되는 동작을 포함하며, 상기 동작은 적어도 가속도를 포함함-; 를 포함하되,
    상기 상태표를 결정하는 방법은,
    이산화된 상태에 기반하여 상태 그리드를 생성하는 단계-여기서, 상기 상태 그리드에는 복수의 서브 그리드가 포함되며, 각 서브 그리드의 정점은 하나의 상태를 표시함-;
    이산화된 동작에 기반하여, 상기 상태 그리드 중의 상태를 보간하여, 상태 보간 정보를 획득하는 단계-여기서, 상기 상태 보간 정보는 상기 상태 그리드 중의 상태에 동작을 인가하여 획득한 다음 상태를 표시함-;
    값 반복 알고리즘을 사용하여, 기설정된 최적화 목표에 대응하는 목표 비용 함수에 따라, 상기 상태 그리드 중의 상태 및 상기 상태 보간 정보가 표시하는 상태를 기반으로 값 반복을 수행하여, 상기 상태 그리드 중 각 상태에 대응하는 계획 동작을 결정하는 단계;
    상기 상태 그리드 중의 각 상태 및 그에 대응하는 계획 동작을 상기 상태표로 하는 단계; 를 포함하는 것을 특징으로 하는 자율 주행을 위한 속도 계획 방법.
  2. 제 1 항에 있어서,
    이산화된 동작에 기반하여, 상기 상태 그리드 중의 상태를 보간하여, 상태 보간 정보를 획득하는 상기 단계는,
    이산화된 동작에 기반하여, 상기 상태 그리드 중의 상태에 대해 무게중심 보간을 수행하여, 상태 보간 정보를 획득하는 단계를 포함하는 것을 특징으로 하는 자율 주행을 위한 속도 계획 방법.
  3. 제 1 항에 있어서,
    상기 목표 비용 함수는 상태 비용 함수 및 동작 비용 함수를 포함하는 것을 특징으로 하는 자율 주행을 위한 속도 계획 방법.
  4. 제 1 항에 있어서,
    상기 현재 상태 및 기결정된 상태표에 따라, 동작을 보간하여, 상기 현재 상태의 목표 동작을 획득하는 상기 단계는,
    기결정된 상태표에서 상기 현재 상태가 속하는 상태 범위를 결정하는 단계;
    상기 상태 범위 내의 각 상태에 대응하는 동작에 대해 무게중심 보간을 수행하여, 상기 현재 상태의 목표 동작을 획득하는 단계; 를 포함하는 것을 특징으로 하는 자율 주행을 위한 속도 계획 방법.
  5. 자율 주행을 위한 속도 계획 장치에 있어서,
    차량의 현재 상태를 획득하는 상태 획득 모듈-여기서, 상기 현재 상태는 적어도 나머지 주행 거리와 현재 속도를 포함함-;
    상기 현재 상태 및 기결정된 상태표에 따라, 동작을 보간하여, 상기 현재 상태의 목표 동작을 획득하는 보간 모듈-여기서, 상기 상태표는 학습 강화 방법에 기반하여 결정되고, 복수의 상태와 각 상태에서 실행되는 동작을 포함하며, 상기 동작은 적어도 가속도를 포함함-; 을 포함하되,
    상기 자율 주행을 위한 속도 계획 장치는 상태표 결정 모듈을 더 포함하고, 해당 상태표 결정 모듈은 구체적으로,
    이산화된 상태에 기반하여 상태 그리드를 생성하는 상태 그리드 생성 유닛-여기서, 상기 상태 그리드에는 복수의 서브 그리드가 포함되며, 각 서브 그리드의 정점은 하나의 상태를 표시함-;
    이산화된 동작에 기반하여, 상기 상태 그리드 중의 상태를 보간하여, 상태 보간 정보를 획득하는 상태 보간 유닛-여기서, 상기 상태 보간 정보는 상기 상태 그리드 중의 상태에 동작을 인가하여 획득한 다음 상태를 표시함-;
    값 반복 알고리즘을 사용하여, 기설정된 최적화 목표에 대응하는 목표 비용 함수에 따라, 상기 상태 그리드 중의 상태 및 상기 상태 보간 정보가 표시하는 상태를 기반으로 값 반복을 수행하여, 상기 상태 그리드 중 각 상태에 대응하는 계획 동작을 결정하는 값 반복 유닛;
    상기 상태 그리드 중의 각 상태 및 그에 대응하는 계획 동작을 상기 상태표로 하는 상태표 결정 유닛; 을 포함하는 것을 특징으로 하는 자율 주행을 위한 속도 계획 장치.
  6. 제 5 항에 있어서,
    상기 상태 보간 유닛은 구체적으로,
    이산화된 동작에 기반하여, 상기 상태 그리드 중의 상태에 대해 무게중심 보간을 수행하여, 상태 보간 정보를 획득하는 것을 특징으로 하는 자율 주행을 위한 속도 계획 장치.
  7. 제 5 항에 있어서,
    상기 목표 비용 함수는 상태 비용 함수 및 동작 비용 함수를 포함하는 것을 특징으로 하는 자율 주행을 위한 속도 계획 장치.
  8. 제 5 항에 있어서,
    상기 보간 모듈은,
    기결정된 상태표에서 상기 현재 상태가 속하는 상태 범위를 결정하는 룩업 테이블 유닛;
    상기 상태 범위 내의 각 상태에 대응하는 동작에 대해 무게중심 보간을 수행하여, 상기 현재 상태의 목표 동작을 획득하는 동작 보간 유닛; 을 포함하는 것을 특징으로 하는 자율 주행을 위한 속도 계획 장치.
  9. 적어도 하나의 프로세서; 및
    상기 적어도 하나의 프로세서와 통신 연결하는 메모리; 를 포함하는 전자 설비에 있어서,
    상기 메모리는 상기 적어도 하나의 프로세서에 의해 실행 가능한 명령을 저장하고, 상기 명령은 상기 적어도 하나의 프로세서에 의해 실행되어, 상기 적어도 하나의 프로세서가 제 1 항 내지 제 4 항 중 어느 한 항에 따른 자율 주행을 위한 속도 계획 방법을 실행하도록 하는 것을 특징으로 하는 전자 설비.
  10. 컴퓨터 명령을 저장하는 비일시적 컴퓨터 판독가능 저장매체에 있어서,
    상기 컴퓨터 명령은, 컴퓨터가 제 1 항 내지 제 4 항 중 어느 한 항에 따른 자율 주행을 위한 속도 계획 방법을 실행하도록 하는 것을 특징으로 하는 비일시적 컴퓨터 판독가능 저장매체.
  11. 차체를 포함하는 차량에 있어서,
    상기 차체에는 제 9 항에 따른 전자 설비가 설치되는 것을 특징으로 하는 차량.
  12. 컴퓨터 판독가능 저장매체에 저장된 컴퓨터 프로그램에 있어서,
    상기 컴퓨터 프로그램은 컴퓨터 명령을 포함하며, 상기 컴퓨터 명령은 컴퓨터가 제 1 항 내지 제 4 항 중 어느 한 항에 따른 자율 주행을 위한 속도 계획 방법을 실행하도록 하는 것을 특징으로 하는 컴퓨터 판독가능 저장매체에 저장된 컴퓨터 프로그램.
  13. 삭제
  14. 삭제
KR1020210098514A 2020-11-06 2021-07-27 자율 주행을 위한 속도 계획 방법, 장치, 설비, 매체 및 차량 KR102566603B1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN202011231666.XA CN114527737A (zh) 2020-11-06 2020-11-06 用于自动驾驶的速度规划方法、装置、设备、介质和车辆
CN202011231666.X 2020-11-06

Publications (2)

Publication Number Publication Date
KR20210101172A KR20210101172A (ko) 2021-08-18
KR102566603B1 true KR102566603B1 (ko) 2023-08-14

Family

ID=77050886

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020210098514A KR102566603B1 (ko) 2020-11-06 2021-07-27 자율 주행을 위한 속도 계획 방법, 장치, 설비, 매체 및 차량

Country Status (5)

Country Link
US (1) US11318938B2 (ko)
EP (1) EP3896624A3 (ko)
JP (1) JP7372296B2 (ko)
KR (1) KR102566603B1 (ko)
CN (1) CN114527737A (ko)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113511222B (zh) * 2021-08-27 2023-09-26 清华大学 场景自适应式车辆交互行为决策与预测方法及装置
CN113715845A (zh) * 2021-09-07 2021-11-30 北京百度网讯科技有限公司 一种自动驾驶方法、装置及电子设备
CN113946155B (zh) * 2021-12-20 2022-04-05 深圳佑驾创新科技有限公司 一种自动驾驶速度规划方法、装置及存储介质
KR102508367B1 (ko) * 2021-12-28 2023-03-09 한국교통연구원 커넥티드 자율 주행차의 안전 모니터링 및 운영설계범위를 지원하는 관제 서버
CN114355948A (zh) * 2022-01-11 2022-04-15 大连海事大学 一种栅格图下的基于混合算法的无人船路径规划方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110298640A1 (en) 2010-06-04 2011-12-08 Gm Global Technology Operations, Inc. Method and system for calculating and displaying travel range information
WO2017210901A1 (zh) 2016-06-08 2017-12-14 驭势科技(北京)有限公司 车辆自动驾驶的速度规划方法、装置及计算装置
JP2019128962A (ja) 2018-01-26 2019-08-01 バイドゥ・ユーエスエイ・リミテッド・ライアビリティ・カンパニーBaidu USA LLC 自動運転車のための経路及び速度の最適化フォールバックメカニズム[path and speed optimization fallback mechanism for autonomous vehicles]
WO2019167457A1 (ja) 2018-02-28 2019-09-06 ソニー株式会社 情報処理装置、情報処理方法、プログラム、及び移動体
US20200090042A1 (en) 2017-05-19 2020-03-19 Deepmind Technologies Limited Data efficient imitation of diverse behaviors

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102037036B1 (ko) * 2013-04-11 2019-10-28 현대모비스 주식회사 자동주행 제어시스템
WO2018132608A2 (en) * 2017-01-12 2018-07-19 Mobileye Vision Technologies Ltd. Navigation based on occlusion zones
US10296004B2 (en) * 2017-06-21 2019-05-21 Toyota Motor Engineering & Manufacturing North America, Inc. Autonomous operation for an autonomous vehicle objective in a multi-vehicle environment
CN108009587B (zh) * 2017-12-01 2021-04-16 驭势科技(北京)有限公司 一种基于强化学习和规则确定驾驶策略的方法与设备
US11231717B2 (en) * 2018-11-08 2022-01-25 Baidu Usa Llc Auto-tuning motion planning system for autonomous vehicles
CN109712063B (zh) * 2018-12-12 2023-03-14 中国航空工业集团公司西安航空计算技术研究所 一种图形处理器平面剪裁电路
CN109782766B (zh) * 2019-01-25 2023-01-03 北京百度网讯科技有限公司 用于控制车辆行驶的方法和装置
CN110488861B (zh) * 2019-07-30 2020-08-28 北京邮电大学 基于深度强化学习的无人机轨迹优化方法、装置和无人机
CN110466531B (zh) * 2019-08-30 2021-10-12 广州小鹏汽车科技有限公司 一种车辆的行驶控制方法、系统及车辆
CN110686906B (zh) * 2019-10-09 2021-03-26 清华大学 车辆自动驾驶测试方法及装置
CN111845701B (zh) * 2020-08-05 2021-03-30 重庆大学 一种跟车环境下基于深度强化学习的hev能量管理方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110298640A1 (en) 2010-06-04 2011-12-08 Gm Global Technology Operations, Inc. Method and system for calculating and displaying travel range information
WO2017210901A1 (zh) 2016-06-08 2017-12-14 驭势科技(北京)有限公司 车辆自动驾驶的速度规划方法、装置及计算装置
US20190265713A1 (en) * 2016-06-08 2019-08-29 Uisee Technologies (Beijing) Ltd Speed planning method and apparatus and calculating apparatus for automatic driving of vehicle
US20200090042A1 (en) 2017-05-19 2020-03-19 Deepmind Technologies Limited Data efficient imitation of diverse behaviors
JP2019128962A (ja) 2018-01-26 2019-08-01 バイドゥ・ユーエスエイ・リミテッド・ライアビリティ・カンパニーBaidu USA LLC 自動運転車のための経路及び速度の最適化フォールバックメカニズム[path and speed optimization fallback mechanism for autonomous vehicles]
WO2019167457A1 (ja) 2018-02-28 2019-09-06 ソニー株式会社 情報処理装置、情報処理方法、プログラム、及び移動体

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Jean-Paul Berrut외 1명. Barycentric Lagrange Interpolation. Society for Industrial and Applied Mathematics. 2004.07.30., pp.501-517 1부*

Also Published As

Publication number Publication date
KR20210101172A (ko) 2021-08-18
EP3896624A3 (en) 2022-03-16
JP2022075526A (ja) 2022-05-18
US11318938B2 (en) 2022-05-03
JP7372296B2 (ja) 2023-10-31
US20210362714A1 (en) 2021-11-25
CN114527737A (zh) 2022-05-24
EP3896624A2 (en) 2021-10-20

Similar Documents

Publication Publication Date Title
KR102566603B1 (ko) 자율 주행을 위한 속도 계획 방법, 장치, 설비, 매체 및 차량
US11753005B2 (en) Collision detection method, and device, as well as electronic device and storage medium
JP7166383B2 (ja) 高精度マップの作成方法及び装置
JP7258078B2 (ja) 実景ナビゲーションアイコン表示方法、装置、機器及び媒体
EP3932763A1 (en) Method and apparatus for generating route planning model, and device
JP7309806B2 (ja) 軌跡を処理するための方法、装置、路側機、クラウド制御プラットフォーム及びコンピュータプログラム
KR20210089116A (ko) 종방향 동역학 모델의 트레이닝 방법, 장치 및 기기
JP2021119507A (ja) 車線の決定方法、車線測位精度の評価方法、車線の決定装置、車線測位精度の評価装置、電子デバイス、コンピュータ可読記憶媒体、及びプログラム
CN110879395B (zh) 障碍物位置预测方法、装置和电子设备
CN111368760A (zh) 一种障碍物检测方法、装置、电子设备及存储介质
JP2023510198A (ja) 車両姿勢を検出するための方法及び装置
JP7337121B2 (ja) 環状交差点のナビゲーション方法、装置、デバイス及び記憶媒体
CN115222792B (zh) 一种铁路桥梁数字孪生建模方法
CN113844463B (zh) 基于自动驾驶系统的车辆控制方法、装置及车辆
EP3932781A1 (en) Reverse trajectory tracking method and apparatus, electronic device and storage medium
CN112880674A (zh) 一种行驶设备的定位方法、装置、设备及存储介质
CN114815851A (zh) 机器人跟随方法、装置、电子设备以及存储介质
EP3822850A2 (en) Method and apparatus for 3d modeling
CN112902951A (zh) 一种行驶设备的定位方法、装置、设备及存储介质
KR20210037633A (ko) 장애물 속도를 결정하는 방법, 장치, 전자 기기, 저장 매체 및 프로그램
CN112528932B (zh) 用于优化位置信息的方法、装置、路侧设备和云控平台
CN115366919A (zh) 一种轨迹预测方法、系统、电子设备及存储介质
CN112880664A (zh) 一种行驶设备的定位方法、装置、设备及存储介质
CN111582543A (zh) 预测模型的生成方法、估计到达时间确定方法及装置
CN117739946A (zh) 一种智驾地图的构建方法、装置、计算机设备及存储介质

Legal Events

Date Code Title Description
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant