CN108053067A

CN108053067A - 最优路径的规划方法、装置及计算机可读存储介质

Info

Publication number: CN108053067A
Application number: CN201711323312.6A
Authority: CN
Inventors: 刘新; 宋朝忠; 郭烽; 单单
Original assignee: Shenzhen Yicheng Automatic Driving Technology Co Ltd
Current assignee: Shenzhen Yicheng Automatic Driving Technology Co Ltd
Priority date: 2017-12-12
Filing date: 2017-12-12
Publication date: 2018-05-18

Abstract

本发明公开了一种最优路径的规划方法，包括以下步骤：利用最优算法获取第一参数对应的第二参数，其中，第一参数及第二参数包括多个参数；将所述第一参数及所述第二参数分别作为输入及输出训练神经网络，以得到所述神经网络对应的神经网络模型；运行所述神经网络模型，根据获取到的参数变量得到最优结果。本发明还公开了一种最优路径的规划装置及计算机可读存储介质。本发明实现了利用神经网络模型解决最优理论问题中路径规划的方法，能快速得最优结果，且计算简单。

Description

最优路径的规划方法、装置及计算机可读存储介质

技术领域

本发明涉及神经网络技术领域，尤其涉及一种最优路径的规划方法、装置及计算机可读存储介质。

背景技术

人工神经网络是一种模仿动物神经网络行为特征，进行分布式并行信息处理的算法数学模型，这种网络依靠系统的复杂程度，通过调整内部大量节点之间相互连接的关系和运算系数，从而达到处理信息的目的，并具有自学习和自适应的能力，所以，神经网络学在自动驾驶中得到了广泛的运用。

自动驾驶系统中的路径规划与决策算法可以被归纳成一个多变量输入、多目标输出的最优化问题，目前，通过传统的最优算法来求解这类问题，但传统的最优算法解决这类问题时计算复杂。

上述内容仅用于辅助理解本发明的技术方案，并不代表承认上述内容是现有技术。

发明内容

本发明的主要目的在于提供一种最优路径的规划方法、装置及计算机可读存储介质，旨在解决传统的最优算法解决最优化问题时计算复杂的技术问题。

为实现上述目的，本发明提供一种最优路径的规划方法，所述方法包括以下步骤：

利用最优算法获取第一参数对应的第二参数，其中，第一参数及第二参数包括多个参数；

将所述第一参数及所述第二参数分别作为输入及输出训练神经网络，以得到所述神经网络对应的神经网络模型；

运行所述神经网络模型，根据获取到的参数变量得到最优结果。

优选地，所述将所述第一参数及所述第二参数分别作为输入及输出训练神经网络，以得到所述神经网络对应的神经网络模型的步骤包括：

将所述第一参数及所述第二参数分别作为输入及输出在所述神经网络中进行逐层运算；

确定当前层输出值的误差值是否小于预设阈值；

当所述误差值小于预设阈值时，结束训练，得到所述神经网络对应的神经网络模型。

优选地，所述确定当前层输出值的误差值是否小于预设阈值的步骤包括：

获取当前层的实际输出值及所述第二参数中的期望输出值；

基于所述输出值及所述期望输出值获取所述误差值，确定所述误差值是否小于预设阈值。

优选地，所述确定当前层输出值的误差值是否小于预设阈值的步骤之后，所述最优路径的规划方法还包括：

当所述误差值大于预设阈值时，获取所述当前层输出值对应的梯度；

调整所述梯度对应的权重，将当前层的输出作为下一层的输入继续调整权重。

当所述误差值大于预设阈值时，获取当前训练次数，确定所述当前训练次数是否大于预设次数；

当所述当前训练次数大于预设次数时，结束训练。

此外，为实现上述目的，本发明还提供一种最优路径的规划装置，所述最优路径的规划装置包括：存储器、处理器及存储在所述存储器上并可在所述处理器上运行的最优路径的规划程序，所述最优路径的规划程序被所述处理器执行时实现以下步骤：

优选地，所述将所述第一参数及所述第二参数分别作为输入及输出来训练神经网络，以得到所述神经网络对应的神经网络模型的步骤包括：

确定当前层输出值的误差值是否小于预设阈值；

获取当前层的实际输出值及所述第二参数中的期望输出值；

此外，为实现上述目的，本发明还提供一种计算机可读存储介质，所述计算机可读存储介质上存储有最优路径的规划程序，所述最优路径的规划程序被处理器执行时实现以下步骤：

本发明通过利用最优算法获取第一参数对应的第二参数，其中，第一参数及第二参数包括多个参数；将所述第一参数及所述第二参数分别作为输入及输出训练神经网络，以得到所述神经网络对应的神经网络模型；运行所述神经网络模型，根据获取到的参数变量得到最优结果。本发明还公开了一种最优路径的规划装置及计算机可读存储介质。本发明实现了利用神经网络模型解决最优理论问题中路径规划的方法，能快速得最优结果，且计算简单。

附图说明

图1是本发明实施例方案涉及的硬件运行环境的终端结构示意图；

图2为本发明最优路径的规划方法第一实施例的流程示意图；

图3为本发明最优路径的规划方法第二实施例中所述将所述第一参数及所述第二参数分别作为输入及输出训练神经网络，以得到所述神经网络对应的神经网络模型步骤的细化流程示意图；

图4为本发明最优路径的规划方法第三实施例中所述确定当前层输出值的误差值是否小于预设阈值步骤的细化流程示意图；

图5为本发明最优路径的规划方法第四实施例的流程示意图；

图6为本发明最优路径的规划方法第五实施例的流程示意图。

本发明目的的实现、功能特点及优点将结合实施例，参照附图做进一步说明。

具体实施方式

应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。

如图1所示，图1是本发明实施例方案涉及的硬件运行环境中最优路径的规划装置所属终端的结构示意图。

本发明实施例终端可以是PC。如图1所示，该终端可以包括：处理器1001，例如CPU，网络接口1004，用户接口1003，存储器1005，通信总线1002。其中，通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(Display)、输入单元比如键盘(Keyboard)，可选用户接口 1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如WI-FI接口)。存储器1005可以是高速RAM 存储器，也可以是稳定的存储器(non-volatile memory)，例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。

可选地，终端还可以包括摄像头、RF(Radio Frequency，射频)电路，传感器、音频电路、WiFi模块等等。其中，传感器比如光传感器、运动传感器以及其他传感器。具体地，光传感器可包括环境光传感器及接近传感器，其中，环境光传感器可根据环境光线的明暗来调节显示屏的亮度，接近传感器可在移动终端移动到耳边时，关闭显示屏和/或背光。作为运动传感器的一种，重力加速度传感器可检测方向上(一般为三轴)加速度的大小，静止时可检测出重力的大小及方向，可用于识别移动终端姿态的应用(比如横竖屏切换、相关游戏、磁力计姿态校准)、振动识别相关功能(比如计步器、敲击)等；当然，移动终端还可配置陀螺仪、气压计、湿度计、温度计、红外线传感器等其他传感器，在此不再赘述。

本领域技术人员可以理解，图1中示出的终端结构并不构成对终端的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置。

如图1所示，作为一种计算机存储介质的存储器1005中可以包括操作服务器、网络通信模块、用户接口模块以及最优路径的规划程序。

在图1所示的终端中，网络接口1004主要用于连接后台服务器，与后台服务器进行数据通信；用户接口1003主要用于连接客户端(用户端)，与客户端进行数据通信；而处理器1001可以用于调用存储器1005中存储的最优路径的规划程序。

在本实施例中，最优路径的规划装置包括：存储器1005、处理器1001及存储在所述存储器1005上并可在所述处理器1001上运行的最优路径的规划程序，其中，处理器1001调用存储器1005中存储的最优路径的规划程序时，执行以下操作：

进一步地，处理器1001可以调用存储器1005中存储的最优路径的规划程序，还执行以下操作：

确定当前层输出值的误差值是否小于预设阈值；

获取当前层的实际输出值及所述第二参数中的期望输出值；

当所述当前训练次数大于预设次数时，结束训练。

基于上述硬件结构，提出本发明最优路径的规划方法的各个实施例。

参照图2，本发明最优路径的规划方法第一实施例提供一种最优路径的规划方法，所述最优路径的规划方法包括：

步骤S10，利用最优算法获取第一参数对应的第二参数，其中，第一参数及第二参数包括多个参数；

在本实施例中，可以在高性能服务器上运行传统最优算法对最优化问题进行求解，得到第一参数及第二参数，第一参数包括车辆的位置、道路边界坐标、障碍物坐标和运动方向等，第二参数包括车辆的速度、加速度、转弯角度，例如，基于最优化理论解决路径规划与决策问题的算法通常具有如下的形态：maximize y＝f(x₁，x₂，...，x_n，c₁，c₂，...，c_k)，其中x₁，x₂，...，x_n指的是被优化的变量，例如，速度、加速度、转弯角度等，c₁，c₂，...，c_k指汽车和周边环境当前的状态，例如，汽车的位置、道路边界坐标、障碍物坐标和运动方向等，n和k都是正整数，代表x和c的数量，y是优化的目标，用来量化速度、加速度的连续性，以及与道路边界和障碍物边界的距离等，量化的过程由函数f实现，当f为车辆在行驶过程中与障碍物的距离的最大值时，对于每一组给定的c₁，c₂，...，c_k，寻找所有可能的x₁，x₂，...，x_n，使得 y达到最大值，则表示车辆行驶路径最安全。

步骤S20，将所述第一参数及所述第二参数分别作为输入及输出训练神经网络，以得到所述神经网络对应的神经网络模型；

在本实施例中，在得到第一参数与第二参数时，将该第一参数与第二参数分别作为输入与输出训练神经网络，(比如训练一百万次)，第二参数为第一参数的最优参数。一般来说，神经网络包括输入层、隐层、输出层，隐层可以为一层或者多层，隐层是输入层和输出层之间众多神经元和链接组成的各个层面，包括多个节点，每一个输入都有一个权重与输入相联系，权重可以为正，也可以为负，如果权重为正，就会有激发作用，权重为负，则会有抑制作用，例如，技术人员设计一个CNN(卷积神经网络)，确定神经网络的层数、隐藏神经元的个数、选取初始权值、学习速率、期望误差及训练次数，在步骤S10中，c₁，c₂，...，c_k作为输入，c₁，c₂，...，c_k在各个隐层进行逐层变换、逐层映射，一直到输出层，可以采用随机梯度下降法对构建的卷积神经网络进行迭代训练，每迭代一次检测一次梯度以及损失函数的值，以获得网络模型结构中各权重值和偏置值的调整量，迭代多次后得到本次训练的最优卷积神经网络模型，具体地，把c₁，c₂，...，c_k输入CNN(卷积神经网络)，将得到当前层对应的输出值，表示为{x₁，x₂，...，x_n}'，然后根据期望输出值x₁，x₂，...，x_n，检测当前的梯度m，并对第m层神经网络的权值与偏置值进行调整，将当前层的输出作为下一层神经网络的输入，根据第m层网络调整后和调整前的权重，得到梯度m-1，据此调整第m-1层神经网络的权重，以此类推，更新CNN(卷积神经网络)中所有层的神经网络，进一步地，在每一层神经网络输出后，都将当前层对应的输出值{x₁，x₂，...，x_n}'与期望输出值x₁，x₂，...，x_n进行对比，获取误差值，确定该误差值是否大于预设阈值，如果误差值小于预设阈值时，则结束训练，如果大于预设阈值，则根据误差值反传调整权值和阈值(即偏置值)继续训练，当然，如果检测到训练次数大于预设次数时，结束训练，表明神经网络需要重新设计调整。

步骤S30，运行所述神经网络模型，根据输入的变量得到最优结果。

在本实施例中，在对神经网络训练完成后，得到相应的神经网络模型，该神经网络模型能够根据不同的输入，能够快速地得到输出值，并且该输出值逼近最优化理论的结果。例如，将训练后的神经网络放在汽车嵌入式环境中在线运行，当获取到汽车的位置、道路边界坐标、障碍物坐标和运动方向等参数时，则可以得到汽车的位置、道路边界坐标、障碍物坐标和运动方向等参数对应的速度、加速度、转弯角度等参数，使得汽车与障碍物距离最远，得到最安全路径。

进一步地，可以根据摄像机、雷达等装置获取参数变量，例如，根据摄像机获取到的图像进行图像处理，获取汽车前方障碍物的方向及距离，确定汽车经过障碍物最安全行驶路径时的速度、加速度及行驶方向等，将获取到的参数输入值神经网络模型，则可以快速输出最优结果对应的参数。

本实施例提出的最优路径的规划方法，通过利用最优算法获取第一参数对应的第二参数，其中，第一参数及第二参数包括多个参数，然后将所述第一参数及所述第二参数分别作为输入及输出训练神经网络，以得到所述神经网络对应的神经网络模型，最后运行所述神经网络模型，根据输入的变量得到最优结果；实现了利用神经网络模型解决最优理论问题中路径规划的方法，能快速得最优结果，且计算简单。

基于第一实施例，提出本发明最优路径的规划方法的第二实施例，参照图3，本实施例中，步骤S20包括：

步骤S21，将所述第一参数及所述第二参数分别作为输入及输出在所述神经网络中进行逐层运算；

在本实施例中，第一参数在隐层的各层神经网络进行逐层运算，该逐层运算包括将当前层神经网络的输出作为下一层神经网络的输入，从最后一层一直传导到第一层。在设计神经网络时，技术人员需设计神经网络的层数、设计隐层神经元的个数、初始权值的选取、学习速率、期望误差的选取等，一般来说，具有偏差和至少一个S型隐层加上一个线性输出层的神经网络，能够逼近任何有理函数，增加层数可以进一步降低误差，提高精度，神经元数太少时，网络不能很好的学习，训练迭代的次数也比较多，训练精度也不高，神经元数太多时，网络的功能越强大，精确度也更高，训练迭代的次数也大，可能会出现过拟合现象，一般初始权值是取值在(-1，1)之间的随机数，学习速率一般选取为0.01到0.8，大的学习速率可能导致系统的不稳定，但小的学习速率导致收敛太慢，需要较长的训练时间，在设计网络的过程中，期望误差值也应当通过对比训练后确定一个合适的值，这个合适的值是相对于所需要的隐层节点数来确定的，也可以同时对两个不同的期望误差值的网络进行训练。

步骤S22，确定当前层输出值的误差值是否小于预设阈值；

在本实施例中，预设阈值是包括设计神经网络时设定的期望误差值，由技术人员根据需求进行设定，例如，在步骤S10中，c₁，c₂，...，c_k作为输入， x₁，x₂，...，x_n作为期望输出，c₁，c₂，...，c_k在当前层神经网络实际输出值为 {x₁，x₂，...，x_n}'，则将x₁，x₂，...，x_n与{x₁，x₂，...，x_n}'进行对比，得到误差值，确定该误差值是否小于期望误差值。

步骤S23，当所述误差值小于预设阈值时，结束训练，得到所述神经网络对应的神经网络模型。

在本实施例中，当所述误差值小于预设阈值时，输出最终输出值，则说明训练完成，将c₁，c₂，...，c_k作为输入能够得到逼近与最优理论的结果，结束训练，得到训练后的神经网络模型。

本实施例提出的最优路径的规划方法，通过将所述第一参数及所述第二参数分别作为输入及输出在所述神经网络中进行逐层运算，然后确定当前层输出值的误差值是否小于预设阈值，最后当所述误差值小于预设阈值时，结束训练，得到所述神经网络对应的神经网络模型；实现了通过逐层运算来训练神经网络，提高了训练的准确度，从而快速得到需要的神经网络模型。

基于第二实施例，提出本发明最优路径的规划方法的第三实施例，参照图4，本实施例中，步骤S22包括：

步骤S221，获取当前层的实际输出值及第二参数中的期望输出值；

在本实施例中，该实际输出值是指输入值经过当前层的神经网络运算后得到的输出值，期望输出值是指将第二参数作为输出训练神经网络的输出值，例如，在步骤S10中，将x₁，x₂，...，x_n作为输出训练神经网络，则x₁，x₂，...， x_n为期望输出值，将c₁，c₂，...，c_k作为输入训练神经网络，c₁，c₂，...，c_k则有对应的实际输出值，用{x₁，x₂，...，x_n}'表示。

步骤S222，基于所述输出值及所述期望输出值获取所述误差值，确定所述误差值是否小于预设阈值；

在本实施例中，将实际输出值与期望输出值进行对比，计算实际输出值与期望输出值的误差值，确定该误差值是否小于预设阈值，该预设阈值包括期望误差值，该期望误差值由技术人员进行设定。

本实施例提出的最优路径的规划方法，通过获取当前层的实际输出值及所述第二参数中的期望输出值，然后基于所述输出值及所述期望输出值获取所述误差值，确定所述误差值是否小于预设阈值；实现了通过对误差值与预设阈值的判断来确定训练是否完成，进而提高了训练的速度及训练的准确性。

基于第三实施例，提出本发明最优路径的规划方法的第四实施例，参照图5，本实施例中，步骤S22之后，还包括：

步骤S24，当所述误差值大于预设阈值时，获取所述当前层输出值对应的梯度；

步骤S25，调整所述梯度对应的权重，将当前层的输出作为下一层的输入继续调整权重。

在本实施例中，当该误差值大于预设阈值时，则继续训练，可以利用梯度下降法来训练神经网络，获取当前层输入值对应的梯度，例如，将把c₁， c₂，...，c_k输入卷积神经网络，得到实际输出值为{x₁，x₂，...，x_n}'；再根据期望输出值x₁，x₂，...，x_n，得到梯度m，并据此调整第m层神经网络的权重，根据第m层神经网络调整后和调整前的权重，得到梯度m-1，据此更新第 m-1层神经网络的权重，以此类推，更新神经网络所有层的权重。

在其它实施例中，还可以利用最小二乘法、牛顿法、拟牛顿法等算法来训练神经网络，梯度下降法和最小二乘法相比，梯度下降法是迭代求解，最小二乘法是计算解析解。如果样本量不算很大，且存在解析解，最小二乘法比起梯度下降法要有优势，计算速度很快。但是如果样本量很大，用最小二乘法由于需要求一个超级大的逆矩阵，这时就很难或者很慢才能求解解析解了，使用迭代的梯度下降法比较有优势。

本实施例提出的最优路径的规划方法，通过当所述误差值大于预设阈值时，获取所述当前层输出值对应的梯度，然后调整所述梯度对应的权重，将当前层的输出作为下一层的输入继续调整权重；实现了对权重的调整，从而让实际输出值越来越接近期望输出值，从而提高了模型训练的速度。

基于第四实施例，提出本发明最优路径的规划方法的第五实施例，参照图6，本实施例中，步骤S22之后，还包括

步骤S26，当所述误差值大于预设阈值时，获取当前学习次数，确定所述当前训练次数是否大于预设次数；

步骤S27，当所述当前训练次数大于预设次数时，结束训练。

在本实施例中，在设计模型时，技术人员会设置训练次数，可以是几万次、几十万次、几百万次，当误差值大于预设阈值时，获取当前训练次数，确定当前训练次数是否大于预设次数，该预设次数是指技术人员设置的训练次数，当所述训练次数大于预设次数时，则停止训练。

本实施例提出的最优路径的规划方法，通过当所述误差值大于预设阈值时，获取当前训练次数，确定所述当前训练次数是否大于预设次数，然后当所述当前训练次数大于预设次数时，结束训练；实现了在预设次数时停止训练，避免了神经网络在训练过程中由于错误而带来的不停的训练，从而提高了训练的准确度。

此外，本发明实施例还提出一种最优路径的规划装置。

本发明最优路径的规划装置包括：存储器、处理器及存储在所述存储器上并可在所述处理器上运行的最优路径的规划程序，所述最优路径的规划程序被所述处理器执行时实现以下步骤：

进一步地，所述最优路径的规划程序被所述处理器执行时还实现以下步骤：

确定当前层输出值的误差值是否小于预设阈值；

获取当前层的实际输出值及所述第二参数中的期望输出值；

其中，本发明最优路径的规划装置中存储的最优路径的规划程序被处理器执行的具体实施例与上述最优路径的规划方法各实施例基本相同，在此不作赘述。

本发明还提供一种计算机可读存储介质。

本发明计算机可读存储介质上存储有最优路径的规划程序，所述最优路径的规划程序被所述处理器执行时实现以下步骤：

其中，本发明计算机可读存储介质中存储的最优路径的规划程序被处理器执行的具体实施例与上述最优路径的规划方法各实施例基本相同，在此不作赘述。

需要说明的是，在本文中，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。

上述本发明实施例序号仅仅为了描述，不代表实施例的优劣。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在如上所述的一个存储介质(如ROM/RAM、磁碟、光盘)中，包括若干指令用以使得一台终端设备(可以是手机，计算机，服务器，空调器，或者网络设备等)执行本发明各个实施例所述的方法。

以上仅为本发明的优选实施例，并非因此限制本发明的专利范围，凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换，或直接或间接运用在其他相关的技术领域，均同理包括在本发明的专利保护范围内。

Claims

1.一种最优路径的规划方法，其特征在于，所述最优路径的规划方法包括以下步骤：

2.如权利要求1所述的最优路径的规划方法，其特征在于，所述将所述第一参数及所述第二参数分别作为输入及输出训练神经网络，以得到所述神经网络对应的神经网络模型的步骤包括：

确定当前层输出值的误差值是否小于预设阈值；

3.如权利要求2所述的最优路径的规划方法，其特征在于，所述确定当前层输出值的误差值是否小于预设阈值的步骤包括：

获取当前层的实际输出值及所述第二参数中的期望输出值；

4.如权利要求3所述的最优路径的规划方法，其特征在于，所述确定当前层输出值的误差值是否小于预设阈值的步骤之后，所述最优路径的规划方法还包括：

5.如权利要求4所述的最优路径的规划方法，其特征在于，所述确定当前层输出值的误差值是否小于预设阈值的步骤之后，所述最优路径的规划方法还包括：

当所述当前训练次数大于预设次数时，结束训练。

6.一种最优路径的规划装置，其特征在于，所述最优路径的规划装置包括：存储器、处理器及存储在所述存储器上并可在所述处理器上运行的最优路径的规划程序，所述最优路径的规划程序被所述处理器执行时实现以下步骤：

7.如权利要求6所述的最优路径的规划装置，其特征在于，所述最优路径的规划程序被所述处理器执行时还实现以下步骤：

确定当前层输出值的误差值是否小于预设阈值；

8.如权利要求7所述的最优路径的规划装置，其特征在于，所述最优路径的规划程序被所述处理器执行时还实现以下步骤：

获取当前层的实际输出值及所述第二参数中的期望输出值；

9.如权利要求8所述的最优路径的规划装置，其特征在于，所述最优路径的规划程序被所述处理器执行时还实现以下步骤：

10.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质上存储有最优路径的规划程序，所述最优路径的规划程序被处理器执行时实现以下步骤：

利用预设算法获取第一参数对应的第二参数，其中，第一参数及第二参数包括多个参数；