CN110514206B - 一种基于深度学习的无人机飞行路径预测方法 - Google Patents

一种基于深度学习的无人机飞行路径预测方法 Download PDF

Info

Publication number
CN110514206B
CN110514206B CN201910715018.2A CN201910715018A CN110514206B CN 110514206 B CN110514206 B CN 110514206B CN 201910715018 A CN201910715018 A CN 201910715018A CN 110514206 B CN110514206 B CN 110514206B
Authority
CN
China
Prior art keywords
aerial vehicle
unmanned aerial
path
matrix
neural network
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910715018.2A
Other languages
English (en)
Other versions
CN110514206A (zh
Inventor
曾议芝
康敏旸
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Aeronautical Radio Electronics Research Institute
Original Assignee
China Aeronautical Radio Electronics Research Institute
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Aeronautical Radio Electronics Research Institute filed Critical China Aeronautical Radio Electronics Research Institute
Priority to CN201910715018.2A priority Critical patent/CN110514206B/zh
Publication of CN110514206A publication Critical patent/CN110514206A/zh
Application granted granted Critical
Publication of CN110514206B publication Critical patent/CN110514206B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01CMEASURING DISTANCES, LEVELS OR BEARINGS; SURVEYING; NAVIGATION; GYROSCOPIC INSTRUMENTS; PHOTOGRAMMETRY OR VIDEOGRAMMETRY
    • G01C21/00Navigation; Navigational instruments not provided for in groups G01C1/00 - G01C19/00
    • G01C21/20Instruments for performing navigational calculations
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05DSYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
    • G05D1/00Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots
    • G05D1/10Simultaneous control of position or course in three dimensions
    • G05D1/101Simultaneous control of position or course in three dimensions specially adapted for aircraft
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • G06Q10/047Optimisation of routes or paths, e.g. travelling salesman problem
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02TCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
    • Y02T10/00Road transport of goods or passengers
    • Y02T10/10Internal combustion engine [ICE] based vehicles
    • Y02T10/40Engine management systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Remote Sensing (AREA)
  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • General Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Automation & Control Theory (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • Development Economics (AREA)
  • Game Theory and Decision Science (AREA)
  • Aviation & Aerospace Engineering (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Feedback Control In General (AREA)

Abstract

本发明公开了一种基于深度学习的无人机飞行路径预测方法,包括以下步骤:步骤一,采用模拟图像像素点的方式,将航路规划场景抽象成多维矩阵;步骤二,输入深度神经网络进行训练,得到一组同样规模的权值矩阵,作为路径选择;步骤三,设置神经网络调参控制策略;步骤四,利用路径平滑过程将权值矩阵表达为完整航路。本发明可以帮助无人机在完全未知的环境下进行下一时刻的路径预测,进而指导无人机的导航和避障,最后安全到达目标点。本发明通过在线学习能够实时获得无人机外界环境信息,学习无人机在何种环境下做出何种动作。通过本发明,无人机能完整地实现未知复杂障碍环境下的导航和避障,突破了原有航路规划算法实时计算的局限性和复杂性。

Description

一种基于深度学习的无人机飞行路径预测方法
技术领域
本发明属于航空技术领域,涉及一种无人机航路规划方法,具体涉及一种 一种基于深度学习的无人机飞行路径预测方法。
背景技术
无人机航路规划的基本目标是自主的获得一条能够避开威胁安全到达目标 的飞行路径。近些年来,航路规划问题的技术方法发展迅速,有很多文献对该 问题从不同方面提出了建模与求解方法。这些技术按照威胁信息获取方式的不 同可以分为两大类:一类是静态航路规划技术,即基于环境先验完全信息的航 路规划。无人机根据全局完整环境威胁信息构造出一条起始点和目标点之间的 安全、可行、满意的路径;另一类是实时航路规划技术,在这部分工作中假设 威胁环境预先完全未知或部分未知。此时,无人机只能获取有限范围(通常是 传感器探测范围)内的威胁信息,为了安全到达目标就需要在飞行过程中实时 规划航路。如果实时航路规划需要在机载计算机上运行,称为在线实时航路规 划。
有关实时航路规划的方法。无人机实时航路规划的重点是如何根据探测的 有限环境信息规划出一条从起点到目标点的全局航路。目前的研究主要以机器 人路径规划方法为参考,结合无人机性能以及飞行环境的特殊性来进行方法研 究。目前,所提出的方法按照建模思想不同可以归为以下几种:
1、基于概率的方法。Klasing等人采用基于Cell的概率路标(Cell-basedprobabilistic roadmaps)法实时对路径进行重规划;Jun和D’Andrea提出了一 种基于威胁概率图的航路规划算法;Zengin和Dogan开发了动态环境下的概率 模型框架(Probabilistic modeling framework),为路径规划提供了较为完整的解决 方案。
2、数学规划方法。近来很多文献中给出了一系列利用混合整数规划来实时 求解路径的方法;Shi和Wang采用Bayesian决策理论与动态规划算法相结合 的方法来求解最优路径;另外,还有基于流函数(Stream Function)的人工势场的 方法(Potential fieldapproaches),全局动态窗口方法(Global dynamic window approaches),基于进化计算的方法(Evolutionary computation),边界跟踪方法 (Bouncing based methods)等用于实时路径规划;Lan和Wen等人对采用不同规 划方法进行路径规划的优缺点进行了分析和比较。
3、全局路径规划与实时路径调整相结合的方法。Xiao和Gao等人首先采 用Dijkstra算法根据改进的Voronoi图生成初始路径,然后在威胁信息变化时采 用基于混合动态贝叶斯网络的转换线性动态系统对路径重新规划;Yan和Ding 等人在给出初始路径的基础上采用基于路标图(Roadmap Diagram)的混合重规划 方法(Hybrid path re-planning algorithm)来实时搜索可行路径;Tarjan还基于有 向图(Directed graphs)给出一种通用的可以解决大部分路径问题的一般性方法, 并说明了构造路径表达式在某种意义上是最常见的路径问题,但这种方法在求 解具体问题时的效率和可行性上都有一定的局限。
除了上述方法,还包括一些由静态方法(A*算法、Voronoi图法等)改进得 到的实时方法,例如,Beard等人基于改进的Voronoi图动态生成可行路径; Bernhard等人使用Dijkstra算法给出了一种局部操作迭代步骤方法,进而用于 确定每一步的最佳轨迹;Chen等人提出了基于D*算法在未知环境中进行无人 战斗机航路规划的方法,其中还考虑了突发威胁。
但是以上航路规划方法面临着实时算法计算量大,环境描述的复杂性和局 限性等特点,一直难以真正地应用在实际无人机系统中。深度学习方法在解决 实际问题中的复杂性和实时性问题有非常好的效果,这一方法恰好能解决无人 机在复杂环境中实时航路规划的问题。
发明内容
针对以上问题,本发明提供了一种基于深度学习的无人机飞行路径预测方 法,通过本发明,能克服复杂的未知环境以及复杂的实时路径规划模型,能够 实时自学习无人机飞行策略,提供了一种基于深度学习的无人机实时导航和避 障功能。
本发明提供的一种基于深度学习的无人机飞行路径预测方法,包括以下步 骤:步骤一,采用模拟图像像素点的方式,将航路规划场景抽象成多维矩阵; 步骤二,输入深度神经网络进行训练,得到一组同样规模的权值矩阵,作为路 径选择;步骤三,设置神经网络调参控制策略;步骤四,利用路径平滑过程将 权值矩阵表达为完整航路。
进一步的,深度神经网络训练过程以路径规划场景的多维矩阵为输入,矩 阵规模因场景大小而调整,无人机路径规划采样时间内飞行距离满足一定数值 要求;矩阵中参数包括路径规划场景中抽象出的危险度和目标点距离等,深度 神经网络的输出以智能算法规划成功的路径抽象出的路径矩阵为训练标签。
其中,该深度神经网络具有多层卷积层、池化层与网络层。卷积层的作用 在于自动提取特征,将输入的场景矩阵进行多次卷积变换,充分使矩阵栅格之 间进行特征交互,从而自动提取出场景特征。池化层在每一层卷积层之后,目 的是进行采样,从而获得更重要的特征而忽略不重要特征。网络层将卷积层与 池化层计算出的参数进行非线性拟合,最终得到输出矩阵,再同标签矩阵进行 比较,采用逐层反向传播策略,进行参数调整,最终重复多次上述过程,完成 对该深度神经网络的训练过程。
进一步的,步骤三的设置神经网络调参控制策略是利用人工智能算法对神 经网络的参数进行调整。如利用A*算法,A*算法具有逃离局部最优的优良特性, 将训练好的神经网络以A*规划出的路径为输出调整参数,使该神经网络也具有 避免陷入局部最优的特性;又如路径平滑算法,路径平滑算法具有使路径平滑 的优良特性,因此也可以用来调整参数使神经网络计算出的路径拥有平滑的性 质。
本发明可以帮助无人机在完全未知的环境下进行下一时刻的路径预测,进 而指导无人机的导航和避障,最后安全到达目标点。本发明通过在线学习能够 实时获得无人机外界环境信息,学习无人机在何种环境下做出何种动作。通过 本发明,无人机能完整地实现未知复杂障碍环境下的导航和避障,突破了原有 航路规划算法实时计算的局限性和复杂性。
附图说明
图1为本发明的技术路线图;
图2为本发明实施例全连接神经网络与卷积神经网络原理对比示意图;
图3为本发明实施例BP神经网络训练方法原理示意图。
具体实施方式
本发明的一种具体实施方式为:
一种基于深度学习的实时无人机路径预测方法,其设计思想是:采用模拟 图像像素点的方式,将航路规划场景抽象成多维矩阵,输入深度神经网络进行 训练,得到一组同样规模的权值矩阵,作为路径选择。另外,本算法还设置神 经网络调参控制策略,使网络训练得到的路径优于普通智能算法。最终利用路 径平滑过程将权值矩阵表达为完整航路。训练部分分为三个过程,分别为:深 度神经网络训练过程、参数调整和路径平滑,流程图如图1所示。
深度神经网络以路径规划场景的多维矩阵为输入,矩阵规模因场景大小而 调整,无人机路径规划采样时间内飞行距离满足一定数值要求。其中,矩阵中 参数包括路径规划场景中抽象出的危险度和目标点距离等。深度神经网络的输 出以智能算法规划成功的路径抽象出的路径矩阵为训练标签。该深度神经网络 具有多层卷积层、池化层与网络层。卷积层的作用在于自动提取特征,将输入 的场景矩阵进行多次卷积变换,充分使矩阵栅格之间进行特征交互,从而自动 提取出场景特征。池化层在每一层卷积层之后,目的是进行采样,从而获得更 重要的特征而忽略不重要特征。网络层将卷积层与池化层计算出的参数进行非 线性拟合,最终得到输出矩阵,再同标签矩阵进行比较,采用逐层反向传播策 略,进行参数调整,最终重复多次上述过程,完成对该深度神经网络的训练过 程。
完全依赖深度学习不考虑专家知识难以学习出真正完美的神经网络。因此, 在网络训练完成后,需要利用优秀的人工智能算法对神经网络的参数进行调整。 例如,A*算法具有逃离局部最优的优良特性,将训练好的神经网络以A*规划出 的路径为输出调整参数,使该神经网络也具有避免陷入局部最优的特性。又如, 路径平滑算法具有使路径平滑的优良特性,因此也可以用来调整参数使神经网 络计算出的路径拥有平滑的性质。
下面根据附图来阐述本发明的另一种更具体的实施方式。
第一部分:基于深度神经网络的无人机航路规划算法模型建立
本部分为解决无人机实时航路规划计算复杂,实时性实施困难的问题,对 如何建立基于深度神经网络的无人机航路规划学习算法模型进行研究。
(1)深度神经网络的输入输出:
本部分深度神经网络输入信息选取的是无人机在探测范围内的威胁度以及 距离目标点距离构成的二位矩阵,输出信息则为无人机转弯角度的选择概率向 量(或者无人机的坐标)。
假设场景或者航路规划结果图的面积K×K(m2),据此调整矩阵的规模为 N×N,无人机的航路规划采样时间为T,则在此时间内其飞行距离X应满足 输入矩阵为X=(Mij)N×N,参数向量Mij=(αijij)。其中的参数包括航路 规划场景中抽象出的危胁度α,与目标点距离χ。输出数据为无人机转弯角度 的选择概率向量。深度神经网络的输出以智能算法规划成功的航路抽象出的路 径矩阵为训练标签。具体来说,输出矩阵Y=(Tij)N×N,参数向量,其中Tij为该航 路点的转弯概率向量。
(2)提取环境特征的网络模型:
卷积神经网络(CNN)可以很好的提取环境特征,它与一般神经网络有着 一定的区别,卷积神经网络一共分为两层,它们是特征提取层与映射层。在特 征提取层中一个神经元的输入只与前一层局部接受域相接。在这里,神经元指 的就是滤波器。在特征映射层中,通常包含若干特征映射,每个特征映射都能 够构成一个平面,每个特征平面都由一些矩形排列的神经元组成,这些神经元 共享权值,指的是同一特征平面的滤波器卷积核相同。卷积核通常以随机小数 矩阵作为初始化形式,在训练神经网络的过程中,卷积核随着训练的进行学习 权值,相应的卷积核做出适应学习目标的改变。共享权值(卷积核)最主要的 好处是可以降低运算参数的数量,对防止过拟合也可以起到一定的作用。子采 样也叫做池化,通常分为平均池化和最大池化两种形式。池化可以降低输入维 数,减少运算参数,提高训练速度。
卷积神经网络还可以从另一方面减少运算的参数,这个方面叫做局部感知。 以我们自身为例,人是从局部到全部对外界进行感知的。对于卷积神经网络要 学习的特征来说,也是局部的特征相关性较强,而相距较远的特征相关性较弱。 由此可知,每个神经元只需要对局部的特征进行感知,在更深层将局部信息结 合到一起就能够得到全局信息,如图2所示。
综上所述,同一层的神经元不必对整个输入进行卷积,每个神经元对输入 的一部分进行卷积,最后统一合并完成对整个输入的卷积。这样不仅降低了参 数数目,还提高了整个神经网络的训练速度。
这样可以大大提高我们在提取航路规划环境信息的过程中所消耗的时间, 有助于神经网络模型更快的学习目标算法的航路规划模式。
(3)解决动作选择的多分类问题网络模型:
常见的逻辑回归、支持向量机常用于解决二分类问题,对于多分类问题, 比如识别手写数字就需要10个分类,同样也可以用逻辑回归或SVM,只是需 要多个二分类来组成多分类,这里采用另外一种方式来解决多分类——Softmax 函数。
Softmax的函数为:
可以看到它有多个值,所有值加起来刚好等于1,每个输出都映射到了0 到1区间,可以看成是概率问题。θi Tx为多个输入,训练其实就是为了逼近最佳 的θT
对于训练集{(x(1),y(1)),...,(x(m),y(m))},有y(i)∈{1,2,3,...,k},总共有k个分类。对 于每个输入x都会有对应每个类的概率,即p(y=j|x),从向量角度来看,有:
softmax的代价函数定为如下,其中包含了示性函数1{j=y(i)},表示如果第 i个样本的类别为j则yij=1。代价函数可看成是最大化似然函数,也即是最小化 负对数似然函数。
其中
一般使用梯度下降优化算法来最小化代价函数,而其中会涉及到偏导数, 即则J(θ)对θj求偏导数,得到:
得到代价函数对参数权重的梯度就可以优化。
因此,将Softmax分类器运用到将要构建的深度神经网络模型中,可以很 好的帮助我们将神经网络最后提取出来的特征进行处理并分类输出,帮助神经 网络模型更好的学习在航路规划过程中目标算法对转弯角度的选择。
第二部分:面向航路学习和规划算法网络模型的参数调节和训练方法研究 (1)反向传播算法训练神经网络:
人工神经网络是受到生物神经网络而开发出的一种模型,它可以估算或者 近似拟合函数,为了达到这一目的需要大量的输入输出数据。人工神经网络具 体表现为一系列互相联接的“神经元”,它们之间能够互相传递信息。这些“神 经元”之间的连接称为连接权重,权重的数值根据学习过程积累的经验进行改 变,这就是神经网络学习的能力。随着训练神经网络样本数量的增加与反复学 习,神经元之间的连接权值和阈值也会不断增加,从而提高神经元之间的反应 灵敏度。
如图3所示,BP网络的学习过程分为两个阶段:
第一阶段:向神经网络输入训练集数据,通过设定好的网络结构和前一次 迭代的权值和阈值,从神经层的第一层向后依次计算各神经元输出。
第二阶段:神经网络对各权值和阈值进行修改,算法从最后一层向前反过 来计算各权值和阈值对总误差的影响,依此对各神经层的权值和阈值进行修改。
重复以上两个过程,直到收敛。
运用反向传播算法训练神经网络模型,使得神经网络模型在训练的过程中 不断的根据感知到的航路规划环境信息特征对每一层的连接权重和阈值进行修 改,使得神经网络最终输出接近目标算法的输出,达到估算或者拟合航路的目 的。
(2)解决神经网络过拟合问题:
在机器学习模型建立的过程中,一般都是使用已有数据建立模型,然后使 用该模型去拟合未知的数据。在统计学习中,通常假设数据满足独立同分布, 即当前已产生的数据可以对未来的数据进行推测模拟。问题是一般情况下独立 同分布的假设往往并不成立,也就是说数据的分布可能会发生变化,并且可能 由于数据量过少,不足以对整个数据集进行分布估计。因此防止模型过拟合, 提高模型泛化能力就显得尤为重要。而最常使用的方法便是正则化,即在对模 型的目标函数或代价函数加上正则项。
在对模型进行训练时,有可能会因为训练数据不足,无法对整个数据的分 布进行估计,或者在对模型进行过度训练时导致模型的过拟合。随着训练的进 行,模型的复杂度会增加,此时模型在训练数据集上的训练误差会逐渐减小, 但是在模型的复杂度达到一定程度时,模型在验证集上的误差反而随着复杂度 增加而增大。此时便发生了过拟合,即模型的复杂度升高,但是该模型在除训 练集之外的数据集上却没有很好的效果。
为了防止过拟合,在本课题中需要用到一些方法:Bacth Normalization。 BacthNormalization是一种样本标准化操作,在机器学习中,他是一种最常用的 标准化方式。对数据预处理进行标准化不仅可以加快收敛的速度,同理,在神 经网络中使用标准化操作也可以加速收敛。使用Batch Normalization还具有如 下好处:
一是正则化效果,防止过拟合;
二是提高模型的泛化能力,使其更好地拟合测试集;
三是允许模型以更高的速率进行学习从而加速收敛。
其原理是利用正则化减少内部相关变量分布的偏移,从而能够提升算法的 鲁棒性。Bacth Normalization由两部分组成,第一部分是缩放和平移,第二部分 是训练缩放的大小与平移的距离。
运用Batch Normalization,将输入的航路规划环境信息在样本轴上进行标准化,可以有效的提高神经网络模型的泛化能力,使其更好的拟合目标算法,完 成对航路或者航路点的预测,并且一定程度上提高了训练速度。
(3)提高神经网络的训练速度:
学习速率是神经网络信息累积的速度。学习速率决定了网络的参数达到最 优的状态的速度。在随机梯度下降的平面图中,学习速率与误差梯度的形状无 关,因为全局学习速率与误差梯度无关。然而,可以通过对原始SGD更新规则 进行修改,将学习速率与错误梯度的大小和方向相关联。
降低学习速率是必要的。在训练过程中,较高的学习速率很可能会使模型 陷入局部最小值。以交通情况为例,将局部最优值视为阻碍行进的情况,这些 情况会增加到达目的地的时间。虽然驾驶途中不可能完全避免所有阻碍,但是 在驾驶时我们更喜欢选择一条最佳的路线。同样,在训练中,我们希望避免梯 度的曲折反弹,同时寻找最优路线,并且更喜欢在该路径上的训练。理想情况 下,我们不希望加速得太多,因为我们会跳进一个局部最优值并卡住。同样的 比喻也适用于学习速率。
动量允许沿浅方向使用较高的速度,同时沿陡峭方向降低速度前进,是一 种自适应学习速率方法的参数。这种动量为“经典动量”,可以对速度进行校正, 然后在速度方向上进行跳跃。动量有助于适当改变学习速率以适应梯度的变化, 最终使网络学习速率的变化而不是其在损失函数表面上的位置的变化。使用动 量学习能够使网络抵抗输入数中的噪声和随机性的性能获得提升。
对模型进行训练时拟采用Adam优化算法。它利用梯度的一阶矩估计和二 阶矩估计动态调整每个参数的学习率。Adam的优点主要在于经过偏置校正后, 每一次迭代学习率都有个确定范围,使得参数比较平稳。公式如下:
mt=μ*mt-1+(1-u)*gt
其中,mt,nt分别是对梯度的一阶矩估计和二阶矩估计,可以看作对期望 E|gt|,的估计;/>是对mt,nt的校正,这样可以近似为对期望的无 偏估计。
可以看出,直接对梯度的矩估计对内存没有额外的要求,而且可以根据梯 度进行动态调整,而对学习率形成一个动态约束,而且有明确的范围。
Adam优化算法有以下特点:
一是善于处理稀疏梯度和非平稳目标;
二是对内存需求较小;
三是为不同的参数计算不同的自适应学习率;
四是也适用于大多非凸优化;
五是适用于大数据集和高维空间。
(4)神经网络测评:
选取交叉熵函数作为损失函数。其公式为:
其中y为期望的输出,a为神经元实际输出。交叉熵代价函数同样有两个 性质:
非负性。
当真实输出a与期望输出y接近的时候,代价函数接近于0。
它可以克服方差代价函数更新权重过慢的问题。它的导数为:
可以看到,权重的更新是受σ(z)-y这一项影响,即受误差的影响。所以 当误差大的时候,权重更新就快,当误差小的时候,权重的更新就慢。这是一 个很好的性质。
运用交叉熵函数对模型进行误差反馈,可以有效的反映实际输出与标签的 误差,从而使得神经网络模型更快的对权重进行更新,使其更好地拟合目标算 法。

Claims (4)

1.一种基于深度学习的无人机飞行路径预测方法,其特征在于,包括以下步骤:
步骤一,采用模拟图像像素点的方式,将航路规划场景抽象成多维矩阵;
步骤二,输入深度神经网络进行训练,得到一组同样规模的权值矩阵,作为路径选择;深度神经网络训练过程以路径规划场景的多维矩阵为输入,矩阵规模因场景大小而调整,无人机路径规划采样时间T内飞行距离满足要求,深度神经网络的输出以智能算法规划成功的路径抽象出的路径矩阵为训练标签;对模型进行训练时拟采用Adam优化算法,利用梯度的一阶矩估计和二阶矩估计动态调整每个参数的学习率,使得每一次迭代学习率都有个确定范围,使得参数比较平稳;
步骤三,设置神经网络调参控制策略;
步骤四,利用路径平滑过程将权值矩阵表达为完整航路;
具体的,场景或者航路规划结果面积为K×Km2,据此调整矩阵的规模为N×N,无人机的航路规划采样时间为T,则在此时间内其飞行距离X应满足输入矩阵为X=(Mij)N×N,参数向量Mij=(αijij);其中的参数包括航路规划场景中抽象出的危胁度α,与目标点距离χ;输出数据为无人机转弯角度的选择概率向量;深度神经网络的输出以智能算法规划成功的航路抽象出的路径矩阵为训练标签;最后输出矩阵Y=(Tij)N×N,参数向量,其中Tij为航路点的转弯概率向量;
其中,深度神经网络具有多层卷积层、池化层与网络层;所述的卷积层自动提取特征,将输入的场景矩阵进行多次卷积变换,充分使矩阵栅格之间进行特征交互,从而自动提取出场景特征;所述的池化层在每一层卷积层之后,进行采样,从而获得更重要的特征而忽略不重要特征;所述的网络层将卷积层与池化层计算出的参数进行非线性拟合,最终得到输出矩阵,再同标签矩阵进行比较,采用逐层反向传播策略,进行参数调整,重复多次上述过程,完成对该深度神经网络的训练过程;同一层的神经元不对整个输入进行卷积,每个神经元对输入的一部分进行卷积,最后统一合并完成对整个输入的卷积。
2.根据权利要求1所述的一种基于深度学习的无人机飞行路径预测方法,其特征在于,所述的步骤三具体为根据路径规划需要利用不同特点的人工智能算法对神经网络的参数进行调整。
3.根据权利要求2所述的一种基于深度学习的无人机飞行路径预测方法,其特征在于,所述的人工智能算法是A*算法。
4.根据权利要求2所述的一种基于深度学习的无人机飞行路径预测方法,其特征在于,所述的人工智能算法是路径平滑算法。
CN201910715018.2A 2019-08-02 2019-08-02 一种基于深度学习的无人机飞行路径预测方法 Active CN110514206B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910715018.2A CN110514206B (zh) 2019-08-02 2019-08-02 一种基于深度学习的无人机飞行路径预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910715018.2A CN110514206B (zh) 2019-08-02 2019-08-02 一种基于深度学习的无人机飞行路径预测方法

Publications (2)

Publication Number Publication Date
CN110514206A CN110514206A (zh) 2019-11-29
CN110514206B true CN110514206B (zh) 2023-08-04

Family

ID=68624337

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910715018.2A Active CN110514206B (zh) 2019-08-02 2019-08-02 一种基于深度学习的无人机飞行路径预测方法

Country Status (1)

Country Link
CN (1) CN110514206B (zh)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111142557B (zh) * 2019-12-23 2020-12-22 清华大学 无人机路径规划方法、系统、计算机设备及可读存储介质
CN110941288B (zh) * 2019-12-24 2021-07-02 华中科技大学 一种用于低空航空器的自动避障装置和方法
CN111486847B (zh) * 2020-04-29 2021-10-08 华中科技大学 一种无人机导航方法及系统
CN111829527B (zh) * 2020-07-23 2021-07-20 中国石油大学(华东) 一种基于深度强化学习且顾及海洋环境要素的无人船路径规划方法
CN112161626B (zh) * 2020-09-21 2022-05-17 北京航空航天大学 一种基于航路跟踪映射网络的高可飞性航路规划方法
CN112720465A (zh) * 2020-12-15 2021-04-30 大国重器自动化设备(山东)股份有限公司 一种人工智能消毒机器人的控制方法
CN112902969B (zh) * 2021-02-03 2023-08-01 重庆大学 一种无人机在数据收集过程中的路径规划方法
CN113065499B (zh) * 2021-04-14 2022-07-01 湖南大学 基于视觉学习驱动的空中机器人集群控制方法及系统
CN113110592B (zh) * 2021-04-23 2022-09-23 南京大学 一种无人机避障与路径规划方法
CN113426044B (zh) * 2021-07-07 2022-04-26 广东诺海科技集团有限公司 一种集群无人机森林灭火方法
CN116360504B (zh) * 2023-05-31 2023-10-27 北京航空航天大学 无人机集群任务的确定方法、装置、电子设备及存储介质
CN116777095B (zh) * 2023-06-30 2024-04-12 中国南方航空股份有限公司 一种航路规划方法、装置、设备及介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106970615A (zh) * 2017-03-21 2017-07-21 西北工业大学 一种深度强化学习的实时在线路径规划方法
CN107065881A (zh) * 2017-05-17 2017-08-18 清华大学 一种基于深度强化学习的机器人全局路径规划方法
CN107817820A (zh) * 2017-10-16 2018-03-20 复旦大学 一种基于深度学习的无人机自主飞行控制方法与系统
CN108182450A (zh) * 2017-12-25 2018-06-19 电子科技大学 一种基于深度卷积网络的机载探地雷达目标识别方法
CN109870162A (zh) * 2019-04-04 2019-06-11 北京航空航天大学 一种基于竞争深度学习网络的无人机飞行路径规划方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10198011B2 (en) * 2017-07-06 2019-02-05 Top Flight Technologies, Inc. Navigation system for a drone

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106970615A (zh) * 2017-03-21 2017-07-21 西北工业大学 一种深度强化学习的实时在线路径规划方法
CN107065881A (zh) * 2017-05-17 2017-08-18 清华大学 一种基于深度强化学习的机器人全局路径规划方法
CN107817820A (zh) * 2017-10-16 2018-03-20 复旦大学 一种基于深度学习的无人机自主飞行控制方法与系统
CN108182450A (zh) * 2017-12-25 2018-06-19 电子科技大学 一种基于深度卷积网络的机载探地雷达目标识别方法
CN109870162A (zh) * 2019-04-04 2019-06-11 北京航空航天大学 一种基于竞争深度学习网络的无人机飞行路径规划方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
基于自适应模糊神经网络的机器人路径规划方法;钱夔等;《东南大学学报(自然科学版)》;20120731(第04期);全文 *

Also Published As

Publication number Publication date
CN110514206A (zh) 2019-11-29

Similar Documents

Publication Publication Date Title
CN110514206B (zh) 一种基于深度学习的无人机飞行路径预测方法
Ding et al. Multimodal safety-critical scenarios generation for decision-making algorithms evaluation
Jiang et al. Path planning for intelligent robots based on deep Q-learning with experience replay and heuristic knowledge
Grigorescu et al. Neurotrajectory: A neuroevolutionary approach to local state trajectory learning for autonomous vehicles
Botteghi et al. On reward shaping for mobile robot navigation: A reinforcement learning and SLAM based approach
CN112148008B (zh) 一种基于深度强化学习的实时无人机路径预测方法
Ibrahim et al. An improved runner-root algorithm for solving feature selection problems based on rough sets and neighborhood rough sets
CN114170789A (zh) 基于时空图神经网络的智能网联车换道决策建模方法
Ni et al. Hdpg: Hyperdimensional policy-based reinforcement learning for continuous control
CN115909027B (zh) 一种态势估计方法及装置
CN110779526A (zh) 一种路径规划方法、装置及存储介质
CN113379063B (zh) 基于在线增强学习模型的全流程任务时序智能决策方法
CN114997306A (zh) 一种基于动态贝叶斯网络的目标意图识别方法
Chin et al. A neuro-based network for on-line topological map building and dynamic path planning
Chouikhi et al. Adaptive extreme learning machine for recurrent beta-basis function neural network training
Baruah et al. Clustering as a tool for self-generation of intelligent systems: a survey
CN113625560A (zh) 玉米收获机损失率控制方法、装置、存储介质与设备
He et al. Reinforcement learning in many-agent settings under partial observability
KR102082999B1 (ko) Rce 신경망 학습 장치 및 방법
Waldock et al. Fuzzy Q-learning with an adaptive representation
Cao et al. Particle swarm optimization for convolved Gaussian process models
Via et al. Training algorithm for dendrite morphological neural network using k-medoids
CN113589810B (zh) 智能体动态自主避障运动方法、装置、服务器及存储介质
Alkhashab Data-Efficient Learning using Modular Meta-Learning
Song et al. Research on Local Path Planning for the Mobile Robot Based on QL-anfis Algorithm

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant