CN114489095B - 一种应用于变体飞行器的类脑脉冲神经网络控制方法 - Google Patents
一种应用于变体飞行器的类脑脉冲神经网络控制方法 Download PDFInfo
- Publication number
- CN114489095B CN114489095B CN202111523892.XA CN202111523892A CN114489095B CN 114489095 B CN114489095 B CN 114489095B CN 202111523892 A CN202111523892 A CN 202111523892A CN 114489095 B CN114489095 B CN 114489095B
- Authority
- CN
- China
- Prior art keywords
- aircraft
- pulse
- neural network
- variant
- control
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 45
- 238000013528 artificial neural network Methods 0.000 title claims abstract description 41
- 210000002569 neuron Anatomy 0.000 claims abstract description 41
- 239000007788 liquid Substances 0.000 claims abstract description 21
- 230000008569 process Effects 0.000 claims abstract description 18
- 238000012549 training Methods 0.000 claims description 27
- 238000004364 calculation method Methods 0.000 claims description 10
- 238000004422 calculation algorithm Methods 0.000 claims description 7
- 230000003044 adaptive effect Effects 0.000 claims description 6
- 210000004556 brain Anatomy 0.000 claims description 4
- 230000006870 function Effects 0.000 claims description 4
- 230000001133 acceleration Effects 0.000 claims description 3
- 239000000446 fuel Substances 0.000 claims description 3
- 238000012417 linear regression Methods 0.000 claims description 3
- 238000013507 mapping Methods 0.000 claims description 3
- 238000012360 testing method Methods 0.000 claims description 3
- 230000005284 excitation Effects 0.000 claims description 2
- 230000002349 favourable effect Effects 0.000 claims description 2
- 238000001914 filtration Methods 0.000 claims description 2
- 230000005764 inhibitory process Effects 0.000 claims description 2
- 238000010606 normalization Methods 0.000 claims description 2
- 230000008054 signal transmission Effects 0.000 claims description 2
- 230000008878 coupling Effects 0.000 abstract description 3
- 238000010168 coupling process Methods 0.000 abstract description 3
- 238000005859 coupling reaction Methods 0.000 abstract description 3
- 230000001537 neural effect Effects 0.000 abstract description 2
- 238000004088 simulation Methods 0.000 description 20
- 238000013461 design Methods 0.000 description 14
- 230000008859 change Effects 0.000 description 11
- 239000011159 matrix material Substances 0.000 description 9
- 230000007613 environmental effect Effects 0.000 description 8
- 238000011160 research Methods 0.000 description 6
- 230000005540 biological transmission Effects 0.000 description 4
- 210000001787 dendrite Anatomy 0.000 description 4
- 230000000694 effects Effects 0.000 description 4
- 239000000463 material Substances 0.000 description 4
- 210000000225 synapse Anatomy 0.000 description 4
- 238000010586 diagram Methods 0.000 description 3
- 230000010365 information processing Effects 0.000 description 3
- 239000012528 membrane Substances 0.000 description 3
- 210000005036 nerve Anatomy 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 238000012421 spiking Methods 0.000 description 3
- 230000009471 action Effects 0.000 description 2
- 230000006399 behavior Effects 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 230000010485 coping Effects 0.000 description 2
- 230000002964 excitative effect Effects 0.000 description 2
- 230000002401 inhibitory effect Effects 0.000 description 2
- 230000000670 limiting effect Effects 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 210000000653 nervous system Anatomy 0.000 description 2
- 239000011664 nicotinic acid Substances 0.000 description 2
- 230000036961 partial effect Effects 0.000 description 2
- 230000008447 perception Effects 0.000 description 2
- 230000036544 posture Effects 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 230000000946 synaptic effect Effects 0.000 description 2
- NAWXUBYGYWOOIX-SFHVURJKSA-N (2s)-2-[[4-[2-(2,4-diaminoquinazolin-6-yl)ethyl]benzoyl]amino]-4-methylidenepentanedioic acid Chemical compound C1=CC2=NC(N)=NC(N)=C2C=C1CCC1=CC=C(C(=O)N[C@@H](CC(=C)C(O)=O)C(O)=O)C=C1 NAWXUBYGYWOOIX-SFHVURJKSA-N 0.000 description 1
- RZVHIXYEVGDQDX-UHFFFAOYSA-N 9,10-anthraquinone Chemical compound C1=CC=C2C(=O)C3=CC=CC=C3C(=O)C2=C1 RZVHIXYEVGDQDX-UHFFFAOYSA-N 0.000 description 1
- 241000282412 Homo Species 0.000 description 1
- 210000003050 axon Anatomy 0.000 description 1
- 210000004027 cell Anatomy 0.000 description 1
- 230000003750 conditioning effect Effects 0.000 description 1
- 238000011217 control strategy Methods 0.000 description 1
- 210000003618 cortical neuron Anatomy 0.000 description 1
- 230000001808 coupling effect Effects 0.000 description 1
- 238000012938 design process Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 239000006185 dispersion Substances 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000012530 fluid Substances 0.000 description 1
- 230000005484 gravity Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000009347 mechanical transmission Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 230000003518 presynaptic effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000036962 time dependent Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05D—SYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
- G05D1/00—Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots
- G05D1/08—Control of attitude, i.e. control of roll, pitch, or yaw
- G05D1/0808—Control of attitude, i.e. control of roll, pitch, or yaw specially adapted for aircraft
- G05D1/0816—Control of attitude, i.e. control of roll, pitch, or yaw specially adapted for aircraft to ensure stability
- G05D1/0833—Control of attitude, i.e. control of roll, pitch, or yaw specially adapted for aircraft to ensure stability using limited authority control
Landscapes
- Engineering & Computer Science (AREA)
- Computer Security & Cryptography (AREA)
- Aviation & Aerospace Engineering (AREA)
- Radar, Positioning & Navigation (AREA)
- Remote Sensing (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Automation & Control Theory (AREA)
- Feedback Control In General (AREA)
Abstract
本发明涉及一种应用于变体飞行器的类脑脉冲神经网络控制方法,考虑变体飞行器模型中各种空气动力系数与变形率之间强耦合动态关系的变体飞行器模型基础上,引入一定数量的脉冲神经元模型构成小范围的网络用来模拟生物神经系统给出控制信息。在任意飞行时刻,从变体飞行器接收到的姿态和轨迹信息经脉冲神经网络系统的脉冲编码层处理,输入到脉冲神经网络液体状态机,脉冲神经网络内部拓扑结构、连接权值相应变化后被一个由无记忆的解码函数构成的解码层映射转换成控制指令。最终根据飞行器当前状态量在线调度计算增益以生成控制命令,对变体飞行器实时飞行过程中变体变结构所带来的不稳定性进行了有效消除,完成关键状态的跟踪指令。
Description
技术领域
本发明属于高速变体飞行器飞行控制仿真领域,更具体的涉及基于类脑脉冲神经网络控制变体飞行器的方法,该方法可以对变体飞行器结构切换过程进行快速稳定控 制。
背景技术
脉冲神经网络是具有生物学意义和最类似于大脑的操作机制的神经网络模型,在近年来的类脑科学的研究中,SNN一直占据着核心地位。一般来说脉冲神经元通过树 突接收外部信息,然后在细胞内部处理接收到的信息,并将其通过轴突传递给其他神经元的树突。因此可以将树突视为输入端口,将轴突视为输出端口。由于SNN内部存 在时空信息的传递,不仅具有更好的生物保真度,而且具有信息处理速度快、实时性 好、计算能力强等特点。因此更适合基于人类推理,判断和决策行为模拟等类脑的计 算。与一般的神经网络(Neural networks,NN)相比,由于SNN内部具有时空信息的传 递,因此更适合于建立类脑计算的模型,模拟类脑学习方法以及研究和应用类脑神经 形态控制。神经元之间的突触的连接强度与突触的前神经元和后神经元相对的脉冲作用时间相关的性质被称为脉冲时间依赖的可塑性,是神经系统发育、学习和记忆的神 经生物学基础。
一般的神经网络在高速飞行器中的应用也已经产生了一些成果,但随着飞行器结构设计、材料变形和动力推进领域的不断技术创新,新型变体飞行器通常会采用更加 精密的机械传动结构或智能变形材料,实现飞行任务中自身结构或形状的自适应改变。 而由于变体飞行器不同外形状态下的空气动力学结构也存在较大差异,因此传统方法便不再能保证良好的控制特性,无法满足时在线变体飞行器智能化的需求。当飞行器 高度自主地完成其任务时,它将面临未知的、非结构化的环境。研究人员不可能为飞 行器设计所有应对策略,这就要求飞行器像人类在与环境互动的过程中一样,能够自 主、自适应地学习。基于SNN的类脑计算及其应用研究可以提高基于知觉信息的类脑 自主学习,智能化飞行器的泛化和决策能力,从而提高飞行器完成任务的能力,并为 更加先进的飞行器应用奠定基础,最终实现了最高的类脑智能飞行器。将最新的STDP 研究成果应用到飞行器控制系统中,设计其神经元和突触的结构以及连接方式,使其更具仿生特性和智能信息处理能力,有望进一步推进飞行器控制系统智能化程度。
发明内容
要解决的技术问题
针对现有建模控制技术对变体变结构飞行器控制器设计的局限性,本发明提供了一种应用于变体飞行器的类脑脉冲神经网络控制方法。该方法是一种智能实时处理架 构,对变体飞行器实时飞行过程中变体变结构所带来的不稳定性进行了有效消除,满 足控制系统快速性、鲁棒性和抗干扰特性的需求,为未来实现飞行器智能控制提供了新的思路。
技术方案
一种应用于变体飞行器的类脑脉冲神经网络控制方法,其特征在于步骤如下:
步骤1:首先确定控制对象模型,由三维建模软件导出变体飞行器网格模型,通 过专业气动力学动解算工具得到飞行包络线中不同形状和结构的空气动力学系数,插 值得到各轴向力和力矩的数学表达形式,建立变体飞行器的运动学和动力学模型;
步骤2:对步骤1中得到的模型在速度、高度和变形率三个维度进行平衡点求解,得到其它飞行器姿态、轨迹状态量在这些平衡点处的值;将平衡点设置为训练数据集 的初始点,得到包络线内不同初始速度、高度、外形下受传统线性变参数鲁棒控制的 飞行姿态和轨迹信息,同时保存各平衡点处的鲁棒控制增益矩阵,构建训练集;
步骤3:由于各个状态信息在大小、单位上具有较大差异,因此将训练集中的离 散化姿态轨迹信息根据归一化算法消除数量级上的差距,在充分保留原有信息特征的 基础上进一步压缩数据的复杂度,从而得到有利于脉冲神经网络学习的输入集;
步骤4:针对变体飞行器姿态、轨迹和控制信息的种类和输入集量级和维度,结 合各类型脉冲神经元的参数和特性,对于每种飞行器关键状态量,利用液体状态机算 法初始化相应的子网络,其中每个脉冲神经网络的初始拓扑和连接方式由服从高斯分 布的随机种子决定;
步骤5:在网络训练过程中使用线性回归算法来训练每个脉冲神经元输入的读数权重,脉冲神经元以特定的频率向三维空间内相邻的神经元发送脉冲信号传递信息, 并且随着训练学习的过程不断改变网络拓扑结构,转换连接的兴奋和抑制类型,由脉 冲神神经网络生成的栅格数据预测当前状态的飞行器控制指令脉冲信号;
步骤6:由无记忆的解码函数滤波映射得到的脉冲信号,建立一个可根据当前飞行器外形和姿态实时变化的自适应变增益控制器;在变体飞行器不同初始状态和跟踪 指令下与未经脉冲神经网络学习训练的线性变参数鲁棒控制器进行对比试验,检验所 设计脉冲神经网络控制器的快速性、鲁棒性和抗干扰特性。
本发明进一步的技术方案:步骤1中所述的变体飞行器的运动学和动力学模型为:
其中T代表推力,D为阻力,g为重力加速度,m为飞行器的质量,L代表升力 的合力,M表示俯仰力矩,Jz为是俯仰轴的转动惯量。选取了速度V、弹道倾角θ、 飞行高度h、攻角α、俯仰角速度ωz作为状态变量。将燃料当量比δt,舵偏角δe以及 变形率δb作为被控输入,即u=[δe,δt,δb]。
有益效果
本发明提出的一种应用于变体飞行器的类脑脉冲神经网络控制方法,在考虑变体飞行器模型中各种空气动力系数与变形率之间强耦合动态关系的变体飞行器模型基础上,引入一定数量的脉冲神经元模型构成小范围的网络用来模拟生物神经系统给出控 制信息。该网络包括脉冲编码层、脉冲神经网络液体状态机以及脉冲信号解码层。在 任意飞行时刻t,从变体飞行器接收到的姿态和轨迹信息经脉冲神经网络系统的脉冲编 码层LM,处理,输入到脉冲神经网络液体状态机xM(t),脉冲神经网络内部拓扑结构、 连接权值相应变化后被一个由无记忆的解码函数fM构成的解码层映射转换成控制指 令u(t)。由于脉冲神经网络(Spiking Neural Networks,SNN)的特性,输入信号的影响 会在一定的时间延迟后传输到输出,该时间由液体状态机的延迟可塑性参数决定,最 终根据飞行器当前状态量在线调度计算增益以生成控制命令,对变体飞行器实时飞行 过程中变体变结构所带来的不稳定性进行了有效消除,完成关键状态的跟踪指令,并 且满足控制系统快速性、鲁棒性和抗干扰特性的需求,为未来实现飞行器智能控制提 供了新的思路。
与常规飞行器的设计相比,高速变体飞行器控制需要新的智能控制方法的需求主要表现在以下几个方面:
作为一类特殊的变结构飞行器,现有的控制方法无法用来指导模型本身剧烈变化的变体飞行器的控制器设计,传统方法因为需要精确固定的模型才能够进行控制器的 设计,而变体变结构带来的影响颠覆了以往的设计思路,因此传统线性鲁棒控制的作 用大大减弱。全包络线范围内的控制器设计往往同时关心不止一个构型或局部的性能指标,而现有的高速变体飞行器设计方法都是针对单个外形结构进行迭代,具有仿生 结构的类脑脉冲神经网络架构可以给出全构型下良好的控制能力。
高速变体飞行器各个气动模型间强烈耦合,人为地拆分通道进行控制器设计得到的结果往往与耦合设计控制器得到的结果大相径庭,因此控制器设计过程中必须充分 考虑飞行器变结构和气动特性的耦合效应,脉冲神经网络可以在现有数据样本的情况 下完成训练学习,以设定的优化目标控制对象。
在近年来的类脑科学的研究中,SNN一直占据着核心地位。相比于人工神经网络(Artificial Neural Networks,ANNs),由于SNN内部存在时空信息的传递,不仅具有 更好的生物保真度,而且具有信息处理速度快、实时性好、计算能力强等特点,因此 更适合基于大脑的推理,判断和决策行为模拟,以及其他类脑神经计算和控制任务。
当飞行器高度自主地完成其任务时,它将面临未知的、非结构化的环境。研究人员不可能为飞行器设计所有应对策略,这就要求飞行器像人类在与环境互动的过程中 一样,能够自主、自适应地学习。基于SNN的类脑计算可以提高基于知觉信息的类脑自主学习,智能化飞行器的泛化和决策能力,从而提高飞行器完成任务的能力,并为 更加先进的飞行器应用奠定基础,最终实现了最高的类脑智能飞行器。
附图说明
附图仅用于示出具体实施例的目的,而并不认为是对本发明的限制,在整个附图中,相同的参考符号表示相同的部件。
图1为根据本发明实施例的高超声速巡航飞行器参考外形;
图2为根据本发明实施例的应用于变体飞行器的类脑脉冲神经网络控制方法工作流程示意图;
图3为根据本发明实施例的常规脉冲神经元模型分类;
图4为根据本发明实施例的SNN网络仿真模型;
图5为根据本发明实施例的离散化处理结果;
图6为根据本发明实施例的飞行器轨迹集的控制增益定律;
图7为根据本发明实施例的变体飞行器状态曲线;
图8为根据本发明实施例的自适应增益变化曲线;
图9为根据本发明实施例的气动系数变化曲线;
图10为根据本发明实施例的气动力变化曲线;
图11为根据本发明实施例的环境参数变化曲线;
图12为根据本发明实施例的SNN网络尖峰输出;
图13为根据本发明实施例的脉冲神经网络权重变化。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图和实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发 明,并不用于限定本发明。此外,下面描述的本发明各个实施方式中所涉及到的技术 特征只要彼此之间未构成冲突就可以相互组合。
步骤一:使用空气动力学系数计算软件求解如图1所示变体飞行器的不同形状和结构的气动力学系数,定义如式(1)所示形式的变体飞行器的运动学和动力学模型,并 合理设定如式的变体飞行器环境参数。
其中T代表推力,D为阻力,g为重力加速度,m为飞行器的质量,L代表升力 的合力,M表示俯仰力矩,Jz为是俯仰轴的转动惯量。选取了速度V、弹道倾角θ、 飞行高度h、攻角α、俯仰角速度ωz作为状态变量。将燃料当量比δt,舵偏角δe以及 变形率δb作为被控输入,即u=[δe,δt,δb]。变体飞行器爬升时,冲压发动机开机提供 推力,具体系数计算方式参考如下公式:
前面研究了各个参数和气动数据,由于飞行器的飞行速度和飞行高度跨度较大,因此将空气密度,声速和动压等环境因素代入模型以进行插值拟合以构建相关的仿真 模块,使用GB1920-80标准大气模型的气体关系计算密度。
表1大气环境模型参数
步骤二:对步骤一得到的模型在速度、高度和变形率三个维度进行平衡点求解,得到其它飞行器姿态、轨迹状态量在这些平衡点处的值。
对于高速变体飞行器(1),首先假设
选择攻角α、马赫数Ma作为调度变量。系统平衡点序列可按方程求解
由(3)和(4)可得
因此可得θe=0,ωze=0,接着将(2)中的系数代入(5)中,然后依据调度变参数 he、Mae和δbe确定平衡点和该状态下得平衡输入量,即
其中下标e表示该变量在平衡点的值,将平衡点设置为训练数据集的初始点,得到包络线内不同初始he、Mae和δbe下受传统线性变参数鲁棒控制的飞行姿态和轨迹信息 (如表2所示),同时保存各平衡点处的鲁棒控制增益矩阵,构建训练集。
表2平衡点求解部分结果
步骤三:将飞行器闭环控制仿真轨迹构建成为训练数据集,具有不同初始状态的飞行轨迹训练集存储在文件中。接着将对飞行器的轨迹输出进行处理并将其转换为 SNN网络可识别的峰值类型,然后将其导入已建立的液体状态机模型中。在离线模拟中获得的轨迹信息在数值上有很大差异,例如高度h=2000m和俯仰角速度 ωz=0.2rad/s。如果同时直接将其输入到液体状态机系统,则无法完全考虑较小的数量, 因此需要标准化时变参数,即定义Xstate_normalized∈[-1,1]为如下形式:
Xstate_normalized=(2Xstate-(Xmax(state)+Vmin(state)))/(Vmax(state)-Vmin(state)) (7)
Xstate表示包含变体飞行器各状量轨迹信息的矩阵,式(7)用于处理飞行器在不同初始点的连续轨迹作为神经元索引的离散信号,从而离散化受电子仪器信号调节启发 的模拟值,使模拟值从0发生偏移/偏置,并通过系数进行压缩/扩展,使尖峰信号分布 在给定范围内(见图5)。飞行器的轨迹输出通过这两个附加参数进行归一化,处理后的数据可用作SNN模型训练仿真的输入信号。在算法预处理之后,变形车辆控制输 入命令的一组典型结果如图5所示,图中纵坐标表示网络中各脉冲神经元的序号,横 坐标为仿真时间。
步骤四:当将标准化轨迹信息输入到液体状态机模型中时,首先将其成比例转换I(t)∈[0,1],然后根据上述SNN的划分(每个输入对应一部分尖峰神经元),将该范 围内的信息线性映射到相应的部分液体状态机模型ω1,…,120,ω121,…,240,ω241,,…,360,ω361,…,480,ω481,…,600。每个输入轨迹数据对应的偏置和增益值不同, 为保证输入液体状态机信号在一定范围内均匀分布,将液体分为五部分。每一部分神 经元从相应的轨迹输入(不同初始状态下的状态曲线)接收尖峰信号。在模拟中,信 息由当前激活的尖峰神经元的数量表示,并以当前步长输出。
结合脉冲神经元参数如图3和特性如图2,对于每种状态轨迹输入,创建如图4 所示对应的子网络,每种网络包含部分神经元,连接代表神经元之间的突触,箭头表 示连接方向,方形为兴奋性连接,圆形为抑制性连接,一些边缘神经元没有连接。SNN 网络神经元数目的选择根据以往文献中的经验,网络框架参考图2,并使用简化的代 码来处理飞行器不同单位的轨迹输入。最后,获得尖峰输入以训练SNN模型。
当运行液体状态机模型模拟时,初始膜电位u0∈[13.5,14.9]mV。I&F神经元的初始 连接是随机初始化的,并遵循以下分布:
其中,P(a*,b*)代表液体状态机模型中两个尖峰神经元之间连接的概率,下标指 示神经元是兴奋性的还是抑制性的。D(a,b)代表两个尖峰神经元之间的欧几里得距离。为了更真实地模拟生物大脑皮层神经元的反应,根据等式(8)表示的概率,还激活了与 激活的神经元相连的三个神经元。可以看出,这种高斯分布的可能性很小:
步骤五:在本过程中设定学习过程最终发生在神经元之间的突触部位,突触的联系强度随着突触前后神经元的活动而变化。SNN接收与训练数据集分离的输入峰值以 模拟液体状态机模型。在每个模拟步骤中,液体状态机膜低通滤波器的输出都以二维阵列的形式保存。这将为训练集中的每个轨迹输入创建一个500×600的矩阵,其中500 代表时间,轨迹模拟步长为0.1s,600是SNN中神经元的数量。
当使用液体状态机模型框架时,通常使用线性回归来学习将读数连接到液体 ω1~ω600的权重。式(10)所代表的最小化问题可以通过经典的最小二乘(Least Squares,LS)方法来解决。这里使用Scikit-learn(0.20.1)的Ridge Regression函数的广义线性模型(Ordinary Least Square-OLS)及其默认设置。如式(11)所示,该Python工具箱在 经典的LS方法(χ是正则化参数)的基础上进行了一些改进。与经典LS不同,即使 X的不是满秩,也可以解决极值问题。
在仿真工作中X由液体状态机输出膜低通滤波器的液体尖峰参数τm=30ms要学习的变量值和读数权重组成,y是生成尖峰学习输出信息所需的归一化轨迹状态值 (离散尖峰形式),w表示尖峰传输的输出权重通过上面提到的回归工具箱迭代地计 算每组神经元中的权重。为了改善结果,将μ=0,σ=0.1的高斯白噪声(Gaussian White Noise,GWN)添加到X矩阵,并将σ=0.01添加到y。
实例中使用了内置的SNN来离线学习常规控制器中由变体飞行器提供的飞行轨迹和反馈增益。让SNN以相同的方式学习新的反馈增益矩阵,然后使用测试中的内置 更改来控制飞行器的纵向模型,以获得飞行器形状切换的仿真曲线。
步骤六:前面详细介绍了分布的均值,方差和特定方法,以通过随机处理定义具有高斯分布特征的SNN中连接的液体状态机神经元之间的尖峰信息的权重值,以确保 每组SNN模拟的独立性。需要说明的是,在液体状态机模型的输出过程中,也需要进 行类似的处理,并且在输入信号时通过唯一的参数进行相反的处理,然后通过膜低通 滤波器输出SNN学习结果。在这里,我们构造一个3D增益矩阵K125×3×5,125表示训 练轨迹的数量,3表示输入量,5表示影响输入量的五个状态量。绘制并观察控制增益 矩阵的变化规律见图6。
结果表明,平衡点处的明显参数变化与主要参数变化之间存在一定的关系,如速度,高度和变形率。反馈增益在数量级上,但与α和θ相关的变化更为明显。由于这 两个数量本身相对较小,因此增益值更加敏感,并且值较大,这两者在一起显得更加 引人注目。在这种情况下,可以从这些平衡点中学习以找到与状态量的关系,使用SNN 进行插值或回归训练,获取关系,然后从当前状态获取可变增益控制反馈矩阵,然后进行命令值的初始点模拟。
根据所实施实例的内容,可以获得以下形式的反馈控制增益矩阵集:
其中kinput,state代表飞行器状态与输入之间的反馈增益关系。在图2所示的训练框架 下,将图6所示的变体飞行器控制增益数据输入到SNN中,以使神经元之间的链接适 应此特性,从而获得在线飞行器控制命令,设计了以下控制策略:
a)在包络线内,根据飞行器的当前形状在最接近的平衡点选择使用传统的二次最优型控制器。
b)像传统控制器一样,切换控制会根据飞行过程中的状态自动选择最合适的控制器。设计变量,设计距离和初始状态之间的关系如式(12)所示。
c)SNN具有可变增益。SNN根据前面的内容训练和学习飞行器当前状态与输入 之间的关系,并在飞行过程中不断调整输入与状态之间的关系以完成飞行任务。这样 使用的自适应可变增益控制器如式(13)所示。
变体飞行器在速度为1050m/s,高度为11000m,和迎角为0°的初始状态。当高度 调节指令增加同时调节速度[100,0.05,0.05,3000,0.05]的仿真中,考虑更加复杂的环境参数,将重力系数g,空气密度ρ,动压q,马赫数Ma等参数都以表1的计算方式在飞 行过程中实时更新,再由这些量去解算气动力系数和环境系数,增加观测环境检测飞 行过程中气动参数和气动力矩的变化,仿真结果如图7、图8所示。从仿真结果中可 以得出在高度跟踪中,变增益控制更快速,而速度跟踪中,切换控制具有更小的超调 量。同时跟踪速度和高度的情况时,大范围跟踪指令切换控制更好,小范围跟踪指令变增益优势更明显。
出现这种情况可能是因为切换所依据的规律具有更少的保守性,所以能在比较快速的变化中获得更大胆的控制输入,从而得到比较好的性能,而变增益在小范围内变 化时所在线产生的控制指令,也同样带来了性能的提升。与前两种控制方法相比,SNN 控制器经过训练后可以更快,更稳定地动态调节增益,实现变体飞行器的在线自适应 变形率跟踪控制,在变增益控制下的动态响应性能也有了一定的提高。
图9横轴代表时间,而纵轴代表变体飞行器在3种控制器下分别的气动参数和气动力矩的变化曲线,并且可以看出,相比于固定不变的控制增益,切换控制和自适应 控制都更加充分的调动了飞行器的各个动力性能,实现快速的机动以跟踪飞行指令。
图10中力矩的突变则是由于在建模过程中与变形率相关插值的不连续性导致的,并不影响变体飞行器的状态量变化,自适应变增益脉冲神经网络控制都表现出了更好 的控制效果,并且实现了速度和高度更加快速的跟踪控制。
此外在控制的同时,切换控制和变增益控制也通过更小的机动,实现了更加高效的控制方式,额外增加的环境信息,由于这些参数在最初就是和高度的关系比较密切, 而动压在维度上与当前变体飞行器的速度有二阶的关系,图11所呈现的环境参数变化 曲线也能够符合预期的设想。
图12是SNN内部的仿真栅格图,从中我们可以隐约地看到飞行器的轨迹信息。 在图12中,纵轴表示20*5*6个神经元,横轴表示时间序列,坐标点表示训练周期后 每个神经元的输出结果。观察从1到600的神经元序列,可以找到以下轨迹信息:V接 近110,α接近160,俯仰速率ωz接近240,俯仰角接近,飞行高度h接近330和俯仰角 θ接近510。这些是由SNN网络训练的车辆状态轨迹的输出尖峰序列。在模拟距离内, 随着步数的增加,传输的尖峰也会从前一个神经元传输到后一个神经元。
从图13中可以看出,在各种轨迹期间增益矩阵的变化关系。图13中的每个图片 代表一个SNN控制器输出通道,该通道描述了20×5×6神经元。在当前数据集轨迹输 入训练条件下,回归算法获得的神经元权重发生变化。图13中每个坐标点的颜色更接 近注释中的顶部,表明该点已被训练以获得更高的权重比。因此,如果坐标的颜色低于注释,则意味着在训练后该点的重要性降低。
需要说明的是,对于前述的各方法实施例,为了简便描述,故将其都表述为一系列的方法组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限 制,因为依据本发明,某些步骤可以采用其它顺序或者同时进行。其次,本领域技术 人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定都是本发明所必须的。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其它实施例的相关描述。在本说明书的描述中,参考术语“一个实施例”、 “一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实 施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示 例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例 中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说 明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
以上为对本发明所提供的应用于变体飞行器的类脑脉冲神经网络控制方法的描述, 对于本领域的一般技术人员,依据本发明实施例的思想,在具体实施方式及应用范围上均会有改变之处,综上,本说明书内容不应理解为对本发明的限制,凡在本发明的 精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围 之内。
Claims (2)
1.一种应用于变体飞行器的类脑脉冲神经网络控制方法,其特征在于步骤如下:
步骤1:首先确定控制对象模型,由三维建模软件导出变体飞行器网格模型,通过专业气动力学动解算工具得到飞行包络线中不同形状和结构的空气动力学系数,插值得到各轴向力和力矩的数学表达形式,建立变体飞行器的运动学和动力学模型;
步骤2:对步骤1中得到的模型在速度、高度和变形率三个维度进行平衡点求解,得到飞行器姿态、轨迹状态量在这些平衡点处的值;将平衡点设置为训练数据集的初始点,得到包络线内不同初始速度、高度、外形下受传统线性变参数鲁棒控制的飞行姿态和轨迹信息,同时保存各平衡点处的鲁棒控制增益矩阵,构建训练集;
步骤3:由于各个状态信息在大小、单位上具有较大差异,因此将训练集中的离散化姿态轨迹信息根据归一化算法消除数量级上的差距,在充分保留原有信息特征的基础上进一步压缩数据的复杂度,从而得到有利于脉冲神经网络学习的输入集;
步骤4:针对变体飞行器姿态、轨迹和控制信息的种类和输入集量级和维度,结合各类型脉冲神经元的参数和特性,对于每种飞行器关键状态量,利用液体状态机算法初始化相应的子网络,其中每个脉冲神经网络的初始拓扑和连接方式由服从高斯分布的随机种子决定;
步骤5:在网络训练过程中使用线性回归算法来训练每个脉冲神经元输入的读数权重,脉冲神经元以特定的频率向三维空间内相邻的神经元发送脉冲信号传递信息,并且随着训练学习的过程不断改变网络拓扑结构,转换连接的兴奋和抑制类型,由脉冲神神经网络生成的栅格数据预测当前状态的飞行器控制指令脉冲信号;
步骤6:由无记忆的解码函数滤波映射得到的脉冲信号,建立一个可根据当前飞行器外形和姿态实时变化的自适应变增益控制器;在变体飞行器不同初始状态和跟踪指令下与未经脉冲神经网络学习训练的线性变参数鲁棒控制器进行对比试验,检验所设计脉冲神经网络控制器的快速性、鲁棒性和抗干扰特性。
2.根据权利要求1所述的一种应用于变体飞行器的类脑脉冲神经网络控制方法,其特征在于:步骤1中所述的变体飞行器的运动学和动力学模型为:
其中T代表推力,D为阻力,g为重力加速度,m为飞行器的质量,L代表升力的合力,M表示俯仰力矩,Jz为是俯仰轴的转动惯量;选取了速度V、弹道倾角θ、飞行高度h、攻角α、俯仰角速度ωz作为状态变量;将燃料当量比δt,舵偏角δe以及变形率δb作为被控输入,即u=[δe,δt,δb];q为动压,Isp为比冲。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111523892.XA CN114489095B (zh) | 2021-12-11 | 2021-12-11 | 一种应用于变体飞行器的类脑脉冲神经网络控制方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111523892.XA CN114489095B (zh) | 2021-12-11 | 2021-12-11 | 一种应用于变体飞行器的类脑脉冲神经网络控制方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114489095A CN114489095A (zh) | 2022-05-13 |
CN114489095B true CN114489095B (zh) | 2023-12-26 |
Family
ID=81494938
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111523892.XA Active CN114489095B (zh) | 2021-12-11 | 2021-12-11 | 一种应用于变体飞行器的类脑脉冲神经网络控制方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114489095B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116080688B (zh) * | 2023-03-03 | 2023-07-11 | 北京航空航天大学 | 一种类脑启发的智能驾驶视觉辅助方法、装置及存储介质 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107479383A (zh) * | 2017-09-05 | 2017-12-15 | 西北工业大学 | 基于鲁棒设计的高超声速飞行器神经网络复合学习控制方法 |
CN107526296A (zh) * | 2017-09-05 | 2017-12-29 | 西北工业大学 | 基于预测建模的高超声速飞行器神经网络学习控制方法 |
CN108762098A (zh) * | 2018-08-20 | 2018-11-06 | 西北工业大学 | 基于复合学习的非最小相位飞行器神经网络控制方法 |
CN111665857A (zh) * | 2020-06-21 | 2020-09-15 | 西北工业大学 | 基于复合智能学习的变体飞行器控制方法 |
WO2021012752A1 (zh) * | 2019-07-23 | 2021-01-28 | 中建三局智能技术有限公司 | 一种基于脉冲神经网络的短程跟踪方法及系统 |
CN113126643A (zh) * | 2021-04-28 | 2021-07-16 | 西安电子科技大学 | 一种高超声速飞行器智能鲁棒再入制导方法及系统 |
-
2021
- 2021-12-11 CN CN202111523892.XA patent/CN114489095B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107479383A (zh) * | 2017-09-05 | 2017-12-15 | 西北工业大学 | 基于鲁棒设计的高超声速飞行器神经网络复合学习控制方法 |
CN107526296A (zh) * | 2017-09-05 | 2017-12-29 | 西北工业大学 | 基于预测建模的高超声速飞行器神经网络学习控制方法 |
CN108762098A (zh) * | 2018-08-20 | 2018-11-06 | 西北工业大学 | 基于复合学习的非最小相位飞行器神经网络控制方法 |
WO2021012752A1 (zh) * | 2019-07-23 | 2021-01-28 | 中建三局智能技术有限公司 | 一种基于脉冲神经网络的短程跟踪方法及系统 |
CN111665857A (zh) * | 2020-06-21 | 2020-09-15 | 西北工业大学 | 基于复合智能学习的变体飞行器控制方法 |
CN113126643A (zh) * | 2021-04-28 | 2021-07-16 | 西安电子科技大学 | 一种高超声速飞行器智能鲁棒再入制导方法及系统 |
Non-Patent Citations (1)
Title |
---|
脉冲神经网络:模型、学习算法与应用;程龙;刘洋;;控制与决策(第05期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN114489095A (zh) | 2022-05-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112162564B (zh) | 基于模仿学习和强化学习算法的无人机飞行控制方法 | |
CN108803321A (zh) | 基于深度强化学习的自主水下航行器轨迹跟踪控制方法 | |
Lin | Adaptive critic autopilot design of bank-to-turn missiles using fuzzy basis function networks | |
CN108334677B (zh) | 一种基于gru网络的uuv实时避碰规划方法 | |
CN111240345B (zh) | 基于双bp网络增强学习框架的水下机器人轨迹跟踪方法 | |
Kamanditya et al. | Elman recurrent neural networks based direct inverse control for quadrotor attitude and altitude control | |
CN114489095B (zh) | 一种应用于变体飞行器的类脑脉冲神经网络控制方法 | |
CN113377121A (zh) | 一种基于深度强化学习的飞行器智能抗扰动控制方法 | |
CN116225055A (zh) | 一种复杂环境下基于状态分解的无人机自主航迹规划算法 | |
Roudbari et al. | Generalization of ANN-based aircraft dynamics identification techniques into the entire flight envelope | |
CN114237268A (zh) | 一种基于深度强化学习的无人机强鲁棒姿态控制方法 | |
Abdulla et al. | Roll control system design using auto tuning LQR technique | |
Chen et al. | The motion controller based on neural network s-plane model for fixed-wing UAVs | |
Toha et al. | Dynamic nonlinear inverse-model based control of a twin rotor system using adaptive neuro-fuzzy inference system | |
Blumel et al. | Fuzzy autopilot design using a multiobjective evolutionary algorithm | |
Omkar et al. | Identification of helicopter dynamics based on flight data using nature inspired techniques | |
CN108459614B (zh) | 一种基于cw-rnn网络的uuv实时避碰规划方法 | |
Zhao et al. | Consciousness neural network for path tracking control of floating objects at sea | |
CN115796021A (zh) | 一种基于神经网络的变体飞行器自适应pid控制参数整定方法 | |
Kamalasadan | A new generation of adaptive control: An intelligent supervisory loop approach | |
CN116774576A (zh) | 基于神经网络间接估计的水下航行器动力学黑盒建模方法 | |
Khantsis et al. | UAV controller design using evolutionary algorithms | |
Xin et al. | Online hybrid learning to speed up deep reinforcement learning method for commercial aircraft control | |
Taha et al. | Small-scale helicopter system identification model using recurrent neural networks | |
CN115407664B (zh) | 一种基于神经网络训练的非程序制导方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |