CN114373360B - 飞行模拟器智能训练系统、方法及装置 - Google Patents

飞行模拟器智能训练系统、方法及装置 Download PDF

Info

Publication number
CN114373360B
CN114373360B CN202111551956.7A CN202111551956A CN114373360B CN 114373360 B CN114373360 B CN 114373360B CN 202111551956 A CN202111551956 A CN 202111551956A CN 114373360 B CN114373360 B CN 114373360B
Authority
CN
China
Prior art keywords
training
flight
simulator
subsystem
plan
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202111551956.7A
Other languages
English (en)
Other versions
CN114373360A (zh
Inventor
张超
田菀玉
何耀宇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tsinghua University
Original Assignee
Tsinghua University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tsinghua University filed Critical Tsinghua University
Priority to CN202111551956.7A priority Critical patent/CN114373360B/zh
Publication of CN114373360A publication Critical patent/CN114373360A/zh
Application granted granted Critical
Publication of CN114373360B publication Critical patent/CN114373360B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09BEDUCATIONAL OR DEMONSTRATION APPLIANCES; APPLIANCES FOR TEACHING, OR COMMUNICATING WITH, THE BLIND, DEAF OR MUTE; MODELS; PLANETARIA; GLOBES; MAPS; DIAGRAMS
    • G09B9/00Simulators for teaching or training purposes
    • G09B9/02Simulators for teaching or training purposes for teaching control of vehicles or other craft
    • G09B9/08Simulators for teaching or training purposes for teaching control of vehicles or other craft for teaching control of aircraft, e.g. Link trainer
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/20Education
    • G06Q50/205Education administration or guidance
    • G06Q50/2057Career enhancement or continuing education service

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Human Resources & Organizations (AREA)
  • Educational Administration (AREA)
  • Theoretical Computer Science (AREA)
  • Strategic Management (AREA)
  • Educational Technology (AREA)
  • Tourism & Hospitality (AREA)
  • Economics (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Development Economics (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Aviation & Aerospace Engineering (AREA)
  • Game Theory and Decision Science (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提供了一种飞行模拟器智能训练系统、方法及装置,其中的系统包括个性化训练子系统、飞行训练子系统、辅助驾驶子系统和电子教员子系统;个性化训练子系统用于根据各飞行学员的学习特征定制个性化训练计划;飞行训练子系统用于基于个性化训练计划对飞行学员进行空战飞行训练并输出飞行训练输出参数;辅助驾驶子系统用于在飞行学员进行空战飞行训练时为飞行学员提供辅助信息;电子教员子系统基于智能电子教员模型通过飞行训练输出参数对飞行学员进行飞行训练质量评估。通过本发明提供的飞行模拟器智能训练系统能够解决现有的飞行训练模拟器不能有效制定个性化训练计划,且需要教员等人员进行人为参与从而严重影响学员培训工作效率的问题。

Description

飞行模拟器智能训练系统、方法及装置
技术领域
本发明涉及飞行模拟器技术领域,更为具体地,涉及一种飞行模拟器智能训练系统、方法及装置。
背景技术
飞行模拟器是一种在地面上模拟飞行器在空中飞行的仿真设备。根据用途不同,飞行模拟器一般可分为三类:工程模拟器、空管模拟器和训练模拟器。其中,工程模拟器主要用于飞行器的研究设计、仿真试验以及对现有飞行器的改进;空管模拟器即空中交通管制模拟器,主要用于空中交通管制员和指挥员的培训,以及对空管系统的验证和确认;训练模拟器起初仅用于军事训练,现已广泛用于飞行员的飞行训练,包括驾驶技术和空战技术等。
随着飞行仿真技术和虚拟现实技术的发展与成熟,现有的飞行模拟器可以达到极高的模拟逼真度,并能够通过预设的视景系统、运动系统和音响系统等实现对环境的模拟、飞行控制、视觉显示、仪表显示和震感反馈等模拟仿真效果,从而在视觉、听觉、触觉等各方面最大程度地还原了真机飞行场景。
相比于真机训练,采用飞行训练模拟器进行训练只需在地面上的模拟器座舱即可达到在空中真机飞行的逼真度,所以更加安全。此外,模拟器的成本更低,所以可以使飞行训练更加经济和高效。另外,为了辅助飞行学员进行飞行训练,飞行训练模拟器往往还包括教员控制台,并配备有相应的飞行教练员。教练员可以通过教员控制台设置并更改飞行训练的环境参数、飞行科目等训练条件,并对飞行学员的飞行动作进行指导和评估。
在实际过程中,鉴于使用飞行训练模拟器进行训练的诸多优点,现在飞行学员培训时往往需要先在飞行模拟器上完成一定课时的飞行训练,然后才能到实装机上进行实际飞行。
然而,虽然模拟仿真技术已经非常成熟,飞行训练模拟器的逼真级别已经足够用来进行飞行训练,但现有的飞行训练模拟器的在训练飞行员方面仍然完全依赖于飞行教员对学员的评估和指导,即完全依赖于人力对学员的飞行训练结果进行评估反馈,效率非常有限。基于此,亟需一种能够在解放人力物力的同时获得高效的飞行训练效果的飞行训练模拟器。
发明内容
鉴于上述问题,本发明的目的是提供一种能够解决现有的飞行训练模拟器不能有效制定个性化训练计划,且需要教员等人员进行人为参与从而严重影响学员培训工作效率的问题。
本发明提供的飞行模拟器智能训练系统,包括个性化训练子系统、飞行训练子系统、辅助驾驶子系统和电子教员子系统;其中,
所述个性化训练子系统用于根据各飞行学员的学习特征定制相应的个性化训练计划;
所述飞行训练子系统用于基于所述个性化训练计划对所述飞行学员进行空战飞行训练并输出相应的飞行训练输出参数;
所述辅助驾驶子系统用于在所述飞行学员通过所述飞行训练子系统进行所述空战飞行训练时为所述飞行学员提供辅助信息;
所述电子教员子系统基于预设的智能电子教员模型通过所述飞行训练输出参数对所述飞行学员进行飞行训练质量评估。
优选地,所述飞行模拟器智能训练系统还包括训练数据库,所述训练数据库包括所述历史训练数据库、训练计划数据库以及教员经验知识库,其中,
所述历史训练数据库用于存储所有飞行学员的学习特征;
所述训练计划数据库用于存储所述个性化训练计划的制定策略;
所述教员经验知识库用于存储用于构建所述智能电子教员模型的教员评分策略和历史人工教员的评估数据。
优选地,所述个性化训练子系统包括身份认证模块、特征提取模块以及计划制定模块;其中,
所述身份认证模块用于在各飞行学员进行所述空战飞行训练前对各飞行学员完成身份认证;
所述特征提取模块用于根据所述身份认证的认证结果在所述历史训练数据库中提取各飞行学员的学习特征;
所述计划制定模块用于根据所述学习特征和所述训练计划数据库中相应的制定策略为各飞行学员制定相应的个性化训练计划。
优选地,所述飞行训练子系统包括空战飞行训练模块和训练参数输出模块;其中,所述空战飞行训练模块用于基于所述个性化训练计划对所述飞行学员进行空战飞行训练,所述训练参数输出模块用于输出相应的所述飞行训练输出参数;并且,所述空战飞行训练模块包括虚拟对抗训练模块;其中,
所述虚拟对抗训练模块用于根据预设的智能驾驶员决策模型生成虚拟敌机;并在所述虚拟敌机基于所述个性化训练计划进行环境感知和战机感知后,通过所述智能驾驶员决策模型为所述飞行学员提供人机虚拟对抗训练。
优选地,所述空战飞行训练模块还包括组网训练模块;其中,
所述组网训练模块用于将至少两个异地的所述飞行模拟器智能训练系统之间以及所述飞行模拟器智能训练系统与实机之间进行组网;并通过组网后的异地的所述飞行模拟器智能训练系统以及所述实机对所述飞行学员进行组网对抗训练、组网编队飞行训练以及组网多机协同作战训练。
优选地,所述飞行模拟器智能训练系统与外部预设的飞行模拟器相连,其中,所述飞行模拟器包括飞行模拟器仿真系统和运动平台,所述飞行模拟器仿真系统用于向所述飞行模拟器智能训练系统输入训练任务输入参数,所述训练任务输入参数包括状态信息参数和操纵信息参数,所述运动平台用于向所述飞行模拟器智能训练系统输入模拟器运动数据;并且,
所述辅助驾驶子系统包括决策规划模块、监控告警模块和运动控制模块;其中,
所述决策规划模块用于基于预设的智能驾驶员决策模型生成与所述状态信息参数相对应的辅助决策规划信息,并将所述辅助决策规划信息提供给所述飞行学员;
所述监控告警模块用于基于预设的监控告警模型生成与所述状态信息参数相对应的监控告警信息,并将所述监控告警信息提供给所述飞行学员;
所述运动控制模块用于根据所述操纵信息参数和所述模拟器运动数据基于预设的运动控制算法生成与所述操纵信息参数相对应的运动控制信息,并将所述运动控制信息送至所述运动平台以实现对所述运动平台的控制。
优选地,所述电子教员子系统包括实时动作评估模块和总体质量评估模块,其中,
所述实时动作评估模块用于根据所述教员经验知识库中的所述教员评分策略和所述历史人工教员的评估数据构建所述智能电子教员模型,并使用所述智能电子教员模型对所述飞行学员的实时的飞行训练输出参数进行实时动作质量评估,并生成相应的一组实时动作质量评估结果;
所述总体质量评估模块用于根据所述飞行学员在飞行训练过程中的全部的飞行训练输出参数以及所述实时动作质量评估结果生成总体质量评估结果,并根据所述总体质量评估结果更新所述学员历史训练数据库。
优选地,所述飞行模拟器智能训练系统还包括数据处理子系统和界面显示子系统,其中,所述数据处理子系统用于对飞行模拟器数据进行异常值处理和滑动滤波,并将处理后的所述飞行模拟器数据输入至所述个性化训练子系统,所述特征提取模块根据处理后的所述飞行模拟器数据自所述历史训练数据库中实时提取所述飞行学员的学习特征;其中,所述飞行模拟器数据包括所述训练任务输入参数和所述模拟器运动数据;
所述界面显示子系统用于接收来自所述个性化训练子系统、所述飞行训练子系统、所述辅助驾驶子系统以及所述电子教员子系统的交互信息并进行界面显示。
此外,本发明还提供一种飞行模拟器智能训练方法,包括:
通过所述个性化训练子系统根据各飞行学员的学习特征定制相应的个性化训练计划;
通过所述飞行训练子系统基于所述个性化训练计划对所述飞行学员进行空战飞行训练并输出相应的飞行训练输出参数;
通过所述辅助驾驶子系统在所述飞行学员通过所述飞行训练子系统进行所述空战飞行训练时为所述飞行学员提供辅助信息;
通过所述电子教员子系统基于预设的智能电子教员模型通过所述飞行训练输出参数对所述飞行学员进行飞行训练质量评估。
另一方面,本发明还提供一种飞行模拟器智能训练装置,包括个性化训练单元、飞行训练单元、辅助驾驶单元、电子教员单元、训练数据库单元、数据处理单元、以及界面显示单元;其中,
所述个性化训练系统用于根据各飞行学员的学习特征定制相应的个性化训练计划;
所述飞行训练系统用于基于所述个性化训练计划对所述飞行学员进行空战飞行训练并输出相应的飞行训练输出参数;
所述辅助驾驶系统用于在所述飞行学员通过所述飞行训练子系统进行所述空战飞行训练时为所述飞行学员提供辅助信息;
所述电子教员系统基于预设的智能电子教员模型通过所述飞行训练输出参数对所述飞行学员进行飞行训练质量评估;
所述训练数据库单元包括所述历史训练数据库子单元、训练计划数据库子单元以及教员经验知识库子单元,其中,所述历史训练数据库子单元用于存储所有飞行学员的学习特征;所述训练计划数据库子单元用于存储所述个性化训练计划的制定策略;所述教员经验知识库子单元用于存储用于构建所述智能电子教员模型的教员评分策略和历史人工教员的评估数据;
所述数据处理单元用于对飞行模拟器数据进行异常值处理和滑动滤波,并将处理后的所述飞行模拟器数据输入至所述个性化训练子系统,特征提取模块根据处理后的所述飞行模拟器数据自所述历史训练数据库中实时提取所述飞行学员的学习特征;
所述界面显示单元用于接收来自所述个性化训练单元、所述飞行训练单元、所述辅助驾驶单元以及所述电子教员单元的交互信息并进行界面显示。
本发明提供的飞行模拟器智能训练系统通过设置飞行训练子系统、电子教员子系统以及辅助驾驶子系统能够实现学员飞行模拟器的自动化训练,能够进一步解放人力物力,提升学员训练工作的效率;此外,通过设定相应的智能线路规划算法、智能驾驶员模型等能够显示提升飞行模拟器智能训练系统的各项功能的精度,比如航迹规划模块确定最优飞行路径的精度,辅助决策模块生成辅助决策信息的精度。
为了实现上述以及相关目的,本发明的一个或多个方面包括后面将详细说明并在权利要求中特别指出的特征。下面的说明以及附图详细说明了本发明的某些示例性方面。然而,这些方面指示的仅仅是可使用本发明的原理的各种方式中的一些方式。此外,本发明旨在包括所有这些方面以及它们的等同物。
附图说明
通过参考以下结合附图的说明及权利要求书的内容,并且随着对本发明的更全面理解,本发明的其它目的及结果将更加明白及易于理解。在附图中:
图1为本发明的飞行模拟器智能训练系统的结构框图;
图2为本发明的飞行模拟器智能训练系统的硬件架构图;
图3为本发明的个性化训练子系统结构图;
图4为本发明的飞行训练子系统结构图;
图5为本发明的辅助驾驶子系统结构图;
图6为本发明的电子教员子系结构图;
图7为根据本发明实施例的个性化训练子系统算法流程图;
图8为根据本发明实施例的DQN算法结构图;
图9为根据本发明实施例的组网训练模块网络结构图;
图10为根据本发明实施例的航迹规划算法;
图11为根据本发明实施例的电子教员ANN算法原理图;
在所有附图中相同的标号指示相似或相应的特征或功能。
具体实施方式
在下面的描述中,出于说明的目的,为了提供对一个或多个实施例的全面理解,阐述了许多具体细节。然而,很明显,也可以在没有这些具体细节的情况下实现这些实施例。在其它例子中,为了便于描述一个或多个实施例,公知的结构和设备以方框图的形式示出。
在本发明的描述中,需要说明的是,术语“中心”、“上”、“下”、“左”、“右”、“竖直”、“水平”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制;术语“第一”、“第二”、“第三”仅用于描述目的,而不能理解为指示或暗示相对重要性;此外,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本发明中的具体含义。
图1示出了本发明的飞行模拟器智能训练系统的结构,由图1可知,本发明提供的飞行模拟器智能训练系统包括,数据处理子系统、个性化训练子系统、飞行训练子系统、辅助驾驶子系统、电子教员子系统、界面显示子系统和训练数据库;其中,该个性化训练子系统用于根据各飞行学员的学习特征定制相应的个性化训练计划;该飞行训练子系统用于基于该个性化训练计划对该飞行学员进行空战飞行训练并输出相应的飞行训练输出参数;该辅助驾驶子系统用于在该飞行学员通过该飞行训练子系统进行该空战飞行训练时为该飞行学员提供辅助信息;该电子教员子系统基于预设的智能电子教员模型通过该飞行训练输出参数对该飞行学员进行飞行训练质量评估。
具体地,该训练数据库包括该历史训练数据库、训练计划数据库以及教员经验知识库,其中,该历史训练数据库用于存储所有飞行学员的学习特征;该训练计划数据库用于存储该个性化训练计划的制定策略;该教员经验知识库用于存储用于构建该智能电子教员模型的教员评分策略和历史人工教员的评估数据。
具体地,该个性化训练子系统包括身份认证模块、特征提取模块以及计划制定模块;其中,该身份认证模块用于在各飞行学员进行该空战飞行训练前对各飞行学员完成身份认证;该特征提取模块用于根据该身份认证的认证结果在该历史训练数据库中提取各飞行学员的学习特征;该计划制定模块用于根据该学习特征和该训练计划数据库中相应的制定策略为各飞行学员制定相应的个性化训练计划。
进一步地,该飞行训练子系统包括空战飞行训练模块和训练参数输出模块;其中,该空战飞行训练模块用于基于该个性化训练计划对该飞行学员进行空战飞行训练,该训练参数输出模块用于输出相应的该飞行训练输出参数;并且,该空战飞行训练模块包括虚拟对抗训练模块;其中,
该虚拟对抗训练模块用于根据预设的智能驾驶员决策模型生成虚拟敌机;并在该虚拟敌机基于该个性化训练计划进行环境感知和战机感知后,通过该智能驾驶员决策模型为该飞行学员提供人机虚拟对抗训练。
此外,该空战飞行训练模块还包括组网训练模块;其中,该组网训练模块用于将至少两个异地的该飞行模拟器智能训练系统之间以及该飞行模拟器智能训练系统与实机之间进行组网;并通过组网后的异地的该飞行模拟器智能训练系统以及该实机对该飞行学员进行组网对抗训练、组网编队飞行训练以及组网多机协同作战训练。
需要说明的是,该飞行模拟器智能训练系统与外部预设的飞行模拟器相连,其中,该飞行模拟器包括飞行模拟器仿真系统和运动平台,该飞行模拟器仿真系统用于向该飞行模拟器智能训练系统输入训练任务输入参数,该训练任务输入参数包括状态信息参数和操纵信息参数,该运动平台用于向该飞行模拟器智能训练系统输入模拟器运动数据;并且,
该辅助驾驶子系统包括决策规划模块、监控告警模块和运动控制模块;其中,
该决策规划模块用于基于预设的智能驾驶员决策模型生成与该状态信息参数相对应的辅助决策规划信息,并将该辅助决策规划信息提供给该飞行学员;
该监控告警模块用于基于预设的监控告警模型生成与该状态信息参数相对应的监控告警信息,并将该监控告警信息提供给该飞行学员;
该运动控制模块用于根据该操纵信息参数和该模拟器运动数据基于预设的运动控制算法生成与该操纵信息参数相对应的运动控制信息,并将该运动控制信息送至该运动平台以实现对该运动平台的控制。
具体地,该电子教员子系统包括实时动作评估模块和总体质量评估模块,其中,该实时动作评估模块用于根据该教员经验知识库中的该教员评分策略和该历史人工教员的评估数据构建该智能电子教员模型,并使用该智能电子教员模型对该飞行学员的实时的飞行训练输出参数进行实时动作质量评估,并生成相应的一组实时动作质量评估结果;
该总体质量评估模块用于根据该飞行学员在飞行训练过程中的全部的飞行训练输出参数以及该实时动作质量评估结果生成总体质量评估结果,并根据该总体质量评估结果更新该学员历史训练数据库。
在本发明的一个具体的实施方式中,图2示出了本发明的飞行模拟器智能训练系统的硬件架构图,该飞行模拟器智能训练系统搭载的计算机通过光纤和以太网等与外界预设的飞行模拟器的飞行模拟器仿真系统所在的计算机直接相连,完成数据的双向传输,其中飞行模拟器仿真系统用于输出训练任务输入参数,包括飞行运动参数、训练任务(如起落航线五边飞行)和环境条件(如晴天、大风、小雪等)等。
具体地,该个性化训练子系统获取外部飞行模拟器仿真系统生成的训练任务输入参数,并经界面显示子系统的交互界面对学员进行身份认证后,基于个性化训练计划的制定策略根据各飞行学员的学习特征定制相应的详细的个性化训练计划;该飞行训练子系统获取个性化训练子系统输出的个性化训练计划并基于该个性化训练计划对飞行学员进行空战飞行训练并生成相应的飞行训练输出参数(敌机和组网信息);该辅助驾驶子系统用于该飞行学员在通过该飞行训练子系统进行空战飞行训练时为该飞行学员进行辅助;该电子教员子系统基于预设的智能电子教员模型通过该飞行训练输出参数对该飞行学员进行飞行训练质量评估。
具体地,对系统输入的飞行模拟器数据(包括该训练任务输入参数和该模拟器运动数据),要先经过数据处理子系统,数据处理子系统负责实时接收来自飞行模拟器仿真系统输出的飞机运动位置(三维位置坐标)、速度(三轴速度)、加速度(三轴加速度)、姿态角、姿态角速率、坡度、高度等飞行状态参数(即状态信息参数),油门开度、压杆倾角等杆、舵、油门的驾驶员操纵输入参数(即操纵信息参数);设置的训练任务和环境条件等参数(以上参数均为训练任务输入参数),以及模拟器运动数据(由飞行模拟器的运动平台参数)并对相关的飞行模拟器数据进行异常值处理和滑动滤波等预处理操作,再经预设的数据总线将经过预处理的各飞行模拟器数据输入至后续的个性化训练子系统。
另外,为进一步对本发明提供的飞行模拟器智能训练系统的工作原理进行说明,下面详细介绍各子系统的工作原理。
1.个性化训练子系统
具体地,个性化训练子系统用于针对飞行学员的个体差异定制飞行训练计划,具体包括基本驾驶操作技术、复杂飞行条件下的任务飞行、空战作战技术、多机协同任务飞行等不同层次和类型的训练计划。如图3所示,个性化训练子系统主要包括数据库和个性化训练计划制定算法两部分,其中飞行学员历史训练数据库包含了该飞行学员的历史训练数据,其中蕴含着该学员的个人掌握情况等个人特征,训练计划数据库为计划制定算法提供飞行训练大纲、人工教员制定策略等可依据的策略。
更为具体地,个性化训练计划制定算法可采用如图7所示的具体结构。首先学员通过交互界面使用唯一ID号进行身份认证,然后判断是否自定义训练计划,若判断为否则在学员历史训练数据库中获取该学员的历史训练数据集并进行学员特征提取。学员的历史训练数据集可记为X={x1,x2,L,xn},X∈Rm×n,其中xi表示训练集中的第i条训练记录,包含了该次训练信息,如训练科目、训练次数、训练时长、各阶段得分、飞行天气条件等级、作战态势难度等级等m维数据,通过主成分分析、线性判别分析和人工神经网络等方法可提取出众多训练数据中该用户的关键特征。即将该矩阵经投影矩阵W∈Rd×n(d=m)投影到一个低维空间,提取的特征矩阵Y={y1,y2,L,yn},Y∈Rd×n可由下式得到
Y=WTX
然后依据训练计划数据库中飞行大纲和人工教员制定的训练计划所规定的子任务集,生成训练任务集C={c1,c2,L,cl},其中ci表示第i个子任务对应的特征向量。构建学员特征与训练任务到掌握程度得分向量的映射模型,即构建非线性模型得到s=F(Y,C),其中s={s1,s2,L,sl}是当前学员对各训练子任务掌握情况的得分向量,即得分越低表示掌握情况越差。按得分由低到高排序的训练任务即为包含该学员个人特征的个性化训练计划。
2.飞行训练子系统
具体地,飞行训练子系统用于飞行学员的空战飞行训练,如图4所示包括虚拟对抗功能和组网训练功能。其中虚拟对抗功能通过人工智能算法构建一个虚拟的敌机,并接收来自个性化训练子系统的定制化训练计划信息,可以生成个性化的自主作战和对抗计划。并通过交互接口与模拟器座舱系统和飞行仿真子系统相连,可以与飞行学员驾驶的模拟器完成人机对抗训练;组网训练功能通过组网接口与多个异地模拟器或实装机进行组网,从而实现多机飞行任务的训练。
更为具体地,对于飞行训练子系统,可以采用强化学习人工智能算法预先建立一个智能驾驶员决策模型,该智能驾驶员模型可用于控制虚拟飞机作为模拟器的虚拟敌机参与人机对抗训练,即完成虚拟对抗训练。
进一步地,智能驾驶员决策模型可采用基于策略的DQN(Deep Q-learning,深度Q学习)强化学习方法进行构建,其算法结构如图8所示,将模拟器模拟的飞行器作为智能体,根据飞行器的速度加速度约束、高度约束、最大偏航角约束、最大转弯转弯半径约束等约束条件以及武器系统投放和运动控制等规则,建立智能体仿真模型,根据飞行环境条件、地图信息、敌机飞行控制方式和武器系统投放规则等信息建立环境仿真模型,再根据作战规则设立奖惩制度。这样随着智能体与环境的不断交互,智能体就能自主学习到使得总体奖励最大的策略,DQN就是用DNN(Deep Neural Network,深度神经网络)来拟合得到在状态s下采取动作a的奖励之和Q(s,a),其更新表达式为:
Figure BDA0003417421480000111
其中st,at分别表示t时刻的状态和采取的动作,α和γ是权重因子,可取0-1之间的任意值,r表示在状态s下采取动作a获得的奖励,Q(st,at)表示在状态st下采取动作at的奖励总和,Q'是更新Q后的值。
在进行组网训练时,通过移动通信链路接口进行异地飞行模拟器智能训练系统之间,以及飞行模拟器与实机之间的组网。为保证多机进行飞行训练时互操作的实时性,大容量飞行训练数据的可靠性传输,可采用具有高速、大容量和低时延特点的第五代移动通信网络进行异地模拟器之间,以及模拟器与实装机之间的互连组网。如图9所示,A、B和C是搭载该飞行模拟器智能训练系统的飞行模拟器,其中A位于甲地,可与位于乙地的B和位于丙地的C通过移动通信链路接口接入5G移动通信网络,除异地模拟器外,带有5G移动通信链路接口的实装机D也可以接入5G网络与飞行模拟器系统共同组成智能训练交互网络。异地模拟器的训练数据和模拟器飞参数据,以及实装机的空地链路回传数据等可以通过5G网络进行传输共享,组网训练模块通过接收数据总线上异地模拟器和实装机的数据并载入自身训练系统,即可进一步完成多机对抗训练、编队飞行和多机协同作战等训练。
此处,还需要说明的是,智能驾驶员决策模型也可以采用其他的智能驾驶员算法进行构建,不局限于DQN强化学习算法,如还可采用SARSA(State-Action-Reward-State-Action,状态-行动-奖励-状态-行动),Q-learning(Q学习)和Policy Gradient(策略梯度)等算法,只要能够实现智能驾驶员决策模型的构建过程均可。并且,本发明此处主要是对各中算法的应用,因此,具体过程在此不在赘述。
3.辅助驾驶子系统
具体地,如图5所示,辅助决策子系统通过机载传感器获取来自个性化训练子系统和飞行训练子系统的飞行模拟器的飞行环境参数等外部信息,和飞机运动参数等自身状态进行态势感知,并根据当前作战态势通过智能辅助驾驶算法为驾驶员提供辅助决策信息(速度规划、武器规划和航迹规划等)和告警信息(动作告警和状态监控等),同时通过运动控制算法(速度控制和姿态控制等)控制模拟器运动平台的运动。
该辅助驾驶子系统充当飞行训练过程中驾驶员的智能助手,通过为驾驶员提供决策规划和危险警告等,辅助飞行学员完成飞行训练任务。辅助驾驶子系统包括决策规划模块、监控告警模块和运动控制模块。其中,决策规划模块可采用飞行训练子系统中与构建虚拟敌机类似的基于DQN的智能驾驶员决策模型。如图8所示,其中的状态感知输入替换成当前驾驶模拟器的态势感知信息,其中的动作执行输出作为辅助决策信息通过界面显示子系统呈现给驾驶员。
具体地,航迹规划还可通过单独的智能路径规划算法实现。接收来自训练任务输入参数中的飞行环境参数和运动参数,然后通过预设的智能线路规划算法,得出满足设定的飞机运动限制约束条件的最优飞行路径,并通过界面显示子系统实时显示给飞行学员,作为完成飞行任务时的航迹参考。进一步地,航迹规划模块接收数据总线中的地图信息、飞机位置参数和传感器数据(均为训练任务输入参数),通过智能路径规划算法,得出满足设定的飞机运动限制约束条件的最优路径。智能路径规划算法可选择A*算法。A*(A-Star)算法是一种静态路网中求解最短路径最有效的直接搜索方法,也是解决许多搜索问题的有效算法。算法中的距离估算值与实际值越接近,最终搜索速度越快。
A*算法的具体使用过程为:首先根据获得的地图信息进行地图栅格化,将其划分成位置点,即节点,并根据地势和空中交通状况等信息建立地图状态矩阵,每个网格的值用0-1的数来表示,其中0表示可飞行位置,1表示因障碍等原因不可到达的位置。通过对飞机当前节点到所有可到达的下一节点的路径进行搜索和代价评估,从而选出最佳的子路径,然后更新当前节点,再继续不断迭代搜索,直至抵达目标位置。
其中,A*算法的代价评估表达式为:
F(n)=G(n)+H(n)
其中G(n)表示从当前节点到节点n的评估代价,H(n)表示从节点n到终点的评估代价,F(n)表示从当前节点经由节点n到达终点的总评估代价。
此外,A*算法还需要两个节点列表:Open表用来记录为找到最优路径可选择的所有节点,Closed表用来记录不会再被选择的节点。另外,在实时搜索并更新最优路径的同时,需要实时接收传感器获取的周围状态信息,并进行异常状态判断,一旦出现异常状态则进入中断优先处理异常状态,即将地图尺度缩小到飞机位置点的附近区域,并细化网格建立局部地图状态矩阵,然后通过路径规划算法实现局部路径规划,从而修正现有的全局最优路径。整个航迹规划算法流程图如图10所示。
需要说明的是,该智能线路规划算法也可采用其他的航迹规划算法,不局限于A*算法,如还可采用D*算法、Dijkstra算法以及人工神经网络和遗传算法等,只要能够实现线路规划的算法均可。
动作告警模块基于预设的飞行训练参数数据库判断该实时飞行参数是否异常,若判定异常,则该动作告警模块告警;该运动控制模块基于获取的运动平台状态信息为操纵算法提供运动控制信息。进一步地,监控告警模块接收飞行学员的实时输入参数和飞机运动参数(均为实时飞行参数),在飞行学员进行起飞、着陆、盘旋和斤斗等基本动作训练时,根据飞行训练大纲的要求对飞行科目相关参数进行严格监督。在学员驾驶飞行模拟器进行训练的过程中,一旦相关参数值超出大纲要求标准阈值则输出告警信息,及时提醒飞行学员进行动作调整。具体地,动作告警模块依据飞行训练大纲对各科目关于飞行参数的规定,然后通过预设的逻辑推理系统实时分析接收到的各项飞行参数,当参数值与飞行训练参数数据库不一致时,即触发动作告警信号,该告警信息通过交互界面呈现给飞行学员。
4.电子教员子系统
具体地,电子教员子系统通过数字化智能技术取代传统人工教员对飞行训练质量进行评估,包括实时动作评估模块和总体质量评估模块,可采用ANN(Artificial NeuralNetwork,人工神经网络)取代传统教员对飞行训练质量进行评估。如图6所示,其中,实时动作评估模块根据预设的智能电子教员模型依据教员经验知识库对该飞行学员的该实时飞行参数进行实时动作质量评估,并生成相应的一组实时动作质量评估结果,总体质量评估模块在飞行训练结束后,根据该飞行学员在飞行训练过程中的全部飞行训练参数以及该实时动作质量评估结果对整个飞行训练过程进行总体评估,生成总体质量评估结果,并使用该评估结果更新该学员的学员历史训练数据库。
具体地,采用监督学习的方式用ANN实现质量评估(包括实时动作质量评估和总体质量评估),如图11所示,电子教员ANN算法包括两个阶段,即离线训练阶段和在线评估阶段。在离线训练阶段,需要采集大量飞行模拟器训练数据,包括飞参数据和教员评分数据,通过监督学习的方式从大量数据中学习人工教员的知识经验,形成ANN智能电子教员模型;在在线评估阶段,实时获得当前飞行学员的训练参数,输入ANN智能电子教员模型得到实时动作评估结果,在整个飞行训练结束后,再根据整个飞行训练过程中的全部训练数据以及实时动作评估结果,给出总体质量评估结果,并通过界面显示子系统反馈给飞行学员,从而达到高效的训练效果。
具体地,训练数据库子系统负责存储和管理学员的历史训练数据、训练计划数据和教员经验知识数据。其中学员历史训练数据包括飞行器运动状态参数、飞行环境条件参数、学员信息以及电子教员的评估数据等在内的全部训练数据,可供电子教员子系统完成离线阶段的ANN网络训练以及在学员飞行训练过程中各子系统的数据调用和存储等;训练计划数据包括飞行大纲和人工教员制定的训练计划及其制定方法、规则和策略;教员经验知识数据包括依据飞行训练大纲对各科目关于飞行参数的规定,可作为监控告警模块的参考信息,此外,还包括教员对学员飞行动作质量的评分方法、规则和策略,以及历史的人工教员评估数据,可作为电子教员评估子系统进行实时评估和总体评估的训练数据。
此外,还需要说明的是,该数据处理子系统、个性化训练子系统、飞行训练子系统、辅助驾驶子系统、电子教员子系统、界面显示子系统和训练数据库仅对其实现的功能以及整个系统的架构做出约束,实现时可选用具体算法,如简单逻辑判断类算法、知识推理类算法、神经网络和决策树等人工智能算法等。
需要说明的是,上述涉及到的各个子系统和各个功能模块可以根据需求单独几个在一起使用,也可以共同使用,例如,飞行模拟器智能训练系统可以包括个性化训练子系统、飞行训练子系统、辅助驾驶子系统、电子教员子系统、界面显示子系统和训练数据库中的任意一个或多个子系统的组合,从而实现部分所需的功能。且该辅助驾驶子系统可以包括决策规划功能、监控告警功能和运动控制功能中任意一个或全部模块;电子教员子系统可以包括实时动作评估和总体质量评估中任意一个或全部模块。
另外,为进一步说明本发明提供的还提供的飞行模拟器智能训练系统的工作过程,本发明还提供一种飞行模拟器智能训练方法,包括:
通过该个性化训练子系统根据各飞行学员的学习特征定制相应的个性化训练计划;
通过该飞行训练子系统基于该个性化训练计划对该飞行学员进行空战飞行训练并输出相应的飞行训练输出参数;
通过该辅助驾驶子系统在该飞行学员通过该飞行训练子系统进行该空战飞行训练时为该飞行学员提供辅助信息;
通过该电子教员子系统基于预设的智能电子教员模型通过该飞行训练输出参数对该飞行学员进行飞行训练质量评估。
此外,本发明还提供一种飞行模拟器智能训练装置,包括个性化训练单元、飞行训练单元、辅助驾驶单元、电子教员单元、训练数据库单元、数据处理单元、以及界面显示单元;其中,
该个性化训练系统用于根据各飞行学员的学习特征定制相应的个性化训练计划;
该飞行训练系统用于基于该个性化训练计划对该飞行学员进行空战飞行训练并输出相应的飞行训练输出参数;
该辅助驾驶系统用于在该飞行学员通过该飞行训练子系统进行该空战飞行训练时为该飞行学员提供辅助信息;
该电子教员系统基于预设的智能电子教员模型通过该飞行训练输出参数对该飞行学员进行飞行训练质量评估;
该训练数据库单元包括该历史训练数据库子单元、训练计划数据库子单元以及教员经验知识库子单元,其中,该历史训练数据库子单元用于存储所有飞行学员的学习特征;该训练计划数据库子单元用于存储该个性化训练计划的制定策略;该教员经验知识库子单元用于存储用于构建该智能电子教员模型的教员评分策略和历史人工教员的评估数据;
该数据处理单元用于对飞行模拟器数据进行异常值处理和滑动滤波,并将处理后的该飞行模拟器数据输入至该个性化训练子系统,特征提取模块根据处理后的该飞行模拟器数据自该历史训练数据库中实时提取该飞行学员的学习特征;
该界面显示单元用于接收来自该个性化训练单元、该飞行训练单元、该辅助驾驶单元以及该电子教员单元的交互信息并进行界面显示。
需要说明的是,该飞行模拟器智能训练系统在实际应用时可以是搭载了相应功能单元的一个计算机或多个计算机组成的集群,各子系统之间通过数据总线进行数据双向传输。并且,该搭载了飞行模拟器智能训练系统的计算机通过光纤和以太网与飞行模拟器仿真系统所在的计算机相连接,并进行数据双向传输。此外,本发明提供的上述单元,是指一种能够被电子设备处理器所执行,并且能够完成固定功能的一系列计算机程序段,其存储在电子设备的存储器中。
如上参照附图以示例的方式描述根据本发明的飞行模拟器智能训练系统。但是,本领域技术人员应当理解,对于上述本发明所提出的飞行模拟器智能训练系统,还可以在不脱离本发明内容的基础上做出各种改进。因此,本发明的保护范围应当由所附的权利要求书的内容确定。

Claims (10)

1.一种飞行模拟器智能训练系统,其特征在于,包括个性化训练子系统、飞行训练子系统、辅助驾驶子系统、电子教员子系统以及训练数据库,所述训练数据库包括历史训练数据库、训练计划数据库以及教员经验知识库;其中,
所述个性化训练子系统用于根据各飞行学员的学习特征定制相应的个性化训练计划;所述个性化训练计划包括基本驾驶操作技术、复杂飞行条件下的任务飞行、空战作战技术、多机协同任务飞行;
所述个性化训练子系统包括训练数据库和个性化训练计划制定算法两部分;其中,所述训练数据库包括历史训练数据库和训练计划数据库;所述历史训练数据库包含飞行学员的历史训练数据,其中蕴含着飞行学员的个人特征;所述训练计划数据库为所述个性化训练计划制定算法、提供飞行训练大纲、人工教员制定策略;
所述个性化训练计划制定算法包括:
飞行学员通过交互界面使用唯一ID号进行身份认证,然后判断是否自定义训练计划;
若判断为否,则在所述历史训练数据库中获取该飞行学员的历史训练数据集,并进行学员特征提取,所述历史训练数据集记为
Figure DEST_PATH_IMAGE002
,包含训练信息,如训练科目、训练次数、训练时长、各阶段得分、飞行天气条件等级、作战态势难度等级
Figure DEST_PATH_IMAGE004
维数据;其中,
Figure DEST_PATH_IMAGE006
表示所述历史训练数据集中的第
Figure DEST_PATH_IMAGE008
条训练记录;
通过主成分分析、线性判别分析以及人工神经网络提取所述历史训练数据集中该飞行学员的关键特征,即将所述历史训练数据集经投影矩阵
Figure DEST_PATH_IMAGE010
投影到一个低维空间,提取的关键特征矩阵
Figure DEST_PATH_IMAGE012
可由下式得到:
Figure DEST_PATH_IMAGE014
;其中,d和n表示为维度,R表示线性空间;
依据所述训练计划数据库中的飞行大纲和人工教员制定的训练计划所规定的子任务集,生成训练任务集
Figure DEST_PATH_IMAGE016
,其中
Figure DEST_PATH_IMAGE018
表示第i个子任务对应的特征向量;
构建该飞行学员的关键特征矩阵与练任务集到掌握程度得分向量的映射模型,即构建非线性模型得到
Figure DEST_PATH_IMAGE020
,其中
Figure DEST_PATH_IMAGE022
是该飞行学员对各训练子任务掌握情况的得分向量,即得分越低表示掌握情况越差;
按得分由低到高排序的训练任务即为包含该飞行学员的个人特征的个性化训练计划;
所述飞行训练子系统用于基于所述个性化训练计划对所述飞行学员进行空战飞行训练并输出相应的飞行训练输出参数,包括虚拟对抗功能和组网训练功能;
其中,所述虚拟对抗功能包括:
通过人工智能算法构建一个虚拟的敌机,并接收来自所述个性化训练子系统定制的个性化训练计划,以生成个性化的自主作战和对抗计划;并通过交互接口与模拟器座舱系统和飞行仿真子系统相连,与飞行学员驾驶的模拟器完成人机对抗训练;以及,采用强化学习人工智能算法预先建立一个智能驾驶员决策模型,所述智能驾驶员模型可用于控制虚拟飞机作为模拟器的虚拟敌机参与人机对抗训练,即完成虚拟对抗训练;
其中,所述智能驾驶员决策模型采用基于策略的DQN强化学习方法进行构建;包括:将模拟器模拟的飞行器作为智能体,根据飞行器的速度加速度约束、高度约束、最大偏航角约束、最大转弯转弯半径约束以及武器系统投放规则和运动控制规则,建立智能体仿真模型;根据飞行环境条件、地图信息、敌机飞行控制方式和武器系统投放规则,建立环境仿真模型;再根据作战规则设立奖惩制度;随着智能体仿真模型与环境仿真模型的不断交互,智能体仿真模型就能自主学习到使得总体奖励最大的策略;其中,DQN强化学习方法就是用DNN来拟合得到在状态
Figure DEST_PATH_IMAGE024
下采取动作
Figure DEST_PATH_IMAGE026
的奖励之和
Figure DEST_PATH_IMAGE028
,其更新表达式为:
Figure DEST_PATH_IMAGE030
其中
Figure DEST_PATH_IMAGE032
分别表示
Figure DEST_PATH_IMAGE034
时刻的状态和采取的动作,
Figure DEST_PATH_IMAGE036
Figure DEST_PATH_IMAGE038
是权重因子,可取0-1之间的任意值,
Figure DEST_PATH_IMAGE040
表示在状态
Figure DEST_PATH_IMAGE024A
下采取动作
Figure DEST_PATH_IMAGE043
获得的奖励,
Figure DEST_PATH_IMAGE045
表示在状态
Figure DEST_PATH_IMAGE047
下采取动作
Figure DEST_PATH_IMAGE049
的奖励总和,
Figure DEST_PATH_IMAGE051
是更新
Figure DEST_PATH_IMAGE053
后的值;
所述组网训练功能包括:通过组网接口与多个异地模拟器或实装机进行组网,实现多机飞行任务的训练;其中,采用第五代移动通信网络进行异地模拟器之间,以及模拟器与实装机之间的互连组网;其中,异地模拟器的训练数据、模拟器飞参数据以及实装机的空地链路回传数据通过5G网络进行传输共享,通过接收数据总线上异地模拟器和实装机的数据并载入自身训练系统,以完成多机对抗训练、编队飞行训练以及多机协同作战训练;
所述辅助驾驶子系统用于在所述飞行学员通过所述飞行训练子系统进行所述空战飞行训练时为所述飞行学员提供辅助信息;
所述电子教员子系统基于预设的智能电子教员模型通过所述飞行训练输出参数对所述飞行学员进行飞行训练质量评估。
2.如权利要求1所述的飞行模拟器智能训练系统,其特征在于,还包括训练数据库,所述训练数据库包括所述历史训练数据库、训练计划数据库以及教员经验知识库,其中,
所述历史训练数据库用于存储所有飞行学员的学习特征;
所述训练计划数据库用于存储所述个性化训练计划的制定策略;
所述教员经验知识库用于存储用于构建所述智能电子教员模型的教员评分策略和历史人工教员的评估数据。
3.如权利要求2所述的飞行模拟器智能训练系统,其特征在于,
所述个性化训练子系统包括身份认证模块、特征提取模块以及计划制定模块;其中,
所述身份认证模块用于在各飞行学员进行所述空战飞行训练前对各飞行学员完成身份认证;
所述特征提取模块用于根据所述身份认证的认证结果在所述历史训练数据库中提取各飞行学员的学习特征;
所述计划制定模块用于根据所述学习特征和所述训练计划数据库中相应的制定策略为各飞行学员制定相应的个性化训练计划。
4.如权利要求3所述的飞行模拟器智能训练系统,其特征在于,所述飞行训练子系统包括空战飞行训练模块和训练参数输出模块;其中,所述空战飞行训练模块用于基于所述个性化训练计划对所述飞行学员进行空战飞行训练,所述训练参数输出模块用于输出相应的所述飞行训练输出参数;并且,所述空战飞行训练模块包括虚拟对抗训练模块;其中,
所述虚拟对抗训练模块用于根据预设的智能驾驶员决策模型生成虚拟敌机;并在所述虚拟敌机基于所述个性化训练计划进行环境感知和战机感知后,通过所述智能驾驶员决策模型为所述飞行学员提供人机虚拟对抗训练。
5.如权利要求4所述的飞行模拟器智能训练系统,其特征在于,
所述空战飞行训练模块还包括组网训练模块;其中,
所述组网训练模块用于将至少两个异地的所述飞行模拟器智能训练系统之间以及所述飞行模拟器智能训练系统与实机之间进行组网;并通过组网后的异地的所述飞行模拟器智能训练系统以及所述实机对所述飞行学员进行组网对抗训练、组网编队飞行训练以及组网多机协同作战训练。
6.如权利要求5所述的飞行模拟器智能训练系统,其特征在于,
所述飞行模拟器智能训练系统与外部预设的飞行模拟器相连,其中,所述飞行模拟器包括飞行模拟器仿真系统和运动平台,所述飞行模拟器仿真系统用于向所述飞行模拟器智能训练系统输入训练任务输入参数,所述训练任务输入参数包括状态信息参数和操纵信息参数,所述运动平台用于向所述飞行模拟器智能训练系统输入模拟器运动数据;并且,
所述辅助驾驶子系统包括决策规划模块、监控告警模块和运动控制模块;其中,
所述决策规划模块用于基于预设的智能驾驶员决策模型生成与所述状态信息参数相对应的辅助决策规划信息,并将所述辅助决策规划信息提供给所述飞行学员;
所述监控告警模块用于基于预设的监控告警模型生成与所述状态信息参数相对应的监控告警信息,并将所述监控告警信息提供给所述飞行学员;
所述运动控制模块用于根据所述操纵信息参数和所述模拟器运动数据基于预设的运动控制算法生成与所述操纵信息参数相对应的运动控制信息,并将所述运动控制信息送至所述运动平台以实现对所述运动平台的控制。
7.如权利要求6所述的飞行模拟器智能训练系统,其特征在于,
所述电子教员子系统包括实时动作评估模块和总体质量评估模块,其中,
所述实时动作评估模块用于根据所述教员经验知识库中的所述教员评分策略和所述历史人工教员的评估数据构建所述智能电子教员模型,并使用所述智能电子教员模型对所述飞行学员的实时的飞行训练输出参数进行实时动作质量评估,并生成相应的一组实时动作质量评估结果;
所述总体质量评估模块用于根据所述飞行学员在飞行训练过程中的全部的飞行训练输出参数以及所述实时动作质量评估结果生成总体质量评估结果,并根据所述总体质量评估结果更新所述学员历史训练数据库。
8.如权利要求7所述的飞行模拟器智能训练系统,其特征在于,还包括数据处理子系统和界面显示子系统,其中,
所述数据处理子系统用于对飞行模拟器数据进行异常值处理和滑动滤波,并将处理后的所述飞行模拟器数据输入至所述个性化训练子系统,所述特征提取模块根据处理后的所述飞行模拟器数据自所述历史训练数据库中实时提取所述飞行学员的学习特征;其中,所述飞行模拟器数据包括所述训练任务输入参数和所述模拟器运动数据;
所述界面显示子系统用于接收来自所述个性化训练子系统、所述飞行训练子系统、所述辅助驾驶子系统以及所述电子教员子系统的交互信息并进行界面显示。
9.一种如权利要求1所述的飞行模拟器智能训练系统的训练方法,其特征在于,包括:
通过所述个性化训练子系统根据各飞行学员的学习特征定制相应的个性化训练计划;所述个性化训练计划包括基本驾驶操作技术、复杂飞行条件下的任务飞行、空战作战技术、多机协同任务飞行;
所述个性化训练子系统包括训练数据库和个性化训练计划制定算法两部分;其中,所述训练数据库包括历史训练数据库和训练计划数据库;所述历史训练数据库包含飞行学员的历史训练数据,其中蕴含着飞行学员的个人特征;所述训练计划数据库为所述个性化训练计划制定算法、提供飞行训练大纲、人工教员制定策略;
所述个性化训练计划制定算法包括:
飞行学员通过交互界面使用唯一ID号进行身份认证,然后判断是否自定义训练计划;
若判断为否,则在所述历史训练数据库中获取该飞行学员的历史训练数据集,并进行学员特征提取,所述历史训练数据集记为
Figure DEST_PATH_IMAGE002A
,包含训练信息,如训练科目、训练次数、训练时长、各阶段得分、飞行天气条件等级、作战态势难度等级;其中,
Figure DEST_PATH_IMAGE006A
表示所述历史训练数据集中的第
Figure DEST_PATH_IMAGE008A
条训练记录;
通过主成分分析、线性判别分析以及人工神经网络提取所述历史训练数据集中该飞行学员的关键特征,即将所述历史训练数据集经投影矩阵
Figure DEST_PATH_IMAGE010A
投影到一个低维空间,提取的关键特征矩阵
Figure DEST_PATH_IMAGE012A
可由下式得到:
Figure DEST_PATH_IMAGE014A
;其中,d和n表示为维度,R表示线性空间;
依据所述训练计划数据库中的飞行大纲和人工教员制定的训练计划所规定的子任务集,生成训练任务集
Figure DEST_PATH_IMAGE016A
,其中
Figure DEST_PATH_IMAGE018A
表示第i个子任务对应的特征向量;
构建该飞行学员的关键特征矩阵与练任务集到掌握程度得分向量的映射模型,即构建非线性模型得到
Figure DEST_PATH_IMAGE020A
,其中
Figure DEST_PATH_IMAGE022A
是该飞行学员对各训练子任务掌握情况的得分向量,即得分越低表示掌握情况越差;
按得分由低到高排序的训练任务即为包含该飞行学员的个人特征的个性化训练计划;
通过所述飞行训练子系统基于所述个性化训练计划对所述飞行学员进行空战飞行训练并输出相应的飞行训练输出参数;所述飞行训练子系统包括虚拟对抗功能和组网训练功能;
其中,所述虚拟对抗功能包括:
通过人工智能算法构建一个虚拟的敌机,并接收来自所述个性化训练子系统定制的个性化训练计划,以生成个性化的自主作战和对抗计划;并通过交互接口与模拟器座舱系统和飞行仿真子系统相连,与飞行学员驾驶的模拟器完成人机对抗训练;以及,采用强化学习人工智能算法预先建立一个智能驾驶员决策模型,所述智能驾驶员模型可用于控制虚拟飞机作为模拟器的虚拟敌机参与人机对抗训练,即完成虚拟对抗训练;
其中,所述智能驾驶员决策模型采用基于策略的DQN强化学习方法进行构建;包括:将模拟器模拟的飞行器作为智能体,根据飞行器的速度加速度约束、高度约束、最大偏航角约束、最大转弯转弯半径约束以及武器系统投放规则和运动控制规则,建立智能体仿真模型;根据飞行环境条件、地图信息、敌机飞行控制方式和武器系统投放规则,建立环境仿真模型;再根据作战规则设立奖惩制度;随着智能体仿真模型与环境仿真模型的不断交互,智能体仿真模型就能自主学习到使得总体奖励最大的策略;其中,DQN强化学习方法就是用DNN来拟合得到在状态
Figure DEST_PATH_IMAGE024AA
下采取动作
Figure DEST_PATH_IMAGE026A
的奖励之和
Figure DEST_PATH_IMAGE028A
,其更新表达式为:
Figure DEST_PATH_IMAGE030A
其中
Figure DEST_PATH_IMAGE032A
分别表示
Figure DEST_PATH_IMAGE034A
时刻的状态和采取的动作,
Figure DEST_PATH_IMAGE036A
Figure DEST_PATH_IMAGE038A
是权重因子,可取0-1之间的任意值,
Figure DEST_PATH_IMAGE040A
表示在状态
Figure DEST_PATH_IMAGE024AAA
下采取动作
Figure DEST_PATH_IMAGE043A
获得的奖励,
Figure DEST_PATH_IMAGE045A
表示在状态
Figure DEST_PATH_IMAGE047A
下采取动作
Figure DEST_PATH_IMAGE049A
的奖励总和,
Figure DEST_PATH_IMAGE051A
是更新
Figure DEST_PATH_IMAGE053A
后的值;
所述组网训练功能包括:通过组网接口与多个异地模拟器或实装机进行组网,实现多机飞行任务的训练;其中,采用第五代移动通信网络进行异地模拟器之间,以及模拟器与实装机之间的互连组网;其中,异地模拟器的训练数据、模拟器飞参数据以及实装机的空地链路回传数据通过5G网络进行传输共享,通过接收数据总线上异地模拟器和实装机的数据并载入自身训练系统,以完成多机对抗训练、编队飞行训练以及多机协同作战训练;
通过所述辅助驾驶子系统在所述飞行学员通过所述飞行训练子系统进行所述空战飞行训练时为所述飞行学员提供辅助信息;
通过所述电子教员子系统基于预设的智能电子教员模型通过所述飞行训练输出参数对所述飞行学员进行飞行训练质量评估。
10.一种飞行模拟器智能训练装置,其特征在于,包括个性化训练单元、飞行训练单元、辅助驾驶单元、电子教员单元、训练数据库单元、数据处理单元、以及界面显示单元;其中,
所述个性化训练单元用于根据各飞行学员的学习特征定制相应的个性化训练计划;所述个性化训练计划包括基本驾驶操作技术、复杂飞行条件下的任务飞行、空战作战技术、多机协同任务飞行;
所述个性化训练子系统包括训练数据库和个性化训练计划制定算法两部分;其中,所述训练数据库包括历史训练数据库和训练计划数据库;所述历史训练数据库包含飞行学员的历史训练数据,其中蕴含着飞行学员的个人特征;所述训练计划数据库为所述个性化训练计划制定算法、提供飞行训练大纲、人工教员制定策略;
所述个性化训练计划制定算法包括:
飞行学员通过交互界面使用唯一ID号进行身份认证,然后判断是否自定义训练计划;
若判断为否,则在所述历史训练数据库中获取该飞行学员的历史训练数据集,并进行学员特征提取,所述历史训练数据集记为
Figure DEST_PATH_IMAGE002AA
,包含训练信息,如训练科目、训练次数、训练时长、各阶段得分、飞行天气条件等级、作战态势难度等级;其中,
Figure DEST_PATH_IMAGE006AA
表示所述历史训练数据集中的第
Figure DEST_PATH_IMAGE008AA
条训练记录;
通过主成分分析、线性判别分析以及人工神经网络提取所述历史训练数据集中该飞行学员的关键特征,即将所述历史训练数据集经投影矩阵
Figure DEST_PATH_IMAGE010AA
投影到一个低维空间,提取的关键特征矩阵
Figure DEST_PATH_IMAGE012AA
可由下式得到:
Figure DEST_PATH_IMAGE014AA
;其中,d和n表示为维度,R表示线性空间;
依据所述训练计划数据库中的飞行大纲和人工教员制定的训练计划所规定的子任务集,生成训练任务集
Figure DEST_PATH_IMAGE016AA
,其中
Figure DEST_PATH_IMAGE018AA
表示第i个子任务对应的特征向量;
构建该飞行学员的关键特征矩阵与练任务集到掌握程度得分向量的映射模型,即构建非线性模型得到
Figure DEST_PATH_IMAGE020AA
,其中
Figure DEST_PATH_IMAGE022AA
是该飞行学员对各训练子任务掌握情况的得分向量,即得分越低表示掌握情况越差;
按得分由低到高排序的训练任务即为包含该飞行学员的个人特征的个性化训练计划;
所述飞行训练单元用于基于所述个性化训练计划对所述飞行学员进行空战飞行训练并输出相应的飞行训练输出参数;包括虚拟对抗功能和组网训练功能;
其中,所述虚拟对抗功能包括:
通过人工智能算法构建一个虚拟的敌机,并接收来自所述个性化训练子系统定制的个性化训练计划,以生成个性化的自主作战和对抗计划;并通过交互接口与模拟器座舱系统和飞行仿真子系统相连,与飞行学员驾驶的模拟器完成人机对抗训练;以及,采用强化学习人工智能算法预先建立一个智能驾驶员决策模型,所述智能驾驶员模型可用于控制虚拟飞机作为模拟器的虚拟敌机参与人机对抗训练,即完成虚拟对抗训练;
其中,所述智能驾驶员决策模型采用基于策略的DQN强化学习方法进行构建;包括:将模拟器模拟的飞行器作为智能体,根据飞行器的速度加速度约束、高度约束、最大偏航角约束、最大转弯转弯半径约束以及武器系统投放规则和运动控制规则,建立智能体仿真模型;根据飞行环境条件、地图信息、敌机飞行控制方式和武器系统投放规则,建立环境仿真模型;再根据作战规则设立奖惩制度;随着智能体仿真模型与环境仿真模型的不断交互,智能体仿真模型就能自主学习到使得总体奖励最大的策略;其中,DQN强化学习方法就是用DNN来拟合得到在状态
Figure DEST_PATH_IMAGE024AAAA
下采取动作
Figure DEST_PATH_IMAGE026AA
的奖励之和
Figure DEST_PATH_IMAGE028AA
,其更新表达式为:
Figure DEST_PATH_IMAGE030AA
其中
Figure DEST_PATH_IMAGE032AA
分别表示
Figure DEST_PATH_IMAGE034AA
时刻的状态和采取的动作,
Figure DEST_PATH_IMAGE036AA
Figure DEST_PATH_IMAGE038AA
是权重因子,可取0-1之间的任意值,
Figure DEST_PATH_IMAGE040AA
表示在状态
Figure DEST_PATH_IMAGE024_5A
下采取动作
Figure DEST_PATH_IMAGE043AA
获得的奖励,
Figure DEST_PATH_IMAGE045AA
表示在状态
Figure DEST_PATH_IMAGE047AA
下采取动作
Figure DEST_PATH_IMAGE049AA
的奖励总和,
Figure DEST_PATH_IMAGE051AA
是更新
Figure DEST_PATH_IMAGE053AA
后的值;
所述组网训练功能包括:通过组网接口与多个异地模拟器或实装机进行组网,实现多机飞行任务的训练;其中,采用第五代移动通信网络进行异地模拟器之间,以及模拟器与实装机之间的互连组网;其中,异地模拟器的训练数据、模拟器飞参数据以及实装机的空地链路回传数据通过5G网络进行传输共享,通过接收数据总线上异地模拟器和实装机的数据并载入自身训练系统,以完成多机对抗训练、编队飞行训练以及多机协同作战训练;
所述辅助驾驶系统用于在所述飞行学员通过所述飞行训练子系统进行所述空战飞行训练时为所述飞行学员提供辅助信息;
所述电子教员系统基于预设的智能电子教员模型通过所述飞行训练输出参数对所述飞行学员进行飞行训练质量评估。
CN202111551956.7A 2021-12-17 2021-12-17 飞行模拟器智能训练系统、方法及装置 Active CN114373360B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111551956.7A CN114373360B (zh) 2021-12-17 2021-12-17 飞行模拟器智能训练系统、方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111551956.7A CN114373360B (zh) 2021-12-17 2021-12-17 飞行模拟器智能训练系统、方法及装置

Publications (2)

Publication Number Publication Date
CN114373360A CN114373360A (zh) 2022-04-19
CN114373360B true CN114373360B (zh) 2023-01-10

Family

ID=81140366

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111551956.7A Active CN114373360B (zh) 2021-12-17 2021-12-17 飞行模拟器智能训练系统、方法及装置

Country Status (1)

Country Link
CN (1) CN114373360B (zh)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114792072B (zh) * 2022-05-18 2024-01-16 中国人民解放军国防科技大学 一种基于功能的装备决策行为仿真建模方法及系统
CN114638442B (zh) * 2022-05-19 2022-09-02 珠海翔翼航空技术有限公司 面向个体差异的飞行训练方案生成系统、方法及设备
CN114822143B (zh) * 2022-06-29 2022-09-02 深圳前海壹路科技有限公司 军事训练智能考核管理系统和方法
WO2024031182A1 (en) * 2022-08-07 2024-02-15 Cae Inc. Hybrid instructor-machine assessment system, dynamic instructor interface and adaptive training
CN115063274B (zh) * 2022-08-18 2023-03-24 珠海翔翼航空技术有限公司 基于虚拟现实的飞行训练方案生成方法、系统、设备
CN115222300B (zh) * 2022-09-20 2023-02-28 珠海翔翼航空技术有限公司 基于智能评价算法的航空模拟器复训时长分配系统和方法
CN115587693B (zh) * 2022-09-23 2023-08-11 中国民用航空飞行学院 一种基于可观察行为的飞行训练质量评级的方法
CN117711627B (zh) * 2024-02-06 2024-06-21 中国民用航空飞行学院 民航飞行学员飞行训练过程健康风险预测处置方法及系统

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102013187B (zh) * 2010-10-29 2012-01-11 北京航空航天大学 具有持续性过载模拟能力的飞行模拟器系统
DE102015106420A1 (de) * 2015-04-27 2016-10-27 Rheinmetall Defence Electronics Gmbh Verfahren und Vorrichtung zur Entwicklung eines Simulators für ein Fahrzeug
CN106803385A (zh) * 2017-04-09 2017-06-06 中国人民解放军空军航空大学飞行研究所 一种飞行辅助训练考核评定系统
CN109243243B (zh) * 2018-10-08 2020-12-04 卓尔飞机制造(武汉)有限公司 飞行模拟仿真培训系统及其培训方法
CN110827617A (zh) * 2019-11-29 2020-02-21 中仿智能科技(上海)股份有限公司 一种模拟飞行器的飞行训练自动评估系统
CN111861231B (zh) * 2020-07-24 2023-07-25 沈阳航空航天大学 一种基于决策树的飞行训练特情智能生成方法
CN112655006A (zh) * 2020-11-24 2021-04-13 曹庆恒 一种驾驶教学系统及其使用方法、驾驶设备、计算机可读存储介质
CN113053205A (zh) * 2021-03-02 2021-06-29 中国人民解放军海军航空大学航空作战勤务学院 基于虚拟现实vr的空战对抗虚拟训练系统

Also Published As

Publication number Publication date
CN114373360A (zh) 2022-04-19

Similar Documents

Publication Publication Date Title
CN114373360B (zh) 飞行模拟器智能训练系统、方法及装置
CN100583185C (zh) 飞行模拟器
US20200372822A1 (en) Training system for autonomous driving control policy
CN112180967B (zh) 基于评判-执行架构的多无人机协同对抗决策方法
CN109308076A (zh) 具有集成成像和力感测模态的机组自动化系统和方法
US20230274657A1 (en) System and method for identifying a deviation of an operator of a vehicle from a doctrine
AU2020102976A4 (en) System and method for faciliting automated intelligent military mission training
CN117215197B (zh) 四旋翼飞行器在线轨迹规划方法、系统、电子设备及介质
CN117784812A (zh) 基于进化引导深度强化学习的无人机自主飞行决策方法
Smith et al. The design and application of MIDAS: A constructive simulation for human-system analysis
Zhao et al. Imitation of real lane-change decisions using reinforcement learning
Anderson et al. Behavioral cloning of student pilots with modular neural networks
CN113848750A (zh) 一种双轮机器人仿真系统及机器人系统
Roldán Gómez Adaptive and immersive interfaces to improve situational awareness in multi-robot missions
O’Brien et al. Autonomous vehicle control: teaching tool and simulation
US12024198B2 (en) Method and system of collecting training data suitable for training an autonomous driving system of a vehicle
Henninger Neural network based movement models to improve the predictive utility of entity state synchronization methods for distributed simulations
Bazzano et al. Adjustable autonomy for UAV supervision applications through mental workload assessment techniques
Drewes Automated student performance monitoring in training simulation
Schmidt Testing the Safe Behavior of Unmanned Aerial Vehicles with Scenario-Based Testing
Getzov et al. Modeling of the human–operator in a complex system functioning under extreme conditions
Andriambololona et al. Implementing a dogfight artificial pilot
Raol et al. Situation Assessment in Aviation: Bayesian Network and Fuzzy Logic-based Approaches
CN117980972A (zh) 用于获取地理围栏驾驶策略的基于仿真的方法和数据中心
CN113593357A (zh) 基于平行系统理论的无人机操控训练仿真系统和方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant