CN110147820B - 航班额外油量的推荐方法、装置、设备及存储介质 - Google Patents

航班额外油量的推荐方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN110147820B
CN110147820B CN201910291062.5A CN201910291062A CN110147820B CN 110147820 B CN110147820 B CN 110147820B CN 201910291062 A CN201910291062 A CN 201910291062A CN 110147820 B CN110147820 B CN 110147820B
Authority
CN
China
Prior art keywords
data
flight
class
full
sample
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910291062.5A
Other languages
English (en)
Other versions
CN110147820A (zh
Inventor
李文严
陈沛宇
苏德新
何华杰
宋岩
孟涛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Yuanhang Information Technology Co ltd
Original Assignee
Beijing Yuanhang Information Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Yuanhang Information Technology Co ltd filed Critical Beijing Yuanhang Information Technology Co ltd
Priority to CN201910291062.5A priority Critical patent/CN110147820B/zh
Publication of CN110147820A publication Critical patent/CN110147820A/zh
Application granted granted Critical
Publication of CN110147820B publication Critical patent/CN110147820B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Probability & Statistics with Applications (AREA)
  • Other Investigation Or Analysis Of Materials By Electrical Means (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请公开了一种航班额外油量的推荐方法、装置、设备及存储介质,通过获取目标航班的全量飞行数据,并对全量飞行数据进行预处理,获得全量样本集,对全量样本集中的样本进行Kmeans聚类,产生聚类结果,根据聚类结果,利用训练后的最近邻KNN模型对各预测样本进行分类,得到各预测样本所属的分类,根据各预测样本所属的分类对应的类均值和类标准差以及对应的风控数据,计算得到各预测样本对应的为目标航班推荐的额外油量,从而在航班历史飞行数据的基础上对计算机飞机计划额外油量进行精确度更高的推荐,在保证航空安全的基础上减少了空中油耗油,为航空公司减少了燃油成本。

Description

航班额外油量的推荐方法、装置、设备及存储介质
技术领域
本申请涉及航空领域,特别涉及一种航班额外油量的推荐方法、装置、设备及存储介质。
背景技术
飞机携带的额外油量主要作用是飞机在空中遇到特殊情况时所使用的油量,额外油量的多少不仅涉及到航空安全问题,当额外油量过多则会增加空中油耗油,提高飞行成本,所以科学、优良的准确度是推荐额外油量的基准要求。
因此,如何科学、准确地对额外油量进行推荐是本领域亟需解决的技术问题。
发明内容
本申请的目的在于提供一种航班额外油量的推荐方法、装置、设备及存储介质,以减少航班空中油耗油,降低成本。
第一方面,本申请实施例提供了一种航班额外油量的推荐方法,包括:
获取目标航班的全量飞行数据,并对所述全量飞行数据进行预处理,获得全量样本集;其中,所述全量飞行数据包括历史记录的计算机飞行计划数据、风控数据和实际油耗数据;所述风控数据是预置风控模型以在所述目标航班的航线上收集到的气象数据为输入得到的输出;
对所述全量样本集中的样本进行Kmeans聚类,产生聚类结果,并计算得到各分类对应的类均值和类标准差;
随机抽取所述全量样本集中的样本组成所述目标航班的预测样本集,其余样本组成训练集,采用所述训练集对最近邻KNN模型进行训练;
根据所述聚类结果,利用训练后的最近邻KNN模型对所述预测样本集中各预测样本进行分类,得到各预测样本所属的分类;
根据各预测样本所属的分类对应的类均值和类标准差以及对应的风控数据,计算得到各预测样本对应的为目标航班推荐的额外油量。
在一种可能的实现方式中,在本申请实施例提供的上述方法中,所述对所述全量飞行数据进行预处理,包括:
将所述全量飞行数据中的定类数据转化成定距数据,以及进行数据清洗。
在一种可能的实现方式中,在本申请实施例提供的上述方法中,所述对所述全量样本集中的样本进行Kmeans聚类,产生聚类结果,包括:
确定聚类个数K1以及迭代次数;
从所述样本集中随机选择K1个样本作为初始质心,K1为大于等于1的整数;
计算所述样本集中每一个样本与每一个初始质心的距离,并将每一个样本归到与其距离最小的初始质心所属的类中;
计算每一类中样本的均值,并将所述均值作为下一次迭代的质心;
循环迭代,直到达到所述迭代次数,产生各类。
在一种可能的实现方式中,在本申请实施例提供的上述方法中,所述根据所述聚类结果,利用训练后的最近邻KNN模型对各预测样本进行分类,得到各预测样本所属的分类,包括:
计算单个预测样本与训练集每一个训练样本之间的距离:
将测试集中每一个测试样本按照所述距离的递增关系进行排序;
选取距离最小的K2个测试样本,K2为大于等于1的整数;
确定所述K2个测试样本所在类的出现频率;
返回所述K2个测试样本中出现频率最高的类作为所述单个预测样本所属的分类。
在一种可能的实现方式中,在本申请实施例提供的上述方法中,所述根据各预测样本所属的分类对应的类均值和类标准差以及对应的风控数据,计算得到各预测样本对应的为目标航班推荐的额外油量,包括:
按照以下公式计算各预测样本对应的为目标航班推荐的额外油量:y=|xmax-a|*b+c;
其中,y为额外油量计算值,xmax为对风控数据进行取最大值操作得到的最大风控数据,a为经验值,b为类标准差,c为类均值;
若y值小于0,则推荐的额外油量为0,否则,推荐的额外油量为y值。
第二方面,本申请实施例提供了一种航班额外油量的推荐装置,包括:
样本获取模块,用于获取目标航班的全量飞行数据,并对所述全量飞行数据进行预处理,获得全量样本集;其中,所述全量飞行数据包括历史记录的计算机飞行计划数据、风控数据和实际油耗数据;所述风控数据是预置风控模型以在所述目标航班的航线上收集到的气象数据为输入得到的输出;
聚类模块,用于对所述全量样本集中的样本进行Kmeans聚类,产生聚类结果,并计算得到各分类对应的类均值和类标准差;
训练模块,用于随机抽取所述全量样本集中的样本组成所述目标航班的预测样本集,其余样本组成训练集,采用所述训练集对最近邻KNN模型进行训练;
分类模块,用于根据所述聚类结果,利用训练后的最近邻KNN模型对所述预测样本集中各预测样本进行分类,得到各预测样本所属的分类;
计算模块,用于根据各预测样本所属的分类对应的类均值和类标准差以及对应的风控数据,计算得到各预测样本对应的为目标航班推荐的额外油量。
在一种可能的实现方式中,在本申请实施例提供的上述装置中,所述样本获取模块,具体用于将所述全量飞行数据中的定类数据转化成定距数据,以及进行数据清洗。
在一种可能的实现方式中,在本申请实施例提供的上述装置中,所述聚类模块,具体用于:
确定聚类个数K1以及迭代次数;
从所述样本集中随机选择K1个样本作为初始质心,K1为大于等于1的整数;
计算所述样本集中每一个样本与每一个初始质心的距离,并将每一个样本归到与其距离最小的初始质心所属的类中;
计算每一类中样本的均值,并将所述均值作为下一次迭代的质心;
循环迭代,直到达到所述迭代次数,产生各类。
在一种可能的实现方式中,在本申请实施例提供的上述装置中,所述分类模块,具体用于:
计算单个预测样本与训练集每一个训练样本之间的距离;
将测试集中每一个测试样本按照所述距离的递增关系进行排序;
选取距离最小的K2个测试样本,K2为大于等于1的整数;
确定所述K2个测试样本所在类的出现频率;
返回所述K2个测试样本中出现频率最高的类作为所述单个预测样本所属的分类。
在一种可能的实现方式中,在本申请实施例提供的上述装置中,所述计算模块,具体用于:
按照以下公式计算各预测样本对应的为目标航班推荐的额外油量:y=|xmax-a|*b+c;
其中,y为额外油量计算值,xmax为对风控数据进行取最大值操作得到的最大风控数据,a为经验值,b为类标准差,c为类均值;
若y值小于0,则推荐的额外油量为0,否则,推荐的额外油量为y值。
第三方面,本申请实施例提供了一种电子设备,包括:存储器和处理器;
所述存储器,用于存储计算机程序;
其中,所述处理器执行所述存储器中的计算机程序,以实现上述第一方面以及第一方面的各个实施方式中所述的方法。
第四方面,本申请实施例提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机程序,所述计算机程序被处理器执行时用于实现上述第一方面以及第一方面的各个实施方式中所述的方法。
本申请提供的航班额外油量的推荐方法、装置、设备及存储介质,通过获取目标航班的全量飞行数据,并对全量飞行数据进行预处理,获得全量样本集,对全量样本集中的样本进行Kmeans聚类,产生聚类结果,根据聚类结果,利用训练后的最近邻KNN模型对各预测样本进行分类,得到各预测样本所属的分类,根据各预测样本所属的分类对应的类均值和类标准差以及对应的风控数据,计算得到各预测样本对应的为目标航班推荐的额外油量,从而在航班历史飞行数据的基础上对计算机飞机计划额外油量进行精确度更高的推荐,从而在保证航空安全的基础上减少了空中油耗油,为航空公司减少了燃油成本。
附图说明
图1为本申请实施例一提供的航班额外油量的推荐方法的流程示意图;
图2为本申请实施例一中步骤S102的流程示意图;
图3为本申请实施例一中步骤S104的流程示意图;
图4为本申请实施例二提供的航班额外油量的推荐装置的结构示意图;
图5为本申请实施例三提供的电子设备的结构示意图。
具体实施方式
下面结合附图,对本申请的具体实施方式进行详细描述,但应当理解本申请的保护范围并不受具体实施方式的限制。
除非另有其它明确表示,否则在整个说明书和权利要求书中,术语“包括”或其变换如“包含”或“包括有”等等将被理解为包括所陈述的元件或组成部分,而并未排除其它元件或其它组成部分。
图1为本申请实施例一提供的航班额外油量的推荐方法的流程示意图,实际应用中,本实施例的执行主体可以为航班额外油量的推荐装置,该航班额外油量的推荐装置可以通过虚拟装置实现,例如软件代码,也可以通过写入有相关执行代码的实体装置实现,例如U盘,再或者,也可以通过集成有相关执行代码的实体装置实现,例如,智能终端、电脑等。
如图1所示,该方法包括以下步骤S101~S105:
S101、获取目标航班的全量飞行数据,并对所述全量飞行数据进行预处理,获得全量样本集。
其中,所述全量飞行数据包括历史记录的计算机飞行计划数据、风控数据和实际油耗数据;所述风控数据是预置风控模型以在所述目标航班的航线上收集到的气象数据为输入得到的输出。所述气象数据包括刮风、下雨等气象相关数据,例如风力等级、下雨量等。示例性的,所述风控数据可以为1-10内的数字,从1到10表示飞机飞行的阻力由小到大。
采集到全量飞行数据后,在制作样本数据之前,需要对全量飞行数据进行预处理,本实施例中,预处理的方式可以为:将全量飞行数据中的定类数据转化成定距数据,以及进行数据清洗。具体的,定类数据转化成定距数据是将文字描述类数据转化为数值表示,数据清洗是将不完整的数据、错误的数据、重复的数据删除,并提供数据一致性。
对全量飞行数据进行预处理之后,将其制作为目标航班对应的全量样本集,其中,每一个样本对应一条航班飞行数据记录,例如该样本集包括8万个样本,即包括8万条航班飞行数据记录。
S102、对所述全量样本集中的样本进行Kmeans聚类,产生聚类结果,并计算得到各分类对应的类均值和类标准差。
本实施例中,得到全量样本集后,首先对其进行Kmeans聚类得到全量样本集中各样本的分类,具体的,如图2所示,可以通过以下步骤来进行Kmeans聚类:
S201、确定聚类个数K1以及迭代次数。
S202、从所述样本集中随机选择K1个样本作为初始质心,K1为大于等于1的整数。
S203、计算所述样本集中每一个样本与每一个初始质心的距离,并将每一个样本归到与其距离最小的初始质心所属的类中。
S204、计算每一类中样本的均值,并将所述均值作为下一次迭代的质心。
S205、循环迭代,直到达到所述迭代次数,产生各类。
本实施例中,得到全量样本集的分类后,再计算得到各分类对应的类均值和类标准差。聚类个数K1以及迭代次数可以根据实际情况进行设定,本申请不做限定。
S103、随机抽取所述全量样本集中的样本组成所述目标航班的预测样本集,其余样本组成训练集,采用所述训练集对最近邻KNN模型进行训练。
本实施例中,在得到全量样本集的分类后,再采用最近邻KNN模型进行有监督的分类,首先需要将全量样本集分为两部分,即随机抽取全量样本集中的样本作为目标航班的预测样本,其余样本组成训练集。例如,全量样本集中有8万个样本,随机抽取其中的1万个作为目标航班的预测样本,其余7万个样本组成最近邻KNN模型的训练集。根据上述对全量样本集的聚类结果,可以知道训练集各样本的分类,因此采用所训练集对最近邻KNN模型进行训练,可以得到精确的训练后的最近邻KNN模型。
S104、根据所述聚类结果,利用训练后的最近邻KNN模型对所述预测样本集中各预测样本进行分类,得到各预测样本所属的分类。
本实施例中,具体的,如图3所示,可以通过以下步骤得到各预测样本所属的分类:
S301、计算单个预测样本与训练集每一个训练样本之间的距离。
S302、将测试集中每一个测试样本按照所述距离的递增关系进行排序。
S303、选取距离最小的K2个测试样本,K2为大于等于1的整数。
S304、确定所述K2个测试样本所在类的出现频率。
S305、返回所述K2个测试样本中出现频率最高的类作为所述单个预测样本所属的分类。
本步骤中,通过Kmeans聚类得到的聚类结果,对预测样本进行了有监督的分类,提高了分类精确度,为后续对目标航班推荐精确的额外油量奠定了基础。
S105、根据各预测样本所属的分类对应的类均值和类标准差以及对应的风控数据,计算得到各预测样本对应的为目标航班推荐的额外油量。
本实施例中,最后根据每类数据服从正态分布来推荐额外油量,优选的,可以按照以下公式计算各预测样本对应的为目标航班推荐的额外油量:y=|xmax-a|*b+c
其中,y为额外油量计算值,xmax为对风控数据进行取最大值操作得到的最大风控数据,a为经验值,b为类标准差,c为类均值;
实际应用中,若y值小于0,则表明飞机不需要额外油量,则返回推荐的额外油量数就设置为0,若y值不小于0,则返回的推荐的额外油量就为y值。
示例性的,预测样本数量24966个,推荐额外油量的结果如下表:
误差范围 准确度
[-100,100] 0.77
[-150,150] 0.85
[-200,200] 0.9
[-300,300] 0.95
可见,示例中推荐飞机携带的额外油量误差在200公斤的准确度在90%,误差在300公斤的准确度为95%。
实际应用中,基于航空安全的考虑,本申请提供的航班额外油量的推荐方案,当风控数据的值较小时,使用效果更佳。
本实施例提供的航班额外油量的推荐方法,通过获取目标航班的全量飞行数据,并对全量飞行数据进行预处理,获得全量样本集,对全量样本集中的样本进行Kmeans聚类,产生聚类结果,根据聚类结果,利用训练后的最近邻KNN模型对各预测样本进行分类,得到各预测样本所属的分类,根据各预测样本所属的分类对应的类均值和类标准差以及对应的风控数据,计算得到各预测样本对应的为目标航班推荐的额外油量,从而在航班历史飞行数据的基础上对计算机飞机计划额外油量进行精确度更高的推荐,从而在保证航空安全的基础上减少了空中油耗油,为航空公司减少了燃油成本。
下述为本申请装置实施例,可以用于执行本申请方法实施例。对于本申请装置实施例中未披露的细节,请参照本申请方法实施例。
图4为本申请实施例二提供的航班额外油量的推荐装置的结构示意图,如图4所示,该装置可以包括:
样本获取模块410,用于获取目标航班的全量飞行数据,并对所述全量飞行数据进行预处理,获得全量样本集;其中,所述全量飞行数据包括历史记录的计算机飞行计划数据、风控数据和实际油耗数据;所述风控数据是预置风控模型以在所述目标航班的航线上收集到的气象数据为输入得到的输出;
聚类模块420,用于对所述全量样本集中的样本进行Kmeans聚类,产生聚类结果,并计算得到各分类对应的类均值和类标准差;
训练模块430,用于随机抽取所述全量样本集中的样本组成所述目标航班的预测样本集,其余样本组成训练集,采用所述训练集对最近邻KNN模型进行训练;
分类模块440,用于根据所述聚类结果,利用训练后的最近邻KNN模型对所述预测样本集中各预测样本进行分类,得到各预测样本所属的分类;
计算模块450,用于根据各预测样本所属的分类对应的类均值和类标准差以及对应的风控数据,计算得到各预测样本对应的为目标航班推荐的额外油量。
本实施例提供的航班额外油量的推荐装置,通过获取目标航班的全量飞行数据,并对全量飞行数据进行预处理,获得全量样本集,对全量样本集中的样本进行Kmeans聚类,产生聚类结果,根据聚类结果,利用训练后的最近邻KNN模型对各预测样本进行分类,得到各预测样本所属的分类,根据各预测样本所属的分类对应的类均值和类标准差以及对应的风控数据,计算得到各预测样本对应的为目标航班推荐的额外油量,从而在航班历史飞行数据的基础上对计算机飞机计划额外油量进行精确度更高的推荐,从而在保证航空安全的基础上减少了空中油耗油,为航空公司减少了燃油成本。
一种优选的实施方式中,所述样本获取模块410,具体用于将所述全量飞行数据中的定类数据转化成定距数据,以及进行数据清洗。
一种优选的实施方式中,所述聚类模块420,具体用于:确定聚类个数K1以及迭代次数;从所述样本集中随机选择K1个样本作为初始质心,K1为大于等于1的整数;计算所述样本集中每一个样本与每一个初始质心的距离,并将每一个样本归到与其距离最小的初始质心所属的类中;计算每一类中样本的均值,并将所述均值作为下一次迭代的质心;循环迭代,直到达到所述迭代次数,产生各类。
一种优选的实施方式中,所述分类模块440,具体用于:计算单个预测样本与训练集每一个训练样本之间的距离;将测试集中每一个测试样本按照所述距离的递增关系进行排序;选取距离最小的K2个测试样本,K2为大于等于1的整数;确定所述K2个测试样本所在类的出现频率;返回所述K2个测试样本中出现频率最高的类作为所述单个预测样本所属的分类。
一种优选的实施方式中,所述计算模块450,具体用于:按照以下公式计算各预测样本对应的为目标航班推荐的额外油量:y=|xmax-a|*b+c;其中,y为额外油量计算值,xmax为对风控数据进行取最大值操作得到的最大风控数据,a为经验值,b为类标准差,c为类均值;
若y值小于0,则推荐的额外油量为0,否则,推荐的额外油量为y值。
图5为本申请实施例三提供的电子设备的结构示意图,如图5所示,该设备包括:存储器501和处理器502;
存储器501,用于存储计算机程序;
其中,处理器502执行存储器501中的计算机程序,以实现如上所述各方法实施例所提供的方法。
在实施例中,以一电子设备对本申请提供的航班额外油量的推荐装置进行示例。处理器可以是中央处理单元(CPU)或者具有数据处理能力和/或指令执行能力的其他形式的处理单元,并且可以控制电子设备中的其他组件以执行期望的功能。
存储器可以包括一个或多个计算机程序产品,计算机程序产品可以包括各种形式的计算机可读存储介质,例如易失性存储器和/或非易失性存储器。易失性存储器例如可以包括随机存取存储器(RAM)和/或高速缓冲存储器(cache)等。非易失性存储器例如可以包括只读存储器(ROM)、硬盘、闪存等。在计算机可读存储介质上可以存储一个或多个计算机程序指令,处理器可以运行程序指令,以实现上文的本申请的各个实施例中的方法以及/或者其他期望的功能。在计算机可读存储介质中还可以存储诸如输入信号、信号分量、噪声分量等各种内容。
本申请实施例四提供了一种计算机可读存储介质,该计算机可读存储介质中存储有计算机程序,该计算机程序被处理器执行时用于实现如上所述各方法实施例所提供的方法。
实际应用中,本实施例中的计算机程序可以以一种或多种程序设计语言的任意组合来编写用于执行本申请实施例操作的程序代码,程序设计语言包括面向对象的程序设计语言,诸如Java、C++等,还包括常规的过程式程序设计语言,诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。
实际应用中,计算机可读存储介质可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以包括但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
前述对本申请的具体示例性实施方案的描述是为了说明和例证的目的。这些描述并非想将本申请限定为所公开的精确形式,并且很显然,根据上述教导,可以进行很多改变和变化。对示例性实施例进行选择和描述的目的在于解释本申请的特定原理及其实际应用,从而使得本领域的技术人员能够实现并利用本申请的各种不同的示例性实施方案以及各种不同的选择和改变。本申请的范围意在由权利要求书及其等同形式所限定。

Claims (8)

1.一种航班额外油量的推荐方法,其特征在于,包括:
获取目标航班的全量飞行数据,并对所述全量飞行数据进行预处理,获得全量样本集;其中,所述全量飞行数据包括历史记录的计算机飞行计划数据、风控数据和实际油耗数据;所述风控数据是预置风控模型以在所述目标航班的航线上收集到的气象数据为输入得到的输出;
对所述全量样本集中的样本进行Kmeans聚类,产生聚类结果,并计算得到各分类对应的类均值和类标准差;
随机抽取所述全量样本集中的样本组成所述目标航班的预测样本集,其余样本组成训练集,采用所述训练集对最近邻KNN模型进行训练;
根据所述聚类结果,利用训练后的最近邻KNN模型对所述预测样本集中各预测样本进行分类,得到各预测样本所属的分类;
根据各预测样本所属的分类对应的类均值和类标准差以及对应的风控数据,计算得到各预测样本对应的为目标航班推荐的额外油量;
所述根据各预测样本所属的分类对应的类均值和类标准差以及对应的风控数据,计算得到各预测样本对应的为目标航班推荐的额外油量,包括:
按照以下公式计算各预测样本对应的为目标航班推荐的额外油量:y=|xmax-a|*b+c;
其中,y为额外油量计算值,xmax为对风控数据进行取最大值操作得到的最大风控数据,a为经验值,b为类标准差,c为类均值;
若y值小于0,则推荐的额外油量为0,否则,推荐的额外油量为y值;
其中,在飞机不需要额外油量的情况下y值小于0。
2.根据权利要求1所述的方法,其特征在于,所述对所述全量飞行数据进行预处理,包括:
将所述全量飞行数据中的定类数据转化成定距数据,以及进行数据清洗。
3.根据权利要求1所述的方法,其特征在于,所述对所述全量样本集中的样本进行Kmeans聚类,产生聚类结果,包括:
确定聚类个数K1以及迭代次数;
从所述样本集中随机选择K1个样本作为初始质心,K1为大于等于1的整数;
计算所述样本集中每一个样本与每一个初始质心的距离,并将每一个样本归到与其距离最小的初始质心所属的类中;
计算每一类中样本的均值,并将所述均值作为下一次迭代的质心;
循环迭代,直到达到所述迭代次数,产生各类。
4.根据权利要求3所述的方法,其特征在于,所述根据所述聚类结果,利用训练后的最近邻KNN模型对各预测样本进行分类,得到各预测样本所属的分类,包括:
计算单个预测样本与训练集每一个训练样本之间的距离:
将测试集中每一个测试样本按照所述距离的递增关系进行排序;
选取距离最小的K2个测试样本,K2为大于等于1的整数;
确定所述K2个测试样本所在类的出现频率;
返回所述K2个测试样本中出现频率最高的类作为所述单个预测样本所属的分类。
5.一种航班额外油量的推荐装置,其特征在于,包括:
样本获取模块,用于获取目标航班的全量飞行数据,并对所述全量飞行数据进行预处理,获得全量样本集;其中,所述全量飞行数据包括历史记录的计算机飞行计划数据、风控数据和实际油耗数据;所述风控数据是预置风控模型以在所述目标航班的航线上收集到的气象数据为输入得到的输出;
聚类模块,用于对所述全量样本集中的样本进行Kmeans聚类,产生聚类结果,并计算得到各分类对应的类均值和类标准差;
训练模块,用于随机抽取所述全量样本集中的样本组成所述目标航班的预测样本集,其余样本组成训练集,采用所述训练集对最近邻KNN模型进行训练;
分类模块,用于根据所述聚类结果,利用训练后的最近邻KNN模型对所述预测样本集中各预测样本进行分类,得到各预测样本所属的分类;
计算模块,用于根据各预测样本所属的分类对应的类均值和类标准差以及对应的风控数据,计算得到各预测样本对应的为目标航班推荐的额外油量;
所述计算模块,具体用于:
按照以下公式计算各预测样本对应的为目标航班推荐的额外油量:y=|xmax-a|*b+c;
其中,y为额外油量计算值,xmax为对风控数据进行取最大值操作得到的最大风控数据,a为经验值,b为类标准差,c为类均值;
若y值小于0,则推荐的额外油量为0,否则,推荐的额外油量为y值;
其中,在飞机不需要额外油量的情况下y值小于0。
6.根据权利要求5所述的装置,其特征在于,所述样本获取模块,具体用于将所述全量飞行数据中的定类数据转化成定距数据,以及进行数据清洗。
7.一种电子设备,包括:存储器和处理器;
所述存储器,用于存储计算机程序;
其中,所述处理器执行所述存储器中的计算机程序,以实现如权利要求1-4中任一项所述的方法。
8.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机程序,所述计算机程序被处理器执行时用于实现如权利要求1-4中任一项所述的方法。
CN201910291062.5A 2019-04-11 2019-04-11 航班额外油量的推荐方法、装置、设备及存储介质 Active CN110147820B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910291062.5A CN110147820B (zh) 2019-04-11 2019-04-11 航班额外油量的推荐方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910291062.5A CN110147820B (zh) 2019-04-11 2019-04-11 航班额外油量的推荐方法、装置、设备及存储介质

Publications (2)

Publication Number Publication Date
CN110147820A CN110147820A (zh) 2019-08-20
CN110147820B true CN110147820B (zh) 2021-06-15

Family

ID=67589540

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910291062.5A Active CN110147820B (zh) 2019-04-11 2019-04-11 航班额外油量的推荐方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN110147820B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112181003A (zh) * 2020-08-24 2021-01-05 中国神华能源股份有限公司国华电力分公司 一种机组压力控制的方法和电子设备
CN112307342B (zh) * 2020-11-02 2023-10-10 沈阳民航东北凯亚有限公司 航班推荐方法及装置
CN112883648B (zh) * 2021-02-23 2022-06-17 一汽解放汽车有限公司 汽车油耗预测模型的训练方法、装置、计算机设备
CN116205694B (zh) * 2023-05-04 2023-10-24 品茗科技股份有限公司 造价定额自动推荐配合比的方法、装置、设备及介质

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6216066B1 (en) * 1998-07-01 2001-04-10 General Electric Company System and method for generating alerts through multi-variate data assessment
CN106530692A (zh) * 2016-10-25 2017-03-22 黑龙江省城市规划勘测设计研究院 一种基于交通拥堵评价指标的机动车油耗排放强度测算方法
CN107180288A (zh) * 2017-07-21 2017-09-19 东软集团股份有限公司 驾驶行为能耗测算方法、装置、存储介质及电子设备
CN107330217A (zh) * 2017-07-13 2017-11-07 北京市交通信息中心 一种基于rbfnn的中观油耗预测方法
CN108052707A (zh) * 2017-11-28 2018-05-18 中国船舶工业系统工程研究院 一种基于聚类分析的船舶航行工况划分方法
CN109344492A (zh) * 2018-09-27 2019-02-15 中国人民解放军海军航空大学 一种基于k-均值聚类与粒子群核极限学习机的航空发动机推力估计方法
CN109446275A (zh) * 2018-09-03 2019-03-08 厦门快商通信息技术有限公司 一种基于大数据的航空数据分析方法、设备及存储介质
CN109598815A (zh) * 2018-12-04 2019-04-09 中国航空无线电电子研究所 一种机载燃油系统耗油估计及健康监测方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107146015B (zh) * 2017-05-02 2023-06-27 联想(北京)有限公司 多变量时间序列预测方法和系统

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6216066B1 (en) * 1998-07-01 2001-04-10 General Electric Company System and method for generating alerts through multi-variate data assessment
CN106530692A (zh) * 2016-10-25 2017-03-22 黑龙江省城市规划勘测设计研究院 一种基于交通拥堵评价指标的机动车油耗排放强度测算方法
CN107330217A (zh) * 2017-07-13 2017-11-07 北京市交通信息中心 一种基于rbfnn的中观油耗预测方法
CN107180288A (zh) * 2017-07-21 2017-09-19 东软集团股份有限公司 驾驶行为能耗测算方法、装置、存储介质及电子设备
CN108052707A (zh) * 2017-11-28 2018-05-18 中国船舶工业系统工程研究院 一种基于聚类分析的船舶航行工况划分方法
CN109446275A (zh) * 2018-09-03 2019-03-08 厦门快商通信息技术有限公司 一种基于大数据的航空数据分析方法、设备及存储介质
CN109344492A (zh) * 2018-09-27 2019-02-15 中国人民解放军海军航空大学 一种基于k-均值聚类与粒子群核极限学习机的航空发动机推力估计方法
CN109598815A (zh) * 2018-12-04 2019-04-09 中国航空无线电电子研究所 一种机载燃油系统耗油估计及健康监测方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
An amalgam KNN to predict diabetes mellitus;M NirmalaDevi等;《ICECCN》;20130613;第691-695页 *
基于IK-medoids算法的飞机油耗聚类方法;陈静杰等;《计算机科学》;20180831;第45卷(第8期);第306-309页 *
基于综合相关度的飞机油耗影响参数研究;曹惠玲等;《中国民航大学学报》;20160430(第2期);第19-22页 *

Also Published As

Publication number Publication date
CN110147820A (zh) 2019-08-20

Similar Documents

Publication Publication Date Title
CN110147820B (zh) 航班额外油量的推荐方法、装置、设备及存储介质
Entezami et al. Big data analytics and structural health monitoring: a statistical pattern recognition-based approach
US8687851B2 (en) Generic object-based image recognition apparatus with exclusive classifier, and method for the same
US11416007B2 (en) Computer-implemented method and system for evaluating uncertainty in trajectory prediction
Zhang et al. Simultaneous pixel-level concrete defect detection and grouping using a fully convolutional model
CN112668238B (zh) 一种降雨量处理方法、装置、设备和存储介质
Badhiye et al. Analysis of Temperature and Humidity Data for Future value prediction
CN114325405A (zh) 电池组一致性分析方法、建模方法、装置、设备及介质
CN112580780A (zh) 模型训练的处理方法、装置、设备和存储介质
CN105590026A (zh) 基于主成分分析的卫星遥测回归方法
KR102477509B1 (ko) 기상 예측 정보 생성 방법 및 이를 수행하기 위한 컴퓨팅 장치
Jędrzejczyk et al. Convolutional neural network and support vector machine for prediction of damage intensity to multi-storey prefabricated RC buildings
Lin et al. Integrated circuit board object detection and image augmentation fusion model based on YOLO
CN111812670B (zh) 一种单光子激光雷达空间变换噪声判断、滤波方法及装置
Zeybek Inlier point preservation in outlier points removed from the ALS point cloud
KR102574865B1 (ko) 인공지능 기반 광고 데이터 시각화 시스템
CN110852322B (zh) 感兴趣区域的确定方法及装置
CN112465250A (zh) 电力负荷预测方法、装置、计算机设备和存储介质
Sirangelo et al. Rainfall nowcasting by at site stochastic model PRAISE
CN114139643B (zh) 一种基于机器视觉的单甘酯质量检测方法及系统
Fu et al. Prognostic and Health Management of Critical Aircraft Systems and Components: An Overview
KR101181326B1 (ko) 채프에코 식별 시스템 및 그 방법
EP3951535B1 (en) Data management system, data management method, and data management program
US20230022253A1 (en) Fast and accurate prediction methods and systems based on analytical models
Tang et al. A Classification Method of Point Clouds of Transmission Line Corridor Based on Improved Random Forest and Multi-Scale Features

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant