CN111325380A - 基于多粒度时间注意力机制确定航班客座率的方法和系统 - Google Patents

基于多粒度时间注意力机制确定航班客座率的方法和系统 Download PDF

Info

Publication number
CN111325380A
CN111325380A CN201911386046.0A CN201911386046A CN111325380A CN 111325380 A CN111325380 A CN 111325380A CN 201911386046 A CN201911386046 A CN 201911386046A CN 111325380 A CN111325380 A CN 111325380A
Authority
CN
China
Prior art keywords
flight
takeoff
day
period
passenger seat
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201911386046.0A
Other languages
English (en)
Inventor
邓玉婧
梁丽
吴伟刚
孙艺
张学军
宋颖
陈晓敏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Aisino Corp
Original Assignee
Aisino Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Aisino Corp filed Critical Aisino Corp
Priority to CN201911386046.0A priority Critical patent/CN111325380A/zh
Publication of CN111325380A publication Critical patent/CN111325380A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • G06Q10/06393Score-carding, benchmarking or key performance indicator [KPI] analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/067Enterprise or organisation modelling
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/40Business processes related to the transportation industry

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • General Physics & Mathematics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Marketing (AREA)
  • Development Economics (AREA)
  • General Health & Medical Sciences (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Game Theory and Decision Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Molecular Biology (AREA)
  • Evolutionary Computation (AREA)
  • Educational Administration (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Primary Health Care (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提供一种基于多粒度时间注意力机制确定航班客座率的方法和系统。所述方法和系统基于采集历史的航班客座率数据,通过对建立的预测航班客座率模型进行训练并验证生成最优模型,再基于所述最优模型,根据所述航线历史航班客座率数据预测目标航班在未来一段时间的客座率,从而通过所述模型的输出结果对目标航班的航行进行调整。所述方法和系统与现有技术相比,建立的模型除考虑航班自身每日客座率变化外,还考虑到目标航班客座率的起飞时刻相关性和起飞日相关性,以及其他因素也的影响,从而预测航班客座率准确率更高,能够更好地帮助民航市场从业者提前感知市场需求进而及时采取对应决策。

Description

基于多粒度时间注意力机制确定航班客座率的方法和系统
技术领域
本发明涉及大数据处理领域,并且更具体地,涉及一种基于多粒度时间注意力机制确定航班客座率的方法和系统。
背景技术
随着民航旅客的迅速增长,航空客运需求预测越来越受到航空公司、机票代理商、飞机制造商等民航相关企业的关注。航班客座率是航空客运市场中用以衡量航班客运量需求的重要指标之一。准确地预测航班客座率是解决航空公司处理航班机票超售、座位虚耗等问题,提高民航从业者提前感知市场需求进而提高企业收益管理水平、为各级运营部门提供决策支持的重要途径之一。
目前,现有的航班客座率预测方法仅关注了目标航班近期每日客座率的变化特点,无法同时考虑到该问题受到的其它众多因素的影响,因此无法获得理想的预测效果。
发明内容
为了解决现有技术中航班客座率预测方法只关注目标航班近期每日客座率的变化特点,而使航班客座率预测效果不理想的技术问题,本发明提供一种基于多粒度时间注意力机制确定航班客座率的方法,所述方法包括:
采集一个航线在某一个时间周期内所有起飞时刻的历史航班客座率数据,生成初始样本集;
对所述历史航班客座率数据中具有离散属性和连续属性的数据进行预处理,生成有效样本集;
基于预先确定的预测所述航线航班客座率的最优模型,以所述有效样本集中目标航班的数据为输入向量,对所述航线上的目标航班未来τ天的客座率进行预测;
根据预测所述航线上航班客座率的最优模型的输出结果对所述目标航班在所述航线上未来τ天的航行进行调整。
进一步地,所述方法在采集一个航线在某一个时间周期内所有起飞时刻的历史航班客座率数据之前还包括建立预测所述航线航班客座率的最优模型,其中:
采集一个航线在某一个时间周期内所有起飞时刻的历史航班客座率数据,生成初始样本集;
对所述初始样本集中具有离散属性和连续属性的数据进行预处理,生成有效样本集;
按照预先设置的比例,将有效样本集划分为非重叠的有效训练集和有效验证集;
设置与训练预测航班客座率的第一模型的相关的信息和预测航班客座率的第一模型中的超参的初始值,其中,所述第一模型包括2个编码器模块,1个解码器模块和1个外部因素融合模块,所述2个编码器模块分别是临近时段编码器模块和遥远时段编码器模块,其用于对输入向量进行编码,所述临近时段编码器模块的输入向量是临近时段所述航线上目标航班所有起飞时刻的航班客座率时间序列,所述遥远时段编码器模块的输入向量是遥远时段所述航线上目标航班所有起飞时刻的航班客座率时间序列,所述临近时段是指与需要预测的目标航班在预测时段内的每一天相邻的时间段,所述遥远时段是指与需要预测的目标航班在预测时段内的每一天相隔一定天数的时间段,外部因素融合模块用于确定除所述航线起飞时间以外的外部因素对所述航线上的航班的影响,其输入向量为有效训练集中目标航班在预测时间内的除所述航线起飞时间以外的外部因素的数据,解码器模块用于输出所述航线上目标航班客座率预测结果;临近时段编码器模块包括第一临近时段长短期记忆网络LSTM单元和第二临近时段LSTM单元,所述遥远时段编码器模块包括第一遥远时段LSTM单元和第二遥远时段LSTM单元,所述解码器模块包括解码LSTM单元,所述与训练预测航班客座率的第一模型的相关的信息包括批大小、学习、训练轮数和防止过拟合策略;所述超参指第一临近时段长短期记忆网络LSTM单元和第一遥远时段 LSTM单元隐藏层状态数,第二临近时段LSTM单元和第二遥远时段LSTM单元隐藏层状态数,解码LSTM单元隐藏层状态数,以及临近时段和遥远时段的时间窗口长度;
根据所述有效训练集,基于预测航班客座率的第一模型进行客座率预测,并将所述第一模型的输出结果与所述有效训练集中的航班客座率数据进行比较,确定所述第一模型中的最优参数值,生成预测航班客座率的第二模型,其中,所述第一模型中的最优参数是指第一临近时段长短期记忆网络LSTM单元、第一遥远时段LSTM单元、第二临近时段LSTM单元和第二遥远时段LSTM单元中需要学习的参数的最优值;
根据所述有效验证集,为所述预测航班客座率的第二模型中的超参赋值后进行客座率预测,并将所述第二模型的输出结果与所述有效验证集中的目标航班在预测时间段的航班客座率数据进行比较,将比较结果最接近时的超参值作为所述第二模型中的超参的最优值,生成预测航班客座率的最优模型。
进一步地,所述对所述初始样本集中具有离散特征和连续特征的数据进行预处理,生成有效样本集包括:
对于初始样本集中ID离散属性的数据采用one-hot编码方式进行编码,并将编码后的结果输入至全连接神经网络层将高维向量映射为低维向量,所述低维向量为第一数据,其中,所述ID离散属性的数据包括航空公司,机型;
对于初始样本集中一般离散属性的数据采用one-hot编码方式进行编码,所述编码后的结果为第二数据,其中,所述一般离散属性的数据包括是否工作日,是否节假晶,是否节假日前,是否节假日后;
对于初始样本集中具有连续属性的数据采用Min-Max归一化方法归一到[0,1]之间,所述归一后的数据为第三数据,其中,所述具有连续属性的数据包括航班起飞时刻,机舱座位数,所述归一化的计算公式为:
x′=(x-min x)/(max x-min x)
式中,x代表具有连续属性的原数据,x′代表经过归一化处理后新的数据,min x、max x分别代表归一化处理前具有连续属性的原数据的最小值和最大值;
将所述第一数据、第二数据、第三数据按照初始样本集中的顺序进行排列,生成有效样本集。
进一步地,根据所述有效训练集,基于预测航班客座率的第一模型进行客座率预测,并将所述第一模型的输出结果与所述有效训练集中的航班客座率数据进行比较,确定所述第一模型的最优参数,生成预测航班客座率的第二模型包括:
对于临近时段编码器模块:
给定临近时段输入序列Xnear=(xnear,1,xnear,2,…,xnear,T),
Figure RE-GDA0002496436480000041
将xnear ,t作为第一临近时段LSTM单元在目标航班第t个起飞时刻航班的输入,其中,所述ln为临时时段的时间窗口长度,T为目标航班在所述航线上的所有起飞时刻的数目;
采用
Figure RE-GDA0002496436480000042
更新第一临近时段LSTM单元在第t个起飞时刻的隐藏层状态值,其中feb代表第一临近时段LSTM单元的更新函数,通过所述第一临近时段LSTM单元计算得到每个起飞时刻下的隐藏层状态值
Figure RE-GDA0002496436480000043
Figure RE-GDA0002496436480000044
其中,n为第一临近时段 LSTM单元的隐藏层状态数;
采用起飞时刻注意力机制,基于所述第一临近时段LSTM单元在第 t个起飞时刻下的隐藏层状态值
Figure RE-GDA0002496436480000045
以及所述第二临近时段LSTM单元在临近时段历史第k-1个起飞日的隐藏层状态值
Figure RE-GDA0002496436480000046
及记忆单元状态值
Figure RE-GDA0002496436480000047
计算在起飞日第k天时,第t个起飞时刻的航班客座率时间序列对目标航班当天客座率影响程度的注意力权重
Figure RE-GDA0002496436480000048
其计算公式为:
Figure RE-GDA0002496436480000049
Figure RE-GDA0002496436480000051
式中,待学习的参数是Ve,
Figure RE-GDA0002496436480000052
m为第二临近时段LSTM单元的隐藏层状态数,所述起飞时刻注意力机制是前馈神经网络;
采用softmax函数对
Figure RE-GDA0002496436480000053
进行归一化,使注意力权重
Figure RE-GDA0002496436480000054
之和为1;
基于目标航班在起飞日第k天的每个起飞时刻下的隐藏层状态值 hnear和注意力权重
Figure RE-GDA0002496436480000055
计算起飞日第k天的输出向量
Figure RE-GDA0002496436480000056
其计算公式为:
Figure RE-GDA0002496436480000057
采用
Figure RE-GDA0002496436480000058
更新第二临近时段LSTM单元在第k个起飞日的隐藏层状态值,fea代表第二临近时段LSTM单元的更新函数,通过所述第二临近时段LSTM单元计算得到临近时段每个起飞日的隐藏层状态值
Figure RE-GDA0002496436480000059
其中,m为第二临近时段LSTM 单元的隐藏层状态数;
采用起飞日注意力机制,基于所述第二临近时段LSTM单元在临近时段历史第k个起飞日的隐藏层状态值
Figure RE-GDA00024964364800000510
及解码器中的解码LSTM单元在第d-1个预测日的隐藏层状态值gd-1及记忆单元状态值s′d-1计算在第d个预测日对应的临近时段编码器模块在历史第k个起飞日的隐藏层状态值的注意力权重
Figure RE-GDA00024964364800000511
其计算公式为:
Figure RE-GDA00024964364800000512
Figure RE-GDA00024964364800000513
式中,待学习的参数是Va,
Figure RE-GDA00024964364800000514
p 为解码LSTM单元隐藏层状态数,所述起飞日注意力机制是前馈神经网络;
采用softmax函数对
Figure RE-GDA00024964364800000515
进行归一化,使注意力权重
Figure RE-GDA00024964364800000516
之和为1;
基于目标航班在临近时段的每个起飞日的隐藏层状态值qnear和注意力权重
Figure RE-GDA00024964364800000517
计算目标航班的第d个预测日,在所述临近时段编码器模块经过起飞日注意力机制后输出的上下文向量
Figure RE-GDA00024964364800000518
其计算公式为:
Figure RE-GDA0002496436480000061
对于遥远时段编码器模块:
给定临近时段输入序列Xdistant=(xdistant,1,xdistant,2,…,xdistant,T),
Figure RE-GDA0002496436480000062
将xdistant,t作为第一遥远时段LSTM单元在目标航班第t个起飞时刻航班的输入,其中,所述ld为遥远时段的时间窗口长度,T为目标航班在所述航线上的所有起飞时刻的数目;
采用
Figure RE-GDA0002496436480000063
更新第一遥远时段LSTM单元在第t个起飞时刻的隐藏层状态值,其中feb′代表第一遥远时段LSTM单元的更新函数,通过所述第一遥远时段LSTM单元计算得到每个起飞时刻下的隐藏层状态值
Figure RE-GDA0002496436480000064
其中,n为第一遥远时段LSTM单元的隐藏层状态数;
采用起飞时刻注意力机制,基于所述第一遥远时段LSTM单元在第 t个起飞时刻下的隐藏层状态值
Figure RE-GDA0002496436480000065
以及所述第二遥远时段LSTM单元在遥远时段历史第k-1个起飞日的隐藏层状态值
Figure RE-GDA0002496436480000066
及记忆单元状态值
Figure RE-GDA0002496436480000067
计算在起飞日第k天时,第t个起飞时刻的航班客座率时间序列对目标航班当天客座率影响程度的注意力权重
Figure RE-GDA0002496436480000068
其计算公式为:
Figure RE-GDA0002496436480000069
Figure RE-GDA00024964364800000610
式中,m为第二遥远时段LSTM单元的隐藏层状态数,待学习的参数是V’e,
Figure RE-GDA00024964364800000611
所述起飞时刻注意力机制是前馈神经网络;
采用softmax函数对
Figure RE-GDA00024964364800000612
进行归一化,使注意力权重
Figure RE-GDA00024964364800000613
之和为1;
基于目标航班在起飞日第k天的每个起飞时刻下的隐藏层状态值 hdistant和注意力权重
Figure RE-GDA00024964364800000614
计算起飞日第k天的输出向量
Figure RE-GDA00024964364800000615
其计算公式为:
Figure RE-GDA00024964364800000616
采用
Figure RE-GDA00024964364800000617
更新第二遥远时段LSTM单元在第k个起飞日的隐藏层状态值,fea’代表第二遥远时段LSTM单元的更新函数,通过所述第二遥远时段LSTM单元计算得到遥远时段每个起飞日的隐藏层状态值
Figure RE-GDA0002496436480000071
其中,m为第二遥远时段LSTM单元的隐藏层状态数;
采用起飞日注意力机制,基于所述第二遥远时段LSTM单元在遥远时段历史第k个起飞日的隐藏层状态值
Figure RE-GDA0002496436480000072
及解码器中的解码LSTM单元在第d-1个预测日的隐藏层状态值gd-1及记忆单元状态值s′d-1计算在第d 个预测日对应的遥远时段编码器模块在历史第k个起飞日的隐藏层状态值的注意力权重
Figure RE-GDA0002496436480000073
其计算公式为:
Figure RE-GDA0002496436480000074
Figure RE-GDA0002496436480000075
式中,待确定的参数是V′a,
Figure RE-GDA0002496436480000076
p为解码LSTM单元隐藏层状态数,所述起飞日注意力机制是前馈神经网络;
采用softmax函数对
Figure RE-GDA0002496436480000077
进行归一化,使注意力权重
Figure RE-GDA0002496436480000078
之和为1;
基于目标航班在遥远时段的每个起飞日的隐藏层状态值qdistant和注意力权重
Figure RE-GDA0002496436480000079
计算目标航班的第d个预测日,在所述遥远时段编码器模块经过起飞日注意力机制后输出的上下文向量
Figure RE-GDA00024964364800000710
其计算公式为:
Figure RE-GDA00024964364800000711
对于外部因素融合模块:
将有效训练集中预测时间段的外部因素数据进行连接后作为所述模块的输出,记为
Figure RE-GDA00024964364800000712
其中d为解码器模块预测时间段的第d个起飞日,i为解码器模块预测时间段的第i个起飞时刻,Ne为外部因素个数;
对于解码器模块:
经过临近时段编码器模块及遥远时段编码器模块的起飞日注意力机制分别计算得到对于未来第d天的加权求和的上下文向量
Figure RE-GDA00024964364800000713
之后,在解码器模块中,将所述两个上下文向量
Figure RE-GDA00024964364800000714
与外部因素融合模块的输出
Figure RE-GDA00024964364800000715
以及解码器模块上一时刻的输出
Figure RE-GDA00024964364800000716
相结合来更新解码器隐藏层状态,公式如下:
Figure RE-GDA0002496436480000081
式中,fd表示解码器中使用的解码LSTM单元更新函数;
将上下文向量
Figure RE-GDA0002496436480000082
与隐藏状态gd进行向量拼接,确定进行最终预测的新隐藏层状态,公式如下:
Figure RE-GDA0002496436480000083
式中,矩阵
Figure RE-GDA0002496436480000084
及向量
Figure RE-GDA0002496436480000085
将拼接向量
Figure RE-GDA0002496436480000086
维度映射到解码器模块隐藏层的维度;
使用线性变换
Figure RE-GDA0002496436480000087
来生成最终输出结果;
将解码器模块最终输出结果与所述有效训练集中预测时间段中对应的航班客座率数据进行比较,将比较结果最接近时的需要学习的参数的值作为所述第一模型中的最优参数值,并根据确定的所述第一模型的最优参数值,生成预测航班客座率的第二模型。
进一步地,所述根据预测所述航线上航班客座率的最优模型的输出结果对所述目标航班在所述航线上未来τ天的航行进行调整包括:
当目标航班未来τ天内的起飞时刻的客座率高于设定的第一阈值时,增加所述起飞时刻航班的飞行次数;
当目标航班未来τ天内的起飞时刻的客座率高于设定的第二阈值时,增加所述起飞时刻航班的售票价格,其中,所述第二阈值小于第一阈值;
当目标航班未来τ天内的起飞时刻的客座率低于设定的第三阈值时,降低所述起飞时刻航班的售票价格以提高航班客座率,其中,所述第三阈值少于第二阈值。
根据本发明的另一方面,本发明提供一种基于多粒度时间注意力机制确定航班客座率的系统,所述系统包括:
数据采集单元,其用于采集一个航线在某一个时间周期内所有起飞时刻的历史航班客座率数据,生成初始样本集;
数据处理单元,其用于对所述历史航班客座率数据中具有离散属性和连续属性的数据进行预处理,生成有效样本集;
预测结果单元,其用于基于预先确定的预测所述航线航班客座率的最优模型,以所述有效样本集中目标航班的数据为输入向量,对所述航线上的目标航班未来τ天的客座率进行预测;
航班调整单元,其用于根据预测所述航线上航班客座率的最优模型的输出结果对所述目标航班在所述航线上未来τ天的航行进行调整。
进一步地,所述方法还包括模型建立单元,其用于建立预测所述航线航班客座率的最优模型,所述模型建立单元包括:
数据采集单元,其用于采集一个航线在某一个时间周期内所有起飞时刻的历史航班客座率数据,生成初始样本集;
数据处理单元,其用于对所述初始样本集中具有离散属性和连续属性的数据进行预处理,生成有效样本集;
样本划分单元,其用于按照预先设置的比例,将有效样本集划分为非重叠的有效训练集和有效验证集;
第一模型单元,其用于建立预测航班客座率的第一模型,并设置与训练预测航班客座率的第一模型的相关的信息和预测航班客座率的第一模型中的超参的初始值,其中,所述第一模型包括2个编码器模块,1个解码器模块和1个外部因素融合模块,所述2个编码器模块分别是临近时段编码器模块和遥远时段编码器模块,其用于对输入向量进行编码,所述临近时段编码器模块的输入向量是临近时段所述航线上目标航班所有起飞时刻的航班客座率时间序列,所述遥远时段编码器模块的输入向量是遥远时段所述航线上目标航班所有起飞时刻的航班客座率时间序列,所述临近时段是指与需要预测的目标航班在预测时段内的每一天相邻的时间段,所述遥远时段是指与需要预测的目标航班在预测时段内的每一天相隔一定天数的时间段,外部因素融合模块用于确定除所述航线起飞时间以外的外部因素对所述航线上的航班的影响,其输入向量为有效训练集中目标航班在预测时间内的除所述航线起飞时间以外的外部因素的数据,解码器模块用于输出所述航线上目标航班客座率预测结果;临近时段编码器模块包括第一临近时段长短期记忆网络LSTM单元和第二临近时段LSTM单元,所述遥远时段编码器模块包括第一遥远时段LSTM单元和第二遥远时段LSTM单元,所述解码器模块包括解码LSTM单元,所述与训练预测航班客座率的第一模型的相关的信息包括批大小、学习、训练轮数和防止过拟合策略;所述超参指第一临近时段长短期记忆网络LSTM单元和第一遥远时段LSTM单元隐藏层状态数,第二临近时段LSTM单元和第二遥远时段LSTM单元隐藏层状态数,解码LSTM单元隐藏层状态数,以及临近时段和遥远时段的时间窗口长度;
模型训练单元,其用于根据所述有效训练集,基于预测航班客座率的第一模型进行客座率预测,并将所述第一模型的输出结果与所述有效训练集中的航班客座率数据进行比较,确定所述第一模型中的最优参数值,生成预测航班客座率的第二模型,其中,所述第一模型中的最优参数是指第一临近时段长短期记忆网络LSTM单元、第一遥远时段LSTM单元、第二临近时段LSTM单元和第二遥远时段LSTM单元中需要学习的参数的最优值;
最优模型单元,其用于根据所述有效验证集,为所述预测航班客座率的第二模型中的超参赋值后进行客座率预测,并将所述第二模型的输出结果与所述有效验证集中的目标航班在预测时间段的航班客座率数据进行比较,将比较结果最接近时的超参值作为所述第二模型中的超参的最优值,生成预测航班客座率的最优模型。
进一步地,所述数据处理单元对所述初始样本集中具有离散特征和连续特征的数据进行预处理,生成有效样本集包括:
对于初始样本集中ID离散属性的数据采用one-hot编码方式进行编码,并将编码后的结果输入至全连接神经网络层将高维向量映射为低维向量,所述低维向量为第一数据,其中,所述ID离散属性的数据包括航空公司,机型;
对于初始样本集中一般离散属性的数据采用one-hot编码方式进行编码,所述编码后的结果为第二数据,其中,所述一般离散属性的数据包括是否工作日,是否节假晶,是否节假日前,是否节假日后;
对于初始样本集中具有连续属性的数据采用Min-Max归一化方法归一到[0,1]之间,所述归一后的数据为第三数据,其中,所述具有连续属性的数据包括航班起飞时刻,机舱座位数,所述归一化的计算公式为:
x′=(x-min x)/(max x-min x)
式中,x代表具有连续属性的原数据,x′代表经过归一化处理后新的数据,minx、maxx分别代表归一化处理前具有连续属性的原数据的最小值和最大值;
将所述第一数据、第二数据、第三数据按照初始样本集中的顺序进行排列,生成有效样本集。
进一步地,所述模型训练单元根据所述有效训练集,基于预测航班客座率的第一模型进行客座率预测,并将所述第一模型的输出结果与所述有效训练集中的航班客座率数据进行比较,确定所述第一模型的最优参数,生成预测航班客座率的第二模型包括:
对于临近时段编码器模块:
给定临近时段输入序列Xnear=(xnear,1,xnear,2,…,xnear,T),
Figure RE-GDA0002496436480000111
将xnear ,t作为第一临近时段LSTM单元在目标航班第t个起飞时刻航班的输入,其中,所述ln为临时时段的时间窗口长度,T为目标航班在所述航线上的所有起飞时刻的数目;
采用
Figure RE-GDA0002496436480000112
更新第一临近时段LSTM单元在第t个起飞时刻的隐藏层状态值,其中feb代表第一临近时段LSTM单元的更新函数,通过所述第一临近时段LSTM单元计算得到每个起飞时刻下的隐藏层状态值
Figure RE-GDA0002496436480000113
其中,n为第一临近时段 LSTM单元的隐藏层状态数;
采用起飞时刻注意力机制,基于所述第一临近时段LSTM单元在第 t个起飞时刻下的隐藏层状态值
Figure RE-GDA0002496436480000114
以及所述第二临近时段LSTM单元在临近时段历史第k-1个起飞日的隐藏层状态值
Figure RE-GDA0002496436480000115
及记忆单元状态值
Figure RE-GDA0002496436480000116
计算在起飞日第k天时,第t个起飞时刻的航班客座率时间序列对目标航班当天客座率影响程度的注意力权重
Figure RE-GDA0002496436480000121
其计算公式为:
Figure RE-GDA0002496436480000122
Figure RE-GDA0002496436480000123
式中,待学习的参数是Ve,
Figure RE-GDA0002496436480000124
m为第二临近时段LSTM单元的隐藏层状态数,所述起飞时刻注意力机制是前馈神经网络;
采用softmax函数对
Figure RE-GDA0002496436480000125
进行归一化,使注意力权重
Figure RE-GDA0002496436480000126
之和为1;
基于目标航班在起飞日第k天的每个起飞时刻下的隐藏层状态值 hnear和注意力权重
Figure RE-GDA0002496436480000127
计算起飞日第k天的输出向量
Figure RE-GDA0002496436480000128
其计算公式为:
Figure RE-GDA0002496436480000129
采用
Figure RE-GDA00024964364800001210
更新第二临近时段LSTM单元在第k个起飞日的隐藏层状态值,fea代表第二临近时段LSTM单元的更新函数,通过所述第二临近时段LSTM单元计算得到临近时段每个起飞日的隐藏层状态值
Figure RE-GDA00024964364800001211
其中,m为第二临近时段LSTM 单元的隐藏层状态数;
采用起飞日注意力机制,基于所述第二临近时段LSTM单元在临近时段历史第k个起飞日的隐藏层状态值
Figure RE-GDA00024964364800001212
及解码器中的解码LSTM单元在第d-1个预测日的隐藏层状态值gd-1及记忆单元状态值s d-1计算在第d个预测日对应的临近时段编码器模块在历史第k个起飞日的隐藏层状态值的注意力权重
Figure RE-GDA00024964364800001213
其计算公式为:
Figure RE-GDA00024964364800001214
Figure RE-GDA00024964364800001215
式中,待学习的参数是Va,
Figure RE-GDA00024964364800001216
p 为解码LSTM单元隐藏层状态数,所述起飞日注意力机制是前馈神经网络;
采用softmax函数对
Figure RE-GDA00024964364800001217
进行归一化,使注意力权重
Figure RE-GDA00024964364800001218
之和为1;
基于目标航班在临近时段的每个起飞日的隐藏层状态值qnear和注意力权重
Figure RE-GDA0002496436480000131
计算目标航班的第d个预测日,在所述临近时段编码器模块经过起飞日注意力机制后输出的上下文向量
Figure RE-GDA0002496436480000132
其计算公式为:
Figure RE-GDA0002496436480000133
对于遥远时段编码器模块:
给定临近时段输入序列Xdistant=(xdistant,1,xdistant,2,…,xdistant,T),
Figure RE-GDA0002496436480000134
将xdistant,t作为第一遥远时段LSTM单元在目标航班第t个起飞时刻航班的输入,其中,所述ld为遥远时段的时间窗口长度,T为目标航班在所述航线上的所有起飞时刻的数目;
采用
Figure RE-GDA0002496436480000135
更新第一遥远时段LSTM单元在第t个起飞时刻的隐藏层状态值,其中feb′代表第一遥远时段LSTM单元的更新函数,通过所述第一遥远时段LSTM单元计算得到每个起飞时刻下的隐藏层状态值
Figure RE-GDA0002496436480000136
其中,n为第一遥远时段LSTM单元的隐藏层状态数;
采用起飞时刻注意力机制,基于所述第一遥远时段LSTM单元在第 t个起飞时刻下的隐藏层状态值
Figure RE-GDA0002496436480000137
以及所述第二遥远时段LSTM单元在遥远时段历史第k-1个起飞日的隐藏层状态值
Figure RE-GDA0002496436480000138
及记忆单元状态值
Figure RE-GDA0002496436480000139
计算在起飞日第k天时,第t个起飞时刻的航班客座率时间序列对目标航班当天客座率影响程度的注意力权重
Figure RE-GDA00024964364800001310
其计算公式为:
Figure RE-GDA00024964364800001311
Figure RE-GDA00024964364800001312
式中,m为第二遥远时段LSTM单元的隐藏层状态数,待学习的参数是V’e,
Figure RE-GDA00024964364800001313
所述起飞时刻注意力机制是前馈神经网络;
采用softmax函数对
Figure RE-GDA00024964364800001314
进行归一化,使注意力权重
Figure RE-GDA00024964364800001315
之和为1;
基于目标航班在起飞日第k天的每个起飞时刻下的隐藏层状态值 hdistant和注意力权重
Figure RE-GDA00024964364800001316
计算起飞日第k天的输出向量
Figure RE-GDA00024964364800001317
其计算公式为:
Figure RE-GDA0002496436480000141
采用
Figure RE-GDA0002496436480000142
更新第二遥远时段LSTM单元在第k个起飞日的隐藏层状态值,fea’代表第二遥远时段LSTM单元的更新函数,通过所述第二遥远时段LSTM单元计算得到遥远时段每个起飞日的隐藏层状态值
Figure RE-GDA0002496436480000143
其中,m为第二遥远时段LSTM单元的隐藏层状态数;
采用起飞日注意力机制,基于所述第二遥远时段LSTM单元在遥远时段历史第k个起飞日的隐藏层状态值
Figure RE-GDA0002496436480000144
及解码器中的解码LSTM单元在第d-1个预测日的隐藏层状态值gd-1及记忆单元状态值s′d-1计算在第d 个预测日对应的遥远时段编码器模块在历史第k个起飞日的隐藏层状态值的注意力权重
Figure RE-GDA0002496436480000145
其计算公式为:
Figure RE-GDA0002496436480000146
Figure RE-GDA0002496436480000147
式中,待确定的参数是V′a,
Figure RE-GDA0002496436480000148
p为解码LSTM单元隐藏层状态数,所述起飞日注意力机制是前馈神经网络;
采用softmax函数对
Figure RE-GDA0002496436480000149
进行归一化,使注意力权重
Figure RE-GDA00024964364800001410
之和为1;
基于目标航班在遥远时段的每个起飞日的隐藏层状态值qdistant和注意力权重
Figure RE-GDA00024964364800001411
计算目标航班的第d个预测日,在所述遥远时段编码器模块经过起飞日注意力机制后输出的上下文向量
Figure RE-GDA00024964364800001412
其计算公式为:
Figure RE-GDA00024964364800001413
对于外部因素融合模块:
将有效训练集中预测时间段的外部因素数据进行连接后作为所述模块的输出,记为
Figure RE-GDA00024964364800001414
其中d为解码器模块预测时间段的第d个起飞日,i为解码器模块预测时间段的第i个起飞时刻,Ne为外部因素个数;
对于解码器模块:
经过临近时段编码器模块及遥远时段编码器模块的起飞日注意力机制分别计算得到对于未来第d天的加权求和的上下文向量
Figure RE-GDA00024964364800001415
之后,在解码器模块中,将所述两个上下文向量
Figure RE-GDA0002496436480000151
与外部因素融合模块的输出
Figure RE-GDA0002496436480000152
以及解码器模块上一时刻的输出
Figure RE-GDA0002496436480000153
相结合来更新解码器隐藏层状态,公式如下:
Figure RE-GDA0002496436480000154
式中,fd表示解码器中使用的解码LSTM单元更新函数;
将上下文向量
Figure RE-GDA0002496436480000155
与隐藏状态gd进行向量拼接,确定进行最终预测的新隐藏层状态,公式如下:
Figure RE-GDA0002496436480000156
式中,矩阵
Figure RE-GDA0002496436480000157
及向量
Figure RE-GDA0002496436480000158
将拼接向量
Figure RE-GDA0002496436480000159
维度映射到解码器模块隐藏层的维度;
使用线性变换
Figure RE-GDA00024964364800001510
来生成最终输出结果;
将解码器模块最终输出结果与所述有效训练集中预测时间段中对应的航班客座率数据进行比较,将比较结果最接近时的需要学习的参数的值作为所述第一模型中的最优参数值,并根据确定的所述第一模型的最优参数值,生成预测航班客座率的第二模型。
进一步地,所述航班调整单元根据预测所述航线上航班客座率的最优模型的输出结果对所述目标航班在所述航线上未来τ天的航行进行调整包括:
当目标航班未来τ天内的起飞时刻的客座率高于设定的第一阈值时,增加所述起飞时刻航班的飞行次数;
当目标航班未来τ天内的起飞时刻的客座率高于设定的第二阈值时,增加所述起飞时刻航班的售票价格,其中,所述第二阈值小于第一阈值;
当目标航班未来τ天内的起飞时刻的客座率低于设定的第三阈值时,降低所述起飞时刻航班的售票价格以提高航班客座率,其中,所述第三阈值少于第二阈值。
本发明技术方案提供的基于多粒度时间注意力机制确定航班客座率的方法和系统基于采集历史的航班客座率数据,通过对建立的预测航班客座率模型进行训练并验证生成预测航班客座率的最优模型,再基于所述最优模型,根据所述航线历史航班客座率数据预测目标航班在未来一段时间的客座率,从而通过所述模型的输出结果对目标航班的航行进行调整。所述方法和系统与现有技术相比,建立的模型除考虑航班自身每日客座率变化外,还考虑到目标航班客座率受其所在航线中其他邻近起飞时刻的航班客座率影响,存在起飞时刻相关性,即同一航线上起飞时刻越相近的航班对应的客座率相差更小;在时间粒度上,航班客座率不仅存在起飞时刻相关性,还存在起飞日相关性,即航班自身的客座率数据在起飞日的时间维度上呈现出时间依赖关系,如航班在预测时间区间的客座率与该航班前一周同一星期的客座率具有的周周期性、与该航班过去同一时间区间的客座率具有的周期性;同样,航班自身属性及节假日、航班所在航线是否开设高铁等其他因素也会影响航班客座率,因此,本发明的预测模型通过历史数据预测未来时间段的航班客座率准确率更高,从而能够更好地帮助民航市场从业者提前感知市场需求进而及时采取对应决策,同时为解决铁路、公路等其他交通领域的时间序列预测问题提供了新的解决思路。
附图说明
通过参考下面的附图,可以更为完整地理解本发明的示例性实施方式:
图1为根据本发明优选实施方式的基于多粒度时间注意力机制确定航班客座率的方法的流程图;
图2为根据本发明优选实施方式的预测航线航班客座率的模型的结构示意图;
图3为根据本发明优选实施方式的基于多粒度时间注意力机制确定航班客座率的系统的结构示意图。
具体实施方式
现在参考附图介绍本发明的示例性实施方式,然而,本发明可以用许多不同的形式来实施,并且不局限于此处描述的实施例,提供这些实施例是为了详尽地且完全地公开本发明,并且向所属技术领域的技术人员充分传达本发明的范围。对于表示在附图中的示例性实施方式中的术语并不是对本发明的限定。在附图中,相同的单元/元件使用相同的附图标记。
除非另有说明,此处使用的术语(包括科技术语)对所属技术领域的技术人员具有通常的理解含义。另外,可以理解的是,以通常使用的词典限定的术语,应当被理解为与其相关领域的语境具有一致的含义,而不应该被理解为理想化的或过于正式的意义。
图1为根据本发明优选实施方式的基于多粒度时间注意力机制确定航班客座率的方法的流程图。如图1所示,本优选实施方式所述的基于多粒度时间注意力机制确定航班客座率的方法100从步骤101开始。
在步骤101,建立预测所述航线航班客座率的最优模型。
在步骤102,采集一个航线在某一个时间周期内所有起飞时刻的历史航班客座率数据,生成初始样本集。
在步骤103,对所述历史航班客座率数据中具有离散属性和连续属性的数据进行预处理,生成有效样本集。
在步骤104,基于预先确定的预测所述航线航班客座率的最优模型,以所述有效样本集中目标航班的数据为输入向量,对所述航线上的目标航班未来τ天的客座率进行预测。
在步骤105,根据预测所述航线上航班客座率的最优模型的输出结果对所述目标航班在所述航线上未来τ天的航行进行调整。
优选地,所述方法在采集一个航线在某一个时间周期内所有起飞时刻的历史航班客座率数据之前还包括建立预测所述航线航班客座率的最优模型,其中:
采集一个航线在某一个时间周期内所有起飞时刻的历史航班客座率数据,生成初始样本集;
对所述初始样本集中具有离散属性和连续属性的数据进行预处理,生成有效样本集;
按照预先设置的比例,将有效样本集划分为非重叠的有效训练集和有效验证集;
设置与训练预测航班客座率的第一模型的相关的信息和预测航班客座率的第一模型中的超参的初始值。
图2为根据本发明优选实施方式的预测航线航班客座率的模型的结构示意图。如图2所示,本优选实施方式中的预测航线航班客座率的模型200 包括2个编码器模块201和202,1个解码器模块203和1个外部因素融合模块204,所述2个编码器模块分别是临近时段编码器模块201和遥远时段编码器模块202,其用于对输入向量进行编码,所述临近时段编码器模块201的输入向量是临近时段所述航线上目标航班所有起飞时刻的航班客座率时间序列,所述遥远时段编码器模块202的输入向量是遥远时段所述航线上目标航班所有起飞时刻的航班客座率时间序列,所述临近时段是指与需要预测的目标航班在预测时段内的每一天相邻的时间段,所述遥远时段是指与需要预测的目标航班在预测时段内的每一天相隔一定天数的时间段,外部因素融合模块204用于确定除所述航线起飞时间以外的外部因素对所述航线上的航班的影响,其输入向量为有效训练集中目标航班在预测时间内的除所述航线起飞时间以外的外部因素的数据,解码器模块203用于输出所述航线上目标航班客座率预测结果;临近时段编码器模块201包括第一临近时段长短期记忆网络LSTM单元211和第二临近时段LSTM单元 212,所述遥远时段编码器模202块包括第一遥远时段LSTM单元221和第二遥远时段LSTM单元222,所述解码器模块203包括解码LSTM单元231,所述与训练预测航班客座率的第一模型的相关的信息包括批大小、学习、训练轮数和防止过拟合策略;所述超参指第一临近时段长短期记忆网络 LSTM单元和第一遥远时段LSTM单元隐藏层状态数,第二临近时段LSTM单元和第二遥远时段LSTM单元隐藏层状态数,解码LSTM单元隐藏层状态数,以及临近时段和遥远时段的时间窗口长度。所述外部因素模块204的数据输入单元241进行的外部因素数据,然后再通过连接层242将所有的外部因素数据进行连接后作为输出传输至解码器模块203的连接层232,而解码器模块203则通过连接层232将临近时段编码器模块201和遥远时段编码器模块202的输出,以及外部因素模块204的输出进行连接后,传输至解码LSTM单元进行预测结果的输出。
根据所述有效训练集,基于预测航班客座率的第一模型进行客座率预测,并将所述第一模型的输出结果与所述有效训练集中的航班客座率数据进行比较,确定所述第一模型中的最优参数值,生成预测航班客座率的第二模型,其中,所述第一模型中的最优参数是指第一临近时段长短期记忆网络LSTM单元、第一遥远时段LSTM单元、第二临近时段LSTM单元和第二遥远时段LSTM单元中需要学习的参数的最优值;
根据所述有效验证集,为所述预测航班客座率的第二模型中的超参赋值后进行客座率预测,并将所述第二模型的输出结果与所述有效验证集中的目标航班在预测时间段的航班客座率数据进行比较,将比较结果最接近时的超参值作为所述第二模型中的超参的最优值,生成预测航班客座率的最优模型。
优选地,所述对所述初始样本集中具有离散特征和连续特征的数据进行预处理,生成有效样本集包括:
对于初始样本集中ID离散属性的数据采用one-hot编码方式进行编码,并将编码后的结果输入至全连接神经网络层将高维向量映射为低维向量,所述低维向量为第一数据,其中,所述ID离散属性的数据包括航空公司,机型;
对于初始样本集中一般离散属性的数据采用one-hot编码方式进行编码,所述编码后的结果为第二数据,其中,所述一般离散属性的数据包括是否工作日,是否节假晶,是否节假日前,是否节假日后;
对于初始样本集中具有连续属性的数据采用Min-Max归一化方法归一到[0,1]之间,所述归一后的数据为第三数据,其中,所述具有连续属性的数据包括航班起飞时刻,机舱座位数,所述归一化的计算公式为:
x′=(x-min x)/(max x-min x)
式中,x代表具有连续属性的原数据,x′代表经过归一化处理后新的数据,minx、maxx分别代表归一化处理前具有连续属性的原数据的最小值和最大值;
将所述第一数据、第二数据、第三数据按照初始样本集中的顺序进行排列,生成有效样本集。
优选地,根据所述有效训练集,基于预测航班客座率的第一模型进行客座率预测,并将所述第一模型的输出结果与所述有效训练集中的航班客座率数据进行比较,确定所述第一模型的最优参数,生成预测航班客座率的第二模型包括:
对于临近时段编码器模块:
给定临近时段输入序列Xnear=(xnear,1,xnear,2,…,xnear,T),
Figure RE-GDA0002496436480000201
将xnear ,t作为第一临近时段LSTM单元在目标航班第t个起飞时刻航班的输入,其中,所述ln为临时时段的时间窗口长度,T为目标航班在所述航线上的所有起飞时刻的数目;
采用
Figure RE-GDA0002496436480000202
更新第一临近时段LSTM单元在第t个起飞时刻的隐藏层状态值,其中feb代表第一临近时段LSTM单元的更新函数,通过所述第一临近时段LSTM单元计算得到每个起飞时刻下的隐藏层状态值
Figure RE-GDA0002496436480000203
其中,n为第一临近时段 LSTM单元的隐藏层状态数;
采用起飞时刻注意力机制,基于所述第一临近时段LSTM单元在第 t个起飞时刻下的隐藏层状态值
Figure RE-GDA0002496436480000204
以及所述第二临近时段LSTM单元在临近时段历史第k-1个起飞日的隐藏层状态值
Figure RE-GDA0002496436480000205
及记忆单元状态值
Figure RE-GDA0002496436480000206
计算在起飞日第k天时,第t个起飞时刻的航班客座率时间序列对目标航班当天客座率影响程度的注意力权重
Figure RE-GDA0002496436480000207
其计算公式为:
Figure RE-GDA0002496436480000208
Figure RE-GDA0002496436480000209
式中,待学习的参数是Ve,
Figure RE-GDA00024964364800002010
m为第二临近时段LSTM单元的隐藏层状态数,所述起飞时刻注意力机制是前馈神经网络;
采用softmax函数对
Figure RE-GDA0002496436480000211
进行归一化,使注意力权重
Figure RE-GDA0002496436480000212
之和为1;
基于目标航班在起飞日第k天的每个起飞时刻下的隐藏层状态值 hnear和注意力权重
Figure RE-GDA0002496436480000213
计算起飞日第k天的输出向量
Figure RE-GDA0002496436480000214
其计算公式为:
Figure RE-GDA0002496436480000215
采用
Figure RE-GDA0002496436480000216
更新第二临近时段LSTM单元在第k个起飞日的隐藏层状态值,fea代表第二临近时段LSTM单元的更新函数,通过所述第二临近时段LSTM单元计算得到临近时段每个起飞日的隐藏层状态值
Figure RE-GDA0002496436480000217
其中,m为第二临近时段LSTM 单元的隐藏层状态数;
采用起飞日注意力机制,基于所述第二临近时段LSTM单元在临近时段历史第k个起飞日的隐藏层状态值
Figure RE-GDA0002496436480000218
及解码器中的解码LSTM单元在第d-1个预测日的隐藏层状态值gd-1及记忆单元状态值s d-1计算在第d个预测日对应的临近时段编码器模块在历史第k个起飞日的隐藏层状态值的注意力权重
Figure RE-GDA0002496436480000219
其计算公式为:
Figure RE-GDA00024964364800002110
Figure RE-GDA00024964364800002111
式中,待学习的参数是Va,
Figure RE-GDA00024964364800002112
p 为解码LSTM单元隐藏层状态数,所述起飞日注意力机制是前馈神经网络;
采用softmax函数对
Figure RE-GDA00024964364800002113
进行归一化,使注意力权重
Figure RE-GDA00024964364800002114
之和为1;
基于目标航班在临近时段的每个起飞日的隐藏层状态值qnear和注意力权重
Figure RE-GDA00024964364800002115
计算目标航班的第d个预测日,在所述临近时段编码器模块经过起飞日注意力机制后输出的上下文向量
Figure RE-GDA00024964364800002116
其计算公式为:
Figure RE-GDA00024964364800002117
对于遥远时段编码器模块:
给定临近时段输入序列Xdistant=(xdistant,1,xdistant,2,…,xdistant,T),
Figure RE-GDA00024964364800002118
将xdistant,t作为第一遥远时段LSTM单元在目标航班第t个起飞时刻航班的输入,其中,所述ld为遥远时段的时间窗口长度,T为目标航班在所述航线上的所有起飞时刻的数目;
采用
Figure RE-GDA0002496436480000221
更新第一遥远时段LSTM单元在第t个起飞时刻的隐藏层状态值,其中feb′代表第一遥远时段LSTM单元的更新函数,通过所述第一遥远时段LSTM单元计算得到每个起飞时刻下的隐藏层状态值
Figure RE-GDA0002496436480000222
其中,n为第一遥远时段LSTM单元的隐藏层状态数;
采用起飞时刻注意力机制,基于所述第一遥远时段LSTM单元在第 t个起飞时刻下的隐藏层状态值
Figure RE-GDA0002496436480000223
以及所述第二遥远时段LSTM单元在遥远时段历史第k-1个起飞日的隐藏层状态值
Figure RE-GDA0002496436480000224
及记忆单元状态值
Figure RE-GDA0002496436480000225
计算在起飞日第k天时,第t个起飞时刻的航班客座率时间序列对目标航班当天客座率影响程度的注意力权重
Figure RE-GDA0002496436480000226
其计算公式为:
Figure RE-GDA0002496436480000227
Figure RE-GDA0002496436480000228
式中,m为第二遥远时段LSTM单元的隐藏层状态数,待学习的参数是V’e,
Figure RE-GDA0002496436480000229
所述起飞时刻注意力机制是前馈神经网络;
采用softmax函数对
Figure RE-GDA00024964364800002210
进行归一化,使注意力权重
Figure RE-GDA00024964364800002211
之和为1;基于目标航班在起飞日第k天的每个起飞时刻下的隐藏层状态值 hdistant和注意力权重
Figure RE-GDA00024964364800002212
计算起飞日第k天的输出向量
Figure RE-GDA00024964364800002213
其计算公式为:
Figure RE-GDA00024964364800002214
采用
Figure RE-GDA00024964364800002215
更新第二遥远时段LSTM单元在第k个起飞日的隐藏层状态值,fea’代表第二遥远时段LSTM单元的更新函数,通过所述第二遥远时段LSTM单元计算得到遥远时段每个起飞日的隐藏层状态值
Figure RE-GDA00024964364800002216
其中,m为第二遥远时段LSTM单元的隐藏层状态数;
采用起飞日注意力机制,基于所述第二遥远时段LSTM单元在遥远时段历史第k个起飞日的隐藏层状态值
Figure RE-GDA0002496436480000231
及解码器中的解码LSTM单元在第d-1个预测日的隐藏层状态值gd-1及记忆单元状态值s′d-1计算在第d 个预测日对应的遥远时段编码器模块在历史第k个起飞日的隐藏层状态值的注意力权重
Figure RE-GDA0002496436480000232
其计算公式为:
Figure RE-GDA0002496436480000233
Figure RE-GDA0002496436480000234
式中,待确定的参数是V′a,
Figure RE-GDA0002496436480000235
p为解码LSTM单元隐藏层状态数,所述起飞日注意力机制是前馈神经网络;
采用softmax函数对
Figure RE-GDA0002496436480000236
进行归一化,使注意力权重
Figure RE-GDA0002496436480000237
之和为1;
基于目标航班在遥远时段的每个起飞日的隐藏层状态值qdistant和注意力权重
Figure RE-GDA0002496436480000238
计算目标航班的第d个预测日,在所述遥远时段编码器模块经过起飞日注意力机制后输出的上下文向量
Figure RE-GDA0002496436480000239
其计算公式为:
Figure RE-GDA00024964364800002310
对于外部因素融合模块:
将有效训练集中预测时间段的外部因素数据进行连接后作为所述模块的输出,记为
Figure RE-GDA00024964364800002311
其中d为解码器模块预测时间段的第d个起飞日,i为解码器模块预测时间段的第i个起飞时刻,Ne为外部因素个数;
对于解码器模块:
经过临近时段编码器模块及遥远时段编码器模块的起飞日注意力机制分别计算得到对于未来第d天的加权求和的上下文向量
Figure RE-GDA00024964364800002312
之后,在解码器模块中,将所述两个上下文向量
Figure RE-GDA00024964364800002313
与外部因素融合模块的输出
Figure RE-GDA00024964364800002314
以及解码器模块上一时刻的输出
Figure RE-GDA00024964364800002315
相结合来更新解码器隐藏层状态,公式如下:
Figure RE-GDA00024964364800002316
式中,fd表示解码器中使用的解码LSTM单元更新函数;
将上下文向量
Figure RE-GDA0002496436480000241
与隐藏状态gd进行向量拼接,确定进行最终预测的新隐藏层状态,公式如下:
Figure RE-GDA0002496436480000242
式中,矩阵
Figure RE-GDA0002496436480000243
及向量
Figure RE-GDA0002496436480000244
将拼接向量
Figure RE-GDA0002496436480000245
维度映射到解码器模块隐藏层的维度;
使用线性变换
Figure RE-GDA0002496436480000246
来生成最终输出结果;
将解码器模块最终输出结果与所述有效训练集中预测时间段中对应的航班客座率数据进行比较,将比较结果最接近时的需要学习的参数的值作为所述第一模型中的最优参数值,并根据确定的所述第一模型的最优参数值,生成预测航班客座率的第二模型。
优选地,所述根据预测所述航线上航班客座率的最优模型的输出结果对所述目标航班在所述航线上未来τ天的航行进行调整包括:
当目标航班未来τ天内的起飞时刻的客座率高于设定的第一阈值时,增加所述起飞时刻航班的飞行次数;
当目标航班未来τ天内的起飞时刻的客座率高于设定的第二阈值时,增加所述起飞时刻航班的售票价格,其中,所述第二阈值小于第一阈值;
当目标航班未来τ天内的起飞时刻的客座率低于设定的第三阈值时,降低所述起飞时刻航班的售票价格以提高航班客座率,其中,所述第三阈值少于第二阈值。
本优选实施方式中,以真实的历史航班客座率数据集为例,其中选取“北京首都-上海虹桥”航线中在两年内起飞日达584天以上的航班数据作为实验数据集,若设置临近时段及遥远时段的时间窗口长度分别为ln= 28、ld=19、预测天数τ=7,则统计信息如表1所示。
表1数据集统计信息
Figure RE-GDA0002496436480000247
Figure RE-GDA0002496436480000251
步骤S1、基于采集的数据集构造初始样本集。
假定h代表需要预测的目标航班未来τ天中的第一天,则预测时段为 [h,h+τ-1],该航线上所有起飞时刻航班的历史客座率数据临近时段为 [h-ln,h-1]、遥远时段为[h-365-(ld-τ)/2,h-366+ (ld-τ)/2+τ],依据以上时段划分构造单个数据样本,按照每天一次滑动构建新的预测时段,依据上述操作,每一个航班可以构建353个样本,则总样本数为27×353=9531。
步骤S2、对实验涉及的数据进行数据预处理,生成有效样本集,并划分非重叠的训练集和验证集。
由于航班客座率的取值范围为[0,1],所以无需对其进行归一化处理;对于外部输入数据,本发明采用独热编码(One-Hot)的方式分别对起飞日期星期属性、是否工作日、是否节假日、是否节假日前、是否节假日后、目标航班起飞时选用的机型、航班所属航空公司这些离散特征进行编码;对于起落地GDP、起飞时刻(提取小时及分钟)、各舱座位数这些连续特征本发明采用Min-Max归一化方法归一到[0,1]之间,具体公式为:
x′=(x-min x)/(max x-min x)
其中x代表原数据,x′代表经过归一化处理后新的数据表示,min x、max x 分别代表归一化处理前原数据的最小值和最大值。
本发明按照时间顺序将数据集划分为非重叠的训练集和验证集,划分比例为4:1,即在该实验数据集中选取27个航班预测时段为 2011/01/07-2011/10/20的经济舱客座率数据作为训练集,预测时段为 2011/10/21-2011/12/31的数据作为验证集。
步骤S3、训练预测航班客座率的模型,学习该数据集下模型最优参数,并确定最优超参后生成最优模型。
模型训练阶段,批大小(Batch Size)设为256,学习率为0.001,训练轮数为500,采用早停策略防止过拟合。本发明提出的模型中共有5个需要调节的超参,它们分别是临近时间依赖及遥远时间依赖的时间窗口长度 ln、ld,两部分编码器(Near Encoder及DistantEncoder)中下方LSTM单元的隐藏层状态数n及上方LSTM单元隐藏层状态数m,解码器隐藏层状态数p。在确定模型的最优参数后,为了确定ln和ld的取值,本发明在这两个参数的取值上做网格搜索ln∈{7,14,28,42,56},ld∈{11,15,19,23,27}。本发明选取在验证集上达到最佳预测效果的超参组合(ln=28,ld=19,23) 用于测试。为了简单起见,本发明在两部分编码器及编解码器中所有的LSTM 单元中使用相同的隐藏层维度并在该参数上进行网格搜索n=m=p∈ {32,64,128,256},选取在验证集上取得最佳预测效果的隐藏层维度(n= m=p=64)用于模型评估。另外,本发明采用堆叠LSTMs(层数f=2)作为编解码器的单元来提高模型性能。
步骤S4、基于确定的最优模型,根据采集的航线的历史航班客座率数据进行未来时间段航班客座率的预测。
为了验证本优选实施方式所述的最优模型预测航班客座率的准确度,本发明将最优模型在验证集上进行模型预测性能评估,与其他基准方法进行对比。本优选实施方式采用平均绝对误差(MAE)和均方根误差(RMSE)作为模型预测效果的评价指标。本发明提出的模型与其他基准方法预测结果进行对比,准确度明显高于其他方法。
图3为根据本发明优选实施方式的基于多粒度时间注意力机制确定航班客座率的系统的结构示意图。如图3所示,本优选实施方式所述的基于多粒度时间注意力机制确定航班客座率的系统300包括:
模型建立单元301,其用于建立预测所述航线航班客座率的最优模型。
数据采集单元302,其用于采集一个航线在某一个时间周期内所有起飞时刻的历史航班客座率数据,生成初始样本集;
数据处理单元303,其用于对所述历史航班客座率数据中具有离散属性和连续属性的数据进行预处理,生成有效样本集;
预测结果单元304,其用于基于预先确定的预测所述航线航班客座率的最优模型,以所述有效样本集中目标航班的数据为输入向量,对所述航线上的目标航班未来τ天的客座率进行预测;
航班调整单元305,其用于根据预测所述航线上航班客座率的最优模型的输出结果对所述目标航班在所述航线上未来τ天的航行进行调整。
优选地,所述模型建立单元301包括:
数据采集单元311,其用于采集一个航线在某一个时间周期内所有起飞时刻的历史航班客座率数据,生成初始样本集;
数据处理单元312,其用于对所述初始样本集中具有离散属性和连续属性的数据进行预处理,生成有效样本集;
样本划分单元313,其用于按照预先设置的比例,将有效样本集划分为非重叠的有效训练集和有效验证集;
第一模型单元314,其用于建立预测航班客座率的第一模型,并设置与训练预测航班客座率的第一模型的相关的信息和预测航班客座率的第一模型中的超参的初始值,其中,所述第一模型包括2个编码器模块,1个解码器模块和1个外部因素融合模块,所述2个编码器模块分别是临近时段编码器模块和遥远时段编码器模块,其用于对输入向量进行编码,所述临近时段编码器模块的输入向量是临近时段所述航线上目标航班所有起飞时刻的航班客座率时间序列,所述遥远时段编码器模块的输入向量是遥远时段所述航线上目标航班所有起飞时刻的航班客座率时间序列,所述临近时段是指与需要预测的目标航班在预测时段内的每一天相邻的时间段,所述遥远时段是指与需要预测的目标航班在预测时段内的每一天相隔一定天数的时间段,外部因素融合模块用于确定除所述航线起飞时间以外的外部因素对所述航线上的航班的影响,其输入向量为有效训练集中目标航班在预测时间内的除所述航线起飞时间以外的外部因素的数据,解码器模块用于输出所述航线上目标航班客座率预测结果;临近时段编码器模块包括第一临近时段长短期记忆网络LSTM单元和第二临近时段LSTM单元,所述遥远时段编码器模块包括第一遥远时段LSTM单元和第二遥远时段LSTM单元,所述解码器模块包括解码LSTM单元,所述与训练预测航班客座率的第一模型的相关的信息包括批大小、学习、训练轮数和防止过拟合策略;所述超参指第一临近时段长短期记忆网络LSTM单元和第一遥远时段LSTM单元隐藏层状态数,第二临近时段LSTM单元和第二遥远时段LSTM单元隐藏层状态数,解码LSTM单元隐藏层状态数,以及临近时段和遥远时段的时间窗口长度;
模型训练单元315,其用于根据所述有效训练集,基于预测航班客座率的第一模型进行客座率预测,并将所述第一模型的输出结果与所述有效训练集中的航班客座率数据进行比较,确定所述第一模型中的最优参数值,生成预测航班客座率的第二模型,其中,所述第一模型中的最优参数是指第一临近时段长短期记忆网络LSTM单元、第一遥远时段LSTM单元、第二临近时段LSTM单元和第二遥远时段LSTM单元中需要学习的参数的最优值;
最优模型单元316,其用于根据所述有效验证集,为所述预测航班客座率的第二模型中的超参赋值后进行客座率预测,并将所述第二模型的输出结果与所述有效验证集中的目标航班在预测时间段的航班客座率数据进行比较,将比较结果最接近时的超参值作为所述第二模型中的超参的最优值,生成预测航班客座率的最优模型。
优选地,所述数据处理单元303对所述初始样本集中具有离散特征和连续特征的数据进行预处理,生成有效样本集包括:
对于初始样本集中ID离散属性的数据采用one-hot编码方式进行编码,并将编码后的结果输入至全连接神经网络层将高维向量映射为低维向量,所述低维向量为第一数据,其中,所述ID离散属性的数据包括航空公司,机型;
对于初始样本集中一般离散属性的数据采用one-hot编码方式进行编码,所述编码后的结果为第二数据,其中,所述一般离散属性的数据包括是否工作日,是否节假晶,是否节假日前,是否节假日后;
对于初始样本集中具有连续属性的数据采用Min-Max归一化方法归一到[0,1]之间,所述归一后的数据为第三数据,其中,所述具有连续属性的数据包括航班起飞时刻,机舱座位数,所述归一化的计算公式为:
x′=(x-min x)/(max x-min x)
式中,x代表具有连续属性的原数据,x′代表经过归一化处理后新的数据,minx、maxx分别代表归一化处理前具有连续属性的原数据的最小值和最大值;
将所述第一数据、第二数据、第三数据按照初始样本集中的顺序进行排列,生成有效样本集。
优选地,所述模型训练单元315根据所述有效训练集,基于预测航班客座率的第一模型进行客座率预测,并将所述第一模型的输出结果与所述有效训练集中的航班客座率数据进行比较,确定所述第一模型的最优参数,生成预测航班客座率的第二模型包括:
对于临近时段编码器模块:
给定临近时段输入序列Xnear=(xnear,1,xnear,2,…,xnear,T),
Figure RE-GDA0002496436480000291
将xnear ,t作为第一临近时段LSTM单元在目标航班第t个起飞时刻航班的输入,其中,所述ln为临时时段的时间窗口长度,T为目标航班在所述航线上的所有起飞时刻的数目;
采用
Figure RE-GDA0002496436480000292
更新第一临近时段LSTM单元在第t个起飞时刻的隐藏层状态值,其中feb代表第一临近时段LSTM单元的更新函数,通过所述第一临近时段LSTM单元计算得到每个起飞时刻下的隐藏层状态值
Figure RE-GDA0002496436480000293
其中,n为第一临近时段LSTM单元的隐藏层状态数;
采用起飞时刻注意力机制,基于所述第一临近时段LSTM单元在第 t个起飞时刻下的隐藏层状态值
Figure RE-GDA0002496436480000301
以及所述第二临近时段LSTM单元在临近时段历史第k-1个起飞日的隐藏层状态值
Figure RE-GDA0002496436480000302
及记忆单元状态值
Figure RE-GDA0002496436480000303
计算在起飞日第k天时,第t个起飞时刻的航班客座率时间序列对目标航班当天客座率影响程度的注意力权重
Figure RE-GDA0002496436480000304
其计算公式为:
Figure RE-GDA0002496436480000305
Figure RE-GDA0002496436480000306
式中,待学习的参数是Ve,
Figure RE-GDA0002496436480000307
m为第二临近时段LSTM单元的隐藏层状态数,所述起飞时刻注意力机制是前馈神经网络;
采用softmax函数对
Figure RE-GDA0002496436480000308
进行归一化,使注意力权重
Figure RE-GDA0002496436480000309
之和为1;
基于目标航班在起飞日第k天的每个起飞时刻下的隐藏层状态值 hnear和注意力权重
Figure RE-GDA00024964364800003010
计算起飞日第k天的输出向量
Figure RE-GDA00024964364800003011
其计算公式为:
Figure RE-GDA00024964364800003012
采用
Figure RE-GDA00024964364800003013
更新第二临近时段LSTM单元在第k个起飞日的隐藏层状态值,fea代表第二临近时段LSTM单元的更新函数,通过所述第二临近时段LSTM单元计算得到临近时段每个起飞日的隐藏层状态值
Figure RE-GDA00024964364800003014
其中,m为第二临近时段LSTM 单元的隐藏层状态数;
采用起飞日注意力机制,基于所述第二临近时段LSTM单元在临近时段历史第k个起飞日的隐藏层状态值
Figure RE-GDA00024964364800003015
及解码器中的解码LSTM单元在第d-1个预测日的隐藏层状态值gd-1及记忆单元状态值s′d-1计算在第d个预测日对应的临近时段编码器模块在历史第k个起飞日的隐藏层状态值的注意力权重
Figure RE-GDA00024964364800003016
其计算公式为:
Figure RE-GDA00024964364800003017
Figure RE-GDA0002496436480000311
式中,待学习的参数是Va,
Figure RE-GDA0002496436480000312
p 为解码LSTM单元隐藏层状态数,所述起飞日注意力机制是前馈神经网络;
采用softmax函数对
Figure RE-GDA0002496436480000313
进行归一化,使注意力权重
Figure RE-GDA0002496436480000314
之和为1;
基于目标航班在临近时段的每个起飞日的隐藏层状态值qnear和注意力权重
Figure RE-GDA0002496436480000315
计算目标航班的第d个预测日,在所述临近时段编码器模块经过起飞日注意力机制后输出的上下文向量
Figure RE-GDA0002496436480000316
其计算公式为:
Figure RE-GDA0002496436480000317
对于遥远时段编码器模块:
给定临近时段输入序列Xdistant=(xdistant,1,xdistant,2,…,xdistant,T),
Figure RE-GDA0002496436480000318
将xdistant,t作为第一遥远时段LSTM单元在目标航班第t个起飞时刻航班的输入,其中,所述ld为遥远时段的时间窗口长度,T为目标航班在所述航线上的所有起飞时刻的数目;
采用
Figure RE-GDA0002496436480000319
更新第一遥远时段LSTM单元在第t个起飞时刻的隐藏层状态值,其中feb′代表第一遥远时段LSTM单元的更新函数,通过所述第一遥远时段LSTM单元计算得到每个起飞时刻下的隐藏层状态值
Figure RE-GDA00024964364800003110
其中,n为第一遥远时段LSTM单元的隐藏层状态数;
采用起飞时刻注意力机制,基于所述第一遥远时段LSTM单元在第 t个起飞时刻下的隐藏层状态值
Figure RE-GDA00024964364800003111
以及所述第二遥远时段LSTM单元在遥远时段历史第k-1个起飞日的隐藏层状态值
Figure RE-GDA00024964364800003112
及记忆单元状态值
Figure RE-GDA00024964364800003113
计算在起飞日第k天时,第t个起飞时刻的航班客座率时间序列对目标航班当天客座率影响程度的注意力权重
Figure RE-GDA00024964364800003114
其计算公式为:
Figure RE-GDA00024964364800003115
Figure RE-GDA00024964364800003116
式中,m为第二遥远时段LSTM单元的隐藏层状态数,待学习的参数是V’e,
Figure RE-GDA0002496436480000321
所述起飞时刻注意力机制是前馈神经网络;
采用softmax函数对
Figure RE-GDA0002496436480000322
进行归一化,使注意力权重
Figure RE-GDA0002496436480000323
之和为1;基于目标航班在起飞日第k天的每个起飞时刻下的隐藏层状态值 hdistant和注意力权重
Figure RE-GDA0002496436480000324
计算起飞日第k天的输出向量
Figure RE-GDA0002496436480000325
其计算公式为:
Figure RE-GDA0002496436480000326
采用
Figure RE-GDA0002496436480000327
更新第二遥远时段LSTM单元在第k个起飞日的隐藏层状态值,fea’代表第二遥远时段LSTM单元的更新函数,通过所述第二遥远时段LSTM单元计算得到遥远时段每个起飞日的隐藏层状态值
Figure RE-GDA0002496436480000328
其中,m为第二遥远时段LSTM单元的隐藏层状态数;
采用起飞日注意力机制,基于所述第二遥远时段LSTM单元在遥远时段历史第k个起飞日的隐藏层状态值
Figure RE-GDA0002496436480000329
及解码器中的解码LSTM单元在第d-1个预测日的隐藏层状态值gd-1及记忆单元状态值s′d-1计算在第d 个预测日对应的遥远时段编码器模块在历史第k个起飞日的隐藏层状态值的注意力权重
Figure RE-GDA00024964364800003210
其计算公式为:
Figure RE-GDA00024964364800003211
Figure RE-GDA00024964364800003212
式中,待确定的参数是V′a,
Figure RE-GDA00024964364800003213
p为解码LSTM单元隐藏层状态数,所述起飞日注意力机制是前馈神经网络;
采用softmax函数对
Figure RE-GDA00024964364800003214
进行归一化,使注意力权重
Figure RE-GDA00024964364800003215
之和为1;
基于目标航班在遥远时段的每个起飞日的隐藏层状态值qdistant和注意力权重
Figure RE-GDA00024964364800003216
计算目标航班的第d个预测日,在所述遥远时段编码器模块经过起飞日注意力机制后输出的上下文向量
Figure RE-GDA00024964364800003217
其计算公式为:
Figure RE-GDA00024964364800003218
对于外部因素融合模块:
将有效训练集中预测时间段的外部因素数据进行连接后作为所述模块的输出,记为
Figure RE-GDA0002496436480000331
其中d为解码器模块预测时间段的第d个起飞日,i为解码器模块预测时间段的第i个起飞时刻,Ne为外部因素个数;
对于解码器模块:
经过临近时段编码器模块及遥远时段编码器模块的起飞日注意力机制分别计算得到对于未来第d天的加权求和的上下文向量
Figure RE-GDA0002496436480000332
之后,在解码器模块中,将所述两个上下文向量
Figure RE-GDA0002496436480000333
与外部因素融合模块的输出
Figure RE-GDA0002496436480000334
以及解码器模块上一时刻的输出
Figure RE-GDA0002496436480000335
相结合来更新解码器隐藏层状态,公式如下:
Figure RE-GDA0002496436480000336
式中,fd表示解码器中使用的解码LSTM单元更新函数;
将上下文向量
Figure RE-GDA0002496436480000337
与隐藏状态gd进行向量拼接,确定进行最终预测的新隐藏层状态,公式如下:
Figure RE-GDA0002496436480000338
式中,矩阵
Figure RE-GDA0002496436480000339
及向量
Figure RE-GDA00024964364800003310
将拼接向量
Figure RE-GDA00024964364800003311
维度映射到解码器模块隐藏层的维度;
使用线性变换
Figure RE-GDA00024964364800003312
来生成最终输出结果;
将解码器模块最终输出结果与所述有效训练集中预测时间段中对应的航班客座率数据进行比较,将比较结果最接近时的需要学习的参数的值作为所述第一模型中的最优参数值,并根据确定的所述第一模型的最优参数值,生成预测航班客座率的第二模型。
优选地,所述航班调整单元305根据预测所述航线上航班客座率的最优模型的输出结果对所述目标航班在所述航线上未来τ天的航行进行调整包括:
当目标航班未来τ天内的起飞时刻的客座率高于设定的第一阈值时,增加所述起飞时刻航班的飞行次数;
当目标航班未来τ天内的起飞时刻的客座率高于设定的第二阈值时,增加所述起飞时刻航班的售票价格,其中,所述第二阈值小于第一阈值;
当目标航班未来τ天内的起飞时刻的客座率低于设定的第三阈值时,降低所述起飞时刻航班的售票价格以提高航班客座率,其中,所述第三阈值少于第二阈值。
本发明所述基于多粒度时间注意力机制确定航班客座率的系统对目标航班未来时间段的客座率进行预测并调整的步骤与本发明所述基于多粒度时间注意力机制确定航班客座率的方法采取的步骤相同,并且达到的技术效果也相同,此处不再赘述。
已经通过参考少量实施方式描述了本发明。然而,本领域技术人员所公知的,正如附带的专利权利要求所限定的,除了本发明以上公开的其他的实施例等同地落在本发明的范围内。
通常地,在权利要求中使用的所有术语都根据他们在技术领域的通常含义被解释,除非在其中被另外明确地定义。所有的参考“一个/所述/该 [装置、组件等]”都被开放地解释为所述装置、组件等中的至少一个实例,除非另外明确地说明。这里公开的任何方法的步骤都没必要以公开的准确的顺序运行,除非明确地说明。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
最后应当说明的是:以上实施例仅用以说明本发明的技术方案而非对其限制,尽管参照上述实施例对本发明进行了详细的说明,所属领域的普通技术人员应当理解:依然可以对本发明的具体实施方式进行修改或者等同替换,而未脱离本发明精神和范围的任何修改或者等同替换,其均应涵盖在本发明的权利要求保护范围之内。

Claims (10)

1.一种基于多粒度时间注意力机制确定航班客座率的方法,其特征在于,所述方法包括:
采集一个航线在某一个时间周期内所有起飞时刻的历史航班客座率数据,生成初始样本集;
对所述历史航班客座率数据中具有离散属性和连续属性的数据进行预处理,生成有效样本集;
基于预先确定的预测所述航线航班客座率的最优模型,以所述有效样本集中目标航班的数据为输入向量,对所述航线上的目标航班未来τ天的客座率进行预测;
根据预测所述航线上航班客座率的最优模型的输出结果对所述目标航班在所述航线上未来τ天的航行进行调整。
2.根据权利要求1所述的方法,其特征在于,所述方法在采集一个航线在某一个时间周期内所有起飞时刻的历史航班客座率数据之前还包括建立预测所述航线航班客座率的最优模型,其中:
采集一个航线在某一个时间周期内所有起飞时刻的历史航班客座率数据,生成初始样本集;
对所述初始样本集中具有离散属性和连续属性的数据进行预处理,生成有效样本集;
按照预先设置的比例,将有效样本集划分为非重叠的有效训练集和有效验证集;
设置与训练预测航班客座率的第一模型的相关的信息和预测航班客座率的第一模型中的超参的初始值,其中,所述第一模型包括2个编码器模块,1个解码器模块和1个外部因素融合模块,所述2个编码器模块分别是临近时段编码器模块和遥远时段编码器模块,其用于对输入向量进行编码,所述临近时段编码器模块的输入向量是临近时段所述航线上目标航班所有起飞时刻的航班客座率时间序列,所述遥远时段编码器模块的输入向量是遥远时段所述航线上目标航班所有起飞时刻的航班客座率时间序列,所述临近时段是指与需要预测的目标航班在预测时段内的每一天相邻的时间段,所述遥远时段是指与需要预测的目标航班在预测时段内的每一天相隔一定天数的时间段,外部因素融合模块用于确定除所述航线起飞时间以外的外部因素对所述航线上的航班的影响,其输入向量为有效训练集中目标航班在预测时间内的除所述航线起飞时间以外的外部因素的数据,解码器模块用于输出所述航线上目标航班客座率预测结果;临近时段编码器模块包括第一临近时段长短期记忆网络LSTM单元和第二临近时段LSTM单元,所述遥远时段编码器模块包括第一遥远时段LSTM单元和第二遥远时段LSTM单元,所述解码器模块包括解码LSTM单元,所述与训练预测航班客座率的第一模型的相关的信息包括批大小、学习、训练轮数和防止过拟合策略;所述超参指第一临近时段长短期记忆网络LSTM单元和第一遥远时段LSTM单元隐藏层状态数,第二临近时段LSTM单元和第二遥远时段LSTM单元隐藏层状态数,解码LSTM单元隐藏层状态数,以及临近时段和遥远时段的时间窗口长度;
根据所述有效训练集,基于预测航班客座率的第一模型进行客座率预测,并将所述第一模型的输出结果与所述有效训练集中的航班客座率数据进行比较,确定所述第一模型中的最优参数值,生成预测航班客座率的第二模型,其中,所述第一模型中的最优参数是指第一临近时段长短期记忆网络LSTM单元、第一遥远时段LSTM单元、第二临近时段LSTM单元和第二遥远时段LSTM单元中需要学习的参数的最优值;
根据所述有效验证集,为所述预测航班客座率的第二模型中的超参赋值后进行客座率预测,并将所述第二模型的输出结果与所述有效验证集中的目标航班在预测时间段的航班客座率数据进行比较,将比较结果最接近时的超参值作为所述第二模型中的超参的最优值,生成预测航班客座率的最优模型。
3.根据权利要求1或者2所述的方法,其特征在于,所述对所述初始样本集中具有离散特征和连续特征的数据进行预处理,生成有效样本集包括:
对于初始样本集中ID离散属性的数据采用one-hot编码方式进行编码,并将编码后的结果输入至全连接神经网络层将高维向量映射为低维向量,所述低维向量为第一数据,其中,所述ID离散属性的数据包括航空公司,机型;
对于初始样本集中一般离散属性的数据采用one-hot编码方式进行编码,所述编码后的结果为第二数据,其中,所述一般离散属性的数据包括是否工作日,是否节假晶,是否节假日前,是否节假日后;
对于初始样本集中具有连续属性的数据采用Min-Max归一化方法归一到[0,1]之间,所述归一后的数据为第三数据,其中,所述具有连续属性的数据包括航班起飞时刻,机舱座位数,所述归一化的计算公式为:
x′=(x-min x)/(max x-min x)
式中,x代表具有连续属性的原数据,x′代表经过归一化处理后新的数据,min x、max x分别代表归一化处理前具有连续属性的原数据的最小值和最大值;
将所述第一数据、第二数据、第三数据按照初始样本集中的顺序进行排列,生成有效样本集。
4.根据权利要求2所述的方法,其特征在于,根据所述有效训练集,基于预测航班客座率的第一模型进行客座率预测,并将所述第一模型的输出结果与所述有效训练集中的航班客座率数据进行比较,确定所述第一模型的最优参数,生成预测航班客座率的第二模型包括:
对于临近时段编码器模块:
给定临近时段输入序列Xnear=(xnear,1,xnear,2,…,xnear,T),
Figure RE-FDA0002496436470000031
将xnear,t作为第一临近时段LSTM单元在目标航班第t个起飞时刻航班的输入,其中,所述ln为临时时段的时间窗口长度,T为目标航班在所述航线上的所有起飞时刻的数目;
采用
Figure RE-FDA0002496436470000041
更新第一临近时段LSTM单元在第t个起飞时刻的隐藏层状态值,其中feb代表第一临近时段LSTM单元的更新函数,通过所述第一临近时段LSTM单元计算得到每个起飞时刻下的隐藏层状态值
Figure RE-FDA0002496436470000042
其中,n为第一临近时段LSTM单元的隐藏层状态数;
采用起飞时刻注意力机制,基于所述第一临近时段LSTM单元在第t个起飞时刻下的隐藏层状态值
Figure RE-FDA0002496436470000043
以及所述第二临近时段LSTM单元在临近时段历史第k-1个起飞日的隐藏层状态值
Figure RE-FDA0002496436470000044
及记忆单元状态值
Figure RE-FDA0002496436470000045
计算在起飞日第k天时,第t个起飞时刻的航班客座率时间序列对目标航班当天客座率影响程度的注意力权重
Figure RE-FDA0002496436470000046
其计算公式为:
Figure RE-FDA0002496436470000047
Figure RE-FDA0002496436470000048
式中,待学习的参数是Ve,
Figure RE-FDA0002496436470000049
m为第二临近时段LSTM单元的隐藏层状态数,所述起飞时刻注意力机制是前馈神经网络;
采用softmax函数对
Figure RE-FDA00024964364700000410
进行归一化,使注意力权重
Figure RE-FDA00024964364700000411
之和为1;
基于目标航班在起飞日第k天的每个起飞时刻下的隐藏层状态值hnear和注意力权重
Figure RE-FDA00024964364700000412
计算起飞日第k天的输出向量
Figure RE-FDA00024964364700000413
其计算公式为:
Figure RE-FDA00024964364700000414
采用
Figure RE-FDA00024964364700000415
更新第二临近时段LSTM单元在第k个起飞日的隐藏层状态值,fea代表第二临近时段LSTM单元的更新函数,通过所述第二临近时段LSTM单元计算得到临近时段每个起飞日的隐藏层状态值
Figure RE-FDA00024964364700000416
其中,m为第二临近时段LSTM单元的隐藏层状态数;
采用起飞日注意力机制,基于所述第二临近时段LSTM单元在临近时段历史第k个起飞日的隐藏层状态值
Figure RE-FDA00024964364700000417
及解码器中的解码LSTM单元在第d-1个预测日的隐藏层状态值gd-1及记忆单元状态值s′d-1计算在第d个预测日对应的临近时段编码器模块在历史第k个起飞日的隐藏层状态值的注意力权重
Figure RE-FDA0002496436470000051
其计算公式为:
Figure RE-FDA0002496436470000052
Figure RE-FDA0002496436470000053
式中,待学习的参数是Va,
Figure RE-FDA0002496436470000054
p为解码LSTM单元隐藏层状态数,所述起飞日注意力机制是前馈神经网络;
采用softmax函数对
Figure RE-FDA0002496436470000055
进行归一化,使注意力权重
Figure RE-FDA0002496436470000056
之和为1;
基于目标航班在临近时段的每个起飞日的隐藏层状态值qnear和注意力权重
Figure RE-FDA0002496436470000057
计算目标航班的第d个预测日,在所述临近时段编码器模块经过起飞日注意力机制后输出的上下文向量
Figure RE-FDA0002496436470000058
其计算公式为:
Figure RE-FDA0002496436470000059
对于遥远时段编码器模块:
给定临近时段输入序列Xdistant=(xdistant,1,xdistant,2,…,xdistant,T),
Figure RE-FDA00024964364700000510
将xdistant,t作为第一遥远时段LSTM单元在目标航班第t个起飞时刻航班的输入,其中,所述ld为遥远时段的时间窗口长度,T为目标航班在所述航线上的所有起飞时刻的数目;
采用
Figure RE-FDA00024964364700000511
更新第一遥远时段LSTM单元在第t个起飞时刻的隐藏层状态值,其中feb′代表第一遥远时段LSTM单元的更新函数,通过所述第一遥远时段LSTM单元计算得到每个起飞时刻下的隐藏层状态值
Figure RE-FDA00024964364700000512
其中,n为第一遥远时段LSTM单元的隐藏层状态数;
采用起飞时刻注意力机制,基于所述第一遥远时段LSTM单元在第t个起飞时刻下的隐藏层状态值
Figure RE-FDA00024964364700000513
以及所述第二遥远时段LSTM单元在遥远时段历史第k-1个起飞日的隐藏层状态值
Figure RE-FDA00024964364700000514
及记忆单元状态值
Figure RE-FDA00024964364700000515
计算在起飞日第k天时,第t个起飞时刻的航班客座率时间序列对目标航班当天客座率影响程度的注意力权重
Figure RE-FDA00024964364700000516
其计算公式为:
Figure RE-FDA0002496436470000061
Figure RE-FDA0002496436470000062
式中,m为第二遥远时段LSTM单元的隐藏层状态数,待学习的参数是V’e,
Figure RE-FDA0002496436470000063
所述起飞时刻注意力机制是前馈神经网络;
采用softmax函数对
Figure RE-FDA0002496436470000064
进行归一化,使注意力权重
Figure RE-FDA0002496436470000065
之和为1;
基于目标航班在起飞日第k天的每个起飞时刻下的隐藏层状态值hdistant和注意力权重
Figure RE-FDA0002496436470000066
计算起飞日第k天的输出向量
Figure RE-FDA0002496436470000067
其计算公式为:
Figure RE-FDA0002496436470000068
采用
Figure RE-FDA0002496436470000069
更新第二遥远时段LSTM单元在第k个起飞日的隐藏层状态值,fea’代表第二遥远时段LSTM单元的更新函数,通过所述第二遥远时段LSTM单元计算得到遥远时段每个起飞日的隐藏层状态值
Figure RE-FDA00024964364700000610
其中,m为第二遥远时段LSTM单元的隐藏层状态数;
采用起飞日注意力机制,基于所述第二遥远时段LSTM单元在遥远时段历史第k个起飞日的隐藏层状态值
Figure RE-FDA00024964364700000611
及解码器中的解码LSTM单元在第d-1个预测日的隐藏层状态值gd-1及记忆单元状态值s′d-1计算在第d个预测日对应的遥远时段编码器模块在历史第k个起飞日的隐藏层状态值的注意力权重
Figure RE-FDA00024964364700000612
其计算公式为:
Figure RE-FDA00024964364700000613
Figure RE-FDA00024964364700000614
式中,待确定的参数是V′a,
Figure RE-FDA00024964364700000615
p为解码LSTM单元隐藏层状态数,所述起飞日注意力机制是前馈神经网络;
采用softmax函数对
Figure RE-FDA00024964364700000616
进行归一化,使注意力权重
Figure RE-FDA00024964364700000617
之和为1;
基于目标航班在遥远时段的每个起飞日的隐藏层状态值qdistant和注意力权重
Figure RE-FDA0002496436470000071
计算目标航班的第d个预测日,在所述遥远时段编码器模块经过起飞日注意力机制后输出的上下文向量
Figure RE-FDA0002496436470000072
其计算公式为:
Figure RE-FDA0002496436470000073
对于外部因素融合模块:
将有效训练集中预测时间段的外部因素数据进行连接后作为所述模块的输出,记为
Figure RE-FDA0002496436470000074
其中d为解码器模块预测时间段的第d个起飞日,i为解码器模块预测时间段的第i个起飞时刻,Ne为外部因素个数;
对于解码器模块:
经过临近时段编码器模块及遥远时段编码器模块的起飞日注意力机制分别计算得到对于未来第d天的加权求和的上下文向量
Figure RE-FDA0002496436470000075
之后,在解码器模块中,将所述两个上下文向量
Figure RE-FDA0002496436470000076
与外部因素融合模块的输出
Figure RE-FDA0002496436470000077
以及解码器模块上一时刻的输出
Figure RE-FDA0002496436470000078
相结合来更新解码器隐藏层状态,公式如下:
Figure RE-FDA0002496436470000079
式中,fd表示解码器中使用的解码LSTM单元更新函数;
将上下文向量
Figure RE-FDA00024964364700000710
与隐藏状态gd进行向量拼接,确定进行最终预测的新隐藏层状态,公式如下:
Figure RE-FDA00024964364700000711
式中,矩阵
Figure RE-FDA00024964364700000712
及向量
Figure RE-FDA00024964364700000713
将拼接向量
Figure RE-FDA00024964364700000714
维度映射到解码器模块隐藏层的维度;
使用线性变换
Figure RE-FDA00024964364700000715
来生成最终输出结果;
将解码器模块最终输出结果与所述有效训练集中预测时间段中对应的航班客座率数据进行比较,将比较结果最接近时的需要学习的参数的值作为所述第一模型中的最优参数值,并根据确定的所述第一模型的最优参数值,生成预测航班客座率的第二模型。
5.根据权利要求1所述的方法,其特征在于,所述根据预测所述航线上航班客座率的最优模型的输出结果对所述目标航班在所述航线上未来τ天的航行进行调整包括:
当目标航班未来τ天内的起飞时刻的客座率高于设定的第一阈值时,增加所述起飞时刻航班的飞行次数;
当目标航班未来τ天内的起飞时刻的客座率高于设定的第二阈值时,增加所述起飞时刻航班的售票价格,其中,所述第二阈值小于第一阈值;
当目标航班未来τ天内的起飞时刻的客座率低于设定的第三阈值时,降低所述起飞时刻航班的售票价格以提高航班客座率,其中,所述第三阈值少于第二阈值。
6.一种基于多粒度时间注意力机制确定航班客座率的系统,其特征在于,所述系统包括:
数据采集单元,其用于采集一个航线在某一个时间周期内所有起飞时刻的历史航班客座率数据,生成初始样本集;
数据处理单元,其用于对所述历史航班客座率数据中具有离散属性和连续属性的数据进行预处理,生成有效样本集;
预测结果单元,其用于基于预先确定的预测所述航线航班客座率的最优模型,以所述有效样本集中目标航班的数据为输入向量,对所述航线上的目标航班未来τ天的客座率进行预测;
航班调整单元,其用于根据预测所述航线上航班客座率的最优模型的输出结果对所述目标航班在所述航线上未来τ天的航行进行调整。
7.根据权利要求6所述的系统,其特征在于,所述方法还包括模型建立单元,其用于建立预测所述航线航班客座率的最优模型,所述模型建立单元包括:
数据采集单元,其用于采集一个航线在某一个时间周期内所有起飞时刻的历史航班客座率数据,生成初始样本集;
数据处理单元,其用于对所述初始样本集中具有离散属性和连续属性的数据进行预处理,生成有效样本集;
样本划分单元,其用于按照预先设置的比例,将有效样本集划分为非重叠的有效训练集和有效验证集;
第一模型单元,其用于建立预测航班客座率的第一模型,并设置与训练预测航班客座率的第一模型的相关的信息和预测航班客座率的第一模型中的超参的初始值,其中,所述第一模型包括2个编码器模块,1个解码器模块和1个外部因素融合模块,所述2个编码器模块分别是临近时段编码器模块和遥远时段编码器模块,其用于对输入向量进行编码,所述临近时段编码器模块的输入向量是临近时段所述航线上目标航班所有起飞时刻的航班客座率时间序列,所述遥远时段编码器模块的输入向量是遥远时段所述航线上目标航班所有起飞时刻的航班客座率时间序列,所述临近时段是指与需要预测的目标航班在预测时段内的每一天相邻的时间段,所述遥远时段是指与需要预测的目标航班在预测时段内的每一天相隔一定天数的时间段,外部因素融合模块用于确定除所述航线起飞时间以外的外部因素对所述航线上的航班的影响,其输入向量为有效训练集中目标航班在预测时间内的除所述航线起飞时间以外的外部因素的数据,解码器模块用于输出所述航线上目标航班客座率预测结果;临近时段编码器模块包括第一临近时段长短期记忆网络LSTM单元和第二临近时段LSTM单元,所述遥远时段编码器模块包括第一遥远时段LSTM单元和第二遥远时段LSTM单元,所述解码器模块包括解码LSTM单元,所述与训练预测航班客座率的第一模型的相关的信息包括批大小、学习、训练轮数和防止过拟合策略;所述超参指第一临近时段长短期记忆网络LSTM单元和第一遥远时段LSTM单元隐藏层状态数,第二临近时段LSTM单元和第二遥远时段LSTM单元隐藏层状态数,解码LSTM单元隐藏层状态数,以及临近时段和遥远时段的时间窗口长度;
模型训练单元,其用于根据所述有效训练集,基于预测航班客座率的第一模型进行客座率预测,并将所述第一模型的输出结果与所述有效训练集中的航班客座率数据进行比较,确定所述第一模型中的最优参数值,生成预测航班客座率的第二模型,其中,所述第一模型中的最优参数是指第一临近时段长短期记忆网络LSTM单元、第一遥远时段LSTM单元、第二临近时段LSTM单元和第二遥远时段LSTM单元中需要学习的参数的最优值;
最优模型单元,其用于根据所述有效验证集,为所述预测航班客座率的第二模型中的超参赋值后进行客座率预测,并将所述第二模型的输出结果与所述有效验证集中的目标航班在预测时间段的航班客座率数据进行比较,将比较结果最接近时的超参值作为所述第二模型中的超参的最优值,生成预测航班客座率的最优模型。
8.根据权利要求6或者7所述的系统,其特征在于,所述数据处理单元对所述初始样本集中具有离散特征和连续特征的数据进行预处理,生成有效样本集包括:
对于初始样本集中ID离散属性的数据采用one-hot编码方式进行编码,并将编码后的结果输入至全连接神经网络层将高维向量映射为低维向量,所述低维向量为第一数据,其中,所述ID离散属性的数据包括航空公司,机型;
对于初始样本集中一般离散属性的数据采用one-hot编码方式进行编码,所述编码后的结果为第二数据,其中,所述一般离散属性的数据包括是否工作日,是否节假晶,是否节假日前,是否节假日后;
对于初始样本集中具有连续属性的数据采用Min-Max归一化方法归一到[0,1]之间,所述归一后的数据为第三数据,其中,所述具有连续属性的数据包括航班起飞时刻,机舱座位数,所述归一化的计算公式为:
x′=(x-min x)/(max x-min x)
式中,x代表具有连续属性的原数据,x′代表经过归一化处理后新的数据,min x、max x分别代表归一化处理前具有连续属性的原数据的最小值和最大值;
将所述第一数据、第二数据、第三数据按照初始样本集中的顺序进行排列,生成有效样本集。
9.根据权利要求7所述的方法,其特征在于,所述模型训练单元根据所述有效训练集,基于预测航班客座率的第一模型进行客座率预测,并将所述第一模型的输出结果与所述有效训练集中的航班客座率数据进行比较,确定所述第一模型的最优参数,生成预测航班客座率的第二模型包括:
对于临近时段编码器模块:
给定临近时段输入序列Xnear=(xnear,1,xnear,2,…,xnear,T),
Figure RE-FDA0002496436470000111
将xnear,t作为第一临近时段LSTM单元在目标航班第t个起飞时刻航班的输入,其中,所述ln为临时时段的时间窗口长度,T为目标航班在所述航线上的所有起飞时刻的数目;
采用
Figure RE-FDA0002496436470000112
更新第一临近时段LSTM单元在第t个起飞时刻的隐藏层状态值,其中feb代表第一临近时段LSTM单元的更新函数,通过所述第一临近时段LSTM单元计算得到每个起飞时刻下的隐藏层状态值
Figure RE-FDA0002496436470000113
其中,n为第一临近时段LSTM单元的隐藏层状态数;
采用起飞时刻注意力机制,基于所述第一临近时段LSTM单元在第t个起飞时刻下的隐藏层状态值
Figure RE-FDA0002496436470000114
以及所述第二临近时段LSTM单元在临近时段历史第k-1个起飞日的隐藏层状态值
Figure RE-FDA0002496436470000115
及记忆单元状态值
Figure RE-FDA0002496436470000116
计算在起飞日第k天时,第t个起飞时刻的航班客座率时间序列对目标航班当天客座率影响程度的注意力权重
Figure RE-FDA0002496436470000117
其计算公式为:
Figure RE-FDA0002496436470000118
Figure RE-FDA0002496436470000119
式中,待学习的参数是Ve,
Figure RE-FDA00024964364700001110
m为第二临近时段LSTM单元的隐藏层状态数,所述起飞时刻注意力机制是前馈神经网络;
采用softmax函数对
Figure RE-FDA00024964364700001111
进行归一化,使注意力权重
Figure RE-FDA00024964364700001112
之和为1;
基于目标航班在起飞日第k天的每个起飞时刻下的隐藏层状态值hnear和注意力权重
Figure RE-FDA0002496436470000121
计算起飞日第k天的输出向量
Figure RE-FDA0002496436470000122
其计算公式为:
Figure RE-FDA0002496436470000123
采用
Figure RE-FDA0002496436470000124
更新第二临近时段LSTM单元在第k个起飞日的隐藏层状态值,fea代表第二临近时段LSTM单元的更新函数,通过所述第二临近时段LSTM单元计算得到临近时段每个起飞日的隐藏层状态值
Figure RE-FDA0002496436470000125
其中,m为第二临近时段LSTM单元的隐藏层状态数;
采用起飞日注意力机制,基于所述第二临近时段LSTM单元在临近时段历史第k个起飞日的隐藏层状态值
Figure RE-FDA0002496436470000126
及解码器中的解码LSTM单元在第d-1个预测日的隐藏层状态值gd-1及记忆单元状态值s′d-1计算在第d个预测日对应的临近时段编码器模块在历史第k个起飞日的隐藏层状态值的注意力权重
Figure RE-FDA0002496436470000127
其计算公式为:
Figure RE-FDA0002496436470000128
Figure RE-FDA0002496436470000129
式中,待学习的参数是Va,
Figure RE-FDA00024964364700001210
p为解码LSTM单元隐藏层状态数,所述起飞日注意力机制是前馈神经网络;
采用softmax函数对
Figure RE-FDA00024964364700001211
进行归一化,使注意力权重
Figure RE-FDA00024964364700001212
之和为1;
基于目标航班在临近时段的每个起飞日的隐藏层状态值qnear和注意力权重
Figure RE-FDA00024964364700001213
计算目标航班的第d个预测日,在所述临近时段编码器模块经过起飞日注意力机制后输出的上下文向量
Figure RE-FDA00024964364700001214
其计算公式为:
Figure RE-FDA00024964364700001218
对于遥远时段编码器模块:
给定临近时段输入序列Xdistant=(xdistant,1,xdistant,2,…,xdistant,T),
Figure RE-FDA00024964364700001216
将xdistant,t作为第一遥远时段LSTM单元在目标航班第t个起飞时刻航班的输入,其中,所述ld为遥远时段的时间窗口长度,T为目标航班在所述航线上的所有起飞时刻的数目;
采用
Figure RE-FDA00024964364700001217
更新第一遥远时段LSTM单元在第t个起飞时刻的隐藏层状态值,其中feb′代表第一遥远时段LSTM单元的更新函数,通过所述第一遥远时段LSTM单元计算得到每个起飞时刻下的隐藏层状态值
Figure RE-FDA0002496436470000131
其中,n为第一遥远时段LSTM单元的隐藏层状态数;
采用起飞时刻注意力机制,基于所述第一遥远时段LSTM单元在第t个起飞时刻下的隐藏层状态值
Figure RE-FDA0002496436470000132
以及所述第二遥远时段LSTM单元在遥远时段历史第k-1个起飞日的隐藏层状态值
Figure RE-FDA0002496436470000133
及记忆单元状态值
Figure RE-FDA0002496436470000134
计算在起飞日第k天时,第t个起飞时刻的航班客座率时间序列对目标航班当天客座率影响程度的注意力权重
Figure RE-FDA0002496436470000135
其计算公式为:
Figure RE-FDA0002496436470000136
Figure RE-FDA0002496436470000137
式中,m为第二遥远时段LSTM单元的隐藏层状态数,待学习的参数是V’e,
Figure RE-FDA0002496436470000138
所述起飞时刻注意力机制是前馈神经网络;
采用softmax函数对
Figure RE-FDA0002496436470000139
进行归一化,使注意力权重
Figure RE-FDA00024964364700001310
之和为1;
基于目标航班在起飞日第k天的每个起飞时刻下的隐藏层状态值hdistant和注意力权重
Figure RE-FDA00024964364700001311
计算起飞日第k天的输出向量
Figure RE-FDA00024964364700001312
其计算公式为:
Figure RE-FDA00024964364700001313
采用
Figure RE-FDA00024964364700001314
更新第二遥远时段LSTM单元在第k个起飞日的隐藏层状态值,fea’代表第二遥远时段LSTM单元的更新函数,通过所述第二遥远时段LSTM单元计算得到遥远时段每个起飞日的隐藏层状态值
Figure RE-FDA00024964364700001315
其中,m为第二遥远时段LSTM单元的隐藏层状态数;
采用起飞日注意力机制,基于所述第二遥远时段LSTM单元在遥远时段历史第k个起飞日的隐藏层状态值
Figure RE-FDA00024964364700001316
及解码器中的解码LSTM单元在第d-1个预测日的隐藏层状态值gd-1及记忆单元状态值s′d-1计算在第d个预测日对应的遥远时段编码器模块在历史第k个起飞日的隐藏层状态值的注意力权重
Figure RE-FDA0002496436470000141
其计算公式为:
Figure RE-FDA0002496436470000143
式中,待确定的参数是V′a,
Figure RE-FDA0002496436470000144
p为解码LSTM单元隐藏层状态数,所述起飞日注意力机制是前馈神经网络;
采用softmax函数对
Figure RE-FDA0002496436470000145
进行归一化,使注意力权重
Figure RE-FDA0002496436470000146
之和为1;
基于目标航班在遥远时段的每个起飞日的隐藏层状态值qdistant和注意力权重
Figure RE-FDA0002496436470000147
计算目标航班的第d个预测日,在所述遥远时段编码器模块经过起飞日注意力机制后输出的上下文向量
Figure RE-FDA0002496436470000148
其计算公式为:
Figure RE-FDA0002496436470000149
对于外部因素融合模块:
将有效训练集中预测时间段的外部因素数据进行连接后作为所述模块的输出,记为
Figure RE-FDA00024964364700001410
其中d为解码器模块预测时间段的第d个起飞日,i为解码器模块预测时间段的第i个起飞时刻,Ne为外部因素个数;
对于解码器模块:
经过临近时段编码器模块及遥远时段编码器模块的起飞日注意力机制分别计算得到对于未来第d天的加权求和的上下文向量
Figure RE-FDA00024964364700001411
之后,在解码器模块中,将所述两个上下文向量
Figure RE-FDA00024964364700001412
与外部因素融合模块的输出
Figure RE-FDA00024964364700001413
以及解码器模块上一时刻的输出
Figure RE-FDA00024964364700001414
相结合来更新解码器隐藏层状态,公式如下:
Figure RE-FDA00024964364700001415
式中,fd表示解码器中使用的解码LSTM单元更新函数;
将上下文向量
Figure RE-FDA00024964364700001416
与隐藏状态gd进行向量拼接,确定进行最终预测的新隐藏层状态,公式如下:
Figure RE-FDA0002496436470000151
式中,矩阵
Figure RE-FDA0002496436470000152
及向量
Figure RE-FDA0002496436470000153
将拼接向量
Figure RE-FDA0002496436470000154
维度映射到解码器模块隐藏层的维度;
使用线性变换
Figure RE-FDA0002496436470000155
来生成最终输出结果;
将解码器模块最终输出结果与所述有效训练集中预测时间段中对应的航班客座率数据进行比较,将比较结果最接近时的需要学习的参数的值作为所述第一模型中的最优参数值,并根据确定的所述第一模型的最优参数值,生成预测航班客座率的第二模型。
10.根据权利要求6所述的系统,其特征在于,所述航班调整单元根据预测所述航线上航班客座率的最优模型的输出结果对所述目标航班在所述航线上未来τ天的航行进行调整包括:
当目标航班未来τ天内的起飞时刻的客座率高于设定的第一阈值时,增加所述起飞时刻航班的飞行次数;
当目标航班未来τ天内的起飞时刻的客座率高于设定的第二阈值时,增加所述起飞时刻航班的售票价格,其中,所述第二阈值小于第一阈值;
当目标航班未来τ天内的起飞时刻的客座率低于设定的第三阈值时,降低所述起飞时刻航班的售票价格以提高航班客座率,其中,所述第三阈值少于第二阈值。
CN201911386046.0A 2019-12-29 2019-12-29 基于多粒度时间注意力机制确定航班客座率的方法和系统 Pending CN111325380A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911386046.0A CN111325380A (zh) 2019-12-29 2019-12-29 基于多粒度时间注意力机制确定航班客座率的方法和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911386046.0A CN111325380A (zh) 2019-12-29 2019-12-29 基于多粒度时间注意力机制确定航班客座率的方法和系统

Publications (1)

Publication Number Publication Date
CN111325380A true CN111325380A (zh) 2020-06-23

Family

ID=71172535

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911386046.0A Pending CN111325380A (zh) 2019-12-29 2019-12-29 基于多粒度时间注意力机制确定航班客座率的方法和系统

Country Status (1)

Country Link
CN (1) CN111325380A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112329993A (zh) * 2020-10-22 2021-02-05 海南太美航空股份有限公司 一种航班乘客数量的预测方法、系统及电子设备
CN112926809A (zh) * 2021-05-10 2021-06-08 北京人人云图信息技术有限公司 一种基于聚类和改进的xgboost的航班流量预测方法及系统
CN113221472A (zh) * 2021-07-08 2021-08-06 北京航空航天大学 一种基于lstm的客流预测方法
WO2022111302A1 (zh) * 2020-11-24 2022-06-02 天津九安医疗电子股份有限公司 一种智能灯、其点亮方法及转存、加载和应用灯状态模型的方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109858671A (zh) * 2018-12-26 2019-06-07 携程旅游网络技术(上海)有限公司 预测目标航线的客座率的方法和系统
CN110288121A (zh) * 2019-05-16 2019-09-27 北京交通大学 基于多粒度时间注意力机制的航班客座率预测方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109858671A (zh) * 2018-12-26 2019-06-07 携程旅游网络技术(上海)有限公司 预测目标航线的客座率的方法和系统
CN110288121A (zh) * 2019-05-16 2019-09-27 北京交通大学 基于多粒度时间注意力机制的航班客座率预测方法

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112329993A (zh) * 2020-10-22 2021-02-05 海南太美航空股份有限公司 一种航班乘客数量的预测方法、系统及电子设备
CN112329993B (zh) * 2020-10-22 2024-03-19 海南太美航空股份有限公司 一种航班乘客数量的预测方法、系统及电子设备
WO2022111302A1 (zh) * 2020-11-24 2022-06-02 天津九安医疗电子股份有限公司 一种智能灯、其点亮方法及转存、加载和应用灯状态模型的方法
CN112926809A (zh) * 2021-05-10 2021-06-08 北京人人云图信息技术有限公司 一种基于聚类和改进的xgboost的航班流量预测方法及系统
CN113221472A (zh) * 2021-07-08 2021-08-06 北京航空航天大学 一种基于lstm的客流预测方法

Similar Documents

Publication Publication Date Title
CN111325380A (zh) 基于多粒度时间注意力机制确定航班客座率的方法和系统
CN110288121A (zh) 基于多粒度时间注意力机制的航班客座率预测方法
CN109490814B (zh) 基于深度学习和支持向量数据描述的计量自动化终端故障诊断方法
CN109785618B (zh) 一种基于组合逻辑的短时交通流预测方法
CN106022549A (zh) 基于神经网络和思维演化搜索的短期负荷预测方法
CN108197751A (zh) 基于多层Bi-GRU的Seq2seq网络短期电力负荷预测方法
CN109583565A (zh) 基于注意力模型长短时记忆网络的洪水预测方法
WO2021121354A1 (en) Model-based deep reinforcement learning for dynamic pricing in online ride-hailing platform
CN110210648B (zh) 基于灰色长短期记忆网络的管制空域战略流量预测方法
CN110991607B (zh) 一种地铁客流预测方法、装置、电子设备及存储介质
CN111860989B (zh) 一种基于蚁群算法优化的lstm神经网络短时交通流量预测方法
CN113282684B (zh) 航班季节性归类的预测方法、装置及机器可读介质
CN109637196A (zh) 航路扇区交通概率密度预测方法
CN113449905A (zh) 一种基于门控循环单元神经网络的交通拥堵预警方法
CN112258251A (zh) 基于灰色关联的电动汽车换电需求的集成学习预测方法及系统
CN115359659B (zh) 一种车道开闭配置方法和系统
CN112381336A (zh) 一种航班延误时长预测方法及系统
CN111582584A (zh) 基于航空公司公平性的航段运行时间优化方法
CN115114128A (zh) 一种卫星健康状态评估系统及评估方法
CN114565187A (zh) 一种基于图时空自编码网络的交通路网数据预测方法
CN113674524A (zh) 基于lstm-gasvr的多尺度短时交通流预测建模、预测方法及系统
CN110490365B (zh) 一种基于多源数据融合预测网约车订单量的方法
CN116957331A (zh) 风险旅客流量范围预测方法和装置
CN111311905A (zh) 一种基于粒子群优化小波神经网络的高速公路行程时间预测方法
CN109670875B (zh) 一种铁路客票浮动定价优化管理方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination