CN111325380A - 基于多粒度时间注意力机制确定航班客座率的方法和系统 - Google Patents
基于多粒度时间注意力机制确定航班客座率的方法和系统 Download PDFInfo
- Publication number
- CN111325380A CN111325380A CN201911386046.0A CN201911386046A CN111325380A CN 111325380 A CN111325380 A CN 111325380A CN 201911386046 A CN201911386046 A CN 201911386046A CN 111325380 A CN111325380 A CN 111325380A
- Authority
- CN
- China
- Prior art keywords
- flight
- takeoff
- day
- period
- passenger seat
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000007246 mechanism Effects 0.000 title claims abstract description 72
- 238000000034 method Methods 0.000 title claims abstract description 33
- 238000012549 training Methods 0.000 claims abstract description 79
- 239000013598 vector Substances 0.000 claims description 102
- 238000004364 calculation method Methods 0.000 claims description 59
- 230000006870 function Effects 0.000 claims description 58
- 238000010606 normalization Methods 0.000 claims description 44
- 238000012545 processing Methods 0.000 claims description 37
- 230000015654 memory Effects 0.000 claims description 32
- 238000013528 artificial neural network Methods 0.000 claims description 30
- 230000004927 fusion Effects 0.000 claims description 24
- 238000012795 verification Methods 0.000 claims description 23
- 238000007781 pre-processing Methods 0.000 claims description 14
- 230000010006 flight Effects 0.000 claims description 13
- 230000007787 long-term memory Effects 0.000 claims description 12
- 238000013507 mapping Methods 0.000 claims description 12
- 230000006403 short-term memory Effects 0.000 claims description 12
- AGVAZMGAQJOSFJ-WZHZPDAFSA-M cobalt(2+);[(2r,3s,4r,5s)-5-(5,6-dimethylbenzimidazol-1-yl)-4-hydroxy-2-(hydroxymethyl)oxolan-3-yl] [(2r)-1-[3-[(1r,2r,3r,4z,7s,9z,12s,13s,14z,17s,18s,19r)-2,13,18-tris(2-amino-2-oxoethyl)-7,12,17-tris(3-amino-3-oxopropyl)-3,5,8,8,13,15,18,19-octamethyl-2 Chemical compound [Co+2].N#[C-].[N-]([C@@H]1[C@H](CC(N)=O)[C@@]2(C)CCC(=O)NC[C@@H](C)OP(O)(=O)O[C@H]3[C@H]([C@H](O[C@@H]3CO)N3C4=CC(C)=C(C)C=C4N=C3)O)\C2=C(C)/C([C@H](C\2(C)C)CCC(N)=O)=N/C/2=C\C([C@H]([C@@]/2(CC(N)=O)C)CCC(N)=O)=N\C\2=C(C)/C2=N[C@]1(C)[C@@](C)(CC(N)=O)[C@@H]2CCC(N)=O AGVAZMGAQJOSFJ-WZHZPDAFSA-M 0.000 claims description 10
- 239000011159 matrix material Substances 0.000 claims description 6
- 230000002265 prevention Effects 0.000 claims description 6
- 238000000844 transformation Methods 0.000 claims description 6
- 230000008859 change Effects 0.000 abstract description 4
- 238000010586 diagram Methods 0.000 description 13
- 238000004590 computer program Methods 0.000 description 7
- 230000000694 effects Effects 0.000 description 6
- 238000011156 evaluation Methods 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 238000007430 reference method Methods 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- 238000005530 etching Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 238000010200 validation analysis Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
- G06Q10/06393—Score-carding, benchmarking or key performance indicator [KPI] analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/067—Enterprise or organisation modelling
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/40—Business processes related to the transportation industry
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Strategic Management (AREA)
- Economics (AREA)
- General Physics & Mathematics (AREA)
- Entrepreneurship & Innovation (AREA)
- Marketing (AREA)
- Development Economics (AREA)
- General Health & Medical Sciences (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Game Theory and Decision Science (AREA)
- General Engineering & Computer Science (AREA)
- Computing Systems (AREA)
- Molecular Biology (AREA)
- Evolutionary Computation (AREA)
- Educational Administration (AREA)
- Data Mining & Analysis (AREA)
- Computational Linguistics (AREA)
- Mathematical Physics (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Primary Health Care (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明提供一种基于多粒度时间注意力机制确定航班客座率的方法和系统。所述方法和系统基于采集历史的航班客座率数据,通过对建立的预测航班客座率模型进行训练并验证生成最优模型,再基于所述最优模型,根据所述航线历史航班客座率数据预测目标航班在未来一段时间的客座率,从而通过所述模型的输出结果对目标航班的航行进行调整。所述方法和系统与现有技术相比,建立的模型除考虑航班自身每日客座率变化外,还考虑到目标航班客座率的起飞时刻相关性和起飞日相关性,以及其他因素也的影响,从而预测航班客座率准确率更高,能够更好地帮助民航市场从业者提前感知市场需求进而及时采取对应决策。
Description
技术领域
本发明涉及大数据处理领域,并且更具体地,涉及一种基于多粒度时间注意力机制确定航班客座率的方法和系统。
背景技术
随着民航旅客的迅速增长,航空客运需求预测越来越受到航空公司、机票代理商、飞机制造商等民航相关企业的关注。航班客座率是航空客运市场中用以衡量航班客运量需求的重要指标之一。准确地预测航班客座率是解决航空公司处理航班机票超售、座位虚耗等问题,提高民航从业者提前感知市场需求进而提高企业收益管理水平、为各级运营部门提供决策支持的重要途径之一。
目前,现有的航班客座率预测方法仅关注了目标航班近期每日客座率的变化特点,无法同时考虑到该问题受到的其它众多因素的影响,因此无法获得理想的预测效果。
发明内容
为了解决现有技术中航班客座率预测方法只关注目标航班近期每日客座率的变化特点,而使航班客座率预测效果不理想的技术问题,本发明提供一种基于多粒度时间注意力机制确定航班客座率的方法,所述方法包括:
采集一个航线在某一个时间周期内所有起飞时刻的历史航班客座率数据,生成初始样本集;
对所述历史航班客座率数据中具有离散属性和连续属性的数据进行预处理,生成有效样本集;
基于预先确定的预测所述航线航班客座率的最优模型,以所述有效样本集中目标航班的数据为输入向量,对所述航线上的目标航班未来τ天的客座率进行预测;
根据预测所述航线上航班客座率的最优模型的输出结果对所述目标航班在所述航线上未来τ天的航行进行调整。
进一步地,所述方法在采集一个航线在某一个时间周期内所有起飞时刻的历史航班客座率数据之前还包括建立预测所述航线航班客座率的最优模型,其中:
采集一个航线在某一个时间周期内所有起飞时刻的历史航班客座率数据,生成初始样本集;
对所述初始样本集中具有离散属性和连续属性的数据进行预处理,生成有效样本集;
按照预先设置的比例,将有效样本集划分为非重叠的有效训练集和有效验证集;
设置与训练预测航班客座率的第一模型的相关的信息和预测航班客座率的第一模型中的超参的初始值,其中,所述第一模型包括2个编码器模块,1个解码器模块和1个外部因素融合模块,所述2个编码器模块分别是临近时段编码器模块和遥远时段编码器模块,其用于对输入向量进行编码,所述临近时段编码器模块的输入向量是临近时段所述航线上目标航班所有起飞时刻的航班客座率时间序列,所述遥远时段编码器模块的输入向量是遥远时段所述航线上目标航班所有起飞时刻的航班客座率时间序列,所述临近时段是指与需要预测的目标航班在预测时段内的每一天相邻的时间段,所述遥远时段是指与需要预测的目标航班在预测时段内的每一天相隔一定天数的时间段,外部因素融合模块用于确定除所述航线起飞时间以外的外部因素对所述航线上的航班的影响,其输入向量为有效训练集中目标航班在预测时间内的除所述航线起飞时间以外的外部因素的数据,解码器模块用于输出所述航线上目标航班客座率预测结果;临近时段编码器模块包括第一临近时段长短期记忆网络LSTM单元和第二临近时段LSTM单元,所述遥远时段编码器模块包括第一遥远时段LSTM单元和第二遥远时段LSTM单元,所述解码器模块包括解码LSTM单元,所述与训练预测航班客座率的第一模型的相关的信息包括批大小、学习、训练轮数和防止过拟合策略;所述超参指第一临近时段长短期记忆网络LSTM单元和第一遥远时段 LSTM单元隐藏层状态数,第二临近时段LSTM单元和第二遥远时段LSTM单元隐藏层状态数,解码LSTM单元隐藏层状态数,以及临近时段和遥远时段的时间窗口长度;
根据所述有效训练集,基于预测航班客座率的第一模型进行客座率预测,并将所述第一模型的输出结果与所述有效训练集中的航班客座率数据进行比较,确定所述第一模型中的最优参数值,生成预测航班客座率的第二模型,其中,所述第一模型中的最优参数是指第一临近时段长短期记忆网络LSTM单元、第一遥远时段LSTM单元、第二临近时段LSTM单元和第二遥远时段LSTM单元中需要学习的参数的最优值;
根据所述有效验证集,为所述预测航班客座率的第二模型中的超参赋值后进行客座率预测,并将所述第二模型的输出结果与所述有效验证集中的目标航班在预测时间段的航班客座率数据进行比较,将比较结果最接近时的超参值作为所述第二模型中的超参的最优值,生成预测航班客座率的最优模型。
进一步地,所述对所述初始样本集中具有离散特征和连续特征的数据进行预处理,生成有效样本集包括:
对于初始样本集中ID离散属性的数据采用one-hot编码方式进行编码,并将编码后的结果输入至全连接神经网络层将高维向量映射为低维向量,所述低维向量为第一数据,其中,所述ID离散属性的数据包括航空公司,机型;
对于初始样本集中一般离散属性的数据采用one-hot编码方式进行编码,所述编码后的结果为第二数据,其中,所述一般离散属性的数据包括是否工作日,是否节假晶,是否节假日前,是否节假日后;
对于初始样本集中具有连续属性的数据采用Min-Max归一化方法归一到[0,1]之间,所述归一后的数据为第三数据,其中,所述具有连续属性的数据包括航班起飞时刻,机舱座位数,所述归一化的计算公式为:
x′=(x-min x)/(max x-min x)
式中,x代表具有连续属性的原数据,x′代表经过归一化处理后新的数据,min x、max x分别代表归一化处理前具有连续属性的原数据的最小值和最大值;
将所述第一数据、第二数据、第三数据按照初始样本集中的顺序进行排列,生成有效样本集。
进一步地,根据所述有效训练集,基于预测航班客座率的第一模型进行客座率预测,并将所述第一模型的输出结果与所述有效训练集中的航班客座率数据进行比较,确定所述第一模型的最优参数,生成预测航班客座率的第二模型包括:
对于临近时段编码器模块:
给定临近时段输入序列Xnear=(xnear,1,xnear,2,…,xnear,T),将xnear ,t作为第一临近时段LSTM单元在目标航班第t个起飞时刻航班的输入,其中,所述ln为临时时段的时间窗口长度,T为目标航班在所述航线上的所有起飞时刻的数目;
采用更新第一临近时段LSTM单元在第t个起飞时刻的隐藏层状态值,其中feb代表第一临近时段LSTM单元的更新函数,通过所述第一临近时段LSTM单元计算得到每个起飞时刻下的隐藏层状态值 其中,n为第一临近时段 LSTM单元的隐藏层状态数;
采用起飞时刻注意力机制,基于所述第一临近时段LSTM单元在第 t个起飞时刻下的隐藏层状态值以及所述第二临近时段LSTM单元在临近时段历史第k-1个起飞日的隐藏层状态值及记忆单元状态值计算在起飞日第k天时,第t个起飞时刻的航班客座率时间序列对目标航班当天客座率影响程度的注意力权重其计算公式为:
采用更新第二临近时段LSTM单元在第k个起飞日的隐藏层状态值,fea代表第二临近时段LSTM单元的更新函数,通过所述第二临近时段LSTM单元计算得到临近时段每个起飞日的隐藏层状态值其中,m为第二临近时段LSTM 单元的隐藏层状态数;
采用起飞日注意力机制,基于所述第二临近时段LSTM单元在临近时段历史第k个起飞日的隐藏层状态值及解码器中的解码LSTM单元在第d-1个预测日的隐藏层状态值gd-1及记忆单元状态值s′d-1计算在第d个预测日对应的临近时段编码器模块在历史第k个起飞日的隐藏层状态值的注意力权重其计算公式为:
对于遥远时段编码器模块:
给定临近时段输入序列Xdistant=(xdistant,1,xdistant,2,…,xdistant,T),将xdistant,t作为第一遥远时段LSTM单元在目标航班第t个起飞时刻航班的输入,其中,所述ld为遥远时段的时间窗口长度,T为目标航班在所述航线上的所有起飞时刻的数目;
采用更新第一遥远时段LSTM单元在第t个起飞时刻的隐藏层状态值,其中feb′代表第一遥远时段LSTM单元的更新函数,通过所述第一遥远时段LSTM单元计算得到每个起飞时刻下的隐藏层状态值其中,n为第一遥远时段LSTM单元的隐藏层状态数;
采用起飞时刻注意力机制,基于所述第一遥远时段LSTM单元在第 t个起飞时刻下的隐藏层状态值以及所述第二遥远时段LSTM单元在遥远时段历史第k-1个起飞日的隐藏层状态值及记忆单元状态值计算在起飞日第k天时,第t个起飞时刻的航班客座率时间序列对目标航班当天客座率影响程度的注意力权重其计算公式为:
采用更新第二遥远时段LSTM单元在第k个起飞日的隐藏层状态值,fea’代表第二遥远时段LSTM单元的更新函数,通过所述第二遥远时段LSTM单元计算得到遥远时段每个起飞日的隐藏层状态值其中,m为第二遥远时段LSTM单元的隐藏层状态数;
采用起飞日注意力机制,基于所述第二遥远时段LSTM单元在遥远时段历史第k个起飞日的隐藏层状态值及解码器中的解码LSTM单元在第d-1个预测日的隐藏层状态值gd-1及记忆单元状态值s′d-1计算在第d 个预测日对应的遥远时段编码器模块在历史第k个起飞日的隐藏层状态值的注意力权重其计算公式为:
对于外部因素融合模块:
对于解码器模块:
经过临近时段编码器模块及遥远时段编码器模块的起飞日注意力机制分别计算得到对于未来第d天的加权求和的上下文向量之后,在解码器模块中,将所述两个上下文向量与外部因素融合模块的输出以及解码器模块上一时刻的输出相结合来更新解码器隐藏层状态,公式如下:
式中,fd表示解码器中使用的解码LSTM单元更新函数;
将解码器模块最终输出结果与所述有效训练集中预测时间段中对应的航班客座率数据进行比较,将比较结果最接近时的需要学习的参数的值作为所述第一模型中的最优参数值,并根据确定的所述第一模型的最优参数值,生成预测航班客座率的第二模型。
进一步地,所述根据预测所述航线上航班客座率的最优模型的输出结果对所述目标航班在所述航线上未来τ天的航行进行调整包括:
当目标航班未来τ天内的起飞时刻的客座率高于设定的第一阈值时,增加所述起飞时刻航班的飞行次数;
当目标航班未来τ天内的起飞时刻的客座率高于设定的第二阈值时,增加所述起飞时刻航班的售票价格,其中,所述第二阈值小于第一阈值;
当目标航班未来τ天内的起飞时刻的客座率低于设定的第三阈值时,降低所述起飞时刻航班的售票价格以提高航班客座率,其中,所述第三阈值少于第二阈值。
根据本发明的另一方面,本发明提供一种基于多粒度时间注意力机制确定航班客座率的系统,所述系统包括:
数据采集单元,其用于采集一个航线在某一个时间周期内所有起飞时刻的历史航班客座率数据,生成初始样本集;
数据处理单元,其用于对所述历史航班客座率数据中具有离散属性和连续属性的数据进行预处理,生成有效样本集;
预测结果单元,其用于基于预先确定的预测所述航线航班客座率的最优模型,以所述有效样本集中目标航班的数据为输入向量,对所述航线上的目标航班未来τ天的客座率进行预测;
航班调整单元,其用于根据预测所述航线上航班客座率的最优模型的输出结果对所述目标航班在所述航线上未来τ天的航行进行调整。
进一步地,所述方法还包括模型建立单元,其用于建立预测所述航线航班客座率的最优模型,所述模型建立单元包括:
数据采集单元,其用于采集一个航线在某一个时间周期内所有起飞时刻的历史航班客座率数据,生成初始样本集;
数据处理单元,其用于对所述初始样本集中具有离散属性和连续属性的数据进行预处理,生成有效样本集;
样本划分单元,其用于按照预先设置的比例,将有效样本集划分为非重叠的有效训练集和有效验证集;
第一模型单元,其用于建立预测航班客座率的第一模型,并设置与训练预测航班客座率的第一模型的相关的信息和预测航班客座率的第一模型中的超参的初始值,其中,所述第一模型包括2个编码器模块,1个解码器模块和1个外部因素融合模块,所述2个编码器模块分别是临近时段编码器模块和遥远时段编码器模块,其用于对输入向量进行编码,所述临近时段编码器模块的输入向量是临近时段所述航线上目标航班所有起飞时刻的航班客座率时间序列,所述遥远时段编码器模块的输入向量是遥远时段所述航线上目标航班所有起飞时刻的航班客座率时间序列,所述临近时段是指与需要预测的目标航班在预测时段内的每一天相邻的时间段,所述遥远时段是指与需要预测的目标航班在预测时段内的每一天相隔一定天数的时间段,外部因素融合模块用于确定除所述航线起飞时间以外的外部因素对所述航线上的航班的影响,其输入向量为有效训练集中目标航班在预测时间内的除所述航线起飞时间以外的外部因素的数据,解码器模块用于输出所述航线上目标航班客座率预测结果;临近时段编码器模块包括第一临近时段长短期记忆网络LSTM单元和第二临近时段LSTM单元,所述遥远时段编码器模块包括第一遥远时段LSTM单元和第二遥远时段LSTM单元,所述解码器模块包括解码LSTM单元,所述与训练预测航班客座率的第一模型的相关的信息包括批大小、学习、训练轮数和防止过拟合策略;所述超参指第一临近时段长短期记忆网络LSTM单元和第一遥远时段LSTM单元隐藏层状态数,第二临近时段LSTM单元和第二遥远时段LSTM单元隐藏层状态数,解码LSTM单元隐藏层状态数,以及临近时段和遥远时段的时间窗口长度;
模型训练单元,其用于根据所述有效训练集,基于预测航班客座率的第一模型进行客座率预测,并将所述第一模型的输出结果与所述有效训练集中的航班客座率数据进行比较,确定所述第一模型中的最优参数值,生成预测航班客座率的第二模型,其中,所述第一模型中的最优参数是指第一临近时段长短期记忆网络LSTM单元、第一遥远时段LSTM单元、第二临近时段LSTM单元和第二遥远时段LSTM单元中需要学习的参数的最优值;
最优模型单元,其用于根据所述有效验证集,为所述预测航班客座率的第二模型中的超参赋值后进行客座率预测,并将所述第二模型的输出结果与所述有效验证集中的目标航班在预测时间段的航班客座率数据进行比较,将比较结果最接近时的超参值作为所述第二模型中的超参的最优值,生成预测航班客座率的最优模型。
进一步地,所述数据处理单元对所述初始样本集中具有离散特征和连续特征的数据进行预处理,生成有效样本集包括:
对于初始样本集中ID离散属性的数据采用one-hot编码方式进行编码,并将编码后的结果输入至全连接神经网络层将高维向量映射为低维向量,所述低维向量为第一数据,其中,所述ID离散属性的数据包括航空公司,机型;
对于初始样本集中一般离散属性的数据采用one-hot编码方式进行编码,所述编码后的结果为第二数据,其中,所述一般离散属性的数据包括是否工作日,是否节假晶,是否节假日前,是否节假日后;
对于初始样本集中具有连续属性的数据采用Min-Max归一化方法归一到[0,1]之间,所述归一后的数据为第三数据,其中,所述具有连续属性的数据包括航班起飞时刻,机舱座位数,所述归一化的计算公式为:
x′=(x-min x)/(max x-min x)
式中,x代表具有连续属性的原数据,x′代表经过归一化处理后新的数据,minx、maxx分别代表归一化处理前具有连续属性的原数据的最小值和最大值;
将所述第一数据、第二数据、第三数据按照初始样本集中的顺序进行排列,生成有效样本集。
进一步地,所述模型训练单元根据所述有效训练集,基于预测航班客座率的第一模型进行客座率预测,并将所述第一模型的输出结果与所述有效训练集中的航班客座率数据进行比较,确定所述第一模型的最优参数,生成预测航班客座率的第二模型包括:
对于临近时段编码器模块:
给定临近时段输入序列Xnear=(xnear,1,xnear,2,…,xnear,T),将xnear ,t作为第一临近时段LSTM单元在目标航班第t个起飞时刻航班的输入,其中,所述ln为临时时段的时间窗口长度,T为目标航班在所述航线上的所有起飞时刻的数目;
采用更新第一临近时段LSTM单元在第t个起飞时刻的隐藏层状态值,其中feb代表第一临近时段LSTM单元的更新函数,通过所述第一临近时段LSTM单元计算得到每个起飞时刻下的隐藏层状态值其中,n为第一临近时段 LSTM单元的隐藏层状态数;
采用起飞时刻注意力机制,基于所述第一临近时段LSTM单元在第 t个起飞时刻下的隐藏层状态值以及所述第二临近时段LSTM单元在临近时段历史第k-1个起飞日的隐藏层状态值及记忆单元状态值计算在起飞日第k天时,第t个起飞时刻的航班客座率时间序列对目标航班当天客座率影响程度的注意力权重其计算公式为:
采用更新第二临近时段LSTM单元在第k个起飞日的隐藏层状态值,fea代表第二临近时段LSTM单元的更新函数,通过所述第二临近时段LSTM单元计算得到临近时段每个起飞日的隐藏层状态值其中,m为第二临近时段LSTM 单元的隐藏层状态数;
采用起飞日注意力机制,基于所述第二临近时段LSTM单元在临近时段历史第k个起飞日的隐藏层状态值及解码器中的解码LSTM单元在第d-1个预测日的隐藏层状态值gd-1及记忆单元状态值s′ d-1计算在第d个预测日对应的临近时段编码器模块在历史第k个起飞日的隐藏层状态值的注意力权重其计算公式为:
对于遥远时段编码器模块:
给定临近时段输入序列Xdistant=(xdistant,1,xdistant,2,…,xdistant,T),将xdistant,t作为第一遥远时段LSTM单元在目标航班第t个起飞时刻航班的输入,其中,所述ld为遥远时段的时间窗口长度,T为目标航班在所述航线上的所有起飞时刻的数目;
采用更新第一遥远时段LSTM单元在第t个起飞时刻的隐藏层状态值,其中feb′代表第一遥远时段LSTM单元的更新函数,通过所述第一遥远时段LSTM单元计算得到每个起飞时刻下的隐藏层状态值其中,n为第一遥远时段LSTM单元的隐藏层状态数;
采用起飞时刻注意力机制,基于所述第一遥远时段LSTM单元在第 t个起飞时刻下的隐藏层状态值以及所述第二遥远时段LSTM单元在遥远时段历史第k-1个起飞日的隐藏层状态值及记忆单元状态值计算在起飞日第k天时,第t个起飞时刻的航班客座率时间序列对目标航班当天客座率影响程度的注意力权重其计算公式为:
采用更新第二遥远时段LSTM单元在第k个起飞日的隐藏层状态值,fea’代表第二遥远时段LSTM单元的更新函数,通过所述第二遥远时段LSTM单元计算得到遥远时段每个起飞日的隐藏层状态值其中,m为第二遥远时段LSTM单元的隐藏层状态数;
采用起飞日注意力机制,基于所述第二遥远时段LSTM单元在遥远时段历史第k个起飞日的隐藏层状态值及解码器中的解码LSTM单元在第d-1个预测日的隐藏层状态值gd-1及记忆单元状态值s′d-1计算在第d 个预测日对应的遥远时段编码器模块在历史第k个起飞日的隐藏层状态值的注意力权重其计算公式为:
对于外部因素融合模块:
对于解码器模块:
经过临近时段编码器模块及遥远时段编码器模块的起飞日注意力机制分别计算得到对于未来第d天的加权求和的上下文向量之后,在解码器模块中,将所述两个上下文向量与外部因素融合模块的输出以及解码器模块上一时刻的输出相结合来更新解码器隐藏层状态,公式如下:
式中,fd表示解码器中使用的解码LSTM单元更新函数;
将解码器模块最终输出结果与所述有效训练集中预测时间段中对应的航班客座率数据进行比较,将比较结果最接近时的需要学习的参数的值作为所述第一模型中的最优参数值,并根据确定的所述第一模型的最优参数值,生成预测航班客座率的第二模型。
进一步地,所述航班调整单元根据预测所述航线上航班客座率的最优模型的输出结果对所述目标航班在所述航线上未来τ天的航行进行调整包括:
当目标航班未来τ天内的起飞时刻的客座率高于设定的第一阈值时,增加所述起飞时刻航班的飞行次数;
当目标航班未来τ天内的起飞时刻的客座率高于设定的第二阈值时,增加所述起飞时刻航班的售票价格,其中,所述第二阈值小于第一阈值;
当目标航班未来τ天内的起飞时刻的客座率低于设定的第三阈值时,降低所述起飞时刻航班的售票价格以提高航班客座率,其中,所述第三阈值少于第二阈值。
本发明技术方案提供的基于多粒度时间注意力机制确定航班客座率的方法和系统基于采集历史的航班客座率数据,通过对建立的预测航班客座率模型进行训练并验证生成预测航班客座率的最优模型,再基于所述最优模型,根据所述航线历史航班客座率数据预测目标航班在未来一段时间的客座率,从而通过所述模型的输出结果对目标航班的航行进行调整。所述方法和系统与现有技术相比,建立的模型除考虑航班自身每日客座率变化外,还考虑到目标航班客座率受其所在航线中其他邻近起飞时刻的航班客座率影响,存在起飞时刻相关性,即同一航线上起飞时刻越相近的航班对应的客座率相差更小;在时间粒度上,航班客座率不仅存在起飞时刻相关性,还存在起飞日相关性,即航班自身的客座率数据在起飞日的时间维度上呈现出时间依赖关系,如航班在预测时间区间的客座率与该航班前一周同一星期的客座率具有的周周期性、与该航班过去同一时间区间的客座率具有的周期性;同样,航班自身属性及节假日、航班所在航线是否开设高铁等其他因素也会影响航班客座率,因此,本发明的预测模型通过历史数据预测未来时间段的航班客座率准确率更高,从而能够更好地帮助民航市场从业者提前感知市场需求进而及时采取对应决策,同时为解决铁路、公路等其他交通领域的时间序列预测问题提供了新的解决思路。
附图说明
通过参考下面的附图,可以更为完整地理解本发明的示例性实施方式:
图1为根据本发明优选实施方式的基于多粒度时间注意力机制确定航班客座率的方法的流程图;
图2为根据本发明优选实施方式的预测航线航班客座率的模型的结构示意图;
图3为根据本发明优选实施方式的基于多粒度时间注意力机制确定航班客座率的系统的结构示意图。
具体实施方式
现在参考附图介绍本发明的示例性实施方式,然而,本发明可以用许多不同的形式来实施,并且不局限于此处描述的实施例,提供这些实施例是为了详尽地且完全地公开本发明,并且向所属技术领域的技术人员充分传达本发明的范围。对于表示在附图中的示例性实施方式中的术语并不是对本发明的限定。在附图中,相同的单元/元件使用相同的附图标记。
除非另有说明,此处使用的术语(包括科技术语)对所属技术领域的技术人员具有通常的理解含义。另外,可以理解的是,以通常使用的词典限定的术语,应当被理解为与其相关领域的语境具有一致的含义,而不应该被理解为理想化的或过于正式的意义。
图1为根据本发明优选实施方式的基于多粒度时间注意力机制确定航班客座率的方法的流程图。如图1所示,本优选实施方式所述的基于多粒度时间注意力机制确定航班客座率的方法100从步骤101开始。
在步骤101,建立预测所述航线航班客座率的最优模型。
在步骤102,采集一个航线在某一个时间周期内所有起飞时刻的历史航班客座率数据,生成初始样本集。
在步骤103,对所述历史航班客座率数据中具有离散属性和连续属性的数据进行预处理,生成有效样本集。
在步骤104,基于预先确定的预测所述航线航班客座率的最优模型,以所述有效样本集中目标航班的数据为输入向量,对所述航线上的目标航班未来τ天的客座率进行预测。
在步骤105,根据预测所述航线上航班客座率的最优模型的输出结果对所述目标航班在所述航线上未来τ天的航行进行调整。
优选地,所述方法在采集一个航线在某一个时间周期内所有起飞时刻的历史航班客座率数据之前还包括建立预测所述航线航班客座率的最优模型,其中:
采集一个航线在某一个时间周期内所有起飞时刻的历史航班客座率数据,生成初始样本集;
对所述初始样本集中具有离散属性和连续属性的数据进行预处理,生成有效样本集;
按照预先设置的比例,将有效样本集划分为非重叠的有效训练集和有效验证集;
设置与训练预测航班客座率的第一模型的相关的信息和预测航班客座率的第一模型中的超参的初始值。
图2为根据本发明优选实施方式的预测航线航班客座率的模型的结构示意图。如图2所示,本优选实施方式中的预测航线航班客座率的模型200 包括2个编码器模块201和202,1个解码器模块203和1个外部因素融合模块204,所述2个编码器模块分别是临近时段编码器模块201和遥远时段编码器模块202,其用于对输入向量进行编码,所述临近时段编码器模块201的输入向量是临近时段所述航线上目标航班所有起飞时刻的航班客座率时间序列,所述遥远时段编码器模块202的输入向量是遥远时段所述航线上目标航班所有起飞时刻的航班客座率时间序列,所述临近时段是指与需要预测的目标航班在预测时段内的每一天相邻的时间段,所述遥远时段是指与需要预测的目标航班在预测时段内的每一天相隔一定天数的时间段,外部因素融合模块204用于确定除所述航线起飞时间以外的外部因素对所述航线上的航班的影响,其输入向量为有效训练集中目标航班在预测时间内的除所述航线起飞时间以外的外部因素的数据,解码器模块203用于输出所述航线上目标航班客座率预测结果;临近时段编码器模块201包括第一临近时段长短期记忆网络LSTM单元211和第二临近时段LSTM单元 212,所述遥远时段编码器模202块包括第一遥远时段LSTM单元221和第二遥远时段LSTM单元222,所述解码器模块203包括解码LSTM单元231,所述与训练预测航班客座率的第一模型的相关的信息包括批大小、学习、训练轮数和防止过拟合策略;所述超参指第一临近时段长短期记忆网络 LSTM单元和第一遥远时段LSTM单元隐藏层状态数,第二临近时段LSTM单元和第二遥远时段LSTM单元隐藏层状态数,解码LSTM单元隐藏层状态数,以及临近时段和遥远时段的时间窗口长度。所述外部因素模块204的数据输入单元241进行的外部因素数据,然后再通过连接层242将所有的外部因素数据进行连接后作为输出传输至解码器模块203的连接层232,而解码器模块203则通过连接层232将临近时段编码器模块201和遥远时段编码器模块202的输出,以及外部因素模块204的输出进行连接后,传输至解码LSTM单元进行预测结果的输出。
根据所述有效训练集,基于预测航班客座率的第一模型进行客座率预测,并将所述第一模型的输出结果与所述有效训练集中的航班客座率数据进行比较,确定所述第一模型中的最优参数值,生成预测航班客座率的第二模型,其中,所述第一模型中的最优参数是指第一临近时段长短期记忆网络LSTM单元、第一遥远时段LSTM单元、第二临近时段LSTM单元和第二遥远时段LSTM单元中需要学习的参数的最优值;
根据所述有效验证集,为所述预测航班客座率的第二模型中的超参赋值后进行客座率预测,并将所述第二模型的输出结果与所述有效验证集中的目标航班在预测时间段的航班客座率数据进行比较,将比较结果最接近时的超参值作为所述第二模型中的超参的最优值,生成预测航班客座率的最优模型。
优选地,所述对所述初始样本集中具有离散特征和连续特征的数据进行预处理,生成有效样本集包括:
对于初始样本集中ID离散属性的数据采用one-hot编码方式进行编码,并将编码后的结果输入至全连接神经网络层将高维向量映射为低维向量,所述低维向量为第一数据,其中,所述ID离散属性的数据包括航空公司,机型;
对于初始样本集中一般离散属性的数据采用one-hot编码方式进行编码,所述编码后的结果为第二数据,其中,所述一般离散属性的数据包括是否工作日,是否节假晶,是否节假日前,是否节假日后;
对于初始样本集中具有连续属性的数据采用Min-Max归一化方法归一到[0,1]之间,所述归一后的数据为第三数据,其中,所述具有连续属性的数据包括航班起飞时刻,机舱座位数,所述归一化的计算公式为:
x′=(x-min x)/(max x-min x)
式中,x代表具有连续属性的原数据,x′代表经过归一化处理后新的数据,minx、maxx分别代表归一化处理前具有连续属性的原数据的最小值和最大值;
将所述第一数据、第二数据、第三数据按照初始样本集中的顺序进行排列,生成有效样本集。
优选地,根据所述有效训练集,基于预测航班客座率的第一模型进行客座率预测,并将所述第一模型的输出结果与所述有效训练集中的航班客座率数据进行比较,确定所述第一模型的最优参数,生成预测航班客座率的第二模型包括:
对于临近时段编码器模块:
给定临近时段输入序列Xnear=(xnear,1,xnear,2,…,xnear,T),将xnear ,t作为第一临近时段LSTM单元在目标航班第t个起飞时刻航班的输入,其中,所述ln为临时时段的时间窗口长度,T为目标航班在所述航线上的所有起飞时刻的数目;
采用更新第一临近时段LSTM单元在第t个起飞时刻的隐藏层状态值,其中feb代表第一临近时段LSTM单元的更新函数,通过所述第一临近时段LSTM单元计算得到每个起飞时刻下的隐藏层状态值其中,n为第一临近时段 LSTM单元的隐藏层状态数;
采用起飞时刻注意力机制,基于所述第一临近时段LSTM单元在第 t个起飞时刻下的隐藏层状态值以及所述第二临近时段LSTM单元在临近时段历史第k-1个起飞日的隐藏层状态值及记忆单元状态值计算在起飞日第k天时,第t个起飞时刻的航班客座率时间序列对目标航班当天客座率影响程度的注意力权重其计算公式为:
采用更新第二临近时段LSTM单元在第k个起飞日的隐藏层状态值,fea代表第二临近时段LSTM单元的更新函数,通过所述第二临近时段LSTM单元计算得到临近时段每个起飞日的隐藏层状态值其中,m为第二临近时段LSTM 单元的隐藏层状态数;
采用起飞日注意力机制,基于所述第二临近时段LSTM单元在临近时段历史第k个起飞日的隐藏层状态值及解码器中的解码LSTM单元在第d-1个预测日的隐藏层状态值gd-1及记忆单元状态值s′ d-1计算在第d个预测日对应的临近时段编码器模块在历史第k个起飞日的隐藏层状态值的注意力权重其计算公式为:
对于遥远时段编码器模块:
给定临近时段输入序列Xdistant=(xdistant,1,xdistant,2,…,xdistant,T),将xdistant,t作为第一遥远时段LSTM单元在目标航班第t个起飞时刻航班的输入,其中,所述ld为遥远时段的时间窗口长度,T为目标航班在所述航线上的所有起飞时刻的数目;
采用更新第一遥远时段LSTM单元在第t个起飞时刻的隐藏层状态值,其中feb′代表第一遥远时段LSTM单元的更新函数,通过所述第一遥远时段LSTM单元计算得到每个起飞时刻下的隐藏层状态值其中,n为第一遥远时段LSTM单元的隐藏层状态数;
采用起飞时刻注意力机制,基于所述第一遥远时段LSTM单元在第 t个起飞时刻下的隐藏层状态值以及所述第二遥远时段LSTM单元在遥远时段历史第k-1个起飞日的隐藏层状态值及记忆单元状态值计算在起飞日第k天时,第t个起飞时刻的航班客座率时间序列对目标航班当天客座率影响程度的注意力权重其计算公式为:
采用更新第二遥远时段LSTM单元在第k个起飞日的隐藏层状态值,fea’代表第二遥远时段LSTM单元的更新函数,通过所述第二遥远时段LSTM单元计算得到遥远时段每个起飞日的隐藏层状态值其中,m为第二遥远时段LSTM单元的隐藏层状态数;
采用起飞日注意力机制,基于所述第二遥远时段LSTM单元在遥远时段历史第k个起飞日的隐藏层状态值及解码器中的解码LSTM单元在第d-1个预测日的隐藏层状态值gd-1及记忆单元状态值s′d-1计算在第d 个预测日对应的遥远时段编码器模块在历史第k个起飞日的隐藏层状态值的注意力权重其计算公式为:
对于外部因素融合模块:
对于解码器模块:
经过临近时段编码器模块及遥远时段编码器模块的起飞日注意力机制分别计算得到对于未来第d天的加权求和的上下文向量之后,在解码器模块中,将所述两个上下文向量与外部因素融合模块的输出以及解码器模块上一时刻的输出相结合来更新解码器隐藏层状态,公式如下:
式中,fd表示解码器中使用的解码LSTM单元更新函数;
将解码器模块最终输出结果与所述有效训练集中预测时间段中对应的航班客座率数据进行比较,将比较结果最接近时的需要学习的参数的值作为所述第一模型中的最优参数值,并根据确定的所述第一模型的最优参数值,生成预测航班客座率的第二模型。
优选地,所述根据预测所述航线上航班客座率的最优模型的输出结果对所述目标航班在所述航线上未来τ天的航行进行调整包括:
当目标航班未来τ天内的起飞时刻的客座率高于设定的第一阈值时,增加所述起飞时刻航班的飞行次数;
当目标航班未来τ天内的起飞时刻的客座率高于设定的第二阈值时,增加所述起飞时刻航班的售票价格,其中,所述第二阈值小于第一阈值;
当目标航班未来τ天内的起飞时刻的客座率低于设定的第三阈值时,降低所述起飞时刻航班的售票价格以提高航班客座率,其中,所述第三阈值少于第二阈值。
本优选实施方式中,以真实的历史航班客座率数据集为例,其中选取“北京首都-上海虹桥”航线中在两年内起飞日达584天以上的航班数据作为实验数据集,若设置临近时段及遥远时段的时间窗口长度分别为ln= 28、ld=19、预测天数τ=7,则统计信息如表1所示。
表1数据集统计信息
步骤S1、基于采集的数据集构造初始样本集。
假定h代表需要预测的目标航班未来τ天中的第一天,则预测时段为 [h,h+τ-1],该航线上所有起飞时刻航班的历史客座率数据临近时段为 [h-ln,h-1]、遥远时段为[h-365-(ld-τ)/2,h-366+ (ld-τ)/2+τ],依据以上时段划分构造单个数据样本,按照每天一次滑动构建新的预测时段,依据上述操作,每一个航班可以构建353个样本,则总样本数为27×353=9531。
步骤S2、对实验涉及的数据进行数据预处理,生成有效样本集,并划分非重叠的训练集和验证集。
由于航班客座率的取值范围为[0,1],所以无需对其进行归一化处理;对于外部输入数据,本发明采用独热编码(One-Hot)的方式分别对起飞日期星期属性、是否工作日、是否节假日、是否节假日前、是否节假日后、目标航班起飞时选用的机型、航班所属航空公司这些离散特征进行编码;对于起落地GDP、起飞时刻(提取小时及分钟)、各舱座位数这些连续特征本发明采用Min-Max归一化方法归一到[0,1]之间,具体公式为:
x′=(x-min x)/(max x-min x)
其中x代表原数据,x′代表经过归一化处理后新的数据表示,min x、max x 分别代表归一化处理前原数据的最小值和最大值。
本发明按照时间顺序将数据集划分为非重叠的训练集和验证集,划分比例为4:1,即在该实验数据集中选取27个航班预测时段为 2011/01/07-2011/10/20的经济舱客座率数据作为训练集,预测时段为 2011/10/21-2011/12/31的数据作为验证集。
步骤S3、训练预测航班客座率的模型,学习该数据集下模型最优参数,并确定最优超参后生成最优模型。
模型训练阶段,批大小(Batch Size)设为256,学习率为0.001,训练轮数为500,采用早停策略防止过拟合。本发明提出的模型中共有5个需要调节的超参,它们分别是临近时间依赖及遥远时间依赖的时间窗口长度 ln、ld,两部分编码器(Near Encoder及DistantEncoder)中下方LSTM单元的隐藏层状态数n及上方LSTM单元隐藏层状态数m,解码器隐藏层状态数p。在确定模型的最优参数后,为了确定ln和ld的取值,本发明在这两个参数的取值上做网格搜索ln∈{7,14,28,42,56},ld∈{11,15,19,23,27}。本发明选取在验证集上达到最佳预测效果的超参组合(ln=28,ld=19,23) 用于测试。为了简单起见,本发明在两部分编码器及编解码器中所有的LSTM 单元中使用相同的隐藏层维度并在该参数上进行网格搜索n=m=p∈ {32,64,128,256},选取在验证集上取得最佳预测效果的隐藏层维度(n= m=p=64)用于模型评估。另外,本发明采用堆叠LSTMs(层数f=2)作为编解码器的单元来提高模型性能。
步骤S4、基于确定的最优模型,根据采集的航线的历史航班客座率数据进行未来时间段航班客座率的预测。
为了验证本优选实施方式所述的最优模型预测航班客座率的准确度,本发明将最优模型在验证集上进行模型预测性能评估,与其他基准方法进行对比。本优选实施方式采用平均绝对误差(MAE)和均方根误差(RMSE)作为模型预测效果的评价指标。本发明提出的模型与其他基准方法预测结果进行对比,准确度明显高于其他方法。
图3为根据本发明优选实施方式的基于多粒度时间注意力机制确定航班客座率的系统的结构示意图。如图3所示,本优选实施方式所述的基于多粒度时间注意力机制确定航班客座率的系统300包括:
模型建立单元301,其用于建立预测所述航线航班客座率的最优模型。
数据采集单元302,其用于采集一个航线在某一个时间周期内所有起飞时刻的历史航班客座率数据,生成初始样本集;
数据处理单元303,其用于对所述历史航班客座率数据中具有离散属性和连续属性的数据进行预处理,生成有效样本集;
预测结果单元304,其用于基于预先确定的预测所述航线航班客座率的最优模型,以所述有效样本集中目标航班的数据为输入向量,对所述航线上的目标航班未来τ天的客座率进行预测;
航班调整单元305,其用于根据预测所述航线上航班客座率的最优模型的输出结果对所述目标航班在所述航线上未来τ天的航行进行调整。
优选地,所述模型建立单元301包括:
数据采集单元311,其用于采集一个航线在某一个时间周期内所有起飞时刻的历史航班客座率数据,生成初始样本集;
数据处理单元312,其用于对所述初始样本集中具有离散属性和连续属性的数据进行预处理,生成有效样本集;
样本划分单元313,其用于按照预先设置的比例,将有效样本集划分为非重叠的有效训练集和有效验证集;
第一模型单元314,其用于建立预测航班客座率的第一模型,并设置与训练预测航班客座率的第一模型的相关的信息和预测航班客座率的第一模型中的超参的初始值,其中,所述第一模型包括2个编码器模块,1个解码器模块和1个外部因素融合模块,所述2个编码器模块分别是临近时段编码器模块和遥远时段编码器模块,其用于对输入向量进行编码,所述临近时段编码器模块的输入向量是临近时段所述航线上目标航班所有起飞时刻的航班客座率时间序列,所述遥远时段编码器模块的输入向量是遥远时段所述航线上目标航班所有起飞时刻的航班客座率时间序列,所述临近时段是指与需要预测的目标航班在预测时段内的每一天相邻的时间段,所述遥远时段是指与需要预测的目标航班在预测时段内的每一天相隔一定天数的时间段,外部因素融合模块用于确定除所述航线起飞时间以外的外部因素对所述航线上的航班的影响,其输入向量为有效训练集中目标航班在预测时间内的除所述航线起飞时间以外的外部因素的数据,解码器模块用于输出所述航线上目标航班客座率预测结果;临近时段编码器模块包括第一临近时段长短期记忆网络LSTM单元和第二临近时段LSTM单元,所述遥远时段编码器模块包括第一遥远时段LSTM单元和第二遥远时段LSTM单元,所述解码器模块包括解码LSTM单元,所述与训练预测航班客座率的第一模型的相关的信息包括批大小、学习、训练轮数和防止过拟合策略;所述超参指第一临近时段长短期记忆网络LSTM单元和第一遥远时段LSTM单元隐藏层状态数,第二临近时段LSTM单元和第二遥远时段LSTM单元隐藏层状态数,解码LSTM单元隐藏层状态数,以及临近时段和遥远时段的时间窗口长度;
模型训练单元315,其用于根据所述有效训练集,基于预测航班客座率的第一模型进行客座率预测,并将所述第一模型的输出结果与所述有效训练集中的航班客座率数据进行比较,确定所述第一模型中的最优参数值,生成预测航班客座率的第二模型,其中,所述第一模型中的最优参数是指第一临近时段长短期记忆网络LSTM单元、第一遥远时段LSTM单元、第二临近时段LSTM单元和第二遥远时段LSTM单元中需要学习的参数的最优值;
最优模型单元316,其用于根据所述有效验证集,为所述预测航班客座率的第二模型中的超参赋值后进行客座率预测,并将所述第二模型的输出结果与所述有效验证集中的目标航班在预测时间段的航班客座率数据进行比较,将比较结果最接近时的超参值作为所述第二模型中的超参的最优值,生成预测航班客座率的最优模型。
优选地,所述数据处理单元303对所述初始样本集中具有离散特征和连续特征的数据进行预处理,生成有效样本集包括:
对于初始样本集中ID离散属性的数据采用one-hot编码方式进行编码,并将编码后的结果输入至全连接神经网络层将高维向量映射为低维向量,所述低维向量为第一数据,其中,所述ID离散属性的数据包括航空公司,机型;
对于初始样本集中一般离散属性的数据采用one-hot编码方式进行编码,所述编码后的结果为第二数据,其中,所述一般离散属性的数据包括是否工作日,是否节假晶,是否节假日前,是否节假日后;
对于初始样本集中具有连续属性的数据采用Min-Max归一化方法归一到[0,1]之间,所述归一后的数据为第三数据,其中,所述具有连续属性的数据包括航班起飞时刻,机舱座位数,所述归一化的计算公式为:
x′=(x-min x)/(max x-min x)
式中,x代表具有连续属性的原数据,x′代表经过归一化处理后新的数据,minx、maxx分别代表归一化处理前具有连续属性的原数据的最小值和最大值;
将所述第一数据、第二数据、第三数据按照初始样本集中的顺序进行排列,生成有效样本集。
优选地,所述模型训练单元315根据所述有效训练集,基于预测航班客座率的第一模型进行客座率预测,并将所述第一模型的输出结果与所述有效训练集中的航班客座率数据进行比较,确定所述第一模型的最优参数,生成预测航班客座率的第二模型包括:
对于临近时段编码器模块:
给定临近时段输入序列Xnear=(xnear,1,xnear,2,…,xnear,T),将xnear ,t作为第一临近时段LSTM单元在目标航班第t个起飞时刻航班的输入,其中,所述ln为临时时段的时间窗口长度,T为目标航班在所述航线上的所有起飞时刻的数目;
采用更新第一临近时段LSTM单元在第t个起飞时刻的隐藏层状态值,其中feb代表第一临近时段LSTM单元的更新函数,通过所述第一临近时段LSTM单元计算得到每个起飞时刻下的隐藏层状态值其中,n为第一临近时段LSTM单元的隐藏层状态数;
采用起飞时刻注意力机制,基于所述第一临近时段LSTM单元在第 t个起飞时刻下的隐藏层状态值以及所述第二临近时段LSTM单元在临近时段历史第k-1个起飞日的隐藏层状态值及记忆单元状态值计算在起飞日第k天时,第t个起飞时刻的航班客座率时间序列对目标航班当天客座率影响程度的注意力权重其计算公式为:
采用更新第二临近时段LSTM单元在第k个起飞日的隐藏层状态值,fea代表第二临近时段LSTM单元的更新函数,通过所述第二临近时段LSTM单元计算得到临近时段每个起飞日的隐藏层状态值其中,m为第二临近时段LSTM 单元的隐藏层状态数;
采用起飞日注意力机制,基于所述第二临近时段LSTM单元在临近时段历史第k个起飞日的隐藏层状态值及解码器中的解码LSTM单元在第d-1个预测日的隐藏层状态值gd-1及记忆单元状态值s′d-1计算在第d个预测日对应的临近时段编码器模块在历史第k个起飞日的隐藏层状态值的注意力权重其计算公式为:
对于遥远时段编码器模块:
给定临近时段输入序列Xdistant=(xdistant,1,xdistant,2,…,xdistant,T),将xdistant,t作为第一遥远时段LSTM单元在目标航班第t个起飞时刻航班的输入,其中,所述ld为遥远时段的时间窗口长度,T为目标航班在所述航线上的所有起飞时刻的数目;
采用更新第一遥远时段LSTM单元在第t个起飞时刻的隐藏层状态值,其中feb′代表第一遥远时段LSTM单元的更新函数,通过所述第一遥远时段LSTM单元计算得到每个起飞时刻下的隐藏层状态值其中,n为第一遥远时段LSTM单元的隐藏层状态数;
采用起飞时刻注意力机制,基于所述第一遥远时段LSTM单元在第 t个起飞时刻下的隐藏层状态值以及所述第二遥远时段LSTM单元在遥远时段历史第k-1个起飞日的隐藏层状态值及记忆单元状态值计算在起飞日第k天时,第t个起飞时刻的航班客座率时间序列对目标航班当天客座率影响程度的注意力权重其计算公式为:
采用更新第二遥远时段LSTM单元在第k个起飞日的隐藏层状态值,fea’代表第二遥远时段LSTM单元的更新函数,通过所述第二遥远时段LSTM单元计算得到遥远时段每个起飞日的隐藏层状态值其中,m为第二遥远时段LSTM单元的隐藏层状态数;
采用起飞日注意力机制,基于所述第二遥远时段LSTM单元在遥远时段历史第k个起飞日的隐藏层状态值及解码器中的解码LSTM单元在第d-1个预测日的隐藏层状态值gd-1及记忆单元状态值s′d-1计算在第d 个预测日对应的遥远时段编码器模块在历史第k个起飞日的隐藏层状态值的注意力权重其计算公式为:
对于外部因素融合模块:
对于解码器模块:
经过临近时段编码器模块及遥远时段编码器模块的起飞日注意力机制分别计算得到对于未来第d天的加权求和的上下文向量之后,在解码器模块中,将所述两个上下文向量与外部因素融合模块的输出以及解码器模块上一时刻的输出相结合来更新解码器隐藏层状态,公式如下:
式中,fd表示解码器中使用的解码LSTM单元更新函数;
将解码器模块最终输出结果与所述有效训练集中预测时间段中对应的航班客座率数据进行比较,将比较结果最接近时的需要学习的参数的值作为所述第一模型中的最优参数值,并根据确定的所述第一模型的最优参数值,生成预测航班客座率的第二模型。
优选地,所述航班调整单元305根据预测所述航线上航班客座率的最优模型的输出结果对所述目标航班在所述航线上未来τ天的航行进行调整包括:
当目标航班未来τ天内的起飞时刻的客座率高于设定的第一阈值时,增加所述起飞时刻航班的飞行次数;
当目标航班未来τ天内的起飞时刻的客座率高于设定的第二阈值时,增加所述起飞时刻航班的售票价格,其中,所述第二阈值小于第一阈值;
当目标航班未来τ天内的起飞时刻的客座率低于设定的第三阈值时,降低所述起飞时刻航班的售票价格以提高航班客座率,其中,所述第三阈值少于第二阈值。
本发明所述基于多粒度时间注意力机制确定航班客座率的系统对目标航班未来时间段的客座率进行预测并调整的步骤与本发明所述基于多粒度时间注意力机制确定航班客座率的方法采取的步骤相同,并且达到的技术效果也相同,此处不再赘述。
已经通过参考少量实施方式描述了本发明。然而,本领域技术人员所公知的,正如附带的专利权利要求所限定的,除了本发明以上公开的其他的实施例等同地落在本发明的范围内。
通常地,在权利要求中使用的所有术语都根据他们在技术领域的通常含义被解释,除非在其中被另外明确地定义。所有的参考“一个/所述/该 [装置、组件等]”都被开放地解释为所述装置、组件等中的至少一个实例,除非另外明确地说明。这里公开的任何方法的步骤都没必要以公开的准确的顺序运行,除非明确地说明。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
最后应当说明的是:以上实施例仅用以说明本发明的技术方案而非对其限制,尽管参照上述实施例对本发明进行了详细的说明,所属领域的普通技术人员应当理解:依然可以对本发明的具体实施方式进行修改或者等同替换,而未脱离本发明精神和范围的任何修改或者等同替换,其均应涵盖在本发明的权利要求保护范围之内。
Claims (10)
1.一种基于多粒度时间注意力机制确定航班客座率的方法,其特征在于,所述方法包括:
采集一个航线在某一个时间周期内所有起飞时刻的历史航班客座率数据,生成初始样本集;
对所述历史航班客座率数据中具有离散属性和连续属性的数据进行预处理,生成有效样本集;
基于预先确定的预测所述航线航班客座率的最优模型,以所述有效样本集中目标航班的数据为输入向量,对所述航线上的目标航班未来τ天的客座率进行预测;
根据预测所述航线上航班客座率的最优模型的输出结果对所述目标航班在所述航线上未来τ天的航行进行调整。
2.根据权利要求1所述的方法,其特征在于,所述方法在采集一个航线在某一个时间周期内所有起飞时刻的历史航班客座率数据之前还包括建立预测所述航线航班客座率的最优模型,其中:
采集一个航线在某一个时间周期内所有起飞时刻的历史航班客座率数据,生成初始样本集;
对所述初始样本集中具有离散属性和连续属性的数据进行预处理,生成有效样本集;
按照预先设置的比例,将有效样本集划分为非重叠的有效训练集和有效验证集;
设置与训练预测航班客座率的第一模型的相关的信息和预测航班客座率的第一模型中的超参的初始值,其中,所述第一模型包括2个编码器模块,1个解码器模块和1个外部因素融合模块,所述2个编码器模块分别是临近时段编码器模块和遥远时段编码器模块,其用于对输入向量进行编码,所述临近时段编码器模块的输入向量是临近时段所述航线上目标航班所有起飞时刻的航班客座率时间序列,所述遥远时段编码器模块的输入向量是遥远时段所述航线上目标航班所有起飞时刻的航班客座率时间序列,所述临近时段是指与需要预测的目标航班在预测时段内的每一天相邻的时间段,所述遥远时段是指与需要预测的目标航班在预测时段内的每一天相隔一定天数的时间段,外部因素融合模块用于确定除所述航线起飞时间以外的外部因素对所述航线上的航班的影响,其输入向量为有效训练集中目标航班在预测时间内的除所述航线起飞时间以外的外部因素的数据,解码器模块用于输出所述航线上目标航班客座率预测结果;临近时段编码器模块包括第一临近时段长短期记忆网络LSTM单元和第二临近时段LSTM单元,所述遥远时段编码器模块包括第一遥远时段LSTM单元和第二遥远时段LSTM单元,所述解码器模块包括解码LSTM单元,所述与训练预测航班客座率的第一模型的相关的信息包括批大小、学习、训练轮数和防止过拟合策略;所述超参指第一临近时段长短期记忆网络LSTM单元和第一遥远时段LSTM单元隐藏层状态数,第二临近时段LSTM单元和第二遥远时段LSTM单元隐藏层状态数,解码LSTM单元隐藏层状态数,以及临近时段和遥远时段的时间窗口长度;
根据所述有效训练集,基于预测航班客座率的第一模型进行客座率预测,并将所述第一模型的输出结果与所述有效训练集中的航班客座率数据进行比较,确定所述第一模型中的最优参数值,生成预测航班客座率的第二模型,其中,所述第一模型中的最优参数是指第一临近时段长短期记忆网络LSTM单元、第一遥远时段LSTM单元、第二临近时段LSTM单元和第二遥远时段LSTM单元中需要学习的参数的最优值;
根据所述有效验证集,为所述预测航班客座率的第二模型中的超参赋值后进行客座率预测,并将所述第二模型的输出结果与所述有效验证集中的目标航班在预测时间段的航班客座率数据进行比较,将比较结果最接近时的超参值作为所述第二模型中的超参的最优值,生成预测航班客座率的最优模型。
3.根据权利要求1或者2所述的方法,其特征在于,所述对所述初始样本集中具有离散特征和连续特征的数据进行预处理,生成有效样本集包括:
对于初始样本集中ID离散属性的数据采用one-hot编码方式进行编码,并将编码后的结果输入至全连接神经网络层将高维向量映射为低维向量,所述低维向量为第一数据,其中,所述ID离散属性的数据包括航空公司,机型;
对于初始样本集中一般离散属性的数据采用one-hot编码方式进行编码,所述编码后的结果为第二数据,其中,所述一般离散属性的数据包括是否工作日,是否节假晶,是否节假日前,是否节假日后;
对于初始样本集中具有连续属性的数据采用Min-Max归一化方法归一到[0,1]之间,所述归一后的数据为第三数据,其中,所述具有连续属性的数据包括航班起飞时刻,机舱座位数,所述归一化的计算公式为:
x′=(x-min x)/(max x-min x)
式中,x代表具有连续属性的原数据,x′代表经过归一化处理后新的数据,min x、max x分别代表归一化处理前具有连续属性的原数据的最小值和最大值;
将所述第一数据、第二数据、第三数据按照初始样本集中的顺序进行排列,生成有效样本集。
4.根据权利要求2所述的方法,其特征在于,根据所述有效训练集,基于预测航班客座率的第一模型进行客座率预测,并将所述第一模型的输出结果与所述有效训练集中的航班客座率数据进行比较,确定所述第一模型的最优参数,生成预测航班客座率的第二模型包括:
对于临近时段编码器模块:
给定临近时段输入序列Xnear=(xnear,1,xnear,2,…,xnear,T),
采用更新第一临近时段LSTM单元在第t个起飞时刻的隐藏层状态值,其中feb代表第一临近时段LSTM单元的更新函数,通过所述第一临近时段LSTM单元计算得到每个起飞时刻下的隐藏层状态值其中,n为第一临近时段LSTM单元的隐藏层状态数;
采用起飞时刻注意力机制,基于所述第一临近时段LSTM单元在第t个起飞时刻下的隐藏层状态值以及所述第二临近时段LSTM单元在临近时段历史第k-1个起飞日的隐藏层状态值及记忆单元状态值计算在起飞日第k天时,第t个起飞时刻的航班客座率时间序列对目标航班当天客座率影响程度的注意力权重其计算公式为:
采用更新第二临近时段LSTM单元在第k个起飞日的隐藏层状态值,fea代表第二临近时段LSTM单元的更新函数,通过所述第二临近时段LSTM单元计算得到临近时段每个起飞日的隐藏层状态值其中,m为第二临近时段LSTM单元的隐藏层状态数;
采用起飞日注意力机制,基于所述第二临近时段LSTM单元在临近时段历史第k个起飞日的隐藏层状态值及解码器中的解码LSTM单元在第d-1个预测日的隐藏层状态值gd-1及记忆单元状态值s′d-1计算在第d个预测日对应的临近时段编码器模块在历史第k个起飞日的隐藏层状态值的注意力权重其计算公式为:
对于遥远时段编码器模块:
给定临近时段输入序列Xdistant=(xdistant,1,xdistant,2,…,xdistant,T),将xdistant,t作为第一遥远时段LSTM单元在目标航班第t个起飞时刻航班的输入,其中,所述ld为遥远时段的时间窗口长度,T为目标航班在所述航线上的所有起飞时刻的数目;
采用更新第一遥远时段LSTM单元在第t个起飞时刻的隐藏层状态值,其中feb′代表第一遥远时段LSTM单元的更新函数,通过所述第一遥远时段LSTM单元计算得到每个起飞时刻下的隐藏层状态值其中,n为第一遥远时段LSTM单元的隐藏层状态数;
采用起飞时刻注意力机制,基于所述第一遥远时段LSTM单元在第t个起飞时刻下的隐藏层状态值以及所述第二遥远时段LSTM单元在遥远时段历史第k-1个起飞日的隐藏层状态值及记忆单元状态值计算在起飞日第k天时,第t个起飞时刻的航班客座率时间序列对目标航班当天客座率影响程度的注意力权重其计算公式为:
采用更新第二遥远时段LSTM单元在第k个起飞日的隐藏层状态值,fea’代表第二遥远时段LSTM单元的更新函数,通过所述第二遥远时段LSTM单元计算得到遥远时段每个起飞日的隐藏层状态值其中,m为第二遥远时段LSTM单元的隐藏层状态数;
采用起飞日注意力机制,基于所述第二遥远时段LSTM单元在遥远时段历史第k个起飞日的隐藏层状态值及解码器中的解码LSTM单元在第d-1个预测日的隐藏层状态值gd-1及记忆单元状态值s′d-1计算在第d个预测日对应的遥远时段编码器模块在历史第k个起飞日的隐藏层状态值的注意力权重其计算公式为:
对于外部因素融合模块:
对于解码器模块:
经过临近时段编码器模块及遥远时段编码器模块的起飞日注意力机制分别计算得到对于未来第d天的加权求和的上下文向量之后,在解码器模块中,将所述两个上下文向量与外部因素融合模块的输出以及解码器模块上一时刻的输出相结合来更新解码器隐藏层状态,公式如下:
式中,fd表示解码器中使用的解码LSTM单元更新函数;
将解码器模块最终输出结果与所述有效训练集中预测时间段中对应的航班客座率数据进行比较,将比较结果最接近时的需要学习的参数的值作为所述第一模型中的最优参数值,并根据确定的所述第一模型的最优参数值,生成预测航班客座率的第二模型。
5.根据权利要求1所述的方法,其特征在于,所述根据预测所述航线上航班客座率的最优模型的输出结果对所述目标航班在所述航线上未来τ天的航行进行调整包括:
当目标航班未来τ天内的起飞时刻的客座率高于设定的第一阈值时,增加所述起飞时刻航班的飞行次数;
当目标航班未来τ天内的起飞时刻的客座率高于设定的第二阈值时,增加所述起飞时刻航班的售票价格,其中,所述第二阈值小于第一阈值;
当目标航班未来τ天内的起飞时刻的客座率低于设定的第三阈值时,降低所述起飞时刻航班的售票价格以提高航班客座率,其中,所述第三阈值少于第二阈值。
6.一种基于多粒度时间注意力机制确定航班客座率的系统,其特征在于,所述系统包括:
数据采集单元,其用于采集一个航线在某一个时间周期内所有起飞时刻的历史航班客座率数据,生成初始样本集;
数据处理单元,其用于对所述历史航班客座率数据中具有离散属性和连续属性的数据进行预处理,生成有效样本集;
预测结果单元,其用于基于预先确定的预测所述航线航班客座率的最优模型,以所述有效样本集中目标航班的数据为输入向量,对所述航线上的目标航班未来τ天的客座率进行预测;
航班调整单元,其用于根据预测所述航线上航班客座率的最优模型的输出结果对所述目标航班在所述航线上未来τ天的航行进行调整。
7.根据权利要求6所述的系统,其特征在于,所述方法还包括模型建立单元,其用于建立预测所述航线航班客座率的最优模型,所述模型建立单元包括:
数据采集单元,其用于采集一个航线在某一个时间周期内所有起飞时刻的历史航班客座率数据,生成初始样本集;
数据处理单元,其用于对所述初始样本集中具有离散属性和连续属性的数据进行预处理,生成有效样本集;
样本划分单元,其用于按照预先设置的比例,将有效样本集划分为非重叠的有效训练集和有效验证集;
第一模型单元,其用于建立预测航班客座率的第一模型,并设置与训练预测航班客座率的第一模型的相关的信息和预测航班客座率的第一模型中的超参的初始值,其中,所述第一模型包括2个编码器模块,1个解码器模块和1个外部因素融合模块,所述2个编码器模块分别是临近时段编码器模块和遥远时段编码器模块,其用于对输入向量进行编码,所述临近时段编码器模块的输入向量是临近时段所述航线上目标航班所有起飞时刻的航班客座率时间序列,所述遥远时段编码器模块的输入向量是遥远时段所述航线上目标航班所有起飞时刻的航班客座率时间序列,所述临近时段是指与需要预测的目标航班在预测时段内的每一天相邻的时间段,所述遥远时段是指与需要预测的目标航班在预测时段内的每一天相隔一定天数的时间段,外部因素融合模块用于确定除所述航线起飞时间以外的外部因素对所述航线上的航班的影响,其输入向量为有效训练集中目标航班在预测时间内的除所述航线起飞时间以外的外部因素的数据,解码器模块用于输出所述航线上目标航班客座率预测结果;临近时段编码器模块包括第一临近时段长短期记忆网络LSTM单元和第二临近时段LSTM单元,所述遥远时段编码器模块包括第一遥远时段LSTM单元和第二遥远时段LSTM单元,所述解码器模块包括解码LSTM单元,所述与训练预测航班客座率的第一模型的相关的信息包括批大小、学习、训练轮数和防止过拟合策略;所述超参指第一临近时段长短期记忆网络LSTM单元和第一遥远时段LSTM单元隐藏层状态数,第二临近时段LSTM单元和第二遥远时段LSTM单元隐藏层状态数,解码LSTM单元隐藏层状态数,以及临近时段和遥远时段的时间窗口长度;
模型训练单元,其用于根据所述有效训练集,基于预测航班客座率的第一模型进行客座率预测,并将所述第一模型的输出结果与所述有效训练集中的航班客座率数据进行比较,确定所述第一模型中的最优参数值,生成预测航班客座率的第二模型,其中,所述第一模型中的最优参数是指第一临近时段长短期记忆网络LSTM单元、第一遥远时段LSTM单元、第二临近时段LSTM单元和第二遥远时段LSTM单元中需要学习的参数的最优值;
最优模型单元,其用于根据所述有效验证集,为所述预测航班客座率的第二模型中的超参赋值后进行客座率预测,并将所述第二模型的输出结果与所述有效验证集中的目标航班在预测时间段的航班客座率数据进行比较,将比较结果最接近时的超参值作为所述第二模型中的超参的最优值,生成预测航班客座率的最优模型。
8.根据权利要求6或者7所述的系统,其特征在于,所述数据处理单元对所述初始样本集中具有离散特征和连续特征的数据进行预处理,生成有效样本集包括:
对于初始样本集中ID离散属性的数据采用one-hot编码方式进行编码,并将编码后的结果输入至全连接神经网络层将高维向量映射为低维向量,所述低维向量为第一数据,其中,所述ID离散属性的数据包括航空公司,机型;
对于初始样本集中一般离散属性的数据采用one-hot编码方式进行编码,所述编码后的结果为第二数据,其中,所述一般离散属性的数据包括是否工作日,是否节假晶,是否节假日前,是否节假日后;
对于初始样本集中具有连续属性的数据采用Min-Max归一化方法归一到[0,1]之间,所述归一后的数据为第三数据,其中,所述具有连续属性的数据包括航班起飞时刻,机舱座位数,所述归一化的计算公式为:
x′=(x-min x)/(max x-min x)
式中,x代表具有连续属性的原数据,x′代表经过归一化处理后新的数据,min x、max x分别代表归一化处理前具有连续属性的原数据的最小值和最大值;
将所述第一数据、第二数据、第三数据按照初始样本集中的顺序进行排列,生成有效样本集。
9.根据权利要求7所述的方法,其特征在于,所述模型训练单元根据所述有效训练集,基于预测航班客座率的第一模型进行客座率预测,并将所述第一模型的输出结果与所述有效训练集中的航班客座率数据进行比较,确定所述第一模型的最优参数,生成预测航班客座率的第二模型包括:
对于临近时段编码器模块:
给定临近时段输入序列Xnear=(xnear,1,xnear,2,…,xnear,T),
采用更新第一临近时段LSTM单元在第t个起飞时刻的隐藏层状态值,其中feb代表第一临近时段LSTM单元的更新函数,通过所述第一临近时段LSTM单元计算得到每个起飞时刻下的隐藏层状态值其中,n为第一临近时段LSTM单元的隐藏层状态数;
采用起飞时刻注意力机制,基于所述第一临近时段LSTM单元在第t个起飞时刻下的隐藏层状态值以及所述第二临近时段LSTM单元在临近时段历史第k-1个起飞日的隐藏层状态值及记忆单元状态值计算在起飞日第k天时,第t个起飞时刻的航班客座率时间序列对目标航班当天客座率影响程度的注意力权重其计算公式为:
采用更新第二临近时段LSTM单元在第k个起飞日的隐藏层状态值,fea代表第二临近时段LSTM单元的更新函数,通过所述第二临近时段LSTM单元计算得到临近时段每个起飞日的隐藏层状态值其中,m为第二临近时段LSTM单元的隐藏层状态数;
采用起飞日注意力机制,基于所述第二临近时段LSTM单元在临近时段历史第k个起飞日的隐藏层状态值及解码器中的解码LSTM单元在第d-1个预测日的隐藏层状态值gd-1及记忆单元状态值s′d-1计算在第d个预测日对应的临近时段编码器模块在历史第k个起飞日的隐藏层状态值的注意力权重其计算公式为:
对于遥远时段编码器模块:
给定临近时段输入序列Xdistant=(xdistant,1,xdistant,2,…,xdistant,T),将xdistant,t作为第一遥远时段LSTM单元在目标航班第t个起飞时刻航班的输入,其中,所述ld为遥远时段的时间窗口长度,T为目标航班在所述航线上的所有起飞时刻的数目;
采用更新第一遥远时段LSTM单元在第t个起飞时刻的隐藏层状态值,其中feb′代表第一遥远时段LSTM单元的更新函数,通过所述第一遥远时段LSTM单元计算得到每个起飞时刻下的隐藏层状态值其中,n为第一遥远时段LSTM单元的隐藏层状态数;
采用起飞时刻注意力机制,基于所述第一遥远时段LSTM单元在第t个起飞时刻下的隐藏层状态值以及所述第二遥远时段LSTM单元在遥远时段历史第k-1个起飞日的隐藏层状态值及记忆单元状态值计算在起飞日第k天时,第t个起飞时刻的航班客座率时间序列对目标航班当天客座率影响程度的注意力权重其计算公式为:
采用更新第二遥远时段LSTM单元在第k个起飞日的隐藏层状态值,fea’代表第二遥远时段LSTM单元的更新函数,通过所述第二遥远时段LSTM单元计算得到遥远时段每个起飞日的隐藏层状态值其中,m为第二遥远时段LSTM单元的隐藏层状态数;
采用起飞日注意力机制,基于所述第二遥远时段LSTM单元在遥远时段历史第k个起飞日的隐藏层状态值及解码器中的解码LSTM单元在第d-1个预测日的隐藏层状态值gd-1及记忆单元状态值s′d-1计算在第d个预测日对应的遥远时段编码器模块在历史第k个起飞日的隐藏层状态值的注意力权重其计算公式为:
对于外部因素融合模块:
对于解码器模块:
经过临近时段编码器模块及遥远时段编码器模块的起飞日注意力机制分别计算得到对于未来第d天的加权求和的上下文向量之后,在解码器模块中,将所述两个上下文向量与外部因素融合模块的输出以及解码器模块上一时刻的输出相结合来更新解码器隐藏层状态,公式如下:
式中,fd表示解码器中使用的解码LSTM单元更新函数;
将解码器模块最终输出结果与所述有效训练集中预测时间段中对应的航班客座率数据进行比较,将比较结果最接近时的需要学习的参数的值作为所述第一模型中的最优参数值,并根据确定的所述第一模型的最优参数值,生成预测航班客座率的第二模型。
10.根据权利要求6所述的系统,其特征在于,所述航班调整单元根据预测所述航线上航班客座率的最优模型的输出结果对所述目标航班在所述航线上未来τ天的航行进行调整包括:
当目标航班未来τ天内的起飞时刻的客座率高于设定的第一阈值时,增加所述起飞时刻航班的飞行次数;
当目标航班未来τ天内的起飞时刻的客座率高于设定的第二阈值时,增加所述起飞时刻航班的售票价格,其中,所述第二阈值小于第一阈值;
当目标航班未来τ天内的起飞时刻的客座率低于设定的第三阈值时,降低所述起飞时刻航班的售票价格以提高航班客座率,其中,所述第三阈值少于第二阈值。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911386046.0A CN111325380A (zh) | 2019-12-29 | 2019-12-29 | 基于多粒度时间注意力机制确定航班客座率的方法和系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911386046.0A CN111325380A (zh) | 2019-12-29 | 2019-12-29 | 基于多粒度时间注意力机制确定航班客座率的方法和系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111325380A true CN111325380A (zh) | 2020-06-23 |
Family
ID=71172535
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911386046.0A Pending CN111325380A (zh) | 2019-12-29 | 2019-12-29 | 基于多粒度时间注意力机制确定航班客座率的方法和系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111325380A (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112329993A (zh) * | 2020-10-22 | 2021-02-05 | 海南太美航空股份有限公司 | 一种航班乘客数量的预测方法、系统及电子设备 |
CN112926809A (zh) * | 2021-05-10 | 2021-06-08 | 北京人人云图信息技术有限公司 | 一种基于聚类和改进的xgboost的航班流量预测方法及系统 |
CN113221472A (zh) * | 2021-07-08 | 2021-08-06 | 北京航空航天大学 | 一种基于lstm的客流预测方法 |
WO2022111302A1 (zh) * | 2020-11-24 | 2022-06-02 | 天津九安医疗电子股份有限公司 | 一种智能灯、其点亮方法及转存、加载和应用灯状态模型的方法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109858671A (zh) * | 2018-12-26 | 2019-06-07 | 携程旅游网络技术(上海)有限公司 | 预测目标航线的客座率的方法和系统 |
CN110288121A (zh) * | 2019-05-16 | 2019-09-27 | 北京交通大学 | 基于多粒度时间注意力机制的航班客座率预测方法 |
-
2019
- 2019-12-29 CN CN201911386046.0A patent/CN111325380A/zh active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109858671A (zh) * | 2018-12-26 | 2019-06-07 | 携程旅游网络技术(上海)有限公司 | 预测目标航线的客座率的方法和系统 |
CN110288121A (zh) * | 2019-05-16 | 2019-09-27 | 北京交通大学 | 基于多粒度时间注意力机制的航班客座率预测方法 |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112329993A (zh) * | 2020-10-22 | 2021-02-05 | 海南太美航空股份有限公司 | 一种航班乘客数量的预测方法、系统及电子设备 |
CN112329993B (zh) * | 2020-10-22 | 2024-03-19 | 海南太美航空股份有限公司 | 一种航班乘客数量的预测方法、系统及电子设备 |
WO2022111302A1 (zh) * | 2020-11-24 | 2022-06-02 | 天津九安医疗电子股份有限公司 | 一种智能灯、其点亮方法及转存、加载和应用灯状态模型的方法 |
CN112926809A (zh) * | 2021-05-10 | 2021-06-08 | 北京人人云图信息技术有限公司 | 一种基于聚类和改进的xgboost的航班流量预测方法及系统 |
CN113221472A (zh) * | 2021-07-08 | 2021-08-06 | 北京航空航天大学 | 一种基于lstm的客流预测方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111325380A (zh) | 基于多粒度时间注意力机制确定航班客座率的方法和系统 | |
CN110288121A (zh) | 基于多粒度时间注意力机制的航班客座率预测方法 | |
CN109490814B (zh) | 基于深度学习和支持向量数据描述的计量自动化终端故障诊断方法 | |
CN109785618B (zh) | 一种基于组合逻辑的短时交通流预测方法 | |
CN106022549A (zh) | 基于神经网络和思维演化搜索的短期负荷预测方法 | |
CN108197751A (zh) | 基于多层Bi-GRU的Seq2seq网络短期电力负荷预测方法 | |
CN109583565A (zh) | 基于注意力模型长短时记忆网络的洪水预测方法 | |
WO2021121354A1 (en) | Model-based deep reinforcement learning for dynamic pricing in online ride-hailing platform | |
CN110210648B (zh) | 基于灰色长短期记忆网络的管制空域战略流量预测方法 | |
CN110991607B (zh) | 一种地铁客流预测方法、装置、电子设备及存储介质 | |
CN111860989B (zh) | 一种基于蚁群算法优化的lstm神经网络短时交通流量预测方法 | |
CN113282684B (zh) | 航班季节性归类的预测方法、装置及机器可读介质 | |
CN109637196A (zh) | 航路扇区交通概率密度预测方法 | |
CN113449905A (zh) | 一种基于门控循环单元神经网络的交通拥堵预警方法 | |
CN112258251A (zh) | 基于灰色关联的电动汽车换电需求的集成学习预测方法及系统 | |
CN115359659B (zh) | 一种车道开闭配置方法和系统 | |
CN112381336A (zh) | 一种航班延误时长预测方法及系统 | |
CN111582584A (zh) | 基于航空公司公平性的航段运行时间优化方法 | |
CN115114128A (zh) | 一种卫星健康状态评估系统及评估方法 | |
CN114565187A (zh) | 一种基于图时空自编码网络的交通路网数据预测方法 | |
CN113674524A (zh) | 基于lstm-gasvr的多尺度短时交通流预测建模、预测方法及系统 | |
CN110490365B (zh) | 一种基于多源数据融合预测网约车订单量的方法 | |
CN116957331A (zh) | 风险旅客流量范围预测方法和装置 | |
CN111311905A (zh) | 一种基于粒子群优化小波神经网络的高速公路行程时间预测方法 | |
CN109670875B (zh) | 一种铁路客票浮动定价优化管理方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |