CN111325380A

CN111325380A - 基于多粒度时间注意力机制确定航班客座率的方法和系统

Info

Publication number: CN111325380A
Application number: CN201911386046.0A
Authority: CN
Inventors: 邓玉婧; 梁丽; 吴伟刚; 孙艺; 张学军; 宋颖; 陈晓敏
Original assignee: Aisino Corp
Current assignee: Aisino Corp
Priority date: 2019-12-29
Filing date: 2019-12-29
Publication date: 2020-06-23

Abstract

本发明提供一种基于多粒度时间注意力机制确定航班客座率的方法和系统。所述方法和系统基于采集历史的航班客座率数据，通过对建立的预测航班客座率模型进行训练并验证生成最优模型，再基于所述最优模型，根据所述航线历史航班客座率数据预测目标航班在未来一段时间的客座率，从而通过所述模型的输出结果对目标航班的航行进行调整。所述方法和系统与现有技术相比，建立的模型除考虑航班自身每日客座率变化外，还考虑到目标航班客座率的起飞时刻相关性和起飞日相关性，以及其他因素也的影响，从而预测航班客座率准确率更高，能够更好地帮助民航市场从业者提前感知市场需求进而及时采取对应决策。

Description

基于多粒度时间注意力机制确定航班客座率的方法和系统

技术领域

本发明涉及大数据处理领域,并且更具体地，涉及一种基于多粒度时间注意力机制确定航班客座率的方法和系统。

背景技术

随着民航旅客的迅速增长，航空客运需求预测越来越受到航空公司、机票代理商、飞机制造商等民航相关企业的关注。航班客座率是航空客运市场中用以衡量航班客运量需求的重要指标之一。准确地预测航班客座率是解决航空公司处理航班机票超售、座位虚耗等问题，提高民航从业者提前感知市场需求进而提高企业收益管理水平、为各级运营部门提供决策支持的重要途径之一。

目前，现有的航班客座率预测方法仅关注了目标航班近期每日客座率的变化特点，无法同时考虑到该问题受到的其它众多因素的影响，因此无法获得理想的预测效果。

发明内容

为了解决现有技术中航班客座率预测方法只关注目标航班近期每日客座率的变化特点，而使航班客座率预测效果不理想的技术问题，本发明提供一种基于多粒度时间注意力机制确定航班客座率的方法,所述方法包括：

采集一个航线在某一个时间周期内所有起飞时刻的历史航班客座率数据，生成初始样本集；

对所述历史航班客座率数据中具有离散属性和连续属性的数据进行预处理，生成有效样本集；

基于预先确定的预测所述航线航班客座率的最优模型，以所述有效样本集中目标航班的数据为输入向量，对所述航线上的目标航班未来τ天的客座率进行预测；

根据预测所述航线上航班客座率的最优模型的输出结果对所述目标航班在所述航线上未来τ天的航行进行调整。

进一步地，所述方法在采集一个航线在某一个时间周期内所有起飞时刻的历史航班客座率数据之前还包括建立预测所述航线航班客座率的最优模型，其中：

对所述初始样本集中具有离散属性和连续属性的数据进行预处理，生成有效样本集；

按照预先设置的比例，将有效样本集划分为非重叠的有效训练集和有效验证集；

设置与训练预测航班客座率的第一模型的相关的信息和预测航班客座率的第一模型中的超参的初始值，其中，所述第一模型包括2个编码器模块，1个解码器模块和1个外部因素融合模块，所述2个编码器模块分别是临近时段编码器模块和遥远时段编码器模块，其用于对输入向量进行编码，所述临近时段编码器模块的输入向量是临近时段所述航线上目标航班所有起飞时刻的航班客座率时间序列，所述遥远时段编码器模块的输入向量是遥远时段所述航线上目标航班所有起飞时刻的航班客座率时间序列，所述临近时段是指与需要预测的目标航班在预测时段内的每一天相邻的时间段，所述遥远时段是指与需要预测的目标航班在预测时段内的每一天相隔一定天数的时间段，外部因素融合模块用于确定除所述航线起飞时间以外的外部因素对所述航线上的航班的影响，其输入向量为有效训练集中目标航班在预测时间内的除所述航线起飞时间以外的外部因素的数据，解码器模块用于输出所述航线上目标航班客座率预测结果；临近时段编码器模块包括第一临近时段长短期记忆网络LSTM单元和第二临近时段LSTM单元，所述遥远时段编码器模块包括第一遥远时段LSTM单元和第二遥远时段LSTM单元，所述解码器模块包括解码LSTM单元，所述与训练预测航班客座率的第一模型的相关的信息包括批大小、学习、训练轮数和防止过拟合策略；所述超参指第一临近时段长短期记忆网络LSTM单元和第一遥远时段 LSTM单元隐藏层状态数，第二临近时段LSTM单元和第二遥远时段LSTM单元隐藏层状态数，解码LSTM单元隐藏层状态数，以及临近时段和遥远时段的时间窗口长度；

根据所述有效训练集，基于预测航班客座率的第一模型进行客座率预测，并将所述第一模型的输出结果与所述有效训练集中的航班客座率数据进行比较，确定所述第一模型中的最优参数值，生成预测航班客座率的第二模型，其中，所述第一模型中的最优参数是指第一临近时段长短期记忆网络LSTM单元、第一遥远时段LSTM单元、第二临近时段LSTM单元和第二遥远时段LSTM单元中需要学习的参数的最优值；

根据所述有效验证集，为所述预测航班客座率的第二模型中的超参赋值后进行客座率预测，并将所述第二模型的输出结果与所述有效验证集中的目标航班在预测时间段的航班客座率数据进行比较，将比较结果最接近时的超参值作为所述第二模型中的超参的最优值，生成预测航班客座率的最优模型。

进一步地，所述对所述初始样本集中具有离散特征和连续特征的数据进行预处理，生成有效样本集包括：

对于初始样本集中ID离散属性的数据采用one-hot编码方式进行编码，并将编码后的结果输入至全连接神经网络层将高维向量映射为低维向量，所述低维向量为第一数据，其中，所述ID离散属性的数据包括航空公司，机型；

对于初始样本集中一般离散属性的数据采用one-hot编码方式进行编码，所述编码后的结果为第二数据，其中，所述一般离散属性的数据包括是否工作日，是否节假晶，是否节假日前，是否节假日后；

对于初始样本集中具有连续属性的数据采用Min-Max归一化方法归一到[0,1]之间，所述归一后的数据为第三数据，其中，所述具有连续属性的数据包括航班起飞时刻，机舱座位数，所述归一化的计算公式为：

x′＝(x-min x)/(max x-min x)

式中，x代表具有连续属性的原数据，x′代表经过归一化处理后新的数据，min x、max x分别代表归一化处理前具有连续属性的原数据的最小值和最大值；

将所述第一数据、第二数据、第三数据按照初始样本集中的顺序进行排列，生成有效样本集。

进一步地，根据所述有效训练集，基于预测航班客座率的第一模型进行客座率预测，并将所述第一模型的输出结果与所述有效训练集中的航班客座率数据进行比较，确定所述第一模型的最优参数，生成预测航班客座率的第二模型包括：

对于临近时段编码器模块：

给定临近时段输入序列X^near＝(x^near,1,x^near,2,…,x^near,T)，

将x^near ^,t作为第一临近时段LSTM单元在目标航班第t个起飞时刻航班的输入，其中，所述l_n为临时时段的时间窗口长度，T为目标航班在所述航线上的所有起飞时刻的数目；

采用

更新第一临近时段LSTM单元在第t个起飞时刻的隐藏层状态值，其中f_eb代表第一临近时段LSTM单元的更新函数，通过所述第一临近时段LSTM单元计算得到每个起飞时刻下的隐藏层状态值

其中，n为第一临近时段 LSTM单元的隐藏层状态数；

采用起飞时刻注意力机制，基于所述第一临近时段LSTM单元在第 t个起飞时刻下的隐藏层状态值

以及所述第二临近时段LSTM单元在临近时段历史第k－1个起飞日的隐藏层状态值

及记忆单元状态值

计算在起飞日第k天时，第t个起飞时刻的航班客座率时间序列对目标航班当天客座率影响程度的注意力权重

其计算公式为：

式中，待学习的参数是V_e,

m为第二临近时段LSTM单元的隐藏层状态数，所述起飞时刻注意力机制是前馈神经网络；

采用softmax函数对

进行归一化，使注意力权重

之和为1；

基于目标航班在起飞日第k天的每个起飞时刻下的隐藏层状态值 h^near和注意力权重

计算起飞日第k天的输出向量

其计算公式为：

采用

更新第二临近时段LSTM单元在第k个起飞日的隐藏层状态值，f_ea代表第二临近时段LSTM单元的更新函数，通过所述第二临近时段LSTM单元计算得到临近时段每个起飞日的隐藏层状态值

其中，m为第二临近时段LSTM 单元的隐藏层状态数；

采用起飞日注意力机制，基于所述第二临近时段LSTM单元在临近时段历史第k个起飞日的隐藏层状态值

及解码器中的解码LSTM单元在第d－1个预测日的隐藏层状态值g_d-1及记忆单元状态值s′_d-1计算在第d个预测日对应的临近时段编码器模块在历史第k个起飞日的隐藏层状态值的注意力权重

其计算公式为：

式中，待学习的参数是V_a,

p 为解码LSTM单元隐藏层状态数，所述起飞日注意力机制是前馈神经网络；

采用softmax函数对

进行归一化，使注意力权重

之和为1；

基于目标航班在临近时段的每个起飞日的隐藏层状态值q^near和注意力权重

计算目标航班的第d个预测日，在所述临近时段编码器模块经过起飞日注意力机制后输出的上下文向量

其计算公式为：

对于遥远时段编码器模块：

给定临近时段输入序列X^distant＝(x^distant,1,x^distant,2,…,x^distant,T)，

将x^distant,t作为第一遥远时段LSTM单元在目标航班第t个起飞时刻航班的输入，其中，所述l_d为遥远时段的时间窗口长度，T为目标航班在所述航线上的所有起飞时刻的数目；

采用

更新第一遥远时段LSTM单元在第t个起飞时刻的隐藏层状态值，其中f_eb′代表第一遥远时段LSTM单元的更新函数，通过所述第一遥远时段LSTM单元计算得到每个起飞时刻下的隐藏层状态值

其中，n为第一遥远时段LSTM单元的隐藏层状态数；

采用起飞时刻注意力机制，基于所述第一遥远时段LSTM单元在第 t个起飞时刻下的隐藏层状态值

以及所述第二遥远时段LSTM单元在遥远时段历史第k－1个起飞日的隐藏层状态值

及记忆单元状态值

其计算公式为：

式中，m为第二遥远时段LSTM单元的隐藏层状态数，待学习的参数是V’_e,

所述起飞时刻注意力机制是前馈神经网络；

采用softmax函数对

进行归一化，使注意力权重

之和为1；

基于目标航班在起飞日第k天的每个起飞时刻下的隐藏层状态值 h^distant和注意力权重

计算起飞日第k天的输出向量

其计算公式为：

采用

更新第二遥远时段LSTM单元在第k个起飞日的隐藏层状态值，f_ea’代表第二遥远时段LSTM单元的更新函数，通过所述第二遥远时段LSTM单元计算得到遥远时段每个起飞日的隐藏层状态值

其中，m为第二遥远时段LSTM单元的隐藏层状态数；

采用起飞日注意力机制，基于所述第二遥远时段LSTM单元在遥远时段历史第k个起飞日的隐藏层状态值

及解码器中的解码LSTM单元在第d－1个预测日的隐藏层状态值g_d-1及记忆单元状态值s′_d-1计算在第d 个预测日对应的遥远时段编码器模块在历史第k个起飞日的隐藏层状态值的注意力权重

其计算公式为：

式中，待确定的参数是V′_a,

p为解码LSTM单元隐藏层状态数，所述起飞日注意力机制是前馈神经网络；

采用softmax函数对

进行归一化，使注意力权重

之和为1；

基于目标航班在遥远时段的每个起飞日的隐藏层状态值q^distant和注意力权重

计算目标航班的第d个预测日，在所述遥远时段编码器模块经过起飞日注意力机制后输出的上下文向量

其计算公式为：

对于外部因素融合模块:

将有效训练集中预测时间段的外部因素数据进行连接后作为所述模块的输出，记为

其中d为解码器模块预测时间段的第d个起飞日，i为解码器模块预测时间段的第i个起飞时刻,N_e为外部因素个数；

对于解码器模块:

经过临近时段编码器模块及遥远时段编码器模块的起飞日注意力机制分别计算得到对于未来第d天的加权求和的上下文向量

之后，在解码器模块中，将所述两个上下文向量

与外部因素融合模块的输出

以及解码器模块上一时刻的输出

相结合来更新解码器隐藏层状态，公式如下：

式中，f_d表示解码器中使用的解码LSTM单元更新函数；

将上下文向量

与隐藏状态g_d进行向量拼接，确定进行最终预测的新隐藏层状态，公式如下：

式中，矩阵

及向量

将拼接向量

维度映射到解码器模块隐藏层的维度；

使用线性变换

来生成最终输出结果；

将解码器模块最终输出结果与所述有效训练集中预测时间段中对应的航班客座率数据进行比较，将比较结果最接近时的需要学习的参数的值作为所述第一模型中的最优参数值，并根据确定的所述第一模型的最优参数值，生成预测航班客座率的第二模型。

进一步地，所述根据预测所述航线上航班客座率的最优模型的输出结果对所述目标航班在所述航线上未来τ天的航行进行调整包括：

当目标航班未来τ天内的起飞时刻的客座率高于设定的第一阈值时，增加所述起飞时刻航班的飞行次数；

当目标航班未来τ天内的起飞时刻的客座率高于设定的第二阈值时，增加所述起飞时刻航班的售票价格，其中，所述第二阈值小于第一阈值；

当目标航班未来τ天内的起飞时刻的客座率低于设定的第三阈值时，降低所述起飞时刻航班的售票价格以提高航班客座率，其中，所述第三阈值少于第二阈值。

根据本发明的另一方面，本发明提供一种基于多粒度时间注意力机制确定航班客座率的系统,所述系统包括：

数据采集单元，其用于采集一个航线在某一个时间周期内所有起飞时刻的历史航班客座率数据，生成初始样本集；

数据处理单元，其用于对所述历史航班客座率数据中具有离散属性和连续属性的数据进行预处理，生成有效样本集；

预测结果单元，其用于基于预先确定的预测所述航线航班客座率的最优模型，以所述有效样本集中目标航班的数据为输入向量，对所述航线上的目标航班未来τ天的客座率进行预测；

航班调整单元，其用于根据预测所述航线上航班客座率的最优模型的输出结果对所述目标航班在所述航线上未来τ天的航行进行调整。

进一步地，所述方法还包括模型建立单元，其用于建立预测所述航线航班客座率的最优模型，所述模型建立单元包括：

数据处理单元，其用于对所述初始样本集中具有离散属性和连续属性的数据进行预处理，生成有效样本集；

样本划分单元，其用于按照预先设置的比例，将有效样本集划分为非重叠的有效训练集和有效验证集；

第一模型单元，其用于建立预测航班客座率的第一模型，并设置与训练预测航班客座率的第一模型的相关的信息和预测航班客座率的第一模型中的超参的初始值，其中，所述第一模型包括2个编码器模块，1个解码器模块和1个外部因素融合模块，所述2个编码器模块分别是临近时段编码器模块和遥远时段编码器模块，其用于对输入向量进行编码，所述临近时段编码器模块的输入向量是临近时段所述航线上目标航班所有起飞时刻的航班客座率时间序列，所述遥远时段编码器模块的输入向量是遥远时段所述航线上目标航班所有起飞时刻的航班客座率时间序列，所述临近时段是指与需要预测的目标航班在预测时段内的每一天相邻的时间段，所述遥远时段是指与需要预测的目标航班在预测时段内的每一天相隔一定天数的时间段，外部因素融合模块用于确定除所述航线起飞时间以外的外部因素对所述航线上的航班的影响，其输入向量为有效训练集中目标航班在预测时间内的除所述航线起飞时间以外的外部因素的数据，解码器模块用于输出所述航线上目标航班客座率预测结果；临近时段编码器模块包括第一临近时段长短期记忆网络LSTM单元和第二临近时段LSTM单元，所述遥远时段编码器模块包括第一遥远时段LSTM单元和第二遥远时段LSTM单元，所述解码器模块包括解码LSTM单元，所述与训练预测航班客座率的第一模型的相关的信息包括批大小、学习、训练轮数和防止过拟合策略；所述超参指第一临近时段长短期记忆网络LSTM单元和第一遥远时段LSTM单元隐藏层状态数，第二临近时段LSTM单元和第二遥远时段LSTM单元隐藏层状态数，解码LSTM单元隐藏层状态数，以及临近时段和遥远时段的时间窗口长度；

模型训练单元，其用于根据所述有效训练集，基于预测航班客座率的第一模型进行客座率预测，并将所述第一模型的输出结果与所述有效训练集中的航班客座率数据进行比较，确定所述第一模型中的最优参数值，生成预测航班客座率的第二模型，其中，所述第一模型中的最优参数是指第一临近时段长短期记忆网络LSTM单元、第一遥远时段LSTM单元、第二临近时段LSTM单元和第二遥远时段LSTM单元中需要学习的参数的最优值；

最优模型单元，其用于根据所述有效验证集，为所述预测航班客座率的第二模型中的超参赋值后进行客座率预测，并将所述第二模型的输出结果与所述有效验证集中的目标航班在预测时间段的航班客座率数据进行比较，将比较结果最接近时的超参值作为所述第二模型中的超参的最优值，生成预测航班客座率的最优模型。

进一步地，所述数据处理单元对所述初始样本集中具有离散特征和连续特征的数据进行预处理，生成有效样本集包括：

x′＝(x-min x)/(max x-min x)

式中，x代表具有连续属性的原数据，x′代表经过归一化处理后新的数据，minx、maxx分别代表归一化处理前具有连续属性的原数据的最小值和最大值；

进一步地，所述模型训练单元根据所述有效训练集，基于预测航班客座率的第一模型进行客座率预测，并将所述第一模型的输出结果与所述有效训练集中的航班客座率数据进行比较，确定所述第一模型的最优参数，生成预测航班客座率的第二模型包括：

对于临近时段编码器模块：

给定临近时段输入序列X^near＝(x^near,1,x^near,2,…,x^near,T)，

采用

其中，n为第一临近时段 LSTM单元的隐藏层状态数；

及记忆单元状态值

其计算公式为：

式中，待学习的参数是V_e,

采用softmax函数对

进行归一化，使注意力权重

之和为1；

计算起飞日第k天的输出向量

其计算公式为：

采用

其中，m为第二临近时段LSTM 单元的隐藏层状态数；

及解码器中的解码LSTM单元在第d－1个预测日的隐藏层状态值g_d-1及记忆单元状态值s^′ _d-1计算在第d个预测日对应的临近时段编码器模块在历史第k个起飞日的隐藏层状态值的注意力权重

其计算公式为：

式中，待学习的参数是V_a,

采用softmax函数对

进行归一化，使注意力权重

之和为1；

其计算公式为：

对于遥远时段编码器模块：

采用

其中，n为第一遥远时段LSTM单元的隐藏层状态数；

及记忆单元状态值

其计算公式为：

所述起飞时刻注意力机制是前馈神经网络；

采用softmax函数对

进行归一化，使注意力权重

之和为1；

计算起飞日第k天的输出向量

其计算公式为：

采用

其中，m为第二遥远时段LSTM单元的隐藏层状态数；

其计算公式为：

式中，待确定的参数是V′_a,

采用softmax函数对

进行归一化，使注意力权重

之和为1；

其计算公式为：

对于外部因素融合模块:

对于解码器模块:

之后，在解码器模块中，将所述两个上下文向量

与外部因素融合模块的输出

以及解码器模块上一时刻的输出

相结合来更新解码器隐藏层状态，公式如下：

式中，f_d表示解码器中使用的解码LSTM单元更新函数；

将上下文向量

式中，矩阵

及向量

将拼接向量

维度映射到解码器模块隐藏层的维度；

使用线性变换

来生成最终输出结果；

进一步地，所述航班调整单元根据预测所述航线上航班客座率的最优模型的输出结果对所述目标航班在所述航线上未来τ天的航行进行调整包括：

本发明技术方案提供的基于多粒度时间注意力机制确定航班客座率的方法和系统基于采集历史的航班客座率数据，通过对建立的预测航班客座率模型进行训练并验证生成预测航班客座率的最优模型，再基于所述最优模型，根据所述航线历史航班客座率数据预测目标航班在未来一段时间的客座率，从而通过所述模型的输出结果对目标航班的航行进行调整。所述方法和系统与现有技术相比，建立的模型除考虑航班自身每日客座率变化外，还考虑到目标航班客座率受其所在航线中其他邻近起飞时刻的航班客座率影响，存在起飞时刻相关性，即同一航线上起飞时刻越相近的航班对应的客座率相差更小；在时间粒度上，航班客座率不仅存在起飞时刻相关性，还存在起飞日相关性，即航班自身的客座率数据在起飞日的时间维度上呈现出时间依赖关系，如航班在预测时间区间的客座率与该航班前一周同一星期的客座率具有的周周期性、与该航班过去同一时间区间的客座率具有的周期性；同样，航班自身属性及节假日、航班所在航线是否开设高铁等其他因素也会影响航班客座率，因此，本发明的预测模型通过历史数据预测未来时间段的航班客座率准确率更高，从而能够更好地帮助民航市场从业者提前感知市场需求进而及时采取对应决策，同时为解决铁路、公路等其他交通领域的时间序列预测问题提供了新的解决思路。

附图说明

通过参考下面的附图，可以更为完整地理解本发明的示例性实施方式：

图1为根据本发明优选实施方式的基于多粒度时间注意力机制确定航班客座率的方法的流程图；

图2为根据本发明优选实施方式的预测航线航班客座率的模型的结构示意图；

图3为根据本发明优选实施方式的基于多粒度时间注意力机制确定航班客座率的系统的结构示意图。

具体实施方式

现在参考附图介绍本发明的示例性实施方式，然而，本发明可以用许多不同的形式来实施，并且不局限于此处描述的实施例，提供这些实施例是为了详尽地且完全地公开本发明，并且向所属技术领域的技术人员充分传达本发明的范围。对于表示在附图中的示例性实施方式中的术语并不是对本发明的限定。在附图中，相同的单元/元件使用相同的附图标记。

除非另有说明，此处使用的术语(包括科技术语)对所属技术领域的技术人员具有通常的理解含义。另外，可以理解的是，以通常使用的词典限定的术语，应当被理解为与其相关领域的语境具有一致的含义，而不应该被理解为理想化的或过于正式的意义。

图1为根据本发明优选实施方式的基于多粒度时间注意力机制确定航班客座率的方法的流程图。如图1所示，本优选实施方式所述的基于多粒度时间注意力机制确定航班客座率的方法100从步骤101开始。

在步骤101，建立预测所述航线航班客座率的最优模型。

在步骤102，采集一个航线在某一个时间周期内所有起飞时刻的历史航班客座率数据，生成初始样本集。

在步骤103，对所述历史航班客座率数据中具有离散属性和连续属性的数据进行预处理，生成有效样本集。

在步骤104，基于预先确定的预测所述航线航班客座率的最优模型，以所述有效样本集中目标航班的数据为输入向量，对所述航线上的目标航班未来τ天的客座率进行预测。

在步骤105，根据预测所述航线上航班客座率的最优模型的输出结果对所述目标航班在所述航线上未来τ天的航行进行调整。

优选地，所述方法在采集一个航线在某一个时间周期内所有起飞时刻的历史航班客座率数据之前还包括建立预测所述航线航班客座率的最优模型，其中：

设置与训练预测航班客座率的第一模型的相关的信息和预测航班客座率的第一模型中的超参的初始值。

图2为根据本发明优选实施方式的预测航线航班客座率的模型的结构示意图。如图2所示，本优选实施方式中的预测航线航班客座率的模型200 包括2个编码器模块201和202，1个解码器模块203和1个外部因素融合模块204，所述2个编码器模块分别是临近时段编码器模块201和遥远时段编码器模块202，其用于对输入向量进行编码，所述临近时段编码器模块201的输入向量是临近时段所述航线上目标航班所有起飞时刻的航班客座率时间序列，所述遥远时段编码器模块202的输入向量是遥远时段所述航线上目标航班所有起飞时刻的航班客座率时间序列，所述临近时段是指与需要预测的目标航班在预测时段内的每一天相邻的时间段，所述遥远时段是指与需要预测的目标航班在预测时段内的每一天相隔一定天数的时间段，外部因素融合模块204用于确定除所述航线起飞时间以外的外部因素对所述航线上的航班的影响，其输入向量为有效训练集中目标航班在预测时间内的除所述航线起飞时间以外的外部因素的数据，解码器模块203用于输出所述航线上目标航班客座率预测结果；临近时段编码器模块201包括第一临近时段长短期记忆网络LSTM单元211和第二临近时段LSTM单元 212，所述遥远时段编码器模202块包括第一遥远时段LSTM单元221和第二遥远时段LSTM单元222，所述解码器模块203包括解码LSTM单元231，所述与训练预测航班客座率的第一模型的相关的信息包括批大小、学习、训练轮数和防止过拟合策略；所述超参指第一临近时段长短期记忆网络 LSTM单元和第一遥远时段LSTM单元隐藏层状态数，第二临近时段LSTM单元和第二遥远时段LSTM单元隐藏层状态数，解码LSTM单元隐藏层状态数，以及临近时段和遥远时段的时间窗口长度。所述外部因素模块204的数据输入单元241进行的外部因素数据，然后再通过连接层242将所有的外部因素数据进行连接后作为输出传输至解码器模块203的连接层232，而解码器模块203则通过连接层232将临近时段编码器模块201和遥远时段编码器模块202的输出，以及外部因素模块204的输出进行连接后，传输至解码LSTM单元进行预测结果的输出。

优选地，所述对所述初始样本集中具有离散特征和连续特征的数据进行预处理，生成有效样本集包括：

x′＝(x-min x)/(max x-min x)

优选地，根据所述有效训练集，基于预测航班客座率的第一模型进行客座率预测，并将所述第一模型的输出结果与所述有效训练集中的航班客座率数据进行比较，确定所述第一模型的最优参数，生成预测航班客座率的第二模型包括：

对于临近时段编码器模块：

给定临近时段输入序列X^near＝(x^near,1,x^near,2,…,x^near,T)，

采用

其中，n为第一临近时段 LSTM单元的隐藏层状态数；

及记忆单元状态值

其计算公式为：

式中，待学习的参数是V_e,

采用softmax函数对

进行归一化，使注意力权重

之和为1；

计算起飞日第k天的输出向量

其计算公式为：

采用

其中，m为第二临近时段LSTM 单元的隐藏层状态数；

其计算公式为：

式中，待学习的参数是V_a,

采用softmax函数对

进行归一化，使注意力权重

之和为1；

其计算公式为：

对于遥远时段编码器模块：

采用

其中，n为第一遥远时段LSTM单元的隐藏层状态数；

及记忆单元状态值

其计算公式为：

所述起飞时刻注意力机制是前馈神经网络；

采用softmax函数对

进行归一化，使注意力权重

之和为1；基于目标航班在起飞日第k天的每个起飞时刻下的隐藏层状态值 h^distant和注意力权重

计算起飞日第k天的输出向量

其计算公式为：

采用

其中，m为第二遥远时段LSTM单元的隐藏层状态数；

其计算公式为：

式中，待确定的参数是V′_a,

采用softmax函数对

进行归一化，使注意力权重

之和为1；

其计算公式为：

对于外部因素融合模块:

对于解码器模块:

之后，在解码器模块中，将所述两个上下文向量

与外部因素融合模块的输出

以及解码器模块上一时刻的输出

相结合来更新解码器隐藏层状态，公式如下：

式中，f_d表示解码器中使用的解码LSTM单元更新函数；

将上下文向量

式中，矩阵

及向量

将拼接向量

维度映射到解码器模块隐藏层的维度；

使用线性变换

来生成最终输出结果；

优选地，所述根据预测所述航线上航班客座率的最优模型的输出结果对所述目标航班在所述航线上未来τ天的航行进行调整包括：

本优选实施方式中，以真实的历史航班客座率数据集为例，其中选取“北京首都-上海虹桥”航线中在两年内起飞日达584天以上的航班数据作为实验数据集，若设置临近时段及遥远时段的时间窗口长度分别为l_n＝ 28、l_d＝19、预测天数τ＝7，则统计信息如表1所示。

表1数据集统计信息

步骤S1、基于采集的数据集构造初始样本集。

假定h代表需要预测的目标航班未来τ天中的第一天，则预测时段为 [h,h+τ-1]，该航线上所有起飞时刻航班的历史客座率数据临近时段为 [h-l_n,h-1]、遥远时段为[h-365-(l_d-τ)/2,h-366+ (l_d-τ)/2+τ]，依据以上时段划分构造单个数据样本，按照每天一次滑动构建新的预测时段，依据上述操作，每一个航班可以构建353个样本，则总样本数为27×353＝9531。

步骤S2、对实验涉及的数据进行数据预处理，生成有效样本集，并划分非重叠的训练集和验证集。

由于航班客座率的取值范围为[0,1]，所以无需对其进行归一化处理；对于外部输入数据，本发明采用独热编码(One-Hot)的方式分别对起飞日期星期属性、是否工作日、是否节假日、是否节假日前、是否节假日后、目标航班起飞时选用的机型、航班所属航空公司这些离散特征进行编码；对于起落地GDP、起飞时刻(提取小时及分钟)、各舱座位数这些连续特征本发明采用Min-Max归一化方法归一到[0,1]之间，具体公式为：

x′＝(x-min x)/(max x-min x)

其中x代表原数据，x′代表经过归一化处理后新的数据表示，min x、max x 分别代表归一化处理前原数据的最小值和最大值。

本发明按照时间顺序将数据集划分为非重叠的训练集和验证集，划分比例为4:1，即在该实验数据集中选取27个航班预测时段为 2011/01/07-2011/10/20的经济舱客座率数据作为训练集，预测时段为 2011/10/21-2011/12/31的数据作为验证集。

步骤S3、训练预测航班客座率的模型，学习该数据集下模型最优参数，并确定最优超参后生成最优模型。

模型训练阶段，批大小(Batch Size)设为256，学习率为0.001，训练轮数为500，采用早停策略防止过拟合。本发明提出的模型中共有5个需要调节的超参，它们分别是临近时间依赖及遥远时间依赖的时间窗口长度 l_n、l_d，两部分编码器(Near Encoder及DistantEncoder)中下方LSTM单元的隐藏层状态数n及上方LSTM单元隐藏层状态数m，解码器隐藏层状态数p。在确定模型的最优参数后，为了确定l_n和l_d的取值，本发明在这两个参数的取值上做网格搜索l_n∈{7,14,28,42,56}，l_d∈{11,15,19,23,27}。本发明选取在验证集上达到最佳预测效果的超参组合(l_n＝28，l_d＝19,23) 用于测试。为了简单起见，本发明在两部分编码器及编解码器中所有的LSTM 单元中使用相同的隐藏层维度并在该参数上进行网格搜索n＝m＝p∈ {32,64,128,256}，选取在验证集上取得最佳预测效果的隐藏层维度(n＝ m＝p＝64)用于模型评估。另外，本发明采用堆叠LSTMs(层数f＝2)作为编解码器的单元来提高模型性能。

步骤S4、基于确定的最优模型，根据采集的航线的历史航班客座率数据进行未来时间段航班客座率的预测。

为了验证本优选实施方式所述的最优模型预测航班客座率的准确度，本发明将最优模型在验证集上进行模型预测性能评估，与其他基准方法进行对比。本优选实施方式采用平均绝对误差(MAE)和均方根误差(RMSE)作为模型预测效果的评价指标。本发明提出的模型与其他基准方法预测结果进行对比，准确度明显高于其他方法。

图3为根据本发明优选实施方式的基于多粒度时间注意力机制确定航班客座率的系统的结构示意图。如图3所示，本优选实施方式所述的基于多粒度时间注意力机制确定航班客座率的系统300包括：

模型建立单元301，其用于建立预测所述航线航班客座率的最优模型。

数据采集单元302，其用于采集一个航线在某一个时间周期内所有起飞时刻的历史航班客座率数据，生成初始样本集；

数据处理单元303，其用于对所述历史航班客座率数据中具有离散属性和连续属性的数据进行预处理，生成有效样本集；

预测结果单元304，其用于基于预先确定的预测所述航线航班客座率的最优模型，以所述有效样本集中目标航班的数据为输入向量，对所述航线上的目标航班未来τ天的客座率进行预测；

航班调整单元305，其用于根据预测所述航线上航班客座率的最优模型的输出结果对所述目标航班在所述航线上未来τ天的航行进行调整。

优选地，所述模型建立单元301包括：

数据采集单元311，其用于采集一个航线在某一个时间周期内所有起飞时刻的历史航班客座率数据，生成初始样本集；

数据处理单元312，其用于对所述初始样本集中具有离散属性和连续属性的数据进行预处理，生成有效样本集；

样本划分单元313，其用于按照预先设置的比例，将有效样本集划分为非重叠的有效训练集和有效验证集；

第一模型单元314，其用于建立预测航班客座率的第一模型，并设置与训练预测航班客座率的第一模型的相关的信息和预测航班客座率的第一模型中的超参的初始值，其中，所述第一模型包括2个编码器模块，1个解码器模块和1个外部因素融合模块，所述2个编码器模块分别是临近时段编码器模块和遥远时段编码器模块，其用于对输入向量进行编码，所述临近时段编码器模块的输入向量是临近时段所述航线上目标航班所有起飞时刻的航班客座率时间序列，所述遥远时段编码器模块的输入向量是遥远时段所述航线上目标航班所有起飞时刻的航班客座率时间序列，所述临近时段是指与需要预测的目标航班在预测时段内的每一天相邻的时间段，所述遥远时段是指与需要预测的目标航班在预测时段内的每一天相隔一定天数的时间段，外部因素融合模块用于确定除所述航线起飞时间以外的外部因素对所述航线上的航班的影响，其输入向量为有效训练集中目标航班在预测时间内的除所述航线起飞时间以外的外部因素的数据，解码器模块用于输出所述航线上目标航班客座率预测结果；临近时段编码器模块包括第一临近时段长短期记忆网络LSTM单元和第二临近时段LSTM单元，所述遥远时段编码器模块包括第一遥远时段LSTM单元和第二遥远时段LSTM单元，所述解码器模块包括解码LSTM单元，所述与训练预测航班客座率的第一模型的相关的信息包括批大小、学习、训练轮数和防止过拟合策略；所述超参指第一临近时段长短期记忆网络LSTM单元和第一遥远时段LSTM单元隐藏层状态数，第二临近时段LSTM单元和第二遥远时段LSTM单元隐藏层状态数，解码LSTM单元隐藏层状态数，以及临近时段和遥远时段的时间窗口长度；

模型训练单元315，其用于根据所述有效训练集，基于预测航班客座率的第一模型进行客座率预测，并将所述第一模型的输出结果与所述有效训练集中的航班客座率数据进行比较，确定所述第一模型中的最优参数值，生成预测航班客座率的第二模型，其中，所述第一模型中的最优参数是指第一临近时段长短期记忆网络LSTM单元、第一遥远时段LSTM单元、第二临近时段LSTM单元和第二遥远时段LSTM单元中需要学习的参数的最优值；

最优模型单元316，其用于根据所述有效验证集，为所述预测航班客座率的第二模型中的超参赋值后进行客座率预测，并将所述第二模型的输出结果与所述有效验证集中的目标航班在预测时间段的航班客座率数据进行比较，将比较结果最接近时的超参值作为所述第二模型中的超参的最优值，生成预测航班客座率的最优模型。

优选地，所述数据处理单元303对所述初始样本集中具有离散特征和连续特征的数据进行预处理，生成有效样本集包括：

x′＝(x-min x)/(max x-min x)

优选地，所述模型训练单元315根据所述有效训练集，基于预测航班客座率的第一模型进行客座率预测，并将所述第一模型的输出结果与所述有效训练集中的航班客座率数据进行比较，确定所述第一模型的最优参数，生成预测航班客座率的第二模型包括：

对于临近时段编码器模块：

给定临近时段输入序列X^near＝(x^near,1,x^near,2,…,x^near,T)，

采用

其中，n为第一临近时段LSTM单元的隐藏层状态数；

及记忆单元状态值

其计算公式为：

式中，待学习的参数是V_e,

采用softmax函数对

进行归一化，使注意力权重

之和为1；

计算起飞日第k天的输出向量

其计算公式为：

采用

其中，m为第二临近时段LSTM 单元的隐藏层状态数；

其计算公式为：

式中，待学习的参数是V_a,

采用softmax函数对

进行归一化，使注意力权重

之和为1；

其计算公式为：

对于遥远时段编码器模块：

采用

其中，n为第一遥远时段LSTM单元的隐藏层状态数；

及记忆单元状态值

其计算公式为：

所述起飞时刻注意力机制是前馈神经网络；

采用softmax函数对

进行归一化，使注意力权重

计算起飞日第k天的输出向量

其计算公式为：

采用

其中，m为第二遥远时段LSTM单元的隐藏层状态数；

其计算公式为：

式中，待确定的参数是V′_a,

采用softmax函数对

进行归一化，使注意力权重

之和为1；

其计算公式为：

对于外部因素融合模块:

对于解码器模块:

之后，在解码器模块中，将所述两个上下文向量

与外部因素融合模块的输出

以及解码器模块上一时刻的输出

相结合来更新解码器隐藏层状态，公式如下：

式中，f_d表示解码器中使用的解码LSTM单元更新函数；

将上下文向量

式中，矩阵

及向量

将拼接向量

维度映射到解码器模块隐藏层的维度；

使用线性变换

来生成最终输出结果；

优选地，所述航班调整单元305根据预测所述航线上航班客座率的最优模型的输出结果对所述目标航班在所述航线上未来τ天的航行进行调整包括：

本发明所述基于多粒度时间注意力机制确定航班客座率的系统对目标航班未来时间段的客座率进行预测并调整的步骤与本发明所述基于多粒度时间注意力机制确定航班客座率的方法采取的步骤相同，并且达到的技术效果也相同，此处不再赘述。

已经通过参考少量实施方式描述了本发明。然而，本领域技术人员所公知的，正如附带的专利权利要求所限定的，除了本发明以上公开的其他的实施例等同地落在本发明的范围内。

通常地，在权利要求中使用的所有术语都根据他们在技术领域的通常含义被解释，除非在其中被另外明确地定义。所有的参考“一个/所述/该 [装置、组件等]”都被开放地解释为所述装置、组件等中的至少一个实例，除非另外明确地说明。这里公开的任何方法的步骤都没必要以公开的准确的顺序运行，除非明确地说明。

本领域内的技术人员应明白，本申请的实施例可提供为方法、系统、或计算机程序产品。因此，本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

最后应当说明的是：以上实施例仅用以说明本发明的技术方案而非对其限制，尽管参照上述实施例对本发明进行了详细的说明，所属领域的普通技术人员应当理解：依然可以对本发明的具体实施方式进行修改或者等同替换，而未脱离本发明精神和范围的任何修改或者等同替换，其均应涵盖在本发明的权利要求保护范围之内。

Claims

1.一种基于多粒度时间注意力机制确定航班客座率的方法,其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述方法在采集一个航线在某一个时间周期内所有起飞时刻的历史航班客座率数据之前还包括建立预测所述航线航班客座率的最优模型，其中：

设置与训练预测航班客座率的第一模型的相关的信息和预测航班客座率的第一模型中的超参的初始值，其中，所述第一模型包括2个编码器模块，1个解码器模块和1个外部因素融合模块，所述2个编码器模块分别是临近时段编码器模块和遥远时段编码器模块，其用于对输入向量进行编码，所述临近时段编码器模块的输入向量是临近时段所述航线上目标航班所有起飞时刻的航班客座率时间序列，所述遥远时段编码器模块的输入向量是遥远时段所述航线上目标航班所有起飞时刻的航班客座率时间序列，所述临近时段是指与需要预测的目标航班在预测时段内的每一天相邻的时间段，所述遥远时段是指与需要预测的目标航班在预测时段内的每一天相隔一定天数的时间段，外部因素融合模块用于确定除所述航线起飞时间以外的外部因素对所述航线上的航班的影响，其输入向量为有效训练集中目标航班在预测时间内的除所述航线起飞时间以外的外部因素的数据，解码器模块用于输出所述航线上目标航班客座率预测结果；临近时段编码器模块包括第一临近时段长短期记忆网络LSTM单元和第二临近时段LSTM单元，所述遥远时段编码器模块包括第一遥远时段LSTM单元和第二遥远时段LSTM单元，所述解码器模块包括解码LSTM单元，所述与训练预测航班客座率的第一模型的相关的信息包括批大小、学习、训练轮数和防止过拟合策略；所述超参指第一临近时段长短期记忆网络LSTM单元和第一遥远时段LSTM单元隐藏层状态数，第二临近时段LSTM单元和第二遥远时段LSTM单元隐藏层状态数，解码LSTM单元隐藏层状态数，以及临近时段和遥远时段的时间窗口长度；

3.根据权利要求1或者2所述的方法，其特征在于，所述对所述初始样本集中具有离散特征和连续特征的数据进行预处理，生成有效样本集包括：

x′＝(x-min x)/(max x-min x)

4.根据权利要求2所述的方法，其特征在于，根据所述有效训练集，基于预测航班客座率的第一模型进行客座率预测，并将所述第一模型的输出结果与所述有效训练集中的航班客座率数据进行比较，确定所述第一模型的最优参数，生成预测航班客座率的第二模型包括：

对于临近时段编码器模块：

给定临近时段输入序列X^near＝(x^near,1,x^near,2,…,x^near,T)，

将x^near,t作为第一临近时段LSTM单元在目标航班第t个起飞时刻航班的输入，其中，所述l_n为临时时段的时间窗口长度，T为目标航班在所述航线上的所有起飞时刻的数目；

采用

其中，n为第一临近时段LSTM单元的隐藏层状态数；

采用起飞时刻注意力机制，基于所述第一临近时段LSTM单元在第t个起飞时刻下的隐藏层状态值

及记忆单元状态值

其计算公式为：

式中，待学习的参数是V_e,

采用softmax函数对

进行归一化，使注意力权重

之和为1；

基于目标航班在起飞日第k天的每个起飞时刻下的隐藏层状态值h^near和注意力权重

计算起飞日第k天的输出向量

其计算公式为：

采用

其中，m为第二临近时段LSTM单元的隐藏层状态数；

其计算公式为：

式中，待学习的参数是V_a,

采用softmax函数对

进行归一化，使注意力权重

之和为1；

其计算公式为：

对于遥远时段编码器模块：

采用

其中，n为第一遥远时段LSTM单元的隐藏层状态数；

采用起飞时刻注意力机制，基于所述第一遥远时段LSTM单元在第t个起飞时刻下的隐藏层状态值

及记忆单元状态值

其计算公式为：

所述起飞时刻注意力机制是前馈神经网络；

采用softmax函数对

进行归一化，使注意力权重

之和为1；

基于目标航班在起飞日第k天的每个起飞时刻下的隐藏层状态值h^distant和注意力权重

计算起飞日第k天的输出向量

其计算公式为：

采用

其中，m为第二遥远时段LSTM单元的隐藏层状态数；

及解码器中的解码LSTM单元在第d－1个预测日的隐藏层状态值g_d-1及记忆单元状态值s′_d-1计算在第d个预测日对应的遥远时段编码器模块在历史第k个起飞日的隐藏层状态值的注意力权重

其计算公式为：

式中，待确定的参数是V′_a,

采用softmax函数对

进行归一化，使注意力权重

之和为1；

其计算公式为：

对于外部因素融合模块:

对于解码器模块:

之后，在解码器模块中，将所述两个上下文向量

与外部因素融合模块的输出

以及解码器模块上一时刻的输出

相结合来更新解码器隐藏层状态，公式如下：

式中，f_d表示解码器中使用的解码LSTM单元更新函数；

将上下文向量

式中，矩阵

及向量

将拼接向量

维度映射到解码器模块隐藏层的维度；

使用线性变换

来生成最终输出结果；

5.根据权利要求1所述的方法，其特征在于，所述根据预测所述航线上航班客座率的最优模型的输出结果对所述目标航班在所述航线上未来τ天的航行进行调整包括：

6.一种基于多粒度时间注意力机制确定航班客座率的系统,其特征在于，所述系统包括：

7.根据权利要求6所述的系统，其特征在于，所述方法还包括模型建立单元，其用于建立预测所述航线航班客座率的最优模型，所述模型建立单元包括：

8.根据权利要求6或者7所述的系统，其特征在于，所述数据处理单元对所述初始样本集中具有离散特征和连续特征的数据进行预处理，生成有效样本集包括：

x′＝(x-min x)/(max x-min x)

9.根据权利要求7所述的方法，其特征在于，所述模型训练单元根据所述有效训练集，基于预测航班客座率的第一模型进行客座率预测，并将所述第一模型的输出结果与所述有效训练集中的航班客座率数据进行比较，确定所述第一模型的最优参数，生成预测航班客座率的第二模型包括：

对于临近时段编码器模块：

给定临近时段输入序列X^near＝(x^near,1,x^near,2,…,x^near,T)，

采用

其中，n为第一临近时段LSTM单元的隐藏层状态数；

及记忆单元状态值

其计算公式为：

式中，待学习的参数是V_e,

采用softmax函数对

进行归一化，使注意力权重

之和为1；

计算起飞日第k天的输出向量

其计算公式为：

采用

其中，m为第二临近时段LSTM单元的隐藏层状态数；

其计算公式为：

式中，待学习的参数是V_a,

采用softmax函数对

进行归一化，使注意力权重

之和为1；

其计算公式为：

对于遥远时段编码器模块：

采用

其中，n为第一遥远时段LSTM单元的隐藏层状态数；

及记忆单元状态值

其计算公式为：

所述起飞时刻注意力机制是前馈神经网络；

采用softmax函数对

进行归一化，使注意力权重

之和为1；

计算起飞日第k天的输出向量

其计算公式为：

采用

其中，m为第二遥远时段LSTM单元的隐藏层状态数；

其计算公式为：

式中，待确定的参数是V′_a,

采用softmax函数对

进行归一化，使注意力权重

之和为1；

其计算公式为：

对于外部因素融合模块:

对于解码器模块:

之后，在解码器模块中，将所述两个上下文向量

与外部因素融合模块的输出

以及解码器模块上一时刻的输出

相结合来更新解码器隐藏层状态，公式如下：

式中，f_d表示解码器中使用的解码LSTM单元更新函数；

将上下文向量

式中，矩阵

及向量

将拼接向量

维度映射到解码器模块隐藏层的维度；

使用线性变换

来生成最终输出结果；

10.根据权利要求6所述的系统，其特征在于，所述航班调整单元根据预测所述航线上航班客座率的最优模型的输出结果对所述目标航班在所述航线上未来τ天的航行进行调整包括：