CN118095092A - 航班客流量预测方法、装置及系统 - Google Patents
航班客流量预测方法、装置及系统 Download PDFInfo
- Publication number
- CN118095092A CN118095092A CN202410284963.2A CN202410284963A CN118095092A CN 118095092 A CN118095092 A CN 118095092A CN 202410284963 A CN202410284963 A CN 202410284963A CN 118095092 A CN118095092 A CN 118095092A
- Authority
- CN
- China
- Prior art keywords
- passenger flow
- flight
- output
- layer
- embedding
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 51
- 241000283153 Cetacea Species 0.000 claims abstract description 66
- 238000005457 optimization Methods 0.000 claims abstract description 20
- 238000013528 artificial neural network Methods 0.000 claims description 16
- 230000009466 transformation Effects 0.000 claims description 15
- 230000006870 function Effects 0.000 claims description 11
- 238000006243 chemical reaction Methods 0.000 claims description 10
- 238000000354 decomposition reaction Methods 0.000 claims description 9
- 238000007781 pre-processing Methods 0.000 claims description 9
- 238000003860 storage Methods 0.000 claims description 9
- 238000013507 mapping Methods 0.000 claims description 8
- 239000011159 matrix material Substances 0.000 claims description 8
- 238000012549 training Methods 0.000 claims description 8
- 238000010606 normalization Methods 0.000 claims description 7
- 230000003044 adaptive effect Effects 0.000 claims description 3
- 238000010586 diagram Methods 0.000 description 8
- 238000004590 computer program Methods 0.000 description 7
- 238000004458 analytical method Methods 0.000 description 5
- 230000000737 periodic effect Effects 0.000 description 5
- 230000008569 process Effects 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 230000008859 change Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000010006 flight Effects 0.000 description 2
- 238000003062 neural network model Methods 0.000 description 2
- 238000013519 translation Methods 0.000 description 2
- NAWXUBYGYWOOIX-SFHVURJKSA-N (2s)-2-[[4-[2-(2,4-diaminoquinazolin-6-yl)ethyl]benzoyl]amino]-4-methylidenepentanedioic acid Chemical compound C1=CC2=NC(N)=NC(N)=C2C=C1CCC1=CC=C(C(=O)N[C@@H](CC(=C)C(O)=O)C(O)=O)C=C1 NAWXUBYGYWOOIX-SFHVURJKSA-N 0.000 description 1
- 101001095088 Homo sapiens Melanoma antigen preferentially expressed in tumors Proteins 0.000 description 1
- 102100037020 Melanoma antigen preferentially expressed in tumors Human genes 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000008094 contradictory effect Effects 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000012706 support-vector machine Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F30/00—Computer-aided design [CAD]
- G06F30/20—Design optimisation, verification or simulation
- G06F30/27—Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
- G06F18/2431—Multiple classes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
- G06N3/0442—Recurrent networks, e.g. Hopfield networks characterised by memory or gating, e.g. long short-term memory [LSTM] or gated recurrent units [GRU]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2119/00—Details relating to the type or aim of the analysis or the optimisation
- G06F2119/02—Reliability analysis or reliability optimisation; Failure analysis, e.g. worst case scenario performance, failure mode and effects analysis [FMEA]
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02T—CLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
- Y02T10/00—Road transport of goods or passengers
- Y02T10/10—Internal combustion engine [ICE] based vehicles
- Y02T10/40—Engine management systems
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Life Sciences & Earth Sciences (AREA)
- Software Systems (AREA)
- Computing Systems (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Mathematical Physics (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Health & Medical Sciences (AREA)
- Evolutionary Biology (AREA)
- Medical Informatics (AREA)
- Computer Hardware Design (AREA)
- Geometry (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种航班客流量预测方法、装置及系统,包括获取实时的航班客流量时间序列数据;将所述实时的航班客流量时间序列数据输入至预先训练好的基于Transformer的航班客流量预测模型,得到航班客流量预测值;其中,所述基于Transformer的航班客流量预测模型通过利用改进鲸鱼优化算法优化Transformer模型的超参数获得。本发明能够解决传统的预测方法对具有周期性、突发性和随机性的航班客流量时间序列数据预测精度不高的问题。
Description
技术领域
本发明属于航班客流量预测领域,具体涉及一种航班客流量预测方法、装置及系统,更具体地涉及一种基于改进鲸鱼优化算法(Improved Whale OptimizationAlgorithm,IWOA)和Transformer模型的航班客流量预测方法、装置及系统。
背景技术
近年来城市化进程迅速推进经济飞速发展,生活质量提高,航空运输凭借舒适、安全快捷等优点,在旅客出行方式的选择中占据的比例也持续增加。然而,旅客对航空运输的需求量在不断增长的同时,旅客对机场的服务与运营要求也越来越高,也带来了民航服务能力不足的问题。
随着互联网、人工智能、云计算、大数据、物联网等热点技术的应用,智慧城市、智慧交通等概念大众都不再陌生,建设智慧机场已经成为民航炙手可热的话题。航空客流量预测是智慧机场系统中重要的组成部分之一,将所收集到的历史航空客流量数据进行全面的分析,并通过科学的技术手段实现动态分析和合理预测,对未来的客流量情况进行判断,按需开放值机柜台和安检口的资源数量,合理配置航站楼内外服务和安保人员,降低因旅客排队或机场服务欠缺所导致的航班延误以及突发事件产生的可能性,这样才能真正地提高出行旅客的满意度和机场的运行效率。
近年来,国内外诸多学者研究航班客流量预测问题。鄢仕林针对中小机场航线客流量构成的时间序列既有总体变化趋势又有周期性波动的特点,构建了GM(1,1)模型对序列的趋势性进行预测,该方法获取灰色模型预测值的残差序列,构建周期外延模型提取残差序列的优势周期,生成灰色周期外延模型组合对周期性波动进行预测,最后基于支持向量机模型对灰色周期外延模型预测值的残差进行修正补偿。任鹏建立了基于小波分析的LSTM网络的短时段值机客流量预测模型,该模型以每小时的客流量为预测单位,运用小波分析技术对时间序列进行变换和重构,对重构后的时间序列使用深度LSTM网络模型进行训练,最后将各个预测值叠加求均值,即得到每小时的客流量预测值。衡红军通过对机场历史数据的统计和分析,结合航班的DOW特性,分析值机客流量的相关影响因素,以每小时的值机客流量为研究对象,构建基于时间序列的动态回归ARIMAX模型。然而,在对航班客流量预测的研究中,一方面现有的研究方法往往都基于某种单一机器学习方法,但是忽略了不同方法之间的结合。另一方面现有模型的参数优化,往往使用网格搜索法,该方法难以得到最优的参数组合。同时现有方法往往没有考虑数据波动变化大时干扰预测结果的情况,且没有充分挖掘航班客流量数据的特征信息,难以形成稳定精确的航班客流量预测模型。
航班客流量数据具有非线性、周期性、突发性及随机性。Transformer模型在时间序列预测时考虑序列的整体信息,更全面地理解时间序列的演变趋势和模式,能够捕捉到序列中的长距离依赖关系。改进鲸鱼优化算法优化神经网络模型的超参数,可以高效地探索复杂的超参数组合,找到性能最佳的模型配置,并且可以克服模型预测过程易陷入局部最优解及收敛速度慢的问题。
发明内容
针对上述问题,本发明提出一种航班客流量预测方法、装置及系统,能够解决传统的预测方法对具有周期性、突发性和随机性的航班客流量时间序列数据预测精度不高的问题。
为了实现上述技术目的,达到上述技术效果,本发明通过以下技术方案实现:
第一方面,本发明提供了一种航班客流量预测方法,包括:
获取实时的航班客流量时间序列数据;
将所述实时的航班客流量时间序列数据输入至预先训练好的基于Transformer的航班客流量预测模型,得到航班客流量预测值;
其中,所述基于Transformer的航班客流量预测模型通过利用改进鲸鱼优化算法优化Transformer模型的超参数获得。
可选地,所述基于Transformer的航班客流量预测模型包括顺次设置的嵌入层、编码器、解码器和输出层,其中:
所述嵌入层用于将离散的客流量时间序列值映射到连续的向量空间中;
所述编码器由N个相同的编码器层堆叠而成,每个编码器层包含两个子层:多头自注意力层和前馈神经网络层,用于将所述嵌入层的输出转换为高维的特征表示;
所述解码器由N个相同的解码器层堆叠而成,每个解码器层包含三个子层:多头自注意力层、编码器-解码器注意力层和前馈神经网络层,用于捕获嵌入层输出的输入序列的嵌入表示和解码器输入序列的依赖关系;
所述输出层用于将解码器的输出通过线性变换映射到输出空间。
可选地,所述嵌入层将输入的航班客流量时间序列数据中的每一个时间步表示为向量X,并进行线性变换,得到输入序列的嵌入表示Xembedding:
Xembedding=X*Wembedding
其中,Wembedding是嵌入矩阵。
可选地,每个编码器层的输出为EOutput:
EOutput=FFN(MHA(Xembedding)+Xembedding)
其中,MHA为多头自注意力层,FFN为前馈神经网络层,Xembedding为嵌入层输出的输入序列的嵌入表示;
每个编码器层的输出为DOutput:
DOutput=FFN(MHA(Xdec_embedding,EOutput)+EOutput)
其中,MHA为多头自注意力层,用于捕获输入序列和解码器输入序列的依赖关系,FFN为前馈神经网络层,Xdec_embedding为解码器输入序列的嵌入表示。
可选地,所述输出层的输出为Y:
Y=DOutput*Woutput
其中,Y为航班客流量预测值,Woutput为输出层的权重矩阵。
可选地,所述利用改进鲸鱼优化算法对Transformer模型的超参数优化的具体方法是:
确定Transformer模型中待优化的超参数为时间窗口和学习率,进行参数初始化,包括迭代次数、鲸鱼数量、学习率和超参数范围;
鲸鱼种群初始化,随机生成指定数量的鲸鱼,每个鲸鱼的位置代表一个超参数组合,根据该超参数组合,以及历史的航班客流量时间序列数据,建立并训练Transformer预测模型;
将均方误差MSE设定为适应度函数,并计算每个鲸鱼的适应度值;
改进鲸鱼算法迭代开始,每次迭代根据算法中的包围猎物、旋转搜索和随机搜寻不断更新鲸鱼的位置,基于该位置更新后的鲸鱼的位置,以及历史的航班客流量时间序列数据,建立并训练Transformer预测模型,更新鲸鱼的适应度值;
改进鲸鱼算法迭代结束后,输出最优鲸鱼个体的位置,将其对应的超参数作为Transformer模型的最佳超参数。
可选地,包围猎物操作如下式所示:
其中,X为当前鲸鱼位置,X*为全局最优位置,t为迭代次数,D为步长,A和C为系数矩阵;
当|A|<1时,根据进行随机搜寻,其中Xrand为随机鲸鱼位置;
当|A|≥1时,根据进行旋转搜索,其中,p为[0,1]之间的随机数,b为改变旋转形状的常数,l为[-1,1]之间的随机数,/>和/>表示自适应权重。
可选地,所述航班客流量预测方法还包括:
对获取到航班客流量时间序列数据进行预处理,所述预处理包括:
对航班客流量数据进行基准转换,将客流量幅值转化为百分比,具体公式如下所示:
其中,Di为基准转换后的客流量百分比值;Xi为第i项客流量数据,Xmax为客流量数据中的最大值;
利用小波变换对进行基准转换后的航班客流量数据进行小波分解,得到若干个子序列:
对小波分解后的子序列进行数据归一化。
第二方面,本发明提供了一种航班客流量预测装置,包括:
获取模块,用于获取实时航班客流量时间序列数据;
预测模块,用于将所述实时航班客流量时间序列数据输入至预先训练好的基于Transformer的航班客流量预测模型,得到航班客流量预测值;
其中,所述基于Transformer的航班客流量预测模型通过利用改进鲸鱼优化算法优化Transformer模型的超参数获得。
第三方面,本发明提供了一种航班客流量预测系统,包括存储介质和处理器;
所述存储介质用于存储指令;
所述处理器用于根据所述指令进行操作以执行根据第一方面中任一项所述的方法。
与现有技术相比,本发明的有益效果:
本发明利用改进鲸鱼优化算法优化神经网络模型的超参数,克服了模型预测过程中易陷入局部最优解、收敛速度慢且不稳定的问题,进一步提高模型鲁棒性和预测精度,还能够提取航班客流量数据的特征变化,最终实现了对航班客流量时间序列数据的高准确率预测和分析,不仅解决了传统的预测方法对具有周期性、突发性和随机性的航班客流量时间序列数据预测精度不高的问题。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图,其中:
图1为本发明一种实施例中航班客流量预测方法的整体流程图;
图2为本发明一种实施例中航班客流量预测方法中的Transformer网络结构图;
图3为本发明一种实施例中航班客流量预测方法中的改进鲸鱼优化算法优化Transformer超参数流程图;
图4为本发明一种实施例中航班客流量预测方法中的预测结果图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本发明的一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
另外,若本发明实施例中有涉及“第一”、“第二”等的描述,则该“第一”、“第二”等的描述仅用于描述目的,而不能理解为指示或暗示其相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。另外,各个实施例之间的技术方案可以相互结合,但是必须是以本领域普通技术人员能够实现为基础,当技术方案的结合出现相互矛盾或无法实现时应当认为这种技术方案的结合不存在,也不在本发明要求的保护范围之内。
实施例1
本发明实施例中提供了一种航班客流量预测方法,包括以下步骤:
(1)获取实时的航班客流量时间序列数据;
(2)将所述实时的航班客流量时间序列数据输入至预先训练好的基于Transformer的航班客流量预测模型,得到航班客流量预测值;
其中,所述基于Transformer的航班客流量预测模型通过利用改进鲸鱼优化算法优化Transformer模型的超参数获得。
在本发明实施例的一种具体实施方式中,所述基于Transformer的航班客流量预测模型包括顺次设置的嵌入层、编码器、解码器和输出层,其中:
所述嵌入层用于将离散的客流量时间序列值映射到连续的向量空间中;
所述编码器由N个相同的编码器层堆叠而成,每个编码器层包含两个子层:多头自注意力层和前馈神经网络层,用于将所述嵌入层的输出转换为高维的特征表示;
所述解码器由N个相同的解码器层堆叠而成,每个解码器层包含三个子层:多头自注意力层、编码器-解码器注意力层和前馈神经网络层,用于捕获嵌入层输出的输入序列的嵌入表示和解码器输入序列的依赖关系;
所述输出层用于将解码器的输出通过线性变换映射到输出空间。
在本发明实施例的一种具体实施方式中,所述嵌入层将输入的航班客流量时间序列数据中的每一个时间步表示为向量X,并进行线性变换,得到输入序列的嵌入表示Xembedding:
Xembedding=X*Wembedding
其中,Wembedding为嵌入矩阵。
每个编码器层的输出为EOutput:
EOutput=FFN(MHA(Xembedding)+Xembedding)
其中,MHA表示多头自注意力层,FFN为前馈神经网络层,Xembedding是嵌入层输出的输入序列的嵌入表示;
每个编码器层的输出为DOutput:
DOutput=FFN(MHA(Xdec_embedding,EOutput)+EOutput)
其中,MHA是多头自注意力层,用于捕获输入序列和解码器输入序列的依赖关系,FFN是前馈神经网络层,Xdec_embedding是解码器输入序列的嵌入表示。
所述输出层的输出为Y:
Y=DOutput*Woutput
其中,Y为航班客流量预测值,Woutput为输出层的权重矩阵。
在本发明实施例的一种具体实施方式中,所述利用改进鲸鱼优化算法对Transformer模型的超参数优化的具体方法是:
确定Transformer模型中待优化的超参数为时间窗口和学习率,进行参数初始化,包括迭代次数、鲸鱼数量、学习率、超参数范围;
鲸鱼种群初始化,随机生成指定数量的鲸鱼,每个鲸鱼的位置代表一个超参数组合,根据该超参数组合,以及历史的航班客流量时间序列数据,建立并训练Transformer预测模型;
将均方误差MSE设定为适应度函数,并计算每个鲸鱼的适应度值;
改进鲸鱼算法迭代开始,每次迭代根据算法中的包围猎物、旋转搜索和随机搜寻不断更新鲸鱼的位置,基于该位置更新后的鲸鱼的位置,以及历史的航班客流量时间序列数据,建立并训练Transformer预测模型,更新鲸鱼的适应度值;
改进鲸鱼算法迭代结束后,输出最优鲸鱼个体的位置,将其对应的超参数作为Transformer模型的最佳超参数。
包围猎物操作如下式所示:
其中,X为当前鲸鱼位置,X*为全局最优位置,t为迭代次数,D为步长,A和C为系数矩阵;
当|A|<1时,根据进行随机搜寻,其中Xrand为随机鲸鱼位置;
当|A|≥1时,根据进行旋转搜索,其中,p为[0,1]之间的随机数,b为改变旋转形状的常数,l为[-1,1]之间的随机数,/>和/>表示自适应权重。
在本发明实施例的一种具体实施方式中,所述航班客流量预测方法还包括:
对获取到航班客流量时间序列数据进行预处理,所述预处理包括:
对航班客流量数据进行基准转换,将客流量幅值转化为百分比,具体公式如下所示:
其中,Xi为第i项客流量数据,Xmax为客流量数据中的最大值,Di为基准转换后的客流量百分比值;
利用小波变换对进行基准转换后的航班客流量数据进行小波分解,得到若干个子序列:
对小波分解后的子序列进行数据归一化。
下面结合一具体实施方式对本发明实施例中的航班客流量预测方法进行详细说明。
本发明实施例中的航班客流量预测方法的流程图如图1所示,包括以下步骤:
步骤1,收集历史的航班客流量时间序列数据;
步骤2,对步骤1所获得的航班客流量时间序列数据进行预处理操作;
步骤3,建立基于Transformer的航班客流量预测模型;
步骤4,结合Transformer模型,利用改进鲸鱼优化算法优化Transformer模型的超参数;
步骤5,利用优化后的Transformer模型,基于获取到的实时的航班客流量时间序列数据进行预测,获得未来航班客流量数据。
其中,步骤2中,对原始航班客流量时间序列数据进行预处理操作,包括基准转换、小波变换和数据归一化;
步骤2.1,对原始的航班客流量数据进行基准转换,将客流量幅值转化为百分比,具体如公式(1)所示:
其中,X(i)为第i项客流量数据,Xmax为客流量数据中的最大值,D(i)为基准转换后的客流量百分比值。
步骤2.2,考虑到航班客流量时间序列数据具有的周期性、突发性等特征,对步骤2.1所得数据利用小波变换进行特征提取,小波变换的基本公式如下:
其中,D(i)是基准转换后的航班客流量百分比时序数据,W(a,b)是尺度参数a和平移参数b下的小波系数,ψa,b(i)是小波函数在尺度参数a和平移参数b下的缩放和平移版本。考虑到航班客流量数据的离散特性,选择Daubechies小波作为小波函数,根据经验分解层数设定为3,小波变换后得到一个近似分量和三个细节分量,其中近似分量代表航班客流量时间序列中的整体变化趋势,细节分量则代表航班客流量序列中的局部特征。
步骤2.3,对小波分解后的子序列进行数据归一化,能够消除不同量纲影响,加快预测模型的收敛速度,提升模型的性能。数据归一化(Min-Max Scaling)公式如下所示:
其中,Dmin是序列中的最小值,Dmax是序列中的最大值,Dnormalized(i)是归一化后的数据。经过数据归一化,将小波分解后的各个子序列映射至[0,1]范围内。
步骤3,建立基于Transformer的航班客流量预测模型,Transformer模型为编码器(Encoder)-解码器(Decoder)的结构,如图3所示。
步骤3.1,构建嵌入层:将输入的客流量子序列中的每一个时间步表示为向量X,并进行线性变换,如下所示,其中,Wembedding为嵌入矩阵,用于将输入序列映射到固定维度。
Xembedding=X*Wembedding (4)
步骤3.2,构建编码器:编码器由N个相同的编码器层堆叠而成,每个编码器层包含两个子层:多头自注意力层和前馈神经网络层。每个编码器层的输出如下式所示,其中MHA表示多头自注意力层(Multi Head Attention),FFN为前馈神经网络层,Xembedding是输入序列的嵌入表示。
EOutput=FFN(MHA(Xembedding)+Xembedding) (5)
步骤3.3,构建解码器:解码器也由N个相同的解码器层堆叠而成,每个解码器层包含三个子层:多头自注意力层、编码器-解码器注意力层和前馈神经网络层。每个解码器层的输出如下式所示,MHA为多头自注意力层,用于捕获输入序列和解码器输入序列的依赖关系,FFN为前馈神经网络层,Xdec_embedding为解码器输入序列的嵌入表示。
DOutput=FFN(MHA(Xdec_embedding,EOutput)+EOutput) (6)
步骤3.4,构建输出层:解码器的输出通过线性变换映射到输出空间,如下所示,其中Y为输入航班客流量值的预测结果,Woutput为输出层的权重矩阵。
Y=DOutput*Woutput (7)
步骤4,利用改进鲸鱼优化算法优化步骤3所得Transformer模型的超参数,流程如图3所示,具体方法如下:
步骤4.1,确定待优化的Transformer超参数为时间窗口和学习率,并进行参数初始化,包括超参数寻优范围、鲸鱼数量、迭代次数等;
步骤4.2,鲸鱼种群初始化,随机生成指定数量的鲸鱼,每个鲸鱼的位置代表一个超参数组合,根据该超参数组合建立并训练Transformer预测模型;
步骤4.3,确定适应度函数为均方误差MSE,并根据适应度函数计算每个鲸鱼个体的适应度值;
步骤4.4,改进鲸鱼优化算法开始迭代,每次迭代根据算法中的包围猎物、旋转搜索和随机搜寻不断更新鲸鱼的位置,根据该位置建立并训练Transformer预测模型。
包围猎物操作如公式(8)所示,其中,X为当前鲸鱼位置,X*为全局最优位置,t为迭代次数,D为步长,A和C为系数矩阵。
当|A|<1时,会进行随机搜寻,如公式(9)所示,其中Xrand为随机鲸鱼位置。
当|A|≥1时,会进行旋转搜索,如公式(10)所示,其中p为[0,1]之间的随机数,b为改变旋转形状的常数,l为[-1,1]之间的随机数,和/>表示自适应权重,通过引入该非线性权重能够提升全局搜索能力,加快搜索速度。
步骤4.5,当达到最大迭代次数时,算法迭代完成,解码最优鲸鱼位置,输出其对应的超参数。
本实施例采用澳大利亚悉尼Kingsford Smith机场2019-2021年客流量数据,本发明实施例中的方法在该数据中测试集上的预测结果如图4所示。分别采用均方根误差RMSE、平均绝对误差MAE以及平均绝对百分比误差MAPE作为评价指标,如公式(11)(12)(13)所示,N为数据样本的个数,ypredictive为预测值,ytrue为实际值。本方法与传统方法SVM、LSTM的预测性能对比如表1所示。
表1不同模型的预测性能对比
实施例2
基于与实施例1相同的发明构思,本发明实施例中提供了一种航班客流量预测装置,包括:
获取模块,用于获取实时航班客流量时间序列数据;
预测模块,用于将所述实时航班客流量时间序列数据输入至预先训练好的基于Transformer的航班客流量预测模型,得到航班客流量预测值;
其中,所述基于Transformer的航班客流量预测模型通过利用改进鲸鱼优化算法优化Transformer模型的超参数获得。
其余部分均与实施例1相同。
实施例3
基于与实施例1相同的发明构思,本发明实施例中提供了一种航班客流量预测系统,包括存储介质和处理器;
所述存储介质用于存储指令;
所述处理器用于根据所述指令进行操作以执行根据第一方面中任一项所述的方法。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
以上结合附图对本发明的实施例进行了描述,但是本发明并不局限于上述的具体实施方式,上述的具体实施方式仅仅是示意性的,而不是限制性的,本领域的普通技术人员在本发明的启示下,在不脱离本发明宗旨和权利要求所保护的范围情况下,还可做出很多形式,这些均属于本发明的保护之内。
以上显示和描述了本发明的基本原理和主要特征和本发明的优点。本行业的技术人员应该了解,本发明不受上述实施例的限制,上述实施例和说明书中描述的只是说明本发明的原理,在不脱离本发明精神和范围的前提下,本发明还会有各种变化和改进,这些变化和改进都落入要求保护的本发明范围内。本发明要求保护范围由所附的权利要求书及其等效物界定。
Claims (10)
1.一种航班客流量预测方法,其特征在于,包括:
获取实时的航班客流量时间序列数据;
将所述实时的航班客流量时间序列数据输入至预先训练好的基于Transformer的航班客流量预测模型,得到航班客流量预测值;
其中,所述基于Transformer的航班客流量预测模型通过利用改进鲸鱼优化算法优化Transformer模型的超参数获得。
2.根据权利要求1所述的一种航班客流量预测方法,其特征在于,所述基于Transformer的航班客流量预测模型包括顺次设置的嵌入层、编码器、解码器和输出层,其中:
所述嵌入层用于将离散的客流量时间序列值映射到连续的向量空间中;
所述编码器由N个相同的编码器层堆叠而成,每个编码器层包含两个子层:多头自注意力层和前馈神经网络层,用于将所述嵌入层的输出转换为高维的特征表示;
所述解码器由N个相同的解码器层堆叠而成,每个解码器层包含三个子层:多头自注意力层、编码器-解码器注意力层和前馈神经网络层,用于捕获嵌入层输出的输入序列的嵌入表示和解码器输入序列的依赖关系;
所述输出层用于将解码器的输出通过线性变换映射到输出空间。
3.根据权利要求2所述的一种航班客流量预测方法,其特征在于,所述嵌入层将输入的航班客流量时间序列数据中的每一个时间步表示为向量X,并进行线性变换,得到输入序列的嵌入表示Xembedding:
Xembedding=X*Wembedding
其中,Wembedding是嵌入矩阵。
4.根据权利要求3所述的一种航班客流量预测方法,其特征在于,每个编码器层的输出为EOutput:
EOutput=FFN(MHA(Xembedding)+Xembedding)
其中,MHA为多头自注意力层,FFN为前馈神经网络层,Xembedding为嵌入层输出的输入序列的嵌入表示;
每个编码器层的输出为DOutput:
DOutput=FFN(MHA(Xdec_embedding,EOutput)+EOutput)
其中,MHA为多头自注意力层,用于捕获输入序列和解码器输入序列的依赖关系,FFN为前馈神经网络层,Xdec_embedding为解码器输入序列的嵌入表示。
5.根据权利要求4所述的一种航班客流量预测方法,其特征在于,所述输出层的输出为Y:
Y=DOutput*Woutput
其中,Y为航班客流量预测值,Woutput为输出层的权重矩阵。
6.根据权利要求1所述的一种航班客流量预测方法,其特征在于:所述利用改进鲸鱼优化算法对Transformer模型的超参数优化的具体方法是:
确定Transformer模型中待优化的超参数为时间窗口和学习率,进行参数初始化,包括迭代次数、鲸鱼数量、学习率和超参数范围;
鲸鱼种群初始化,随机生成指定数量的鲸鱼,每个鲸鱼的位置代表一个超参数组合,根据该超参数组合,以及历史的航班客流量时间序列数据,建立并训练Transformer预测模型;
将均方误差MSE设定为适应度函数,并计算每个鲸鱼的适应度值;
改进鲸鱼算法迭代开始,每次迭代根据算法中的包围猎物、旋转搜索和随机搜寻不断更新鲸鱼的位置,基于该位置更新后的鲸鱼的位置,以及历史的航班客流量时间序列数据,建立并训练Transformer预测模型,更新鲸鱼的适应度值;
改进鲸鱼算法迭代结束后,输出最优鲸鱼个体的位置,将其对应的超参数作为Transformer模型的最佳超参数。
7.根据权利要求6所述的一种航班客流量预测方法,其特征在于:包围猎物操作如下式所示:
其中,X为当前鲸鱼位置,X*为全局最优位置,t为迭代次数,D为步长,A和C为系数矩阵;
当|A|<1时,根据进行随机搜寻,其中Xrand为随机鲸鱼位置;
当|A|≥1时,根据进行旋转搜索,其中,p为[0,1]之间的随机数,b为改变旋转形状的常数,l为[-1,1]之间的随机数,/>和表示自适应权重。
8.根据权利要求1所述的一种航班客流量预测方法,其特征在于:所述航班客流量预测方法还包括:
对获取到航班客流量时间序列数据进行预处理,所述预处理包括:
对航班客流量数据进行基准转换,将客流量幅值转化为百分比,具体公式如下所示:
其中,Di为基准转换后的客流量百分比值;Xi为第i项客流量数据,Xmax为客流量数据中的最大值;
利用小波变换对进行基准转换后的航班客流量数据进行小波分解,得到若干个子序列:对小波分解后的子序列进行数据归一化。
9.一种航班客流量预测装置,其特征在于,包括:
获取模块,用于获取实时航班客流量时间序列数据;
预测模块,用于将所述实时航班客流量时间序列数据输入至预先训练好的基于Transformer的航班客流量预测模型,得到航班客流量预测值;
其中,所述基于Transformer的航班客流量预测模型通过利用改进鲸鱼优化算法优化Transformer模型的超参数获得。
10.一种航班客流量预测系统,其特征在于,包括存储介质和处理器;
所述存储介质用于存储指令;
所述处理器用于根据所述指令进行操作以执行根据权利要求1-8中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410284963.2A CN118095092A (zh) | 2024-03-13 | 2024-03-13 | 航班客流量预测方法、装置及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410284963.2A CN118095092A (zh) | 2024-03-13 | 2024-03-13 | 航班客流量预测方法、装置及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN118095092A true CN118095092A (zh) | 2024-05-28 |
Family
ID=91157456
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202410284963.2A Pending CN118095092A (zh) | 2024-03-13 | 2024-03-13 | 航班客流量预测方法、装置及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN118095092A (zh) |
-
2024
- 2024-03-13 CN CN202410284963.2A patent/CN118095092A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11874640B2 (en) | Wind power prediction method and system for optimizing deep transformer network | |
CN110751318B (zh) | 一种基于ipso-lstm的超短期电力负荷预测方法 | |
CN110969290A (zh) | 一种基于深度学习的径流概率预测方法及系统 | |
CN112418482A (zh) | 一种基于时间序列聚类的云计算能耗预测方法 | |
CN111127246A (zh) | 一种输电线路工程造价的智能预测方法 | |
CN112884236B (zh) | 一种基于vdm分解与lstm改进的短期负荷预测方法及系统 | |
Ren et al. | A $ T^{2} $-tensor-aided multiscale transformer for remaining useful life prediction in IIoT | |
CN117576910A (zh) | 一种基于循环时空注意力机制的交通流量预测方法 | |
CN116702831A (zh) | 一种考虑数据大量丢失的混合短期风电功率预测方法 | |
CN118036822A (zh) | 电氢一体化能源站的电氢负荷预测方法、装置及存储介质 | |
CN118035670A (zh) | 基于Deep-Pred框架的台风风速预测方法及系统 | |
CN116777066B (zh) | 基于地基云图引导深度分解的光伏功率概率预测方法及装置 | |
CN112348236A (zh) | 用于智能用电监测终端的异常日负荷需求预测系统与方法 | |
CN116106751A (zh) | 一种基于Informer的锂离子电池荷电状态估计方法 | |
CN118095092A (zh) | 航班客流量预测方法、装置及系统 | |
CN113835964B (zh) | 基于小样本学习的云数据中心服务器能耗预测方法 | |
CN115730716A (zh) | 基于改进Transformer模型通信基站中长期用电量预测方法 | |
CN118504792B (zh) | 外生变量深度融合的充电站集群负荷预测方法及系统 | |
CN116345495B (zh) | 基于数据分析和建模的电厂机组调频优化方法 | |
CN114741196B (zh) | 一种云平台负载预测方法、装置及设备 | |
CN115829135A (zh) | 基于注意力机制的燃气负荷预测方法、装置、设备及介质 | |
Feng et al. | Research On Tourist Destination Passenger Flow Prediction Based On Decomposition Clustering Technology For Data Continuity Problem | |
Lou et al. | An Efficient Energy Consumption Prediction Framework for High Performance Computing Cluster Jobs | |
CN117913776A (zh) | 一种基于粒子群算法优化融合模型的电力负荷预测方法 | |
CN112686451A (zh) | 一种风电功率预测方法、装置、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |