CN116611552B - 一种基于目标监测数据的船舶交通流量预测方法及系统 - Google Patents
一种基于目标监测数据的船舶交通流量预测方法及系统 Download PDFInfo
- Publication number
- CN116611552B CN116611552B CN202310534191.9A CN202310534191A CN116611552B CN 116611552 B CN116611552 B CN 116611552B CN 202310534191 A CN202310534191 A CN 202310534191A CN 116611552 B CN116611552 B CN 116611552B
- Authority
- CN
- China
- Prior art keywords
- model
- data
- sequence
- ship
- module
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 51
- 238000012544 monitoring process Methods 0.000 title claims abstract description 25
- 238000007781 pre-processing Methods 0.000 claims abstract description 40
- 238000010219 correlation analysis Methods 0.000 claims abstract description 23
- 238000010276 construction Methods 0.000 claims abstract description 22
- 238000012545 processing Methods 0.000 claims abstract description 16
- 238000012795 verification Methods 0.000 claims abstract description 11
- YHXISWVBGDMDLQ-UHFFFAOYSA-N moclobemide Chemical compound C1=CC(Cl)=CC=C1C(=O)NCCN1CCOCC1 YHXISWVBGDMDLQ-UHFFFAOYSA-N 0.000 claims description 40
- 238000005311 autocorrelation function Methods 0.000 claims description 21
- 241001123248 Arma Species 0.000 claims description 19
- 238000007689 inspection Methods 0.000 claims description 13
- 230000008859 change Effects 0.000 claims description 9
- 238000004458 analytical method Methods 0.000 claims description 8
- 238000010586 diagram Methods 0.000 claims description 7
- 230000008569 process Effects 0.000 claims description 5
- 238000012800 visualization Methods 0.000 claims description 5
- 238000004590 computer program Methods 0.000 claims description 4
- 238000012937 correction Methods 0.000 claims description 4
- 238000005314 correlation function Methods 0.000 claims description 3
- 238000004364 calculation method Methods 0.000 description 8
- 238000012360 testing method Methods 0.000 description 7
- 230000007547 defect Effects 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 230000006872 improvement Effects 0.000 description 2
- 230000001932 seasonal effect Effects 0.000 description 2
- 238000001278 Kwiatkowski–Phillips–Schmidt–Shin (KPSS) test Methods 0.000 description 1
- 230000002776 aggregation Effects 0.000 description 1
- 238000004220 aggregation Methods 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 238000013499 data model Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000013136 deep learning model Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- 230000004069 differentiation Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000003203 everyday effect Effects 0.000 description 1
- 238000005206 flow analysis Methods 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 230000033772 system development Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/18—Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
-
- G—PHYSICS
- G08—SIGNALLING
- G08G—TRAFFIC CONTROL SYSTEMS
- G08G3/00—Traffic control systems for marine craft
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Business, Economics & Management (AREA)
- Data Mining & Analysis (AREA)
- Strategic Management (AREA)
- Mathematical Optimization (AREA)
- Mathematical Analysis (AREA)
- Operations Research (AREA)
- Human Resources & Organizations (AREA)
- Computational Mathematics (AREA)
- Pure & Applied Mathematics (AREA)
- Economics (AREA)
- Mathematical Physics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Probability & Statistics with Applications (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Tourism & Hospitality (AREA)
- Quality & Reliability (AREA)
- Evolutionary Biology (AREA)
- Marketing (AREA)
- Entrepreneurship & Innovation (AREA)
- General Business, Economics & Management (AREA)
- Game Theory and Decision Science (AREA)
- Algebra (AREA)
- Development Economics (AREA)
- Databases & Information Systems (AREA)
- Software Systems (AREA)
- General Engineering & Computer Science (AREA)
- Ocean & Marine Engineering (AREA)
- Radar, Positioning & Navigation (AREA)
- Remote Sensing (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明属于交通流量预测技术领域,具体涉及一种基于目标监测数据的船舶交通流量预测方法,包括以下步骤:获取时间序列数据进行处理,并发送至预处理模块;判断将符合预设条件的时间序列数据发送至相关性分析模块;将不符合的数据进行差分处理后,重新预处理;相关性分析模块获取数据的自相关系数和偏相关系数,通过模型构建模块选取相应的模型结构作为建模系数结构;并获取到模型参数建立对应的模型,将建立的模型发送至模型验证模块判断该模型是否满足精度要求,若不满足,则重新进行确定建模系数结构及模型参数估计;若满足则利用验证通过的模型,最终将采集目标区域位置船舶流量的时间序列数据作为模型的输入,模型输出得到船舶流量的预测值。
Description
技术领域
本发明属于交通流量预测技术领域,具体涉及一种基于目标监测数据的船舶交通流量预测方法。
背景技术
船舶交通流量的大小与众多因素有关,由于船舶交通流量具有惯性原则、类推原则和相关性原则,因此船舶交通流量的预测是一种可测性增量研究,而现有技术的交通流预测方法主要存在以下几点缺陷:
一是采用大数据建模流量预测,其实质上是通过建立大数据模型的两两共享的共享方式,实时对获取各个航线的船舶流量,并非真正意义上的传播流量的预测,而在该方法的基础上,通过传感器方式获取其他属性变量加入进行预测,虽然排除一些环境属性变量解决一些无法捕捉的船舶,以达到预测效果,但其对于未来短时间内的船舶流量无法精准预测,且由于输入的信号种类多,处理步骤繁琐,加大了运算工作量。二是通过深度学习模型的方式对船舶流量进行预测,该方案可以将序列分解为不同频率的分量,其对于非平稳非线性序列的处理有较好的效果。但无法单独处理针对于平稳随机序列,导致无法预测特定平稳随机序列的情况;
三是利用图卷积网络对船舶流量进行预测,将船舶航速、船舶密度等特征作为输入,对水运通航密度进行预测。但该方法直接应用于船舶流量预测时仍然存在缺点,在这种预测方式基础上,其船舶流量不仅仅与船舶自身航速等特征相关,还与卷积网络的整体特征等因素存在紧密联系。而目前普遍的图卷积神经网络无法充分挖掘相关特征,导致受缺失因素影响,预测不准确,且涉及到的输入条件同样较多,运算的工作量同样巨大。
上述研究为船舶交通流量预测提供了理论基础,但影响船舶交通流量的因素繁多且复杂,包括上文中所提及的不确定性影响因素,无法准确预测。因此,考虑到预选试验航区内的船舶流量总体可控,存在明显的季节性波动聚集效应,整体趋势较为稳定,趋势性与周期性较强,结合前文提及的研究现状和数据挖掘技术方法,需要提供一种不受上述干扰因素影响的船舶流量预测方法。
发明内容
本发明提出一种基于目标监测数据的船舶交通流量预测方法,该方法利用模型对航区内船舶流量进行建模,可以有效地捕捉船舶流量的周期性变化、船舶流量的长期变化趋势、船舶流量受短期因素的影响变化、船舶流量的随机扰动项等流量变化规律,以克服背景技术中的存在的缺陷。
本发明为实现上述目的所采用的技术方案是:一种基于目标监测数据的船舶交通流量预测方法,包括以下步骤:
1)通过数据获取模块获取目标区域中船舶流量的时间序列数据进行处理,并发送至预处理模块;
2)预处理模块对时间序列数据进行预处理,判断为符合预设条件的时间序列数据发送至相关性分析模块;同时,将判断为不符合预设条件的时间序列数据进行差分处理后,经数据获取模块重新发回预处理模块进行预处理;
3)相关性分析模块对符合预设条件的时间序列数据进行相关性分析,获取数据的自相关系数和偏相关系数,并发送至模型构建模块;
4)模型构建模块根据自相关系数和偏相关系数选取模型结构作为建模系数结构;
5)模型构建模块对选取的建模系数结构处理,获取到模型参数,并建立对应的ARIMA模型,将建立的ARIMA模型发送至模型验证模块,并执行步骤6);
6)判断建立对应ARIMA模型是否满足精度要求,若误差分布超出阈值,则重复执行一次步骤4)-步骤5)重新进行确定建模系数结构及模型参数估计;若建立的ARIMA模型满足精度要求,则验证ARIMA模型的平稳性和可逆性,验证通过后,则执行步骤7);
7)利用验证通过的ARIMA模型,将采集目标区域位置船舶流量的时间序列数据作为ARIMA模型的输入,ARIMA模型输出未来时间的船舶流量的预测值。
所述步骤1),具体为:
数据获取模块获取到某一时间段目标区域船舶流量的原始数据,包括历年各时间段对应的船舶流量数据,构成时间序列数据,并发送至预处理模块;并以设定单位时间为切片,绘制时间序列数据的散点图以可视化。
步骤2)中,所述预处理模块采用ADF检验或KPSS检验对时间序列数据进行预处理;
步骤2)中,所述符合预设条件的时间序列数据为:当时间序列数据为零均值的平稳随机时间序列数据;
其中,平稳指包括均值、方差和协方差的数字特征不随时间的变化而变化,且时间序列在各个时间点上的随机性服从设定的概率分布。
所述模型结构为AR(p)自回归模型,则AR(p)自回归模型的模型表达式如下:
A(B)y(t)=e(t)
其中,A(B)=1-a1B-a2B2-…-apBp,e(t)为零均值的白噪声,B为后移算子,即满足:
Bny(t)=y(t-n),n=1,2,…
将数据序列{Yt}转化为以下的AR(p)的形式,即:
y(t)=a1y(t-1)+a2y(t-2)+…+apy(t-p)+e(t)
其中,y(t-p)表示平稳时间序列,ap为AR(p)模型的自回归系数,p代表模型中采用的时序数据本身的滞后阶次,序列e(t)代表AR(p)模型未观测到的随机干扰,即零均值的白噪声序列。
所述模型结构为MA(q)移动平均模型,则MA(q)移动平均模型的模型表达式如下:
y(t)=C(B)e(t)
其中,C(B)=1-c1B-c2B2-…-cqBq,e(t)为零均值的白噪声,B为后移算子;
将数据序列{Yt}转化为以下的MA(q)模型的形式,即:
y(t)=e(t)-c1e(t-1)-c2(t-2)-…-cqe(t-q)
其中,cq为MA(q)模型移动平均部分的系数,q为模型中采用的预测误差的滞后阶次;
所述模型结构为ARMA(p,q)自回归求积平均模型,则ARMA(p,q)自回归求积平均模型的模型表达式如下:
A(B)y(t)=C(B)e(t)
将数据序列{Yt}转化为以下的ARMA(p,q)模型的形式,即:
y(t)=a1y(t-1)+a2y(t-2)+…+apy(t-p)+e(t)-c1e(t-1)-c2(t-2)-…-cqe(t-q)
其中,y(t-p)表示平稳时间序列,ap为ARMA(p,q)模型的自回归系数,p代表模型中采用的时序数据本身的滞后阶次,cq为ARMA(p,q)模型移动平均部分的系数,q为模型中采用的预测误差的滞后阶次,序列e(t)代表AR(p)模型未观测到的随机干扰,即零均值的白噪声序列。
所述步骤5),包括以下步骤:
5-1)以步骤4)选取的模型为基础,通过AIC准则或BIC准则确定模型阶数;
5-2)对步骤S5-1)中定阶后的模型采用最小二乘法进行模型的参数估计,即对模型的自回归系数、滑动平均系数和白噪声方差进行估计,获得条件最小二乘估计值。
所述步骤6),具体为:
6-1)通过数据采集模块获取已知的某段时间序列数据,利用建立的ARIMA模型进行数据预测,判断原始数据与预测数据的误差大小是否小于预设范围,若误差分布大于预设范围,则需重新进行模型结构识别和参数估计;
验证模型的平稳性和可逆性:
6-2)通过作残差序列自相关函数,检验该模型的残差是否为白噪声序列,若残差满足白噪声序列要求,则该模型作为最终的预测模型使用;
6-3)判断模型的可决系数、AIC信息量、均方误差、平均绝对百分比误差以及泰尔不等系数并给出预测结果的展示和分析,判断是否满足模型预测条件,最终完成模型预测。
一种基于目标监测数据的船舶交通流量预测方法的预测系统,包括:数据获取模块、预处理模块、相关性分析模块、模型构建模块以及模型构建模块;
数据获取模块,用于获取到某一时间段目标区域船舶流量的原始数据,原始数据包括历年各时间段对应的船舶流量数据,构成时间序列数据,并发送至预处理模块;并以设定单位时间为切片,绘制时间序列数据的散点图以可视化;
预处理模块,用于采用ADF检验或KPSS检验对时间序列数据进行预处理;并判断为符合预设条件的时间序列数据发送至相关性分析模块;同时,将判断为不符合预设条件的时间序列数据进行差分处理后,经数据获取模块重新发回预处理模块进行预处理;
相关性分析模块,用于对符合预设条件的时间序列数据进行相关性分析,获取数据的自相关系数和偏相关系数,并发送至模型构建模块;
模型构建模块,用于选取模型结构作为建模系数结构并处理,获取到模型参数,并建立对应的ARIMA模型;
模型验证模块,用于对建立的ARIMA模型进行平稳性和可逆性验证。
一种基于目标监测数据的船舶交通流量预测方法的预测系统,包括存储器和处理器;所述存储器,用于存储计算机程序;所述处理器,用于当执行所述计算机程序时,实现一种基于目标监测数据的船舶交通流量预测方法。
本发明具有以下有益效果及优点:
1、本发明利用ARIMA模型对航区内船舶流量进行建模,该方法基于目标的历史流量统计,在免于识别影响因素的基础上,通过时间序列拟合,完成流量变化趋势的分析与预测,而且对数据的细节变化预测较为准确。
2、本发明方法针对船舶流量的一些主要影响因素的船舶航速、船舶密度或者自然航速,建立的ARIMA模型预测正好起到改善作用,不需要再花费精力去考虑影响因素的突然介入,且相对于现有技术,本发明只需要模型的内生变量而不需要借助模型的其他外生变量,也不会因此影响模型预测精度。
3、本发明对许多时间序列都适用,并且在建模过程中可根据时间序列的特点有多种方法可以选择,如AR模型、MA模型以及ARMA模型,并且在模型的诊断中能过对模型的好坏进行评价,针对不同的时间序列特点,选用最佳的模型,对预测起到很好的作用。
附图说明
图1为本发明的船舶交通流量预测方法流程图;
图2为本发明的实施例中区域范围内每年海面目标流量监测数据;
图3为本发明的实施例中根据自相关系数和偏自相关系数参数估计图;
图4为本发明的实施例中某一时间段各月海面目标流量原始数据;
图5为本发明的实施例中预测值与统计值残差分析图;
图6为本发明的实施例中海面目标流量监测数据预测结果图。
具体实施方式
下面结合附图及实施例对本发明做进一步的详细说明。
本发明一种基于目标监测数据的船舶交通流量预测方法,基于其船舶交通流量预测系统实现,该系统包括:数据获取模块、预处理模块、相关性分析模块、模型构建模块以及模型构建模块;
数据获取模块,用于获取到某一时间段目标区域船舶流量的原始数据,原始数据包括历年各时间段对应的船舶流量数据,构成时间序列数据,并发送至预处理模块;并以设定单位时间为切片,绘制时间序列数据的散点图以可视化;
预处理模块,用于采用ADF检验或KPSS检验对时间序列数据进行预处理;并判断为符合预设条件的时间序列数据发送至相关性分析模块;同时,将判断为不符合预设条件的时间序列数据进行差分处理后,经数据获取模块重新发回预处理模块进行预处理;
相关性分析模块,用于对符合预设条件的时间序列数据进行相关性分析,获取数据的自相关系数和偏相关系数,并发送至模型构建模块;
模型构建模块,用于选取模型结构作为建模系数结构并处理,获取到模型参数,并建立对应的ARIMA模型;
模型验证模块,用于对建立的ARIMA模型进行平稳性和可逆性验证。
基于上述船舶交通流量预测系统,本发明提供的方法采用的ARIMA方法可用于序列的预测,其预测仅取决于时间序列,而不需要其他信息即可实现预测,本发明基于ARIMA(p,d,q)模型对目标监测数据的船舶交通流量进行预测,ARIMA(p,d,q)是以随机理论为基础的时间序列模型。其基本思路是对于已知船舶流量时间序列,用若干次差分使其成为平稳序列,再用ARIMA模型对该平稳序列建模、预测,之后经反变换得到原序列,
如图1所示,为本发明的船舶交通流量预测方法流程图,本发明一种基于目标监测数据的船舶交通流量预测方法,具体包括以下步骤:
步骤1):通过数据获取模块获取目标区域中船舶流量的时间序列数据进行处理,并发送至预处理模块;
数据获取模块获取到某一时间段目标区域船舶流量的原始数据,包括历年各时间段对应的船舶流量数据,构成时间序列数据,并发送至预处理模块;同时,以设定单位时间为切片,绘制时间序列数据的散点图以可视化。
步骤2):预处理模块对时间序列数据进行预处理,判断为符合预设条件的时间序列数据发送至相关性分析模块;同时,将判断为不符合预设条件的时间序列数据进行差分处理后,经数据获取模块重新发回预处理模块进行预处理;
a.预处理模块采用ADF检验或KPSS检验对时间序列数据进行预处理;
b.符合预设条件的时间序列数据为:当时间序列数据为零均值的平稳随机时间序列数据;其中,平稳指包括均值、方差和协方差的数字特征不随时间的变化而变化,且时间序列在各个时间点上的随机性服从设定的概率分布;
c.不符合预设条件的时间序列数据为:当时间序列数据是非平稳的,并存在增长或下降趋势,则需要对数据进行差分处理;其中,非平稳指数字特征随时间的变化而变化,且时间序列在各个时间点上的随机规律不同。
d.差分处理的方法为:
对不符合预设条件的时间序列数据{Yt}进行d次差分处理,d为差分阶数,d≤2,标记为{DYt};
原始时序{Yt}称为d阶单整序列,标记为Yt~I(d),即:
DYt=▽dYt=(1-L)dYt
其中,L表示滞后算子,I(d)表示d次差分后的时序数列,▽表示矢量微分算符。
步骤3):相关性分析模块对符合预设条件的时间序列数据进行相关性分析,获取数据的自相关系数和偏相关系数,并发送至模型构建模块;
步骤4):模型构建模块根据自相关系数和偏相关系数选取模型结构作为建模系数结构;
4-1)判断当平稳序列的偏自相关函数是以p步截尾,自相关函数拖尾,则选用AR(p)模型;
4-2)判断当平稳序列的自相关函数是以q步截尾,偏自相关函数拖尾,则选用MA(q)模型;
4-3)判断当平稳序列的自相关函数和偏相关函数均拖尾,则选用ARMA(p,q)模型。
其中,模型结构包括:AR(p)自回归模型、MA(q)移动平均模型以及ARMA(p,q)自回归求积平均模型;具体模型选取样式如下:
(1)AR(p)自回归模型的模型表达式如下:
A(B)y(t)=e(t)
其中,A(B)=1-a1B-a2B2-…-apBp,e(t)为零均值的白噪声,B为后移算子,即满足:
Bny(t)=y(t-n),n=1,2,…
将数据序列{Yt}转化为以下的AR(p)的形式,即:
y(t)=a1y(t-1)+a2y(t-2)+…+apy(t-p)+e(t)
其中,y(t-p)表示平稳时间序列,ap为AR(p)模型的自回归系数,p代表模型中采用的时序数据本身的滞后阶次,序列e(t)代表AR(p)模型未观测到的随机干扰,即零均值的白噪声序列;
(2)MA(q)移动平均模型的模型表达式如下:
y(t)=C(B)e(t)
其中,C(B)=1-c1B-c2B2-…-cqBq,e(t)为零均值的白噪声,B为后移算子;
将数据序列{Yt}转化为以下的MA(q)模型的形式,即:
y(t)=e(t)-c1e(t-1)-c2(t-2)-…-cqe(t-q)
其中,cq为MA(q)模型移动平均部分的系数,q为模型中采用的预测误差的滞后阶次;
(3)ARMA(p,q)自回归求积平均模型的模型表达式如下:
A(B)y(t)=C(B)e(t)
将数据序列{Yt}转化为以下的ARMA(p,q)模型的形式,即:
y(t)=a1y(t-1)+a2y(t-2)+...+apy(t-p)+e(t)-c1e(t-1)-c2(t-2)-…-cqe(t-q)
其中,y(t-p)表示平稳时间序列,ap为ARMA(p,q)模型的自回归系数,p代表模型中采用的时序数据本身的滞后阶次,cq为ARMA(p,q)模型移动平均部分的系数,q为模型中采用的预测误差的滞后阶次,序列e(t)代表AR(p)模型未观测到的随机干扰,即零均值的白噪声序列。
步骤5):模型构建模块对选取的建模系数结构处理,获取到模型参数,并建立对应的ARIMA模型,将建立的ARIMA模型发送至模型验证模块,并执行步骤6);
5-1)以步骤4)选取的模型为基础,通过AIC准则或BIC准则确定模型阶数;
5-2)对步骤S5-1)中定阶后的模型采用最小二乘法进行模型的参数估计,即对模型的自回归系数、滑动平均系数和白噪声方差进行估计,获得条件最小二乘估计值。
通过AIC准则或BIC准则确定模型阶数,具体为:
a.当通过AIC准则确定模型阶数时,选取AIC信息量最小时,所对应的阶数为模型阶数,AIC信息准则的表达式:
AIC=2k+nln(RSS/n)
其中,RSS是模型的残差平方和,n是时序样本的个数;k表示参数的数量;
b.当通过BIC准则确定模型阶数时,选取BIC信息量最小时,所对应的阶数为模型阶数,AIC信息准则的表达式:
BIC=ln(n)k–2ln(L)
其中,k表示参数的数量,n是时序样本的个数。
步骤6-1):通过数据采集模块获取已知的某段时间序列数据,利用建立的ARIMA模型进行数据预测,判断原始数据与预测数据的误差大小是否小于预设范围,若误差分布大于预设范围,则重复执行一次步骤4)~步骤5),重新进行模型结构识别和参数估计;
若建立的ARIMA模型满足精度要求,则验证ARIMA模型的平稳性和可逆性,验证通过后,则执行步骤7):
6-2)通过作残差序列自相关函数,检验该模型的残差是否为白噪声序列,若残差满足白噪声序列要求,则该模型作为最终的预测模型使用;
6-3)判断模型的可决系数、AIC信息量、均方误差、平均绝对百分比误差以及泰尔不等系数并给出预测结果的展示和分析,判断是否满足模型预测条件,最终完成模型预测。
7)利用验证通过的ARIMA模型,将采集目标区域位置船舶流量的时间序列数据作为ARIMA模型的输入,ARIMA模型输出船舶流量的预测值。
实施例1:
选取渤海辽东湾某飞行器试验航区中某块区域为流量分析预测区域,面积约50平方公里,按照数据采集与准备要求,统计了该区域2015年1月至2022年6月共90个月的民用船舶交通流量。
实际应用中,可参考该算例根据具体情况,以该区域为单位面积扩展预测范围,并提高时间切片粒度,以每小时或每十分钟统计交通流量。
(1)数据预处理:根据搜集的原始数据,本实施例以月为时间切片,绘制该区域2015年至2022年8个年度的时间序列曲线图,如图2所示,为本发明的实施例中区域范围内每年海面目标流量监测数据,从附图2中可以看出,8条曲线交织穿插,但总体趋势相当,且每条曲线具有明显的季节特征,有一定的逐年增长趋势,每年4月至5月、9月至10月为该年度交通流量高峰期,符合调研搜集的渔船集中作业预期。
现选取2021年1月至2022年7月的统计数据做具体分析,预测8月短期交通流量,时间切片为每天,绘制曲线散点图,如图4所示。
利用ADF检验对该时间序列进行平稳性检验,计算结果如时间序列的ADF检验计算结果表1所示。
表1
ADF检测 | 0.0902359988 | 1%Critical Value | -3.449064 |
5%Critical Value | -2.869786 | ||
10%Critical Value | -2.571163 |
由于该时间序列t统计量的绝对值小于其临界绝对值,未通过ADF检验,判断该序列为非平稳序列。经过反复检验计算,当对原序列取自然对数并完成2次差分处理后,满足平稳要求,可据此继续建模。
(2)模型识别及参数估计:在模型识别过程中,利用挖掘工具分别计算原始数据差分后时间序列的自相关系数和偏自相关系数,计算结果见时间序列ACF和PACF计算的如图3所示。
如图3所示,自相关系数和偏自相关系数均为拖尾型,因此,本实施例的该时间序列预测适用于ARIMA模型。利用AIC准则对模型参数进行反复筛选,确定模型为ARIMA(2,2,2)。采用最小二乘法对模型的自回归系数、滑动平均系数和白噪声方差进行估计,计算结果见表2所示。
表2
模型系数 | Coefficient | Std.Error | t-Statistic | Prob |
C | 0.0064129 | 0.26786 | 0.023941 | 0.980 |
AR(1) | -0.4903 | 0.44509 | -1.1016 | 0.27065 |
AR(2) | -0.29223 | 0.12922 | -2.2615 | 0.023726 |
A(1) | 0.172785 | 0.450155 | 0.383834 | 0.7011 |
MA(2) | 0.162958 | 0.170568 | 0.955383 | 0.33939 |
(4)模型检验:现基于2021年1月至2022年5月的统计数据,利用上述模型对该时间序列进行预测,得出2022年6月至7月的预测结果,并与已知统计数据进行残差比对分析,结果见图5所示。可见,时间序列的预测值与真实统计值十分接近,残差处于允许范围,上述模型可用于预测分析。
通过作残差序列自相关函数,检验该模型的残差是否为白噪声序列,若残差满足白噪声序列要求,则该模型作为最终的预测模型使用;
判断模型的可决系数、AIC信息量、均方误差、平均绝对百分比误差以及泰尔不等系数并给出预测结果的展示和分析,判断是否满足模型预测条件,最终完成模型预测。
(5)预测计算:应用检验通过的预测模型对该区域2022年8月的船舶流量进行预测,结果如图6和表3所示。
表3
本发明提出了一种基于目标监测数据的船舶交通流量预测方法,该方法采用ARIMA(时间序列)模型,通过模型解构提出算法实现的方法步骤,并给出具体的应用算例,系统解决了方法论问题,为后续应用场景设计和系统开发奠定了技术基础。
以上所述仅为本发明的实施方式,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进、扩展等,均包含在本发明的保护范围内。
Claims (9)
1.一种基于目标监测数据的船舶交通流量预测方法,其特征在于,包括以下步骤:
1)通过数据获取模块获取目标区域中船舶流量的时间序列数据进行处理,并发送至预处理模块;
2)预处理模块对时间序列数据进行预处理,判断为符合预设条件的时间序列数据发送至相关性分析模块;同时,将判断为不符合预设条件的时间序列数据进行差分处理后,经数据获取模块重新发回预处理模块进行预处理;
3)相关性分析模块对符合预设条件的时间序列数据进行相关性分析,获取数据的自相关系数和偏相关系数,并发送至模型构建模块;
4)模型构建模块根据自相关系数和偏相关系数选取模型结构作为建模系数结构;
4-1)判断当平稳序列的偏自相关函数是以p步截尾,自相关函数拖尾,则选用AR(p)模型;
4-2)判断当平稳序列的自相关函数是以q步截尾,偏自相关函数拖尾,则选用MA(q)模型;
4-3)判断当平稳序列的自相关函数和偏相关函数均拖尾,则选用ARMA(p,q)模型;
5)模型构建模块对选取的建模系数结构处理,获取到模型参数,并建立对应的ARIMA模型,将建立的ARIMA模型发送至模型验证模块,并执行步骤6);
6)判断建立对应ARIMA模型是否满足精度要求,若误差分布超出阈值,则重复执行一次步骤4)-步骤5)重新进行确定建模系数结构及模型参数估计;若建立的ARIMA模型满足精度要求,则验证ARIMA模型的平稳性和可逆性,验证通过后,则执行步骤7);
所述步骤6),具体为:
6-1)通过数据采集模块获取已知的某段时间序列数据,利用建立的ARIMA模型进行数据预测,判断原始数据与预测数据的误差大小是否小于预设范围,若误差分布大于预设范围,则需重新进行模型结构识别和参数估计;
验证模型的平稳性和可逆性:
6-2)通过作残差序列自相关函数,检验该模型的残差是否为白噪声序列,若残差满足白噪声序列要求,则该模型作为最终的预测模型使用;
6-3)判断模型的可决系数、AIC信息量、均方误差、平均绝对百分比误差以及泰尔不等系数并给出预测结果的展示和分析,判断是否满足模型预测条件,最终完成模型预测;
7)利用验证通过的ARIMA模型,将采集目标区域位置船舶流量的时间序列数据作为ARIMA模型的输入,ARIMA模型输出未来时间的船舶流量的预测值。
2.根据权利要求1所述的一种基于目标监测数据的船舶交通流量预测方法,其特征在于,所述步骤1),具体为:
数据获取模块获取到某一时间段目标区域船舶流量的原始数据,包括历年各时间段对应的船舶流量数据,构成时间序列数据,并发送至预处理模块;并
以设定单位时间为切片,绘制时间序列数据的散点图以可视化。
3.根据权利要求1所述的一种基于目标监测数据的船舶交通流量预测方法,其特征在于,步骤2)中,所述预处理模块采用ADF检验或KPSS检验对时间序列数据进行预处理;
步骤2)中,所述符合预设条件的时间序列数据为:当时间序列数据为零均值的平稳随机时间序列数据;
其中,平稳指包括均值、方差和协方差的数字特征不随时间的变化而变化,且时间序列在各个时间点上的随机性服从设定的概率分布。
4.根据权利要求1所述的一种基于目标监测数据的船舶交通流量预测方法,其特征在于,所述模型结构为AR(p)自回归模型,则AR(p)自回归模型的模型表达式如下:
A(B)y(t)=e(t)
其中,A(B)=1-a1B-a2B2-…-apBp,e(t)为零均值的白噪声,B为后移算子,即满足:
Bny(t)=y(t-n),n=1,2,...
将数据序列{Yt}转化为以下的AR(p)的形式,即:
y(t)=a1y(t-1)+a2y(t-2)+...+apy(t-p)+e(t)
其中,y(t-p)表示平稳时间序列,ap为AR(p)模型的自回归系数,p代表模型中采用的时序数据本身的滞后阶次,序列e(t)代表AR(p)模型未观测到的随机干扰,即零均值的白噪声序列。
5.根据权利要求1所述的一种基于目标监测数据的船舶交通流量预测方法,其特征在于,所述模型结构为MA(q)移动平均模型,则MA(q)移动平均模型的模型表达式如下:
y(t)=C(B)e(t)
其中,C(B)=1-c1B-c2B2-…-cqBq,e(t)为零均值的白噪声,B为后移算子;
将数据序列{Yt}转化为以下的MA(q)模型的形式,即:
y(t)=e(t)-c1e(t-1)-c2(t-2)-…-cqe(t-q)
其中,cq为MA(q)模型移动平均部分的系数,q为模型中采用的预测误差的滞后阶次。
6.根据权利要求1所述的一种基于目标监测数据的船舶交通流量预测方法,其特征在于,所述模型结构为ARMA(p,q)自回归求积平均模型,则ARMA(p,q)自回归求积平均模型的模型表达式如下:
A(B)y(t)=C(B)e(t)
将数据序列{Yt}转化为以下的ARMA(p,q)模型的形式,即:
y(t)=a1y(t-1)+a2y(t-2)+...+apy(t-p)+e(t)-c1e(t-1)-c2(t-2)-…-cqe(t-q)
其中,y(t-p)表示平稳时间序列,ap为ARMA(p,q)模型的自回归系数,p代表模型中采用的时序数据本身的滞后阶次,cq为ARMA(p,q)模型移动平均部分的系数,q为模型中采用的预测误差的滞后阶次,序列e(t)代表AR(p)模型未观测到的随机干扰,即零均值的白噪声序列。
7.根据权利要求1所述的一种基于目标监测数据的船舶交通流量预测方法,其特征在于,所述步骤5),包括以下步骤:
5-1)以步骤4)选取的模型为基础,通过AIC准则或BIC准则确定模型阶数;
5-2)对步骤S5-1)中定阶后的模型采用最小二乘法进行模型的参数估计,即对模型的自回归系数、滑动平均系数和白噪声方差进行估计,获得条件最小二乘估计值。
8.根据权利要求1所述的一种基于目标监测数据的船舶交通流量预测方法的预测系统,其特征在于,包括:数据获取模块、预处理模块、相关性分析模块、模型构建模块以及模型构建模块;
数据获取模块,用于获取到某一时间段目标区域船舶流量的原始数据,原始数据包括历年各时间段对应的船舶流量数据,构成时间序列数据,并发送至预处理模块;并以设定单位时间为切片,绘制时间序列数据的散点图以可视化;
预处理模块,用于采用ADF检验或KPSS检验对时间序列数据进行预处理;并判断为符合预设条件的时间序列数据发送至相关性分析模块;同时,将判断为不符合预设条件的时间序列数据进行差分处理后,经数据获取模块重新发回预处理模块进行预处理;
相关性分析模块,用于对符合预设条件的时间序列数据进行相关性分析,获取数据的自相关系数和偏相关系数,并发送至模型构建模块;
判断当平稳序列的偏自相关函数是以p步截尾,自相关函数拖尾,则选用AR(p)模型;
判断当平稳序列的自相关函数是以q步截尾,偏自相关函数拖尾,则选用MA(q)模型;
判断当平稳序列的自相关函数和偏相关函数均拖尾,则选用ARMA(p,q)模型;
模型构建模块,用于选取模型结构作为建模系数结构并处理,获取到模型参数,并建立对应的ARIMA模型;
模型验证模块,用于对建立的ARIMA模型进行平稳性和可逆性验证;
通过数据采集模块获取已知的某段时间序列数据,利用建立的ARIMA模型进行数据预测,判断原始数据与预测数据的误差大小是否小于预设范围,若误差分布大于预设范围,则需重新进行模型结构识别和参数估计;通过作残差序列自相关函数,检验该模型的残差是否为白噪声序列,若残差满足白噪声序列要求,则该模型作为最终的预测模型使用;
判断模型的可决系数、AIC信息量、均方误差、平均绝对百分比误差以及泰尔不等系数并给出预测结果的展示和分析,判断是否满足模型预测条件,最终完成模型预测。
9.一种基于目标监测数据的船舶交通流量预测方法的预测系统,其特征在于,包括存储器和处理器;所述存储器,用于存储计算机程序;所述处理器,用于当执行所述计算机程序时,实现如权利要求1-7任一项所述的一种基于目标监测数据的船舶交通流量预测方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310534191.9A CN116611552B (zh) | 2023-05-12 | 2023-05-12 | 一种基于目标监测数据的船舶交通流量预测方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310534191.9A CN116611552B (zh) | 2023-05-12 | 2023-05-12 | 一种基于目标监测数据的船舶交通流量预测方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116611552A CN116611552A (zh) | 2023-08-18 |
CN116611552B true CN116611552B (zh) | 2024-04-26 |
Family
ID=87681086
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310534191.9A Active CN116611552B (zh) | 2023-05-12 | 2023-05-12 | 一种基于目标监测数据的船舶交通流量预测方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116611552B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117149584A (zh) * | 2023-10-31 | 2023-12-01 | 国合通用(青岛)测试评价有限公司 | 基于大数据的多试样标距标记设备的运行监管系统 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105703954A (zh) * | 2016-03-17 | 2016-06-22 | 福州大学 | 一种基于arima模型的网络数据流预测方法 |
CN108564229A (zh) * | 2018-04-26 | 2018-09-21 | 广东省广业科技集团有限公司 | 一种基于arima模型的工业污水进水量预测的方法 |
WO2020010717A1 (zh) * | 2018-07-13 | 2020-01-16 | 南京理工大学 | 一种基于时空相关性的短时交通流预测方法 |
CN113221248A (zh) * | 2021-05-21 | 2021-08-06 | 大连海事大学 | 一种基于pf-garch模型的船舶系统设备状态参数预测方法 |
CN115829237A (zh) * | 2022-11-16 | 2023-03-21 | 中国联合网络通信集团有限公司 | 交通运输工具调动方法、装置、设备、介质及产品 |
-
2023
- 2023-05-12 CN CN202310534191.9A patent/CN116611552B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105703954A (zh) * | 2016-03-17 | 2016-06-22 | 福州大学 | 一种基于arima模型的网络数据流预测方法 |
CN108564229A (zh) * | 2018-04-26 | 2018-09-21 | 广东省广业科技集团有限公司 | 一种基于arima模型的工业污水进水量预测的方法 |
WO2020010717A1 (zh) * | 2018-07-13 | 2020-01-16 | 南京理工大学 | 一种基于时空相关性的短时交通流预测方法 |
CN113221248A (zh) * | 2021-05-21 | 2021-08-06 | 大连海事大学 | 一种基于pf-garch模型的船舶系统设备状态参数预测方法 |
CN115829237A (zh) * | 2022-11-16 | 2023-03-21 | 中国联合网络通信集团有限公司 | 交通运输工具调动方法、装置、设备、介质及产品 |
Non-Patent Citations (1)
Title |
---|
基于SARIMA模型的船舶交通流量预测研究;李晓磊;肖进丽;刘明俊;;武汉理工大学学报(交通科学与工程版)(第02期);155-158+163 * |
Also Published As
Publication number | Publication date |
---|---|
CN116611552A (zh) | 2023-08-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107153874B (zh) | 水质预测方法及系统 | |
CN113901384B (zh) | 顾及全局空间自相关性和局部异质性的地面pm2.5浓度建模方法 | |
CN116611552B (zh) | 一种基于目标监测数据的船舶交通流量预测方法及系统 | |
EP2048603A1 (en) | Learning data set optimization method for signal identification device and signal identification device capable of optimizing the learning data set | |
Clémençon et al. | Scoring anomalies: a M-estimation formulation | |
CN112116198A (zh) | 数据驱动的流程工业状态感知网络关键节点筛选方法 | |
Nguyen et al. | New methodology for improving the inspection policies for degradation model selection according to prognostic measures | |
CN117434153A (zh) | 基于超声波技术的道路无损检测方法及系统 | |
CN113743662B (zh) | 一种基于机器学习的船舶关键技术参数预测方法及系统 | |
CN117009814A (zh) | 一种基于多源信息融合的发动机故障诊断方法及系统 | |
Fuentes et al. | Modeling and predicting complex space–time structures and patterns of coastal wind fields | |
CN112288910B (zh) | 一种船舶航行性能分析方法及系统 | |
CN116384843B (zh) | 数字能源氮气站的能效评估模型训练方法及其监测方法 | |
JP2018034585A (ja) | 船舶の推進性能の解析 | |
Nepomuceno et al. | Nonlinear identification using prior knowledge of fixed points: a multiobjective approach | |
CN110751335B (zh) | 一种区域生态质量年景预测评价方法及装置 | |
Wang et al. | The sensitivity to metocean data on using data-driven methods for a Valemax vessel speed prediction | |
JP2004187649A (ja) | 浮魚資源現存量の区間推定方法、そのためのプログラム及び記録媒体 | |
JPH09146915A (ja) | カオス時系列短期予測装置 | |
CN111831693A (zh) | 一种基于数值型关联分析的光学遥感载荷指标获取方法 | |
Raudiya et al. | Non-stationary order of vector autoregression in significant ocean wave forecasting | |
CN117216489B (zh) | 一种基于互联网的防水涂料质检分析方法及系统 | |
CN115423221B (zh) | 一种设施运行趋势预测方法 | |
Sahu et al. | Spatio-temporal Bayesian modeling of precipitation using rain gauge data from the Hubbard Brook Experimental Forest, New Hampshire, USA | |
Latifoğlu et al. | Prediction of daily streamflow data using ensemble learning models |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |