CN115660137B - 一种船舶风浪航行能耗精准估算方法 - Google Patents
一种船舶风浪航行能耗精准估算方法 Download PDFInfo
- Publication number
- CN115660137B CN115660137B CN202211089206.7A CN202211089206A CN115660137B CN 115660137 B CN115660137 B CN 115660137B CN 202211089206 A CN202211089206 A CN 202211089206A CN 115660137 B CN115660137 B CN 115660137B
- Authority
- CN
- China
- Prior art keywords
- ship
- data
- wind
- speed
- model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Abstract
一种借助大数据挖掘技术,以散货船、集装箱船、油轮姐妹船实测数据集为基础,依据不同船型载货量及气象条件分类,建立各分类下转速与航速、转速与燃油消耗率两阶段回归模型,在海量的航运历史数据集上建模分析,总结运营船舶能耗规律来进行船舶运营能耗数据的管理和监控的船舶风浪航行能耗精准估算方法,可估算不同船型的不同船舶的能耗基线,从而对船舶实际填报能耗进行检验,对航运企业目前的能耗管理方法进行补充及优化,同时为船舶排放指标估算与航线规划提供基础。技术方案是:包括下列步骤:S1.数据采集;S2.数据预处理;S3.离群点剔除;S4.两阶段算法模型搭建;S5.油耗估算模型形成。
Description
技术领域
本发明涉及能耗管理方法,特别是公开了一种针对未经智能化改造的运营船舶风浪航行能耗精准估算方法。
背景技术
作为船舶运营最主要的成本项,能耗监管对于航运企业取得市场竞争力至关重要。目前对船舶能耗估算的研究更多利用智能化改造后的船舶精细化数据,使用黑盒算法,对既定航线、单一船舶或既定船型进行建模分析。这些方法解释性较差,不能推广到其他船型,且目前广泛未经智能化改造的运营船舶不能满足建模数据精度要求。故而不适用于非智能船舶在风浪中航行行为的能耗估算。
发明内容
本发明解决目前广泛未进行智能化改造的运营船舶在风浪中航行能耗估算难题,考虑船舶实际航行气象环境对能耗水平的影响,建立具有一定可解释性的转速与航速、转速与燃油消耗率两阶段估算模型,进而可对人工填报采燃油消耗量数据进行校验。本发明提供一种借助大数据挖掘技术,以散货船、集装箱船、油轮姐妹船实测数据集为基础,依据不同船型载货量及气象条件分类,建立各分类下转速与航速、转速与燃油消耗率两阶段回归模型,在海量的航运历史数据集上建模分析,总结运营船舶能耗规律来进行船舶运营能耗数据的管理和监控的船舶风浪航行能耗精准估算方法,可估算不同船型的不同船舶的能耗基线,从而对船舶实际填报能耗进行检验,对航运企业目前的能耗管理方法进行补充及优化,同时为船舶排放指标估算与航线规划提供基础。
本发明的技术方案是:
一种船舶风浪航行能耗精准估算方法,其特征是包括下列步骤:
S1.数据采集:需要采集的数据包括:船舶AIS数据、WNI气象数据、IHS船舶登记资料等航运行业公共数据,以及目标船舶的船舶报文数据,分别形成数据集,并利用多个数据集进行字段内容的相互补充,并以此进行算法研究;
S2.数据预处理:是指结合船舶运营领域知识,根据数据物理意义对空值与异常值进行补充或剔除,并进行数据分类和航行段处理;
S3.离群点剔除:即剔除与总体随机样本中的其他值处于异常距离的异常值点,包括位于数据序列两端的极端值,也称为极值,或位于整体数据序列分布模式之外的值;为找到定转速下船舶对水航速可信的分布范围,采用一系列离群点及高杠杆点处理算法模型,来在建模前及建模中反复对数据进行筛选,以去除异常值点,还原数据实际分布状态,并帮助模型提升拟合效果;
S4.两阶段算法模型搭建:以对未进行智能化改造的运营船舶在风浪下的能耗估算为目标,对不同分类下清洗后的数据,进行用于转速估算的转速与对水航速、用于油耗估算的转速与燃油小时能耗率的两阶段模型回归;
S5.油耗估算模型形成:基于上述两阶段模型对航行态船舶油耗进行估算,得到航行油耗数值,基于报文数据得到船舶锚靠泊燃油消耗率,对船舶锚靠泊油耗进行估算,得到停泊油耗数据,输出最终油耗估算值为航行油耗数值与停泊油耗数值的总和。
所述S1的所述船舶报文数据为船员通过报文的形式对船舶各项动态进行记录,以动态监控船舶船位及运营详情,包含到港报、离港报、正午报、航次报、加油报等,报文内容含有上报时间、船舶航行状态、目的港、装卸信息、船舶存油信息。
所述S2包括如下步骤:
S21检查船舶风浪航行中缺失数据并进行插值补全,完善特定航行点的识别和将对地航速SOG修正为对水航速;
S22对所需字段进行增加;
S23数据分类;
S24提取机动航行段。
所述S21包括如下步骤:
(1)缺失数据处理
主要处理的缺失数据包括气象数据缺失、船艏向数据缺失;使用克里金法(Kriging)对气象数据的缺失进行插值,普通克里金问题和克里金方差为:
其中,普通克里金问题表示为克里金方差表示为/>C(Si,Sj)为位置i与位置j之间的距离、C(Si,S0)为位置i与位置0之间的距离、C(0)为常数项,Z(Si)为位置i处的测量值,λi为位置i处的测量值的未知权重,S0为预测位置,n为测量值数,在反距离权重法中,权重λi仅取决于预测位置之间的距离;在普通克里金法中,权重λi取决于测量点、预测位置的距离和预测位置周围的测量值之间空间关系的拟合模型;
船艏向变化与所在时间序列轨迹有关,船艏向数据缺失的插值依赖于缺失值前后船艏向数据进行线性插值,以表示船艏向的逐渐变化过程,线性插值(LinearInterpolation)是一种曲线拟合方法,它使用线性多项式在一组离散的已知数据点的范围内构造新的数据点:
其中,(x1,y1)为空值前第一个点,(x2,y2)为空值后第一个点,(x,y)为空值点,x为定位值,y为插值值;设船舶船艏向空值点为Pk=(tk,hdgk),首先以第一个遇到的空值点为初始基准点,找到时间序列前一非空点 Pk-1=(tk-1,hdgk-1),沿时间序列向后,直到遇到n个空值组成的序列后第一个非空点Pk+n=(tk+n,hdgk+n),组成长度为n+2的时间序列;
其次,考虑到实际航行中船舶很少会出现大于180°的转向角,对两个非船艏向求差值,并取小于180°的角为转角,然后,将该时间序列作为线性插值算法的输入,由时间戳为索引定位值,对空值进行插值;
(2)内河航行点识别
对船舶在内河航行状态进行识别,并在建模时进行特殊处理;
(3)计算对水航速
将对地航速SOG修正为对水航速SOW(Speed Over the Water, SOW);
设有船舶AIS轨迹点Pi=(sogi,hdgi,stream_directioni,stream_vali,sowi),其中流速stream_vali单位为米/秒,需要转换为海里/小时:
所述S23包括如下步骤:
对数据依据船舶载货量、风向作用、风级与浪级大小进行分类,在不同分类下借助机器学习算法,分别建立风浪条件下转速估算模型以及能耗估算模型;
将散货船载货状态分为两类,即以航次报开始时间为节点,以航次报填报载货量cargo_volumei为准,对AIS点增加loadi字段,若 cargo_volumei=0则此航段空载,令loadi=0,若cargo_volumei>0则认为此航段满载,令loadi=1;
将集装箱姐妹船数据按照载货量分为三类,以航次报开始时间为节点,以航次报填报载货量cargo_volumei为准,对AIS点增加loadi字段,若cargo_volumei≤45000,则此航段分为一类轻载,令loadi=0,若 cargo_volumei>45000且cargo_volumei≤80000,则此航段分为二类中载,令 loadi=1,若cargo_volumei>80000则此航段分为三类重载,令loadi=2;
在不同载货量下,依据风对船舶作用夹角进行风向分区来对数据二级分类,计算风与船艏向夹角为风遇角,以[0,30°],(30°,150°],(150°,180°] 把风遇角分为三区,即顺风、侧风、逆风:首先,风向数据表示风的来向,需要对风向进行调转180°;其次,风对船体两侧的作用相同,对处理后的风向角取绝对值;然后,将处理后的风向角与船艏向相减,并取360°中的相对小角作为风遇角;设有船舶AIS轨迹点 Pi=(hdgi,wind_directioni),其中hdgi为船艏向,wind_directioni为风的来向。增加新字段风遇角wind_ai和类别标签风遇角分区wind_sectioni,按照上述过程计算风遇角并以30°,150°为界值对其进行分区:
wind_ai′=|((wind_directioni+180)%360)-hdgi|
在载货量分类及风遇角分区后,以风浪大小对数据进行三级分类;风速、浪高数值组合变化多,分类前需要首先采用对风速、浪高采用蒲氏风级、标准海况表进行风浪分级;设有船舶AIS轨迹点 Pi=(wind_vali,wave_vali),其中wind_vali为风速,单位为米/秒,wave_vali为浪高,单位为米。增加新字段风级wind_ni和浪级wave_ni:
所述S2还包括如下步骤:机动航行段识别,即找到船舶在定转速下不同风浪环境场中船舶速度表现区间为目标,然而所基于的数据集并不具备精确的发动机转速变化监控信息,仅依靠船舶正午报中填报的日均转速数据,即同一日间固定转速将对应具有较大变化区间的多个航速数据。
所述S3还包括如下步骤:
对在不同分类数据中对不同转速下的对水航速数据,
S31:首先使用箱型图法对离群点进行剔除;
S32:其次使用非参数Bootstrap-t自举法估算90%置信区间,得到样本集中分布区间;
S33:最后在模型拟合过程中采用库克距离,对模型中的高影响点进行量化识别。
所述箱型图法包括如下步骤:
S311计算中位数Q2:设n为样本数据集中数据值的数量,中位数 Q2是数据集的中间值,若n为奇数,则Q2取第(n+1)/2位置的数,若 n为偶数,则Q2取第n/2、第(n+1)/2位置的数求平均值;
S312计算下四分位数Q1:下四分位数Q1是数据集下半部分的中位数,取第(n+1)/4位置的数;
S313计算上四分位数Q3:上四分位数Q3是数据集上半部分的中位数,取第3*(n+1)/4位置的数;
S314计算四分位数间范围IQR:四分位数间范围IQR是中间50%的数据值的散布区间:
IQR=Q3-Q1
S315计算判断数据正常值得下限和上限:
下限=Q1-1.5*IQR
上限=Q3+1.5*IQR
S315根据下限和上限判断数据集中异常数值范围:即在数据集中,大于上限或小于下限的值都被视作是异常值;只有位于下限和上限内的数据在统计学上被认为是合理的分布数据,可用于进一步的观察或研究。
所述自举法包括如下步骤:
S321:建立模型前需要找到不同分类中每一转速下航速集中分布的区间,航速的分布未知,非参数的自举法估计置信区间对样本分布的性质不做要求,其重抽样性可以对数据的偏态及重尾进行一定修正,对数据集构建相对准确的置信区间,因此选用Bootstrap-t方法对每一转速下的航速分布90%置信区间进行估计。
所述S4具体包括如下步骤:
S41:用于转速估算的转速与对水航速模型回归:
采用机器学习回归算法对转速及对水航速进行回归,将在该转速及航速状态下航行里程作为回归权重,同时,以加权残差平方和为损失函数,对不同分类下回归参数进行迭代求解,回归过程中使用库克距离对高影响点进行剔除,得到不同分类下的回归模型,模型搭建前对响应的线性度、因变量的正态性、自变量的无多重共线性假设进行检验,模型搭建后对残差分布进行分析,确保模型残差满足正态性、无自相关性假设;
S42:用于油耗估算的转速与小时燃油消耗率模型回归:
船舶主机转速可表示船舶主机工况,对不同货载量分类下报文日能耗与转速进行回归,找到满载和空载状态各个转速下合理燃油消耗率;
基于预处理后的数据,在回归建模前需要进行数据的线性相关性检验和观测值的正态性检验,对转速与小时燃油消耗率采用机器学习回归算法模型,将权重设置为,从数据点所属的一组重复测量值来获得的样本方差的倒数,模型建立后对回归模型残差是否满足分布正态性及自相关性假设进行分析。
所述S41具体包括如下步骤:
采用加权最小二乘法对转速及对水航速进行回归。
所述S42具体包括如下步骤:
采用加权线性回归法对转速三次方与小时燃油消耗率模型,包括建模部分与估算部分;
以公式表达,估算流程:
第一阶段模型在分类i下船舶的转速估算:
转速i=f(输入i,权重i)=f(航速i,航程i)
第二阶段模型在载货情况j下船舶的油耗率估算:
油耗率j=f(输入j,权重j)=f(转速j,1/方差j)
船舶总油耗估算由不同分类下与不同载货状态下的的油耗估算总量组成:
船舶总油耗=锚靠油耗+航行油耗=(锚靠油耗率·锚靠时长)+(航行油耗率·航行时长)
其中:
航行油耗率·航行时长=∑载货量分类油耗率j·该载货量分类下的航行时长j
即对不同AIS点,索引到该点所属的气象分类下的第一阶段模型,由航速与航程为输入,计算转速,再根据该点所属的载货量分类,索引至第二阶段模型,由转速与持续时间做输入,得到油耗,再加上锚靠油耗,得到该时段总油耗。
所述S5形成包括如下步骤:
S51:在不同分类下依据转速与对水航速模型,输入航速,完成由航速估算转速;
S52:依据航行状态与估算转速区间,进行转速修正;
S53:由修正后的转速和该航速持续的时间,依据转速与燃油小时油耗率模型来估算油耗。
所述油耗估算模型形成还包括如下步骤:
S54:依据航行状态与转速区间,对处于常用转速区间范围外的估算转速与油耗进行修正,以常用转速上下界为标准,进行以航速为比例的线性修正。
所述油耗估算模型形成还包括如下步骤:
S55:结合靠锚泊状态下的基础油耗消耗率,以及航行状态下的回归模型,依据船舶AIS提供的航行记录对船舶辅机及锚停泊所产生的基础油耗进行估算。
所述步骤S55包括下列步骤:
S551:判断船舶是否为发生装卸的油轮,如果是执行步骤S552,如果不是执行步骤S553;
S552:根据历史装卸时间、载油量与油耗进行回归得到油轮燃油消耗模型,估算时输入载油量与装卸时间对装卸油耗进行估算,然后执行步骤S553;
S553:筛选历史数据中单日航时为0的单日油耗,并根据AIS航行状态1锚泊与状态5靠泊,对停泊状态进行区分,对这些单日油耗进行统计,选取单日填报油耗众数除以停泊时间作为锚靠油耗率;估算时利用AIS状态持续时间来对锚靠油耗进行估算;然后执行步骤S554;
S554:油轮锚靠油耗包括装卸油耗与锚靠油耗两部分,其他船舶仅计算锚靠油耗.
所述油耗估算模型形成还包括如下步骤:
模型检验的油耗估算在测试数据集的全量数据上进行,不对数据集进行离群点和机动航行段的识别及相关操作;对AIS轨迹点按照航行状态及航时、航速进行分段,对每段航行点序列进行上述油耗估算流程。
本发明的效果是:一种船舶风浪航行能耗精准估算方法,包括下列步骤:S1.数据采集;S2.数据预处理;S3.离群点剔除;S4.两阶段算法模型搭建;S5.油耗估算模型形成,
本发明对目前广泛未进行智能化改造的运营船舶,借助大数据挖掘技术,在海量的航运历史数据集上加上船舶实际航行气象环境对能耗水平的影响和实时的目标船舶报文数据一起建模分析,结合船舶在风浪中的实际运营来总结运营船舶能耗规律,从而进行考虑了船舶实际运营环境及业务场景的能耗数据的管理和监控,建立了具有一定可解释性的转速与航速、转速与燃油消耗率两阶段估算模型,可对船舶风浪航行能耗进行精准估算,还可对人工填报采燃油消耗量数据进行校验,可对航运企业目前的能耗管理方法进行补充及优化。即本发明进行基于大数据的运营船舶能耗估算算法所利用的数据包括船舶AIS 数据、WNI气象数据、IHS船舶登记资料等航运行业公共数据,以及目标船舶的报文数据,利用多个数据集进行字段内容的相互补充来进行算法研究,两阶段估算模型的建立是基于不同船型的同类姊妹船,故而计算的结果是这类船舶的一般油耗基线,通过大数据挖掘来计算每个船型的油耗水平基线,方便发现油耗采集数据人工误报或船舶问题。同时,通过对不同船型载货量及气象条件分类,建立各分类下转速与航速、转速与燃油消耗率回归模型,形成了基于实际运营船舶 AIS数据、气象数据、船舶报文的精细化能耗估算算法模型,经验证分析具有一定有效性。
本发明利用这类航行运营船舶能耗规律来进行船舶运营能耗数据的管理和监控,消除了这类船舶在船舶能耗监管方面存在人为错误风险、不能保证数据准确性、更不能支持对船舶能耗性能监视和预测日益增长的需求的技术问题,可对航运企业目前的能耗管理方法进行补充及优化。所开发的算法在所进行实验的散货船、集装箱船、油轮三型船的数据集上均具有较好的表现,模型估算油耗量与MRV填报油耗的误差区间在可控范围内,即该算法被认为在实际未经智能化改造的粗颗粒度船舶数据集上具有一定有效性。同时,本发明所提出的运营船舶风浪中航行的能耗精准估算方法,不仅在航运多源异构数据集联合应用、数据预处理方面可以为航运业数据挖掘与处理提供可行思路,而且不受单船约束,可以对多种船型进行外推,为实际批量化船管数据分析与管理提供参考,帮助实现船舶能耗数据管理数字化,对航运企业实际船舶运营管理中的能耗、排放等测算提供数据支撑。
下面结合附图和实施例对本发明做进一步的说明。
附图说明
图1为本发明程序流程框图;
图2为图1中数据基础描述表;
图3为图1中数据预处理程序流程框图;
图4为本发明方法对水航速计算示意图;
图5是本发明方法船舶载货量分布直方图;
图6是本发明方法风向分区示意图;
图7是本发明方法浪级计算表;
图8为图1中利群点剔除程序流程框图;
图9为图3中箱型图法程序流程框图;
图10是本发明方法利用箱型图示意图;
图11为图1中两阶段算法模型搭建程序流程图;
图12为VLOC远字头姐妹船转速与对水航速回归结果图;
图13为VLOC远字头转速与小时燃油消耗率回归对比图;
图14为图5中燃油消耗率与转速模型流程框图;
图15为图1中油耗估算模型流程框图;
图16为图6中对船舶辅机及锚停泊产生基础油耗估算流程框图;
图17运营船舶能耗估算模型算法流程总图;
图18是本发明方法以空值点对应的气象经纬点示意图;
图19为本发明方法中长江流域几何多边形;
图20为本发明方法中增加region_cj字段识别内河航行点;
图21为本发明方法分船型数据分类汇总表;
图22为本发明方法中集装箱姐妹船分类-9日均转速67.88对水航速数据箱型图法分析图;
图23为本发明方法中集装箱姐妹船两分类样本组下转速与对水速度分布箱型图法处理前后对比图;
图24为本发明方法集装箱姐妹船两分类样本组下转速与对水速度分布置信区间对比图;
图25为本发明方法集装箱姐妹船分类-9转速与对水速度,在库克距离法筛选前的加权线性回归分析结果;
图26为本发明方法集装箱姐妹船分类-9转速与对水速度加权线性回归库克距离法筛选后使用库克距离法筛选高影响点后结果;
图27为本发明方法VLOC远字头姐妹船测试集模型效果评价;
图28为本发明方法VLOC远字头某单船能耗估算结果对比。
具体实施方式
图1中,一种船舶风浪航行能耗精准估算方法,包括下列步骤:
S1.数据采集:需要采集的数据包括:船舶AIS数据、WNI气象数据、IHS船舶登记资料等航运行业公共数据,以及目标船舶的船舶报文数据,分别形成数据集,并利用多个数据集进行字段内容的相互补充,并以此进行算法研究。
(1)船舶AIS数据:
船舶自动识别系统(Automatic Identification System,简称AIS系统),由岸基设施和船载设备共同组成,AIS系统配合全球定位系统 (GPS)将船位、船速、改变航向率及航向等船舶动态结合船名、呼号、吃水及危险货物等船舶静态资料由甚高频(VHF)向附近水域船舶及岸台广播,使邻近船舶及岸台能及时掌握附近海面所有船舶之动静态资讯,得以立刻互相通话协调,采取必要避让行动,有效保障船舶航行安全。AIS数据提供的船舶航迹点信息是船舶在该时间点的水文气象、航区环境、航行安全等多因素影响下船舶航行情景的真实反映,能够为数据分析提供最为精细化的研究资料。
(2)WNI气象数据:
日本天气新闻公司(Weather News Incorp.WNI)是世界上最大的民间气象公司,以面向海运、航空等行业气象服务为核心,覆盖气象观测、数据分析、预报及服务全流程的气象服务生态公司。本发明所采用的气象数据为模式分辨率为1*1经纬度网格,根据AIS数据提供的该时间点的经纬度船位信息,匹配当时的海上导航环境气象数据,对船舶航行气象条件及运动状态进行还原。
(3)IHS船舶登记资料:
IHS Markit Ltd.一家整合了数据库、数据分析、咨询、专业观点、出版的咨询公司/信息服务等多元化信息提供商。由IHS Markit收集提供的船舶静态信息覆盖全球所有已登记船只,该信息包括
(4)船舶报文:
为实现航运企业数字化管理,动态监控船舶船位及运营详情,船员通过报文的形式对船舶各项动态进行记录,其中包含到港报、离港报、正午报、航次报、加油报等,报文内容含有上报时间、船舶航行状态、目的港、装卸信息、船舶存油等信息(数据基础描述见图2)。
S2.数据预处理:是指结合船舶运营领域知识,根据数据物理意义对空值与异常值进行补充或剔除,并进行数据分类和航行段处理;
S3.离群点剔除:即剔除与总体随机样本中的其他值处于异常距离的异常值点,包括位于数据序列两端的极端值,也称为极值,或位于整体数据序列分布模式之外的值;为找到定转速下船舶对水航速可信的分布范围,采用一系列离群点及高杠杆点处理算法模型,来在建模前及建模中反复对数据进行筛选,以去除异常值点,还原数据实际分布状态,并帮助模型提升拟合效果;
S4.两阶段算法模型搭建:以对未进行智能化改造的运营船舶在风浪下的能耗估算为目标,对不同分类下清洗后的数据,进行用于转速估算的转速与对水航速、用于油耗估算的转速与燃油小时能耗率的两阶段模型回归;
S5.油耗估算模型形成:基于上述两阶段模型对航行态船舶油耗进行估算,得到航行油耗数值,基于报文数据得到船舶锚靠泊燃油消耗率,对船舶锚靠泊油耗进行估算,得到停泊油耗数据,输出最终油耗估算值为航行油耗数值与停泊油耗数值的总和。
所述S1的所述船舶报文数据为船员通过报文的形式对船舶各项动态进行记录,以动态监控船舶船位及运营详情,包含到港报、离港报、正午报、航次报、加油报等,报文内容含有上报时间、船舶航行状态、目的港、装卸信息、船舶存油信息。数据量的选取最好是近两年内的数据,可以保证船舶航行工况更符合目前状态,同时数据量不能太少,数据量过少会造成数据关联趋势不明显。
图3中,所述S2包括如下步骤:
S21检查船舶风浪航行中缺失数据并进行插值补全,完善特定航行点的识别和将对地航速SOG修正为对水航速;
S22对所需字段进行增加;
S23数据分类;
S24提取机动航行段。
所述S21包括如下步骤:
(1)缺失数据处理
主要处理的缺失数据包括气象数据缺失、船艏向数据缺失;使用克里金法(Kriging)对气象数据的缺失进行插值,普通克里金问题和克里金方差为:
其中,普通克里金问题表示为克里金方差表示为/>C(Si,Sj)为位置i与位置j之间的距离、C(Si,S0)为位置i与位置0之间的距离、C(0)为常数项,Z(Si)为位置i处的测量值,λi为位置i处的测量值的未知权重,S0为预测位置,n为测量值数,在反距离权重法中,权重λi仅取决于预测位置之间的距离;在普通克里金法中,权重λi取决于测量点、预测位置的距离和预测位置周围的测量值之间空间关系的拟合模型;
船艏向变化与所在时间序列轨迹有关,船艏向数据缺失的插值依赖于缺失值前后船艏向数据进行线性插值,以表示船艏向的逐渐变化过程,线性插值(LinearInterpolation)是一种曲线拟合方法,它使用线性多项式在一组离散的已知数据点的范围内构造新的数据点:
其中,(x1,y1)为空值前第一个点,(x2,y2)为空值后第一个点,(x,y)为空值点,x为定位值,y为插值值;设船舶船艏向空值点为Pk=(tk,hdgk),首先以第一个遇到的空值点为初始基准点,找到时间序列前一非空点Pk-1=(tk-1,hdgk-1),沿时间序列向后,直到遇到n个空值组成的序列后第一个非空点Pk+n=(tk+n,hdgk+n),组成长度为n+2的时间序列;
其次,考虑到实际航行中船舶很少会出现大于180°的转向角,对两个非船艏向求差值,并取小于180°的角为转角,然后,将该时间序列作为线性插值算法的输入,由时间戳为索引定位值,对空值进行插值;
(2)内河航行点识别
对船舶在内河航行状态进行识别,并在建模时进行特殊处理;
(3)计算对水航速
将对地航速SOG修正为对水航速SOW(Speed Over the Water, SOW);
设有船舶AIS轨迹点Pi=(sogi,hdgi,stream_directioni,stream_vali,sowi),其中流速stream_vali单位为米/秒,需要转换为海里/小时:
对水航速计算示意图见图4。
所述S23包括如下步骤:
对数据依据船舶载货量、风向作用、风级与浪级大小进行分类,在不同分类下借助机器学习算法,分别建立风浪条件下转速估算模型以及能耗估算模型;
将散货船载货状态分为两类,即以航次报开始时间为节点,以航次报填报载货量cargo_volumei为准,对AIS点增加loadi字段,若 cargo_volumei=0则此航段空载,令loadi=0,若cargo_volumei>0则认为此航段满载,令loadi=1;(载货量分布直方图见图5)
将集装箱姐妹船数据按照载货量分为三类,以航次报开始时间为节点,以航次报填报载货量cargo_volumei为准,对AIS点增加loadi字段,若cargo_volumei≤45000,则此航段分为一类轻载,令loadi=0,若 cargo_volumei>45000且cargo_volumei≤80000,则此航段分为二类中载,令 loadi=1,若cargo_volumei>80000则此航段分为三类重载,令loadi=2;
在不同载货量下,依据风对船舶作用夹角进行风向分区来对数据二级分类,计算风与船艏向夹角为风遇角,以[0,30°],(30°,150°],(150°,180°] 把风遇角分为三区,即顺风、侧风、逆风。首先,风向数据表示风的来向,需要对风向进行调转180°;其次,风对船体两侧的作用相同,对处理后的风向角取绝对值;然后,将处理后的风向角与船艏向相减,并取360°中的相对小角作为风遇角;设有船舶AIS轨迹点Pi=(hdgi,wind_directioni),其中hdgi为船艏向,wind_directioni为风的来向。增加新字段风遇角wind_ai和类别标签风遇角分区wind_sectioni,按照上述过程计算风遇角并以30°,150°为界值对其进行分区:
wind_ai′=|((wind_directioni+180)%360)-hdgi|
(风向分区示意图见图6)
在载货量分类及风遇角分区后,以风浪大小对数据进行三级分类。风速、浪高数值组合变化多,分类前需要首先采用对风速、浪高采用蒲氏风级、标准海况表进行风浪分级;设有船舶AIS轨迹点 Pi=(wind_vali,wave_vali),其中wind_vali为风速,单位为米/秒,wave_vali为浪高,单位为米。增加新字段风级wind_ni和浪级wave_ni:
(浪级计算表见图7)
S2还包括如下步骤:机动航行段识别,即找到船舶在定转速下不同风浪环境场中船舶速度表现区间为目标,然而所基于的数据集并不具备精确的发动机转速变化监控信息,仅依靠船舶正午报中填报的日均转速数据,即同一日间固定转速将对应具有较大变化区间的多个航速数据。
图8中,所述S3还包括如下步骤:
对在不同分类数据中对不同转速下的对水航速数据,
S31:首先使用箱型图法对离群点进行剔除;
S32:其次使用非参数Bootstrap-t自举法估算90%置信区间,得到样本集中分布区间;
S33:最后在模型拟合过程中采用库克距离,对模型中的高影响点进行量化识别。
图9中,所述箱型图法包括如下步骤:
箱形图(Box-plot)又被称为盒须图、盒式图或箱线图,是一种可以直观地描绘样本数据分散情况的统计图形方法。箱形图可以显示数据的不同特征,例如最低值、下四分位数、中位数、上四分位数、最高值以及数据集中是否存在潜在的异常观测值,箱形图对异常值的检测并不受数据偏态和尾重的影响,(箱型图示意图见图10)
S311计算中位数Q2:设n为样本数据集中数据值的数量,中位数 Q2是数据集的中间值,若n为奇数,则Q2取第(n+1)/2位置的数,若 n为偶数,则Q2取第n/2、第(n+1)/2位置的数求平均值;
S312计算下四分位数Q1:下四分位数Q1是数据集下半部分的中位数,取第(n+1)/4位置的数;
S313计算上四分位数Q3:上四分位数Q3是数据集上半部分的中位数,取第3*(n+1)/4位置的数;
S314计算四分位数间范围IQR:四分位数间范围IQR是中间50%的数据值的散布区间:
IQR=Q3-Q1
S315计算判断数据正常值得下限和上限:
下限=Q1-1.5*IQR
上限=Q3+1.5*IQR
S315根据下限和上限判断数据集中异常数值范围:即在数据集中,大于上限或小于下限的值都被视作是异常值;只有位于下限和上限内的数据在统计学上被认为是合理的分布数据,可用于进一步的观察或研究。
所述自举法包括如下步骤:
建立模型前需要找到不同分类中每一转速下航速集中分布的区间,航速的分布未知,非参数的自举法估计置信区间对样本分布的性质不做要求,其重抽样性可以对数据的偏态及重尾进行一定修正,对数据集构建相对准确的置信区间,因此选用Bootstrap-t方法对每一转速下的航速分布90%置信区间进行估计。
图11中,所述S4具体包括如下步骤:
S41:用于转速估算的转速与对水航速模型回归:
采用机器学习回归算法对转速及对水航速进行回归,将在该转速及航速状态下航行里程作为回归权重,同时,以加权残差平方和为损失函数,对不同分类下回归参数进行迭代求解,回归过程中使用库克距离对高影响点进行剔除,得到不同分类下的回归模型,模型搭建前对响应的线性度、因变量的正态性、自变量的无多重共线性假设进行检验,模型搭建后对残差分布进行分析,确保模型残差满足正态性、无自相关性假设;
优选的,采用加权最小二乘法对转速及对水航速进行回归,将在该转速及航速状态下航行里程作为回归权重,航行里程越大的点应在回归中具有更大的贡献度,即更能代表航行常态的样本点对回归线的影响更大。同时,以加权残差平方和为损失函数,对不同分类下线性回归参数进行迭代求解,回归过程中使用库克距离对高影响点进行剔除,得到12类回归线如下图所示。可以看到在空满载两种负载下,随着风向由顺风、到侧风再到逆风状态,以及风级浪级的增大,船舶航行阻力增大,相同转速下所对应的航速具有减小的趋势,意味着要达到相同的航速,船舶主机需要提供更大的动力。载货量的增加,以及风浪条件的恶化,都会使得转速与航速回归线下移,即数据表现与模型回归结果符合现实逻辑,图12为VLOC远字头姐妹船转速与对水航速回归结果图。
S42:用于油耗估算的转速与小时燃油消耗率模型回归:
船舶主机转速可表示船舶主机工况,对不同货载量分类下报文日能耗与转速进行回归,找到满载和空载状态各个转速下合理燃油消耗率;
基于预处理后的数据,在回归建模前需要进行数据的线性相关性检验和观测值的正态性检验,对转速与小时燃油消耗率采用机器学习回归算法模型,将权重设置为,从数据点所属的一组重复测量值来获得的样本方差的倒数,模型建立后对回归模型残差是否满足分布正态性及自相关性假设进行分析。
优选的,采用加权线性回归法对转速三次方与小时燃油消耗率模型,包括建模部分与估算部分;
以公式表达,估算流程:
第一阶段模型在分类i下船舶的转速估算:
转速i=f(输入i权重i)=f(航速i,航程i)
第二阶段模型在载货情况j下船舶的油耗率估算:
油耗率j=f(输入j,权重j)=f(转速j,1/方差j)
船舶总油耗估算由不同分类下与不同载货状态下的的油耗估算总量组成:
船舶总油耗=锚靠油耗+航行油耗=(锚靠油耗率·锚靠时长)+(航行油耗率·航行时长)
其中:
航行油耗率·航行时长=∑载货量分类油耗率j·该载货量分类下的航行时长j
即对不同AIS点,索引到该点所属的气象分类下的第一阶段模型,由航速与航程为输入,计算转速,再根据该点所属的载货量分类,索引至第二阶段模型,由转速与持续时间做输入,得到油耗,再加上锚靠油耗,得到该时段总油耗。VLOC远字头转速与小时燃油消耗率回归对比图参见图13,燃油消耗率与转速模型流程框图参见图14。
图15中,所述S5形成包括如下步骤:
S51:在不同分类下依据转速与对水航速模型,输入航速,完成由航速估算转速;
S52:依据航行状态与估算转速区间,进行转速修正;
S53:由修正后的转速和该航速持续的时间,依据转速与燃油小时油耗率模型来估算油耗。
S54:依据航行状态与转速区间,对处于常用转速区间范围外的估算转速与油耗进行修正,以常用转速上下界为标准,进行以航速为比例的线性修正。
S55:结合靠锚泊状态下的基础油耗消耗率,以及航行状态下的回归模型,依据船舶AIS提供的航行记录对船舶辅机及锚停泊所产生的基础油耗进行估算。
图16中,所述步骤S55包括下列步骤:
S551:判断船舶是否为发生装卸的油轮,如果是执行步骤S552,
如果不是执行步骤S553;
S552:根据历史装卸时间、载油量与油耗进行回归得到油轮燃油消耗模型,估算时输入载油量与装卸时间对装卸油耗进行估算,然后执行步骤S553;
S553:筛选历史数据中单日航时为0的单日油耗,并根据AIS航行状态1锚泊与状态5靠泊,对停泊状态进行区分,对这些单日油耗进行统计,选取单日填报油耗众数除以停泊时间作为锚靠油耗率;估算时利用AIS状态持续时间来对锚靠油耗进行估算;然后执行步骤S554;
S554:油轮锚靠油耗包括装卸油耗与锚靠油耗两部分,其他船舶仅计算锚靠油耗.
所述油耗估算模型形成还包括如下步骤:
模型检验的油耗估算在测试数据集的全量数据上进行,不对数据集进行离群点和机动航行段的识别及相关操作;对AIS轨迹点按照航行状态及航时、航速进行分段,对每段航行点序列进行上述油耗估算流程,运营船舶能耗估算模型算法流程总图参见图17。
两阶段算法模型搭建工作原理说明如下:
本发明以对未进行智能化改造的运营船舶在风浪下的能耗估算为目标,通过对不同分类下清洗后的数据,进行航速与转速、转速与能耗的两阶段模型回归,完成以运营船舶AIS数据及气象数据为算法输入,单日估计能耗值为算法输出的算法闭环。其中,两阶段回归模型可有多种选择,本发明为简单明了的举例说明,以加权最小二乘回归模型为例。
(1)转速与对水航速模型回归
船舶在不同风浪环境下主机特性可用其主要技术参数随转速的变化关系表示,船舶航速可以反映航行过程中所受到不同阻力负载,因此本发明对不同航行因素分类下的船舶航速及转速的关系进行研究,尝试找到在不同航行因素组合下,船舶处于各个转速时的合理航速表现。
本发明采用机器学习回归算法对转速及对水航速进行回归,将在该转速及航速状态下航行里程作为回归权重,航行里程越大的点应在回归中具有更大的贡献度,即更能代表航行常态的样本点对拟合模型的影响更大。同时,以加权残差平方和为损失函数,对不同分类下回归参数进行迭代求解,回归过程中使用库克距离对高影响点进行剔除,得到不同分类下的回归模型。模型搭建前需对响应的线性度、因变量的正态性、自变量的无多重共线性假设进行检验,模型搭建后对残差分布进行分析,确保模型残差满足正态性、无自相关性假设。
(2)转速与小时燃油消耗率模型回归
船舶主机转速可表示船舶主机工况,对不同货载量分类下报文日能耗与转速进行回归,找到满载和空载状态各个转速下合理燃油消耗率。
基于预处理后的数据,在回归建模前需要进行数据的线性相关性检验和观测值的正态性检验。本发明对转速与小时燃油消耗率采用机器学习回归算法模型,由于数据中存在大量重复项,将权重设置为,从数据点所属的一组重复测量值来获得的样本方差的倒数,来减少噪音大的值对拟合的影响程度。模型建立后对回归模型残差是否满足分布正态性及自相关性假设进行分析。
(1)油耗估算模型形成
本发明提出的运营船舶能耗精细化估算模型由转速与航速回归模型、转速与小时燃油消耗率的回归模型共同组成,本章以日油耗、月油耗、船舶半年油耗的估算值与MRV实际填报间的误差进行对比,对能耗精细化模型估算性能进行评估与分析。
本发明所开发的运营船舶能耗精细化估算模型包括由航速到转速、再由转速到油耗的两阶段预测。首先,以船舶AIS数据与后报气象数据、报文数据中的载货量字段为基础完成数据分类标签的标定。其次,在不同分类下依据相对应的模型,输入航速,完成由航速估算转速。然后,由修正后的转速、该航速持续的时间来估算油耗的算法闭环逻辑。此过程中需要强调的是,模型回归在不同船型的可信及常用转速下完成,因此需要对处于常用转速区间范围外的估算转速与油耗进行修正,以常用转速上下界为标准,进行以航速为比例的线性修正。此外,还需要考虑船舶辅机及锚停泊所产生的基础油耗。例如,可以通过收集单日航时为零的日油耗填报众数,得到某姐妹船停泊时的基础油耗大约为5.5吨/天,靠泊时基础油耗大约为4.5吨/天。结合靠锚泊状态下的基础油耗消耗率,以及航行状态下的回归模型,依据船舶AIS提供的航行记录对船舶的油耗完成估算。不同于建模数据的预处理流程,模型检验的油耗估算在测试数据集的全量数据上进行,不对数据集进行离群点和机动航行段的识别及相关操作。对AIS 轨迹点按照航行状态及航时、航速进行分段,对每段航行点序列进行上述油耗估算流程。
下面为本发明方法各步骤具体方法应用实例介绍。
1、数据预处理:气象空值插值
以对风速空值插值为例,首先得到该空值最近的刷新时间切片下所对应的气象信息经纬度点Pi=(loni,lati,ti,windi),以及四周非空值点的经纬度、风速值Paround=(lonj,latj,tj,windj),其次将该空值点的经纬度、周围非空点的经纬度与风速值输入克里金算法模型,设置步长为0.01 度,对该空值点风速进行计算。(图18为利用克里金法对风速空值插值前后对比图)
图18中以空值点对应的气象经纬点 Pk=(127,28,′2020-7-23 06:00:00+08′,null)的处理为例,填补后 windi=2.8755取整后为3。依据此算法,对气象数据中风浪流数据空值进行处理。
2、数据预处理:内河航行点识别
以长江内航行为例,通过PostgreSQL中的PostGIS创建长江流域几何多边形,对AIS点上报经纬度在多边形内的点进行标记。设长江区域多边形polygonCJ=(lon0 lato,lon1 lat1,...lonn latn),对船舶AIS点 Pi=(loni,lati,region_cji)增加类别变量标签region_cj字段,输入Pi点的经纬度信息,若该点在多边形polygonCJ内,则region_cji=1,否则region_cji=0。 (图19为长江流域几何多边形,图20增加region_cj字段识别内河航行点)
3、数据预处理:数据分类
以实验所用集装箱船为例,分别按照载货量、风遇角、风级浪级顺序对数据进行分类情况如下:(图21为分船型数据分类汇总表)
4、离群点剔除机制:箱型图法
图22为集装箱姐妹船分类-9日均转速67对水航速数据箱型图法分析
本发明采用的数据在某些细小分类下,由于数据量偏小,可能存在偏态,箱形图对异常值的检测并不受数据分布的影响,因此对集装箱姐妹船某分类下转速为67.88的对水航速数据采用箱型图法进行分析,在9300条数据中,中位数Q2为19.938,下四分位数Q1取19.466,上四分位数Q3取20.308,则四分位数间范围IQR为0.842,可以得到根据箱型图法,该分类下转速为96的对水航速合理分布应在 [18.204,21.570],从而去除279条在此范围之外的异常值。然后用同样的方法,对该分类下所有转速对应的对水航速值进行处理,由此得到该分类下不同转速。本发明选择集装箱姐妹船一组大样本分类与一组小样本分类,对算法处理结果进行对比,其中大样本分类-9为载货量 (45000,80000]区间侧风区非好天气组,样本容量为158259,小样本分类 -11为载货量(45000,80000]区间逆风区非好天气组,样本容量为57512。箱型图法在不同数据量及分布下均有较好的效果,由下图可以看到在大样本分类组和小样本分类组中,每一转速下的航速分布区间均有所收缩,离群点有明显减少,两变量间的正相关关系趋于明显。
图23为集装箱姐妹船两分类样本组下转速与对水速度分布箱型图法处理前后对比图。
5、离群点剔除机制:Bootstrap自举法
图24集装箱姐妹船两分类样本组下转速与对水速度分布置信区间对比。
本发明分别采用传统公式法与Bootstrap-t自举法,对集装箱姐妹船某分类下转速与对水速度分布90%置信区间进行计算对比,并对算法在大样本和小样本组中的效果进行对比,传统公式法前提假设为各转速下航速分布均服从正态分布,而Bootstrap-t自举法对样本分布不做要求,由上图对比可以看到,在大样本分类中两种方法得到的置信区间差别不大,在小样本分类中自举法对区间的估计更加紧凑,对离群点剔除效果好于公式法。此外,在两类样本下,自举法处理后的结果中转速与航速间的皮尔森相关系数均有提升,即说明该方法具有一定筛选离群点的作用。同时也能说明两变量间存在较强的线性相关性,皮尔森相关系数处于0.6-0.8即为强相关。
6、离群点剔除机制:Cook′s distance库克距离
选取实验船型中的集装箱船为例,并在回归中选用加权最小二乘回归模型为例对库克距离的作用及效果进行说明:
克距离的作用及效果进行说明:
图25集装箱姐妹船分类-9转速与对水速度加权线性回归库克距离法筛选前
由上图可见集装箱姐妹船分类-9转速与对水速度,在库克距离法筛选前的加权线性回归分析结果,模型R-square确定系数为0.535,将数据点按索引及其加权库克距离分数可视化显示为高影响力点检测图,以快速显示数据集中可能影响WLS回归模型的样本的百分比,并使用启发式算法计算得到库克距离阈值0.0075,发现4.39%的样本点的库克距离大于0.0075,即对模型拟合影响力相对较大。同时对模型结果残差进行可视化分析,可以看到残差基本呈正态分布在0 附近,利用Q-Q图验证残差基本满足正态分布,即满足线性度和正态性条件,然而较小的预测值确实存在略微偏向负值的趋势,并且随着预测值的增加,偏离程度也在增加,这表明违反了同质性条件。对高影响力点检测图和残差图比对,发现具有较大库克距离的高影响点大部分属于离群点。基于以上分析,考虑在删除库克距离大于阈值的 112个异常样本点后,再次进行模型回归。
图26集装箱姐妹船分类-9转速与对水速度加权线性回归库克距离法筛选后使用库克距离法筛选高影响点后,模型R-square确定系数由0.535提升至0.768,观测值集中在预测值周围,并均处于加权预测范围内。同时,模型结果残差控制在[-1,1]区间附近,由Q-Q图可见残差分布与正态值更加接近,即去除高影响点后模型拟合效果得到较好提升。同时对小样本分类进行同样的操作,发现库克距离法筛查离群点在小样本集上也具有一定效果,模型R-square确定系数由 0.519提升至0.732,筛选后的两变量线性相关性加强,同时残差分布有所收敛。
7、模型计算结果:
以三种船型中的散货船的超大型矿砂船VLOC远字头姐妹船为例,对两阶段模型搭建及评估予以说明,本发明采用加权最小二乘法为例,对转速及对水航速、转速与油耗率进行回归:
图27为VLOC远字头姐妹船测试集模型效果评价,图28为 VLOC远字头某单船能耗估算结果对比。
分别以日油耗、月油耗、船舶半年油耗的估算值与报文实际填报间的误差进行对比。使用决定系数(R-square)来评价单船在不同时间统计维度上的模型预测表现。VLOC远字头姐妹船在三个时间维度统计下的综合平均R-square为0.846,单船日平均绝对误差为4.15,即日油耗平均估计误差在4.15吨左右,单船月油耗平均估计误差在 73.972吨左右,半年为384.739吨。基于以上结果统计与分析,本发明所提出的能耗精细化估算算法模型在各自船型上具有一定的有效性,模型估算油耗量与报文填报油耗的误差区间在可控范围内。
Claims (12)
1.一种船舶风浪航行能耗精准估算方法,其特征是包括下列步骤:
S1.数据采集:需要采集的数据包括:船舶AIS数据、WNI气象数据、IHS船舶登记资料以及目标船舶的船舶报文数据,分别形成数据集,并利用多个数据集进行字段内容的相互补充,并以此进行算法研究;
S2.数据预处理:是指结合船舶运营领域知识,根据数据物理意义对空值与异常值进行补充或剔除,并进行数据分类和航行段处理;
S21检查船舶风浪航行中缺失数据并进行插值补全,完善特定航行点的识别和将对地航速SOG修正为对水航速;
S22对所需字段进行增加;
S23数据分类;
对数据依据船舶载货量、风向作用、风级与浪级大小进行分类,在不同分类下借助机器学习算法,分别建立风浪条件下转速估算模型以及能耗估算模型;
将散货船载货状态分为两类,即以航次报开始时间为节点,以航次报填报载货量cargo_volumei为准,对AIS点增加loadi字段,若cargo_volumei=0则此航段空载,令loadi=0,若cargo_volumei>0则认为此航段满载,令loadi=1;
将集装箱姐妹船数据按照载货量分为三类,以航次报开始时间为节点,以航次报填报载货量cargo_volumei为准,对AIS点增加loadi字段,若cargo_volumei≤45000,则此航段分为一类轻载,令loadi=0,若cargo_volumei>45000且cargo_volumei≤80000,则此航段分为二类中载,令loadi=1,若cargo_volumei>80000则此航段分为三类重载,令loadi=2;
在不同载货量下,依据风对船舶作用夹角进行风向分区来对数据二级分类,计算风与船艏向夹角为风遇角,以[0,30°],(30°,150°],(150°,180°]把风遇角分为三区,即顺风、侧风、逆风:首先,风向数据表示风的来向,需要对风向进行调转180°;其次,风对船体两侧的作用相同,对处理后的风向角取绝对值;然后,将处理后的风向角与船艏向相减,并取360°中的相对小角作为风遇角;设有船舶AIS轨迹点Pi=(hdgi,wind_directioni),其中hdgi为船艏向,wind_directioni为风的来向,增加新字段风遇角wind_ai和类别标签风遇角分区wind_sectioni,按照上述过程计算风遇角并以30°,150°为界值对其进行分区:
wind_ai′=|((wind_directioni+180)%360)-hdgi|
在载货量分类及风遇角分区后,以风浪大小对数据进行三级分类;风速、浪高数值组合变化多,分类前需要首先采用对风速、浪高采用蒲氏风级、标准海况表进行风浪分级;设有船舶AIS轨迹点Pi=(wind_vali,wave_vali),其中wind_vali为风速,单位为米/秒,wave_vali为浪高,单位为米,增加新字段风级wind_ni和浪级wave_ni:
S24提取机动航行段;
S3.离群点剔除:即剔除与总体随机样本中的其他值处于异常距离的异常值点,包括位于数据序列两端的极端值,也称为极值,或位于整体数据序列分布模式之外的值;为找到定转速下船舶对水航速可信的分布范围,采用一系列离群点及高杠杆点处理算法模型,来在建模前及建模中反复对数据进行筛选,以去除异常值点,还原数据实际分布状态,并帮助模型提升拟合效果;
S4.两阶段算法模型搭建:以对未进行智能化改造的运营船舶在风浪下的能耗估算为目标,对不同分类下清洗后的数据,进行用于转速估算的转速与对水航速、用于油耗估算的转速与燃油小时能耗率的两阶段模型回归;
S41:用于转速估算的转速与对水航速模型回归:
采用机器学习回归算法对转速及对水航速进行回归,将在该转速及航速状态下航行里程作为回归权重,同时,以加权残差平方和为损失函数,对不同分类下回归参数进行迭代求解,回归过程中使用库克距离对高影响点进行剔除,得到不同分类下的回归模型,模型搭建前对响应的线性度、因变量的正态性、自变量的无多重共线性假设进行检验,模型搭建后对残差分布进行分析,确保模型残差满足正态性、无自相关性假设;
S42:用于油耗估算的转速与小时燃油消耗率模型回归:
船舶主机转速可表示船舶主机工况,对不同货载量分类下报文日能耗与转速进行回归,找到满载和空载状态各个转速下合理燃油消耗率;
基于预处理后的数据,在回归建模前需要进行数据的线性相关性检验和观测值的正态性检验,对转速与小时燃油消耗率采用机器学习回归算法模型,将权重设置为从数据点所属的一组重复测量值来获得的样本方差的倒数,模型建立后对回归模型残差是否满足分布正态性及自相关性假设进行分析;
S42具体包括如下步骤:
采用加权线性回归法对转速三次方与小时燃油消耗率模型,包括建模部分与估算部分;
以公式表达,估算流程:
第一阶段模型在分类i下船舶的转速估算:
转速i=f(输入i,权重i)=f(航速i,航程i)
第二阶段模型在载货情况j下船舶的油耗率估算:
油耗率j=f(输入j,权重j)=f(转速j,1/方差j)
船舶总油耗估算由不同分类下与不同载货状态下的油耗估算总量组成:
船舶总油耗=锚靠油耗+航行油耗=(锚靠油耗率·锚靠时长)+(航行油耗率·航行时长)
其中:
航行油耗率·航行时长=∑载货量分类油耗率j·该载货量分类下的航行时长j
即对不同AIS点,索引到该点所属的气象分类下的第一阶段模型,由航速与航程为输入,计算转速,再根据该点所属的载货量分类,索引至第二阶段模型,由转速与持续时间做输入,得到油耗,再加上锚靠油耗,得到该时段总油耗;
S5.油耗估算模型形成:基于上述两阶段模型对航行态船舶油耗进行估算,得到航行油耗数值,基于报文数据得到船舶锚靠泊燃油消耗率,对船舶锚靠泊油耗进行估算,得到停泊油耗数据,输出最终油耗估算值为航行油耗数值与停泊油耗数值的总和。
2.根据权利要求1所述的船舶风浪航行能耗精准估算方法,其特征是所述S1的所述船舶报文数据为船员通过报文的形式对船舶各项动态进行记录,以动态监控船舶船位及运营详情,包含到港报、离港报、正午报、航次报、加油报,报文内容含有上报时间、船舶航行状态、目的港、装卸信息、船舶存油信息。
3.根据权利要求1或2所述的船舶风浪航行能耗精准估算方法,其特征是所述S21包括如下步骤:
(1)缺失数据处理
处理的缺失数据包括气象数据缺失、船艏向数据缺失;使用克里金法(Kriging)对气象数据的缺失进行插值,普通克里金问题和克里金方差为:
其中,普通克里金问题表示为克里金方差表示为/>C(Si,Sj)为位置i与位置j之间的距离、C(Si,S0)为位置i与位置0之间的距离、C(0)为常数项,Z(Si)为位置i处的测量值,λi为位置i处的测量值的未知权重,λj为位置j处的测量值的未知权重,S0为预测位置,n为测量值数,在反距离权重法中,权重λi仅取决于预测位置之间的距离;在普通克里金法中,权重λi取决于测量点、预测位置的距离和预测位置周围的测量值之间空间关系的拟合模型;
船艏向变化与所在时间序列轨迹有关,船艏向数据缺失的插值依赖于缺失值前后船艏向数据进行线性插值,以表示船艏向的逐渐变化过程,线性插值(Linear Interpolation)是一种曲线拟合方法,它使用线性多项式在一组离散的已知数据点的范围内构造新的数据点:
其中,(x1,y1)为空值前第一个点,(x2,y2)为空值后第一个点,(x,y)为空值点,x为定位值,y为插值;设船舶船艏向空值点为Pk=(tk,hdgk),首先以第一个遇到的空值点为初始基准点,找到时间序列前一非空点Pk-1=(tk-1,hdgk-1),沿时间序列向后,直到遇到n个空值组成的序列后第一个非空点Pk+n=(tk+n,hdgk+n),组成长度为n+2的时间序列;
其次,考虑到实际航行中船舶很少会出现大于180°的转向角,对两个非船艏向求差值,并取小于180°的角为转角,然后,将该时间序列作为线性插值算法的输入,由时间戳为索引定位值,对空值进行插值;
(2)内河航行点识别
对船舶在内河航行状态进行识别,并在建模时进行处理;
(3)计算对水航速
将对地航速SOG修正为对水航速SOW(Speed Over the Water,SOW);
设有船舶AIS轨迹点Pi=(sogi,hdgi,stream_directioni,stream_vali,sowi),其中流速stream_vali单位为米/秒,需要转换为海里/小时:
其中,sogi为船舶AIS轨迹点Pi的对地航速,stream_directioni为船舶AIS轨迹点Pi的河水流向,sowi为船舶AIS轨迹点Pi的对水航速。
4.根据权利要求1所述的船舶风浪航行能耗精准估算方法,其特征是所述S3还包括如下步骤:
对在不同分类数据中对不同转速下的对水航速数据,
S31:首先使用箱型图法对离群点进行剔除;
S32:其次使用非参数Bootstrap-t自举法估算90%置信区间,得到样本集中分布区间;
S33:最后在模型拟合过程中采用库克距离,对模型中的高影响点进行量化识别。
5.根据权利要求4所述的船舶风浪航行能耗精准估算方法,其特征是所述箱型图法包括如下步骤:
S311计算中位数Q2:设n为样本数据集中数据值的数量,中位数Q2是数据集的中间值,若n为奇数,则Q2取第(n+1)/2位置的数,若n为偶数,则Q2取第n/2、第(n+1)/2位置的数求平均值;
S312计算下四分位数Q1:下四分位数Q1是数据集下半部分的中位数,取第(n+1)/4位置的数;
S313计算上四分位数Q3:上四分位数Q3是数据集上半部分的中位数,取第3*(n+1)/4位置的数;
S314计算四分位数间范围IQR:四分位数间范围IQR是中间50%的数据值的散布区间:
IQR=Q3-Q1
S315计算判断数据正常值得下限和上限:
下限=Q1-1.5*IQR
上限=Q3+1.5*IQR
S315根据下限和上限判断数据集中异常数值范围:即在数据集中,大于上限或小于下限的值都被视作是异常值;只有位于下限和上限内的数据在统计学上被认为是合理的分布数据,可用于进一步的观察或研究。
6.根据权利要求4所述的船舶风浪航行能耗精准估算方法,其特征是所述自举法包括如下步骤:
S321:建立模型前需要找到不同分类中每一转速下航速集中分布的区间,航速的分布未知,非参数的自举法估计置信区间对样本分布的性质不做要求,其重抽样性可以对数据的偏态及重尾进行修正,对数据集构建准确的置信区间,因此选用Bootstrap-t方法对每一转速下的航速分布90%置信区间进行估计。
7.根据权利要求1所述的船舶风浪航行能耗精准估算方法,其特征是所述S41具体包括如下步骤:
采用加权最小二乘法对转速及对水航速进行回归。
8.根据权利要求1所述的船舶风浪航行能耗精准估算方法,其特征是所述S5形成包括如下步骤:
S51:在不同分类下依据转速与对水航速模型,输入航速,完成由航速估算转速;
S52:依据航行状态与估算转速区间,进行转速修正;
S53:由修正后的转速和该航速持续的时间,依据转速与燃油小时油耗率模型来估算油耗。
9.根据权利要求8所述的船舶风浪航行能耗精准估算方法,其特征是所述油耗估算模型形成还包括如下步骤:
S54:依据航行状态与转速区间,对处于常用转速区间范围外的估算转速与油耗进行修正,以常用转速上下界为标准,进行以航速为比例的线性修正。
10.根据权利要求8所述的船舶风浪航行能耗精准估算方法,其特征是所述油耗估算模型形成还包括如下步骤:
S55:结合靠锚泊状态下的基础油耗消耗率,以及航行状态下的回归模型,依据船舶AIS提供的航行记录对船舶辅机及锚停泊所产生的基础油耗进行估算。
11.根据权利要求10所述的船舶风浪航行能耗精准估算方法,其特征是所述步骤S55包括下列步骤:
S551:判断船舶是否为发生装卸的油轮,如果是执行步骤S552,如果不是执行步骤S553;
S552:根据历史装卸时间、载油量与油耗进行回归得到油轮燃油消耗模型,估算时输入载油量与装卸时间对装卸油耗进行估算,然后执行步骤S553;
S553:筛选历史数据中单日航时为0的单日油耗,并根据AIS航行状态1锚泊与状态5靠泊,对停泊状态进行区分,对这些单日油耗进行统计,选取单日填报油耗众数除以停泊时间作为锚靠油耗率;估算时利用AIS状态持续时间来对锚靠油耗进行估算;然后执行步骤S554;
S554:油轮锚靠油耗包括装卸油耗与锚靠油耗两部分,其他船舶仅计算锚靠油耗。
12.根据权利要求8所述的船舶风浪航行能耗精准估算方法,其特征是所述油耗估算模型形成还包括如下步骤:
模型检验的油耗估算在测试数据集的全量数据上进行,不对数据集进行离群点和机动航行段的识别及相关操作;对AIS轨迹点按照航行状态及航时、航速进行分段,对每段航行点序列进行上述油耗估算流程。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211089206.7A CN115660137B (zh) | 2022-09-07 | 2022-09-07 | 一种船舶风浪航行能耗精准估算方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211089206.7A CN115660137B (zh) | 2022-09-07 | 2022-09-07 | 一种船舶风浪航行能耗精准估算方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115660137A CN115660137A (zh) | 2023-01-31 |
CN115660137B true CN115660137B (zh) | 2023-08-11 |
Family
ID=85024446
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211089206.7A Active CN115660137B (zh) | 2022-09-07 | 2022-09-07 | 一种船舶风浪航行能耗精准估算方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115660137B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116522211B (zh) * | 2023-07-03 | 2024-02-02 | 亿海蓝(北京)数据技术股份公司 | 船舶油耗可解释性灰箱估计方法、装置和可读存储介质 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102768524A (zh) * | 2012-08-06 | 2012-11-07 | 长沙绿航节能科技有限公司 | 一种船舶运行能效的系统优化方法及其装置 |
CN106779137A (zh) * | 2016-11-14 | 2017-05-31 | 上海海事大学 | 一种根据海况与操纵条件预测船舶油耗的方法 |
CN107563576A (zh) * | 2017-10-14 | 2018-01-09 | 连云港杰瑞深软科技有限公司 | 一种船舶智能能效管理系统 |
CN110110943A (zh) * | 2019-05-21 | 2019-08-09 | 大连海事大学 | 一种基于大数据的船队能效综合智能优化管理系统和优化方法 |
CN110525602A (zh) * | 2019-08-13 | 2019-12-03 | 浙江海洋大学 | 一种船舶航迹航速整体规划方法 |
CN112446096A (zh) * | 2020-11-26 | 2021-03-05 | 上海船舶运输科学研究所 | 一种基于航行大数据的船舶主机油耗动态预估方法 |
CN112836893A (zh) * | 2021-02-26 | 2021-05-25 | 上海海事大学 | 一种基于海况条件和船舶航行状况预测恶劣海况下船舶油耗的方法 |
CN113393048A (zh) * | 2021-06-24 | 2021-09-14 | 武汉长江船舶设计院有限公司 | 电动游轮航行能耗预测与控制方法 |
CN113433934A (zh) * | 2021-04-27 | 2021-09-24 | 武汉海兰鲸科技有限公司 | 一种商船航速优化方法 |
-
2022
- 2022-09-07 CN CN202211089206.7A patent/CN115660137B/zh active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102768524A (zh) * | 2012-08-06 | 2012-11-07 | 长沙绿航节能科技有限公司 | 一种船舶运行能效的系统优化方法及其装置 |
CN106779137A (zh) * | 2016-11-14 | 2017-05-31 | 上海海事大学 | 一种根据海况与操纵条件预测船舶油耗的方法 |
CN107563576A (zh) * | 2017-10-14 | 2018-01-09 | 连云港杰瑞深软科技有限公司 | 一种船舶智能能效管理系统 |
CN110110943A (zh) * | 2019-05-21 | 2019-08-09 | 大连海事大学 | 一种基于大数据的船队能效综合智能优化管理系统和优化方法 |
CN110525602A (zh) * | 2019-08-13 | 2019-12-03 | 浙江海洋大学 | 一种船舶航迹航速整体规划方法 |
CN112446096A (zh) * | 2020-11-26 | 2021-03-05 | 上海船舶运输科学研究所 | 一种基于航行大数据的船舶主机油耗动态预估方法 |
CN112836893A (zh) * | 2021-02-26 | 2021-05-25 | 上海海事大学 | 一种基于海况条件和船舶航行状况预测恶劣海况下船舶油耗的方法 |
CN113433934A (zh) * | 2021-04-27 | 2021-09-24 | 武汉海兰鲸科技有限公司 | 一种商船航速优化方法 |
CN113393048A (zh) * | 2021-06-24 | 2021-09-14 | 武汉长江船舶设计院有限公司 | 电动游轮航行能耗预测与控制方法 |
Also Published As
Publication number | Publication date |
---|---|
CN115660137A (zh) | 2023-01-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Zhang et al. | A big data analytics method for the evaluation of ship-ship collision risk reflecting hydrometeorological conditions | |
Cheng et al. | Using big data to track marine oil transportation along the 21st-century Maritime Silk Road | |
Rawson et al. | A machine learning approach for monitoring ship safety in extreme weather events | |
CN115660137B (zh) | 一种船舶风浪航行能耗精准估算方法 | |
CN114662575A (zh) | 风电水域船舶航行风险预估方法、系统以及存储介质 | |
Jalagam et al. | Water Quality Predictions for Urban Streams Using Machine Learning | |
CN113962426A (zh) | 一种近海水上通航安全智能预报方法和装置 | |
Ji et al. | A dynamic adaptive grating algorithm for AIS-based ship trajectory compression | |
Xia | Navigational risk analysis based on GIS spatiotemporal trajectory mining: a case study in Nanjing Yangtze River Bridge waters | |
Zhou et al. | Estimation of shipment size in seaborne iron ore trade | |
CN114047508B (zh) | 一种对海雷达探测范围统计评估方法及系统 | |
CN112632868B (zh) | 高频地波雷达观测径向流缺失值的填补修正方法及系统 | |
CN114331042A (zh) | 一种船舶碰撞风险分析方法 | |
Weng et al. | Detection of abnormal ship trajectory based on the complex polygon | |
Weixi et al. | A Case Research on Vulnerability of logistics system in the Tianjin port | |
Filippopoulos et al. | Multi-sensor data fusion for the vessel trim analyzer and optimization platform | |
Newaliya et al. | A review of maritime spatio-temporal data analytics | |
Zhang et al. | Modeling and solving used sailboat market strategy and pricing method | |
CN116522446B (zh) | 一种河口湾潮流泥沙主通道划定方法 | |
Suo et al. | Evaluation of Port Prosperity Based on High Spatial Resolution Satellite Remote Sensing Images | |
Ioannou et al. | Short-Term Optimal Ship Routing via Reliable Satellite Current Data | |
Henie et al. | Freight pricing and climate change: The case of grain cargoes in the Paraná River | |
Jiang et al. | A method for identifying marine targets based on mining of multi-characteristic movement patterns | |
CN117634325B (zh) | 资料受限河口区域极值事件识别和复合洪水灾害分析方法和系统 | |
Knive et al. | Estimating the impact of weather-sensitive cargo risk on transport cost |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |