CN116403655A

CN116403655A - 一种船舶排放因子计算方法及系统

Info

Publication number: CN116403655A
Application number: CN202310127274.6A
Authority: CN
Inventors: 周凡; 白响恩; 侯利玮; 安博文
Original assignee: Shanghai Maritime University
Current assignee: Shanghai Maritime University
Priority date: 2023-02-16
Filing date: 2023-02-16
Publication date: 2023-07-07

Abstract

本发明涉及一种船舶排放因子计算方法及系统，其中方法包括：对船舶排放的尾气进行测量，获取船舶尾气排放数据测量值；确定积分区间长度，将测量值转换为积分区间长度的平均值，得到平均值序列；提取平均值序列中的全体SO₂峰值点与CO₂峰值点；使用动态时间规整算法矫正平均值序列，建立各个SO₂峰值点与各个CO₂峰值点间的匹配关系；从匹配关系中确定最优匹配结果作为全局最优峰值点；基于全局最优峰值点计算船舶排放因子。同时，系统能够计算测量数据的质量，以评估船舶排放因子计算结果的可信度，从而对船舶排放因子的计算进行优化。与现有技术相比，本发明具有可靠性高、计算准确等优点。

Description

一种船舶排放因子计算方法及系统

技术领域

本发明涉及船舶尾气监测技术领域，尤其是涉及一种船舶排放因子计算方法及系统。

背景技术

近十几年间，全球航运业发展速度加快(UNC-TAD，2017)，导致船舶排放问题日益严峻(Chen等，2019)。船舶排放的污染气体和颗粒物不仅会对自然环境造成污染，也会对人类健康产生影响(Liu等，2016)。SO₂使得酸雨频发破坏环境(Matthias等，2010)，德国和波兰有50％的森林以及瑞士30％的森林被酸雨侵蚀(Mohajjan等，2018)；PM₂₅会诱发肺癌及其他心肺疾病，导致全球每年有220万至330万人因此死亡(Sofiev等，2018)。2015年，全球航运排放总量中有20.1*10⁶吨NO_x、11.5*10⁶吨SO_x、1.54*10⁶吨PM(Sofiev等，2018)。2017年，欧盟的航运排放共产生2.6*10⁶吨SO₂、7.7*10⁶吨NO₂、18.2*10⁶吨CO(Jonson等，2020)。

精确的船舶排放清单是分析船舶排放规律的数据基础，也是控制船舶排放，优化船舶排放控制区监管举措的科学依据。(Zhang等，2017；Zhang等，2017)。对于船舶排放清单的测算主要分为“自上而下”和“自下而上”两种方法。“自上而下”法以船舶的燃油消耗情况为基础，不考虑船舶的具体位置，适用于全球尺度上长时间范围源清单的计算。如：Kesgin等采用“自上而下”的方法计算了土耳其海峡中CO、CO₂、PM_2.5等的船舶排放量(Kesgin等，2001)；Corbett等通过船舶燃油使用情况研究全球排放清单(Corbett等，1997)。“自下而上”法以船舶运动状态和船舶属性为基础直接估算排放量，相比“自上而下”法更加准确。近年来，由于AIS的迅速发展，获取船舶的实时运行状态更加便捷，因此该方法被广泛运用于排放清单的研究之中。如：Papaefthimiou等使用基于港口船舶活动的自下而上方法计算国际游轮在希腊的18个港口中活动排放的NO_x、SO₂、PM_2.5(Papaefthimiou等，2016)；Tichavska等通过AIS获取船舶的活动数据并研究拉斯帕尔马斯港船舶排放与月份、船舶类型之间的关系(Tichavska等，2015)。

在建立排放清单时需要船舶航速、船舶位置、主机功率、辅机功率、排放因子等参数信息，其中，船舶的静态信息和动态信息可以通过AIS数据等渠道直接获取，而排放因子需要经过测量才能确定，因此测量的准确度直接决定排放清单的准确度(Ekmekiolu等，2020；Yang等，2021；Toscano等，2021)。测量排放因子有基于燃油和基于功率两种方式，前者可以通过测量CO₂与其他污染物的浓度来计算，后者需要获取主机功率、辅机功率、运行模式等的实时数据，两种测量方式在已知船舶燃油消耗率的情况下可以互相转换(Zhang等，2016)。“嗅探”技术是基于燃油测量排放因子方法中的一种，能够快捷，准确地对船舶烟羽进行测算。Balzani

等使用“嗅探”技术与其他几种监测技术对鹿特丹港船舶的排放因子和燃油硫含量进行测量，并将几种方法的结果进行对比，发现移动“嗅探”监测技术最便捷，同时准确率也最高，测定的SO₂排放因子的平均随机误差为6％(Balzani/>

等，2014)。Beecken等使用小型飞机搭载“嗅探”监测设备对波罗的海和北海的158艘船舶排放的尾气进行监测，SO₂的平均排放因子为/>

有约85％的被监测船舶符合国际海事组织规定的硫含量限制(Beecken等，2014)。

以SO₂为例，“嗅探”测量技术的原理是基于船舶燃油中的碳元素含量稳定于85％-87％，燃油燃烧生成的CO₂和SO₂的浓度比值等于燃油中碳和硫元素的摩尔比值且不会因为尾气稀释而改变，因此测量CO₂和SO₂浓度能够用来计算排放因子(Huang等，2021)。

但是，计算过程中的各种不确定性因素会对排放因子的结果造成不可忽视的干扰，这种影响主要存在于三个方面：问题一，由于不同气体的传感器响应时间不一致，难以选择同一时间点的气体测量值作为排放因子的计算值。因此，一般的做法是选择一段时间的气体测量值进行累加计算，以降低不同气体传感器响应时间无法同步所带来的误差。Zhou等在先前的研究中提出将累加过程视为积分，然后将积分结果除以时间间隔，从而将气体测量值转换为平均值，并在此基础上寻找选取气体平均值全局最优峰值点的方法。实现了将选取合适的积分区间问题转换为在测量数据平均值集合中选取全局峰值点的问题(Zhou等，2020)。但是，积分区间的时间间隔主要是依赖于经验。问题二，在第一个问题的基础上，全局最优峰值点的选取直接决定排放因子计算的准确度。但是，一段时间内的气体测量值中，会出现多个SO₂和CO₂的峰值点，如何在峰值点间建立匹配关系进而确定SO₂和CO₂的全局最优峰值点尚缺乏深入的研究；问题三，船舶尾气测量过程中的各种环境和设备因素会对气体测量值造成干扰，但目前尚无对气体测量值的质量进行客观评价的方法。

一些通过其他方法计算排放因子的研究中也提到不确定性因素会对计算结果会产生干扰。Betha等通过监测科考船的船舶尾气比较超低硫柴油和氢化衍生可再生柴油生成的颗粒物、黑炭以及NOx，研究中提到监测仪器间存在不可避免的时间延迟，需要通过最小化扫描电动迁移率光谱仪的可变性和单粒子烟尘光度计的滞后相关性来校准延迟时间，以此实现同步测量。Villa等在使用无人驾驶飞行器分析船舶颗粒物排放特性的研究中，通过高斯曲线拟合校正后的峰值点序列，以拟合结果中的最大峰值点作为颗粒数排放因子计算的数据基础。该方法对于峰值趋势清晰的测量数据有较好的效果，但对于同步性较差的，变化复杂的测量数据(如文献中提到的100米横断面)就无法给出准确的计算结果。总体来说，专门研究排放因子计算的不确定性的文献较少，往往使用简单的处理方法从测量数据中选取峰值点参与排放因子的计算，受测量环境的影响，存在大量波动，峰值趋势不明显的测量数据并不在少数，因此研究在复杂数据中选取峰值点计算排放因子是十分必要的。

发明内容

本发明的目的就是为了克服上述现有技术存在的缺陷而提供一种船舶排放因子计算方法及系统。

本发明的目的可以通过以下技术方案来实现：

一种船舶排放因子计算方法，包括以下步骤：

对船舶排放的尾气进行测量，获取船舶尾气排放数据测量值；

确定积分区间长度，将所述测量值转换为积分区间长度的平均值，得到平均值序列；

提取所述平均值序列中的全体SO₂峰值点与CO₂峰值点；

使用动态时间规整算法矫正所述平均值序列，建立各个SO₂峰值点与各个CO₂峰值点间的匹配关系；

从所述匹配关系中确定最优匹配结果作为全局最优峰值点；

基于所述全局最优峰值点计算船舶排放因子。

进一步地，所述确定积分区间包括以下步骤：

S1、若一段完整的测量过程有n个测量值，使用滑动窗口算法遍历所有测量值，窗口大小为备选积分区间长度，窗口每次移动一个测量值；

S2、若一个测量值点大于左右相邻的测量值点，则定义该测量值点为峰值点；计算每个窗口中的峰值点数量，计算窗口的峰值密度，窗口的峰值密度计算公式为：

其中density(j)表示第j个窗口的峰值密度，count_peak(j)表示第j个窗口的峰值点数量，count_data(j)表示第j个窗口的测量值点总数量；

S3、计算该段测量过程中所有窗口的峰值密度标准差：

其中average_density为该段测量过程中所有窗口的峰值密度平均值；

S4、若共有N段完整的测量过程，对每段测量过程执行步骤S1至步骤S3，得到N个峰值密度标准差，计算N个峰值密度标准差的均值；

S5、使用多个备选积分区间长度分别执行步骤S1至步骤S4，比较每个备选积分区间长度的峰值密度标准差，选择峰值密度标准差计算结果最大的备选积分区间长度作为最优积分区间长度。

进一步地，基于所述最优积分区间长度，将SO₂测量值及CO₂测量值序列分别转换为SO₂平均值序列及CO₂平均值序列。

进一步地，建立各个SO₂峰值点与各个CO₂峰值点间的匹配关系包括以下步骤：

对所述SO₂平均值序列及CO₂平均值序列进行归一化，得到归一化SO₂序列及归一化CO₂序列；

通过改进后的曼哈顿距离构造距离矩阵；

在所述距离矩阵中寻找规整路径，从点(0，0)开始逐一对归一化SO₂序列及归一化CO₂序列中每一点进行匹配；

所述规整路径上的每个点均对应一个SO₂峰值点与一个CO₂峰值点，并且两点间存在匹配关系，由此得到SO₂峰值点与CO₂峰值点间的匹配关系。

进一步地，将所述SO₂平均值序列及CO₂平均值序列分别进行0-1的归一化，得到归一化SO₂序列Q和归一化CO₂序列C，其表达式分别为：

其中，SO₂data(i)表示SO₂序列中第i个值，SO₂data(min)表示SO₂序列中的最小值，SO₂data(max)表示SO₂序列中的最大值，C0₂data(j)表示CO₂序列中的第j个值，CO₂data(min)表示CO₂序列中的最小值，CO₂data(max)表示CO₂序列中的最大值。

进一步地，所述改进后的曼哈顿距离表达式为：

其中，Q_i表示归一化序列Q中的第i个值，C_j表示归一化序列C中的第j个值。

进一步地，若SO₂峰值点个数为k，CO₂峰值点个数为m，则通过改进后的曼哈顿距离构造一个k*m的距离矩阵A，A中的元素(i，j)点表示Q_i与C_j的距离d(Q_i，C_j)；

在所述距离矩阵A中寻找规整路径，从点(0，0)开始逐一对归一化SO₂序列及归一化CO₂序列中每一点进行匹配，并对距离进行累加，当到达终点(k，m)后，累加距离的结果即为归一化SO₂序列及归一化CO₂序列的相似度；执行递归可得：

其中，ψ(i，j)表示距离矩阵A所对应的最短距离。

进一步地，从所述匹配关系中确定最优匹配结果作为全局最优峰值点，即使用K均值聚类算法对全体匹配关系的归一化后平均值的差值进行聚类，包括以下步骤：

A1、初始簇中心的个数为2，即将样本集分为两类，一类为正常变化，另一类为异常变化；

A2、将所述全体匹配关系的归一化后平均值的差值记为D，随机选择D中的两个数据点作为两个簇的初始簇中心；

A3、计算每个样本点与这两个簇中心的相似度大小，并将样本点划分到与之相似度最大的簇中心所对应的簇中；

A4、根据现有的簇中的样本，重新计算每个簇的簇中心；

A5、迭代执行步骤A3和步骤A4，直到簇中心不再发生变化；

A6、对D进行多次K均值聚类，若D能够被稳定地分为两类，则说明找到阈值；

A7、若匹配关系中SO₂、CO₂归一化后的差值大于所述阈值，则说明该匹配关系属于异常变化，剔除该匹配关系；

A8、从保留的匹配关系中查找包含SO₂最大平均值的匹配结果，并从包含SO₂最大平均值的匹配结果中筛选出包含CO₂最大平均值的匹配结果作为全局最优峰值点。

进一步地，本方法还包括测量数据评价步骤，即提出评价指标，评价船舶尾气排放测量数据的数据质量，以评估船舶排放因子计算结果的可信度，从而对船舶排放因子的计算进行优化。

进一步地，所述评价船舶尾气排放测量数据的数据质量，即采用基于自展抽样的数值方法量化评价指标的不确定性，从而确定其置信区间，包括以下步骤：

对测量数据进行多次自展抽样，计算每次抽样的均值，得到由多个均值组成的集合；

若评价指标值处于该评价指标对应的95％置信区间中，则说明该评价指标判定测量数据为高质量数据，评价结果记为1，若评价指标值在95％置信区间之外，则说明测量数据被该评价指标判定为低质量数据，评价结果记为0；

对测量数据的质量打标签，峰值趋势明显、SO₂与CO₂平均值序列有较高的同步性则认为是高质量数据，质量标签为1；若SO₂与CO₂平均值序列变化趋势相差较大且剧烈变化则认为是低质量数据，质量标签为0；

结合评价指标的评价结果和质量标签计算每个评价指标的评价正确率，选取较高正确率的评价指标组成评价指标集合对测量数据质量进行联合评价；

计算测量数据的评价指标值与置信区间中心位置的总体均值间的距离，并求得该距离与置信区间单侧长度的比值，比值越接近0则说明测量数据质量越好，比值越接近1则说明测量数据质量越差，并将比值大于1的结果重新赋值为1；

联合评价时，若所有评价指标的计算比值均为1，则判断该测量数据质量差，否则计算所有小于1的比值的均值，均值越接近0，表明评价指标集合认为该测量数据质量越好；

基于对测量数据的评价结果，对船舶排放因子的计算进行优化。

一种船舶排放因子计算系统，包括数据测量模块、计算模块及优化模块；

所述数据测量模块用于对船舶排放的尾气进行测量，获取船舶尾气排放数据测量值；

所述计算模块基于船舶尾气排放数据测量值计算船舶排放因子，包括以下步骤：

提取所述平均值序列中的全体SO₂峰值点与CO₂峰值点；

从所述匹配关系中确定最优匹配结果作为全局最优峰值点；

基于所述全局最优峰值点计算船舶排放因子；

所述优化模块用于提出评价指标，评价船舶尾气排放测量数据的数据质量，以评估船舶排放因子计算结果的可信度，从而对船舶排放因子的计算进行优化。

与现有技术相比，本发明具有以下有益效果：

1、本发明通过提出峰值密度标准差这一概念，用以衡量一个积分区间表征数据变化特征的能力。通过计算每个备选积分区间长度的峰值密度标准差，选择峰值密度标准差计算结果最大的备选积分区间长度作为最优积分区间长度。峰值密度标准差的值越大，则用该积分区间进行预处理后的数据变化特征更明显，峰值趋势更加清晰，从而全局最优峰值点地选取就更准确。克服了现有技术中依赖经验确定积分区间长度的情况，使得船舶排放因子的计算结果可靠性更高。

2、本发明将DTW算法应用到峰值点的筛选之中，能够获得CO2与SO2序列的相似性以及SO2与CO2平均值序列中峰值点间的匹配关系，再结合最优峰值点选定标准，能够选出合适的气体测量值用于排放因子的计算，使得船舶排放因子的计算结果更加精确。

3、本发明通过定义多个评价指标，对船舶尾气排放测量数据进行评价，以评估船舶排放因子计算结果的可信度，从而对船舶排放因子的计算进行优化，弥补了现有研究中的空白。

附图说明

图1为本发明的流程图。

具体实施方式

下面结合附图和具体实施例对本发明进行详细说明。本实施例以本发明技术方案为前提进行实施，给出了详细的实施方式和具体的操作过程，但本发明的保护范围不限于下述的实施例。

船舶排放造成的大气污染越来越受到人们的关注，建立排放清单是评估船舶排放对环境和人类影响的一个重要手段。排放因子是船舶排放清单编制过程中的重要参数，基于“嗅探”法测量船舶尾气进而估算排放因子存在一定的不确定性。

以二氧化硫排放因子测算为例，本发明针对“嗅探法”中气体测量值的选择问题，提出“峰值密度标准差”的概念以确定测量值的最优积分区间长度，并以该区间长度将SO₂和CO₂测量值序列转换为平均值序列。接着，使用改进后的曼哈顿距离表征SO₂和CO₂平均值序列中峰值点的位置关系。然后，使用动态时间规整算法找出SO₂和CO₂平均值序列中峰值点的对应关系，并以此构建备选峰值点集合。最后，在集合中剔除异常值后，分别选择SO₂和CO₂平均值序列中的最大值作为全局最优峰值点，用以计算排放因子。同时，为了评估排放因子计算结果的可信度，选取16个能够反映测量数据特征的评价指标，对已获得的测量数据进行10000次自展抽样计算每个评价指标95％的置信区间，并据此得到评价指标对于测量数据质量的评价结果，结合数据质量标签(1表示质量好，0表示质量差)，筛选出对于测量数据质量评价正率高的指标。2019至2021年间，在中国上海外高桥港区使用无人机“嗅探”监测系统累计采集了148组“SO₂+CO₂”的测量数据，使用本发明所提出的方法进行了计算验证。结果表明：针对该数据集，12s作为积分长度最为合适，算法能够自动计算出排放因子，共有129组数据的全局最优峰值点的算法筛选结果与人为筛选结果一致，正确率达87.16％。样本熵(SO₂)、信息熵(SO₂)、偏度(CO₂)和四分位距(SO₂)这四个指标联合评价结果的正确率为71％，计算测量数据的指标值与置信区间中心位置的总体均值间的距离，并求得该距离与置信区间单侧长度的比值(比值大于1的重新赋值为1)，若四个指标的计算比值均为1，则表明该测量数据质量差，否则计算所有小于1的比值的均值，均值越接近0，测量数据质量越好，以此量化数据质量。

本发明对背景技术中提出的现有技术中存在的三个问题进行了深入研究分析。针对问题一，提出峰值密度标准差这一概念，用以衡量一个积分区间表征数据变化特征的能力。峰值密度标准差的值越大，则用该积分区间进行预处理后的数据变化特征更明显，峰值趋势更加清晰，从而全局最优峰值点的选取就更准确。

针对问题二，为了从众多峰值点中筛选出最优峰值点，需要先在两种气体的平均值序列之间建立匹配关系，并对全部匹配关系的合理性进行判断。将DTW算法应用到峰值点的筛选之中，能够获得CO₂与SO₂序列的相似性以及SO₂与CO₂平均值序列中峰值点间的匹配关系，再结合Zhou等提出的最优峰值点选定标准(Zhou等，2019)，能够选出合适的气体测量值用于排放因子的计算。

其中，DTW算法由Itakura提出(Itakura，1975)，其作用是衡量两条时间序列的相似程度。Dmytrów等通过DTW算法评估能源大宗商品价格与新型冠状病毒感染每日病例时间序列的相似性(Dmytrów等，2021)。Li等将改进后得DTW算法用于比较船舶航行轨迹时间序列间的对应关系，提升航行轨迹建模的性能(Li等，2020)。

针对间题三，提出了16个能够用来反映数据质量的评价指标，其中针对单一气体测量值的评价指标分为两种情况，一种是使用SO₂测量值进行评价，另一种是使用CO₂测量值进行评价。对已获得的若干测量数据通过自展抽样计算评价指标的95％置信区间，并据此给出评价指标对于测量数据质量的评价结果，结合测量数据的质量标签就能够得到指标对于数据质量评价的正确率，选取正确率较高的评价指标组成集合进行联合评价，进一步提高气体测量数据评价的正确率。最后，本实施例使用本发明所提出的方法，对在上海外高桥港口所测得的船舶尾气数据进行了测试，验证了本方法能够以较高的正确率找出合适的全局最优峰值点进而计算排放因子，以及使用指标联合评价测量数据质量的准确性。

本发明提出了一种船舶排放因子计算系统，包括数据测量模块、计算模块及优化模块；其中数据测量模块用于对船舶排放的尾气进行测量，获取船舶尾气排放数据测量值；计算模块基于船舶尾气排放数据测量值计算船舶排放因子；优化模块用于评价船舶尾气排放测量数据的数据质量，以评估船舶排放因子计算结果的可信度，从而对船舶排放因子的计算进行优化。

基于该系统，可以实现一种船舶排放因子计算方法，如图1所示，该方法包括以下步骤：

确定积分区间长度，将测量值转换为积分区间长度的平均值，得到平均值序列；

提取平均值序列中的全体SO2峰值点与CO2峰值点；

使用动态时间规整算法矫正平均值序列，建立各个SO2峰值点与各个CO2峰值点间的匹配关系；

从匹配关系中确定最优匹配结果作为全局最优峰值点；

基于全局最优峰值点计算船舶排放因子；

提出评价指标，评价船舶尾气排放测量数据的数据质量，以评估船舶排放因子计算结果的可信度，从而对船舶排放因子的计算进行优化。

船舶排放因子计算的基本方法原理为：“嗅探”法基于三个假设：其一，不同船舶燃油中的碳元素含量相近，大约为87％；其二，船舶燃油中的碳元素和硫元素燃烧后生成的几乎全部是二氧化碳和二氧化硫，其余的硫氧化物和碳氧化物只占很小一部分，可以忽略不计；其三，船舶燃油燃烧后生成的尾气在空气中稀释时，CO₂与SO₂的比例不发生改变(Hu等，2018)。据此，通过测量一段时间内SO₂与CO₂气体浓度，分别进行累加后求比值就可以计算出SO₂排放因子，计算公式为：

其中m(·)表示质量，M(C)是碳的相对原子质量，M(S0₂)是二氧化硫的相对分子质量，∑[·]表示对一段时间内被测气体的浓度累计求和。

考虑到传感器无法实现完全同步，因此可以采用选取一段时间内测量值进行累加的方式，而不采用一次测量值，即通过对一段时间内的气体测量值进行积分使排放因子的计算结果更加稳定。在本发明中，我们采用将气体测量值转换为平均值的方式来计算SO₂排放因子，如公式2所示：

∫(SO_2，peak-SO_2，bkg)dt[ppb]/t

其中SO_2，peak为数据测量值中SO₂的峰值，S0_2,bkg为数据测量值中SO₂的背景值，t为积分区间长度，∫(·)dt为积分区间为t的积分计算函数，AVG(·)为计算t秒内平均测量值的函数。

通过上述转换，将对“嗅探”法对气体积分区间选择的问题，转换为了选择积分间隔和峰值点的问题。在Zhou等的研究中，积分间隔采用的是10s的经验值，然后通过观察分析平均值序列中峰值点的变化趋势，选取合适的全局最优峰值点用于排放因子的计算。通过上述方法，可以计算得出比较准确的结果。但是，选取的积分区间长度属于经验值，缺乏理论论证。另外，当一段时间内，峰值点较多时，如何进行SO₂和CO₂的配对也存在不确定性。

为了消除SO₂和CO₂传感器响应时间不一致的影响，需要找到SO₂和CO₂平均值序列上峰值点间存在的匹配关系，便于后续从中筛选出具备对应关系的SO₂和CO₂全局最优峰值点。根据峰值点间的距离关系，本发明使用动态时间规整算法(DTW)建立SO₂和CO₂峰值点间的匹配关系。动态时间规整算法的目的是找到目标时间序列与标准时间序列中每个数据点间的差异，并计算差异累加后的最小值，找出与之对应的路径，在本发明中用于对SO₂和CO₂峰值点的匹配。目标时间序列记为X＝(x₁，x₂，...，x_n)，标准时间序列记为Y＝(y₁，y₂，...，y_m)，在本发明中分别对应SO₂与CO₂平均值序列中峰值点提取的结果。f表示目标时间序列上的点以及它在无偏差的理想状态下对应的标准时间序列上点之间的距离：

d(i，j)＝f(x_i，y_j) (3)

计算X、Y中数据点及其对应点间的距离，得到距离矩阵D：

D_ij＝d(i，j) (4)

最短距离是使用代价矩阵D_cost迭代计算目标序列与标准序列间的动态规划路径距离，最短距离路径就是两条序列上的数据点所具有的全部匹配关系。

D_cost(i，j)＝D(i，j)+min(D_cost(i-1)，D_cost(j-1)，D_cost(i-1，j-1)) (5)

通过DTW算法获取CO₂和SO₂峰值点间最短距离矩阵对应的路径，即得到SO₂和CO₂平均值序列中峰值点间的匹配关系，达到矫正偏差序列的效果。

排放因子的高准确度计算需要选择一段时间内稳定气流的测量值，并尽可能地消除各种不确定性因素的影响。在本发明中，首先确定了最优积分区间长度的选取方法，接着，使用DTW算法找到CO₂与SO₂平均值序列上峰值点间的匹配关系，并从中筛选出全局最优峰值点。具体流程分为以下四个步骤：

1.积分区间长度选择与峰值点提取。提出“峰值密度标准差”这一概念分析测量值序列中峰值点的分布规律以及变化趋势，峰值密度标准差的值越大，对应的积分区间长度就能使排放因子的计算更稳定。将测量值转换为积分区间长度的平均值，并提取平均值序列中的全体峰值点；

2.基于DTW的匹配。使用基于改进后曼哈顿距离的动态时间规整算法矫正平均值序列，获取SO₂与CO₂峰值点间的匹配关系；

3.筛选匹配关系。在已获得的若干测量数据中的峰值点间建立匹配关系，以所有的匹配关系为样本进行k-means均值聚类，如果能够被稳定分为两类，则说明两类之间的分界线能够区分正常变化和异常变化，从而就找到了浓度变化的阈值，再结合时间跨度阈值对步骤2中的结果进行筛选，剔除异常的匹配结果。在保留的匹配结果中查找包含SO₂最大平均值的匹配结果，并从找到的所有匹配结果中筛选出包含CO₂最大平均值的匹配结果作为全局最优峰值点。

本实施例中，系统的优化模块用于评估测量结果的可靠性。本实施例提出16个能够表征数据质量的评价指标，对于已获得的若干测量数据通过自展抽样计算每个指标的95％置信区间，若指标值处于置信区间中，记为1，反之，记为0。结合测量数据的质量标签从16个指标中选取部分表征能力较强的若干指标组成指标集合进行联合评价。计算测量数据的指标值与置信区间中心位置的总体均值间的距离，并求得该距离与置信区间单侧长度的比值(比值大于1的重新赋值为1)。联合评价时，若所有指标的计算比值均为1，则判断该测量数据质量差；否则计算所有小于1的比值的均值，均值越接近0，该测量数据质量越好。

以下将详细介绍积分区间长度选择的原理以及方法，对于峰值点的定义做出必要说明；介绍如何使用DTw算法匹配峰值点，从而矫正SO₂、CO₂平均值序列，同时也提出一种以曼哈顿距离为原型的能够表征平均值序列中峰值点间距离关系的距离计算方法；详细说明用于剔除异常匹配关系的阈值的计算方法；阐述从16个评价指标中筛选部分指标组成指标集合进行联合评价的具体方法。

“嗅探”设备监测船舶尾气时，由于SO₂、CO₂传感器的响应时间无法实现完全同步，导致CO₂与SO₂测量值的时间序列之间存在偏差。使用合适的积分区间长度(设为t)将每秒测量值转化为t秒内的平均值，能够在一定程度上缩小时间序列间的偏差。

但是，对于t值的设定往往采取经验值，没有理论依据支撑，存在极大的不确定性，若选定的t值过小，在整体测量数据集中会出现过多极细小的峰值，或者一个峰值由多个数据点共同组成，这对峰值的选取造成巨大困难，致使排放因子的计算结果具有较大的不稳定性；若选定的t值过大，则整个数据集的起伏较为平缓，不能呈现出具有代表性的峰值趋势，会阻碍峰值的选取，对于排放因子的计算也会有较大影响。

本发明从数据挖掘的角度提出一种确定最优积分区间的方法，从而降低人为选取经验值的不确定性。为了选定合适的积分区间进行预处理，需要对多个备选区间进行分析，因为峰值点至少需要三个数据点组成，同时过大的区间会过度平滑数据变化趋势，故只需要找到数据变化趋势与区间的对应关系即可，因此设定的积分区间长度的选择范围为3s到30s。采用滑动窗口算法遍历测量值，窗口大小为备选积分区间长度，窗口每次移动一个测量值点，计算每个窗口峰值点数与窗口总数据点数的比值，该比值就是这个窗口的峰值密度，再计算该备选积分区间长度的峰值密度标准差，以此反映测量值中峰值密度的变化趋势。比较每个备选积分区间长度的峰值密度标准差，其值越大则说明该积分区间长度越能反应测量值中峰值密度的波动。该方法的具体步骤如下：

1.假设一段完整的测量过程有n个测量值，使用滑动窗口算法遍历所有测量值。窗口大小为选取的积分区间长度，窗口每次移动一个测量值；

2.如果一个测量值点大于左右相邻的测量值点，则定义该测量值点为峰值点。计算每个窗口中的峰值点数量，通过公式6计算窗口的峰值密度。其中density(j)表示第j个窗口的峰值密度，count_peak(j)表示第j个窗口的峰值点数量，count_data(j)表示第j个窗口的测量值点总数量；

3.计算该段测量过程中所有窗口的峰值密度标准差；

4.假设共有N段完整的测量过程，对其执行步骤1-3共得到N个峰值密度标准差，计算均值；

5.使用3s-30s的备选积分区间长度分别执行步骤1-4，计算结果最大的积分区间长度就是最优积分区间长度。

使用最优积分区间长度将SO₂和CO₂的测量值序列依据公式2中的描述分别转换为SO₂和CO₂的平均值序列，提取序列中的全体峰值点，用于后续的匹配。

船舶烟羽中，SO₂的浓度一般在0-10ppm，CO₂一般在300-10000ppm，CO₂和SO₂浓度不在一个数量级。为了使用DTW算法进行匹配，需要将SO₂与CO₂的平均值序列分别进行0-1的归一化得到新的SO₂和CO₂序列(分别记为Q，C)：

通常DTW算法是以两条序列间的欧氏距离矩阵为基础进行相似度计算的。欧氏距离计算时只考虑一维的数值大小，而选择全局最优峰值点时不仅需要考虑浓度的相对大小，也需要考虑时间跨度(不同传感器响应时间偏差一般为几秒)，时间跨度较大的两个点间的匹配属于异常匹配，故需要使用二维的相对位置关系来表征两点间的距离。曼哈顿距离在计算时兼顾了两个坐标轴上的数值，比欧氏距离更加适用于全局最优峰值点的筛选。由于平均值已经归一化，需要将时间跨度转化为0-1之间的数值，故替换为时间跨度占总序列长度的比值：

由公式10计算得到的曼哈顿距离中|Q_i-C_j|所占比重过大，因此需要添加补偿系数平衡两个维度的大小：

若SO₂峰值点个数为k，CO₂峰值点个数为m，则通过改进后的曼哈顿距离构造一个k*m的距离矩阵A，A中的元素(i，j)点表示Q_i与C_j的距离d(Q_i，C_j)；d(Q_i，C_j)值越小，则表明Q_i和C_j的相似度越高。在矩阵A中寻找一条规整路径，该路径从矩阵的(0，0)点出发，到(k，m)点结束，叠加产生的距离最小。规整路径轨迹主要受三方面的约束：单调性、连续性和边界条件。

1.单调性的约束使得规整路径只能按照规定的方向进行延伸，对于路径上的一个点(a，b)，有它在路径上的下一个点(a′，b′)，则必须满足0≤(a′-a)和0≤(b′-b)；

2.连续性的约束使得序列Q和序列C中任一点都能映射于规整路径中，只能相邻对齐，不能跨点匹配，对于路径上的一个点(a，b)，有它在路径上的下一个点(a′，b′)，则必须满足(a′-a)≤1和(b′-b)≤1；

3.边界条件的约束使得规整路径上的第一个点和最后一个点必须为(0，0)和(k，m)。

从点(0，0)开始逐一对序列Q和C中每一点进行匹配，并对距离进行累加，当到达终点(k，m)后，最终累加距离的结果就是序列Q和C的最终距离度量，也就是Q和C的相似度。执行递归可得：

规整路径上的每个点都对应着一个SO₂峰值点和一个CO₂峰值点，并且两点间存在匹配关系。但是，从平均值序列中提取的峰值点中有一些是由于测量过程中受到外部环境因素的干扰产生的微小波动，参与匹配时会对规整路径的走向产生影响，因此匹配结果并不都是合理的，需要从中筛选出合理的匹配结果。

DTW算法在距离矩阵中找到的规整路径所经过的点并不都具有合理的匹配关系。Zhou等在之前的研究中提出在选取全局最优峰值点时需要遵循的几个标准：其一是剔除剧烈变化的峰值点，因为这些异常变化是由传感器、被监测气体、大气中被监测气体含量等的不确定性造成的，会影响全局最优峰值点的选取；其二是剔除时间跨度超过20s的峰值点。

在完全理想的情况下，SO₂、CO₂平均值序列应该处于完全同步的状态。当监测设备慢慢靠近船舶烟羽时，SO₂、CO₂平均值都会处于增大趋势，远离烟羽时，就处于减小趋势，由于理想状态下不会受到外部环境因素以及传感器自身因素的干扰，在任一时间点，SO₂与CO₂的平均值差值保持稳定，不会产生较大变化。但实际测量时，复杂的外部环境可能会使不同时间点处平均值差值有较大差异，不能用来作为全局最优峰值点。因此需要寻找能够区分正常变化和异常变化的阈值，将平均值差值较大的匹配结果剔除。在本发明中，使用K均值聚类算法(k-means)对全体匹配结果的归一化后平均值的差值(记为D)进行聚类，以求得区分“正常变化”和“异常变化”的阈值，具体流程为：

1.初始簇中心的个数k为2，即样本集被分为两类，一类为“正常变化”，另一类为“异常变化”；

2.随机选择D中的两个数据点作为两个簇的初始簇中心；

3.计算每个样本点与这两个簇中心的相似度大小，并将样本点划分到与之相似度最大的簇中心所对应的簇中；

4.根据现有的簇中的样本，重新计算每个簇的簇中心；

5.迭代执行步骤3和步骤4，直到簇中心不再发生变化为止。

对D进行多次k-means聚类，如果D能够被稳定的分为两类，则说明阈值已被找到。若匹配结果中SO₂、CO₂归一化后的差值大于该阈值，则说明该匹配结果属于异常变化，应该予以剔除。

依据上述两个条件从匹配结果中筛选出合理的匹配结果，在保留的匹配结果中查找包含SO₂最大平均值的匹配结果，并从找到的所有匹配结果中筛选出包含CO₂最大平均值的匹配结果作为全局最优峰值点。

通过上述方法能够实现排放因子的自动计算。但是，对于测量数据的质量并没有合适的评价方法。因此，本发明提出一种评价测量数据质量的方法，能够依据测量数据的指标计算结果给出质量评价结果。本实施例提出了16个评价指标，分别是样本熵、信息熵、第三四分位数、标准差、偏度、峰值密度标准差、排列熵、模糊熵、近似熵、互信息、第一四分位数、峰度、DTW最短距离、四分位间距、变异系数、峰值点数目之比。其中DTW最短距离、峰值点数目之比、互信息三个评价指标是通过计算SO₂和CO₂测量数据得到的。其余评价指标只需计算SO₂或者CO₂即可得到，为了保证评价结果的准确性，对于这些指标需要分别验证使用SO₂和CO₂测量数据计算的评价准确率，选取正确率更高的一方参与该指标的计算。各个评价指标的作用见表1。

表1. 16个评价指标及其在评价数据质量时起到的作用

采用基于自展抽样的数值方法可以量化评价指标的不确定性，从而确定其置信区间，因此对已有的测量数据进行10000次的自展抽样，计算每次抽样的均值，即可得到一个由若干均值组成的集合，依据该集合就能求出评价指标的置信区间。若指标值处于该指标对应的95％置信区间中，则说明该指标判定测量数据为高质量数据，记为1，若指标值在95％置信区间之外，则说明测量数据被该指标判定为低质量数据，记为0。同时，对测量数据的质量打标签，峰值趋势明显，SO₂与CO₂平均值序列有较高得同步性则认为是高质量数据，质量标签为1；若两条序列变化趋势相差较大且剧烈变化频繁出现则认为是低质量数据，质量标签为0。结合指标的评价结果和质量标签计算每个指标的评价正确率，选取一定数量的有较高正确率的指标组成指标集合对数据质量进行联合评价。计算测量数据的指标值与置信区间中心位置的总体均值间的距离，并求得该距离与置信区间单侧长度的比值，比值越接近0则说明测量数据质量越好，反之越接近1则说明测量数据质量越差，当比值中的分子大于分母时，比值就大于1，此时该指标值不处于95％置信区间之中，因此将比值大于1的结果也重新赋值为1。联合评价时，若所有指标的计算比值均为1，则判断该测量数据质量差，否则计算所有小于1的比值的均值，均值越接近0，表明指标集合认为该测量数据质量越好。最后，根据对测量数据的评价结果，可以选择重新收集测量数据或剔除部分测量数据进行排放因子的计算，以得到更精确的计算结果。

以上详细描述了本发明的较佳具体实施例。应当理解，本领域的普通技术人员无需创造性劳动就可以根据本发明的构思作出诸多修改和变化。因此，凡本技术领域中技术人员依本发明的构思在现有技术的基础上通过逻辑分析、推理或者有限的实验可以得到的技术方案，皆应在由权利要求书所确定的保护范围内。

Claims

1.一种船舶排放因子计算方法，其特征在于，包括以下步骤：

提取所述平均值序列中的全体SO₂峰值点与CO₂峰值点；

从所述匹配关系中确定最优匹配结果作为全局最优峰值点；

基于所述全局最优峰值点计算船舶排放因子。

2.根据权利要求1所述的一种船舶排放因子计算方法，其特征在于，所述确定积分区间包括以下步骤：

S3、计算该段测量过程中所有窗口的峰值密度标准差：

3.根据权利要求2所述的一种船舶排放因子计算方法，其特征在于，建立各个SO₂峰值点与各个CO₂峰值点间的匹配关系包括以下步骤：

基于所述最优积分区间长度，将SO₂测量值及CO₂测量值序列分别转换为SO₂平均值序列及CO₂平均值序列；

通过改进后的曼哈顿距离构造距离矩阵；

在所述距离矩阵中寻找规整路径，从点(0,0)开始逐一对归一化SO₂序列及归一化CO₂序列中每一点进行匹配；

4.根据权利要求3所述的一种船舶排放因子计算方法，其特征在于，将所述SO₂平均值序列及CO₂平均值序列分别进行0-1的归一化，得到归一化SO₂序列Q和归一化CO₂序列C，其表达式分别为：

其中，SO₂data(i)表示SO₂序列中第i个值，SO₂data(min)表示SO₂序列中的最小值，SO₂data(max)表示SO₂序列中的最大值，CO₂data(j)表示CO₂序列中的第j个值，CO₂data(min)表示CO₂序列中的最小值，CO₂data(max)表示CO₂序列中的最大值。

5.根据权利要求4所述的一种船舶排放因子计算方法，其特征在于，所述改进后的曼哈顿距离表达式为：

6.根据权利要求5所述的一种船舶排放因子计算方法，其特征在于，若SO₂峰值点个数为k，CO₂峰值点个数为m，则通过改进后的曼哈顿距离构造一个k*m的距离矩阵A，A中的元素(i,j)点表示Q_i与C_j的距离d(Q_i,C_j)；

在所述距离矩阵A中寻找规整路径，从点(0,0)开始逐一对归一化SO₂序列及归一化CO₂序列中每一点进行匹配，并对距离进行累加，当到达终点(k,m)后，累加距离的结果即为归一化SO₂序列及归一化CO₂序列的相似度；执行递归可得：

其中，ψ(i,j)表示距离矩阵A所对应的最短距离。

7.根据权利要求6所述的一种船舶排放因子计算方法，其特征在于，从所述匹配关系中确定最优匹配结果作为全局最优峰值点，即使用K均值聚类算法对全体匹配关系的归一化后平均值的差值进行聚类，包括以下步骤：

A4、根据现有的簇中的样本，重新计算每个簇的簇中心；

A5、迭代执行步骤A3和步骤A4，直到簇中心不再发生变化；

8.根据权利要求1所述的一种船舶排放因子计算方法，其特征在于，还包括测量数据评价步骤，即提出评价指标，评价船舶尾气排放测量数据的数据质量，以评估船舶排放因子计算结果的可信度，从而对船舶排放因子的计算进行优化。

9.根据权利要求8所述的一种船舶排放因子计算方法，其特征在于，所述评价船舶尾气排放测量数据的数据质量，即采用基于自展抽样的数值方法量化评价指标的不确定性，从而确定其置信区间，包括以下步骤：

10.一种船舶排放因子计算系统，其特征在于，包括数据测量模块、计算模块及优化模块；

提取所述平均值序列中的全体SO₂峰值点与CO₂峰值点；

从所述匹配关系中确定最优匹配结果作为全局最优峰值点；

基于所述全局最优峰值点计算船舶排放因子；