CN101567124A

CN101567124A - 一种海洋灾害预警方法

Info

Publication number: CN101567124A
Application number: CNA2009100160245A
Authority: CN
Inventors: 程岩; 杜立彬; 孙继昌; 张颖颖; 任国兴; 徐珊珊; 尤小华; 侯广利; 刘岩; 高杨; 张颖; 汤永佐; 石小梅; 朱苹
Original assignee: Oceanographic Instrumentation Research Institute Shandong Academy of Sciences
Current assignee: Oceanographic Instrumentation Research Institute Shandong Academy of Sciences
Priority date: 2009-06-04
Filing date: 2009-06-04
Publication date: 2009-10-28
Anticipated expiration: 2029-06-04
Also published as: CN101567124B

Abstract

本发明公开了一种海洋灾害预警方法，包括以下步骤：a.获得监测数据；b.分析所述监测数据得到其所构成的事件；c.按照所述事件并根据统计预测模型预测灾害事件。本发明中，由于采用统计模型进行预测，其不会因为个别环境因素的变化引起错误，容错能力强，可靠性高。

Description

一种海洋灾害预警方法

技术领域

本发明涉及海洋环境领域，尤其涉及一种海洋灾害预警方法。

背景技术

现阶段，用于海洋灾害预报的方法基本采用数值预报方法。其是利用大型、快速的电子计算机求解描述海洋气象运动的方程组来制作海洋灾害预报的方法。其预测过程的运算量庞大，耗时长且消耗较多的资源。

在数值预报中，由于一些小尺度或接近于小尺度运动的无法在预测模型中确切的反应出来，再加之数值预报方法的模型中参数的确定缺乏客观准确的方法，从而导致了预测结果的准确性降低。

另外，虽然在适当条件下，可以证明某些线性微分方程组的稳定格式的数值解，能够近似表示相应的微分方程组的真解，但对于非线性微分方程来说，这两种解可能不完全一致。有时候数值解即使是计算稳定的，但却与真解毫无相似之处。此种原因，也能够导致预测结果的准确性降低。

发明内容

本发明所要解决的技术问题在于提出一种快速且可靠性高的海洋灾害预警方法。

为了解决上述技术问题，本发明提供一种海洋灾害预警方法，包括以下步骤：

a、获得监测数据；

b、分析所述监测数据得到其所构成的事件；

c、按照所述事件并根据统计预测模型预测灾害事件。

其中，步骤b中所述事件为预先设置的条件，若满足所述条件，则认为构成了所述事件。

其中，所述统计预测模型通过以下方式获得：

A、通过确定条件设定若干事件；

B、遍历历史数据库中的监测记录，确定所述若干事件是否发生并记录；

C、利用关联规则方法确定所述若干灾害事件中的仅包含一个灾害事件的关联事件；

D、根据所述关联事件同时发生的次数与所述关联事件中非灾害事件发生次数的比率生成预测模型。

其中，步骤A中所述条件包括：相关站点、数据属性、属性范围、事件类别、比较方式、前向时间。

其中，所述条件还包括：相关历史站点。

其中，所述比较方式包括：区间范围内、区间变化、区间对比；

所述区间范围内表示所述相关站点在当前时间之前的所述前向时间的数据属性的在所述属性范围内；

所述区间变化又包括特定时间段和历史时间段；所述特定时间段表示所述相关历史站点在设定的时间范围内的所述数据属性与所述相关站点在当前时间之前的所述前向时间的所述数据属性的变化关系符合所述属性范围；

所述历史时间段表示所述相关历史站点在设定的历史时间区间内的所述数据属性的平均值与所述相关站点在当前时间之前的所述前向时间的所述数据属性的变化关系符合所述属性范围；

所述区间对比表示所述相关站点在设定的相关站点时间段内的所述数据属性的平均值与所述历史相关站点在设定的历史相关站点时间段内的所述数据属性的平均值的变化关系符合所述属性范围。

其中，所述事件类别包括正常事件和灾害事件；所述灾害事件至少包括风暴潮、赤潮、巨浪及海啸中的一个。

其中，所述步骤C包括：

C1、确定步骤B中所发生事件中每一个所发生的次数占所述历史数据库中全部监测记录的数量的比率，并与预先设置的第一支持度比较，若小于所述第一支持度则剔除，否则保留作为频繁一项集；

C2、确定所述频繁一项集中任意两个仅包含一个灾害事件的关联事件同时发生的次数占所述历史数据库中全部监测记录的数量的比率，并与预先设置的第二支持度比较，若小于所述第二支持度则剔除，否则保留作为频繁二项集；

C3、将频繁N-1项集中每个N-1项关联事件内的事件按序排列后，再将仅前N-2个事件相同的每两个N-1项关联事件合并形成包含N个事件的N项事件以构成候选N项集；并且，计算所述候选N项集中每个N项事件同时发生的次数占所述历史数据库中全部监测记录的数量的比率，并与预先设置的第N支持度比较，若达到所述第N支持度则保留该N项事件作为N项关联事件以构成频繁N项集。

其中，N为大于等于3的正整数；并且，当出现以下任一情形时，本流程结束：

情况一、频繁N-1项集中没有两个N-1项关联事件的前N-2个事件相同；

情况二、候选N项集中的N项事件均无法达到第N支持度。

其中，步骤D包括：

D1、获得所述历史数据库中关联事件同时发生的次数；

D2、获得所述历史数据库中所述关联事件中排除灾害事件后的剩余事件独立发生的次数；

D3、将步骤D1所述次数比上步骤D2所述次数得到所述剩余事件导致所述灾害事件发生的概率。

其中，步骤D3之后还包括：

D4、将所述概率与预设置信度比较，若达到所述预设置信度，则保留所述概率。

本发明中，由于采用统计模型进行预测，其不会因为个别环境因素的变化引起错误，容错能力强，可靠性高。

而且，当统计预测模型建立后，在对海洋实时监测的数据进行分析时，仅需作少量的简单运算，因此预报速度快。

附图说明

图1是本发明一种海洋灾害预警方法的一个实施例的流程图；

图2是图1所示实施例中预测模型建立过程的一个实施例的流程图；

图3是图2所示实施例中挖掘关联事件的一个实施例的流程图；

图4是图2所示实施例中利用关联事件产生预测模型的一个实施例的流程图。

具体实施方式

下面结合附图对本发明进行详细阐述。

参考图1，图示了本发明一种海洋灾害预警方法的一个实施例的流程图。如图所示，包括以下步骤：

步骤S100，获得监测数据。

本步骤中通过设置在海洋上的浮标、监测船、监测中心站及遥感飞机等采集数据。

所述浮标、监测船、监测中心站及遥感飞机等设置在需要的位置，其所采集的数据按照固定的时间间隔自动发送至与其对应的中心站点。

所述对应的中心站点可以对所述采集的数据进行加工作为监测数据，也可以直接将所述采集到的数据作为监测数据。只要是本步骤所获得的数据都称之为监测数据。

所述监测数据包括流速、流向、有效波高、周期、波向、水温、气压、气温、风速、风向、潮位、表层海水盐度等参数。

也就是说，本步骤得到了若干中心站发送而来的流速、流向、有效波高、周期、波向、水温、气压、气温、风速、风向、潮位、表层海水盐度中的若干个等参数。

例如，通过本步骤获得了第一中心站的水温、流速等等监测数据。

步骤S101，分析所述监测数据得到其所构成的事件。

本步骤分析步骤S100中所得到的监测数据，确定所述监测数据符合哪些预先设定的事件。

所述预先设定的事件是人工设置的一些条件，只要满足了这些条件，就认为符合所述事件。

本步骤的详细描述可以参考下文的相关部分。

步骤S102，按照所述事件并根据统计预测模型预测灾害事件发生的概率。

本步骤中，将上一步所确定事件置入所述统计预测模型中，从而对应预测得到了哪些灾害事件会发生，以及发生的概率是多大。

本步骤中统计预测模型的生成的一个实施例可以参考图2及其文字描述。

步骤S103，结束。

参考图2，图示了图1所示实施例中预测模型建立过程的一个实施例的流程图。如图所示，包括以下步骤：

步骤S201，设定条件以确定事件。

本步骤中，通过人工设定一些条件，这些条件便对应着一个事件，这些事件可以是灾害事件，也可以是正常事件。

所述灾害事件可以是风暴潮、赤潮、巨浪、海啸等事件。

所述设定的条件包括：当前站点、相关站点、相关历史站点、数据属性、属性范围、事件类别、比较方式、前向时间；而所述比较方式又包括区间范围内、区间变化、区间对比。

所述当前站点，表示事件发生所针对的中心站点；

所述相关站点，表示与所述当前站点的事件发生有关的中心站点；

所述相关历史站点，表示其历史数据与所述当前站点的事件发生有关的中心站点；

所述数据属性，为流速、流向、有效波高、周期、波向、水温、气压、气温、风速、风向、潮位、表层海水盐度等；

所述事件类别，表示针对当前站点的所述事件是灾害事件，还是正常事件；

所述前向时间，表示引发所述当前站点的所述事件产生的条件中，所述相关站点的所述数据属性是针对其在当前时间之前的前向时间时的值；此处当前时间是指对下述的对历史数据库中的监测记录进行遍历时，所在监测记录的监测时间；

所述属性范围，表示所述相关站点和/或所述相关历史站点在比较方式所确定的方式下，其在所述数据属性所确定的项目上必须符合的范围；该属性范围又包括方向、趋势和边界，所述边界为具体的预先确定的值；所述方向则表示所述数据属性与所述边界应满足的关系；所述趋势则表示，当所述相关站点及所述相关历史站点均确定后，在对所述相关站点及相关历史站点的所述数据属性按照下述设定比较方式进行比较时，所述相关站点应与所述相关历史站点的数据属性该满足的该趋势；

例如，所述数据属性为流速，所述边界包括第一边界和第二边界，所述第一边界的值小于第二边界的值；所述方向为大于等于所述第一边界小于第二边界；那么，其表示的意思便是：所述流速应该大于等于所述第一边界小于第二边界；

再比如，当所述趋势设定为变大时，所述相关站点在所述数据属性所确定的项目的对应值应该大于所述相关历史站点在数据属性所确定项目的对应值。更直观的理解可以参考下属的举例。

需要说明的是，所述方向并不限于所述大于等于所述第一边界小于第二边界，其还可以是‘大于第一边界’、‘小于第一边界’、‘等于第一边界’、‘大于等于第一边界’、‘小于等于第一边界’、‘大于第一边界且小于第二边界’、‘大于第一边界且小于等于第二边界’、‘大于等于第一边界且小于等于第二边界’、‘小于第一边界或大于第二边界’、‘小于等于第一边界或大于第二边界’、‘小于第一边界或大于等于第二边界’或者‘小于等于第一边界或大于等于第二边界’等等。

另外，所述趋势也不限于所述变大，其还可以是变小、等于、大于等于、小于等于或不等于等等。

所述比较方式，表示在确定所述相关站点和/或所述相关历史站点是否在所述属性范围时，对所述数据属性的利用方式；其包括区间范围内、区间变化、区间对比；

所述区间范围内，表示所述相关站点在所述当前时间之前的所述前向时间时的数据属性在所述数据属性范围；

所述区间变化又包括特定时间段和历史时间段；

所述特定时间段，表示所述相关历史站点在设定的时间范围内所述数据属性与所述相关站点在当前时间之前的所述前向时间的所述数据属性的变化关系符合所述属性范围；

所述设定的时间范围通过界定两个事件端点来实现，所述两个时间端点通过年月日来确定，由人工输入设定；

所述历史时间段，表示所述相关历史站点在设定的历史时间区间内的所述属性的平均值与所述相关站点在所述当前时间之前的所述前向时间的所述数据属性的变化关系符合所述属性范围；

所述历史时间区间通过“时间段”和“深度”两个参数人工确定，所述“时间段”可以设定为“历史日中该时”或“历史日中该天”等，所述“深度”则填入具体的数值，该具体的数值表示所述“时间段”所确定的该时或该日在所述当前时间往前追溯的程度；例如，若“深度”选择3，“时间段”设定为“历史日中该时”，则表示在所述当前时间的昨天、前天、大前天中三个当前时刻的所述数据属性的平均值；若“深度”选择2，“时间段”设定为“历史日中该天”，则表示在所述当前时间的昨天及前天中所有时刻的所述数据属性的平均值；

所述区间对比，表示所述相关站点在设定的相关站点时间段的所述数据属性的平均值与所述历史相关站点在设定的历史相关站点时间段内的所述数据属性的平均值的变化关系符合所述属性范围；

所述相关站点时间段和所述历史相关站点时间段均通过设定两个时间端点来确定，此处的两个时间端点为24小时的时刻，例如0点至2点，2点至4点等等。

下面具体举例说明本步骤：

例一

假设某一事件用I5表示，其所对应的当前站点为StationA，该事件I5所对应的条件的设定如下：

设定相关站点为Station B，相关历史站点为Station C，数据属性设定为流速，方向设定为大于第一边界，第一边界设定为23，趋势设定为变大，事件类别设定为正常，比较方式设定为区间变化中的历史时间段，该历史时间段设定为“历史日中该时”，深度设定为3，前向时间设置为0或空置；

则，上述条件表示如下含义：

发生在StationA的事件I5的条件为Station B在当前时间的流速比Station C在当前时间的昨天、前天、大前天(往前3天)中三个当前时刻的流速的平均值大23。

例二

假设某一事件用I6表示，其所对应的当前站点为Station D，该事件I5所对应的条件的设定如下：

设定相关站点为Station E，相关历史站点设定为Station F，数据属性设定为水温，比较方式设定为区间变化中的特定时间段，该特定时间段中的两个端点设定为2008年5月3日3时和2008年5月3日7时，方向设定为大于第一边界，第一边界设定为5，趋势设定为变大，事件类别设定为正常，前向时间设置为4；

则，上述条件表示如下含义：

发生在Station E的事件I6的条件为Station E在当前时间之前4小时时的水温比Station F从2008年5月3日3时至2008年5月3日7时之间所监测的水温的平均值大5。

例3

假设某一事件用I7表示，其所对应的当前站点为Station G，该事件I7所对应的条件的设定如下：

设定相关站点Station H，相关历史站点设定为Station I，数据属性设定为流向，比较方式设定为区间对比，该区间对比中的Station H的两个时间端点为0和2，Station I的两个时间端点设置为2和4，方向设定为大于第一边界，第一边界设定为20，趋势设定为变大，事件类别设定为正常，前向时间设定为0或空置；

则，上述条件设定所表示的含义如下：

发生在Station G的事件I7的条件为Station H的当前时间减去0到当前时间减去2的时段内流向的平均值比Station I的当前时刻减去2到当前时刻减去4的时段内流向的平均值大20。

例4

假设某一事件用I1表示，其所对应的当前站点为Station J，该事件I8所对应的条件的设定如下：

设定相关站点为Station K，数据属性设定为潮位，方向设定为大于第一边界，第一边界设置为50，时间类别设置为灾害事件巨浪，比较方式设定为区间内，前向时间设定为0或空置；

则，上述条件设定所表示的含义如下：

发生在Station J的事件I1的条件为Station K的当前时刻的潮位大于50。

例5

假设某一事件用I3表示，其所对应的当前站点为Station L，该事件I3所对应的条件的设定如下：

设定相关站点为Station M，相关历史站点为Station N，数据属性设定为气温，方向设定为小于第一边界，第一边界设定为30，趋势设定为变大，事件类别设定为灾害事件风暴潮(即I3表示风暴潮事件，前述例子类同)，前向时间设置为2，比较方式设定为区间变化中的历史时间段，该历史时间段设定为“历史日中该天”，深度设定为3；

则，上述条件表示如下含义：

发生在Station L的风暴潮事件I3的条件为Station M在当前时间之前2小时时的气温比Station N在当前时间的昨天、前天、大前天三天中所有时刻的气温的平均值30。

需要注意的是，上述举例仅为了说明如何对条件进行人为的设定以确定各个事件，并不真正表示所述条件真实构成所对应的事件，其可以根据实际情况的不同而改变。

另外，上述5个举例中也仅举出了一个事件仅包含一个条件的情况，当然也可以存在一个事件包含两个条件、三个条件或多个条件的情形，其可以根据需要进行设定，由于过程类似，因而不再进行一一阐述。

步骤S202，遍历历史数据库确定所述事件是否发生并记录。

即，本步骤中遍历历史数据库确定上一步所设定的事件是否发生。

所述历史数据库是长期积累的历史监测数据的集合，其中每一条记录存储了过去某个监测时刻所测得的各种数据，例如：

某一条记录可以包含从Station A至Station N中全部站点在1983年1月29日12时的全部数据属性的值，包括了流速、流向、有小波高、周期、波向、水温、气压、气温、风速、风向、潮位、表层海水盐度等等。而，上述的当前时间或当前时刻也是指此处的1983年1月29日12时。

本步骤中当确定某条记录中发生了某个事件时，对应该条记录记录所述发生的事件。例如，若记录1发生了I1、I5、I7，则对应记录。

而判断所述事件是否发生，则是根据上一步中所设定的条件进行判断，若某个记录满足某个事件对应的全部条件，则认为该事件发生。

步骤S203，利用关联规则方法挖掘关联事件。

所述关联事件是指同时发生的至少两个事件，其至少包含一个灾害事件。本步骤的一个详细的阐述可以参考图3所示实施例。

步骤S204，利用所述关联事件产生预测模型。

即，本步骤最终生成图1所示过程所用到预测模型。本步骤的一个详细的阐述可以参考图4所示实施例。

参考图3，图示了图2所示实施例中挖掘关联事件的一个实施例的流程图。如图所示，包括以下步骤：

步骤S2031，计算所有单个事件发生的比率。

即，针对所述历史数据库中全部记录所发生的事件，计算每个单个事件发生的次数。将所述每个单个事件发生的次数除以所述历史数据库中全部记录的个数便得到了所述单个事件发生的比率。

例如，历史数据库包含14条记录，每条记录对应发生的事件如下：

1、 I1，I5，I6，I7，I9；

2、 I3，I4，I7；

3、 I7，I8，I9；

4、 I1，I4，I7；

5、 I1，I4，I6，I8；

6、 I6，I7，I9；

7、 I1，I6，I8；

8、 I1，I5，I7，I8；

9、 I1，I7，I8，I9；

10、 I1，I6，I8，I9；

11、 I5，I7，I9；

12、 I5，I7，I8；

13、 I1，I2，I4，I7；

14、 I1，I5，I7，I8；

对于事件I4来说，其在第2、4、5、13条记录中共计发生4次，那么4/14＝0.285％便是所述事件I4发生的比率。同理就可以得到I1至I9中其它事件的发生比率。

其中，本步骤中，在所述历史数据库中所发生的全部事件都作为候选一项集，对于该候选一项集中的每一个事件都对应一个发生比率；

步骤S2302，判断是否达到第一支持度，若没有达到则剔除。

本步骤是在上一步得到了候选一项集(也即全部单个事件)发生的比率后执行的，其目的在于判断每一个事件发生的比率是否达到了某一门限(第一支持度)，若达到了，则表明其是频繁发生的事件，否则认为其不是频繁发生的事件，后续便不做考虑。

其中，所述第一支持度为预先设置的值，其可以根据需要进行修改。

步骤S2033，生成频繁一项集。

即，当通过上一步将不是频繁发生的事件剔除以后，则剩余的便认为是频繁发生的事件。本步骤中，将所述剩余的频繁发生的事件作为频繁一项集进行存储。

步骤S2034，计算二项事件发生比率。

本步骤是在步骤S2033的基础上执行的，即是针对的所述频繁一项集中的各个事件。

具体的来说，对所述频繁一项集中的事件进行两两组合作为二项事件，并将全部的二项事件构成候选二项集。

之后，计算所述候选二项集中每个二项事件在所述历史数据库的全部记录中所发生的次数；然后，用该次数除以所述历史数据库的全部记录的条数便得到了该二项事件发生的比率。

例如，接续上述包含14条数据的历史数据库的例子，假设第一支持度为0.2，则经过步骤S2033后得到的频繁一项集为：I1，I4，I5，I6，I7，I8，I9；

其中，I1至I3为灾害事件，I4至I9为正常事件。则经过两两组合后，可以形成的二项事件为：

(I1，I4)、(I1，I5)、(I1，I6)、(I1，I7)、(I1，I8)、(I1，I9)、(I4，I5)、(I4，I6)、(I4，I7)、(I4，I8)、(I4，I9)、(I5，I6)、(I5，I7)、(I5，I8)、(I5，I9)、(I6，I7)、(I6，I8)、(I6，I9)、(I7，I8)、(I7，I9)、(I8，I9)；

将所述形成的全部二项事件作为候选二项集，并计算该候选二项集中全部二项事件的发生比率，得到的结果如下(以“发生次数/总记录条数”表示)：

I1，I4发生的比率为：3/14＝21.4％；

I1，I5发生的比率为：3/14＝21.4％；

I1，I6发生的比率为：4/14＝28.6％；

I1，I7发生的比率为：6/14＝42.9％；

I1，I8发生的比率为：6/14＝42.9％；

I1，I9发生的比率为：3/14＝21.4％；

I4，I5发生的比率为：0

I4，I6发生的比率为：1/14＝7.1％；

I4，I7发生的比率为：3/14＝21.4％；

I4，I8发生的比率为：1/14＝7.1％；

I4，I9发生的比率为：0

I5，I6发生的比率为：1/14＝7.1％；

I5，I7发生的比率为：5/14＝35.7％；

I5，I8发生的比率为：3/14＝21.4％；

I5，I9发生的比率为：2/14＝14.3％；

I6，I7发生的比率为：2/14＝14.3％；

I6，I8发生的比率为：3/14＝21.4％；

I6，I9发生的比率为：3/14＝21.4％；

I7，I8发生的比率为：5/14＝35.7％；

I7，I9发生的比率为：5/14＝35.7％；

I8，I9发生的比率为：3/14＝21.4％；

步骤S2035，判断是否达到第二支持度，若没有则剔除。

本步骤是在上一步得到了所述候选二项集中全部二项事件发生的比率后执行的，其目的在于判断每个二项事件发生的比率是否达到了某一门限(第二支持度)，若达到了，则表明其是频繁发生的二项事件从而作为二项关联事件构成频繁二项集，否则认为其不是频繁发生的二项事件，这样在图4所示实施例中的通过频繁二项集预报中便不做考虑，也即本步骤中说的剔除。

其中，所述第二支持度为预先设置的值，其可以与所述第一支持度相同或不同，并可以根据需要进行修改。

步骤S2036，生成频繁二项集。

即，当通过上一步将不是频繁发生的二项事件剔除以后，本步骤中，将所述剩余的频繁发生的二项关联事件作为频繁二项集进行存储以进行后续的三项关联事件及图4中预测模型的产生。

步骤S2037，计算三项事件发生比率。

本步骤是在步骤S2036的基础上执行的，即是针对的所述频繁二项集中的各个二项关联事件。

具体的来说，对所述频繁二项集中的事件按照下标增续排列后，将所述频繁二项集中仅最后一个事件不相同的二项关联事件进行合并，从而形成包含三个事件的三项事件以构成候选三项集。

之后，计算所述候选三项集中每个三项事件在所述历史数据库的全部记录中所发生的次数；然后，用该次数除以所述历史数据库的全部记录的条数便得到了该三项事件发生的比率。

例如，继续上述二项关联事件的例子；假设第二支持度为0.2，则频繁二项集为：(I1，I4)、(I1，I5)、(I1，I6)、(I1，I7)、(I1，I8)、(I1，I9)、(I4，I7)、(I5，I7)、(I5，I8)、(I6，I8)、(I6，I9)、(I7，I8)、(I7，I9)、(I8，I9)。所述的频繁二项集中每个二项关联事件已按照下标顺序增序排列，再将仅最后一个事件不相同的二项关联事件进行合并，这样可以形成以下三项关联事件：(I1，I4，I5)、(I1，I4，I6)、(I1，I4，I7)、(I1，I4，I8)、(I1，I4，I9)、(I1，I5，I6)、(I1，I5，I7)、(I1，I5，I8)、(I1，I5，I9)、(I1，I6，I7)、(I1，I6，I8)、(I1，I6，I9)、(I 1，I7，I8)、(I 1，I7，I9)、(I1，I8，I9)、(I5，I7，I8)、(I6，I8，I9)、(I7，I8，I9)；所述合并得到的三项事件便作为三项候选集。

通过遍历所述包含14条记录的历史数据库可知，所述三项事件在所述历史数据库的全部记录中对应发生的次数分别为：0、1、2、1、0、1、3、2、1、1、3、2、3、2、2、3、1、2；那么，用所述次数除以记录总条数14便可以得到所述三项关联事件对应发生的比率为：0、7.1％、14.3％、7.1％、0、7.1％、21.4％、14.3％、7.1％、7.1％、21.4％、14.3％、21.4％、14.3％、14.3％、21.4％、7.1％、14.3％。

步骤S2038，判断是否达到第三支持度，若没有则剔除。

本步骤是在上一步得到了全部三项事件发生的比率后执行的，其目的在于判断每个三项事件发生的比率是否达到了某一门限(第三支持度)，若达到了，则表明其是频繁发生的三项事件从而作为三项关联事件构成频繁三项集，否则认为其不是频繁发生的三项事件，这样在图4所示实施例通过频繁三项集预报中便不做考虑，也即本步骤中说的剔除。

其中，所述第三支持度为预先设置的值，其可以与所述第一支持度或第二支持度相同或不同，并可以根据需要进行修改。

步骤S2039，生成频繁三项集。

即，当通过上一步将不是频繁发生的三项事件剔除以后，本步骤中，将所述剩余的频繁发生的三项事件作为频繁三项集进行存储以进行后续的频繁四项集及图4实施例中预测模型的产生。

例如，当所述第三支持度也为0.2，那么所述候选三项集中的可以作为频繁三项集的事件如下：(I1，I5，I7)、(I1，I6，I8)、(I1，I7，I8)、(I5，I7，I8)。

步骤S2040，计算并生成更高的频繁项集直至无法得到更高的频繁项集。

即，按照上述规律，继续计算并生成频繁四项集、频繁五项集、频繁六项集、频繁七项集...频繁N项集；其中，N为正整数。

当生成频繁四项集时，则是在频繁三项集的基础上，将其中每个三项关联事件按照下标增序排列，将两组三项关联事件中仅最后一个事件不同(也就是仅前两个事件相同)的三项关联事件合并，从而形成包含四个事件的四项事件以构成候选四项集，然后再根据第四支持度来确定频繁四项集。

同理，当生成频繁五项集时，则是在频繁四项集的基础上，每个四项关联事件按照下标增序排列，再将其中每两组四项关联事件中仅最后一个事件不同(也就是仅前三个事件相同)的四项关联事件进行合并构成候选五项集，然后根据第五支持度来确定频繁五项集。

也即，对于生成频繁N项集来说，其是在频繁N-1项集的基础上，将频繁N-1项集中的N-1项关联事件按照下标增序排列后，再将每两组仅最后一个事件不同(也就是仅前N-2个事件相同)进行合并，形成包含N个事件的N项事件以构成候选N项集，然后再根据第N支持度来确定频繁N项集(若达到所述第N支持度，则作为N项关联事件构成频繁N项集，否则剔除)。

由于在上述描述的基础上，继续计算并生成更高的频繁项集的方法对本领域普通技术人员来说很容易实现，因而不再进行进一步阐述。

下面说明在什么情况下继续计算并生成更高的频繁项集会停止：

情况一、无法产生更高的项集。

即，在生成频繁N项集时会由于频繁N-1项集中N-1项关联事件按照下标增序排列后，无法找到两个N-1关联事件中仅最后一个事件相同的情况(也即无法找到两个N-1关联事件仅前N-2个事件相同的情形)，这样一来，也就无法产生N项关联事件，因而也就无法产生频繁N项集。

例如，假设频繁五项集为：(I1，I5，I6，I7，I9)，(I1，I6，I8，I10，I11)，其包含的共同事件只有I1和I6两个，不仅最后一个事件不相同，因而无法生成六项关联事件，也就无法生成频繁六项集。

情况二、产生的更高的关联事件中不满足对应的支持度。

即，在生成频繁N项集时，若现有的N项关联事件均无法达到第N支持度时，则也无法作为频繁N项集。

步骤S2041，结束。

参考图4，图示了图2所示实施例中利用关联事件产生预测模型的一个实施例的流程图。如图所示包括以下步骤：

步骤S3041，获得关联事件发生的次数。

本实施例所述的关联事件是指生成的各个频繁项集中的事件，也就是说是发生比率达到了对应支持度的关联事件。

本步骤可以重新计算，或者直接使用前面过程已经计算的结果。例如，利用步骤S2031、步骤S2034、步骤S2037等中的结果，或者按其方式重新计算。

步骤S3042，获得关联事件中除去灾害事件的剩余事件发生次数。

即，在历史数据库的全部记录中搜索发生一个关联事件中除去灾害事件后剩余的事件同时发生的次数。

例如，继续上述二项关联事件的例子，其频繁二项集为(I1，I4)、(I1，I5)、(I1，I6)、(I1，I7)、(I1，I8)、(I1，I9)、(I4，I7)、(I5，I7)、(I5，I8)、(I6，I8)、(I6，I9)、(I7，I8)、(I7，I9)、(I8，I9)。对于(I1，I5)来说，计算除去灾害事件I1后，剩余的事件I5在所述历史数据库的全部记录中所发生的次数；同样，对于(I1，I8)来说，计算除去灾害事件I1后，剩余的事件I8在所述历史数据库的全部记录中所发生的次数；对于两个事件都不是灾害事件的二项关联事件，则不做考虑。例如(I4，I7)、(I5，I7)、(I5，I8)、(I6，I8)、(I6，I9)、(I7，I8)、(I7，I9)、(I8，I9)这些事件。另外，在本例中，所述次数可以通过步骤S2031直接获得，或者重新进行计算。

例如，继续上述三项关联事件的例子，其频繁三项集为(I1，I5，I7)、(I1，I6，I8)、(I1，I7，I8)、(I5，I7，I8)。对于(I1，I5，I7)来说，计算除去灾害事件I1之后，剩余的事件I5和I8在所述历史数据库的全部记录中同时发生的次数；对于(I1，I7，I8)来说，计算除去灾害事件I1之后，剩余的事件I7和I8在所述历史数据库的全部记录中同时发生的次数。同样，对于三个事件都不是灾害事件的三项关联事件则不予考虑。

同理，若有频繁四项集、频繁五项集等等也可以照理计算。由于本领域普通技术人员可以简单推理得到，在此不作进一步阐述。

步骤S3043，计算所述灾害事件发生的概率。

本步骤中，用步骤S3041中计算得到的关联事件的发生次数对应除以步骤S3042中计算得到的剩余事件发生的次数，便得到了步骤S3042中除去的灾害事件发生的概率。

例如，在步骤S3041中频繁三项集中的(I1，I5，I7)发生的次数为P次，而经过步骤S3042计算得到的除去灾害事件I1后，剩余事件I5和I7同时发生的次数为Q，则本步骤中计算P/Q便是所述剩余事件I5和I7同时发生时所述灾害事件I1发生的概率。

例如，在步骤S3041中频繁二项集中的(I1，I9)发生的次数为m次，而经过步骤S3042计算得到的除去灾害事件I1后，剩余事件I9发生的次数为n，则本步骤中计算m/n便是所述剩余事件I9发生时所述灾害事件I1发生的概率。

步骤S3044，结束。

在本发明的一个优选的实施例中，所述步骤S3043与步骤S3044之间还包括：判断步骤S3043中计算得到的发生概率是否达到预设的置信度，若是，则保留此次的对所述灾害事件的预测概率；否则，剔除步骤S3043中得到的预测概率。

这样来说，经过图4所示实施例后便得到了一个预测模型，该预测模型的输入量是实时监测到的数据，该数据输入所述预测模型后，经过图1所示实施例的步骤S101生成事件，然后将生成的事件作为搜索参数，并人工设定预测所提前的时间(该时间与所述前向时间相对应，也就是说这个时间就是所述前向时间，因为模型的建立就是以前向时间作为历史数据的提前预测时间，因而在使用模型的时候应该保持一致)，这样经过搜索模型，便可以得到灾害事件发生的概率。(本段落及上面的阐述再加上图1就是一个预警过程)

本发明中的统计模型预报方法是由用户设定可能与灾害相关的一些规则，系统通过分析历史数据自动计算出每一种规则与灾害的相关程度和根据实时监测的数据满足某一个或某几个规则时，预报灾害发生的概率。

相对于数值预报方法它有如下特点：

1.对站点的同一种灾害有多种预报规则，模型计算得到每种规则与灾害的联系程度。

2.该系统与用户交互，由用户设定规则，辅助用户分析不同的规则与灾害之间的相关程度。

3.随着系统的使用，监测数据提供也被放在历史数据库中，历史数据库逐渐增加，预报模型作自适应的变化。也就是一边实时监测，一边自学习，预报越来越精确。

4.系统预报的过程也是预报模型学习的过程。

本发明所述的统计模型预测方法以历史数据为参考，历史监测数据越多越可靠。

基于关联规则的数据挖掘方法具有非线性表达的能力，适合于海洋灾害预报这一多因子，多目标的拟合、预测。其容错能力强：把海洋历史监测数据库作为知识信息，用统计分析的方法分析灾害和与灾害相关因子之间联系。不会因为个别环境因素的变化引起错误，因此数据挖掘的预报方法容错能力强，可靠性高。

而且，预报速度快：经过用关联规则的数据挖掘方法对历史数据库进行挖掘生成的海洋灾害的预报模型在对海洋实时监测的数据进行分析时，仅需作少量的简单预算，因此预报速度快。

以上所揭露的仅为本发明一种较佳实施例而已，当然不能以此来限定本发明之权利范围，因此依本发明权利要求所作的等同变化，仍属本发明所涵盖的范围。

Claims

1、一种海洋灾害预警方法，包括以下步骤：

a、获得监测数据；

b、分析所述监测数据得到其所构成的事件；

c、按照所述事件并根据统计预测模型预测灾害事件。

2、根据权利要求1所述的海洋灾害预警方法，其特征在于，步骤b中所述事件为预先设置的条件，若满足所述条件，则认为构成了所述事件。

3、根据权利要求1或2所述的海洋灾害预警方法，其特征在于，所述统计预测模型通过以下方式获得：

A、通过确定条件设定若干事件；

C、利用关联规则方法确定所述若干事件中的关联事件；

4、根据权利要求3所述的海洋灾害预警方法，其特征在于，步骤A中所述条件包括：相关站点、数据属性、属性范围、事件类别、比较方式、前向时间。

5、根据权利要求4所述的海洋灾害预警方法，其特征在于，所述条件还包括：相关历史站点。

6、根据权利要求5所述的海洋灾害预警方法，其特征在于，所述比较方式包括：区间范围内、区间变化、区间对比；

7、根据权利要求6所述的海洋灾害预警方法，其特征在于，所述事件类别包括正常事件和灾害事件；所述灾害事件至少包括风暴潮、赤潮、巨浪及海啸中的一个。

8、根据权利要求3所述的海洋灾害预警方法，其特征在于，所述步骤C包括：

C2、将所述频繁一项集中每两个事件组合成为包含两个事件的二项事件以构成候选二项集；并且，计算该候选二项集中每个二项事件同时发生的次数占所述历史数据库中全部监测记录的数量的比率，并与预先设置的第二支持度比较，若小于所述第二支持度则剔除，否则保留该二项事件作为二项关联事件以构成频繁二项集；

情况二、候选N项集中的N项事件均无法达到第N支持度。

9、根据权利要求8所述的海洋灾害预警方法，其特征在于，步骤D包括：

D1、获得所述历史数据库中包含灾害事件的关联事件同时发生的次数；

D2、获得步骤D1所述关联事件中排除灾害事件后的剩余事件在所述历史数据库中独立发生的次数；

10、根据权利要求9所述的海洋灾害预警方法，其特征在于，步骤D3之后还包括：