CN106844663B - 一种基于数据挖掘的船舶碰撞风险评估方法及系统 - Google Patents
一种基于数据挖掘的船舶碰撞风险评估方法及系统 Download PDFInfo
- Publication number
- CN106844663B CN106844663B CN201710051171.0A CN201710051171A CN106844663B CN 106844663 B CN106844663 B CN 106844663B CN 201710051171 A CN201710051171 A CN 201710051171A CN 106844663 B CN106844663 B CN 106844663B
- Authority
- CN
- China
- Prior art keywords
- collision
- ship
- accident
- people
- factors
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0635—Risk analysis of enterprise or organisation activities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2465—Query processing support for facilitating data mining operations in structured databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2474—Sequence data queries, e.g. querying versioned data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/08—Logistics, e.g. warehousing, loading or distribution; Inventory or stock management
- G06Q10/083—Shipping
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/08—Logistics, e.g. warehousing, loading or distribution; Inventory or stock management
- G06Q10/083—Shipping
- G06Q10/0838—Historical data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2216/00—Indexing scheme relating to additional aspects of information retrieval not explicitly covered by G06F16/00 and subgroups
- G06F2216/03—Data mining
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Physics & Mathematics (AREA)
- Human Resources & Organizations (AREA)
- Economics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Strategic Management (AREA)
- Entrepreneurship & Innovation (AREA)
- Operations Research (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Tourism & Hospitality (AREA)
- Development Economics (AREA)
- Quality & Reliability (AREA)
- Databases & Information Systems (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- Fuzzy Systems (AREA)
- Probability & Statistics with Applications (AREA)
- General Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Game Theory and Decision Science (AREA)
- Educational Administration (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本公开是关于一种基于数据挖掘的船舶碰撞风险评估方法及系统,根据统计的船舶碰撞历史数据,通过累积式自回归移动平均模型预测致因因素发生次数,采用主成分分析法对致因因素进行降维计算,将得到的主成分作为第一神经网络的输入,预测碰撞概率;采用决策树分析找到置信度高、频繁发生的事故序列,使用神经网络模型计算受伤人数、死亡人数和财产损失,并进行标准化和归一化处理,消除量级和量纲的影响;用专家系统和模糊层次分析法,赋予指标不同权重量化碰撞后果。根据上述内容,开发基于数据挖掘的船舶碰撞风险评估系统,定量预测船舶碰撞风险,为船舶操纵、避碰应急以及现场处置提供实时指导,可有效降低损失。
Description
技术领域
本公开涉及交通管理技术领域,尤其涉及一种基于数据挖掘的船舶碰撞风险评估方法及系统。
背景技术
在众多交通运输方式中,水路运输以其成本低、运输量大等特点被普遍认可和接受,水上交通运输发展迅速,但是由于船舶运输易受自然环境影响、灵活性差等特点,船舶碰撞事故时有发生,造成不同程度的财产损失、人员伤亡和环境污染。
由于导致船舶碰撞事故的因素众多:包括船舶的因素、环境因素以及人为因素等,这些致因因素由于存在不确定性而很难完全量化碰撞风险。目前通常使用定性或者半定量方法对船舶碰撞的风险进行评估,从而根据评估结果采取相应的船舶管理措施,防止船舶碰撞的发生,降低船舶碰撞引起的损失。然而,发明人通过研究发现,传统风险评估方法,由于加入了大量主观判断,影响船舶碰撞风险评估的准确性;而且,在发生船舶碰撞后,原有的风险评估方式不能定量计算碰撞后果,从而无法为制定应急预案提供客观依据。因此,如何定量计算船舶碰撞后果,以提高风险评估的精度,进而根据风险评估结果,采取有效的应急措施,降低船舶碰撞风险和事故引起的损失,是本领域技术人员亟需解决的技术问题。
发明内容
本发明实施例中提供了一种基于数据挖掘的船舶碰撞风险评估方法及其系统,以解决现有技术中的风险评估精度差、无法降低船舶碰撞风险的问题。
为了解决上述技术问题,本发明实施例公开了如下技术方案:
根据本发明的第一方面,本发明实施例提供了一种基于数据挖掘的船舶碰撞风险评估方法,该方法包括:
根据船舶碰撞历史数据,计算历史碰撞概率,其中,所述船舶碰撞历史数据包括事故致因因素、船舶属性、船舶流量、碰撞次数、历史受伤人数、历史死亡人数以及历史财产损失的一种或多种的组合;
根据所述船舶碰撞历史数据和历史碰撞概率,预测每一事故致因因素的发生次数;
对船舶碰撞历史数据中的事故致因因素进行主成分分析,并优先提取贡献率大的主成分;
根据主成分分析的结果对预测的事故致因因素进行降维计算,并将降维计算的结果作为第一神经网络的输入,得到碰撞概率的预测值;
对船舶属性进行等级划分,采用事故序列的方法寻找频繁项集,通过决策树分析,寻找置信度高的事故序列,对频繁发生且置信度高的事故序列的所有情况进行排列组合;
将船舶属性作为第二神经网络模型的输入层,将决策树分析得到的排列组合后的事故序列输入到所述第二神经网络模型,计算得到对应的碰撞后果;
根据碰撞概率的预测值和所述碰撞后果,计算得到船舶碰撞风险。
可选地,所述事故致因因素包括人为因素、船舶和设备因素、环境因素和管理因素的一种或多种的组合;所述船舶工具属性包括船舶吨位、使用时间、配员数、行驶速度、船舶类型、船舶尺寸、碰撞夹角和碰撞位置的一种或多种的组合。
可选地,所述预测每一事故致因因素的发生次数,包括:
根据累积式自回归移动平均模型,对事故致因因素的发生次数进行预测。
可选地,所述对船舶碰撞历史数据中的事故致因因素进行主成分分析,并优先提取贡献率大的主成分,包括:
对船舶碰撞历史数据中的所有事故致因因素采用主成分分析方法进行简化降维;
提取贡献率大于或等于贡献率阈值的主成分,其中,所述贡献率阈值的取值介于75%至85%之间。
可选地,根据主成分分析的结果对预测的事故致因因素进行降维计算,并将降维计算的结果作为第一神经网络的输入,得到碰撞概率的预测值,包括:
第一神经网络模型结构包括输入层、隐藏层和输出层;
将提取出的主成分作为第一神经网络输入层的参数,将碰撞概率作为输出层的参数,根据主成分分析的结果,对预测的事故致因因素采用主成分分析法进行降维计算,将计算得到的主成分作为第一神经网络的输入,根据输入输出模型、作用函数模型、误差计算模型和自学习模型,计算得到碰撞概率的预测值。
可选地,所述碰撞后果包括受伤人数、死亡人数和财产损失。
可选地,根据碰撞概率的预测值和所述碰撞后果,计算得到船舶碰撞风险之前,还包括:
对所述碰撞后果进行标准化和归一化处理,用于消除量级和量纲的影响;
通过专家系统和模糊层次分析法,确定碰撞后果中受伤人数、死亡人数和财产损失权重;
根据标准化和归一化后的碰撞后果,以及受伤人数、死亡人数和财产损失权重,计算得到新的碰撞后果;
根据碰撞概率的预测值和所述碰撞后果,计算得到船舶碰撞风险,包括:
将碰撞概率的预测值和所述新的碰撞后果进行乘积运算,得到所述船舶碰撞风险。
可选地,对所述碰撞后果进行标准化和归一化处理,包括:
根据特别重大事故受伤人数下限、特别重大事故死亡人数下限和经济损失下限,分别对受伤人数、死亡人数和财产损失进行标准化和归一化处理,消除量级和量纲的影响。
可选地,通过专家系统和模糊层次分析法,确定碰撞后果中受伤人数、死亡人数和财产损失的权重,包括:
采用专家系统确定受伤人数、死亡人数和财产损失的相对重要度,分别对其进行模糊化,得到专家打分矩阵;
对专家打分矩阵求平均值,得到模糊因素判断矩阵;
使用Buckley方法计算模糊权重矩阵;
去模糊化得到受伤人数、死亡人数和财产损失的权重。
根据本发明的第二方面,本发明实施例提供了一种基于数据挖掘的船舶碰撞风险评估系统,该系统包括:
统计模块,用于根据船舶碰撞历史数据,计算历史碰撞概率,其中,所述船舶碰撞历史数据包括事故致因因素、船舶属性、船舶流量、碰撞次数、历史受伤人数、历史死亡人数以及历史财产损失的一种或多种的组合;
预测模块,用于根据所述船舶碰撞历史数据和历史碰撞概率,预测每一事故致因因素的发生次数;
主成分分析模块,用于对船舶碰撞历史数据中的事故致因因素进行主成分分析,并优先提取贡献率大的主成分;
概率计算模块,用于根据主成分分析的结果对预测的事故致因因素进行降维计算,并将降维计算的结果作为第一神经网络的输入,得到碰撞概率的预测值;
组合模块,用于对船舶属性进行等级划分,采用事故序列的方法寻找频繁项集,通过决策树分析,寻找置信度高的事故序列,对频繁发生且置信度高的事故序列的所有情况进行排列组合;
后果计算模块,用于将船舶属性作为第二神经网络模型的输入层,将决策树分析得到的排列组合后的事故序列输入到所述第二神经网络模型,计算得到对应的碰撞后果;
风险评估模块,用于根据碰撞概率的预测值和所述碰撞后果,计算得到船舶碰撞风险。
本公开的实施例提供的技术方案可以包括以下有益效果:本发明实施例提供了一种基于数据挖掘的船舶碰撞风险评估方法及系统,根据统计的历史数据,通过累积式自回归移动平均模型预测致因因素发生次数,对预测的致因因素采用主成分分析法进行降维计算,将降维计算得到的主成分作为第一神经网络的输入,预测船舶碰撞发生的概率;采用事故序列和决策树分析找到置信度较高且频繁发生的事故序列,对其可能的情况进行排列组合,使用神经网络模型计算其可能导致的受伤人数、死亡人数和财产损失,对受伤人数、死亡人数和财产损失进行标准化和归一化处理,消除量级和量纲的影响;用专家系统和模糊层次分析法,赋予这三项指标不同权重以量化碰撞后果最终计算得到船舶碰撞风险。其有益效果如下:
(1)为船舶碰撞后的搜寻救助提供指导。
根据本申请对碰撞结果的分析,确定碰撞所属的等级,指导制定应急预案,从而在搜救开始阶段针对可能的情况提前准备救助设备,做好救助计划,尽可能地减小碰撞损失。
(2)可成为碰撞当事船舶应急反应和事故现场处置的客观依据。
由于在碰撞事故发生后的短时间内,碰撞当事船舶将无法掌握详尽的碰撞损失情况,无法做出及时准确的海事应急处置措施,可能会导致人员伤亡、船舶沉没、海洋环境遭到严重破坏。应用该碰撞结果预测模型有利于在短时间内对碰撞情况有全面客观的认识,结合碰撞后的应急部署做出及时、准确的应急反应和事故现场处置措施,采取科学、合理的自救方案,降低碰撞损失。
(3)为船舶驾引人员安全操纵船舶提供指导。
在对各碰撞因素和碰撞损失量化的基础上,确定各碰撞要素对碰撞损失的影响程度。有利于船舶驾引人员在实际操船的过程中,根据不同碰撞要素对碰撞损失程度的不同影响,结合本船实际操纵性能,尽可能提前得考虑可能发生碰撞危险,客观的做出正确的操船决策,降低碰撞损失程度,保障海上人命、环境、财产的安全。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并与说明书一起用于解释本发明的原理。
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种船舶碰撞风险评估方法的流程示意图;
图2为本发明实施例提供的一种神经网络模型的结构示意图;
图3为本发明实施例提供的一种基于后果量化的船舶碰撞风险计算方法的详细流程示意图;
图4为本发明实施例提供的一种船舶碰撞风险评估系统的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明中的技术方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
在众多交通运输方式中,水路运输以其成本低、运输量大等特点被普遍认可和接受,水上交通运输发展迅速,但是由于船舶运输易受自然环境影响、灵活性差等特点,船舶碰撞事故时有发生,造成不同程度的财产损失、人员伤亡和环境污染。因此,有必要对船舶碰撞事故进行分析研究,依据历史经验数据,定量预测船舶碰撞风险,降低船舶碰撞后果,预防类似事故的再次发生。
参见图1,为本发明实施例提供的一种船舶碰撞风险评估方法的流程示意图,如图1所示,该方法包括:
步骤S101:根据船舶碰撞历史数据,计算历史碰撞概率,其中,所述船舶碰撞历史数据包括事故致因因素、船舶属性、船舶流量、碰撞次数、历史受伤人数、历史死亡人数以及历史财产损失的一种或多种的组合。
通过搜集船舶碰撞的资料构建历史数据库,该历史数据库中包括有船舶碰撞历史数据,其中,所述船舶碰撞历史数据包括事故致因因素、船舶属性、船舶流量、碰撞次数、历史受伤人数、历史死亡人数以及历史财产损失的一种或多种的组合;所述事故致因因素包括人为因素、船舶和设备因素、环境因素和管理因素的一种或多种的组合;所述船舶属性包括船舶吨位、使用时间、配员数、行驶速度、船舶类型、船舶尺寸、碰撞夹角和碰撞位置的一种或多种的组合。对历史数据库以及相关文献资料、事故调查报告中船舶碰撞事故的事故致因因素(人、环境、设备等因素)、船舶碰撞次数碰撞船舶各属性(碰撞两船的吨位、船龄、配员数、航行速度、船舶类型、碰撞夹角、船舶尺寸、船舶碰撞时排水量和碰撞位置等因素)、船舶流量、船舶碰撞次数和概率等,按照年份,进行统计归纳和分析整理,计算船舶历史碰撞概率。经标准化和归一化处理后,系统研究碰撞要素对船舶碰撞后果的影响。
步骤S102:根据所述船舶碰撞历史数据和历史碰撞概率,预测每一事故致因因素的发生次数。
对每一年的事故原因等因素,用累积式自回归移动平均模型(英文:Autoregressive Integrated Moving Average Model,简称:ARIMA)预测每一事故致因因素的发生次数,具体公式如下:
E(εsεt)=0,任意s<t
其中xt为时间序列数据,xt与xt-i(i=1,2,…p)相关;εt为残差,εt与εt-j(j=1,2,…q)相关;B为延迟算子,满足Bnxt-n=xt-n;p是自回归阶数,q是移动平均阶数,d为差分阶数,为差分算子,
Φ(B)表示自回归系数多项式,其表达式为:
Φ(B)=1-φ1B-φ2B2-……-φpBp
Θ(B)表示移动平均系数多项式,其表达式为:
Θ(B)=1-θ1B-θ2B2-…-θqBq
εt表示独立于xt-i和εt-j的白噪声序列,满足条件:
ε=θ1εt-1+θ2εt-2+…+θqεt-q-φ0-φ1xt-1-φ2xt-2-…-φpxt-p-xt
该模型集合AMRA(p,q)模型与差分运算两种方法,预测精度较高,对数据本身结构性没有太高要求,只需从数据本身寻找规律,拟合效果较好。
步骤S103:对船舶碰撞历史数据中的事故致因因素进行主成分分析,并优先提取贡献率大的主成分。
对所统计的原因进行相关性分析,查看各因素之间的相关性,如果各因素的相关性比较大,则可以通过主成分分析对相关性较大的因素进行合并,提取总贡献率大于贡献率阈值的前n个主成分以及他们包含的影响因素,其中,所述贡献率阈值的取值范围可以为75%至85%之间,优选地,所述贡献率阈值可以为85%。主成分分析的公式如下:
当一个待解决问题有n个样本,且每个样本有p个因素时,可得到如下矩阵:
对矩阵X进行线性变换,得p个新生成的综合变量F1……Fp
F1,F2,……Fp分别为原变量x1,x2,……xp的第1,2……p个主成分。
系数aij需要满足3个条件,其中Var表示方差:
①Fi、Fj(i≠j;i,j=1,2,…,p)相互无关
②Var(F1)>Var(F2)>…>Var(Fp);
第i个主成分yi的方差与总方差的比值表示这个主成份的贡献率。
步骤S104:根据主成分分析的结果对预测的事故致因因素进行降维计算,并将降维计算的结果作为第一神经网络的输入,得到碰撞概率的预测值。
参见图2,为本发明实施例提供的一种神经网络模型的结构示意图,本发明实施例中的第一神经网络模型的结构包括输入层、隐藏层和输出层。当然需要说明的是,在后续步骤中使用的第二神经网络模型与第一神经网络模型具有相似的结构和模型函数,在此仅以第一神经网络模型为例进行详细说明,第二神经网络模型可以参见第一神经网络模型的描述,在此不再赘述。
第一神经网络模型包括输入输出模型、作用函数模型、误差计算模型和自学习模型。
(1)节点输出模型
隐藏节点的输出模型:
Oj=f(∑Wij×Xi-θj)
输出节点的输出模型:
Yk=f(∑Tjk×Oj-θk)
其中,f表示非线形作用函数,θ表示神经单元阈值。
(2)作用函数模型
作用函数反映了下层输入对上层节点刺激脉冲强度,又叫刺激函数,一般为(0,1)范围内连续取值的Sigmoid函数:
(3)误差计算模型
误差计算模型反映了神经网络期望输出与计算输出之间误差大小:
其中,tpi表示i节点的期望输出值,Opi表示i节点的计算输出值。
(4)自学习模型
神经网络的学习过程,是确定下层节点和上层节点之间的权重矩阵Wij和修正误差过程。神经网络有的需要设定期望值,有的只需输入模式。在本发明实施例中,自学习模型的表达式如下:
ΔWij(n+1)=η×φi×Oj+a×ΔWij(n)
其中,η表示学习因子,Фi表示输出节点i的计算误差,Oj表示输出节点j的计算输出,a表示动量因子。
在计算过程中,将主成分分析得到的n个主成分作为神经网络的输入层的n个节点,将碰撞事故发生的概率作为输出层的节点,隐藏节点个数k的一般经验公式为:
式中,n表示输入层节点数量,m表示输出层几点数量,a为常数,取值范围为1-10。
选取前80%的样本作为训练集,对神经网络进行建模训练,后20%的样本作为检验。隐藏层初始权值为主成分公式中的各个单因子的系数值,调整神经网络模型的目标精度、训练次数、训练函数和隐层数,其余参数采用系统默认值。将ARIMA时间序列预测得到的影响因素输入该模型,计算得到船舶碰撞概率的预测值。
为了保证第一神经网络模型的准确性,进而提高碰撞概率预测的精度,本发明实施例还可以包括使用后20%样本对第一神经网络模型校验、调整的步骤:
步骤S1041:根据提取到的主成分和预测得到的事故致因因素发生次数,通过第一神经网络模型计算得到参考碰撞概率。
根据上述实施例描述的计算过程,计算得到碰撞概率的预测值。
步骤S1042:计算所述参考碰撞概率与预测得到的事故概率的差值。
通过使用步骤S102的计算方法,还可以对事故概率进行预测,进而通过计算参考碰撞概率与预测得到的事故概率的差值,评估该参考碰撞概率的预测精度。如果所述差值较大,则表示所使用的第一神经网络模型的精度较差,如果所述差值较小,则表示所使用的第一神经网络模型的精度较高,可以用于碰撞概率的计算。
步骤S1043:如果所述差值大于差值阈值,对第一神经网络模型的目标精度、训练次数、训练函数和隐层数中的一种或多种进行调整,得到新的第一神经网络模型。
在得到新的第一神经网络模型后,重新回到步骤S1041进行新的迭代。
步骤S1044:如果所述差值小于或等于差值阈值,将所述参考碰撞概率作为碰撞概率的预测值。
如果差值小于或等于差值阈值,则使用当前的第一神经网络模型计算得到的参考碰撞概率误差在可接受的范围内,将由此计算得到的参考碰撞概率作为最终的碰撞概率的预测值。
步骤S105:对船舶属性进行等级划分,采用事故序列的方法寻找频繁项集,通过决策树分析,寻找置信度高的事故序列,对频繁发生且置信度高的事故序列的所有情况进行排列组合。
根据各个船舶属性将其分别划分为不同等级,用数字1,2,3……表征各个属性的实际情况,从统计数据中找到发生事故次数最多的船舶属性组合,再对其进行决策树分析,设置决策树层数为a层,船舶属性共有b个,选取置信度85%以上的序列,控制这a个属性不变,将剩下(b-a)个所有可能情况进行排列组合,得到P种组合。
步骤S106:将船舶属性作为第二神经网络模型的输入层,将决策树分析得到的排列组合后的事故序列输入到所述第二神经网络模型,计算得到对应的碰撞后果。
设置一个新的神经网络模型,即第二神经网络模型,选取b个船舶属性为输入层,输出层为船舶碰撞的受伤人数、死亡人数和财产损失三个数值,选取船舶属性和事故后果相关数据的前80%作为训练集,后20%进行检验。当误差在可接受范围内时,将步骤S105得到的P个组合输入该模型,计算10次,得到十组不同的碰撞后果。
步骤S107:根据碰撞概率的预测值和所述碰撞后果,计算得到船舶碰撞风险。
为了提高船舶碰撞风险的计算精度,在本发明实施例中对碰撞后果进行了标准化和归一化处理,并根据处理后的碰撞后果,计算得到船舶碰撞风险。参见图3,为本发明实施例提供的一种基于后果量化的船舶碰撞风险计算方法的详细流程示意图,该方法包括:
步骤S1071:对所述碰撞后果进行标准化和归一化处理。
根据上述神经网络计算的结果,对其进行标准化和归一化处理如下:
Ai=max Aij
Bi=maxBij
Gi=max Gij
其中,i表示第i次计算,j表示排列组合的第j种情况,C表示死亡人数,单位(人),D表示财产损失,单位(万元),H表示受伤人数,单位(人),A、B、G分别表示无量纲化之后的死亡人数、财产损失和受伤人数,F表示事故后果,ω1、ω2、ω3分别表示死亡人数、经济损失和受伤人数的权重,M是特别重大事故死亡人数下限,N是对应的经济损失下限,Q是特别重大事故受伤人数下限。在本发明实施例中,M可以取值为30,N可以取值为10000万,Q可以取值为100。
步骤S1072:通过专家系统和模糊层次分析法,确定碰撞后果中受伤人数、死亡人数和财产损失的权重。
对于每一次得到的P组受伤人数、死亡人数和财产损失,采用专家系统确定三项指标的相对重要度,分别对其进行模糊化,具体方法见表1,对n个专家打分矩阵求平均值,得到模糊因素判断矩阵A。
专家系统模糊化指标范围,如表1所示:
表1:
对去模糊化,可以得到对应的ω1,ω2,ω3分别表示死亡人数、财产损失和受伤人数的权重。
步骤S1073:根据处理后的碰撞后果,以及受伤人数、死亡人数和财产损失的权重,计算得到新的碰撞后果。
根据步骤S1071处理后的碰撞后果,以及受伤人数、死亡人数和财产损失的权重,计算得到新的碰撞后果,公式如下:
其中,F为碰撞后果,ω1,ω2,ω3分别表示死亡人数、财产损失和受伤人数的权重,A、B、G分别表示标准化和归一化处理后的死亡人数、财产损失和受伤人数。对每一组计算结果取其经过上述处理后的后果F的最大值,然后对10次计算后果的最大值求平均值,用来表征船舶的碰撞后果。
步骤S1074:将碰撞概率的预测值和所述新的碰撞后果进行乘积运算,得到所述船舶碰撞风险。
将上述实施例中步骤S104计算得到的碰撞概率的预测值和步骤S1073计算得到的所述新的碰撞后果进行乘积运算,得到船舶碰撞风险,即船舶碰撞风险=碰撞概率的预测值×碰撞后果,并用F-N曲线表示风险大小。
由上述实施例的描述可见,本发明实施例提供的一种基于数据挖掘的船舶碰撞风险评估方法,根据船舶碰撞历史数据,计算历史碰撞概率,其中,所述船舶碰撞历史数据包括事故致因因素、船舶属性、船舶流量、碰撞次数、历史受伤人数、历史死亡人数以及历史财产损失的一种或多种的组合;根据所述船舶碰撞历史数据和历史碰撞概率,预测每一事故致因因素的发生次数;对船舶碰撞历史数据中的事故致因因素进行主成分分析,并优先提取贡献率大的主成分;根据主成分分析的结果,对预测的事故致因因素采用主成分分析法进行降维计算,将降维计算得到的主成分作为第一神经网络的输入,计算得到碰撞概率的预测值;对船舶属性进行等级划分,采用事故序列的方法寻找频繁项集,通过决策树分析,寻找置信度高的事故序列,对频繁发生且置信度高的事故序列的所有情况进行排列组合;将船舶属性作为第二神经网络模型的输入层,将决策树分析得到的排列组合后的事故序列输入到所述第二神经网络模型,计算得到对应的碰撞后果;根据碰撞概率的预测值和所述碰撞后果,计算得到船舶碰撞风险。本发明通过基于数据挖掘技术对船舶碰撞风险进行分析,并用时间序列对未来可能导致事故的因素进行预测,用主成分分析对事故因素进行降维,用神经网络对事故发生的概率进行预测,分析不同事故序列可能导致的受伤人数、死亡人数和财产损失,并用其表征和量化后果,结合船舶碰撞概率计算船舶碰撞风险,具有很高的评估精度,从而为船舶碰撞救助和船舶操纵提供指导,为应急决策和事故现场处置提供客观依据,有效降低船舶碰撞风险。
通过以上的方法实施例的描述,所属领域的技术人员可以清楚地了解到本发明可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:只读存储器(ROM)、随机存取存储器(RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
与本发明提供的一种基于数据挖掘的船舶碰撞风险评估方法实施例相对应,本发明还提供了一种基于数据挖掘的船舶碰撞风险评估系统。
参见图4,为本发明实施例提供的一种船舶碰撞风险评估系统的结构示意图,该系统包括:
统计模块11,用于根据船舶碰撞历史数据,计算历史碰撞概率,其中,所述船舶碰撞历史数据包括事故致因因素、船舶属性、船舶流量、碰撞次数、历史受伤人数、历史死亡人数以及历史财产损失的一种或多种的组合;
预测模块12,用于根据所述船舶碰撞历史数据和历史碰撞概率,预测每一事故致因因素的发生次数;
主成分分析模块13,用于对船舶碰撞历史数据中的事故致因因素进行主成分分析,并优先提取贡献率大的主成分;
概率计算模块14,用于根据主成分分析的结果对预测的事故致因因素进行降维计算,并将降维计算的结果作为第一神经网络的输入,得到碰撞概率的预测值;
组合模块15,用于对船舶属性进行等级划分,采用事故序列的方法寻找频繁项集,通过决策树分析,寻找置信度高的事故序列,对频繁发生且置信度高的事故序列的所有情况进行排列组合;
后果计算模块16,用于将船舶属性作为第二神经网络模型的输入层,将决策树分析得到的排列组合后的事故序列输入到所述第二神经网络模型,计算得到对应的碰撞后果;
风险评估模块17,用于根据碰撞概率的预测值和所述碰撞后果,计算得到船舶碰撞风险。
本发明可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本发明,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
以上所述仅是本发明的具体实施方式,使本领域技术人员能够理解或实现本发明。对这些实施例的多种修改对本领域的技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
Claims (5)
1.一种基于数据挖掘的船舶碰撞风险评估方法,其特征在于,包括以下步骤:
根据船舶碰撞历史数据,计算历史碰撞概率,其中,所述船舶碰撞历史数据包括事故致因因素、船舶属性、船舶流量、碰撞次数、历史受伤人数和历史死亡人数以及历史财产损失的一种或多种的组合;所述事故致因因素包括人为因素、船舶和设备因素、环境因素和管理因素的一种或多种的组合;所述船舶属性包括船舶吨位、使用时间、配员数、行驶速度、船舶类型、船舶尺寸、碰撞夹角和碰撞位置的一种或多种的组合;
根据所述船舶碰撞历史数据和历史碰撞概率,根据累积式自回归移动平均模型,预测每一事故致因因素的发生次数;
对船舶碰撞历史数据中的事故致因因素进行主成分分析,并优先提取贡献度大的主成分;
根据主成分分析的结果对事故致因因素进行降维计算,并将降维计算的结果作为第一神经网络的输入,输出碰撞概率的预测值;
对船舶属性进行等级划分,采用事故序列的方法寻找频繁项集,通过决策树分析,寻找置信度高的事故序列,对频繁发生且置信度高的事故序列的所有情况进行排列组合;
将船舶属性作为第二神经网络模型的输入层,将决策树分析得到的排列组合后的事故序列输入到所述第二神经网络模型,计算得到对应的碰撞后果;
根据碰撞概率的预测值和所述碰撞后果,计算得到船舶碰撞风险;
所述碰撞后果包括受伤人数、死亡人数和财产损失;
根据碰撞概率的预测值和所述碰撞后果,计算得到船舶碰撞风险之前,还包括:
对所述碰撞后果进行标准化和归一化处理,用于消除量级和量纲的影响;
通过专家系统和模糊层次分析方法,确定碰撞后果中受伤人数、死亡人数和财产损失的权重;
根据处理后的碰撞后果,以及受伤人数、死亡人数和财产损失的权重,计算得到新的碰撞后果;
根据碰撞概率的预测值和所述碰撞后果,计算得到船舶碰撞风险,包括:
将碰撞概率的预测值和所述新的碰撞后果进行乘积运算,得到所述船舶碰撞风险;
通过专家系统和模糊层次分析法,确定碰撞后果中受伤人数、死亡人数和财产损失的权重,包括:
采用专家系统确定受伤人数、死亡人数和财产损失的相对重要度,分别对其进行模糊化,得到专家打分矩阵;
对专家打分矩阵求平均值,得到模糊因素判断矩阵;
使用Buckley方法计算模糊权重矩阵;
去模糊化得到受伤人数、死亡人数和财产损失的权重。
2.根据权利要求1所述的基于数据挖掘的船舶碰撞风险评估方法,其特征在于,所述对船舶碰撞历史数据中的事故致因因素进行主成分分析,并优先提取贡献率大的主成分,包括:
对船舶碰撞历史数据中的所有事故致因因素采用主成分分析方法进行简化降维;
提取贡献率大于或等于贡献率阈值的主成分,其中,所述贡献率阈值的取值介于75%至85%之间。
3.根据权利要求1所述的基于数据挖掘的船舶碰撞风险评估方法,其特征在于,根据主成分分析的结果对预测的事故致因因素进行降维计算,并将降维计算的结果作为第一神经网络的输入,得到碰撞概率的预测值,包括:
第一神经网络模型结构包括输入层、隐藏层和输出层;
将提取出的主成分作为第一神经网络输入层的参数,将碰撞概率作为输出层的参数,根据主成分分析的结果,对预测的事故致因因素采用主成分分析法进行降维计算,将计算得到的主成分作为第一神经网络的输入,根据输入输出模型、作用函数模型、误差计算模型和自学习模型,计算得到碰撞概率的预测值。
4.根据权利要求1所述的基于数据挖掘的船舶碰撞风险评估方法,其特征在于,对所述碰撞后果进行无量纲化,包括:
根据特别重大事故受伤人数下限、特别重大事故死亡人数下限和经济损失下限,分别对受伤人数、死亡人数和财产损失进行标准化和归一化处理,消除量级和量纲的影响。
5.一种基于数据挖掘的船舶碰撞风险评估系统,其特征在于,包括:
统计模块,用于根据碰撞历史数据,计算历史碰撞概率,其中,所述船舶碰撞历史数据包括事故致因因素、船舶属性、船舶流量、碰撞次数、历史受伤人数、历史死亡人数以及历史财产损失的一种或多种的组合;所述事故致因因素包括人为因素、船舶和设备因素、环境因素和管理因素的一种或多种的组合;所述船舶属性包括船舶吨位、使用时间、配员数、行驶速度、船舶类型、船舶尺寸、碰撞夹角和碰撞位置的一种或多种的组合;
预测模块,用于根据所述船舶碰撞历史数据和历史碰撞概率,根据累积式自回归移动平均模型,预测每一事故致因因素的发生次数;
主成分分析模块,用于对船舶碰撞历史数据中的事故致因因素进行主成分分析,并优先提取贡献度大的主成分;
概率计算模块,用于根据主成分分析的结果对事故致因因素进行降维计算,并将降维计算的结果作为第一神经网络的输入,得到碰撞概率的预测值;
组合模块,用于对船舶属性进行等级划分,采用事故序列的方法寻找频繁项集,通过决策树分析,寻找置信度高的事故序列,对频繁发生且置信度高的事故序列的所有情况进行排列组合;
后果计算模块,用于将船舶属性作为第二神经网络模型的输入层,将决策树分析得到的排列组合后的事故序列输入到所述第二神经网络模型,计算得到对应的碰撞后果;
风险评估模块,用于根据碰撞概率的预测值和所述碰撞后果,计算得到船舶碰撞风险;
所述碰撞后果包括受伤人数、死亡人数和财产损失;
根据碰撞概率的预测值和所述碰撞后果,计算得到船舶碰撞风险之前,还包括:
对所述碰撞后果进行标准化和归一化处理,用于消除量级和量纲的影响;
通过专家系统和模糊层次分析方法,确定碰撞后果中受伤人数、死亡人数和财产损失的权重;
根据处理后的碰撞后果,以及受伤人数、死亡人数和财产损失的权重,计算得到新的碰撞后果;
根据碰撞概率的预测值和所述碰撞后果,计算得到船舶碰撞风险,包括:
将碰撞概率的预测值和所述新的碰撞后果进行乘积运算,得到所述船舶碰撞风险;
通过专家系统和模糊层次分析法,确定碰撞后果中受伤人数、死亡人数和财产损失的权重,包括:
采用专家系统确定受伤人数、死亡人数和财产损失的相对重要度,分别对其进行模糊化,得到专家打分矩阵;
对专家打分矩阵求平均值,得到模糊因素判断矩阵;
使用Buckley方法计算模糊权重矩阵;
去模糊化得到受伤人数、死亡人数和财产损失的权重。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710051171.0A CN106844663B (zh) | 2017-01-23 | 2017-01-23 | 一种基于数据挖掘的船舶碰撞风险评估方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710051171.0A CN106844663B (zh) | 2017-01-23 | 2017-01-23 | 一种基于数据挖掘的船舶碰撞风险评估方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN106844663A CN106844663A (zh) | 2017-06-13 |
CN106844663B true CN106844663B (zh) | 2020-01-17 |
Family
ID=59119738
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710051171.0A Expired - Fee Related CN106844663B (zh) | 2017-01-23 | 2017-01-23 | 一种基于数据挖掘的船舶碰撞风险评估方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106844663B (zh) |
Families Citing this family (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108615229B (zh) * | 2018-03-09 | 2021-11-19 | 南京信息工程大学 | 基于曲率点聚类及决策树的碰撞检测优化方法 |
CN108711203B (zh) * | 2018-05-03 | 2021-06-01 | 中国人民解放军92942部队 | 一种基于代理模型的破损船体波浪载荷快速预报方法 |
CN108711312B (zh) * | 2018-05-24 | 2020-09-01 | 大连海事大学 | 基于bp神经网络的船舶与静态物标碰撞风险预判方法 |
CN109190170A (zh) * | 2018-08-02 | 2019-01-11 | 哈尔滨工程大学 | 一种基于云模型理论的船舶碰撞危险度建模方法 |
CN109684848A (zh) * | 2018-09-07 | 2019-04-26 | 平安科技(深圳)有限公司 | 风险评估方法、装置、设备及可读存储介质 |
CN109816221B (zh) * | 2019-01-07 | 2024-01-02 | 平安科技(深圳)有限公司 | 项目风险决策方法、装置、计算机设备和存储介质 |
CN110956364B (zh) * | 2019-11-11 | 2021-04-30 | 山东大学 | 船舶撞击河道滩地电力线塔防撞桩的风险评估方法及系统 |
CN111159627B (zh) * | 2019-12-30 | 2023-07-04 | 智慧航海(青岛)科技有限公司 | 一种基于综合集成赋权法的船舶操纵性评价方法 |
CN111145595B (zh) * | 2020-02-20 | 2021-06-25 | 智慧航海(青岛)科技有限公司 | 基于投影寻踪法的自主驾驶船舶重点避让船舶的确认方法 |
CN111539091A (zh) * | 2020-03-24 | 2020-08-14 | 青岛科技大学 | 一种智能船舶繁忙水域自主航行仿真测试环境构建方法 |
CN112613664B (zh) * | 2020-12-25 | 2023-12-12 | 武汉理工大学 | 基于水上交通事故风险预测与评估的预警方法和系统 |
CN112287468B (zh) * | 2020-12-29 | 2021-03-26 | 北京海兰信数据科技股份有限公司 | 一种船舶碰撞危险度判别方法及系统 |
CN114048242B (zh) * | 2021-09-10 | 2024-09-06 | 同济大学 | 一种基于5m事故数据挖掘的交通信号系统安全分析方法 |
CN115345347A (zh) * | 2022-07-11 | 2022-11-15 | 清华大学 | 交通风险预测方法、装置、计算机设备和存储介质 |
CN115857336B (zh) * | 2022-11-22 | 2024-02-02 | 江苏射阳港发电有限责任公司 | 悬臂式斗轮机防碰撞的方法、装置和设备 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101344937A (zh) * | 2007-11-16 | 2009-01-14 | 武汉理工大学 | 基于地理信息系统的水上交通风险评价及预测方法 |
CN101976501A (zh) * | 2010-10-29 | 2011-02-16 | 天津市市政工程设计研究院 | 基于主成分分析和神经网络的港区道路安全性预测方法 |
CN106204246A (zh) * | 2016-08-18 | 2016-12-07 | 易联众信息技术股份有限公司 | 一种基于主成分分析法的bp神经网络信用评估方法 |
-
2017
- 2017-01-23 CN CN201710051171.0A patent/CN106844663B/zh not_active Expired - Fee Related
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101344937A (zh) * | 2007-11-16 | 2009-01-14 | 武汉理工大学 | 基于地理信息系统的水上交通风险评价及预测方法 |
CN101976501A (zh) * | 2010-10-29 | 2011-02-16 | 天津市市政工程设计研究院 | 基于主成分分析和神经网络的港区道路安全性预测方法 |
CN106204246A (zh) * | 2016-08-18 | 2016-12-07 | 易联众信息技术股份有限公司 | 一种基于主成分分析法的bp神经网络信用评估方法 |
Also Published As
Publication number | Publication date |
---|---|
CN106844663A (zh) | 2017-06-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106844663B (zh) | 一种基于数据挖掘的船舶碰撞风险评估方法及系统 | |
Koc et al. | Integrating feature engineering, genetic algorithm and tree-based machine learning methods to predict the post-accident disability status of construction workers | |
CN115063020B (zh) | 基于风险监测融合的梯级水电站多维安全调度装置及方法 | |
CN104112181A (zh) | 一种基于层次分析法的信息安全贝叶斯网络评估方法 | |
CN105046389A (zh) | 一种用于电力安全风险评估的智能风险评估方法及其系统 | |
CN104951588A (zh) | 一种矿井通风系统辅助设计方法 | |
CN113240312B (zh) | 一种海底管道风险评估方法、系统及设备 | |
Abbassinia et al. | Dynamic human error assessment in emergency using fuzzy Bayesian CREAM | |
CN114266441A (zh) | 一种降低生产作业人员风险的量化评价系统及方法 | |
CN110472225A (zh) | 基于词扩展lda的铁路事故原因分析方法 | |
CN112257935A (zh) | 一种基于lstm—rbf神经网络模型的航空安全预测方法 | |
CN112836937A (zh) | 基于熵权与bp神经网络技术的洪涝灾害损失评估方法 | |
CN106060077A (zh) | 一种海洋网络安全风险评估系统 | |
CN113011788B (zh) | 一种海上交通事故应急决策方法、终端设备及存储介质 | |
CN113723817A (zh) | 一种企业粉尘爆炸风险评估方法、装置和设备 | |
CN116706907B (zh) | 基于模糊推理的光伏发电预测方法和相关设备 | |
CN112950024A (zh) | 基于水电站应急指挥的决策方法、存储介质及电子设备 | |
CN102864743A (zh) | 桥梁施工期安全风险辨识方法 | |
CN116777244A (zh) | 一种营区安全防范系统效能评估方法 | |
CN115034648B (zh) | 少样本条件下基于bp神经网络的桥梁工程风险评估方法 | |
CN112950011B (zh) | 轨道交通系统风险链分析方法和装置 | |
CN113887197A (zh) | 基于tf-idf和lda的应急事件辅助决策方法 | |
CN113742495A (zh) | 基于预测模型的评级特征权重确定方法及装置、电子设备 | |
CN112990599A (zh) | 一种基于突发火灾事件相似度计算的城市应急消防优化方法 | |
Liu et al. | Research on traffic accident fatality prediction based on BP neural network |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20200117 Termination date: 20210123 |
|
CF01 | Termination of patent right due to non-payment of annual fee |