CN110929224A - 基于公交行车安全的安全指标体系创建方法 - Google Patents

基于公交行车安全的安全指标体系创建方法 Download PDF

Info

Publication number
CN110929224A
CN110929224A CN201911119519.0A CN201911119519A CN110929224A CN 110929224 A CN110929224 A CN 110929224A CN 201911119519 A CN201911119519 A CN 201911119519A CN 110929224 A CN110929224 A CN 110929224A
Authority
CN
China
Prior art keywords
accident
safety
variables
index
matrix
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201911119519.0A
Other languages
English (en)
Inventor
黄驿惠
沈峰
潘振兴
刘伟
娄亭
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Seari Intelligent System Co Ltd
Original Assignee
Shanghai Seari Intelligent System Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Seari Intelligent System Co Ltd filed Critical Shanghai Seari Intelligent System Co Ltd
Priority to CN201911119519.0A priority Critical patent/CN110929224A/zh
Publication of CN110929224A publication Critical patent/CN110929224A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0635Risk analysis of enterprise or organisation activities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/26Government or public services

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • Human Resources & Organizations (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Tourism & Hospitality (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • Data Mining & Analysis (AREA)
  • Mathematical Analysis (AREA)
  • Computational Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • Pure & Applied Mathematics (AREA)
  • Marketing (AREA)
  • Mathematical Physics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Educational Administration (AREA)
  • Operations Research (AREA)
  • Mathematical Optimization (AREA)
  • Development Economics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Algebra (AREA)
  • General Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Databases & Information Systems (AREA)
  • Game Theory and Decision Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Quality & Reliability (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Probability & Statistics with Applications (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明涉及一种基于公交行车安全的安全指标体系创建方法。本发明的安全指标主要涉及到两类指标:安全评价指标和安全风险指标。安全评价指标以事故统计数据为依据,考虑事故发生频率、事故人员伤亡、事故财产损失等方面,客观刻画评价对象过去一段时间的行车安全状况。安全风险指标基于安全评价指标以及其他各类安全属性,挖掘出行车安全背后的规则,对评价对象可能存在的潜在安全风险进行定量评价,是一种事故风险预测指标。

Description

基于公交行车安全的安全指标体系创建方法
技术领域
本发明在全面分析公交行车安全事故的基础上,运用数据挖掘,构建安全管理评价指标体系,以全面预判行车安全涉及到人、车、线、场、站多维度对象的行车风险。
背景技术
目前公交公司对于行车对象行车安全方面的考核和管理基本基于安全公里数等单一的考核指标,没有成体系的评价指标。公交公司内部管理系统通常存储有以下几种类型的数据:
(1)驾驶员属性:主要包括公交公司在职驾驶员个人基本信息、身体健康状态方面数据、驾驶员驾驶技能相关数据等等。驾驶员属性数据的数据结构如下表1所示:
Figure BDA0002275041150000011
Figure BDA0002275041150000021
表1
(2)车辆属性:主要包括公交公司运营车辆基本信息数据、车辆使用状态相关数据等等。车辆属性数据的数据结构如下表2所示:
Figure BDA0002275041150000022
表2
(3)站点属性:主要包括站点基本信息数据、站点所在位置、站点相关线路等等。站点属性数据的数据结构如下表3所示:
Figure BDA0002275041150000023
Figure BDA0002275041150000031
表3
(4)场站属性:主要包括场站基本信息数据、场站面积、场站停车数等等。场站属性数据的数据结构如下表4所示:
Figure BDA0002275041150000032
表4
(5)线路属性:主要包括线路基本信息数据、线路车队管理相关数据等等。线路属性数据的数据结构如下表5所示:
Figure BDA0002275041150000033
Figure BDA0002275041150000041
表5
(6)事故属性:主要包括事故发生的时间地点、事故情况、事故伤亡人数、财产损失等等。事故属性数据的数据结构如下表6所示:
数据 类型 含义
事故时间 TIME 事故时间
事故日期 DATE 事故日期
线路 VARchar2(10) 线路名称
车牌号 VARchar2(32) 涉事公交车牌照
名字 VARchar2(100) 驾驶员名字
职号 VARchar2(100) 驾驶员职号
事故对象 VARchar2(100) 事故对象
事故地点 VARchar2(255) 事故发生地点描述
事故坐标经度 NUMBER(38,6) 事故发生地点经度坐标
事故坐标维度 NUMBER(38,6) 事故发生地点纬度坐标
事故情况 VARchar2(255) 事故具体情况描述
责任分析 VARchar2(255) 事故驾驶员责任分析
事故总损失 NUMBER(10) 事故总损失
事故死亡人数 NUMBER(10) 事故死亡人数
事故受伤人数 NUMBER(10) 事故受伤人数
表6
发明内容
本发明目的是:基于公交公司内部管理系统存储的数据建立反映行车安全的安全指标体系。
为了达到上述目的,本发明的技术方案是提供了一种基于公交行车安全的安全指标体系创建方法,其特征在于,包括以下步骤:
步骤1:将当前年度之前的历史年度事故数据与各对象的对象编号进行合并;
步骤2:判断各对象是否有事故发生,有则转入步骤3,没有则转入步骤4;
步骤3:按照对象分组统计事故的死亡人数、事故的受伤人数、事故的财产损失和事故的发生次数;
步骤4:将事故的死亡人数、事故的受伤人数、事故的财产损失和事故的发生次数均填充为0,
步骤5:通过步骤3及步骤4获得所有对象的事故属性;
步骤6:分别利用层次分析法及主成分分析法对上一步获得的数据进行处理,其中:
利用层次分析法对上一步获得的数据进行处理具体包括以下步骤:
步骤6101、建立层次结构模型,该层次结构模型包括目标层、准则层、方案层,其中,方案层反映不同的方案即多个驾驶员,准则层反映判断驾驶员分数的因素或标准,目标层反映驾驶员行车安全的综合水平;
步骤6102、构造对比矩阵;
步骤6103、对上一步构造出的对比矩阵进行一致性检验,若通过一致性检验,则计算对比矩阵的归一化特征向量,将其作为权向量,若未通过一致性检验,则返回步骤6102重新构造对比矩阵;
步骤6104、权向量中的4个元素x1,x2,x3,x4为准则层的4个权重;则方案层及各个对象的最终安全评价指标ci得分为:x1Yi1+x2Yi2+x3Yi3+x4Yi4,式中,Yi1、Yi2、Yi3、Yi4分别表示第i个对象的事故属性;
假设有n个对象信息,每个对象信息为包括事故的死亡人数、事故的受伤人数、事故的财产损失和事故的发生次数的4维属性,按照列组成n×4矩阵X,则利用主成分分析法对上一步获得的数据进行处理具体包括以下步骤:
步骤6201、求出协方差矩阵
Figure BDA0002275041150000051
步骤6202、求出协方差矩阵C的特征值λi和特征向量wi
步骤6203、对特征值λi从大到小排序,选取最大特征值对应的特征向量,组成矩阵W14
步骤6204、计算降维矩阵Y1n=W14X4n即为PCA降维最终结果pi
步骤7:将层次分析法、主成分分析法获得的最终结果投射到(50,100)范围内,以初步形成安全评价指标初始分值;
步骤8:根据组合赋权法公式:
Figure BDA0002275041150000061
得到安全评价指标最终得分wi,式中,
Figure BDA0002275041150000062
表示不同算法的权重系数,
Figure BDA0002275041150000063
);
步骤9:导入当前年度事故数据,判断对象是否发生过事故,发生过则对象目标属性标注为1,没有发生过事故则对象目标属性标注为0;
步骤10:导入对象特征变量和目标变量,特征变量包括两部分:对象自身属性以及通过步骤1至步骤8得到的对象历史安全评价指标;
步骤11:检查数据是否有缺失值、异常值,对有缺失值、异常值的样本数据进行删除;
步骤12:对特征变量进行相关性分析,变量两两之间相关性大于预先设定的阈值,删除其中之一的变量;
步骤13:判断变量是否是类别变量,否的话转入步骤14,是的话转入步骤15;
步骤14:导入对象目标属性变量,对连续性变量采取连续性变量离散化处理,转回步骤13;
步骤15:判断类别变量类别是否超过5类,是的话转入步骤16,否的话转入步骤17;
步骤16:对类别变量进行分组处理,使得变量类别小于等于5类;
步骤17:计算所有特征变量的IV值:
Figure BDA0002275041150000064
Figure BDA0002275041150000065
式中,#yi是这个组中响应对象的数量,#ni是这个组中未响应对象的数量,#yT是样本中所有响应客户的数量,#nT是样本中所有未响应客户的数量;
根据IV值从大到小排序,选出IV值大于预先设定的阈值的所有特征变量;
步骤10:对筛选完的变量进行证据权重转化
Figure BDA0002275041150000066
WOEi表示证据权重;
步骤11:利用步骤10得到的WOEi对对象目标属性进行处理得到数据集;
步骤12:将数据集分为测试数据集以及训练数据集;
步骤13:运用训练数据集训练逻辑回归模型,首先初始化模型参数;
步骤14:通过公式
Figure BDA0002275041150000071
计算预测结果,式中,σ(·)为sigmoid激活函数;
步骤15:计算代价函数
Figure BDA0002275041150000072
式中,
Figure BDA0002275041150000073
为针对1个样本的损失函数,n为样本总数量;
步骤16:判断代价函数J(w,b)是否达到最小值,是的话则逻辑回归模型已收敛到最小值,输出逻辑回归模型的结果,进入步骤18;否则进入步骤17;
步骤17:按梯度上升算法调整逻辑回归模型的参数,返回步骤14,重新计算预测结果;
步骤18:运用测试集对逻辑回归模型进行检验,判断KS值是否大于预先设定的阈值,若大于则说明逻辑回归模型预测能力较好,转入步骤19,否则转回步骤13,对逻辑回归模型重新进行调整;
步骤19:输出模型参数β0、β1、β2、β3…βn
步骤20:设定评分卡参数:确定预期分值P和比率翻番的分数POD;
步骤21:将上一步确定的预期分值P和比率翻番的分数POD代入公式
Figure BDA0002275041150000074
求解参数A、B,式中,θ0表示样本的好坏比率;
步骤22:运用如下公式计算获得安全风险指标Score:Score=A-B{β0111δ1112δ12+…)+β221δ2122δ22+…)+…βnn1δn1n2δn2+…)},式中,β0、β1、β2、β3…βn为逻辑回归的模型参数;ωij为第i个变量第j个值的WOE;δij为二元变量(0,1),表示变量i是否取第j个值。
优选地,步骤5中,对事故属性数据统一进行归一化处理。
优选地,步骤6103中,对对比矩阵进行一致性检验包括以下步骤:
定义一致性指标为
Figure BDA0002275041150000075
式中,λ表示特征向量,n表示矩阵阶数;CI=0有完全的一致性;CI接近于0,有满意的一致性;CI越大,不一致性越严重;引入随机一致性指标RI衡量CI的大小,定义一致性比率:
Figure BDA0002275041150000076
若一致性比率CR<0.1时,认为步骤6102构造的对比矩阵的不一致程度在允许的范围之内,有满意的一致性,通过一致性检验,否则返回步骤6102重新构造对比矩阵。
本发明的安全指标主要涉及到两类指标:安全评价指标和安全风险指标。安全评价指标以事故统计数据为依据,考虑事故发生频率、事故人员伤亡、事故财产损失等方面,客观刻画评价对象过去一段时间的行车安全状况。安全风险指标基于安全评价指标以及其他各类安全属性,挖掘出行车安全背后的规则,对评价对象可能存在的潜在安全风险进行定量评价,是一种事故风险预测指标。
指标体系对象主要指人、车、线、场、站五类中的每个个体对象。对于安全评价指标来说,这五类对象特征属性无区别,算法流程基本一致;对于安全风险指标来说,五类对象的个体特征属性各不相同,但数据处理、算法流程基本一致;
由于各类属性时间敏感度不高,事故发生也属于低频事件,故安全指标体系以每一个自然年作为更新单位。涉及到的高频属性均按照年平均(数值型)或众数(类别性)取值。
安全风险指标算法的输入参数包含了每个对象的安全评价指标,安全评价指标反应的是每一个对象的历史行车安全状况,类似于过往病史,在对对象进行未来一段时间行车安全风险进行预判时,考虑历史事故状况可以使得预判更加准确。
附图说明
图1为本发明的流程图;
图2为层次结构模型。
具体实施方式
下面结合具体实施例,进一步阐述本发明。应理解,这些实施例仅用于说明本发明而不用于限制本发明的范围。此外应理解,在阅读了本发明讲授的内容之后,本领域技术人员可以对本发明作各种改动或修改,这些等价形式同样落于本申请所附权利要求书所限定的范围。
本发明的提出基于如下概念
相关性分析:数据相关性是指数据之间存在某种关系,如正相关,负相关。
连续性变量离散化:数据离散化是指将连续的数据进行分段,使其变为一段段离散化的区间。
WOE:WOE的全称是“Weight of Evidence”,即证据权重。WOE是对原始自变量的一种编码形式。
IV(Information Value):中文意思是信息价值或者信息量,用来衡量自变量的预测能力。
KS值:KS(Kolmogorov-Smirnov)值越大,表示模型能够将正、负客户区分开的程度越大。KS值的取值范围是[0,1],通常来讲,KS>0.2即表示模型有较好的预测准确性。
POD:当好坏比上升1倍时,分数上升PDO个单位。
如图1所示,本发明提供的一种基于公交行车安全的安全指标体系创建方法包括以下内容:
第一部分、算法前期数据处理步骤:
安全评价指标前期数据处理:
步骤1:首先将历史年度事故数据(2014-2017年)与各对象编号进行合并;
步骤2:判断各对象是否有事故发生,有则转入步骤3,没有则转入步骤4;
步骤3:按照对象分组统计事故的死亡人数、事故的受伤人数、事故的财产损失和事故的发生次数,单位为:年每百公里(驾驶员、车)/年(站台、场站、线路)。
步骤4:事故的死亡人数、事故的受伤人数、事故的财产损失和事故的发生次数均填充为0,
步骤5:获得所有对象的事故属性,为消除量纲的影响,对事故属性数据统一进行归一化处理。
安全风险指标前期数据处理:
步骤1:导入当前年度(2018年)事故数据,判断对象是否发生过事故,发生过则对象目标属性标注为1,没有发生过事故则标注为0;
步骤2:导入对象特征变量和目标变量,特征变量主要包括两部分:对象自身属性以及对象历史安全评价指标;
步骤3:检查数据是否有缺失值、异常值,对有缺失值、异常值的样本数据进行删除;
步骤4:对特征变量进行相关性分析,变量两两之间相关性大于0.8,删除其中之一的变量;
步骤5:判断变量是否是类别变量,否的话转入步骤6,是的话转入步骤7;
步骤6:导入对象目标属性变量,对连续性变量采取连续性变量离散化处理,转回步骤5;
步骤7:判断类别变量类别是否超过5类,是的话转入步骤8,否的话转入步骤9;
步骤8:对类别变量进行分组处理,使得变量类别小于等于5类;
步骤9:计算所有特征变量的IV值:
Figure BDA0002275041150000101
Figure BDA0002275041150000102
式中,pyi表示这个组中响应客户占所有样本中所有响应客户的比例,pni表示这个组中未响应客户占样本中所有未响应客户的比例,#yi是这个组中响应对象的数量,#ni是这个组中未响应对象的数量,#yT是样本中所有响应客户的数量,#nT是样本中所有未响应客户的数量。
根据IV值从大到小排序,选出IV值大于0.02的所有特征变量;
步骤10:对筛选完的变量进行证据权重转化,得到证据权重
Figure BDA0002275041150000103
Figure BDA0002275041150000104
第二部分、算法步骤描述:
1)层次分析法:
步骤1:建立层次结构模型(目标层、准则层、方案层)以公交车驾驶员的信息为例,如图2所示。
步骤2:构造对比矩阵
Figure BDA0002275041150000105
Figure BDA0002275041150000111
得到以下对比矩阵:
Figure BDA0002275041150000112
a14=7说明死亡人数对事故次数来说强烈重要。
步骤3:层次单排序及一致性检验。构造出的矩阵如果不满足一致性检验需要重新构造矩阵,对应于判断矩阵的最大特征值λmax的特征向量,经过归一化(使向量中各元素之和为1)后记为W。W的元素为同一层元素对于上一层元素某因素相对重要性的排序权值,这一过程称为层次单排序。
定义一致性指标为
Figure BDA0002275041150000113
CI=0有完全的一致性;CI接近于0,有满意的一致性;CI越大,不一致性越严重。为了衡量CI的大小,引入随机一致性指标RI如下表所示:
n 1 2 3 4 5 6 7 8 9 10 11
RI 0 0 0.58 0.90 1.12 1.24 1.32 1.41 1.45 1.49 1.51
定义一致性比率:
Figure BDA0002275041150000114
一般认为一致性比率CR<0.1时,认为A矩阵的不一致程度在允许的范围之内,有满意的一致性,通过一致性检验。可用其归一化特征向量作为权向量,否则就要重新构造对比矩阵A,对aij加以调整。
步骤4:通过一致性检验之后,确定准则层4个权重:x1,x2,x3,x4;方案层及各个对象的最终安全评价指标ci得分为:x1Yi1+x2Yi2+x3Yi3+x4Yi4,式中,Yi1、Yi2、Yi3、Yi4分别表示第i个对象的事故属性。
2)PCA(主成分分析法):
假设有n个对象信息,每个对象信息为包括事故的死亡人数、事故的受伤人数、事故的财产损失和事故的发生次数的4维属性,按照列组成n×4矩阵X,则PCA主成分分析法的步骤如下:
步骤1:求出协方差矩阵
Figure BDA0002275041150000115
步骤2:求出协方差矩阵C的特征值λi和特征向量wi
步骤3:对特征值从大到小排序,选取最大特征值对应的特征向量w1,组成矩阵W14
步骤4:计算降维矩阵Y1n=W14X4n即为PCA降维最终结果pi
3)逻辑回归算法模型训练步骤:
把对象目标属性和对象特征属性按照对象编号进行匹配合并形成数据集。
步骤1:将数据集按3:7比例分为两部分,测试数据集以及训练数据集;
步骤2:运用训练数据集训练逻辑回归模型,首先初始化模型参数;
步骤3:通过公式
Figure BDA0002275041150000121
σ(Z)为sigmoid激活函数计算预测结果;
步骤4:计算代价函数
Figure BDA0002275041150000122
Figure BDA0002275041150000123
为针对1个样本的损失函数;
步骤5:判断代价函数是否达到最小值,是的话则模型已收敛到最小值,输出模型结果,进入步骤7;否则进入步骤6;
步骤6:按梯度上升算法调整模型参数,返回步骤3,重新计算预测结果;
步骤7:运用测试集对模型进行检验,判断KS值是否大于20%,大于20%则说明模型预测能力较好,转入步骤8,否则转回步骤2,对模型重新进行调整;
步骤8:输出模型参数β0、β1、β2、β3…βn
第三部分、指标评分体系建立步骤:
1)安全评价指标最终评分:
步骤1:根据层次分析法、PCA(主成分分析法)获得的最终结果投射到(50,100)范围内,以初步形成安全评价指标初始分值;
步骤2:根据组合赋权法公式:
Figure BDA0002275041150000124
得到安全评价指标最终得分,
Figure BDA0002275041150000125
表示不同算法的权重系数,
Figure BDA0002275041150000126
2)安全风险指标最终评分:
步骤1:设定评分卡参数:确定预期分值P和比率翻番的分数POD;
步骤2:将上一步确定的预期分值P和比率翻番的分数POD代入公式
Figure BDA0002275041150000127
求解参数A、B,式中,θ0表示样本的好坏比率;
步骤3:运用如下公式计算获得安全风险指标Score:Score=A-B{β0111δ1112δ12+…)+β221δ2122δ22+…)+…βnn1δn1n2δn2+…)},式中,β0、β1、β2、β3…βn为逻辑回归的模型参数;ωij为第i个变量第j个值的WOE;δij为二元变量(0,1),表示变量i是否取第j个值。

Claims (3)

1.一种基于公交行车安全的安全指标体系创建方法,其特征在于,包括以下步骤:
步骤1:将当前年度之前的历史年度事故数据与各对象的对象编号进行合并;
步骤2:判断各对象是否有事故发生,有则转入步骤3,没有则转入步骤4;
步骤3:按照对象分组统计事故的死亡人数、事故的受伤人数、事故的财产损失和事故的发生次数;
步骤4:将事故的死亡人数、事故的受伤人数、事故的财产损失和事故的发生次数均填充为0,
步骤5:通过步骤3及步骤4获得所有对象的事故属性;
步骤6:分别利用层次分析法及主成分分析法对上一步获得的数据进行处理,其中:
利用层次分析法对上一步获得的数据进行处理具体包括以下步骤:
步骤6101、建立层次结构模型,该层次结构模型包括目标层、准则层、方案层,其中,方案层反映不同的方案即多个驾驶员,准则层反映判断驾驶员分数的因素或标准,目标层反映反映驾驶员行车安全的综合水平;
步骤6102、构造对比矩阵;
步骤6103、对上一步构造出的对比矩阵进行一致性检验,若通过一致性检验,则计算对比矩阵的归一化特征向量,将其作为权向量,若未通过一致性检验,则返回步骤6102重新构造对比矩阵;
步骤6104、权向量中的4个元素x1,x2,x3,x4为准则层的4个权重;则方案层及各个对象的最终安全评价指标ci得分为:x1Yi1+x2Yi2+x3Yi3+x4Yi4,式中,Yi1、Yi2、Yi3、Yi4分别表示第i个对象的事故属性;
假设有n个对象信息,每个对象信息为包括事故的死亡人数、事故的受伤人数、事故的财产损失和事故的发生次数的4维属性,按照列组成n×4矩阵X,则利用主成分分析法对上一步获得的数据进行处理具体包括以下步骤:
步骤6201、求出协方差矩阵
Figure FDA0002275041140000011
步骤6202、求出协方差矩阵C的特征值λi和特征向量wi
步骤6203、对特征值λi从大到小排序,选取最大特征值对应的特征向量,组成矩阵W14
步骤6204、计算降维矩阵Y1n=W14X4n即为PCA降维最终结果pi
步骤7:将层次分析法、主成分分析法获得的最终结果投射到(50,100)范围内,以初步形成安全评价指标初始分值;
步骤8:根据组合赋权法公式:
Figure FDA0002275041140000021
得到安全评价指标最终得分wi,式中,
Figure FDA0002275041140000022
表示不同算法的权重系数,
Figure FDA0002275041140000023
步骤9:导入当前年度事故数据,判断对象是否发生过事故,发生过则对象目标属性标注为1,没有发生过事故则对象目标属性标注为0;
步骤10:导入对象特征变量和目标变量,特征变量包括两部分:对象自身属性以及通过步骤1至步骤8得到的对象历史安全评价指标;
步骤11:检查数据是否有缺失值、异常值,对有缺失值、异常值的样本数据进行删除;
步骤12:对特征变量进行相关性分析,变量两两之间相关性大于预先设定的阈值,删除其中之一的变量;
步骤13:判断变量是否是类别变量,否的话转入步骤14,是的话转入步骤15;
步骤14:导入对象目标属性变量,对连续性变量采取连续性变量离散化处理,转回步骤13;
步骤15:判断类别变量类别是否超过5类,是的话转入步骤16,否的话转入步骤17;
步骤16:对类别变量进行分组处理,使得变量类别小于等于5类;
步骤17:计算所有特征变量的IV值:
Figure FDA0002275041140000024
Figure FDA0002275041140000025
式中,#yi是这个组中响应对象的数量,#ni是这个组中未响应对象的数量,#yT是样本中所有响应客户的数量,#nT是样本中所有未响应客户的数量;
根据IV值从大到小排序,选出IV值大于预先设定的阈值的所有特征变量;
步骤10:对筛选完的变量进行证据权重转化
Figure FDA0002275041140000026
WOEi表示证据权重;
步骤11:利用步骤10得到的WOEi对对象目标属性进行处理得到数据集;
步骤12:将数据集分为测试数据集以及训练数据集;
步骤13:运用训练数据集训练逻辑回归模型,首先初始化模型参数;
步骤14:通过公式
Figure FDA0002275041140000031
计算预测结果,式中,σ(·)为sigmoid激活函数;
步骤15:计算代价函数
Figure FDA0002275041140000032
式中,
Figure FDA0002275041140000033
为针对1个样本的损失函数,n为样本总数量;
步骤16:判断代价函数J(w,b)是否达到最小值,是的话则逻辑回归模型已收敛到最小值,输出逻辑回归模型的结果,进入步骤18;否则进入步骤17;
步骤17:按梯度上升算法调整逻辑回归模型的参数,返回步骤14,重新计算预测结果;
步骤18:运用测试集对逻辑回归模型进行检验,判断KS值是否大于预先设定的阈值,若大于则说明逻辑回归模型预测能力较好,转入步骤19,否则转回步骤13,对逻辑回归模型重新进行调整;
步骤19:输出模型参数β0、β1、β2、β3…βn
步骤20:设定评分卡参数:确定预期分值P和比率翻番的分数POD;
步骤21:将上一步确定的预期分值P和比率翻番的分数POD代入公式
Figure FDA0002275041140000034
求解参数A、B,式中,θ0表示样本的好坏比率;
步骤22:运用如下公式计算获得安全风险指标Score:Score=A-B{β0111δ1112δ12+…)+β221δ2122δ22+…)+…βnn1δn1n2δn2+…)},式中,β0、β1、β2、β3…βn为逻辑回归的模型参数;ωij为第i个变量第j个值的WOE;δij为二元变量(0,1),表示变量i是否取第j个值。
2.如权利要求1所述的一种基于公交行车安全的安全指标体系创建方法,其特征在于,步骤5中,对事故属性数据统一进行归一化处理。
3.如权利要求1所述的一种基于公交行车安全的安全指标体系创建方法,其特征在于,步骤6103中,对对比矩阵进行一致性检验包括以下步骤:
定义一致性指标为
Figure FDA0002275041140000041
式中,λ表示特征向量,n表示矩阵的阶数;CI=0有完全的一致性;CI接近于0,有满意的一致性;CI越大,不一致性越严重;引入随机一致性指标RI衡量CI的大小,定义一致性比率:
Figure FDA0002275041140000042
若一致性比率CR<0.1时,认为步骤6102构造的对比矩阵的不一致程度在允许的范围之内,有满意的一致性,通过一致性检验,否则返回步骤6102重新构造对比矩阵。
CN201911119519.0A 2019-11-15 2019-11-15 基于公交行车安全的安全指标体系创建方法 Pending CN110929224A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911119519.0A CN110929224A (zh) 2019-11-15 2019-11-15 基于公交行车安全的安全指标体系创建方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911119519.0A CN110929224A (zh) 2019-11-15 2019-11-15 基于公交行车安全的安全指标体系创建方法

Publications (1)

Publication Number Publication Date
CN110929224A true CN110929224A (zh) 2020-03-27

Family

ID=69854009

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911119519.0A Pending CN110929224A (zh) 2019-11-15 2019-11-15 基于公交行车安全的安全指标体系创建方法

Country Status (1)

Country Link
CN (1) CN110929224A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111582466A (zh) * 2020-05-09 2020-08-25 深圳市卡数科技有限公司 模拟神经网络的评分卡配置方法、装置、设备及存储介质
CN112198824A (zh) * 2020-10-13 2021-01-08 广州汽车集团股份有限公司 一种车载数据处理方法及系统
CN112381022A (zh) * 2020-11-20 2021-02-19 深圳市汇芯视讯电子有限公司 一种智能行车监控方法、系统、设备及可存储介质
CN114783007A (zh) * 2022-06-22 2022-07-22 成都新希望金融信息有限公司 设备指纹识别方法、装置和电子设备

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111582466A (zh) * 2020-05-09 2020-08-25 深圳市卡数科技有限公司 模拟神经网络的评分卡配置方法、装置、设备及存储介质
CN111582466B (zh) * 2020-05-09 2023-09-01 深圳市卡数科技有限公司 模拟神经网络的评分卡配置方法、装置、设备及存储介质
CN112198824A (zh) * 2020-10-13 2021-01-08 广州汽车集团股份有限公司 一种车载数据处理方法及系统
CN112381022A (zh) * 2020-11-20 2021-02-19 深圳市汇芯视讯电子有限公司 一种智能行车监控方法、系统、设备及可存储介质
CN114783007A (zh) * 2022-06-22 2022-07-22 成都新希望金融信息有限公司 设备指纹识别方法、装置和电子设备
CN114783007B (zh) * 2022-06-22 2022-09-27 成都新希望金融信息有限公司 设备指纹识别方法、装置和电子设备

Similar Documents

Publication Publication Date Title
CN110929224A (zh) 基于公交行车安全的安全指标体系创建方法
US20220196459A1 (en) Real-time vehicle overload detection method based on convolutional neural network
Wong et al. Rough set approach for accident chains exploration
CN110826848A (zh) 基于层次分析法的驾驶人风险评估方法
Zheng et al. A generalized exponential link function to map a conflict indicator into severity index within safety continuum framework
Abreu et al. Ordinal logistic regression in epidemiological studies
CN110705852A (zh) 一种基于层次分析法的车辆风险评估方法
Couto et al. Reporting road victims: assessing and correcting data issues through distinct injury scales
CN107045786A (zh) 基于Kaplan‑Meier法的驾驶者发生交通事故间隔时间的计算方法
CN111882198A (zh) 一种项目绩效评价方法及系统
CN114266289A (zh) 一种复杂装备健康状态评估方法
CN115345347A (zh) 交通风险预测方法、装置、计算机设备和存储介质
Liu et al. Predicting interstate motor carrier crash rate level using classification models
CN111832442B (zh) 从海量桥梁动态应变数据中自动化分离温度应变成分的方法
Aboshady et al. A fuzzy risk management framework for the Egyptian real estate development projects
CN101527016A (zh) 出入境检验检疫符合性条件的筛选方法
Darmawan et al. Comparison between ANN and multiple linear regression models for prediction of warranty cost
CN108256766A (zh) 一种基于危险驾驶行为的车辆保险核算方法
Chen Analysis of a customer satisfaction survey using Rough Sets theory: A manufacturing case in Taiwan
Lloyd et al. Modelling trends in road accident frequency—Bayesian inference for rates with uncertain exposure
Wang et al. Driving risk evaluation applied to premium actuary for pay-how-you-drive vehicle insurance based on fuzzy multi criteria decision-making
Arasan et al. Mode choice for work journeys of urban travellers owning motorized vehicles in India
Teoh et al. IIHS small overlap frontal crash test ratings and real-world driver death risk
Cui et al. Using PCA and ANN to identify significant factors and modeling customer satisfaction for the complex service processes
Ventura et al. Prediction of the severity of exceeding design traffic loads on highway bridges

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination