CN116245365A - 一种车辆风险评估方法、装置、存储介质及电子设备 - Google Patents
一种车辆风险评估方法、装置、存储介质及电子设备 Download PDFInfo
- Publication number
- CN116245365A CN116245365A CN202310256804.7A CN202310256804A CN116245365A CN 116245365 A CN116245365 A CN 116245365A CN 202310256804 A CN202310256804 A CN 202310256804A CN 116245365 A CN116245365 A CN 116245365A
- Authority
- CN
- China
- Prior art keywords
- vehicle
- risk assessment
- score
- indexes
- scores
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 82
- 238000012502 risk assessment Methods 0.000 title claims abstract description 59
- 238000007477 logistic regression Methods 0.000 claims abstract description 26
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 22
- 238000000546 chi-square test Methods 0.000 claims abstract description 11
- 230000015654 memory Effects 0.000 claims description 25
- 238000004364 calculation method Methods 0.000 claims description 21
- 238000012545 processing Methods 0.000 claims description 15
- 230000002159 abnormal effect Effects 0.000 claims description 11
- 238000011156 evaluation Methods 0.000 claims description 9
- 230000006399 behavior Effects 0.000 claims description 6
- 238000012549 training Methods 0.000 claims description 4
- 238000007689 inspection Methods 0.000 claims description 3
- 238000005096 rolling process Methods 0.000 claims description 3
- 230000001502 supplementing effect Effects 0.000 claims description 2
- 230000008859 change Effects 0.000 abstract description 8
- 238000004458 analytical method Methods 0.000 abstract description 7
- 238000002372 labelling Methods 0.000 abstract description 4
- 238000012544 monitoring process Methods 0.000 abstract description 4
- 206010039203 Road traffic accident Diseases 0.000 description 7
- 238000011282 treatment Methods 0.000 description 7
- 238000010801 machine learning Methods 0.000 description 6
- 230000009471 action Effects 0.000 description 5
- 238000007619 statistical method Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 239000007787 solid Substances 0.000 description 3
- 238000004590 computer program Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 230000011218 segmentation Effects 0.000 description 2
- 238000003491 array Methods 0.000 description 1
- 230000001174 ascending effect Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 238000013210 evaluation model Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000011664 signaling Effects 0.000 description 1
- 238000005496 tempering Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0635—Risk analysis of enterprise or organisation activities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
- G06Q10/06393—Score-carding, benchmarking or key performance indicator [KPI] analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/26—Government or public services
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02W—CLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO WASTEWATER TREATMENT OR WASTE MANAGEMENT
- Y02W90/00—Enabling technologies or technologies with a potential or indirect contribution to greenhouse gas [GHG] emissions mitigation
Landscapes
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Engineering & Computer Science (AREA)
- Economics (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- Development Economics (AREA)
- Educational Administration (AREA)
- Entrepreneurship & Innovation (AREA)
- General Physics & Mathematics (AREA)
- Marketing (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Game Theory and Decision Science (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Traffic Control Systems (AREA)
Abstract
本发明公开了一种车辆风险评估方法、装置、存储介质及电子设备,该方法包括:获取待评估车辆的交管数据;采用卡方检验计算所述二级指标中类别变量的分值;采用逻辑回归分析算法计算二级指标中数值变量的分值;根据类别变量的分值和数据变量的分值求和得到每个一级指标的分值;根据多个一级指标的分值确定待评估车辆的风险评估结果。通过实施本发明,采用的是基于大数据统计和分析的模型,可解释性更强,对于实际应用的指导意义更好。解决了样本标注困难的问题;由于该方法能够输出各类指标的得分,能够用于车辆风险的动态监控,溯源车辆风险等级的变化主要由那类指标变化导致的,明确对于车辆群体的风险监管方向。
Description
技术领域
本发明涉及交通安全技术领域,具体涉及一种车辆风险评估方法、装置、存储介质及电子设备。
背景技术
一直以来,机动车作为交通管理的主要对象都受到了交通管理者的重点管控,但由于机动车数量的剧增,交管部门有限的警力资源己经难以支撑对其进行全方位的严格管控,致使各类交通违法和乱象层出不穷。给人们的交通出行安全带来极大的隐患。结合交通管理实战需求,建立机动车管控体系,实现车辆的高效精准管理,势在必行。
为实现车辆精准管理,通常根据车辆档案信息、历史违法信息、交通事故信息等相关信息建立风险评估积分模型,积分越高车辆风险越高,交通管理者对风险高的车辆越需要严加管控,但是目前的风险评估模型存在不精确的问题。因此,研究考虑多风险影响因素的车辆运行风险评估方法具有很大的意义。对车辆风险估计方法进行研究,对提升智能交通汽车核心竞争力,对培育我国汽车产业增长点,也有重要的意义。
发明内容
有鉴于此,本发明实施例提供了涉及一种车辆风险评估方法、装置、存储介质及电子设备,以解决现有技术中对于车辆风险评估不精确的技术问题。
本发明提出的技术方案如下:
本发明实施例第一方面提供一种车辆风险评估方法,包括:获取待评估车辆的交管数据,所述交管数据包括多个一级指标和每个一级指标对应的二级指标;采用卡方检验计算所述二级指标中类别变量的分值;采用逻辑回归分析算法计算所述二级指标中数值变量的分值;根据所述类别变量的分值和所述数据变量的分值求和得到每个一级指标的分值;根据多个一级指标的分值确定待评估车辆的风险评估结果。
可选地,其特征在于,采用卡方检验计算所述二级指标中类别变量的分值,包括:根据所述二级指标中的每个类别变量和待评估车辆是否发生事故生成列联表;基于所述列联表的观测值和期望值进行卡方和自由度计算,得到计算结果;根据所述计算结果生成所述二级指标中类别变量的分值。
可选地,采用逻辑回归分析算法计算所述二级指标中数值变量的分值,包括:对数值变量进行异常值和缺失值处理;训练逻辑回归模型,对逻辑回归模型中的参数进行调整,得到调整后的逻辑回归模型;采用调整后的逻辑回归模型计算二级指标中数值变量和待评估车辆发生事故系数之间的相关系数;根据所述相关系数确定数值变量的分值。
可选地,对数值变量进行异常值和缺失值处理之后,还包括:对数值变量进行卡方分箱操作。
可选地,根据多个一级指标的分值确定待评估车辆的风险评估结果,包括:采用熵权法计算每个一级指标的权重;根据所述权重对所有一级指标进行加权求和,得到待评估车辆的总分;根据待评估车辆的总分确定风险评估结果。
可选地,根据待评估车辆的总分确定风险评估结果,包括:当待评估车辆包括多辆车时,根据聚类算法对待评估车辆的总分进行聚类;根据聚类结果确定待评估车辆的风险等级。
可选地,所述一级指标包括基本信息、车辆状态信息、事故信息和违法信息;所述基本信息对应的二级指标包括车龄、规格以及机动车所有权;所述车辆状态对应的二级指标包括车辆来源、达到报废标准、注销、转出、逾期未检验、保险状态异常、多次补领号牌、被失驾人员所有、被吊销驾驶证人员所有、近一年频繁过户、一周内集中处理违法以及被非从业人员处理违法达12分以上;所述事故信息对应的二级指标包括一般程序事故、伤人事故的受伤人数、负全部责任的伤人事故起数、负主要责任的伤人事故起数、负同等责任的伤人事故起数、负次要责任的伤人事故起数、无责任的伤人事故起数、负全部责任的财损事故起数、负主要责任的财损事故起数、负同等责任的财损事故起数、负次要责任的财损事故起数、无责任的财损事故起数、事故逃逸、近一月频繁事故以及近一年多人受伤事故;所述违法信息包括违法频次、闯红灯行为、逆行违法行为、占用应急车道、超速、高速公路违法停车、违法载人、超载、疲劳驾驶、闯禁行、一年内重复在同一地点多次违法、伪造运输许可证、尾气排放超标以及未依法悬挂标志标牌。
本发明实施例第二方面提供一种车辆风险评估装置,包括:数据获取模块,用于获取待评估车辆的交管数据,所述交管数据包括多个一级指标和每个一级指标对应的二级指标;第一计算模块,用于采用卡方检验计算所述二级指标中类别变量的分值;第二计算模块,用于采用逻辑回归分析算法计算所述二级指标中数值变量的分值;第三计算模块,用于根据所述类别变量的分值和所述数据变量的分值求和得到每个一级指标的分值;评估模块,用于根据多个一级指标的分值确定待评估车辆的风险评估结果。
本发明实施例第三方面提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使所述计算机执行如本发明实施例第一方面及第一方面任一项所述的车辆风险评估方法。
本发明实施例第四方面提供一种电子设备,包括:存储器和处理器,所述存储器和所述处理器之间互相通信连接,所述存储器存储有计算机指令,所述处理器通过执行所述计算机指令,从而执行如本发明实施例第一方面及第一方面任一项所述的车辆风险评估方法。
本发明提供的技术方案,具有如下效果:
本发明实施例提供的车辆风险评估方法、装置、存储介质及电子设备,采用的是基于大数据统计和分析的模型,与现在比较常用的基于机器学习算法的评价模型,可解释性更强,对于实际应用的指导意义更好。由于使用的多是统计学方法,与机器学习算法相比,解决了样本标注困难的问题;由于该方法能够输出各类指标的得分,能够用于车辆风险的动态监控,溯源车辆风险等级的变化主要由那类指标变化导致的,明确对于车辆群体的风险监管方向。
本发明实施例提供的车辆风险评估方法、装置、存储介质及电子设备,基于大数据统计分析对指标进行筛选和赋值,采取主观和客观相结合的原则,在效率和实用性上都有比较先进的水平;在对于细分指标取值范围较大的进行分段赋值时,与常规的均匀划分方法相比,采用基于卡方的分箱方法,是一种有监督的分箱方法,能够对区间进行更准确的划分。另外,该方法采用了熵权法来计算各类指标的权重,与层次分析法等主观权重确定方法相比,熵权法是基于熵值信息即信息量大小确定各指标权重,能够更加客观的反映各个指标对于车辆风险评估的影响。
附图说明
为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是根据本发明实施例的车辆风险评估方法的流程图;
图2是根据本发明实施例的车辆风险评估装置的结构框图;
图3是根据本发明实施例提供的计算机可读存储介质的结构示意图;
图4是根据本发明实施例提供的电子设备的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的实施例能够以除了在这里图示或描述的内容以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
根据本发明实施例,提供了一种车辆风险评估方法,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
在本实施例中提供了一种车辆风险评估方法,可用于电子设备,如电脑、手机、平板电脑等,图1是根据本发明实施例车辆风险评估方法的流程图,如图1所示,该方法包括如下步骤:
步骤S101:获取待评估车辆的交管数据,所述交管数据包括多个一级指标和每个一级指标对应的二级指标。具体地,可以从交管部门获取相应车辆的交管数据,作为对车辆进行风险评估的基础。交管数据选取时,选取和车辆风险评估相关的数据,例如车辆车况数据、车辆业务数据、交通违法数据以及交通事故信息等数据。
通过对选取的交管数据的整理分类,将获取的交管数据划分为四个一级指标:基本信息、车辆状态信息、事故信息和违法信息。同时,为了便于对这些数据进行更详细的分析,对每个一级指标分别划分对应的二级指标。
其中,所述基本信息对应的二级指标包括车龄、规格以及机动车所有权;所述车辆状态对应的二级指标包括车辆来源、达到报废标准、注销、转出、逾期未检验、保险状态异常、多次补领号牌、被失驾人员所有、被吊销驾驶证人员所有、近一年频繁过户、一周内集中处理违法以及被非从业人员处理违法达12分以上。
所述事故信息对应的二级指标包括一般程序事故、伤人事故的受伤人数、负全部责任的伤人事故起数、负主要责任的伤人事故起数、负同等责任的伤人事故起数、负次要责任的伤人事故起数、无责任的伤人事故起数、负全部责任的财损事故起数、负主要责任的财损事故起数、负同等责任的财损事故起数、负次要责任的财损事故起数、无责任的财损事故起数、事故逃逸、近一月频繁事故以及近一年多人受伤事故。
所述违法信息包括违法频次、闯红灯行为、逆行违法行为、占用应急车道、超速、高速公路违法停车、违法载人、超载、疲劳驾驶、闯禁行、一年内重复在同一地点多次违法、伪造运输许可证、尾气排放超标以及未依法悬挂标志标牌。
步骤S102:采用卡方检验计算所述二级指标中类别变量的分值。具体地,在计算类别变量的分值时,采用卡方检验对该二级指标与交通事故的相关性进行分析,根据相关性大小赋予不同的分值。
类别变量为由是否表示或者有具体类别的变量。例如,对于步骤S101中提到的数据,基本信息中规格和机动车所有权属于类别变量,规格可划分为重型车辆、中型车辆、轻型车辆以及微型四个类别;机动车所有权可以划分为单位和个人两个类别。车辆状态信息的二级指标基本均属于类别变量,其中车辆来源可划分为注册、转入、过户三个类别;其他二级指标均可以划分为是否两个类别。事故信息中一般程序事故可以分为是否两个类别,其余均为数值变量。
违法信息中的二级指标基本均属于类别变量,其中,违法频次可以预先设置多个类别,如违法高发车辆(一年30起以上且违法处理人数小于5人)、违法较多车辆(近三年年均违法5-10次月处理违法人数小于5人)、频繁违法车辆(近三年年均违法小于等于20次且违法处理人数小于5人)以及肆意违法车辆(近三年年均违法大于20次且违法处理人数小于5人);闯红灯行为、逆行违法行为、占用应急车道、超速、高速公路违法停车、闯禁行等违法行为可以分为现场和非现场,同时对于现场和非现场还可以分别划分3个月内有1起以上违法行为、1年内有3次以上违法行为以及3年内有5起以上违法行为三个类别;对于违法载人、疲劳驾驶可以直接分为3个月内有1起以上违法行为、1年内有3次以上违法行为以及3年内有5起以上违法行为三个类别;对于超载可以分为未达30%和多余30%两个类别;对于违法信息中的其他二级指标可以直接分为是否两个类别。
步骤S103:采用逻辑回归分析算法计算所述二级指标中数值变量的分值;具体地,采用逻辑回归分析算法时,先训练逻辑回归分析模型,之后采用训练号的逻辑回归分析模型进行数据拟合,根据最终求得各变量系数大小对二级指标进行赋值。其中,数值变量具体是指指标有具体数值的变量。例如,基本信息中,车龄属于数值变量。事故信息中,各种事故的起数也属于数值变量。
步骤S104:根据所述类别变量的分值和所述数据变量的分值求和得到每个一级指标的分值;具体地,每个一级指标中包括多个二级指标,而二级指标又划分为数值变量和类别变量,则每个一级指标的分值由其对应的所有数值变量的分值和类别变量的分值求和得到。
步骤S105:根据多个一级指标的分值确定待评估车辆的风险评估结果。具体地,每个待评估车辆的交管数据中包括多个一级指标,可以根据多个一级指标的总和或者加权和确定待评估车辆的总分,根据该总分判断待评估车辆的风险情况,得到风险评估结果。
本发明实施例提供的车辆风险评估方法,采用的是基于大数据统计和分析的模型,与现在比较常用的基于机器学习算法的评价模型,可解释性更强,对于实际应用的指导意义更好。由于使用的多是统计学方法,与机器学习算法相比,解决了样本标注困难的问题;由于该方法能够输出各类指标的得分,能够用于车辆风险的动态监控,溯源车辆风险等级的变化主要由那类指标变化导致的,明确对于车辆群体的风险监管方向。
在一实施方式中,采用卡方检验计算所述二级指标中类别变量的分值,包括如下步骤:
步骤S201:根据所述二级指标中的每个类别变量和待评估车辆是否发生事故生成列联表。具体地,以类别变量为车辆状态信息中的车辆来源为例,该指标为类别变量,一共有三个属性分别为注册,转入和过户。所以列联表的行数就是3,是否发生事故这个变量只有两个属性,分别为是和否,所以列联表的列数就是2。其和是否发生事故生成的列联表如下表1所示:
表1
步骤S202:基于所述列联表的观测值和期望值进行卡方和自由度计算,得到计算结果。具体地,列联表的观测值vobs为每个单元格的值,列联表中每个单元格的期望值采用下式计算:
式中,totalrow表示列联表中相应单元格所在行的合计数,totalcol表示列联表中相应单元格所在列的合计数,total表示总合计数。例如,以上表1为例,值为a的单元格对应的期望值类比可得,值为b的单元格对应的期望值/>其余单元格的期望值可以类比得出。
自由度的计算公式为Df=(m-1)×(n-1),其中m为列联表的行数,n为列联表的列数。
步骤S203:根据所述计算结果生成所述二级指标中类别变量的分值。具体地,在进行类别变量的赋值之前,可以先对相应的二级指标进行筛选,例如,根据χ2和Df查卡方临界值表,取显著性水平0.05的卡方临界值,与计算得到的卡方值相比,如果小于临界值,则无法拒绝原假设,即该类别变量与是否发生交通事故不相关,可以将该类别变量舍弃,不计算分值;如果大于临界值,则拒绝原假设,即该类别变量与发生交通事故相关。对于筛选出来的和交通事故相关的类别变量,可以根据预先设置的卡方值与分值的关系,确定类别变量的具体分值。
在一实施方式中,采用逻辑回归分析算法计算所述二级指标中数值变量的分值,包括如下步骤:
步骤S301:对数值变量进行异常值和缺失值处理;具体地,对于获取的交管数据中的数值变量,可能存在异常值和缺失值。其中,异常值的判断采用3σ准则,σ对应于该组数据的标准差,μ为该组数据的均值,将数值在(μ-3σ,μ+3σ)范围外的视为异常值,将异常值予以删除。缺失值表明该出数据为空,数值变量类缺失值采用均值填充。
另外,对于部分数值变量,可能存在部分指标取值范围较大的问题,可以采用卡方分箱处理即划分不同区间。分箱操作的优点在于离散后的特征对数据有很强的鲁棒性,同时由于单变量被离散成N个变量,每个变量有单独的权重,引入了非线性,能够提升模型的表达能力,同时降低过拟合的风险。具体地,采用卡方分箱的方法进行分箱操作按照如下步骤实现:
1)预设一个卡方阈值,根据显著性水平以及自由度选取。
2)对要离散的数值变量进行排序,每个数值变量都属于一个区间。
3)计算每一对相邻区间的卡方值,将卡方值最小的一对区间合并。
步骤S302:训练逻辑回归模型,对逻辑回归模型中的参数进行调整,得到调整后的逻辑回归模型;具体地,可以利用python语言调用scikit-learn库中的logistic模型对数据进行训练及调参,获得满意的精确度。
步骤S303:采用调整后的逻辑回归模型计算二级指标中数值变量和待评估车辆发生事故系数之间的相关系数;其中,待评估车辆发生事故系数可以根据是否发生交通事故分为1和0,即1为发生,0为不发生。然后采用训练好的逻辑回归模型计算进行上述处理后的数值变量和事故系数之间的相关系数。
步骤S304:根据所述相关系数确定数值变量的分值。具体地,在根据相关系数确定分值时,也可以先对数值变量进行筛选,例如设置相关系数阈值,将相关系数绝对值小于相关系数阈值的数值变量舍弃。对于剩余的数值变量,也可以根据预先设置的相关系数和分值的关系,确定相应数值变量的分值。
在一实施方式中,根据多个一级指标的分值确定待评估车辆的风险评估结果,包括如下步骤:
步骤S401:采用熵权法计算每个一级指标的权重。具体地,熵权法计算权重的具体步骤如下:
采用如下公式分别对四类一级指标得分进行去量纲化处理,对每一类指标j,去量纲后的具体数值表示为:
之后采用如下公式对去量钢化的一级指标逐行进行归一化处理:
然后采用如下公式计算各个一级指标的信息熵:
最后采用如下公式根据信息熵计算各个一级指标的权重:
步骤S402:根据所述权重对所有一级指标进行加权求和,得到待评估车辆的总分;具体地,确定每个一级指标的权重之后,采用加权法进行求和,得到待评估车辆的总分。
步骤S403:根据待评估车辆的总分确定风险评估结果。具体地,若待评估车辆只有一辆,则可以直接根据待评估车辆的总分和预先设置的风险阈值确定该车辆的风险评估结果。然而,在评估时,大多需要评估多辆车。此时可以采用聚类算法,将所有待评估车辆划分为高风险,中风险,低风险,微风险四类。
其中,该聚类算法可以采用Jenks Natural Breaks算法,假设计算后的所有车辆总分按照升序排序后的序列为[a1,a2,……an],具体步骤如下:
4.计算在分组数K一定的条件下,GVF越大,分类效果越好。对于个数为n的数组,分为K组一共有/>中可能,从上述可能分组中计算处GVF值最大的分组,作为最终的聚类结果,四组对应于四个风险等级的分数区间。
本发明实施例提供的车辆风险评估方法,基于大数据统计分析对指标进行筛选和赋值,采取主观和客观相结合的原则,在效率和实用性上都有比较先进的水平;在对于细分指标取值范围较大的进行分段赋值时,与常规的均匀划分方法相比,采用基于卡方的分箱方法,是一种有监督的分箱方法,能够对区间进行更准确的划分。另外,该方法采用了熵权法来计算各类指标的权重,与层次分析法等主观权重确定方法相比,熵权法是基于熵值信息即信息量大小确定各指标权重,能够更加客观的反映各个指标对于车辆风险评估的影响。
本发明实施例还提供一种车辆风险评估装置,如图2所示,该装置包括:
数据获取模块,用于获取待评估车辆的交管数据,所述交管数据包括多个一级指标和每个一级指标对应的二级指标;具体内容参见上述方法实施例对应部分,在此不再赘述。
第一计算模块,用于采用卡方检验计算所述二级指标中类别变量的分值;具体内容参见上述方法实施例对应部分,在此不再赘述。
第二计算模块,用于采用逻辑回归分析算法计算所述二级指标中数值变量的分值;具体内容参见上述方法实施例对应部分,在此不再赘述。
第三计算模块,用于根据所述类别变量的分值和所述数据变量的分值求和得到每个一级指标的分值;具体内容参见上述方法实施例对应部分,在此不再赘述。
评估模块,用于根据多个一级指标的分值确定待评估车辆的风险评估结果。具体内容参见上述方法实施例对应部分,在此不再赘述。
本发明实施例提供的车辆风险评估装置,采用的是基于大数据统计和分析的模型,与现在比较常用的基于机器学习算法的评价模型,可解释性更强,对于实际应用的指导意义更好。由于使用的多是统计学方法,与机器学习算法相比,解决了样本标注困难的问题;由于该装置能够输出各类指标的得分,能够用于车辆风险的动态监控,溯源车辆风险等级的变化主要由那类指标变化导致的,明确对于车辆群体的风险监管方向。
本发明实施例提供的车辆风险评估装置的功能描述详细参见上述实施例中车辆风险评估方法描述。
本发明实施例还提供一种存储介质,如图3所示,其上存储有计算机程序601,该指令被处理器执行时实现上述实施例中车辆风险评估方法的步骤。该存储介质上还存储有音视频流数据,特征帧数据、交互请求信令、加密数据以及预设数据大小等。其中,存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)、随机存储记忆体(RandomAccess Memory,RAM)、快闪存储器(Flash Memory)、硬盘(Hard Disk Drive,缩写:HDD)或固态硬盘(Solid-State Drive,SSD)等;所述存储介质还可以包括上述种类的存储器的组合。
本领域技术人员可以理解,实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)、随机存储记忆体(RandomAccessMemory,RAM)、快闪存储器(Flash Memory)、硬盘(Hard Disk Drive,缩写:HDD)或固态硬盘(Solid-State Drive,SSD)等;所述存储介质还可以包括上述种类的存储器的组合。
本发明实施例还提供了一种电子设备,如图4所示,该电子设备可以包括处理器51和存储器52,其中处理器51和存储器52可以通过总线或者其他方式连接,图4中以通过总线连接为例。
处理器51可以为中央处理器(Central Processing Unit,CPU)。处理器51还可以为其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等芯片,或者上述各类芯片的组合。
存储器52作为一种非暂态计算机可读存储介质,可用于存储非暂态软件程序、非暂态计算机可执行程序以及模块,如本发明实施例中的对应的程序指令/模块。处理器51通过运行存储在存储器52中的非暂态软件程序、指令以及模块,从而执行处理器的各种功能应用以及数据处理,即实现上述方法实施例中的车辆风险评估方法。
存储器52可以包括存储程序区和存储数据区,其中,存储程序区可存储操作装置、至少一个功能所需要的应用程序;存储数据区可存储处理器51所创建的数据等。此外,存储器52可以包括高速随机存取存储器,还可以包括非暂态存储器,例如至少一个磁盘存储器件、闪存器件、或其他非暂态固态存储器件。在一些实施例中,存储器52可选包括相对于处理器51远程设置的存储器,这些远程存储器可以通过网络连接至处理器51。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
所述一个或者多个模块存储在所述存储器52中,当被所述处理器51执行时,执行如图1所示实施例中的车辆风险评估方法。
上述电子设备具体细节可以对应参阅图1所示的实施例中对应的相关描述和效果进行理解,此处不再赘述。
虽然结合附图描述了本发明的实施例,但是本领域技术人员可以在不脱离本发明的精神和范围的情况下做出各种修改和变型,这样的修改和变型均落入由所附权利要求所限定的范围之内。
Claims (10)
1.一种车辆风险评估方法,其特征在于,包括:
获取待评估车辆的交管数据,所述交管数据包括多个一级指标和每个一级指标对应的二级指标;
采用卡方检验计算所述二级指标中类别变量的分值;
采用逻辑回归分析算法计算所述二级指标中数值变量的分值;
根据所述类别变量的分值和所述数据变量的分值求和得到每个一级指标的分值;
根据多个一级指标的分值确定待评估车辆的风险评估结果。
2.根据权利要求1所述的车辆风险评估方法,其特征在于,采用卡方检验计算所述二级指标中类别变量的分值,包括:
根据所述二级指标中的每个类别变量和待评估车辆是否发生事故生成列联表;
基于所述列联表的观测值和期望值进行卡方和自由度计算,得到计算结果;
根据所述计算结果生成所述二级指标中类别变量的分值。
3.根据权利要求1所述的车辆风险评估方法,其特征在于,采用逻辑回归分析算法计算所述二级指标中数值变量的分值,包括:
对数值变量进行异常值和缺失值处理;
训练逻辑回归模型,对逻辑回归模型中的参数进行调整,得到调整后的逻辑回归模型;
采用调整后的逻辑回归模型计算二级指标中数值变量和待评估车辆发生事故系数之间的相关系数;
根据所述相关系数确定数值变量的分值。
4.根据权利要求3所述的车辆风险评估方法,其特征在于,对数值变量进行异常值和缺失值处理之后,还包括:对数值变量进行卡方分箱操作。
5.根据权利要求1所述的车辆风险评估方法,其特征在于,根据多个一级指标的分值确定待评估车辆的风险评估结果,包括:
采用熵权法计算每个一级指标的权重;
根据所述权重对所有一级指标进行加权求和,得到待评估车辆的总分;
根据待评估车辆的总分确定风险评估结果。
6.根据权利要求5所述的车辆风险评估方法,其特征在于,根据待评估车辆的总分确定风险评估结果,包括:
当待评估车辆包括多辆车时,根据聚类算法对待评估车辆的总分进行聚类;
根据聚类结果确定待评估车辆的风险等级。
7.根据权利要求1所述的车辆风险评估方法,其特征在于,
所述一级指标包括基本信息、车辆状态信息、事故信息和违法信息;
所述基本信息对应的二级指标包括车龄、规格以及机动车所有权;
所述车辆状态对应的二级指标包括车辆来源、达到报废标准、注销、转出、逾期未检验、保险状态异常、多次补领号牌、被失驾人员所有、被吊销驾驶证人员所有、近一年频繁过户、一周内集中处理违法以及被非从业人员处理违法达12分以上;
所述事故信息对应的二级指标包括一般程序事故、伤人事故的受伤人数、负全部责任的伤人事故起数、负主要责任的伤人事故起数、负同等责任的伤人事故起数、负次要责任的伤人事故起数、无责任的伤人事故起数、负全部责任的财损事故起数、负主要责任的财损事故起数、负同等责任的财损事故起数、负次要责任的财损事故起数、无责任的财损事故起数、事故逃逸、近一月频繁事故以及近一年多人受伤事故;
所述违法信息包括违法频次、闯红灯行为、逆行违法行为、占用应急车道、超速、高速公路违法停车、违法载人、超载、疲劳驾驶、闯禁行、一年内重复在同一地点多次违法、伪造运输许可证、尾气排放超标以及未依法悬挂标志标牌。
8.一种车辆风险评估装置,其特征在于,包括:
数据获取模块,用于获取待评估车辆的交管数据,所述交管数据包括多个一级指标和每个一级指标对应的二级指标;
第一计算模块,用于采用卡方检验计算所述二级指标中类别变量的分值;
第二计算模块,用于采用逻辑回归分析算法计算所述二级指标中数值变量的分值;
第三计算模块,用于根据所述类别变量的分值和所述数据变量的分值求和得到每个一级指标的分值;
评估模块,用于根据多个一级指标的分值确定待评估车辆的风险评估结果。
9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使所述计算机执行如权利要求1-7任一项所述的车辆风险评估方法。
10.一种电子设备,其特征在于,包括:存储器和处理器,所述存储器和所述处理器之间互相通信连接,所述存储器存储有计算机指令,所述处理器通过执行所述计算机指令,从而执行如权利要求1-7任一项所述的车辆风险评估方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310256804.7A CN116245365A (zh) | 2023-03-08 | 2023-03-08 | 一种车辆风险评估方法、装置、存储介质及电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310256804.7A CN116245365A (zh) | 2023-03-08 | 2023-03-08 | 一种车辆风险评估方法、装置、存储介质及电子设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116245365A true CN116245365A (zh) | 2023-06-09 |
Family
ID=86626030
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310256804.7A Pending CN116245365A (zh) | 2023-03-08 | 2023-03-08 | 一种车辆风险评估方法、装置、存储介质及电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116245365A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116452008A (zh) * | 2023-06-16 | 2023-07-18 | 山东四季车网络科技有限公司 | 一种基于多项式建模的二手车风险预测方法及系统 |
-
2023
- 2023-03-08 CN CN202310256804.7A patent/CN116245365A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116452008A (zh) * | 2023-06-16 | 2023-07-18 | 山东四季车网络科技有限公司 | 一种基于多项式建模的二手车风险预测方法及系统 |
CN116452008B (zh) * | 2023-06-16 | 2023-08-29 | 山东四季车网络科技有限公司 | 一种基于多项式建模的二手车风险预测方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Park et al. | Real-time prediction and avoidance of secondary crashes under unexpected traffic congestion | |
Tesema et al. | Rule mining and classification of road traffic accidents using adaptive regression trees | |
Pande et al. | Comprehensive analysis of the relationship between real-time traffic surveillance data and rear-end crashes on freeways | |
Abdel-Aty et al. | Assessing safety on Dutch freeways with data from infrastructure-based intelligent transportation systems | |
CN110796859A (zh) | 基于交通流的实时交通状态辨识及事故风险预警方法 | |
Zheng et al. | Decision tree approach to accident prediction for highway–rail grade crossings: Empirical analysis | |
CN103632168A (zh) | 一种机器学习中的分类器集成方法 | |
CN110555565A (zh) | 基于决策树模型的高速路出口匝道事故严重程度预测方法 | |
WO2020108219A1 (zh) | 基于交通安全风险的群体划分与差异性分析方法及系统 | |
CN109887279B (zh) | 一种交通拥堵预测方法及系统 | |
CN116245365A (zh) | 一种车辆风险评估方法、装置、存储介质及电子设备 | |
CN111881243A (zh) | 一种出租车轨迹热点区域分析方法及系统 | |
Mokhtarimousavi et al. | A temporal investigation of crash severity factors in worker-involved work zone crashes: Random parameters and machine learning approaches | |
Liu et al. | Predicting interstate motor carrier crash rate level using classification models | |
Lin et al. | Assessing road traffic safety during COVID-19: Inequality, irregularity, and severity | |
CN113283548B (zh) | 一种车辆安全评分方法、装置、设备和存储介质 | |
Pecherková et al. | Analysis of discrete data from traffic accidents | |
Lee | Freeway travel time forecast using artifical neural networks with cluster method | |
CN109447306B (zh) | 基于最大似然回归树的地铁事故延误时间预测方法 | |
CN111341096B (zh) | 一种基于gps数据的公交运行状态评估方法 | |
CN115796584A (zh) | 一种城市道路运行风险排查方法、装置及电子设备 | |
CN114627643A (zh) | 一种高速公路事故风险预测方法、装置、设备及介质 | |
CN112232607B (zh) | 一种地铁客流量预测方法及装置 | |
CN114693072A (zh) | 车队结构分析方法、系统及存储介质 | |
CN113780682A (zh) | 基于故障标志物的轨道交通系统业务故障预测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |