CN117251803A - 用于两轮充电车的风险评估方法、系统、存储介质及设备 - Google Patents
用于两轮充电车的风险评估方法、系统、存储介质及设备 Download PDFInfo
- Publication number
- CN117251803A CN117251803A CN202311525318.7A CN202311525318A CN117251803A CN 117251803 A CN117251803 A CN 117251803A CN 202311525318 A CN202311525318 A CN 202311525318A CN 117251803 A CN117251803 A CN 117251803A
- Authority
- CN
- China
- Prior art keywords
- data
- charging
- vehicle
- risk assessment
- wheeled
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000012502 risk assessment Methods 0.000 title claims abstract description 83
- 238000000034 method Methods 0.000 title claims abstract description 39
- 238000007781 pre-processing Methods 0.000 claims abstract description 16
- 238000012549 training Methods 0.000 claims description 19
- 238000012360 testing method Methods 0.000 claims description 18
- 238000012545 processing Methods 0.000 claims description 10
- 230000002159 abnormal effect Effects 0.000 claims description 9
- 238000004590 computer program Methods 0.000 claims description 9
- 230000001960 triggered effect Effects 0.000 claims description 3
- 230000007613 environmental effect Effects 0.000 claims description 2
- 238000007637 random forest analysis Methods 0.000 description 8
- 238000007477 logistic regression Methods 0.000 description 6
- 238000013145 classification model Methods 0.000 description 5
- 230000001419 dependent effect Effects 0.000 description 5
- 238000004422 calculation algorithm Methods 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 230000009467 reduction Effects 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000003066 decision tree Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 206010000369 Accident Diseases 0.000 description 1
- 238000007476 Maximum Likelihood Methods 0.000 description 1
- 230000005856 abnormality Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000000546 chi-square test Methods 0.000 description 1
- 238000004140 cleaning Methods 0.000 description 1
- 238000007621 cluster analysis Methods 0.000 description 1
- 238000002485 combustion reaction Methods 0.000 description 1
- 238000002790 cross-validation Methods 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000004880 explosion Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 238000000513 principal component analysis Methods 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 230000002269 spontaneous effect Effects 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
- G06F18/24323—Tree-organised classifiers
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/10—Pre-processing; Data cleansing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/27—Regression, e.g. linear or logistic regression
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F30/00—Computer-aided design [CAD]
- G06F30/20—Design optimisation, verification or simulation
- G06F30/27—Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0635—Risk analysis of enterprise or organisation activities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- Human Resources & Organizations (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Economics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- Marketing (AREA)
- Entrepreneurship & Innovation (AREA)
- General Business, Economics & Management (AREA)
- Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Software Systems (AREA)
- Probability & Statistics with Applications (AREA)
- Water Supply & Treatment (AREA)
- Geometry (AREA)
- Public Health (AREA)
- Medical Informatics (AREA)
- General Health & Medical Sciences (AREA)
- Development Economics (AREA)
- Educational Administration (AREA)
- Computer Hardware Design (AREA)
- Game Theory and Decision Science (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Secondary Cells (AREA)
Abstract
本发明实施例公开了一种用于两轮充电车的风险评估方法,所述方法包括下列步骤:采集两轮充电车的充电数据、车辆数据和驾驶数据以及对应的充电桩信息和地区信息;对所述两轮充电车的充电数据、车辆数据和驾驶数据以及对应的充电桩信息和地区信息进行预处理;构建风险评估模型;根据所述风险评估模型确定当前充电车的风险等级;本发明能够实时监测充电中两轮车的风险指标,便于判断综合风险和实施下一步指示。
Description
技术领域
本发明涉及风险评估技术领域,尤其涉及用于两轮充电车的风险评估方法、系统、存储介质及设备。
背景技术
随着新能源技术的升级及两轮充电车(含电动车和共享电动车等)的市场规模进一步扩大,两轮充电车的充电需求也逐渐增强,而由于两轮充电车电池的高密度性和质量的层次不齐,在充电过程中容易出现热失控的情况,使得充电区域存在一定概率的自燃、爆炸风险。
本申请提出了一种用于两轮充电车的风险评估方法,能够对当前充电车进行风险评估,获取其风险等级,从而实施下一步操作(断电或者警示等)。
发明内容
基于此,有必要针对上述问题,提出了一种用于两轮充电车的风险评估方法。
一种用于两轮充电车的风险评估方法,所述方法包括下列步骤:
采集两轮充电车的充电数据、车辆数据和驾驶数据以及对应的充电桩信息和地区信息;
对所述两轮充电车的充电数据、车辆数据和驾驶数据以及对应的充电桩信息和地区信息进行预处理;
构建风险评估模型;
根据所述风险评估模型确定当前充电车的风险等级。
上述方案中,所述充电数据包括:电流、电压、充电时的电池温度和充电时间;所述车辆数据包括:车型数据、车辆配置信息和电池配置信息;所述驾驶数据包括:驾驶里程数和驾驶年限。
上述方案中,所述充电桩信息包括:固定区域内充电桩的使用数量、异常充电桩数量和充电桩平均温度;所述地区信息包括当前两轮充电车的环境温度、月份、经纬度和地区特征。
上述方案中,所述预处理包括:对缺失值进行填补、对错误数据进行替换、对连续数据进行离散化、对非平衡数据进行调整。
上述方案中,所述构建风险评估模型,具体包括:
根据所述预处理后的两轮充电车的充电数据、车辆数据和驾驶数据以及对应的充电桩信息和地区信息确定训练集数据;
将所述训练集数据输入风险评估模型;
利用所述风险评估模型识别所述训练集数据的特征;
对所述训练集数据进行分类,直至所述风险评估模型输出风险等级误差小于误差阈值。
上述方案中,所述根据所述风险评估模型确定当前充电车的风险等级,具体包括:
根据所述预处理后的两轮充电车的充电数据、车辆数据和驾驶数据以及对应的充电桩信息和地区信息确定测试集数据;
将所述测试集数据输入风险评估模型;
利用所述风险评估模型对测试集数据进行分类,确定测试集数据对应的当前充电车的风险等级。
上述方案中,所述风险等级包括:高风险、较高风险、中等风险和低风险,当所述较高风险被触发时,当前两轮充电车处于异常状态并预警。
本申请还提出了一种用于两轮充电车的风险评估系统,所述系统包括:数据获取单元、数据处理单元和风险评估模型单元;
所述数据获取单元,用于采集两轮充电车的充电数据、车辆数据和驾驶数据以及对应的充电桩信息和地区信息;
所述数据处理单元,用于对所述两轮充电车的充电数据、车辆数据和驾驶数据以及对应的充电桩信息和地区信息进行预处理;
所述风险评估模型单元,用于构建风险评估模型、根据所述风险评估模型确定当前充电车的风险等级。
本申请还提出了一种可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行如下步骤:
采集两轮充电车的充电数据、车辆数据和驾驶数据以及对应的充电桩信息和地区信息;
对所述两轮充电车的充电数据、车辆数据和驾驶数据以及对应的充电桩信息和地区信息进行预处理;
构建风险评估模型;
根据所述风险评估模型确定当前充电车的风险等级。
本申请还提出了一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行如下步骤:
采集两轮充电车的充电数据、车辆数据和驾驶数据以及对应的充电桩信息和地区信息;
对所述两轮充电车的充电数据、车辆数据和驾驶数据以及对应的充电桩信息和地区信息进行预处理;
构建风险评估模型;
根据所述风险评估模型确定当前充电车的风险等级。
采用本发明实施例,具有如下有益效果:采集两轮充电车的充电数据、车辆数据和驾驶数据以及对应的充电桩信息和地区信息;对所述两轮充电车的充电数据、车辆数据和驾驶数据以及对应的充电桩信息和地区信息进行预处理;构建风险评估模型;根据所述风险评估模型确定当前充电车的风险等级;本发明能够实时监测充电中两轮车的风险指标,便于判断综合风险指数和实施下一步指示,这种方法结合了风险评估模型,能够将更多维的两轮充电车信息和对应的充电桩、地区信息进行考虑,从而更精准智能的确认和识别候两轮充电车信息当前风险等级,有利于降低火灾等危险发生的可能性。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
其中:
图1为一个实施例中用于两轮充电车的风险评估方法的流程示意图;
图2为一个实施例中构建风险评估模型的流程示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例;基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
在下文的描述中,给出了大量具体的细节以便提供对本发明更为彻底的理解;然而,对于本领域技术人员而言显而易见的是,本发明可以无需一个或多个这些细节而得以实施;在其他的例子中,为了避免与本发明发生混淆,对于本领域公知的一些技术特征未进行描述,应当理解的是,本发明能够以不同形式实施,而不应当解释为局限于这里提出的实施例;相反地,提供这些实施例将使公开彻底和完全,并且将本发明的范围完全地传递给本领域技术人员。
在此使用的术语的目的仅在于描述具体实施例并且不作为本发明的限制。在此使用时,单数形式的“一”、“一个”和“所述/该”也意图包括复数形式,除非上下文清楚指出另外的方式,还应明白术语“组成”和/或“包括”,当在该说明书中使用时,确定所述特征、整数、步骤、操作、元件和/或部件的存在,但不排除一个或更多其它的特征、整数、步骤、操作、元件、部件和/或组的存在或添加。在此使用时,术语“和/或”包括相关所列项目的任何及所有组合。
为了彻底理解本发明,将在下列的描述中提出详细的结构,以便阐释本发明提出的技术方案;本发明的可选实施例详细描述如下,然而除了这些详细描述外,本发明还可以具有其他实施方式。
为了便于理解,下面先对本申请涉及的相关术语进行介绍。
(1)随机森林模型,随机森林模型构造了多个决策树,当需要对某个样本进行预测时,统计森林中的每棵树对该样本的预测结果,然后通过投票法从这些预测结果中选出最后的结果,随机体现在两个方面,一个是随机取特征,另一个是随机取样本,让森林中的每棵树既有相似性又有差异性;
(2)K-Means聚类分析,是聚类中最常用的方法之一,基于点与点之间的距离的相似度来计算最佳类别归属,K-Means算法通过试着将样本分离到n个方差相等的组中来对数据进行聚类,从而最小化目标函数,可以很好地扩展到大量的样本,常用于客户分群、用户画像、精确营销、基于聚类的推荐系统;
(3)主成分分析,是一种使用最广泛的数据降维算法,其主要思想是将n维特征映射到k维上,这k维是全新的正交特征也被称为主成分,是在原有n维特征的基础上重新构造出来的k维特征,从原始的空间中顺序地找一组相互正交的坐标轴,新的坐标轴的选择与数据本身是密切相关的,其中,第一个新坐标轴选择是原始数据中方差最大的方向,第二个新坐标轴选取是与第一个坐标轴正交的平面中使得方差最大的,第三个轴是与第1,2个轴正交的平面中方差最大的,依次类推,可以得到n个这样的坐标轴,大部分方差都包含在前面k个坐标轴中,后面的坐标轴所含的方差几乎为0,忽略余下的坐标轴,只保留前面k个含有绝大部分方差的坐标轴,事实上,这相当于只保留包含绝大部分方差的维度特征,而忽略包含方差几乎为0的特征维度,实现对数据特征的降维处理。
如图1所示,在一个实施例中,提供了一种用于两轮充电车的风险评估方法,该一种用于两轮充电车的风险评估方法包括步骤S101至步骤S104,详述如下:
S101、采集两轮充电车的充电数据、车辆数据和驾驶数据以及对应的充电桩信息和地区信息;
在一些实施例中,充电数据包括:电流、电压、充电时的电池温度和充电时间;车辆数据包括:车型数据、车辆配置信息和电池配置信息;驾驶数据包括:驾驶里程数和驾驶年限。
优选的,驾驶信息还包括:车牌数据、当前两轮充电车是否为营运车辆等。
其中,上述驾驶里程数、驾驶年限、车辆数据以及驾驶信息等涉及驾驶人个人信息的数据,在运用到具体产品或技术中时,需要获得用户许可或者同意,且相关数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准。
在一些实施例中,充电桩信息包括:固定区域内充电桩的使用数量、异常充电桩数量和充电桩平均温度;地区信息包括当前两轮充电车的环境温度、月份、经纬度和地区特征。
S102、对两轮充电车的充电数据、车辆数据和驾驶数据以及对应的充电桩信息和地区信息进行预处理;
在一些实施例中,预处理包括:对缺失值进行填补、对错误数据进行替换、对连续数据进行离散化、对非平衡数据进行调整。
优选的,当对缺失值进行填补时,首先判断缺失值数量是否占比很大,如果只有极少数的缺失值,可以考虑删除或以简单的统计量(如平均值,众数,中位数)进行填补,对于int数据格式的变量可以考虑使用平均值或中位数,对于float类型的变量可以考虑平均值,对于string类型的分类变量可以考虑众数填补。
如果在缺失值数量较多或者数据较为重要的情况下,可以考虑使用无监督机器学习模型,例如k-means进行聚类填补,先设定类别的数量k,通过调整迭代中心位置的方式将数据划分为k个类别,得出结果后试验多个k值,并使用肘部方法寻找最优k值,计算簇内平方和和整体平方和,调整k,再次计算平方和,以此类推,绘制曲线图,横坐标为类别数k,纵坐标为整体平方和,找到曲线肘部(平方和从急速下降改为缓慢下降处),并确认k值,确认k值后以当下分类的中心点(均值)来填补缺失值。
假设填补几个充电桩在某一天的充电次数的缺失值,先对充电桩进行聚类,相似的经纬度数据、相似SOH的充电桩会因为其潜在联系被分到同一个聚类里,这样使用充电次数均值来填补缺失值,大部份情况会比简单的统计量填补更加精确。
由于k-means方式假设包含缺失值的变量在不同分组具有不同值,但有时数据不符合这样的前提,并且在每一个分组内赋予了组内缺失值同样的均值,并不能达到我们想要的准确度,可以采用一些监督机器学习模型来填补缺失值,将需要填补的缺失值设为因变量,其他特征数据设为自变量,并训练模型,利用训练后的模型对缺失值进行填补。
需要注意的是,有时候缺失值本身就蕴含着一些信息,可以通过行业理解、简单统计量或通过构建哑变量并将其转换为二进制和十进制的方式来观察缺失值出现的规律,并判断是否有某个数据采集的阶段出现了问题。
优选的,当对错误数据进行替换时,使用箱形图找到离群值,判断异常原因,必要时直接删除数据,或替换为缺失值,除此之外,如果有存在明显逻辑错误的异常值,例如经纬度定位到了南极等情况,也可以考虑替换为缺失值并检查是否有数据格式错误,统一日期格式。
优选的,当使用逻辑回归模型时,需要将连续型数据离散化,使逻辑回归模型运算速度更快、更具有表达力,可以针对变量的具体含义考虑使用等宽法、等频法或主观分类对连续型数据进行组类拆分,并将其转化为one-hot码。
由于很多模型都需要数据平衡,尤其是像逻辑回归、决策树之类的分类模型,需要确保数据因变量是平衡的,某个类别数据过少会导致训练出来的分类模型难以获得少类别的特征,进而导致将数据正确分类为a的能力很强,但正确分类为b的能力很弱;一般来说,因变量的少数类型只占总数据的20-40%为轻度非平衡,1-20%为中度非平衡,<1%为重度非平衡,因为大部份时间充电桩都是正常运作的,所以异常情况和数值反而是少数,可以通过欠采样或过采样或混合抽样或加权调整模型来处理失衡数据。
欠采样就是从多数类的样本中抽一部份并保留少数类样本的全样,进行匹配,使两类数量相当或者大致匹配,过采样则是对少数类多次抽样,使两类数量相当,但是这样会产生一些问题,欠采样浪费了原本多数类样本中的很多条数据,其中一些数据可能包含重要的信息,而欠采样则可能会导致模型过拟合。
针对欠采样,可以使用bagging来处理,对多数类进行多次有放回的欠采样,并训练出多个分类模型,然后组合得到的结果,针对分类任务取大多数来确定最终的类别,针对回归任务取平均值;或者使用boosting来处理,先通过欠采样训练出一个分类模型,并从多数类样本集里去掉能够被正确分类的样本,然后进行第二次欠采样训练第二个分类模型,最后组合多个模型的结果。
进一步的,可采用smote的方式通过k近邻的思路增加新的合成样本来尽量避免过拟合,如果单一的采用欠采样或过采样无法达到想要的结果,将两者结合进行混合抽样,或者对数据加权使模型更重视少数类数据。
当处理异常分布数据时,对于不同类别数据频数差距较大的数据,低频数据可以进行低频类别合并,可将小于某个频数的数据直接分为一类,也可基于频数做出更细致的分类,处理偏度夸张的right-skewed/left-skewed分布的数据,首先计算数据的偏度,对数据进行box-cox变换,lambda由极大似然法来估算,并决定采用哪种变化,再用变换后的数据训练模型,对预测值进行box-cox的逆转换,计算mse,看模型是否得到了优化,进而实现异常数据的处理。
S103、构建风险评估模型;
如图2所示,在一些实施例中,构建风险评估模型,具体包括:
S301、根据预处理后的两轮充电车的充电数据、车辆数据和驾驶数据以及对应的充电桩信息和地区信息确定训练集数据;
S302、将训练集数据输入风险评估模型;
S303、利用风险评估模型识别训练集数据的特征;
优选的,获取训练集数据的特征之后,还包括对数据特征进行特征缩放,由于部分数据会有衡量尺度和比较基准上的不同,会对模型造成影响,例如有的数据可能单位是厘米,有的则是米,为了统一尺度和比较基准,需要针对一些模型,对数据进行归一化和标准化,中心化主要是为了让变量的均值变成0,让数值减去均值就可以得到,标准化是在中心化的基础上除以数据的标准差,使变量的均值为0,标准差为1,通常对数据进行降维,使用pca的时候,通过方差来选择信息量最大的主成分,衡量尺度的不同会导致方差出现很大差距,对数据进行特征缩放,此外,还可以用min-max、max-abs等方式将数值缩化到[0,1],[-1,1]等特定区间。
进一步的,由于高维度的数据会增大训练成本,也可能会导致模型过拟合,所以需要减少特征维度或者进行特征筛选。
1、针对分类问题和离散型的变量,可以用卡方检验来判断自变量和因变量的相关性,从而筛选出想要的特征;
2、如果是连续型变量,可以通过计算pearson和spearman相关系数来筛选,相关系数越大证明两个变量越相关,可以设置一个阈值,例如与因变量相关系数绝对值高于0.5的自变量留下,其余的数据删除;
3、使用随机森林模型计算出feature importance排序;
4、使用lasso算法筛选出系数不等于0的变量。
S304、对训练集数据进行分类,直至风险评估模型输出风险等级误差小于误差阈值。
在一些实施例中,通过计算准确率、召回率、F1-SCORE、绘制ROC 曲线以及计算AUC获取一定的误差阈值范围,当风险评估模型输出风险等级误差小于误差阈值范围时,则该模型训练完成。
优选的,上述误差阈值范围包括:准确度、精确度、召回率、F1-SCORE都保持在90%以上,AUC在0.8以上。
S104、根据风险评估模型确定当前充电车的风险等级。
在一些实施例中,根据风险评估模型确定当前充电车的风险等级,具体包括:
根据预处理后的两轮充电车的充电数据、车辆数据和驾驶数据以及对应的充电桩信息和地区信息确定测试集数据;
将测试集数据输入风险评估模型;
利用风险评估模型对测试集数据进行分类,确定测试集数据对应的当前充电车的风险等级。
优选的,使用随机森林模型(风险评估模型)并输入各种类型数据的特征变量,并对数据预处理,然后以8:1的比例按照时间将数据拆分为训练集数据和测试集数据。
上述采集相关的经纬度信息,将其转化为标志性地点标签,例如学校、小区、商圈、地铁口等。
选择电流、电池温度、电池参数、地区(标志性地点标签)、电动汽车配置参数、驾驶年限、驾驶里程数、是否运营车辆作为特征,将风险等级(A级、B级、C级、D级)作为目标变量,根据行业内通用的风险标准、汽车保险专业知识以及过往出险严重程度给过往历史数据预设风险等级,建立随机森林模型。
调整模型超参数,例如树的数量、最大深度、最大特征数、最小样本分裂数等等,用交叉验证的办法来选择最优参数模型,计算准确率、召回率、F1-SCORE,绘制ROC 曲线,计算AUC,再次调参,得到风险评估模型后再对测试集进行测试,评估数值。
用训练好的风险评估模型对测试集数据进行风险评级,用随机森林可视化特征重要性排名,看哪个特征对风险评级的影响比较大,定期检测模型的性能。
还可以使用逻辑回归模型(风险评估模型)获取对应的风险等级,先把一些连续型数值特征离散化,例如电池温度、驾驶里程数等,与随机森林模型不同的是,逻辑回归的目标变量可以不用先进行风险等级的预设,直接把有风险和没风险的二分类标签当作目标变量,其他过程和随机森林模型类似,将数据分为不同集、调整超参数、模型评估,逻辑回归可以计算出一辆充电车出现风险的概率,并针对概率进行风险评级,概率越高风险越高。
在训练完两种模型后,可以对两种模型进行对比,例如对比准确率、召回率、f1-score、AUC等,可以选择表现更佳的模型(注意:如果要再次进行选择的话,需要再准备一个测试集,以避免在选择时污染原来的测试集),也可以综合考量两个模型的风险评级指数。
在一些实施例中,风险等级包括:高风险、较高风险、中等风险和低风险,当较高风险被触发时,当前两轮充电车处于异常状态并预警。
优选的,将相关数据每隔五分钟进行一次实时更新,定时输入到训练好的模型中,得到该地区实时的风险等级。
优选的,在高风险触发时,对使用充电桩的用户、保司和维修部门进行预警并对充电车进行断电。
综上,本申请通过获取车型数据、电池数据、充电桩使用状况及其他相关变量如两轮车历史使用情况、温度、季节、月份、地理经纬度等数据,结合业务理解对数据进行分析筛选后进行包括数据清洗、特征工程等步骤的数据预处理,并选择最优模型,根据地理信息增加地区特征,并对不同地区的实时综合风险进行评估,如有必要可以进行范围警报推送,在两轮车被判定为高风险时,对充电桩进行必要时的断电操作,以减少电气、火灾事故。
本申请还提出了一种用于两轮充电车的风险评估系统,系统包括:数据获取单元、数据处理单元和风险评估模型单元;
数据获取单元,用于采集两轮充电车的充电数据、车辆数据和驾驶数据以及对应的充电桩信息和地区信息;
数据处理单元,用于对两轮充电车的充电数据、车辆数据和驾驶数据以及对应的充电桩信息和地区信息进行预处理;
风险评估模型单元,用于构建风险评估模型、根据风险评估模型确定当前充电车的风险等级。
本申请还提出了一种可读存储介质,存储有计算机程序,计算机程序被处理器执行时,使得处理器执行如下步骤:
采集两轮充电车的充电数据、车辆数据和驾驶数据以及对应的充电桩信息和地区信息;
对两轮充电车的充电数据、车辆数据和驾驶数据以及对应的充电桩信息和地区信息进行预处理;
构建风险评估模型;
根据风险评估模型确定当前充电车的风险等级。
本申请还提出了一种计算机设备,包括存储器和处理器,存储器存储有计算机程序,计算机程序被处理器执行如下步骤:
采集两轮充电车的充电数据、车辆数据和驾驶数据以及对应的充电桩信息和地区信息;
对两轮充电车的充电数据、车辆数据和驾驶数据以及对应的充电桩信息和地区信息进行预处理;
构建风险评估模型;
根据风险评估模型确定当前充电车的风险等级。
本领域普通技术人员能够理解实现上述实施例方法中的全部或部分流程,是能够通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一非易失性计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM (SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM (ESDRAM)、同步链路(Synchlink) DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
以上实施例的各技术特征能够进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本申请专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还能够做出若干变形和改进,这些都属于本申请的保护范围,以上所揭露的仅为本发明较佳实施例而已,当然不能以此来限定本发明之权利范围,因此依本发明权利要求所作的等同变化,仍属本发明所涵盖的范围。
Claims (10)
1.一种用于两轮充电车的风险评估方法,其特征在于,所述方法包括下列步骤:
采集两轮充电车的充电数据、车辆数据和驾驶数据以及对应的充电桩信息和地区信息;
对所述两轮充电车的充电数据、车辆数据和驾驶数据以及对应的充电桩信息和地区信息进行预处理;
构建风险评估模型;
根据所述风险评估模型确定当前充电车的风险等级。
2.根据权利要求1所述的用于两轮充电车的风险评估方法,其特征在于,所述充电数据包括:电流、电压、充电时的电池温度和充电时间;所述车辆数据包括:车型数据、车辆配置信息和电池配置信息;所述驾驶数据包括:驾驶里程数和驾驶年限。
3.根据权利要求2所述的用于两轮充电车的风险评估方法,其特征在于,所述充电桩信息包括:固定区域内充电桩的使用数量、异常充电桩数量和充电桩平均温度;所述地区信息包括当前两轮充电车的环境温度、月份、经纬度和地区特征。
4.根据权利要求3所述的用于两轮充电车的风险评估方法,其特征在于,所述预处理包括:对缺失值进行填补、对错误数据进行替换、对连续数据进行离散化、对非平衡数据进行调整。
5.根据权利要求4所述的用于两轮充电车的风险评估方法,其特征在于,所述构建风险评估模型,具体包括:
根据所述预处理后的两轮充电车的充电数据、车辆数据和驾驶数据以及对应的充电桩信息和地区信息确定训练集数据;
将所述训练集数据输入风险评估模型;
利用所述风险评估模型识别所述训练集数据的特征;
对所述训练集数据进行分类,直至所述风险评估模型输出风险等级误差小于误差阈值。
6.根据权利要求5所述的用于两轮充电车的风险评估方法,其特征在于,所述根据所述风险评估模型确定当前充电车的风险等级,具体包括:
根据所述预处理后的两轮充电车的充电数据、车辆数据和驾驶数据以及对应的充电桩信息和地区信息确定测试集数据;
将所述测试集数据输入风险评估模型;
利用所述风险评估模型对测试集数据进行分类,确定测试集数据对应的当前充电车的风险等级。
7.根据权利要求6所述的用于两轮充电车的风险评估方法,其特征在于,所述风险等级包括:高风险、较高风险、中等风险和低风险,当所述较高风险被触发时,当前两轮充电车处于异常状态并预警。
8.一种用于两轮充电车的风险评估系统,其特征在于,所述系统包括:数据获取单元、数据处理单元和风险评估模型单元;
所述数据获取单元,用于采集两轮充电车的充电数据、车辆数据和驾驶数据以及对应的充电桩信息和地区信息;
所述数据处理单元,用于对所述两轮充电车的充电数据、车辆数据和驾驶数据以及对应的充电桩信息和地区信息进行预处理;
所述风险评估模型单元,用于构建风险评估模型、根据所述风险评估模型确定当前充电车的风险等级。
9.一种可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行如权利要求 1至7中任意一项所述方法的步骤。
10.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行如权利要求1至7中任意一项中所述方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311525318.7A CN117251803A (zh) | 2023-11-16 | 2023-11-16 | 用于两轮充电车的风险评估方法、系统、存储介质及设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311525318.7A CN117251803A (zh) | 2023-11-16 | 2023-11-16 | 用于两轮充电车的风险评估方法、系统、存储介质及设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117251803A true CN117251803A (zh) | 2023-12-19 |
Family
ID=89133602
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311525318.7A Pending CN117251803A (zh) | 2023-11-16 | 2023-11-16 | 用于两轮充电车的风险评估方法、系统、存储介质及设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117251803A (zh) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114997748A (zh) * | 2022-08-01 | 2022-09-02 | 中通客车股份有限公司 | 基于模型融合的新能源汽车运行安全风险预测方法及系统 |
CN115366683A (zh) * | 2022-08-09 | 2022-11-22 | 北京理工大学 | 一种新能源汽车动力电池多维模型融合的故障诊断策略 |
CN116482536A (zh) * | 2023-01-30 | 2023-07-25 | 吉林大学 | 基于数据驱动的动力电池故障预警与安全风险评估方法 |
-
2023
- 2023-11-16 CN CN202311525318.7A patent/CN117251803A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114997748A (zh) * | 2022-08-01 | 2022-09-02 | 中通客车股份有限公司 | 基于模型融合的新能源汽车运行安全风险预测方法及系统 |
CN115366683A (zh) * | 2022-08-09 | 2022-11-22 | 北京理工大学 | 一种新能源汽车动力电池多维模型融合的故障诊断策略 |
CN116482536A (zh) * | 2023-01-30 | 2023-07-25 | 吉林大学 | 基于数据驱动的动力电池故障预警与安全风险评估方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111241154B (zh) | 一种基于大数据的蓄电池故障预警方法及系统 | |
CN109447364B (zh) | 基于标签的电力客户投诉预测方法 | |
Moghadam et al. | Spatiotemporal urbanization processes in the megacity of Mumbai, India: A Markov chains-cellular automata urban growth model | |
Feng et al. | Using exploratory regression to identify optimal driving factors for cellular automaton modeling of land use change | |
CA3037941A1 (en) | Method and system for generating and using vehicle pricing models | |
CN116485020B (zh) | 一种基于大数据的供应链风险识别预警方法、系统及介质 | |
CN116861331A (zh) | 一种融合专家模型决策的数据识别方法及系统 | |
Hosseini et al. | Gene expression programming and data mining methods for bushfire susceptibility mapping in New South Wales, Australia | |
WO2006114328A1 (en) | Test mining systems and methods for early detection and warning | |
CN113283673A (zh) | 一种模型性能衰减评价方法、模型训练方法及装置 | |
Velasco et al. | Rainfall forecasting using support vector regression machines | |
CN117251803A (zh) | 用于两轮充电车的风险评估方法、系统、存储介质及设备 | |
CN112256735B (zh) | 一种用电监测方法、装置、计算机设备和存储介质 | |
CN111861141B (zh) | 一种基于模糊故障率预测的配电网可靠性评估方法 | |
CN116862035A (zh) | 航延预测方法、装置、设备和计算机可读存储介质 | |
CN113326882A (zh) | 一种基于分类和回归算法的模型集成方法、装置 | |
Tzima et al. | Using data-mining techniques for PM 10 forecasting in the metropolitan area of Thessaloniki, Greece | |
CN111754103A (zh) | 企业风险画像方法、装置、计算机设备和可读存储介质 | |
CN114154548A (zh) | 销量数据序列分类方法、装置、计算机设备和存储介质 | |
CN113065683A (zh) | 车辆质押的价格预测方法、装置、设备及存储介质 | |
CN111915184A (zh) | 汽车行业零件质量早期预警方法及存储介质 | |
Dias | EV Battery Degradation: A Data Mining Approach | |
CN116680517B (zh) | 一种自动驾驶仿真测试中失败概率的确定方法及装置 | |
CN115860574B (zh) | 充电设备的使用效果分析方法及装置 | |
CN114114056B (zh) | 一种换电柜的电池检测回收方法、系统及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |