CN114462857A - 在用新能源汽车的高风险车辆筛选方法及存储介质 - Google Patents
在用新能源汽车的高风险车辆筛选方法及存储介质 Download PDFInfo
- Publication number
- CN114462857A CN114462857A CN202210122447.0A CN202210122447A CN114462857A CN 114462857 A CN114462857 A CN 114462857A CN 202210122447 A CN202210122447 A CN 202210122447A CN 114462857 A CN114462857 A CN 114462857A
- Authority
- CN
- China
- Prior art keywords
- principal component
- new energy
- value
- characteristic
- screening
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000012216 screening Methods 0.000 title claims abstract description 77
- 238000000034 method Methods 0.000 title claims abstract description 35
- 239000011159 matrix material Substances 0.000 claims abstract description 54
- 238000009826 distribution Methods 0.000 claims abstract description 12
- 238000000513 principal component analysis Methods 0.000 claims abstract description 10
- 238000004458 analytical method Methods 0.000 claims description 33
- 230000009466 transformation Effects 0.000 claims description 13
- 230000001186 cumulative effect Effects 0.000 claims description 12
- 238000004364 calculation method Methods 0.000 claims description 8
- 238000012545 processing Methods 0.000 claims description 4
- 101100083446 Danio rerio plekhh1 gene Proteins 0.000 claims description 3
- 238000011156 evaluation Methods 0.000 abstract description 6
- 230000009286 beneficial effect Effects 0.000 description 8
- 230000000694 effects Effects 0.000 description 7
- 101100353526 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) pca-2 gene Proteins 0.000 description 5
- 230000008569 process Effects 0.000 description 4
- 108091033411 PCA3 Proteins 0.000 description 3
- 238000007599 discharging Methods 0.000 description 3
- 238000010276 construction Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 238000012827 research and development Methods 0.000 description 2
- DSPDJPFEBQTXDO-UHFFFAOYSA-N 1-[2-(3-pyrrolidin-1-ylprop-1-ynyl)piperidin-1-yl]ethanone Chemical compound CC(=O)N1CCCCC1C#CCN1CCCC1 DSPDJPFEBQTXDO-UHFFFAOYSA-N 0.000 description 1
- 101100129500 Caenorhabditis elegans max-2 gene Proteins 0.000 description 1
- 230000002159 abnormal effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 238000010835 comparative analysis Methods 0.000 description 1
- 239000003344 environmental pollutant Substances 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 231100000719 pollutant Toxicity 0.000 description 1
- 238000012847 principal component analysis method Methods 0.000 description 1
- HYISVWRHTUCNCS-UHFFFAOYSA-N pyrene-1-carboxylic acid Chemical compound C1=C2C(C(=O)O)=CC=C(C=C3)C2=C2C3=CC=CC2=C1 HYISVWRHTUCNCS-UHFFFAOYSA-N 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0631—Resource planning, allocation, distributing or scheduling for enterprises or organisations
- G06Q10/06311—Scheduling, planning or task assignment for a person or group
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
- G06F18/2135—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on approximation criteria, e.g. principal component analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0635—Risk analysis of enterprise or organisation activities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
- G06Q10/06395—Quality analysis or management
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02T—CLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
- Y02T10/00—Road transport of goods or passengers
- Y02T10/60—Other road transportation technologies with climate change mitigation effect
- Y02T10/70—Energy storage systems for electromobility, e.g. batteries
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Human Resources & Organizations (AREA)
- Economics (AREA)
- Strategic Management (AREA)
- Entrepreneurship & Innovation (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Marketing (AREA)
- Educational Administration (AREA)
- Development Economics (AREA)
- Game Theory and Decision Science (AREA)
- Quality & Reliability (AREA)
- Operations Research (AREA)
- Health & Medical Sciences (AREA)
- Data Mining & Analysis (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Public Health (AREA)
- Water Supply & Treatment (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Electric Propulsion And Braking For Vehicles (AREA)
Abstract
本发明涉及电动汽车评价方法领域,具体涉及在用新能源汽车的高风险车辆筛选方法及存储介质,方法包括:确定多个经验特征,计算多个经验特征之间的相关系数矩阵,对相关系数矩阵中相关系数值大于阈值的经验特征的占比进行统计,对经验特征进行主成分分析,得到主成分特征;获取运行中新能源汽车预设时间段内行驶的运行数据,根据累计行驶里程是否大于预设里程将新能源汽车的运行数据分成正样本和负样本;分析正样本与负样本的特征分布的总区分度,以区分度与阈值差值的最小值的主成分特征为筛选特征,将筛选特征标准化后的20%分位数作为特征筛选阈值;以筛车综合特征对待筛车的数据进行筛选。本发明能够有效筛选高风险在用新能源汽车。
Description
技术领域
本发明涉及电动汽车评价方法领域,具体涉及在用新能源汽车的高风险车辆筛选方法及存储介质。
背景技术
新能源汽车是利用清洁能源作为动力进行驱动的代步工具,因污染物排放少,新能源汽车运行过程中对环境造成的污染很小,市场对于新能源汽车的需求量大,企业针对旺盛的市场需求也进行了新能源汽车的研发升级,所以,新能源汽车的发展非常迅速。新能源汽车的迅速发展也促使了对高风险新能源汽车筛选要求的提高,而目前高风险新能源汽车的筛选还是按照相关规则中规定的条件进行,即将一年内行驶了八万公里的新能源汽车作为风险车辆,这种筛选方法使得其安全问题日益突出,使得新能源汽车的风险车辆筛选非常重要。
使用现有规则中固定的条件进行新能源汽车风险状态判断的方法,判断纬度单一,容易忽略掉新能源汽车的部分潜在风险问题,新能源汽车忽略掉潜在风险问题可能会导致潜在风险烈化,引发安全事故,严重时还可能造成起火等严重安全问题。
发明内容
本发明意在提供一种在用新能源汽车的高风险车辆筛选方法,以在新能源汽车的行驶服役过程中及时发现潜在风险问题。
本方案中的在用新能源汽车的高风险车辆筛选方法,包括以下步骤:
步骤1,确定与新能源汽车安全状态相关联的多个经验特征,计算多个经验特征之间的相关系数矩阵,对相关系数矩阵中相关系数值大于阈值的经验特征的占比进行统计,判断占比是否大于预设值,当占比大于预设值时,对经验特征进行主成分分析,得到主成分特征;
步骤2,获取运行中新能源汽车预设时间段内行驶的运行数据,根据累计行驶里程是否大于预设里程将新能源汽车的运行数据分成正样本和负样本;
步骤3,基于每个主成分特征对正样本和负样本的特征分布进行对比,得到正样本与负样本的特征分布的总区分度,根据总区分度中最大两个值对应的主成分特征处理得到筛车综合特征;
步骤4,以步骤3中的筛车综合特征对待筛车的数据进行筛选。
本方案的有益效果是:
将新能源汽车的经验特征进行相关系数矩阵的计算,并将相关系数矩阵进行主成分分析得到主成分特征,并利用主成分特征对正样本和负样本进行特征分布的对比分析,以总区分度最大的两个主成分特征处理得到筛车综合特征,利用筛车综合特征进行新能源汽车的筛选,能够从多个方面进行风险车辆的筛选,能够有效筛选出满足预设高风险状态的在用新能源汽车。
进一步,所述主成分分析步骤包括:
步骤A:根据新能源汽车的分析需求选取初始分析变量,所述初始分析变量包括长时间尺度上的累积效应特征和使用强度特征;
步骤B:将初始分析变量中非标准化的累积效应特征按照预设模型进行标准化处理;
步骤C:对标准化后的初始分析变量特征求协方差矩阵,计算协方差矩阵的特征值和特征向量;
步骤D:将特征值按照从大至小顺序进行排序,得到主成分个数,并根据主成分个数得到主成分特征;
步骤E:从两个方面选择初始分析变量进行分析,根据主成分特征的线性变换系数,得到初始分析变量到主成分特征的线性变换系数矩阵。
有益效果是:利用主成分分析,对累积效应特征和使用强度特征进行分析处理,并对累积效应特征进行标准化处理,保证数据都在0-1之间,有效避免了不同量纲的数据对于权重计算结果的干扰,能够保证新能源车辆在时间的累积效应特征得到准确的测试,提高完整性,能够保留特征中携带的信息,减少信息损失。
进一步,所述步骤B中,所述预设模型为(x1-min1)/(max1-min1),其中x1为初始分析变量的当前值,min1为多辆新能源汽车的经验特征数据中x1同类型初始分析变量的最小值,max1为多辆新能源汽车的经验特征数据中x1同类型初始分析变量的最大值。
有益效果是:按照预设模型对各个特征进行标准化处理,保证多个特质之间量纲的统一性,有效避免不同量纲的数据对于权重计算结果的干扰,以提高后续筛车特征与车辆风险状态之间映射关系的可靠性。
进一步,所述步骤D中,针对每个主成分特征计算特征贡献率,并对主成分特征的特征贡献率求和得到累计贡献率,当累计贡献率大于贡献阈值时,以累计贡献率大于贡献阈值的主成分特征为主成分个数,以主成分个数的主成分特征为最终主成分特征;所述步骤E中,将累计贡献率大于贡献阈值的多个主成分特征线性变换系数进行组合,得到线性变换系数矩阵。
有益效果是:通过计算累计贡献率,并以累计贡献率大于贡献阈值的多个主成分特征为最终主成分特征,在保留主成分特征对正样本和负样本区分度的前提下,能够对多个主成分特征进行筛选和降维。
进一步,所述步骤3中,基于每个主成分特征对正样本和负样本的特征分布进行对比,将负样本与正样本未重合部分车辆数量与负样本中车辆总数量的比值作为负样本区分度,将正样本与负样本未重合部分车辆数量与正样本中车辆总数量的比值作为正样本区分度,以负样本区分度和正样本区分度之和作为总区分度。
有益效果是:将最终得到的每个主成分特征用于对正样本和负样本进行区分,并计算对应的总区分度,保证主成分特征对正样本和负样本的区分能力最大。
进一步,所述步骤3中,将总区分度进行排序,以总区分度最大的两个主成分特征相减得到经验特征权重;
将总区分度最大的两个主成分特征与经验特征值作积,并将正样本作积并标准化后的20%分位数特征值作为特征筛选阈值;
计算总区分度最大的两个主成分特征的综合特征取值范围,根据特征取值范围确定超参数;
将经验特征权重、特征筛选阈值和超参数作为筛车综合特征。
有益效果是:将总区分度最大的两个主成分特征分析处理得到对应的筛车综合特征,并应有筛车综合特征进行筛车,从多个维度筛选得到,在达到预设里程前筛选出风险车辆,提高筛车准确性。
进一步,所述步骤3中,以总区分度最大的两个主成分特征各自的最大值减去最小值得到上边界值,以总区分度最大的两个主成分特征各自的最小值减去最大值得到下边界值,以[下边界值,上边界值]作为综合特征取值范围,将上边界值和下边界值确定为超参数。
有益效果是:将确定的超参数用于筛车,能够将车辆特征的值统一至0-100的分值进行评价,更直观准确。
进一步,所述步骤4中,将经验特征权重与待筛车的车辆数据作积得到初始值,将初始值在超参数条件下进行标准化得到评分值,将评分值与特征筛选阈值进行对比,当评分值大于特征筛选阈值时,对待评价车辆的风险进行评价。
有益效果是:通过多个经验特征分析,重新定下的特征对新能源汽车进行筛选,能够筛选出最准确的高风险的新能源汽车,以提前发现新能源汽车在达到预设里程前的异常情况。
存储介质,存储有计算机可执行程序,所述可执行程序被运行时执行上述方法的步骤。
附图说明
图1为本发明在用新能源汽车的高风险车辆筛选方法实施例一的流程框图;
图2为本发明在用新能源汽车的高风险车辆筛选方法实施例一中主成分特征对样本区分度的分布图;
图3为本发明在用新能源汽车的高风险车辆筛选方法实施例一中新能源汽车风险判定阈值。
具体实施方式
下面通过具体实施方式进一步详细说明。
实施例一
在用新能源汽车的高风险车辆筛选方法,如图1所示,包括以下步骤:
步骤1,确定与新能源汽车安全状态相关联的多个经验特征,例如十台新能源汽车的经验特征如表1所示,实际计算时以十万台车的经验特征进行计算。
表1十台新能源汽车的经验特征
计算多个经验特征之间的相关系数矩阵,相关系数矩阵通过对所获得的十万辆新能源汽车的多个经验特征以现有的公式进行计算,例如将十万辆新能源汽车的十二个经验特征组成12×100000的矩阵和100000×12的矩阵进行相关计算,得到12×12的矩阵,相关系数矩阵通过Python软件中的函数进行计算,计算得到的相关系数矩阵如表2所示。
表2相关系数矩阵
对相关系数矩阵中相关系数值大于阈值的经验特征的占比进行统计,阈值设置为0.3,判断占比是否大于预设值,占比按照相关系数值大于阈值的经验特征数量除以经验特征总数量来计算,预设值设置成56%,当占比大于预设值时,对经验特征进行主成分分析,得到主成分特征。从表2可知相关系数大于0.3的经验特征占比>56%,能够采用主成分分析方法对100000×12的经验特征进行降维和去重,对相关系数值大于阈值的经验特征的占比进行判断,能够保证主成分分析的效果以及分析结果的有效性。
所述主成分分析步骤包括:
步骤A:根据新能源汽车的分析需求选取初始分析变量,所述初始分析变量包括长时间尺度上的累积效应特征和使用强度特征,例如实施例中的初始分析变量即为总充电次数、快充次数、深充次数、高充次数、深放次数、出车天数、日均中位里程、快充占比、深充占比、高充占比、深放占比和最大里程,将十万辆新能源汽车的多个初始分析变量形成100000×12的矩阵。
步骤B:将初始分析变量中的非标准化的累积效应特征按照预设模型进行标准化处理,初始分析变量即为经验特征,即对100000×12的矩阵中的总充电次数、快充次数、深充次数、高充次数、深放次数、出车天数、日均中位里程、最大里程的值进行标准化处理,预设模型为(x1-min1)/(max-min1),其中x1为当前初始分析变量的当前值,min1为多辆新能源汽车的经验特征数据中x1同类型初始分析变量的最小值,max1为多辆新能源汽车的经验特征数据中x1同类型初始分析变量的最大值,以表1中的十台新能源汽车为例,针对矩阵中多个累积效应特征的每列数据进行标准化,例如对车辆1的单日里程中位数进行标准化处理得到标准化结果为(1240-100)/(1240-100)=1,对车辆2的单日里程中位数进行标准化处理得到标准化结果为(1040-100)/(1240-100)=0.8245614,以此方法依次对每个经验特征的值进行标准化处理,将多个经验特征的值变成0-1之间的值,从而统一多个经验特征的量纲。
步骤C:对标准化后的初始分析变量特征求协方差矩阵,计算协方差矩阵的特征值和特征向量,将特征值,即对标准化后的100000×12矩阵求协方差矩阵的特征值与特征向量,求得的协方差矩阵为12×12的矩阵,特征值组成为1×12的矩阵,每个特征值表示为PCA_X,X=1,2,3…12,特征向量表示为12×12的矩阵,协方差矩阵的计算以及对协方差矩阵求特征值和特征向量可用Python软件中的函数进行,在此不再赘述。
步骤D:将特征值按照从大至小顺序进行排序,并针对每个特征值计算特征贡献率,特征值对于的特征表示为PCA特征,特征贡献率是指特征值在所考察的随机变量的总方差中所占的比例,并将特征贡献率求和得到累计贡献率,如表3所示,当累计贡献率大于贡献阈值时,以累计贡献率大于贡献阈值的特征值数量为主成分个数,贡献阈值可以设置成85%,以主成分个数的主成分特征为最终主成分特征,主成分特征为PCA_1、PCA_2、PCA_3、PCA_、PCA_5。
表3特征贡献率
PCA特征 | PCA_1 | PCA_2 | PCA_3 | PCA_4 | PCA_5 | PCA_6 | PCA_7 | PCA_8 | PCA_9 | PCA_10 | PCA_11 | PCA_12 |
特征贡献率 | 0.409047 | 0.196991 | 0.125193 | 0.083615 | 0.063692 | 0.041839 | 0.029589 | 0.022516 | 0.012839 | 0.007272 | 0.005549 | 0.001857 |
累计贡献率 | 0.409047 | 0.606038 | 0.731231 | 0.814847 | 0.878539 | 0.920378 | 0.949967 | 0.972483 | 0.985322 | 0.992594 | 0.998143 | 1 |
从表3可知,前五个主成分的累计贡献率的和为87.854%,已经包含原特征中的绝大部分信息,选取前5个主成分特征,可起到降维与信息去重的作用。
步骤E:将累计贡献率大于贡献阈值的多个主成分特征线性变换系数进行组合,根据主成分特征的线性变换系数,得到初始分析变量到主成分特征的线性变换系数矩阵,按特征值大小排列的特征向量矩阵即为该线性变化系数矩阵,如表4所示的线性变换系数矩阵。
表4线性变换系数矩阵
PCA 1 | PCA 2 | PCA 3 | PCA 4 | PCA 5 | |
总充电状数 | 0.33486 | 0.31398 | 0.26573 | 0.11620 | 0.12074 |
快充次数 | 0.33481 | 0.12889 | -0.42015 | 0.06194 | 0.34690 |
深充次数 | 0.35745 | 0.31105 | 0.15696 | -0.19081 | -0.03104 |
高充次数 | 0.37366 | -0.27123 | 0.15569 | -0.08709 | -0.01741 |
深放次数 | 0.33093 | -0.34006 | 0.21322 | 0.07481 | 0.09281 |
出车天数 | 0.23693 | 0.24848 | 0.41368 | 0.25603 | 0.32564 |
日均中位里程 | 0.25925 | 0.05183 | -0.18993 | 0.26900 | -0.69120 |
快充占比 | 0.22241 | -0.01936 | -0.64336 | -0.02838 | 0.35125 |
深充占比 | 0.23397 | 0.20597 | -0.03294 | -0.73044 | -0.22811 |
高充占比 | 0.27111 | -0.43635 | 0.03661 | -0.26628 | -0.05236 |
深放占比 | 0.13526 | -0.53884 | 0.05290 | 0.13078 | 0.05372 |
最大里程 | 0.28317 | 0.10422 | -0.17375 | 0.41570 | -0.30060 |
步骤2,获取运行中新能源汽车预设时间段内行驶的运行数据,根据累计行驶里程是否大于预设里程将新能源汽车的运行数据分成正样本和负样本,预设里程为八万公里,将累计行驶里程大于预设里程的新能源汽车划分为负样本,将累计行驶里程小于预设李里程的新能源汽车划分为正样本。
步骤3,如图2和图3所示,图2和图3中的横坐标为每个主成分特征的特征值,纵坐标为新能源汽车的数量。基于每个主成分特征对正样本和负样本的特征分布进行对比,得到正样本与负样本的特征分布的总区分度,总区分度包括正样本区分度和正样本区分度,负样本区分度为图2中负样本与正样本未重合部分车辆数量与负样本中车辆总数量的比值,正样本区分度为图2中正样本与负样本未重合部分车辆数量与正样本中车辆总数量的比值,以负样本区分度和正样本区分度之和作为总区分度,图3中黑色框内的部分为正样本和负样本的重叠区域。
将总区分度进行排序,以总区分度最大的两个主成分特征相减得到经验特征权重,即将表4中的PCA_1-PCA_2得到的12×1的矩阵表示经验特征权重。
如图3所示,将总区分度最大的两个主成分特征与经验特征值作积,并将正样本作积并标准化后的20%分位数特征值作为特征筛选阈值,例如经验特征值为100000×12矩阵,总区分度最大的两个主成分特征作差后的经验特征权重表示为12×1的矩阵,作积后得到100000×1的矩阵,对该矩阵中的值进行标准化,标准化的公式为(x-min2)/(max2-min2),其中:x为该矩阵中任一个值,min2为该矩阵中的最小值,max2为该矩阵中的最大值,20%为经验值,是结合大数据统计分析结果,经过试验能够尽可能多包含正样本而少包含负样本的阈值。
计算总区分度最大的两个主成分特征的综合特征取值范围,以总区分度最大的两个主成分特征各自的最大值减去最小值得到上边界值,即(PCA_1)max-(PCA_2)min=上边界值,以总区分度最大的两个主成分特征各自的最小值减去最大值得到下边界值,即(PCA_1)min-(PCA_2)max=下边界值,例如,从图2可以得到综合特征取值范围为[-16,14],将综合特征取值范围的上边界值表示为Max3,将综合特征取值范围的下边界值表示为Min3,将Max3和Min3作为超参数。
以经验特征权重、超参数和筛选特征阈值作为筛车综合特征。
步骤4,以步骤3中的筛车综合特征对待筛车的数据进行筛选,将经验特征权重与待筛车的车辆数据作积得到初始值,将初始值在超参数条件下进行标准化得到评分值,将评分值与特征筛选阈值进行对比,当评分值大于特征筛选阈值时,对待评价车辆的风险进行评价,车辆的风险评价使用现有技术,在此不再赘述。
由于目前针对筛车普遍是以一年内行驶八万公里的时间和行程参量为尺度,筛选出高风险的新能源汽车,一年内八万公里的判断能够筛选出高风险车,故普遍均是利用该时间和里程参数进行高风险车的筛选,但影响新能源汽车安全性的因素很多,现有的时间和里程参数筛选方法不能绝对地评价车辆是否为高风险车,且时间和里程为评价尺度,评价尺度非常单一,无法准确筛选出行驶里程小于八万公里部分车辆中的风险车辆。而本实施例通过先以新能源汽车经验特征的相关系数矩阵进行主成分分析,得到主成分特征,并判断主成分特征对正样本和负样本特征分布的区分能力,并将区分能力较大的主成分特征综合处理,得到筛车综合特征,在实际进行高风险车辆筛选是,利用筛车综合特征进行高风险新能源汽车的筛选。本实施例无需再次计算相关系数矩阵,筛选高风险车辆的速度不会被降低,同时,从多个方面进行高风险车辆的筛选,能够有效筛选出未达到高风险评价标准之前且又具有高风险的在用新能源汽车。
实施例二
存储介质,存储有计算机可执行程序,计算机可执行程序被运行时执行如实施例一中在用新能源汽车的高风险车辆筛选方法的步骤。
本实施例通过存储介质中的在用新能源汽车的高风险车辆筛选方法,先对新能源汽车的多个经验特征进行分析得到主成分特征,并验证主成分特征对正样本和负样本的区分性,最后构造得到新的筛车综合特征,利用筛车综合特征进行筛车。即时在研发过程中,想到利用多特征进行筛车,但是,普遍都是利用多特征结合进行筛车,毕竟多个经验特征对于车辆的影响结果是已知,在已知影响结果基础上改进提高筛车效果比较有效,而所构造的新的特征对于筛车效果未知,研发时一般不会想到构造新的特征进行筛车。
以上所述的仅是本发明的实施例,方案中公知的具体结构及特性等常识在此未作过多描述。应当指出,对于本领域的技术人员来说,在不脱离本发明结构的前提下,还可以作出若干变形和改进,这些也应该视为本发明的保护范围,这些都不会影响本发明实施的效果和专利的实用性。本申请要求的保护范围应当以其权利要求的内容为准,说明书中的具体实施方式等记载可以用于解释权利要求的内容。
Claims (9)
1.在用新能源汽车的高风险车辆筛选方法,其特征在于,包括以下步骤:
步骤1,确定与新能源汽车安全状态相关联的多个经验特征,计算多个经验特征之间的相关系数矩阵,对相关系数矩阵中相关系数值大于阈值的经验特征的占比进行统计,判断占比是否大于预设值,当占比大于预设值时,对经验特征进行主成分分析,得到主成分特征;
步骤2,获取运行中新能源汽车预设时间段内行驶的运行数据,根据累计行驶里程是否大于预设里程将新能源汽车的运行数据分成正样本和负样本;
步骤3,基于每个主成分特征对正样本和负样本的特征分布进行对比,得到正样本与负样本的特征分布的总区分度,根据总区分度中最大两个值对应的主成分特征处理得到筛车综合特征;
步骤4,以步骤3中的筛车综合特征对待筛车的数据进行筛选。
2.根据权利要求1所述的在用新能源汽车的高风险车辆筛选方法,其特征在于:所述主成分分析步骤包括:
步骤A:根据新能源汽车的分析需求选取初始分析变量,所述初始分析变量包括长时间尺度上的累积效应特征和使用强度特征;
步骤B:将初始分析变量中非标准化的累积效应特征按照预设模型进行标准化处理;
步骤C:对标准化后的初始分析变量特征求协方差矩阵,计算协方差矩阵的特征值和特征向量;
步骤D:将特征值按照从大至小顺序进行排序,得到主成分个数,并根据主成分个数得到主成分特征;
步骤E:根据主成分特征的线性变换系数,得到初始分析变量到主成分特征的线性变换系数矩阵。
3.根据权利要求2所述的在用新能源汽车的高风险车辆筛选方法,其特征在于:所述步骤B中,所述预设模型为(x1-min1)/(max1-min1),其中x1为初始分析变量的当前值,min1为多辆新能源汽车的经验特征数据中x1同类型初始分析变量的最小值,max1为多辆新能源汽车的经验特征数据中x1同类型初始分析变量的最大值。
4.根据权利要求3所述的在用新能源汽车的高风险车辆筛选方法,其特征在于:所述步骤D中,针对每个主成分特征计算特征贡献率,并对主成分特征的特征贡献率求和得到累计贡献率,当累计贡献率大于贡献阈值时,以累计贡献率大于贡献阈值的主成分特征为主成分个数,以主成分个数的主成分特征为最终主成分特征;所述步骤E中,将累计贡献率大于贡献阈值的多个主成分特征线性变换系数进行组合,得到线性变换系数矩阵。
5.根据权利要求4所述的在用新能源汽车的高风险车辆筛选方法,其特征在于:所述步骤3中,基于每个主成分特征对正样本和负样本的特征分布进行对比,将负样本与正样本未重合部分车辆数量与负样本中车辆总数量的比值作为负样本区分度,将正样本与负样本未重合部分车辆数量与正样本中车辆总数量的比值作为正样本区分度,以负样本区分度和正样本区分度之和作为总区分度。
6.根据权利要求5所述的在用新能源汽车的高风险车辆筛选方法,其特征在于:所述步骤3中,将总区分度进行排序,以总区分度最大的两个主成分特征相减得到经验特征权重;
将总区分度最大的两个主成分特征与经验特征值作积,并将正样本作积并标准化后的20%分位数特征值作为特征筛选阈值;
计算总区分度最大的两个主成分特征的综合特征取值范围,根据特征取值范围确定超参数;
将经验特征权重、特征筛选阈值和超参数作为筛车综合特征。
7.根据权利要求6所述的在用新能源汽车的高风险车辆筛选方法,其特征在于:所述步骤3中,以总区分度最大的两个主成分特征各自的最大值减去最小值得到上边界值,以总区分度最大的两个主成分特征各自的最小值减去最大值得到下边界值,以[下边界值,上边界值]作为综合特征取值范围,将上边界值和下边界值确定为超参数。
8.根据权利要求7所述的在用新能源汽车的高风险车辆筛选方法,其特征在于:所述步骤4中,将经验特征权重与待筛车的车辆数据作积得到初始值,将初始值在超参数条件下进行标准化得到评分值,将评分值与特征筛选阈值进行对比,当评分值大于特征筛选阈值时,对待评价车辆的风险进行评价。
9.存储介质,存储有计算机可执行程序,其特征在于:所述可执行程序被运行时执行如权利要求1-8任一项上述在用新能源汽车的高风险车辆筛选方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210122447.0A CN114462857B (zh) | 2022-02-09 | 2022-02-09 | 在用新能源汽车的高风险车辆筛选方法及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210122447.0A CN114462857B (zh) | 2022-02-09 | 2022-02-09 | 在用新能源汽车的高风险车辆筛选方法及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114462857A true CN114462857A (zh) | 2022-05-10 |
CN114462857B CN114462857B (zh) | 2022-08-30 |
Family
ID=81412917
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210122447.0A Active CN114462857B (zh) | 2022-02-09 | 2022-02-09 | 在用新能源汽车的高风险车辆筛选方法及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114462857B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117234858A (zh) * | 2023-11-14 | 2023-12-15 | 睿至科技集团有限公司 | 一种智能告警平台的协调优化运行方法及系统 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105975757A (zh) * | 2016-04-28 | 2016-09-28 | 彩虹无线(北京)新技术有限公司 | 一种基于车辆行驶数据的急减速行为识别方法 |
KR20180110566A (ko) * | 2017-03-29 | 2018-10-10 | 아이덴티파이 주식회사 | 인공지능 시스템을 이용하여 자동차 비정상신호를 감지하는 방법 |
CN110866677A (zh) * | 2019-10-25 | 2020-03-06 | 东南大学 | 一种基于基准化分析的驾驶人相对风险评价方法 |
CN112700156A (zh) * | 2021-01-07 | 2021-04-23 | 武汉理工大学 | 一种新能源汽车运行安全性能评价体系构建方法 |
CN112862279A (zh) * | 2021-01-26 | 2021-05-28 | 上海应用技术大学 | 高速公路行车道路面状况评价方法 |
CN113642893A (zh) * | 2021-08-16 | 2021-11-12 | 公安部交通管理科学研究所 | 一种新能源汽车运行风险的评估方法 |
CN113688558A (zh) * | 2021-06-18 | 2021-11-23 | 长安大学 | 一种基于大数据库样本的汽车行驶工况构建方法及系统 |
-
2022
- 2022-02-09 CN CN202210122447.0A patent/CN114462857B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105975757A (zh) * | 2016-04-28 | 2016-09-28 | 彩虹无线(北京)新技术有限公司 | 一种基于车辆行驶数据的急减速行为识别方法 |
KR20180110566A (ko) * | 2017-03-29 | 2018-10-10 | 아이덴티파이 주식회사 | 인공지능 시스템을 이용하여 자동차 비정상신호를 감지하는 방법 |
CN110866677A (zh) * | 2019-10-25 | 2020-03-06 | 东南大学 | 一种基于基准化分析的驾驶人相对风险评价方法 |
CN112700156A (zh) * | 2021-01-07 | 2021-04-23 | 武汉理工大学 | 一种新能源汽车运行安全性能评价体系构建方法 |
CN112862279A (zh) * | 2021-01-26 | 2021-05-28 | 上海应用技术大学 | 高速公路行车道路面状况评价方法 |
CN113688558A (zh) * | 2021-06-18 | 2021-11-23 | 长安大学 | 一种基于大数据库样本的汽车行驶工况构建方法及系统 |
CN113642893A (zh) * | 2021-08-16 | 2021-11-12 | 公安部交通管理科学研究所 | 一种新能源汽车运行风险的评估方法 |
Non-Patent Citations (1)
Title |
---|
刘征宇等: "基于主成分分析法的车险定价因子研究", 《合肥工业大学学报(自然科学版)》 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117234858A (zh) * | 2023-11-14 | 2023-12-15 | 睿至科技集团有限公司 | 一种智能告警平台的协调优化运行方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN114462857B (zh) | 2022-08-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111301426B (zh) | 基于gru网络模型预测未来行驶过程能耗的方法 | |
CN108520357A (zh) | 一种线损异常原因的判别方法、装置及服务器 | |
CN106556802A (zh) | 一种蓄电池组异常单体电池识别方法及装置 | |
CN112946485A (zh) | 车辆电池检测方法、存储介质及设备 | |
CN114462857B (zh) | 在用新能源汽车的高风险车辆筛选方法及存储介质 | |
CN111967717A (zh) | 一种基于信息熵值的数据质量评价方法 | |
CN112730748A (zh) | 一种基于工况选择的大规模筛查重型柴油车高NOx排放方法 | |
CN116664015A (zh) | 一种智能充电桩管理系统及其方法 | |
CN113459894A (zh) | 一种电动汽车电池安全预警方法及系统 | |
CN114781245B (zh) | 基于油耗强相关参数修正的瞬态汽车油耗估计方法及系统 | |
CN115454990A (zh) | 一种基于改进knn的油纸绝缘数据清洗方法 | |
CN114611604A (zh) | 一种基于电驱总成载荷特征融合与聚类的用户筛选方法 | |
US20230130765A1 (en) | Method for Detecting the Load Mass of Commercial Vehicle | |
CN114487836A (zh) | 基于电压和温度的电池状态分析方法、系统及终端 | |
CN111832442B (zh) | 从海量桥梁动态应变数据中自动化分离温度应变成分的方法 | |
CN113221457A (zh) | 一种车辆保养信息的确定方法、装置、设备及介质 | |
CN112287586A (zh) | 基于中小桥损伤识别结果的快速可靠度评估方法 | |
CN117033891A (zh) | 基于单车交通事故数据库的交通事故严重程度评估方法 | |
CN108229797B (zh) | 一种组合倾向得分匹配模型与贝叶斯模型的道路安全评估方法 | |
CN115508732A (zh) | 一种电池包寿命预测方法及装置 | |
CN113538735B (zh) | 一种车辆用途识别方法及装置 | |
CN112699609B (zh) | 一种基于振动数据的柴油机可靠性模型构建方法 | |
CN112505551B (zh) | 一种面向退役动力电池的筛选方法 | |
CN114970600A (zh) | 基于粒化散布熵和优化kelm的滚动轴承故障诊断方法、装置 | |
CN114544201B (zh) | 车辆制动性能的测评方法、装置、车辆及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |