CN114627320A - 一种新能源汽车聚类方法及装置 - Google Patents
一种新能源汽车聚类方法及装置 Download PDFInfo
- Publication number
- CN114627320A CN114627320A CN202011438210.0A CN202011438210A CN114627320A CN 114627320 A CN114627320 A CN 114627320A CN 202011438210 A CN202011438210 A CN 202011438210A CN 114627320 A CN114627320 A CN 114627320A
- Authority
- CN
- China
- Prior art keywords
- new energy
- charging
- energy automobile
- data
- record
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
-
- G—PHYSICS
- G07—CHECKING-DEVICES
- G07C—TIME OR ATTENDANCE REGISTERS; REGISTERING OR INDICATING THE WORKING OF MACHINES; GENERATING RANDOM NUMBERS; VOTING OR LOTTERY APPARATUS; ARRANGEMENTS, SYSTEMS OR APPARATUS FOR CHECKING NOT PROVIDED FOR ELSEWHERE
- G07C5/00—Registering or indicating the working of vehicles
- G07C5/08—Registering or indicating performance data other than driving, working, idle, or waiting time, with or without registering driving, working, idle or waiting time
- G07C5/0841—Registering performance data
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Computational Biology (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Electric Propulsion And Braking For Vehicles (AREA)
- Charge And Discharge Circuits For Batteries Or The Like (AREA)
Abstract
本发明实施例公开一种新能源汽车聚类方法及装置。该方法包括:获取各新能源汽车最近预设数量次充电记录,并识别各充电记录中的异常数据,对所识别的异常数据进行修正;对各充电记录进行划分,得到各充电段;针对每个充电段,根据该充电段中包括的每条数据,依次计算各构造特征的值,并将构造特征的值按预设顺序填充至该充电段;针对任一第一新能源汽车和第二新能源汽车,计算第一新能源汽车和第二新能源汽车的目标距离;获取已存储的密度参数和距离度量标准,并对各新能源汽车进行聚类得到聚类结果,聚类结果包括集中新能源汽车集合和分散新能源汽车集合。应用本发明实施例提供的方案,能够提高新能源汽车聚类的准确性。
Description
技术领域
本发明涉及信息聚类技术领域,具体而言,涉及一种新能源汽车聚类方法及装置。
背景技术
聚类是生活中十分重要的一个部分,例如,新能源汽车公司想对车辆分群,找到可能存在异常的新能源汽车并及时进行处理。
已知的聚类方法,均要求每条数据的信息量,即数据维度一致,且每条数据的特征维度足够大。但是,在针对新能源汽车进行聚类时,其一,不同新能源汽车有的充电次数不一致,有的新能源汽车仅有一次充电,有的新能源汽车多达20次充电;其二,新能源汽车充电信息中每条数据的数据维度不一致。因为在不同的充电中存在充电时长、充入电量不固定的问题,每条数据的信息量不固定,例如新能源汽车A最近一次充电时间久、充电完整,从20%充到了100%,包含了200条电流、电压等数据的纪录;但新能源汽车B最近一次充电时间短,从50%充到了60%,仅包含了50条电流、电压等数据的纪录。因此新能源汽车A本次充电包含的信息远多于新能源汽车B的此次充电,这一数据信息不固定使得传统的聚类算法不太适用于新能源汽车充电数据;最后,对于每次充电,虽然能收集到很多条记录,但每条记录只有电流、电压等基础信息,这种很小的数据维度会导致聚类误差较大。因此,为了提高新能源汽车聚类的准确性,亟需一种新能源汽车聚类方法。
发明内容
本发明提供了一种新能源汽车聚类方法及装置,以提高新能源汽车聚类的准确性。具体的技术方案如下。
第一方面,本发明实施例提供一种新能源汽车聚类方法,所述方法包括:
获取各新能源汽车最近预设数量次充电记录,并识别各充电记录中的异常数据,对所识别的异常数据进行修正;
根据各所述充电记录中包括的预设特征,以及预设的各区间端点值,对各所述充电记录进行划分,得到各充电段;其中,各所述充电记录包括的充电段数量均相等,各所述充电段包括的数据量均相等;
针对每个充电段,根据该充电段中包括的每条数据,依次计算各构造特征的值,并将所述构造特征的值按预设顺序填充至该充电段;
针对任一第一新能源汽车和第二新能源汽车,确定所述第一新能源汽车的第一充电记录数量和所述第二新能源汽车的第二充电记录数量,确定所述第一充电记录数量和所述第二充电记录数量中的最小值,在所述第一新能源汽车和所述第二新能源汽车的充电记录中,选取最近的所述最小值次目标充电记录;依次根据所述第一新能源汽车和所述第二新能源汽车第i次目标充电记录包括的各充电段,计算所述第一新能源汽车和所述第二新能源汽车之间第i次充电记录对应的初始距离,并确定各初始距离的权重,根据所述权重以及各初始距离,计算所述第一新能源汽车和所述第二新能源汽车的目标距离;
获取已存储的密度参数和距离度量标准,并根据所述密度参数和距离度量标准,以及每两辆新能源汽车的目标距离,对各所述新能源汽车进行聚类得到聚类结果,所述聚类结果包括集中新能源汽车集合和分散新能源汽车集合。
可选的,所述获取各新能源汽车最近预设数量次充电记录的步骤包括:
针对任一新能源汽车,判断该新能源汽车的充电记录数量是否小于预设数量;
当该新能源汽车的充电记录数量小于所述预设数量时,获取该新能源汽车所有的充电记录;
当该新能源汽车的充电记录数量不小于所述预设数量时,获取该新能源汽车最近所述预设数量次充电记录。
可选的,所述识别各充电记录中的异常数据,对所识别的异常数据进行修正的步骤包括:
针对各充电记录,识别该充电记录中缺失的数据点,并根据该数据点前后第一预设条数的数据,对该数据点进行填充;
针对各充电记录,识别该充电记录中数据范围异常的数据点,并根据该数据点前后第二预设条数的数据,对该数据点进行修正。
可选的,每条充电记录中至少包括荷电状态,所述各区间端点值包括起始荷电量和对应的终止荷电量;所述根据各所述充电记录中包括的预设特征,以及预设的各区间端点值,对各所述充电记录进行划分,得到各充电段的步骤包括:
获取预设的各起始荷电量和对应的终止荷电量,并构建各起始荷电量和对应的终止荷电量对应的初始充电段;
针对各充电记录,依次查找荷电状态位于各起始荷电量和对应的终止荷电量范围内的数据,将所查找到的数据添加至对应的初始充电段;
针对各初始充电段,在该初始充电段所包括的起始荷电状态不等于对应的起始荷电量时,使用预设数据填充从所述起始荷电量至所述起始荷电状态之间的数据;在该初始充电段所包括的终止荷电状态不等于对应的终止荷电量时,使用所述预设数据填充从所述终止荷电状态至所述终止荷电量之间的数据,得到该初始充电段对应的充电段。
可选的,所述构造特征包括:所述充电记录中所包括各特征的均值和方差。
可选的,所述集中新能源汽车集合中包括的新能源汽车为正常新能源汽车,所述分散新能源汽车集合中包括的新能源汽车为异常新能源汽车,所述方法还包括:
获取对各所述新能源汽车进行检验的检验结果,所述检验结果包括各新能源汽车正常或异常;
将所述聚类结果和所述检验结果进行对比,当异常新能源汽车的识别错误率大于第一阈值时,减小所述密度参数,当正常新能源汽车的识别错误率大于第二阈值时,增大所述密度参数。
第二方面,本发明实施例提供一种新能源汽车聚类装置,所述装置包括:
数据获取模块,用于获取各新能源汽车最近预设数量次充电记录,并识别各充电记录中的异常数据,对所识别的异常数据进行修正;
数据划分模块,用于根据各所述充电记录中包括的预设特征,以及预设的各区间端点值,对各所述充电记录进行划分,得到各充电段;其中,各所述充电记录包括的充电段数量均相等,各所述充电段包括的数据量均相等;
特征构造模块,用于针对每个充电段,根据该充电段中包括的每条数据,依次计算各构造特征的值,并将所述构造特征的值按预设顺序填充至该充电段;
距离计算模块,用于针对任一第一新能源汽车和第二新能源汽车,确定所述第一新能源汽车的第一充电记录数量和所述第二新能源汽车的第二充电记录数量,确定所述第一充电记录数量和所述第二充电记录数量中的最小值,在所述第一新能源汽车和所述第二新能源汽车的充电记录中,选取最近的所述最小值次目标充电记录;依次根据所述第一新能源汽车和所述第二新能源汽车第i次目标充电记录包括的各充电段,计算所述第一新能源汽车和所述第二新能源汽车之间第i次充电记录对应的初始距离,并确定各初始距离的权重,根据所述权重以及各初始距离,计算所述第一新能源汽车和所述第二新能源汽车的目标距离;
新能源汽车聚类模块,用于获取已存储的密度参数和距离度量标准,并根据所述密度参数和距离度量标准,以及每两辆新能源汽车的目标距离,对各所述新能源汽车进行聚类得到聚类结果,所述聚类结果包括集中新能源汽车集合和分散新能源汽车集合。
可选的,所述数据获取模块包括:
数量判断子模块,用于针对任一新能源汽车,判断该新能源汽车的充电记录数量是否小于预设数量;
第一记录获取子模块,用于在所述数量判断子模块确定该新能源汽车的充电记录数量小于所述预设数量时,获取该新能源汽车所有的充电记录;
第二记录获取子模块,用于在所述数量判断子模块确定该新能源汽车的充电记录数量不小于所述预设数量时,获取该新能源汽车最近所述预设数量次充电记录。
可选的,所述数据获取模块包括:
数据填充子模块,用于针对各充电记录,识别该充电记录中缺失的数据点,并根据该数据点前后第一预设条数的数据,对该数据点进行填充;
数据修正子模块,用于针对各充电记录,识别该充电记录中数据范围异常的数据点,并根据该数据点前后第二预设条数的数据,对该数据点进行修正。
可选的,每条充电记录中至少包括荷电状态,所述各区间端点值包括起始荷电量和对应的终止荷电量;所述数据划分模块包括:
充电段构建子模块,用于获取预设的各起始荷电量和对应的终止荷电量,并构建各起始荷电量和对应的终止荷电量对应的初始充电段;
数据添加子模块,用于针对各充电记录,依次查找荷电状态位于各起始荷电量和对应的终止荷电量范围内的数据,将所查找到的数据添加至对应的初始充电段;
数据填充子模块,用于针对各初始充电段,在该初始充电段所包括的起始荷电状态不等于对应的起始荷电量时,使用预设数据填充从所述起始荷电量至所述起始荷电状态之间的数据;在该初始充电段所包括的终止荷电状态不等于对应的终止荷电量时,使用所述预设数据填充从所述终止荷电状态至所述终止荷电量之间的数据,得到该初始充电段对应的充电段。
可选的,所述构造特征包括:所述充电记录中所包括各特征的均值和方差。
可选的,所述集中新能源汽车集合中包括的新能源汽车为正常新能源汽车,所述分散新能源汽车集合中包括的新能源汽车为异常新能源汽车,所述装置还包括:
检验结果获取模块,用于获取对各所述新能源汽车进行检验的检验结果,所述检验结果包括各新能源汽车正常或异常;
参数调整模块,用于将所述聚类结果和所述检验结果进行对比,当异常新能源汽车的识别错误率大于第一阈值时,减小所述密度参数,当正常新能源汽车的识别错误率大于第二阈值时,增大所述密度参数。
由上述内容可知,本发明实施例提供的一种新能源汽车聚类方法及装置,能够在获取到各新能源汽车的充电记录后,对各充电记录进行划分得到各充电段,如此可以得到充电段数量相等的各充电记录,并且,各充电段的数据量也相等,也就是说,能够得到维度一致的各充电记录;并且,还可以在各充电段中添加构造特征,从而可以增加各充电段的数据维度;进而根据数据维度一致且数据维度较大的各充电段对新能源汽车进行聚类,可以提高新能源汽车聚类的准确性。当然,实施本发明的任一产品或方法并不一定需要同时达到以上所述的所有优点。
本发明实施例的创新点包括:
1、在获取到各新能源汽车的充电记录后,对各充电记录进行划分得到各充电段,如此可以得到充电段数量相等的各充电记录,并且,各充电段的数据量也相等,也就是说,能够得到维度一致的各充电记录;并且,还可以在各充电段中添加构造特征,从而可以增加各充电段的数据维度;进而根据数据维度一致且数据维度较大的各充电记录对新能源汽车进行聚类,可以提高新能源汽车聚类的准确性。
2、对新能源汽车进行聚类后,根据检验结果对聚类结果进行判定,并根据判定结果调整密度参数,当异常新能源汽车的识别错误率较大时,也就是说将较多的异常新能源汽车聚类为正常新能源汽车了,表明当前密度参数值较大,这种情况下,可以减小密度参数;当正常新能源汽车的识别错误率较大时,也就是说将较多的正常新能源汽车聚类为异常新能源汽车了,表明当前密度参数值较小,这种情况下,可以增大密度参数;如此,可以在后续聚类过程中,使用合适的密度参数对新能源汽车进行聚类,从而提高新能源汽车聚类的准确性。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单介绍。显而易见地,下面描述中的附图仅仅是本发明的一些实施例。对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的新能源汽车聚类方法的一种流程示意图;
图2为本发明实施例的新能源汽车聚类结果示意图;
图3为本发明实施例提供的新能源汽车聚类装置的一种结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整的描述。显然,所描述的实施例仅仅是本发明的一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有付出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
需要说明的是,本发明实施例及附图中的术语“包括”和“具有”以及它们的任何变形,意图在于覆盖不排他的包含。例如包含的一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其他步骤或单元。
本发明实施例公开了一种新能源汽车聚类方法及装置,能够提高新能源汽车聚类的准确性。下面对本发明实施例进行详细说明。
图1为本发明实施例提供的新能源汽车聚类方法的一种流程示意图。该方法应用于电子设备。该方法具体包括以下步骤。
S110:获取各新能源汽车最近预设数量次充电记录,并识别各充电记录中的异常数据,对所识别的异常数据进行修正。
在本发明实施例中,可以对需要充电的新能源汽车进行聚类,以确定其中的正常新能源汽车和异常新能源汽车。在实际应用中,各新能源汽车每次进行充电时,充电设备都可以记录到该次充电对应的充电记录,例如,可以记录新能源汽车充电过程中各时刻的荷电状态、电流、电压等信息。在本发明实施例中,可以基于各新能源汽车的充电记录对其进行聚类。
在一种实现方式中,电子设备可以预先通过无线的方式与各充电设备建立连接,从而可以基于所建立的连接获取到各充电设备中存储的各新能源汽车的充电记录。例如,各充电设备可以在记录到一段时间内的充电记录后,将充电记录主动发送至电子设备;或者,电子设备可以向各充电设备发送充电记录获取请求,各充电设备在接收到电子设备发送的充电记录获取请求后,将自身存储的还未发送至电子设备的充电记录发送至电子设备,这都是合理的,本发明实施例不对此做具体限定。其中,上述充电记录获取请求可以是用户通过电子设备发送的,也可以是电子设备周期性发送的,这都是可以的,本发明实施例对此不作具体限定。
上述预设数量可以为用户设定的任意整数。可以理解,当上述预设数量较大时,可以根据较多的充电记录对各新能源汽车进行聚类,从而可以提高聚类的准确性;当上述预设数量较小时,可以使用较少的数据量对各新能源汽车进行聚类,从而可以提高聚类的效率。在实际应用中,用户可以根据实际需求设定上述预设数量,本发明实施例不对其具体取值作限定。
可以理解,在实际应用中各新能源汽车的充电次数可能差别较大,从而会出现部分新能源汽车充电记录较多,部分新能源汽车充电记录较小的情况。也就是说,可能出现部分新能源汽车的充电记录数量大于上述预设数量,部分新能源汽车的充电记录数量小于上述预设数量的情况。
在一种实现方式中,电子设备获取各新能源汽车的充电记录时,可以针对任一新能源汽车,判断该新能源汽车的充电记录数量是否小于预设数量;当该新能源汽车的充电记录数量小于预设数量时,获取该新能源汽车所有的充电记录;当该新能源汽车的充电记录数量不小于预设数量时,获取该新能源汽车最近预设数量次充电记录。如此,可以针对大多数新能源汽车获取到次数相等的充电记录,从而可以准确的对各新能源汽车进行聚类。
在本发明实施例中,充电设备记录的充电记录中,可以包括多种类型的数据,每种类型的数据可能有其对应的正常范围,如电流、电压、温度等。然而,在实际应用中,电子设备获取到的充电记录中可能存在一些异常数据,如范围异常的数据、或缺失的数据等。
在一种实现方式中,电子设备获取到各充电记录后,可以针对各充电记录,识别该充电记录中缺失的数据点,并根据该数据点前后第一预设条数的数据,对该数据点进行填充;并且,可以针对各充电记录,识别该充电记录中数据范围异常的数据点,并根据该数据点前后第二预设条数的数据,对该数据点进行修正。
上述第一预设条数和第二预设条数可以由用户根据实际应用设定,并且,第一预设条数和第二预设条数可以相同或不同,本发明实施例对此不作限定。
对充电记录中缺失的数据点进行填充时,例如,电子设备可以根据该数据点前后第一预设条数的数据,采用时间序列的方法对缺失的数据点进行合理的填充。对充电记录中异常的数据点进行修正时,例如,电子设备可以根据该数据点前后第二预设条数的数据,采用时间序列的方法对该数据点进行预测,并使用预测的数据点替换原数据点。
S120:根据各充电记录中包括的预设特征,以及预设的各区间端点值,对各充电记录进行划分,得到各充电段;其中,各充电记录包括的充电段数量均相等,各充电段包括的数据量均相等。
上述预设特征例如可以包括荷电状态,各区间端点值可以包括起始荷电量和对应的终止荷电量。
在一种实现方式中,电子设备对各充电记录进行划分,得到各充电段时,可以首先获取预设的各起始荷电量和对应的终止荷电量,并构建各起始荷电量和对应的终止荷电量对应的初始充电段;之后针对各充电记录,依次查找荷电状态位于各起始荷电量和对应的终止荷电量范围内的数据,将所查找到的数据添加至对应的初始充电段;最后针对各初始充电段,在该初始充电段所包括的起始荷电状态不等于对应的起始荷电量时,使用预设数据填充从起始荷电量至起始荷电状态之间的数据;在该初始充电段所包括的终止荷电状态不等于对应的终止荷电量时,使用预设数据填充从终止荷电状态至终止荷电量之间的数据,得到该初始充电段对应的充电段。
例如,当任一充电记录中包括的荷电状态为10%-80%,预设的各区间端点值分别为0-20%、20%-40%、40%-60%、60%-80%、80%-100%时,可以首先构建5个初始充电段0-20%、20%-40%、40%-60%、60%-80%、80%-100%;然后将该充电记录中10-20%的荷电状态对应的数据添加至0-20%的初始充电段中,将该充电记录中20-40%的荷电状态对应的数据添加至20-40%的初始充电段中,该充电记录中40-60%的荷电状态对应的数据添加至40-60%的初始充电段中,该充电记录中60-80%的荷电状态对应的数据添加至60-80%的初始充电段中;之后,使用预设数据填充0-20%的初始充电段中0-10%的荷电状态对应的数据,使用预设数据填充80%-100%的初始充电段,得到该充电记录对应的5个充电段。
其中,上述预设数据可以为预先设定的任意数,如0、1等,本发明实施例对此不作限定。
可以看出,由于对各充电记录进行充电段划分,并进行了数据填充,从而每条充电记录所包括的充电段数量均相等,并且,由于每个充电段中包括的数据均为相同荷电状态范围对应的数据,因此每个充电段中包括的数据量也相等。从而,对每条充电记录进行划分后,可以使不同时长的充电记录降维成一致。
S130:针对每个充电段,根据该充电段中包括的每条数据,依次计算各构造特征的值,并将构造特征的值按预设顺序填充至该充电段。
上述构造特征例如可以包括各充电记录中所包括各特征的均值和方差。例如,电子设备可以针对每个充电段,查找其中每个特征的数据,并计算所查找到数据的均值和方差,并将计算得到的均值和方差填充至该充电段中。
通过构造特征,可以依据很少的基本特征构造产生新的特征,将时间维度上的原始数据转换为特征数据,增加充电记录的数据维度。
S140:针对任一第一新能源汽车和第二新能源汽车,确定第一新能源汽车的第一充电记录数量和第二新能源汽车的第二充电记录数量,确定第一充电记录数量和第二充电记录数量中的最小值,在第一新能源汽车和第二新能源汽车的充电记录中,选取最近的最小值次目标充电记录;依次根据第一新能源汽车和第二新能源汽车第i次目标充电记录包括的各充电段,计算第一新能源汽车和第二新能源汽车之间第i次充电记录对应的初始距离,并确定各初始距离的权重,根据权重以及各初始距离,计算第一新能源汽车和第二新能源汽车的目标距离。
得到各充电记录对应的各充电段后,电子设备可以根据各新能源汽车对应的充电记录对各新能源汽车进行聚类。对分段后的充电记录再进行整合,使所有的充电记录在有一致的信息量的同时保留原充电记录中尽可能多的信息,从而可以提高新能源汽车聚类的准确性。其中,上述初始距离可以为欧式距离。
例如,对于任意两辆新能源汽车,假设两辆新能源汽车选取的充电数分别为n1和n2,计算出两辆新能源汽车最近min(n1,n2)次充电一一对应的min(n1,n2)个初始距离,对每个初始距离添加权重并计算两个新能源汽车之间的距离d。
确定各初始距离的权重时,例如,可以依据各充电记录的时间,将越近的充电记录对应的初始距离设定为越大的权重。并且,各初始距离的权重之和为1。确定各初始距离权重后,可以对各初始距离进行加权求和,得到目标距离。
S150:获取已存储的密度参数和距离度量标准,并根据密度参数和距离度量标准,以及每两辆新能源汽车的目标距离,对各新能源汽车进行聚类得到聚类结果,聚类结果包括集中新能源汽车集合和分散新能源汽车集合。
上述密度参数和距离度量标准可以由用户根据实际情况而定,例如,针对不同地区的新能源汽车聚类可以设定不同的密度参数和距离度量标准。如,对于面积较大的地区,可以设定较大的密度参数和距离度量标准;对于面积较小的地区,可以设定较小的密度参数和距离度量标准。
在一种实现方式中,电子设备对各新能源汽车进行聚类时,可以根据这些新能源汽车之间的两两距离用DBSCAN(Density-Based Spatial Clustering of Applicationwith Noise,基于密度的聚类算法)的方式进行聚类。聚类结果中,对于分布较为集中的类别,我们认为此类中的车辆较为相似,大概率为正常类;而对于分布较为分散的类别和无法判定类别的一些异常点,我们认为此类中的车辆与大多数车辆相差较大,极可能为异常车辆。
由上述内容可知,本实施例可以在获取到各新能源汽车的充电记录后,对各充电记录进行划分得到各充电段,如此可以得到充电段数量相等的各充电记录,并且,各充电段的数据量也相等,也就是说,能够得到维度一致的各充电记录;并且,还可以在各充电段中添加构造特征,从而可以增加各充电段的数据维度;进而根据数据维度一致且数据维度较大的各充电记录对新能源汽车进行聚类,可以提高新能源汽车聚类的准确性。
在实际应用中,当密度参数设置不准确时,可能导致新能源汽车聚类结果的准确性较低。作为本发明实施例的一种实施方式,电子设备对各新能源汽车进行聚类得到的集中新能源汽车集合中包括的新能源汽车为正常新能源汽车,分散新能源汽车集合中包括的新能源汽车为异常新能源汽车,电子设备对新能源汽车进行聚类得到聚类结果后,还可以基于聚类结果对密度参数进行调整。
例如,可以通过多种新能源汽车数据预警等方案横向比较,或专家对实车检验等方式验证分类效果,得到各新能源汽车的检验结果,检验结果包括各新能源汽车正常或异常;之后可以将聚类结果和检验结果进行对比,当异常新能源汽车的识别错误率大于第一阈值时,减小密度参数,当正常新能源汽车的识别错误率大于第二阈值时,增大密度参数。
上述第一阈值和第二阈值可以由用户根据实际应用设定,并且,上述第一阈值和第二阈值可以相同或不同,本发明实施例对比不作限定。
对新能源汽车进行聚类后,根据检验结果对聚类结果进行判定,并根据判定结果调整密度参数,当异常新能源汽车的识别错误率较大时,也就是说将较多的异常新能源汽车聚类为正常新能源汽车了,表明当前密度参数值较大,这种情况下,可以减小密度参数;当正常新能源汽车的识别错误率较大时,也就是说将较多的正常新能源汽车聚类为异常新能源汽车了,表明当前密度参数值较小,这种情况下,可以增大密度参数;如此,可以在后续聚类过程中,使用合适的密度参数对新能源汽车进行聚类,从而提高新能源汽车聚类的准确性。
如图2所示,其示出了对新能源汽车进行聚类后的聚类结果示意图,其中,各坐标均表示新能源汽车的位置,正方形表示分布分散和异常点,圆形表示分布集中的点。
如图3所示,其示出了本发明实施例提供一种新能源汽车聚类装置的结构示意图,所述装置包括:
数据获取模块310,用于获取各新能源汽车最近预设数量次充电记录,并识别各充电记录中的异常数据,对所识别的异常数据进行修正;
数据划分模块320,用于根据各所述充电记录中包括的预设特征,以及预设的各区间端点值,对各所述充电记录进行划分,得到各充电段;其中,各所述充电记录包括的充电段数量均相等,各所述充电段包括的数据量均相等;
特征构造模块330,用于针对每个充电段,根据该充电段中包括的每条数据,依次计算各构造特征的值,并将所述构造特征的值按预设顺序填充至该充电段;
距离计算模块340,用于针对任一第一新能源汽车和第二新能源汽车,确定所述第一新能源汽车的第一充电记录数量和所述第二新能源汽车的第二充电记录数量,确定所述第一充电记录数量和所述第二充电记录数量中的最小值,在所述第一新能源汽车和所述第二新能源汽车的充电记录中,选取最近的所述最小值次目标充电记录;依次根据所述第一新能源汽车和所述第二新能源汽车第i次目标充电记录包括的各充电段,计算所述第一新能源汽车和所述第二新能源汽车之间第i次充电记录对应的初始距离,并确定各初始距离的权重,根据所述权重以及各初始距离,计算所述第一新能源汽车和所述第二新能源汽车的目标距离;
新能源汽车聚类模块350,用于获取已存储的密度参数和距离度量标准,并根据所述密度参数和距离度量标准,以及每两辆新能源汽车的目标距离,对各所述新能源汽车进行聚类得到聚类结果,所述聚类结果包括集中新能源汽车集合和分散新能源汽车集合。
可选的,所述数据获取模块310包括:
数量判断子模块,用于针对任一新能源汽车,判断该新能源汽车的充电记录数量是否小于预设数量;
第一记录获取子模块,用于在所述数量判断子模块确定该新能源汽车的充电记录数量小于所述预设数量时,获取该新能源汽车所有的充电记录;
第二记录获取子模块,用于在所述数量判断子模块确定该新能源汽车的充电记录数量不小于所述预设数量时,获取该新能源汽车最近所述预设数量次充电记录。
可选的,所述数据获取模块310包括:
数据填充子模块,用于针对各充电记录,识别该充电记录中缺失的数据点,并根据该数据点前后第一预设条数的数据,对该数据点进行填充;
数据修正子模块,用于针对各充电记录,识别该充电记录中数据范围异常的数据点,并根据该数据点前后第二预设条数的数据,对该数据点进行修正。
可选的,每条充电记录中至少包括荷电状态,所述各区间端点值包括起始荷电量和对应的终止荷电量;所述数据划分模块320包括:
充电段构建子模块,用于获取预设的各起始荷电量和对应的终止荷电量,并构建各起始荷电量和对应的终止荷电量对应的初始充电段;
数据添加子模块,用于针对各充电记录,依次查找荷电状态位于各起始荷电量和对应的终止荷电量范围内的数据,将所查找到的数据添加至对应的初始充电段;
数据填充子模块,用于针对各初始充电段,在该初始充电段所包括的起始荷电状态不等于对应的起始荷电量时,使用预设数据填充从所述起始荷电量至所述起始荷电状态之间的数据;在该初始充电段所包括的终止荷电状态不等于对应的终止荷电量时,使用所述预设数据填充从所述终止荷电状态至所述终止荷电量之间的数据,得到该初始充电段对应的充电段。
可选的,所述构造特征包括:所述充电记录中所包括各特征的均值和方差。
可选的,所述集中新能源汽车集合中包括的新能源汽车为正常新能源汽车,所述分散新能源汽车集合中包括的新能源汽车为异常新能源汽车,所述装置还包括:
检验结果获取模块,用于获取对各所述新能源汽车进行检验的检验结果,所述检验结果包括各新能源汽车正常或异常;
参数调整模块,用于将所述聚类结果和所述检验结果进行对比,当异常新能源汽车的识别错误率大于第一阈值时,减小所述密度参数,当正常新能源汽车的识别错误率大于第二阈值时,增大所述密度参数。
由上述内容可知,本发明实施例提供的一种新能源汽车聚类装置,能够在获取到各新能源汽车的充电记录后,对各充电记录进行划分得到各充电段,如此可以得到充电段数量相等的各充电记录,并且,各充电段的数据量也相等,也就是说,能够得到维度一致的各充电记录;并且,还可以在各充电段中添加构造特征,从而可以增加各充电段的数据维度;进而根据数据维度一致且数据维度较大的各充电记录对新能源汽车进行聚类,可以提高新能源汽车聚类的准确性。
上述装置实施例与方法实施例相对应,与该方法实施例具有同样的技术效果,具体说明参见方法实施例。装置实施例是基于方法实施例得到的,具体的说明可以参见方法实施例部分,此处不再赘述。
本领域普通技术人员可以理解:附图只是一个实施例的示意图,附图中的模块或流程并不一定是实施本发明所必须的。
本领域普通技术人员可以理解:实施例中的装置中的模块可以按照实施例描述分布于实施例的装置中,也可以进行相应变化位于不同于本实施例的一个或多个装置中。上述实施例的模块可以合并为一个模块,也可以进一步拆分成多个子模块。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明实施例技术方案的精神和范围。
Claims (10)
1.一种新能源汽车聚类方法,其特征在于,所述方法包括:
获取各新能源汽车最近预设数量次充电记录,并识别各充电记录中的异常数据,对所识别的异常数据进行修正;
根据各所述充电记录中包括的预设特征,以及预设的各区间端点值,对各所述充电记录进行划分,得到各充电段;其中,各所述充电记录包括的充电段数量均相等,各所述充电段包括的数据量均相等;
针对每个充电段,根据该充电段中包括的每条数据,依次计算各构造特征的值,并将所述构造特征的值按预设顺序填充至该充电段;
针对任一第一新能源汽车和第二新能源汽车,确定所述第一新能源汽车的第一充电记录数量和所述第二新能源汽车的第二充电记录数量,确定所述第一充电记录数量和所述第二充电记录数量中的最小值,在所述第一新能源汽车和所述第二新能源汽车的充电记录中,选取最近的所述最小值次目标充电记录;依次根据所述第一新能源汽车和所述第二新能源汽车第i次目标充电记录包括的各充电段,计算所述第一新能源汽车和所述第二新能源汽车之间第i次充电记录对应的初始距离,并确定各初始距离的权重,根据所述权重以及各初始距离,计算所述第一新能源汽车和所述第二新能源汽车的目标距离;
获取已存储的密度参数和距离度量标准,并根据所述密度参数和距离度量标准,以及每两辆新能源汽车的目标距离,对各所述新能源汽车进行聚类得到聚类结果,所述聚类结果包括集中新能源汽车集合和分散新能源汽车集合。
2.根据权利要求1所述的方法,其特征在于,所述获取各新能源汽车最近预设数量次充电记录的步骤包括:
针对任一新能源汽车,判断该新能源汽车的充电记录数量是否小于预设数量;
当该新能源汽车的充电记录数量小于所述预设数量时,获取该新能源汽车所有的充电记录;
当该新能源汽车的充电记录数量不小于所述预设数量时,获取该新能源汽车最近所述预设数量次充电记录。
3.根据权利要求1所述的方法,其特征在于,所述识别各充电记录中的异常数据,对所识别的异常数据进行修正的步骤包括:
针对各充电记录,识别该充电记录中缺失的数据点,并根据该数据点前后第一预设条数的数据,对该数据点进行填充;
针对各充电记录,识别该充电记录中数据范围异常的数据点,并根据该数据点前后第二预设条数的数据,对该数据点进行修正。
4.根据权利要求1所述的方法,其特征在于,每条充电记录中至少包括荷电状态,所述各区间端点值包括起始荷电量和对应的终止荷电量;所述根据各所述充电记录中包括的预设特征,以及预设的各区间端点值,对各所述充电记录进行划分,得到各充电段的步骤包括:
获取预设的各起始荷电量和对应的终止荷电量,并构建各起始荷电量和对应的终止荷电量对应的初始充电段;
针对各充电记录,依次查找荷电状态位于各起始荷电量和对应的终止荷电量范围内的数据,将所查找到的数据添加至对应的初始充电段;
针对各初始充电段,在该初始充电段所包括的起始荷电状态不等于对应的起始荷电量时,使用预设数据填充从所述起始荷电量至所述起始荷电状态之间的数据;在该初始充电段所包括的终止荷电状态不等于对应的终止荷电量时,使用所述预设数据填充从所述终止荷电状态至所述终止荷电量之间的数据,得到该初始充电段对应的充电段。
5.根据权利要求1-4任一项所述的方法,其特征在于,所述构造特征包括:所述充电记录中所包括各特征的均值和方差。
6.根据权利要求1-4任一项所述的方法,其特征在于,所述集中新能源汽车集合中包括的新能源汽车为正常新能源汽车,所述分散新能源汽车集合中包括的新能源汽车为异常新能源汽车,所述方法还包括:
获取对各所述新能源汽车进行检验的检验结果,所述检验结果包括各新能源汽车正常或异常;
将所述聚类结果和所述检验结果进行对比,当异常新能源汽车的识别错误率大于第一阈值时,减小所述密度参数,当正常新能源汽车的识别错误率大于第二阈值时,增大所述密度参数。
7.一种新能源汽车聚类装置,其特征在于,所述装置包括:
数据获取模块,用于获取各新能源汽车最近预设数量次充电记录,并识别各充电记录中的异常数据,对所识别的异常数据进行修正;
数据划分模块,用于根据各所述充电记录中包括的预设特征,以及预设的各区间端点值,对各所述充电记录进行划分,得到各充电段;其中,各所述充电记录包括的充电段数量均相等,各所述充电段包括的数据量均相等;
特征构造模块,用于针对每个充电段,根据该充电段中包括的每条数据,依次计算各构造特征的值,并将所述构造特征的值按预设顺序填充至该充电段;
距离计算模块,用于针对任一第一新能源汽车和第二新能源汽车,确定所述第一新能源汽车的第一充电记录数量和所述第二新能源汽车的第二充电记录数量,确定所述第一充电记录数量和所述第二充电记录数量中的最小值,在所述第一新能源汽车和所述第二新能源汽车的充电记录中,选取最近的所述最小值次目标充电记录;依次根据所述第一新能源汽车和所述第二新能源汽车第i次目标充电记录包括的各充电段,计算所述第一新能源汽车和所述第二新能源汽车之间第i次充电记录对应的初始距离,并确定各初始距离的权重,根据所述权重以及各初始距离,计算所述第一新能源汽车和所述第二新能源汽车的目标距离;
新能源汽车聚类模块,用于获取已存储的密度参数和距离度量标准,并根据所述密度参数和距离度量标准,以及每两辆新能源汽车的目标距离,对各所述新能源汽车进行聚类得到聚类结果,所述聚类结果包括集中新能源汽车集合和分散新能源汽车集合。
8.根据权利要求7所述的装置,其特征在于,所述数据获取模块包括:
数量判断子模块,用于针对任一新能源汽车,判断该新能源汽车的充电记录数量是否小于预设数量;
第一记录获取子模块,用于在所述数量判断子模块确定该新能源汽车的充电记录数量小于所述预设数量时,获取该新能源汽车所有的充电记录;
第二记录获取子模块,用于在所述数量判断子模块确定该新能源汽车的充电记录数量不小于所述预设数量时,获取该新能源汽车最近所述预设数量次充电记录。
9.根据权利要求7所述的装置,其特征在于,所述数据获取模块包括:
数据填充子模块,用于针对各充电记录,识别该充电记录中缺失的数据点,并根据该数据点前后第一预设条数的数据,对该数据点进行填充;
数据修正子模块,用于针对各充电记录,识别该充电记录中数据范围异常的数据点,并根据该数据点前后第二预设条数的数据,对该数据点进行修正。
10.根据权利要求7所述的装置,其特征在于,每条充电记录中至少包括荷电状态,所述各区间端点值包括起始荷电量和对应的终止荷电量;所述数据划分模块包括:
充电段构建子模块,用于获取预设的各起始荷电量和对应的终止荷电量,并构建各起始荷电量和对应的终止荷电量对应的初始充电段;
数据添加子模块,用于针对各充电记录,依次查找荷电状态位于各起始荷电量和对应的终止荷电量范围内的数据,将所查找到的数据添加至对应的初始充电段;
数据填充子模块,用于针对各初始充电段,在该初始充电段所包括的起始荷电状态不等于对应的起始荷电量时,使用预设数据填充从所述起始荷电量至所述起始荷电状态之间的数据;在该初始充电段所包括的终止荷电状态不等于对应的终止荷电量时,使用所述预设数据填充从所述终止荷电状态至所述终止荷电量之间的数据,得到该初始充电段对应的充电段。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011438210.0A CN114627320A (zh) | 2020-12-11 | 2020-12-11 | 一种新能源汽车聚类方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011438210.0A CN114627320A (zh) | 2020-12-11 | 2020-12-11 | 一种新能源汽车聚类方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114627320A true CN114627320A (zh) | 2022-06-14 |
Family
ID=81896182
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011438210.0A Pending CN114627320A (zh) | 2020-12-11 | 2020-12-11 | 一种新能源汽车聚类方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114627320A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117595464A (zh) * | 2024-01-18 | 2024-02-23 | 深圳创芯技术股份有限公司 | 一种电池充电器充电检测控制方法及系统 |
-
2020
- 2020-12-11 CN CN202011438210.0A patent/CN114627320A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117595464A (zh) * | 2024-01-18 | 2024-02-23 | 深圳创芯技术股份有限公司 | 一种电池充电器充电检测控制方法及系统 |
CN117595464B (zh) * | 2024-01-18 | 2024-04-12 | 深圳创芯技术股份有限公司 | 一种电池充电器充电检测控制方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113049976B (zh) | 一种车辆电池健康状态评估方法及系统 | |
CN109934265B (zh) | 一种常驻地址的确定方法和装置 | |
KR102627949B1 (ko) | 전기차 충전 스테이션을 이용한 배터리 성능관리 시스템 및 방법 | |
CN115982602B (zh) | 一种光伏变压器电故障检测方法 | |
CN109523819B (zh) | 一种基于公交到离站的乘客ic卡数据与站点匹配方法 | |
KR102414819B1 (ko) | 배터리 잔존 가치를 기반으로 한 금융 서비스 방법 및 이러한 방법을 수행하는 장치 | |
CN109495327B (zh) | 一种基于大数据分析的用户活动异常检测和流量预测方法 | |
CN108768695B (zh) | Kqi的问题定位方法及装置 | |
KR20240010078A (ko) | 전기차 충전 스테이션을 이용한 배터리 성능관리 시스템 및 방법 | |
CN117217460A (zh) | 一种巡检方案生成方法、装置、电子设备及存储介质 | |
US11733308B2 (en) | Deterioration state estimation system of secondary battery, deterioration state estimation method of secondary battery, and storage medium | |
CN114627320A (zh) | 一种新能源汽车聚类方法及装置 | |
CN112598199A (zh) | 一种基于决策树算法的监测预警方法 | |
CN115219932A (zh) | 用于评价设备电池组的相对老化状态的方法和装置 | |
CN114879070A (zh) | 一种电池状态评估方法及相关设备 | |
CN112035490B (zh) | 基于云平台的电动车信息监控方法、装置及系统 | |
CN111832599B (zh) | 一种基于机器学习随机森林的加油站预测方法 | |
CN112765726A (zh) | 一种寿命预测方法及装置 | |
CN107517474B (zh) | 一种网络分析优化方法及装置 | |
CN116256651A (zh) | 电池热失能预警方法、系统及可读存储介质 | |
CN110861496B (zh) | 电池soh值调整方法及系统 | |
CN114627321A (zh) | 一种基于充电记录的新能源汽车聚类方法及装置 | |
CN114827951A (zh) | 一种基于车辆终端的车辆网络质量分析方法、系统及存储介质 | |
CN116184223A (zh) | 评估电池荷电状态估算算法准确度的方法及电子设备 | |
CN113742926A (zh) | 一种基于时空聚类的气象观测数据质量控制方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |