CN114627321A - 一种基于充电记录的新能源汽车聚类方法及装置 - Google Patents

一种基于充电记录的新能源汽车聚类方法及装置 Download PDF

Info

Publication number
CN114627321A
CN114627321A CN202011447583.4A CN202011447583A CN114627321A CN 114627321 A CN114627321 A CN 114627321A CN 202011447583 A CN202011447583 A CN 202011447583A CN 114627321 A CN114627321 A CN 114627321A
Authority
CN
China
Prior art keywords
new energy
data
charging
energy automobile
charging record
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011447583.4A
Other languages
English (en)
Inventor
黄绍波
邹婉雪
刘金海
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Shengke Energy Technology Co ltd
Original Assignee
Beijing Shengke Energy Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Shengke Energy Technology Co ltd filed Critical Beijing Shengke Energy Technology Co ltd
Priority to CN202011447583.4A priority Critical patent/CN114627321A/zh
Publication of CN114627321A publication Critical patent/CN114627321A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • GPHYSICS
    • G07CHECKING-DEVICES
    • G07CTIME OR ATTENDANCE REGISTERS; REGISTERING OR INDICATING THE WORKING OF MACHINES; GENERATING RANDOM NUMBERS; VOTING OR LOTTERY APPARATUS; ARRANGEMENTS, SYSTEMS OR APPARATUS FOR CHECKING NOT PROVIDED FOR ELSEWHERE
    • G07C5/00Registering or indicating the working of vehicles
    • G07C5/08Registering or indicating performance data other than driving, working, idle, or waiting time, with or without registering driving, working, idle or waiting time
    • G07C5/0841Registering performance data

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Charge And Discharge Circuits For Batteries Or The Like (AREA)
  • Electric Propulsion And Braking For Vehicles (AREA)

Abstract

本发明实施例公开一种基于充电记录的新能源汽车聚类方法及装置。该方法包括:获取各新能源汽车最近预设数量次充电记录,识别各充电记录中的异常数据,对所识别的异常数据进行修正;确定各新能源汽车第i次充电记录对应的目标数据量,针对每辆新能源汽车的第i次充电记录,得到包括目标数据量条数据的该充电记录;将各充电记录转换成一维向量;针对每两辆新能源汽车,依次计算该两辆新能源汽车之间第i次充电记录对应的初始距离,并计算该两辆新能源汽车的目标距离;根据密度参数和距离度量标准,以及每两辆新能源汽车的目标距离,对各新能源汽车进行聚类。应用本发明实施例提供的方案,能够提高新能源汽车聚类的准确性。

Description

一种基于充电记录的新能源汽车聚类方法及装置
技术领域
本发明涉及信息聚类技术领域,具体而言,涉及一种基于充电记录的新能源汽车聚类方法及装置。
背景技术
聚类是生活中十分重要的一个部分,例如,新能源汽车公司可以对车辆进行聚类,找到可能存在异常的新能源汽车并及时进行处理。
已知的聚类方法,均要求每条数据的信息量,即数据维度一致,且每条数据的特征维度足够大。但是,在针对新能源汽车进行聚类时,由于在不同的充电中存在充电时长、充入电量不固定的问题,从而导致每条数据的数据维度不固定。例如新能源汽车A最近一次充电时间久、充电完整,从20%充到了100%,包含了200条数据纪录;但新能源汽车B最近一次充电时间短,从50%充到了60%,仅包含了50条数据纪录,因此新能源汽车A本次充电包含的信息远多于新能源汽车B的此次充电,这一数据信息不固定使得传统的聚类算法不太适用于新能源汽车充电数据,新能源汽车聚类误差较大。并且,对于每次充电,虽然能收集到很多条数据记录,但每条记录只有电流、电压等基础信息,这种很小的特征维度会导致聚类误差较大。因此,为了提高新能源汽车聚类的准确性,亟需一种新能源汽车聚类方法。
发明内容
本发明提供了一种基于充电记录的新能源汽车聚类方法及装置,以提高新能源汽车聚类的准确性。具体的技术方案如下。
第一方面,本发明实施例提供一种基于充电记录的新能源汽车聚类方法,所述方法包括:
获取各新能源汽车最近预设数量次充电记录,并识别各充电记录中的异常数据,对所识别的异常数据进行修正;
确定各新能源汽车第i次充电记录对应的目标数据量,并针对每辆新能源汽车的第i次充电记录,判断该充电记录中所包括数据的数量是否等于所述目标数据量,在该充电记录中所包括数据的数量不等于所述目标数据量时,对该充电记录中包括的数据进行删减或填充,得到包括所述目标数据量条数据的该充电记录;
将各充电记录转换成一维向量;
针对每两辆新能源汽车,依次根据该两辆新能源汽车第i次充电记录,计算该两辆新能源汽车之间第i次充电记录对应的初始距离,并确定各初始距离的权重,根据所述权重以及各初始距离,计算该两辆新能源汽车的目标距离;
获取已存储的密度参数和距离度量标准,并根据所述密度参数和距离度量标准,以及每两辆新能源汽车的目标距离,对各所述新能源汽车进行聚类得到聚类结果,所述聚类结果包括集中新能源汽车集合和分散新能源汽车集合。
可选的,所述获取各新能源汽车最近预设数量次充电记录的步骤包括:
针对任一新能源汽车,判断该新能源汽车的充电记录数量是否小于预设数量;
当该新能源汽车的充电记录数量小于所述预设数量时,获取该新能源汽车所有的充电记录;
当该新能源汽车的充电记录数量不小于所述预设数量时,获取该新能源汽车最近所述预设数量次充电记录。
可选的,所述识别各充电记录中的异常数据,对所识别的异常数据进行修正的步骤包括:
针对各充电记录,识别该充电记录中缺失的数据点,并根据该数据点前后第一预设条数的数据,对该数据点进行填充;
针对各充电记录,识别该充电记录中数据范围异常的数据点,并根据该数据点前后第二预设条数的数据,对该数据点进行修正。
可选的,所述确定各新能源汽车第i次充电记录对应的目标数据量的步骤包括:
获取预先存储的标准数据量,作为各新能源汽车第i次充电记录对应的目标数据量;或
分别确定各新能源汽车第i次充电记录中所包括数据的数量,并根据所确定的数量计算所述各新能源汽车第i次充电记录对应的目标数据量。
可选的,所述在该充电记录中所包括数据的数量不等于所述目标数据量时,对该充电记录中包括的数据进行删减或填充,得到包括所述目标数据量条数据的该充电记录的步骤包括:
在该充电记录中所包括数据的数量小于所述目标数据量时,采用时间序列预测的方式对该充电记录进行填充,得到包括所述目标数据量条数据的该充电记录;
在该充电记录中所包括数据的数量大于所述目标数据量时,对该充电记录中最早记录的数据进行删减,得到包括所述目标数据量条数据的该充电记录。
可选的,所述集中新能源汽车集合中包括的新能源汽车为正常新能源汽车,所述分散新能源汽车集合中包括的新能源汽车为异常新能源汽车,所述方法还包括:
获取对各所述新能源汽车进行检验的检验结果,所述检验结果包括各新能源汽车正常或异常;
将所述聚类结果和所述检验结果进行对比,当异常新能源汽车的识别错误率大于第一阈值时,减小所述密度参数,当正常新能源汽车的识别错误率大于第二阈值时,增大所述密度参数。
第二方面,本发明实施例提供一种基于充电记录的新能源汽车聚类装置,所述装置包括:
数据获取模块,用于获取各新能源汽车最近预设数量次充电记录,并识别各充电记录中的异常数据,对所识别的异常数据进行修正;
数据处理模块,用于确定各新能源汽车第i次充电记录对应的目标数据量,并针对每辆新能源汽车的第i次充电记录,判断该充电记录中所包括数据的数量是否等于所述目标数据量,在该充电记录中所包括数据的数量不等于所述目标数据量时,对该充电记录中包括的数据进行删减或填充,得到包括所述目标数据量条数据的该充电记录;
维度转换模块,用于将各充电记录转换成一维向量;
距离计算模块,用于针对每两辆新能源汽车,依次根据该两辆新能源汽车第i次充电记录,计算该两辆新能源汽车之间第i次充电记录对应的初始距离,并确定各初始距离的权重,根据所述权重以及各初始距离,计算该两辆新能源汽车的目标距离;
新能源汽车聚类模块,用于获取已存储的密度参数和距离度量标准,并根据所述密度参数和距离度量标准,以及每两辆新能源汽车的目标距离,对各所述新能源汽车进行聚类得到聚类结果,所述聚类结果包括集中新能源汽车集合和分散新能源汽车集合。
可选的,所述数据获取模块包括:
数量判断子模块,用于针对任一新能源汽车,判断该新能源汽车的充电记录数量是否小于预设数量;
第一记录获取子模块,用于在所述数量判断子模块确定该新能源汽车的充电记录数量小于所述预设数量时,获取该新能源汽车所有的充电记录;
第二记录获取子模块,用于在所述数量判断子模块确定该新能源汽车的充电记录数量不小于所述预设数量时,获取该新能源汽车最近所述预设数量次充电记录。
可选的,所述数据获取模块包括:
数据填充子模块,用于针对各充电记录,识别该充电记录中缺失的数据点,并根据该数据点前后第一预设条数的数据,对该数据点进行填充;
数据修正子模块,用于针对各充电记录,识别该充电记录中数据范围异常的数据点,并根据该数据点前后第二预设条数的数据,对该数据点进行修正。
可选的,所述数据处理模块,具体用于:
获取预先存储的标准数据量,作为各新能源汽车第i次充电记录对应的目标数据量;或
分别确定各新能源汽车第i次充电记录中所包括数据的数量,并根据所确定的数量计算所述各新能源汽车第i次充电记录对应的目标数据量。
可选的,所述数据处理模块,具体用于:
在该充电记录中所包括数据的数量小于所述目标数据量时,采用时间序列预测的方式对该充电记录进行填充,得到包括所述目标数据量条数据的该充电记录;
在该充电记录中所包括数据的数量大于所述目标数据量时,对该充电记录中最早记录的数据进行删减,得到包括所述目标数据量条数据的该充电记录。
可选的,所述集中新能源汽车集合中包括的新能源汽车为正常新能源汽车,所述分散新能源汽车集合中包括的新能源汽车为异常新能源汽车,所述装置还包括:
检验结果获取模块,用于获取对各所述新能源汽车进行检验的检验结果,所述检验结果包括各新能源汽车正常或异常;
参数调整模块,用于将所述聚类结果和所述检验结果进行对比,当异常新能源汽车的识别错误率大于第一阈值时,减小所述密度参数,当正常新能源汽车的识别错误率大于第二阈值时,增大所述密度参数。
由上述内容可知,本发明实施例提供的基于充电记录的新能源汽车聚类方法及装置,能够在获取到各新能源汽车相同次数的充电记录后,针对各新能源汽车第i次充电记录,将该次充电记录中包括的数据均更改为相同的数据量,如此可以得到维度一致的各充电记录;并且,还可以将各充电记录转换成一维向量,从而可以增加各充电记录的数据维度;进而根据数据维度一致且数据维度较大的各充电记录对新能源汽车进行聚类,可以提高新能源汽车聚类的准确性。当然,实施本发明的任一产品或方法并不一定需要同时达到以上所述的所有优点。
本发明实施例的创新点包括:
1、在获取到各新能源汽车相同次数的充电记录后,针对各新能源汽车第i次充电记录,将该次充电记录中包括的数据均更改为相同的数据量,如此可以得到维度一致的各充电记录;并且,还可以将各充电记录转换成一维向量,从而可以增加各充电记录的数据维度;进而根据数据维度一致且数据维度较大的各充电记录对新能源汽车进行聚类,可以提高新能源汽车聚类的准确性。
2、对新能源汽车进行聚类后,根据检验结果对聚类结果进行判定,并根据判定结果调整密度参数,当异常新能源汽车的识别错误率较大时,也就是说将较多的异常新能源汽车聚类为正常新能源汽车了,表明当前密度参数值较大,这种情况下,可以减小密度参数;当正常新能源汽车的识别错误率较大时,也就是说将较多的正常新能源汽车聚类为异常新能源汽车了,表明当前密度参数值较小,这种情况下,可以增大密度参数;如此,可以在后续聚类过程中,使用合适的密度参数对新能源汽车进行聚类,从而提高新能源汽车聚类的准确性。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单介绍。显而易见地,下面描述中的附图仅仅是本发明的一些实施例。对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的基于充电记录的新能源汽车聚类方法的一种流程示意图;
图2为本发明实施例的新能源汽车聚类结果示意图;
图3为本发明实施例提供的基于充电记录的新能源汽车聚类装置的一种结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整的描述。显然,所描述的实施例仅仅是本发明的一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有付出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
需要说明的是,本发明实施例及附图中的术语“包括”和“具有”以及它们的任何变形,意图在于覆盖不排他的包含。例如包含的一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其他步骤或单元。
本发明实施例公开了一种基于充电记录的新能源汽车聚类方法及装置,能够提高新能源汽车聚类的准确性。下面对本发明实施例进行详细说明。
图1为本发明实施例提供的基于充电记录的新能源汽车聚类方法的一种流程示意图。该方法应用于电子设备。该方法具体包括以下步骤。
S110:获取各新能源汽车最近预设数量次充电记录,并识别各充电记录中的异常数据,对所识别的异常数据进行修正。
在本发明实施例中,可以对需要充电的新能源汽车进行聚类,以确定其中的正常新能源汽车和异常新能源汽车。在实际应用中,各新能源汽车每次进行充电时,充电设备都可以记录到该次充电对应的充电记录,例如,可以记录新能源汽车充电过程中各时刻的荷电状态、电流、电压等信息。在本发明实施例中,可以基于各新能源汽车的充电记录对其进行聚类。
在一种实现方式中,电子设备可以预先通过无线的方式与各充电设备建立连接,从而可以基于所建立的连接获取到各充电设备中存储的各新能源汽车的充电记录。例如,各充电设备可以在记录到一段时间内的充电记录后,将充电记录主动发送至电子设备;或者,电子设备可以向各充电设备发送充电记录获取请求,各充电设备在接收到电子设备发送的充电记录获取请求后,将自身存储的还未发送至电子设备的充电记录发送至电子设备,这都是合理的,本发明实施例不对此做具体限定。其中,上述充电记录获取请求可以是用户通过电子设备发送的,也可以是电子设备周期性发送的,这都是可以的,本发明实施例对此不作具体限定。
上述预设数量可以为用户设定的任意整数。可以理解,当上述预设数量较大时,可以根据较多的充电记录对各新能源汽车进行聚类,从而可以提高聚类的准确性;当上述预设数量较小时,可以使用较少的数据量对各新能源汽车进行聚类,从而可以提高聚类的效率。在实际应用中,用户可以根据实际需求设定上述预设数量,本发明实施例不对其具体取值作限定。
可以理解,在实际应用中各新能源汽车的充电次数可能差别较大,从而会出现部分新能源汽车充电记录较多,部分新能源汽车充电记录较小的情况。也就是说,可能出现部分新能源汽车的充电记录数量大于上述预设数量,部分新能源汽车的充电记录数量小于上述预设数量的情况。
在一种实现方式中,电子设备获取各新能源汽车的充电记录时,可以针对任一新能源汽车,判断该新能源汽车的充电记录数量是否小于预设数量;当该新能源汽车的充电记录数量小于预设数量时,获取该新能源汽车所有的充电记录;当该新能源汽车的充电记录数量不小于预设数量时,获取该新能源汽车最近预设数量次充电记录。如此,可以针对大多数新能源汽车获取到次数相等的充电记录,从而可以准确的对各新能源汽车进行聚类。
在本发明实施例中,充电设备记录的充电记录中,可以包括多种类型的数据,每种类型的数据可能有其对应的正常范围,如电流、电压、温度等。然而,在实际应用中,电子设备获取到的充电记录中可能存在一些异常数据,如范围异常的数据、或缺失的数据等。
在一种实现方式中,电子设备获取到各充电记录后,可以针对各充电记录,识别该充电记录中缺失的数据点,并根据该数据点前后第一预设条数的数据,对该数据点进行填充;并且,可以针对各充电记录,识别该充电记录中数据范围异常的数据点,并根据该数据点前后第二预设条数的数据,对该数据点进行修正。
上述第一预设条数和第二预设条数可以由用户根据实际应用设定,并且,第一预设条数和第二预设条数可以相同或不同,本发明实施例对此不作限定。
对充电记录中缺失的数据点进行填充时,例如,电子设备可以根据该数据点前后第一预设条数的数据,采用时间序列的方法对缺失的数据点进行合理的填充。对充电记录中异常的数据点进行修正时,例如,电子设备可以根据该数据点前后第一预设条数的数据,采用时间序列的方法对该数据点进行预测,并使用预测的数据点替换原数据点。
在一种实现方式中,对数据维度递增或递减时序变化的特征数据,可以取前后数据的中位数值进行填充;对数据维度无时序变化的特征数据,可以取前后n条数据的均值进行填充,n≥10。
S120:确定各新能源汽车第i次充电记录对应的目标数据量,并针对每辆新能源汽车的第i次充电记录,判断该充电记录中所包括数据的数量是否等于目标数据量,在该充电记录中所包括数据的数量不等于目标数据量时,对该充电记录中包括的数据进行删减或填充,得到包括目标数据量条数据的该充电记录。
在实际应用中,由于各新能源汽车每次充电时长、荷电状态等不同,因此,各新能源汽车每次的充电记录中所包含的数据量也可能不同。在本发明实施例中,为了对新能源汽车进行准确的聚类,可以对各新能源汽车的充电记录进行删减或填充,以得到包含相同数据量的充电记录。
具体的,电子设备可以针对各新能源汽车第i次充电记录,首先确定第i次充电记录对应的目标数据量,进而基于目标数据量对各新能源汽车第i次充电记录进行更改。
在一种实现方式中,电子设备可以预先存储标准数据量,在进行新能源汽车聚类时,获取到获取预先存储的标准数据量,作为各新能源汽车第i次充电记录对应的目标数据量。也就是说,可以将各新能源汽车每次充电记录对应的目标数据量均确定为一致,具体即为存储的目标数据量。
在另一种实现方式中,电子设备可以针对各新能源汽车第i次充电记录,分别确定第i次充电记录对应的目标数据量。也就是说,可以针对不同次数的充电记录,确定不同的目标数据量。例如,电子设备可以分别确定各新能源汽车第i次充电记录中所包括数据的数量,并根据所确定的数量计算各新能源汽车第i次充电记录对应的目标数据量。
如,当存在5辆新能源汽车,各新能源汽车第一次充电记录中所包括数据的数量分别为:50、60、65、70、100时,可以将各数量的均值,也即(50+60+65+70+100)/5=69确定为各新能源汽车第一次充电记录对应的目标数据量。当各新能源汽车均包含100次充电记录时,即可确定出100个目标数据量。其中,各目标数据量可能相等或不等。
需要说明的是,上述示例中新能源汽车数量、各充电记录中包括的数据的数量仅为示例性的,实际应用中,新能源汽车数量可能为几百、几千;数据的数量可能为上千上万条,上述示例不构成对新能源汽车数量、以及充电记录中数据的数量的限定。
确定各新能源汽车第i次充电记录对应的目标数据量后,电子设备可以针对每辆新能源汽车的第i次充电记录,判断该充电记录中所包括数据的数量是否等于对应的目标数据量,在该充电记录中所包括数据的数量不等于目标数据量时,对该充电记录中包括的数据进行删减或填充,得到包括目标数据量条数据的该充电记录。
在一种实现方式中,在该充电记录中所包括数据的数量小于目标数据量时,电子设备可以采用时间序列预测的方式对该充电记录进行填充,得到包括目标数据量条数据的该充电记录;在该充电记录中所包括数据的数量大于目标数据量时,电子设备可以对该充电记录中最早记录的数据进行删减,得到包括目标数据量条数据的该充电记录。
通过确定各新能源汽车第i次充电记录对应的目标数据量,并根据目标数据量对各新能源汽车第i次充电记录中包括的数据进行删减或填充,可以确保各新能源汽车第i次充电记录均包含相同的数据量,从而可以基于各充电记录对新能源汽车进行聚类。
S130:将各充电记录转换成一维向量。
例如,当任一充电记录包含60条数据,每条数据的基础特征个数为m时,各充电记录为60*m的矩阵,电子设备可以将60*m的矩阵转换成1*60m的行向量,如此,可以提高特征维度,也即从m变成60m,进而可以提高新能源汽车聚类的准确性。
S140:针对每两辆新能源汽车,依次根据该两辆新能源汽车第i次充电记录,计算该两辆新能源汽车之间第i次充电记录对应的初始距离,并确定各初始距离的权重,根据权重以及各初始距离,计算该两辆新能源汽车的目标距离。
其中,上述初始距离可以为欧式距离。例如,对于任意两辆新能源汽车,假设两辆新能源汽车选取的充电数分别为n,计算出两辆新能源汽车n次充电一一对应的n个初始距离,对每个初始距离添加权重并计算两个新能源汽车之间的距离d。
确定各初始距离的权重时,例如,可以依据各充电记录的时间,将越近的充电记录对应的初始距离设定为越大的权重。并且,各初始距离的权重之和为1。确定各初始距离权重后,可以对各初始距离进行加权求和,得到目标距离。
S150:获取已存储的密度参数和距离度量标准,并根据密度参数和距离度量标准,以及每两辆新能源汽车的目标距离,对各新能源汽车进行聚类得到聚类结果,聚类结果包括集中新能源汽车集合和分散新能源汽车集合。
上述密度参数和距离度量标准可以由用户根据实际情况而定,例如,针对不同地区的新能源汽车聚类可以设定不同的密度参数和距离度量标准。如,对于面积较大的地区,可以设定较大的密度参数和距离度量标准;对于面积较小的地区,可以设定较小的密度参数和距离度量标准。
在一种实现方式中,电子设备对各新能源汽车进行聚类时,可以根据这些新能源汽车之间的两两距离用DBSCAN(Density-Based Spatial Clustering of Applicationwith Noise,基于密度的聚类算法)的方式进行聚类。聚类结果中,对于分布较为集中的类别,我们认为此类中的车辆较为相似,大概率为正常类;而对于分布较为分散的类别和无法判定类别的一些异常点,我们认为此类中的车辆与大多数车辆相差较大,极可能为异常车辆。
例如,假定基础特征个数为m(是一个针对新能源汽车充电数据的常数),当一次充电记录中,新能源汽车1的充电数据A有100条(对应数据为一个100*m的矩阵),新能源汽车2的充电数据B有80条(对应数据为一个80*m的矩阵),新能源汽车3的充电数据C有60条(对应数据为一个60*m的矩阵),由此看出不同充电的数据维度不一致。选定一个目标数据量n值之后,n是一个待确定的常数,可对时间长的充电进行删减,时间短的充电用时间序列预测的方式进行填充,使得所有的充电数据记录数为n。例如上面的例子中,选取n=80,对于A适当的删减数据记录并保留80条,对于B不进行操作,对于C用时间序列的方法合理对之进行填充使记录条数达到80,这样所有的充电维度都一致为80*m,将此80*m的数据矩阵转换为1*80m的行向量来描述一次充电,这种方法能大大提升特征维度,从m变成80m,从而可以提高新能源汽车聚类的准确性。
由上述内容可知,本实施例可以在获取到各新能源汽车相同次数的充电记录后,针对各新能源汽车第i次充电记录,将该次充电记录中包括的数据均更改为相同的数据量,如此可以得到维度一致的各充电记录;并且,还可以将各充电记录转换成一维向量,从而可以增加各充电记录的数据维度;进而根据数据维度一致且数据维度较大的各充电记录对新能源汽车进行聚类,可以提高新能源汽车聚类的准确性。
在实际应用中,当密度参数设置不准确时,可能导致新能源汽车聚类结果的准确性较低。作为本发明实施例的一种实施方式,电子设备对各新能源汽车进行聚类得到的集中新能源汽车集合中包括的新能源汽车为正常新能源汽车,分散新能源汽车集合中包括的新能源汽车为异常新能源汽车,电子设备对新能源汽车进行聚类得到聚类结果后,还可以基于聚类结果对密度参数进行调整。
例如,可以通过多种新能源汽车数据预警等方案横向比较,或专家对实车检验等方式验证分类效果,得到各新能源汽车的检验结果,检验结果包括各新能源汽车正常或异常;之后可以将聚类结果和检验结果进行对比,当异常新能源汽车的识别错误率大于第一阈值时,减小密度参数,当正常新能源汽车的识别错误率大于第二阈值时,增大密度参数。
上述第一阈值和第二阈值可以由用户根据实际应用设定,并且,上述第一阈值和第二阈值可以相同或不同,本发明实施例对比不作限定。
对新能源汽车进行聚类后,根据检验结果对聚类结果进行判定,并根据判定结果调整密度参数,当异常新能源汽车的识别错误率较大时,也就是说将较多的异常新能源汽车聚类为正常新能源汽车了,表明当前密度参数值较大,这种情况下,可以减小密度参数;当正常新能源汽车的识别错误率较大时,也就是说将较多的正常新能源汽车聚类为异常新能源汽车了,表明当前密度参数值较小,这种情况下,可以增大密度参数;如此,可以在后续聚类过程中,使用合适的密度参数对新能源汽车进行聚类,从而提高新能源汽车聚类的准确性。
如图2所示,其示出了对新能源汽车进行聚类后的聚类结果示意图,其中,各坐标均表示新能源汽车的位置,正方形表示分布分散和异常点,圆形表示分布集中的点。
如图3所示,其示出了本发明实施例提供一种新能源汽车聚类装置的结构示意图,所述装置包括:
数据获取模块310,用于获取各新能源汽车最近预设数量次充电记录,并识别各充电记录中的异常数据,对所识别的异常数据进行修正;
数据处理模块320,用于确定各新能源汽车第i次充电记录对应的目标数据量,并针对每辆新能源汽车的第i次充电记录,判断该充电记录中所包括数据的数量是否等于所述目标数据量,在该充电记录中所包括数据的数量不等于所述目标数据量时,对该充电记录中包括的数据进行删减或填充,得到包括所述目标数据量条数据的该充电记录;
维度转换模块330,用于将各充电记录转换成一维向量;
距离计算模块340,用于针对每两辆新能源汽车,依次根据该两辆新能源汽车第i次充电记录,计算该两辆新能源汽车之间第i次充电记录对应的初始距离,并确定各初始距离的权重,根据所述权重以及各初始距离,计算该两辆新能源汽车的目标距离;
新能源汽车聚类模块350,用于获取已存储的密度参数和距离度量标准,并根据所述密度参数和距离度量标准,以及每两辆新能源汽车的目标距离,对各所述新能源汽车进行聚类得到聚类结果,所述聚类结果包括集中新能源汽车集合和分散新能源汽车集合。
可选的,所述数据获取模块310包括:
数量判断子模块,用于针对任一新能源汽车,判断该新能源汽车的充电记录数量是否小于预设数量;
第一记录获取子模块,用于在所述数量判断子模块确定该新能源汽车的充电记录数量小于所述预设数量时,获取该新能源汽车所有的充电记录;
第二记录获取子模块,用于在所述数量判断子模块确定该新能源汽车的充电记录数量不小于所述预设数量时,获取该新能源汽车最近所述预设数量次充电记录。
可选的,所述数据获取模块310包括:
数据填充子模块,用于针对各充电记录,识别该充电记录中缺失的数据点,并根据该数据点前后第一预设条数的数据,对该数据点进行填充;
数据修正子模块,用于针对各充电记录,识别该充电记录中数据范围异常的数据点,并根据该数据点前后第二预设条数的数据,对该数据点进行修正。
可选的,所述数据处理模块320,具体用于:
获取预先存储的标准数据量,作为各新能源汽车第i次充电记录对应的目标数据量;或
分别确定各新能源汽车第i次充电记录中所包括数据的数量,并根据所确定的数量计算所述各新能源汽车第i次充电记录对应的目标数据量。
可选的,所述数据处理模块320,具体用于:
在该充电记录中所包括数据的数量小于所述目标数据量时,采用时间序列预测的方式对该充电记录进行填充,得到包括所述目标数据量条数据的该充电记录;
在该充电记录中所包括数据的数量大于所述目标数据量时,对该充电记录中最早记录的数据进行删减,得到包括所述目标数据量条数据的该充电记录。
可选的,所述集中新能源汽车集合中包括的新能源汽车为正常新能源汽车,所述分散新能源汽车集合中包括的新能源汽车为异常新能源汽车,所述装置还包括:
检验结果获取模块,用于获取对各所述新能源汽车进行检验的检验结果,所述检验结果包括各新能源汽车正常或异常;
参数调整模块,用于将所述聚类结果和所述检验结果进行对比,当异常新能源汽车的识别错误率大于第一阈值时,减小所述密度参数,当正常新能源汽车的识别错误率大于第二阈值时,增大所述密度参数。
由上述内容可知,本实施例可以在获取到各新能源汽车相同次数的充电记录后,针对各新能源汽车第i次充电记录,将该次充电记录中包括的数据均更改为相同的数据量,如此可以得到维度一致的各充电记录;并且,还可以将各充电记录转换成一维向量,从而可以增加各充电记录的数据维度;进而根据数据维度一致且数据维度较大的各充电记录对新能源汽车进行聚类,可以提高新能源汽车聚类的准确性。
上述装置实施例与方法实施例相对应,与该方法实施例具有同样的技术效果,具体说明参见方法实施例。装置实施例是基于方法实施例得到的,具体的说明可以参见方法实施例部分,此处不再赘述。
本领域普通技术人员可以理解:附图只是一个实施例的示意图,附图中的模块或流程并不一定是实施本发明所必须的。
本领域普通技术人员可以理解:实施例中的装置中的模块可以按照实施例描述分布于实施例的装置中,也可以进行相应变化位于不同于本实施例的一个或多个装置中。上述实施例的模块可以合并为一个模块,也可以进一步拆分成多个子模块。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明实施例技术方案的精神和范围。

Claims (10)

1.一种基于充电记录的新能源汽车聚类方法,其特征在于,所述方法包括:
获取各新能源汽车最近预设数量次充电记录,并识别各充电记录中的异常数据,对所识别的异常数据进行修正;
确定各新能源汽车第i次充电记录对应的目标数据量,并针对每辆新能源汽车的第i次充电记录,判断该充电记录中所包括数据的数量是否等于所述目标数据量,在该充电记录中所包括数据的数量不等于所述目标数据量时,对该充电记录中包括的数据进行删减或填充,得到包括所述目标数据量条数据的该充电记录;
将各充电记录转换成一维向量;
针对每两辆新能源汽车,依次根据该两辆新能源汽车第i次充电记录,计算该两辆新能源汽车之间第i次充电记录对应的初始距离,并确定各初始距离的权重,根据所述权重以及各初始距离,计算该两辆新能源汽车的目标距离;
获取已存储的密度参数和距离度量标准,并根据所述密度参数和距离度量标准,以及每两辆新能源汽车的目标距离,对各所述新能源汽车进行聚类得到聚类结果,所述聚类结果包括集中新能源汽车集合和分散新能源汽车集合。
2.根据权利要求1所述的方法,其特征在于,所述获取各新能源汽车最近预设数量次充电记录的步骤包括:
针对任一新能源汽车,判断该新能源汽车的充电记录数量是否小于预设数量;
当该新能源汽车的充电记录数量小于所述预设数量时,获取该新能源汽车所有的充电记录;
当该新能源汽车的充电记录数量不小于所述预设数量时,获取该新能源汽车最近所述预设数量次充电记录。
3.根据权利要求1所述的方法,其特征在于,所述识别各充电记录中的异常数据,对所识别的异常数据进行修正的步骤包括:
针对各充电记录,识别该充电记录中缺失的数据点,并根据该数据点前后第一预设条数的数据,对该数据点进行填充;
针对各充电记录,识别该充电记录中数据范围异常的数据点,并根据该数据点前后第二预设条数的数据,对该数据点进行修正。
4.根据权利要求1所述的方法,其特征在于,所述确定各新能源汽车第i次充电记录对应的目标数据量的步骤包括:
获取预先存储的标准数据量,作为各新能源汽车第i次充电记录对应的目标数据量;或
分别确定各新能源汽车第i次充电记录中所包括数据的数量,并根据所确定的数量计算所述各新能源汽车第i次充电记录对应的目标数据量。
5.根据权利要求1-4任一项所述的方法,其特征在于,所述在该充电记录中所包括数据的数量不等于所述目标数据量时,对该充电记录中包括的数据进行删减或填充,得到包括所述目标数据量条数据的该充电记录的步骤包括:
在该充电记录中所包括数据的数量小于所述目标数据量时,采用时间序列预测的方式对该充电记录进行填充,得到包括所述目标数据量条数据的该充电记录;
在该充电记录中所包括数据的数量大于所述目标数据量时,对该充电记录中最早记录的数据进行删减,得到包括所述目标数据量条数据的该充电记录。
6.根据权利要求1-4任一项所述的方法,其特征在于,所述集中新能源汽车集合中包括的新能源汽车为正常新能源汽车,所述分散新能源汽车集合中包括的新能源汽车为异常新能源汽车,所述方法还包括:
获取对各所述新能源汽车进行检验的检验结果,所述检验结果包括各新能源汽车正常或异常;
将所述聚类结果和所述检验结果进行对比,当异常新能源汽车的识别错误率大于第一阈值时,减小所述密度参数,当正常新能源汽车的识别错误率大于第二阈值时,增大所述密度参数。
7.一种基于充电记录的新能源汽车聚类装置,其特征在于,所述装置包括:
数据获取模块,用于获取各新能源汽车最近预设数量次充电记录,并识别各充电记录中的异常数据,对所识别的异常数据进行修正;
数据处理模块,用于确定各新能源汽车第i次充电记录对应的目标数据量,并针对每辆新能源汽车的第i次充电记录,判断该充电记录中所包括数据的数量是否等于所述目标数据量,在该充电记录中所包括数据的数量不等于所述目标数据量时,对该充电记录中包括的数据进行删减或填充,得到包括所述目标数据量条数据的该充电记录;
维度转换模块,用于将各充电记录转换成一维向量;
距离计算模块,用于针对每两辆新能源汽车,依次根据该两辆新能源汽车第i次充电记录,计算该两辆新能源汽车之间第i次充电记录对应的初始距离,并确定各初始距离的权重,根据所述权重以及各初始距离,计算该两辆新能源汽车的目标距离;
新能源汽车聚类模块,用于获取已存储的密度参数和距离度量标准,并根据所述密度参数和距离度量标准,以及每两辆新能源汽车的目标距离,对各所述新能源汽车进行聚类得到聚类结果,所述聚类结果包括集中新能源汽车集合和分散新能源汽车集合。
8.根据权利要求7所述的装置,其特征在于,所述数据获取模块包括:
数量判断子模块,用于针对任一新能源汽车,判断该新能源汽车的充电记录数量是否小于预设数量;
第一记录获取子模块,用于在所述数量判断子模块确定该新能源汽车的充电记录数量小于所述预设数量时,获取该新能源汽车所有的充电记录;
第二记录获取子模块,用于在所述数量判断子模块确定该新能源汽车的充电记录数量不小于所述预设数量时,获取该新能源汽车最近所述预设数量次充电记录。
9.根据权利要求7所述的装置,其特征在于,所述数据获取模块包括:
数据填充子模块,用于针对各充电记录,识别该充电记录中缺失的数据点,并根据该数据点前后第一预设条数的数据,对该数据点进行填充;
数据修正子模块,用于针对各充电记录,识别该充电记录中数据范围异常的数据点,并根据该数据点前后第二预设条数的数据,对该数据点进行修正。
10.根据权利要求7所述的装置,其特征在于,所述数据处理模块,具体用于:
获取预先存储的标准数据量,作为各新能源汽车第i次充电记录对应的目标数据量;或
分别确定各新能源汽车第i次充电记录中所包括数据的数量,并根据所确定的数量计算所述各新能源汽车第i次充电记录对应的目标数据量。
CN202011447583.4A 2020-12-11 2020-12-11 一种基于充电记录的新能源汽车聚类方法及装置 Pending CN114627321A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011447583.4A CN114627321A (zh) 2020-12-11 2020-12-11 一种基于充电记录的新能源汽车聚类方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011447583.4A CN114627321A (zh) 2020-12-11 2020-12-11 一种基于充电记录的新能源汽车聚类方法及装置

Publications (1)

Publication Number Publication Date
CN114627321A true CN114627321A (zh) 2022-06-14

Family

ID=81896007

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011447583.4A Pending CN114627321A (zh) 2020-12-11 2020-12-11 一种基于充电记录的新能源汽车聚类方法及装置

Country Status (1)

Country Link
CN (1) CN114627321A (zh)

Similar Documents

Publication Publication Date Title
CN107037370B (zh) 基于监控数据的电动汽车剩余电量计算方法
CN110929934A (zh) 设备故障预测方法、装置、计算机设备和存储介质
CN111784068A (zh) 基于eemd的电力负荷组合预测方法及装置
CN113728242A (zh) 对可充电电池中的析锂进行表征
CN115257457A (zh) 车辆电池单体一致性评估方法、装置、设备及存储介质
CN116643178B (zh) 一种电池管理系统的soc估算方法及相关装置
CN111325402A (zh) 基于bp神经网络的电动汽车用户充电行为的预测方法
CN111044927B (zh) 一种动力电池寿命评价方法及系统
CN116381514A (zh) 一种电芯压差预警方法、装置、存储介质及设备
CN113178024A (zh) 基于人工智能的融合型车载智能存储系统及方法
CN113406496B (zh) 基于模型迁移的电池容量预测方法、系统、装置及介质
CN114924203A (zh) 一种电池soh预测分析方法及电动汽车
CN112748348B (zh) 电池低温性能分布水平检测方法、系统及存储介质
CN114627321A (zh) 一种基于充电记录的新能源汽车聚类方法及装置
CN114627320A (zh) 一种新能源汽车聚类方法及装置
CN116127604B (zh) 一种汽车防撞数据处理方法及系统
US20230033057A1 (en) Method, Apparatus and Computer Program Product for Estimating the Service Life of Battery Storage Systems
CN110861496B (zh) 电池soh值调整方法及系统
CN115219932A (zh) 用于评价设备电池组的相对老化状态的方法和装置
CN113281656B (zh) 电池健康度的确定方法和装置
US11460514B2 (en) Battery degradation evaluation system, battery degradation evaluation method, and non-transitory storage medium storing battery degradation evaluation program
CN115221218A (zh) 车辆数据的质量评估方法、装置、计算机设备和存储介质
CN114879070A (zh) 一种电池状态评估方法及相关设备
CN113742926A (zh) 一种基于时空聚类的气象观测数据质量控制方法
CN113119796A (zh) 基于云端稀疏充电数据的电动车剩余充电时间预测方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination