CN116662629A - 基于时序聚类的充电曲线检索方法、系统、装置和介质 - Google Patents
基于时序聚类的充电曲线检索方法、系统、装置和介质 Download PDFInfo
- Publication number
- CN116662629A CN116662629A CN202310963185.5A CN202310963185A CN116662629A CN 116662629 A CN116662629 A CN 116662629A CN 202310963185 A CN202310963185 A CN 202310963185A CN 116662629 A CN116662629 A CN 116662629A
- Authority
- CN
- China
- Prior art keywords
- charging curve
- curve
- charging
- clustering
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 55
- 238000007781 pre-processing Methods 0.000 claims abstract description 32
- 238000004590 computer program Methods 0.000 claims description 18
- 230000008569 process Effects 0.000 claims description 14
- 239000011159 matrix material Substances 0.000 claims description 13
- 238000000926 separation method Methods 0.000 claims description 9
- 238000003860 storage Methods 0.000 claims description 9
- 230000004044 response Effects 0.000 claims description 4
- 238000004364 calculation method Methods 0.000 abstract description 15
- 238000010586 diagram Methods 0.000 description 13
- 238000004422 calculation algorithm Methods 0.000 description 8
- 230000000694 effects Effects 0.000 description 6
- 230000008901 benefit Effects 0.000 description 4
- 238000010606 normalization Methods 0.000 description 4
- 238000012935 Averaging Methods 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 230000002123 temporal effect Effects 0.000 description 3
- 230000002776 aggregation Effects 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 238000007405 data analysis Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 230000001360 synchronised effect Effects 0.000 description 2
- 101100481876 Danio rerio pbk gene Proteins 0.000 description 1
- 101100481878 Mus musculus Pbk gene Proteins 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000005429 filling process Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/907—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/909—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using geographical or spatial information, e.g. location
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/906—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/10—Pre-processing; Data cleansing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02T—CLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
- Y02T10/00—Road transport of goods or passengers
- Y02T10/60—Other road transportation technologies with climate change mitigation effect
- Y02T10/70—Energy storage systems for electromobility, e.g. batteries
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Library & Information Science (AREA)
- Probability & Statistics with Applications (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请涉及一种基于时序聚类的充电曲线检索方法,其中,该方法包括对充电曲线数据进行数据预处理,得到预处理后的充电曲线数据;对预处理后的充电曲线数据进行聚类处理,得到不同类别的目标充电曲线簇;确定实时充电曲线与不同目标充电曲线簇的相似度,基于相似度得到目标充电曲线。解决了基于输入的充电功率曲线,如何快速检索到与其最相似的目标充电功率曲线的问题,能够大幅减少检索目标充电功率曲线的计算量,提高检索效率,实现实时计算。
Description
技术领域
本申请涉及充电功率曲线技术领域,特别是涉及基于时序聚类的充电曲线检索方法、系统、装置和介质。
背景技术
随着新能源的不断发展,电车已经成为了重要的城市交通工具,电车包括电动汽车和两轮电动车等,越来越多电车通过充电桩进行充电,一次充电过程是由充电功率值组成的时序数据。如何基于输入的充电功率曲线,快速检索到最相似的目标充电功率曲线,从而对目标充电功率曲线进行大数据分析是一个重要的技术问题。
现有技术,通过构建全量的时序数据集,定义好距离度量函数,输入一条充电功率曲线,对全量时序数据集进行笛卡尔积计算距离,再将计算好的距离进行从高到低排序,选择Top K条曲线输入,并对得到的TopK条曲线进行大数据分析,描述详细曲线的信息。然而,该技术方案进行笛卡尔积的距离计算,如果需要检索的充电时序数据集数量庞大,则检索消耗大量的计算资源,导致检索效率较低,难以进行实时计算。
目前针对相关技术中,基于输入的充电功率曲线,如何快速检索到与其最相似的目标充电功率曲线的问题,尚未提出有效的解决方案。
发明内容
本申请实施例提供了一种基于时序聚类的充电曲线检索方法、系统、装置和介质,以至少解决相关技术中,基于输入的充电功率曲线,如何快速检索到与其最相似的目标充电功率曲线的问题。
第一方面,本申请实施例提供了一种基于时序聚类的充电曲线检索方法,所述方法包括:
对充电曲线数据进行数据预处理,得到预处理后的所述充电曲线数据;
对所述预处理后的充电曲线数据进行聚类处理,得到不同类别的目标充电曲线簇;
确定所述实时充电曲线与不同所述目标充电曲线簇的相似度,基于所述相似度得到目标充电曲线。
在其中一些实施例中,所述确定所述实时充电曲线与不同所述目标充电曲线簇的相似度,基于所述相似度得到目标充电曲线,包括:
对所述实时充电曲线进行数据预处理,得到预处理后的实时充电曲线;
获取所述目标充电曲线簇的中心曲线,确定所述中心曲线与所述预处理后的实时充电曲线的相似度;
选取所述相似度最高的所述簇中心曲线,作为目标充电曲线。
在其中一些实施例中,对所述预处理后的充电曲线数据进行聚类处理,得到不同类别的目标充电曲线簇,包括:
根据预处理后的所述充电曲线确定第一聚类中心;
获取每个所述充电曲线到所述第一聚类中心的第一距离,根据所述第一距离构建第一距离矩阵;
基于所述第一距离矩阵确定第二聚类中心;
将所述第二聚类中心作为第一聚类中心迭代地获取所述第一聚类中心和所述第二聚类中心;
响应于满足预设迭代条件或所述第二聚类中心与所述第一聚类中心的位置差异小于预设值,得到所述不同类别的充电曲线簇。
在其中一些实施例中,在进行所述聚类处理之后,所述得到不同类别的目标充电曲线簇包括:
获取当前确定的每个所述充电曲线簇中不同所述充电曲线之间的第一平均距离,以及所述充电曲线簇中充电曲线到其他所述充电曲线簇的第二平均距离;
基于所述第一平均距离和所述第二平均距离确定内聚度参数和分离度参数;
基于所述内聚度参数和所述分离度参数,将当前确定的所述充电曲线簇确定为所述目标充电曲线簇。
在其中一些实施例中,对充电曲线数据进行数据预处理包括:
去除所述充电曲线数据集中充电曲线的噪声点;和/或
对所述充电曲线数据中的功率值进行归一化处理;和/或
对所述充电曲线数据缺失值进行填充。
在其中一些实施例中,对所述充电曲线数据缺失值进行填充包括:
确定所述充电曲线中的缺失数据的目标时刻;
基于所述目标时刻的相邻时刻的数据,对所述目标时刻的数据进行填充。
在其中一些实施例中,在对充电曲线数据集进行预处理之前,所述方法还包括:
采集电车充电过程中的充电数据;
根据所述充电数据获取所述充电曲线。
第二方面,本申请实施例提供了一种基于时序聚类的充电曲线检索系统,所述系统包括预处理模块、聚类模块和检索模块;其中,
所述预处理模块,用于对充电曲线数据集进行预处理,得到预处理后的所述充电曲线数据集; 所述聚类模块,用于对所述预处理后的充电曲线数据进行聚类处理,得到不同类别的目标充电曲线簇;
所述检索模块,用于确定所述实时充电曲线与不同所述目标充电曲线簇的相似度,基于所述相似度得到目标充电曲线。
第三方面,本申请实施例提供了一种电子装置,包括显示组件、存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述显示组件用于显示所述处理器运行结果,所述处理器执行所述计算机程序时实现如上述第一方面所述的一种基于时序聚类的充电曲线检索方法。
第四方面,本申请实施例提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上述第一方面所述的基于时序聚类的充电曲线检索方法。
相比于相关技术,本申请实施例提供的一种基于时序聚类的充电曲线检索方法,通过对充电曲线数据集进行预处理,得到预处理后的所述充电曲线数据集,对所述预处理后的充电曲线数据集进行聚类,得到聚类结果,在所述聚类结果中检索与实时充电曲线相似的目标充电曲线,得到目标充电曲线。解决了基于输入的充电功率曲线,如何快速检索到与其最相似的目标充电功率曲线的问题,能够大幅减少检索目标充电功率曲线的计算量,提高检索效率,实现实时计算。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1是根据本申请实施例的基于时序聚类的充电曲线检索方法的步骤流程图;
图2是根据本申请实施例中单条充电功率曲线示意图;
图3是根据本申实施例中聚类结果的示意图;
图4是根据本申请实施例中步骤S106的流程图;
图5是根据本申请实施例的基于时序聚类的充电曲线检索系统的结构框图;
图6是根据本申请实施例中的目标充电曲线信息示意图;
图7是根据本申请实施例的电子设备的内部结构示意图。
附图标识:51、预处理模块;52、聚类模块;53、检索模块。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行描述和说明。应当理解,此处所描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。基于本申请提供的实施例,本领域普通技术人员在没有作出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。
显而易见地,下面描述中的附图仅仅是本申请的一些示例或实施例,对于本领域的普通技术人员而言,在不付出创造性劳动的前提下,还可以根据这些附图将本申请应用于其他类似情景。此外,还可以理解的是,虽然这种开发过程中所作出的努力可能是复杂并且冗长的,然而对于与本申请公开的内容相关的本领域的普通技术人员而言,在本申请揭露的技术内容的基础上进行的一些设计,制造或者生产等变更只是常规的技术手段,不应当理解为本申请公开的内容不充分。
在本申请中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域普通技术人员显式地和隐式地理解的是,本申请所描述的实施例在不冲突的情况下,可以与其它实施例相结合。
除非另作定义,本申请所涉及的技术术语或者科学术语应当为本申请所属技术领域内具有一般技能的人士所理解的通常意义。本申请所涉及的“一”、“一个”、“一种”、“该”等类似词语并不表示数量限制,可表示单数或复数。本申请所涉及的术语“包括”、“包含”、“具有”以及它们任何变形,意图在于覆盖不排他的包含;例如包含了一系列步骤或模块(单元)的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可以还包括没有列出的步骤或单元,或可以还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。本申请所涉及的“连接”、“相连”、“耦接”等类似的词语并非限定于物理的或者机械的连接,而是可以包括电气的连接,不管是直接的还是间接的。本申请所涉及的“多个”是指两个或两个以上。“和/或”描述关联对象的关联关系,表示可以存在三种关系,例如,“A和/或B”可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。本申请所涉及的术语“第一”、“第二”、“第三”等仅仅是区别类似的对象,不代表针对对象的特定排序。
实施例1
本申请实施例提供了一种基于时序聚类的充电曲线检索方法,图1是根据本申请实施例的基于时序聚类的充电曲线检索方法的步骤流程图,如图1所示,该方法包括以下步骤:
步骤S102,对充电曲线数据进行数据预处理,得到预处理后的充电曲线数据;
步骤S104,对预处理后的充电曲线数据进行聚类处理,得到不同类别的目标充电曲线簇;
步骤S106,确定实时充电曲线与不同目标充电曲线簇的相似度,基于相似度得到目标充电曲线。
通过本申请实施例中的步骤S102至步骤S106,通过输入充电功率曲线,能够快速检索到与其最相似的目标充电功率曲线。采用这样的方式,大幅减少检索目标充电功率曲线的计算量,提高检索效率,实现实时计算,解决了现有技术中的缺陷。
在其中一些实施例中,在对步骤S102对充电曲线数据进行预处理之前,基于时序聚类的充电曲线检索方法包括:
采集电车充电过程中的充电数据。
根据充电数据获取充电曲线。
可选地,充电桩提供充电电源给电车进行充电,其中,电车包括但不限于二轮电动车、电动汽车。采集充电过程中的功率数据,一次完整的充电过程包含了3个阶段:恒流阶段、恒压阶段和涓流阶段。其中,恒流阶段功率较为稳定,该阶段充电电量最多。恒压阶段功率逐渐减小,恒压阶段结束电动车基本充满。涓流阶段功率较小,持续一段时间后结束。图2是根据本申请实施例中单条充电功率曲线示意图,如图2所示,3个阶段的功率值形成了一条充电功率曲线,图2中的横坐标表示时间,纵坐标表示功率值,充电功率曲线表示从09点16分45秒到15点19分25秒的充电功率变化以及每一个时刻的所对应的功率值。收集若干个充电曲线,得到时间序列充电曲线数据集。
在其中一些实施例中,步骤S102,对充电曲线数据进行数据预处理,得到预处理后的充电曲线数据包括:去噪处理、和/或归一化处理,和/或填充处理。
其中,去噪处理包括:去除充电曲线数据集中充电曲线的噪声点,其中,充电曲线数据集为时间序列充电曲线数据集。
具体地,充电过程中的时间序列充电曲线,包含了较多噪声点。比如,刚开始进行充电时,充电的功率值非常小,不是恒流阶段的功率,这部分噪声点需要过滤。通过去除充电曲线数据集中充电曲线的噪声点,保留了时间序列充电曲线最核心、最能够反映充电本质的曲线。
归一化处理包括:对充电曲线的功率值进行归一化。
具体地,充电曲线的功率值绝对值较大,直接进行聚类效果较差。对功率值进行归一化处理,能够有效提高聚类效果。现有技术中最常见的归一化方式是min-max处理,这种方式忽略了绝对值的大小。本申请实施例中直接固定了max值进行归一化,,/>为原始的充电功率值,/>为归一化后的功率值。通过直接固定了max值进行归一化,减少了绝对值的大小,有利于提高聚类效果。
填充处理包括:确定充电曲线中的缺失数据的目标时刻;基于目标时刻的相邻时刻的数据,对目标时刻的数据进行填充。
具体地,当采集充电曲线数据时,存在充电曲线数据特征值缺失的情况,此时,对数据特征缺失值进行填补,按时间序列进行前向填充和后向填充,前向填充即t时刻存在数据缺失,则采用t+1时刻数据进行填补,后向填充即t时刻数据填充t+1时刻缺失的数据。通过对充电曲线数据缺失值进行填充,使得充电曲线完整,利于后续对充电曲线进行聚类。
在其中一些实施例中,图3是根据本申实施例中聚类结果的示意图,如图3所示,步骤S104,对预处理后的充电曲线数据进行聚类处理,得到不同类别的目标充电曲线簇包括:
根据预处理后的所述充电曲线确定第一聚类中心;
获取每个所述充电曲线到所述第一聚类中心的第一距离,根据所述第一距离构建第一距离矩阵;
基于所述第一距离矩阵确定第二聚类中心;
将所述第二聚类中心作为第一聚类中心迭代地获取所述第一聚类中心和所述第二聚类中心;
响应于满足预设迭代条件或所述第二聚类中心与所述第一聚类中心的位置差异小于预设值,得到所述不同类别的充电曲线簇。
具体地,对充电曲线进行聚类,即针对预处理后的充电曲线数据集,通过无监督的方法将D划分为/>个簇/>,其中/>为1个聚类,包含了多条充电曲线,且相互聚类簇之间互不相交/>,/> 。
从所述预处理后的充电曲线数据集中,随机选择k个序列充电曲线作为第一聚类中心,其中,所述充电曲线数据集包括若干个序列充电曲线;
对于每个数据点(序列),使用Soft-DTW距离算法将序列充电曲线与每个第一聚类中心间的距离计算出来,得到第一距离矩阵,计算公式如下:式中,/>为两个长度分为/>和/>的标准矩阵集,即/>为一条路径。/>为这条路径下的代价和,/>为两个序列的代价矩阵(Cost Matrix)。/>为常数,实验中值为0.01。用Soft-DTW-k-means算法从第一距离矩阵中选择新的聚类中心。将每个序列充电曲线归类到距离最近的聚类中心,即得到每个簇/>包含了充电曲线集合;
对于每个聚类中心,使用Soft-DTW Barycenter Averaging平均序列算法将每个簇包含了序列充电曲线进行平均,得到一个新的代表性序列(第二聚类中心)。平均序列Ti为:式中,/>是新序列集合/>的第/>个序列。
将第二聚类中心作为第一聚类中心迭代地获取第一聚类中心和第二聚类中心,直到第一聚类中心和第二聚类中心的位置差异小于预设值或达到预设的迭代次数,其中,预设值优选为0.1,得到所述聚类结果。其中,预设的迭代次数为人工根据曲线数量预设一次迭代次数,本申请优选为1000次。
通过基于聚类计算得到的簇进行检测,大幅减少了计算的复杂度。如图3所示,五个框图分别表示经过聚类处理后,得到不同类别的目标充电曲线簇,图3中,cluster1-cluster 5表示将充电曲线分成了5个簇,cluster1是第1个簇的曲线,cluster2是第2个簇的曲线,以此类推cluster5是第5个簇的曲线,5个框图中的虚线是簇中心曲线。假设有N条充电功率曲线,聚成K个簇,则计算复杂度则从O(N)降低至O(K),实际中N远大于K,比如充电功率曲线百万级别,聚类簇百级别,计算量大幅减少,从而能够做到实时计算。
在其中一些实施例中,在步骤S104对在进行聚类处理之后,得到不同类别的目标充电曲线簇包括:
获取当前确定的每个充电曲线簇中不同充电曲线之间的第一平均距离,以及充电曲线簇中充电曲线到其他充电曲线簇的第二平均距离;
基于第一平均距离和第二平均距离确定内聚度参数和分离度参数;
基于内聚度参数和分离度参数,将当前确定的充电曲线簇确定为目标充电曲线簇。
具体地,本申请实施例中,通过对充电曲线数据集进行聚类,采用Soft-DTW k-means方法对充电功率曲线进行聚类,再基于轮廓系数(Silhouette Coefficient)评价聚类效果好坏。其中轮廓系数公式包括:式中,/>代表簇中样本到其他样本的平均距离,/>代表样本到其他簇的平均距离的最小值。
其中,轮廓系数值越高,则聚类结果越好。内聚度为簇中的样本到其他样本的平均距离;分离度为样本到其他簇的样本距离的最小值。本实施例中,将聚类算法和相似性检索分开计算,减少了系统的耦合度。聚类算法以及评价聚类效果可以在离线平台中进行运行,通过采集海量的充电曲线数据,不断实验验证得到最优的聚类簇。在相似曲线检索时,系统只需要计算实时充电曲线与簇中心曲线之间的距离,能够做到实时计算。
在其中一些实施例中,图4是根据本申请实施例中步骤S106的流程图,如图4所示,步骤S106具体包括:
步骤S1061、对实时充电曲线进行数据预处理,得到预处理后的实时充电曲线。
对实时充电曲线进行数据预处理,其中,预处理方式采用上述步骤S102中的预处理方式,处理成能够用于检索的时间序列充电曲线。
步骤S1062、获取目标充电曲线簇的中心曲线,确定中心曲线与预处理后的实时充电曲线的相似度。
步骤S1063、选取相似度最高的簇中心曲线,作为目标充电曲线。
具体地,计算聚类结果中的簇中心曲线与预处理后的实时充电曲线的相似度,得到每个簇中心曲线与预处理后的实时充电曲线的相似度,选取相似度最高的簇中心曲线,作为目标充电曲线,其中,通过soft-DTW距离算法确定中心曲线与预处理后的实时充电曲线的相似度。
在本申请实施例中,首先采集充电曲线数据集(充电时序数据),对充电曲线数据集进行预处理,得到预处理后的充电曲线数据集,对预处理后的充电曲线数据集进行聚类(充电时序数据聚类),得到聚类结果(k个充电曲线聚类簇),输入实时充电曲线,并对实时充电曲线预处理,在聚类结果中检索与实时充电曲线相似的目标充电曲线(相似度检索),得到目标充电曲线(相似聚类簇),最后根据充电信息进行终端展示(可视化展示)。解决了基于输入的充电功率曲线,如何快速检索到与其最相似的目标充电功率曲线的问题,能够大幅减少检索目标充电功率曲线的计算量,提高检索效率,实现实时计算。
本申请实施例提供了一种基于时序聚类的充电曲线检索系统,图5是根据本申请实施例的基于时序聚类的充电曲线检索系统的结构框图,如图5所示,预处理模块51,用于对充电曲线数据集进行预处理,得到预处理后的充电曲线数据集;
聚类模块52,用于对预处理后的充电曲线数据进行聚类处理,得到不同类别的目标充电曲线簇;
检索模块53,用于确定实时充电曲线与不同目标充电曲线簇的相似度,基于相似度得到目标充电曲线。
通过本申请实施例中的预处理模块51、聚类模块52和检索模块53,解决了基于输入的充电功率曲线,如何快速检索到与其最相似的目标充电功率曲线的问题,能够大幅减少检索目标充电功率曲线的计算量,提高检索效率,实现实时计算。
在一个实施例中,检索模块53用于:
对实时充电曲线进行数据预处理,得到预处理后的实时充电曲线;
获取目标充电曲线簇的中心曲线,确定中心曲线与预处理后的实时充电曲线的相似度;
选取相似度最高的簇中心曲线,作为目标充电曲线。
在一个实施例中,聚类模块52用于:
从预处理后的充电曲线数据集中,随机选择k个序列充电曲线作为第一聚类中心,其中,充电曲线数据集包括若干个序列充电曲线;
通过距离算法计算每个序列充电曲线与第一聚类中心之间的距离,得到距离矩阵;
根据距离矩阵,通过Soft-DTW-k-means算法选择第二聚类中心;
通过平均序列算法将第二聚类中心中的所有对齐后的序列充电曲线平均,得到簇中心曲线;
重复迭代第一聚类中心和第二聚类中,直到簇中心曲线停止变化或达到预设的迭代次数,得到聚类结果。
在一个实施例中,在聚类模块52之后,得到不同类别的目标充电曲线簇包括:
获取单元,用于获取当前确定的每个充电曲线簇中不同充电曲线之间的第一平均距离,以及充电曲线簇中充电曲线到其他充电曲线簇的第二平均距离;
确定单元,基于第一平均距离和第二平均距离确定内聚度参数和分离度参数;
目标充电曲线簇单元,响应于内聚度参数和分离度参数达到预设阈值,将当前确定的充电曲线簇确定为目标充电曲线簇。
在一个实施例中,预处理模块51用于:
去除充电曲线数据集中充电曲线的噪声点;和/或
对充电曲线数据中的功率值进行归一化处理;和/或
对充电曲线数据缺失值进行填充。
在一个实施例中,预处理模块51中的对充电曲线数据缺失值进行填充包括:
目标时刻单元,用于确定充电曲线中的缺失数据的目标时刻;
填充单元,基于目标时刻的相邻时刻的数据,对目标时刻的数据进行填充。
在一个实施例中,在预处理模块51之前,基于时序聚类的充电曲线检索系统还包括:
采集单元,用于采集电车充电过程中的充电数据;
充电曲线单元,用于根据充电数据获取充电曲线。需要说明的是,在上述流程中或者附图的流程图中示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
需要说明的是,上述各个模块可以是功能模块也可以是程序模块,既可以通过软件来实现,也可以通过硬件来实现。对于通过硬件来实现的模块而言,上述各个模块可以位于同一处理器中;或者上述各个模块还可以按照任意组合的形式分别位于不同的处理器中。
本实施例还提供了一种电子装置,包括显示组件、存储器和处理器,该存储器中存储有计算机程序,显示组件用于显示处理器运行结果,该处理器被设置为运行计算机程序以执行上述任一项方法实施例中的步骤。
可选地,上述电子装置还可以包括传输设备以及输入输出设备,其中,该传输设备和上述处理器连接,该输入输出设备和上述处理器连接。
可选地,在本实施例中,上述处理器可以被设置为通过计算机程序执行以下步骤:
S61,对充电曲线数据进行预处理,得到预处理后的充电曲线数据;
S62,对预处理后的充电曲线数据进行聚类处理,得到不同类别的目标充电曲线簇;
S63,确定实时充电曲线与不同目标充电曲线簇的相似度,基于相似度得到目标充电曲线。
S64, 根据目标充电曲线,进行充电曲线信息统计,得到目标充电曲线的充电信息,根据充电信息进行终端展示。
具体地,图6是根据本申请实施例中的目标充电曲线信息示意图,如图6所示,具体包括这些充电曲线的簇ID:CC0001、平均充电时长:7:00(7小时)平均总功率(w):1100.00。此外,还包括平均充电功率大小、恒流、恒压阶段充电时长,充电总功率等(图6中未示出),并在终端进行展示。再通过分析目标充电曲线背后的车辆品牌等信息,能够进一步判断目标充电曲线较为属于具体哪个品牌的电动车和电池容量,相同品牌相同类型的电池充电曲线具有相似性,根据具体的品牌电动车和电池容量,能够发现相似的用户,从而对用户进行推广活动,如营销、广告投放等。
通过对预处理后的充电曲线数据集进行聚类,能够得到充电曲线的群体性信息。电车都是具有多个品牌,不同类型的电池,相同品牌相同类型的电池充电曲线具有相似性。通过找到最相似的簇,能够更好的表达目标充电功率曲线的信息。从而对用户进行推广活动,如营销、广告投放等。
需要说明的是,本实施例中的具体示例可以参考上述实施例及可选实施方式中所描述的示例,本实施例在此不再赘述。
另外,结合上述实施例中的基于时序聚类的充电曲线检索的方法,本申请实施例可提供一种存储介质来实现。该存储介质上存储有计算机程序;该计算机程序被处理器执行时实现上述实施例中的任意一种基于时序聚类的充电曲线检索的方法。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是终端。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口、显示屏和输入装置。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种基于时序聚类的充电曲线检索的方法。该计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏,该计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。
在一个实施例中,图7是根据本申请实施例的电子设备的内部结构示意图,如图7所示,提供了一种电子设备,该电子设备可以是服务器,其内部结构图可以如图7所示。该电子设备包括通过内部总线连接的处理器、网络接口、内存储器和非易失性存储器,其中,该非易失性存储器存储有操作系统、计算机程序和数据库。处理器用于提供计算和控制能力,网络接口用于与外部的终端通过网络连接通信,内存储器用于为操作系统和计算机程序的运行提供环境,计算机程序被处理器执行时以实现一种基于时序聚类的充电曲线检索的方法,数据库用于存储数据。
本领域技术人员可以理解,图7中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的电子设备的限定,具体的电子设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,该计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink) DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
本领域的技术人员应该明白,以上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。
Claims (10)
1.一种基于时序聚类的充电曲线检索方法,其特征在于,所述方法包括:
对充电曲线数据进行数据预处理,得到预处理后的所述充电曲线数据;
对所述预处理后的充电曲线数据进行聚类处理,得到不同类别的目标充电曲线簇;
确定实时充电曲线与不同所述目标充电曲线簇的中心曲线的相似度,基于所述相似度得到目标充电曲线。
2.根据权利要求1所述的方法,其特征在于,所述确定实时充电曲线与不同所述目标充电曲线簇的中心曲线的相似度,基于所述相似度得到目标充电曲线,包括:
对所述实时充电曲线进行所述数据预处理,得到预处理后的实时充电曲线;
获取所述目标充电曲线的簇中心曲线,确定所述簇中心曲线与所述预处理后的实时充电曲线的相似度;
选取所述相似度最高的所述簇中心曲线,作为目标充电曲线。
3.根据权利要求1所述的方法,其特征在于,对所述预处理后的充电曲线数据进行聚类处理,得到不同类别的目标充电曲线簇,包括:
根据预处理后的所述充电曲线确定第一聚类中心;
获取每个所述充电曲线到所述第一聚类中心的第一距离,根据所述第一距离构建第一距离矩阵;
基于所述第一距离矩阵确定第二聚类中心;
将所述第二聚类中心作为第一聚类中心迭代地获取所述第一聚类中心和所述第二聚类中心;
响应于满足预设迭代条件或所述第二聚类中心与所述第一聚类中心的位置差异小于预设值,得到所述不同类别的充电曲线簇。
4.根据权利要求1所述的方法,其特征在于,在进行所述聚类处理之后,所述得到不同类别的目标充电曲线簇包括:
获取当前确定的每个所述充电曲线簇中不同所述充电曲线之间的第一平均距离,以及所述充电曲线簇中充电曲线到其他所述充电曲线簇的第二平均距离;
基于所述第一平均距离和所述第二平均距离确定内聚度参数和分离度参数;
基于所述内聚度参数和所述分离度参数,将当前确定的所述充电曲线簇确定为所述目标充电曲线簇。
5. 根据权利要求1所述的方法,其特征在于,对充电曲线数据进行数据预处理包括:
去除所述充电曲线数据集中充电曲线的噪声点;和/或
对所述充电曲线数据中的功率值进行归一化处理;和/或
对所述充电曲线数据缺失值进行填充。
6.根据权利要求5所述的方法,其特征在于,对所述充电曲线数据缺失值进行填充包括:
确定所述充电曲线中的缺失数据的目标时刻;
基于所述目标时刻的相邻时刻的数据,对所述目标时刻的数据进行填充。
7.根据权利要求1所述的方法,其特征在于,在对充电曲线数据集进行预处理之前,所述方法还包括:
采集电车充电过程中的充电数据;
根据所述充电数据获取所述充电曲线。
8.一种基于时序聚类的充电曲线检索系统,其特征在于,所述系统包括预处理模块、聚类模块和检索模块;其中,
所述预处理模块,用于对充电曲线数据集进行预处理,得到预处理后的所述充电曲线数据集;
所述聚类模块,用于对所述预处理后的充电曲线数据进行聚类处理,得到不同类别的目标充电曲线簇;
所述检索模块,用于确定实时充电曲线与不同所述目标充电曲线簇的相似度,基于所述相似度得到目标充电曲线。
9.一种电子装置,包括显示组件、存储器和处理器,其特征在于,所述存储器中存储有计算机程序,所述显示组件用于显示所述处理器运行结果,所述处理器被设置为运行所述计算机程序以执行权利要求1至7中任一项所述的一种基于时序聚类的充电曲线检索方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1至7中任一项所述的一种基于时序聚类的充电曲线检索方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310963185.5A CN116662629B (zh) | 2023-08-02 | 2023-08-02 | 基于时序聚类的充电曲线检索方法、系统、装置和介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310963185.5A CN116662629B (zh) | 2023-08-02 | 2023-08-02 | 基于时序聚类的充电曲线检索方法、系统、装置和介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116662629A true CN116662629A (zh) | 2023-08-29 |
CN116662629B CN116662629B (zh) | 2024-05-28 |
Family
ID=87715781
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310963185.5A Active CN116662629B (zh) | 2023-08-02 | 2023-08-02 | 基于时序聚类的充电曲线检索方法、系统、装置和介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116662629B (zh) |
Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105375537A (zh) * | 2014-08-08 | 2016-03-02 | 国家电网公司 | 电动汽车充电的控制方法和装置 |
CN107024663A (zh) * | 2017-04-01 | 2017-08-08 | 湖南银杏数据科技有限公司 | 基于充电曲线特征kpca聚类的锂电池筛选方法 |
CN109214424A (zh) * | 2018-08-03 | 2019-01-15 | 大连理工大学 | 一种利用回归分析和聚类方法预测新能源汽车充电时间的方法 |
CN109359389A (zh) * | 2018-10-18 | 2019-02-19 | 东北大学 | 基于典型负荷动态博弈的城市电动汽车充电决策方法 |
CN109558467A (zh) * | 2018-12-07 | 2019-04-02 | 国网江苏省电力有限公司常州供电分公司 | 用电用户类别识别方法及系统 |
CN111209937A (zh) * | 2019-12-27 | 2020-05-29 | 深圳智链物联科技有限公司 | 一种充电曲线模型的分类方法、装置以及服务器 |
WO2020155755A1 (zh) * | 2019-01-28 | 2020-08-06 | 平安科技(深圳)有限公司 | 基于谱聚类的异常点比例优化方法、装置及计算机设备 |
CN112330028A (zh) * | 2020-11-08 | 2021-02-05 | 国网天津市电力公司 | 基于谱聚类和lstm神经网络的电动公交车充电负荷预测方法 |
CN113036877A (zh) * | 2021-04-02 | 2021-06-25 | 广西云鸟能源科技有限公司 | 一种根据充电功率曲线判断充电异常的方法 |
CN113837274A (zh) * | 2021-09-24 | 2021-12-24 | 内蒙古电力(集团)有限责任公司内蒙古电力科学研究院分公司 | 基于用电特性分析的用户用电行为画像方法及装置 |
CN114880384A (zh) * | 2022-07-11 | 2022-08-09 | 杭州宇谷科技有限公司 | 一种无监督二轮电动车充电时序异常检测方法及系统 |
CN116049705A (zh) * | 2023-01-09 | 2023-05-02 | 国网湖南省电力有限公司 | 基于聚类分析的电力系统用户负荷特性聚类方法及系统 |
-
2023
- 2023-08-02 CN CN202310963185.5A patent/CN116662629B/zh active Active
Patent Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105375537A (zh) * | 2014-08-08 | 2016-03-02 | 国家电网公司 | 电动汽车充电的控制方法和装置 |
CN107024663A (zh) * | 2017-04-01 | 2017-08-08 | 湖南银杏数据科技有限公司 | 基于充电曲线特征kpca聚类的锂电池筛选方法 |
CN109214424A (zh) * | 2018-08-03 | 2019-01-15 | 大连理工大学 | 一种利用回归分析和聚类方法预测新能源汽车充电时间的方法 |
CN109359389A (zh) * | 2018-10-18 | 2019-02-19 | 东北大学 | 基于典型负荷动态博弈的城市电动汽车充电决策方法 |
CN109558467A (zh) * | 2018-12-07 | 2019-04-02 | 国网江苏省电力有限公司常州供电分公司 | 用电用户类别识别方法及系统 |
WO2020155755A1 (zh) * | 2019-01-28 | 2020-08-06 | 平安科技(深圳)有限公司 | 基于谱聚类的异常点比例优化方法、装置及计算机设备 |
CN111209937A (zh) * | 2019-12-27 | 2020-05-29 | 深圳智链物联科技有限公司 | 一种充电曲线模型的分类方法、装置以及服务器 |
CN112330028A (zh) * | 2020-11-08 | 2021-02-05 | 国网天津市电力公司 | 基于谱聚类和lstm神经网络的电动公交车充电负荷预测方法 |
CN113036877A (zh) * | 2021-04-02 | 2021-06-25 | 广西云鸟能源科技有限公司 | 一种根据充电功率曲线判断充电异常的方法 |
CN113837274A (zh) * | 2021-09-24 | 2021-12-24 | 内蒙古电力(集团)有限责任公司内蒙古电力科学研究院分公司 | 基于用电特性分析的用户用电行为画像方法及装置 |
CN114880384A (zh) * | 2022-07-11 | 2022-08-09 | 杭州宇谷科技有限公司 | 一种无监督二轮电动车充电时序异常检测方法及系统 |
CN116049705A (zh) * | 2023-01-09 | 2023-05-02 | 国网湖南省电力有限公司 | 基于聚类分析的电力系统用户负荷特性聚类方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN116662629B (zh) | 2024-05-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8335786B2 (en) | Multi-media content identification using multi-level content signature correlation and fast similarity search | |
dos Santos et al. | A relevance feedback method based on genetic programming for classification of remote sensing images | |
Liu et al. | A new approach to retrieve video by example video clip | |
Elleuch et al. | A fuzzy ontology: based framework for reasoning in visual video content analysis and indexing | |
CN112699605A (zh) | 一种充电桩故障元件预测方法及系统 | |
CN112417381A (zh) | 应用于图像版权保护的快速定位侵权图像的方法及装置 | |
CN112395457A (zh) | 一种应用于视频版权保护的视频待检索定位方法 | |
CN112287014A (zh) | 产品信息可视化处理方法、装置、计算机设备 | |
CN110866249A (zh) | 一种动态检测恶意代码的方法、装置及电子设备 | |
CN111797267A (zh) | 一种医学图像检索方法及系统、电子设备、存储介质 | |
CN109189747A (zh) | 基于Spark大数据平台的电瓶车用户行为习惯分析方法 | |
CN110135428B (zh) | 图像分割处理方法和装置 | |
CN114329004A (zh) | 数字指纹生成、数据推送方法、装置和存储介质 | |
Jing et al. | Learning region weighting from relevance feedback in image retrieval | |
CN116662629B (zh) | 基于时序聚类的充电曲线检索方法、系统、装置和介质 | |
CN116720145B (zh) | 基于数据处理的无线充电剩余时间预测方法 | |
CN116226468B (zh) | 基于网格化终端业务数据存储管理方法 | |
CN112115281A (zh) | 数据检索方法、装置及存储介质 | |
Dai et al. | A two-layer text clustering approach for retrospective news event detection | |
CN116071569A (zh) | 图像选择方法、计算机设备及存储装置 | |
Mansoor Hussain et al. | RETRACTED ARTICLE: Content based image retrieval using bees algorithm and simulated annealing approach in medical big data applications | |
CN112613562B (zh) | 基于多中心云计算的数据分析系统及方法 | |
CN111984812B (zh) | 一种特征提取模型生成方法、图像检索方法、装置及设备 | |
CN116484067A (zh) | 目标对象匹配方法、装置及计算机设备 | |
CN108304546B (zh) | 一种基于内容相似度和Softmax分类器的医学图像检索方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant |