CN105825232A

CN105825232A - 对电动汽车用户进行分类的方法及装置

Info

Publication number: CN105825232A
Application number: CN201610147753.4A
Authority: CN
Inventors: 张禄; 陈艳霞; 朱洁; 迟忠君; 潘鸣宇; 杨晟; 刘诗; 孙舟; 王伟贤; 李香龙; 赵越
Original assignee: Beijing Reelsky Data Technology Ltd; State Grid Corp of China SGCC; State Grid Beijing Electric Power Co Ltd
Current assignee: Beijing Reelsky Data Technology Ltd; State Grid Corp of China SGCC; State Grid Beijing Electric Power Co Ltd
Priority date: 2016-03-15
Filing date: 2016-03-15
Publication date: 2016-08-03

Abstract

本发明公开了一种对电动汽车用户进行分类的方法及装置。其中，该方法包括：确定电动汽车用户群中的各用户对象；获取各用户对象的特征属性的属性信息；根据获取的属性信息，对各用户对象进行分类处理。本发明解决了相关技术中难以估计电动汽车用户对充电设备的使用情况的技术问题。

Description

对电动汽车用户进行分类的方法及装置

技术领域

本发明涉及数据处理领域，具体而言，涉及一种对电动汽车用户进行分类的方法及装置。

背景技术

在能源消耗、二氧化碳排放量逐年增加，且汽车行业发展迅速的背景下，为实现能源安全、环境保护以及汽车工业跨越式、可持续发展的需要，电动汽车行业以节能环保、节约成本等优点受到政府和汽车市场的青睐。

欧洲、美国、日本等发达国家已在电动汽车网络运营方面的技术研究中取得了阶段性的成果，并力求达到充电设施分布均匀、用户使用方便快捷等目标。随着电动汽车充电系统的全面升级，用户获得了更流畅的充电服务体验。

然而，在相关技术中，还难以估计电动汽车用户对充电设备的使用情况，导致在合理规划城市充电设施、规范网络运营、提升用户体验等方面遇到了瓶颈。

针对上述的问题，目前尚未提出有效的解决方案。

发明内容

本发明实施例提供了一种对电动汽车用户进行分类的方法及装置，以至少解决相关技术中难以估计电动汽车用户对充电设备的使用情况的技术问题。

根据本发明实施例的一个方面，提供了一种对电动汽车用户进行分类的方法，包括：确定电动汽车用户群中的各用户对象；获取上述各用户对象的特征属性的属性信息；根据获取的属性信息，对上述各用户对象进行分类处理。

进一步地，根据获取的属性信息，对上述各用户对象进行分类处理包括：根据获取的属性信息，通过聚类分析的方式对上述各用户对象进行分类。

进一步地，根据获取的属性信息，通过聚类分析的方式对上述各用户对象进行分类包括：确定K类种子；读入上述各用户对象；根据上述获取的属性信息，计算上述各用户对象中的每个用户对象与上述K类种子中的每类种子间的距离；根据计算结果，将上述每个用户对象归类到与其距离最近的一类种子所属的群体中。

进一步地，确定K类种子包括：获取预先指定的K类种子；或者按照预设规则从上述电动汽车用户群对应的数据集中选定K类种子。

进一步地，在按照预设规则从上述电动汽车用户群对应的数据集中选定K类种子的情况下，且在按照预设规则从上述电动汽车用户群对应的数据集中选定K类种子之前，上述方法还包括：将上述电动汽车用户群对应的数据集进行标准化处理。

根据本发明实施例的另一方面，还提供了一种对电动汽车用户进行分类的装置，包括：确定单元，用于确定电动汽车用户群中的各用户对象；获取单元，用于获取上述各用户对象的特征属性的属性信息；分类单元，用于根据获取的属性信息，对上述各用户对象进行分类处理。

进一步地，上述分类单元还用于根据获取的属性信息，通过聚类分析的方式对上述各用户对象进行分类。

进一步地，上述分类单元包括：确定模块，用于确定K类种子；读取模块，用于读入上述各用户对象；计算模块，用于根据上述获取的属性信息，计算上述各用户对象中的每个用户对象与上述K类种子中的每类种子间的距离；分类模块，用于根据计算结果，将上述每个用户对象归类到与其距离最近的一类种子所属的群体中。

进一步地，上述确定模块还用于：获取预先指定的K类种子；或者按照预设规则从上述电动汽车用户群对应的数据集中选定K类种子。

进一步地，上述分类单元还包括：处理模块，用于在按照预设规则从上述电动汽车用户群对应的数据集中选定K类种子的情况下，且在按照预设规则从上述电动汽车用户群对应的数据集中选定K类种子之前，将上述电动汽车用户群对应的数据集进行标准化处理。

在本发明实施例中，采用对电动汽车用户进行分类的方式，通过确定电动汽车用户群中的各用户对象；获取各用户对象的特征属性的属性信息；根据获取的属性信息，对各用户对象进行分类处理，达到了对电动汽车用户进行分类的目的，从而实现了准确估计电动汽车用户对充电设备的使用情况的技术效果，进而解决了相关技术中难以估计电动汽车用户对充电设备的使用情况的技术问题。

附图说明

此处所说明的附图用来提供对本发明的进一步理解，构成本申请的一部分，本发明的示意性实施例及其说明用于解释本发明，并不构成对本发明的不当限定。在附图中：

图1是根据本发明实施例的一种可选的对电动汽车用户进行分类的方法的流程图；

图2是根据本发明实施例的一种可选的对电动汽车用户进行分类的装置的示意图。

具体实施方式

为了使本技术领域的人员更好地理解本发明方案，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分的实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都应当属于本发明保护的范围。

需要说明的是，本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外，术语“包括”和“具有”以及他们的任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

实施例1

根据本发明实施例，提供了一种对电动汽车用户进行分类的方法的实施例，需要说明的是，在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行，并且，虽然在流程图中示出了逻辑顺序，但是在某些情况下，可以以不同于此处的顺序执行所示出或描述的步骤。

图1是根据本发明实施例的一种可选的对电动汽车用户进行分类的方法的流程图，如图1所示，该方法包括如下步骤：

步骤S102，确定电动汽车用户群中的各用户对象；

步骤S104，获取上述各用户对象的特征属性的属性信息；

步骤S106，根据获取的属性信息，对上述各用户对象进行分类处理。

其中，电动汽车用户群是指使用电动汽车的用户对象的集合，该集合中包括多个用户对象。实施时，先确定一个电动汽车用户群及其用户对象，再收集、整理这些用户对象的行为信息，在此基础上依据各用户对象的需求特点、行为习惯等方面的明显差异，将这些用户对象划分为若干个用户类。其中，分属于同一个用户类中的所有用户对象在某一或某些方面具有类似特点，分属于不同用户类中的用户对象之间具有明显的差异性。

通过本发明实施例，采用对电动汽车用户进行分类的方式，通过确定电动汽车用户群中的各用户对象；获取各用户对象的特征属性的属性信息；根据获取的属性信息，对各用户对象进行分类处理，达到了对电动汽车用户进行分类的目的，从而实现了准确估计电动汽车用户对充电设备的使用情况的技术效果，进而解决了相关技术中难以估计电动汽车用户对充电设备的使用情况的技术问题。

可选地，根据获取的属性信息，对上述各用户对象进行分类处理包括：

S2，根据获取的属性信息，通过聚类分析的方式对上述各用户对象进行分类。

其中，聚类分析的目的就是将所关心的用户对象按照一定的规则或标准分成不同的类别。需要说明的是，在本发明实施例中，聚类分析可以分为两类：模糊聚类和非模糊聚类。非模糊聚类是指对象(即用户对象)与类(用户类)的从属关系都是确定的(如属于或者不属于)聚类。模糊聚类是指对象(即用户对象)与类(用户类)的从属关系都是有一定概率的聚类。

另外，在本发明实施例中，可以充分运用电动汽车运营积累的数据，从各个维度挖掘用户的充电行为特点、充电站运营特点等信息，进而由此获得突破合理规划城市充电设施、规范网络运营、提升用户体验等方面的瓶颈的理想技术。

通过本发明实施例，通过聚类分析方式对用户进行分类，进而对各用户类进行价值评估，得到价值评估结果，从而根据价值评估结果了解目前用户使用充电设施的情况，并进一步对电动汽车充电网络运营提出相应建议。

可选地，根据获取的属性信息，通过聚类分析的方式对上述各用户对象进行分类包括：

S4，确定K类种子；

S6，读入上述各用户对象；

S8，根据上述获取的属性信息，计算上述各用户对象中的每个用户对象与上述K类种子中的每类种子间的距离；

S10，根据计算结果，将上述每个用户对象归类到与其距离最近的一类种子所属的群体中。

需要说明的是，实施时，用户分类模型可以采用K_MEANS聚类法。K_MEANS聚类法具有算法的收敛时间与待分析数据的观测数成正比的特点，因此K_MEANS聚类法可以用来处理大数据。其中，K_MEANS聚类法的步骤如下：

(1)选定K个观测数(如用户对象的属性信息)作为K类种子；

(2)读入所有观测数，计算每个观测数与K类种子之间的距离，并将观测数暂时归类到与其距离最近的种子所在的类(如用户类)中；

(3)根据已有类中的观测数，重新计算类的中心，即种子；

(4)重复第(2)-(3)步，直至收敛，至此所有K类种子已最终确定；

(5)再次读入所有观测数，将每个观测数归类到与其距离最近的种子所在的类中，分类结束。

其中K值是预估的，针对K值的估计，有以下方法：根据背景知识判断；根据分类目标判断；作图辅助判断；由选取的工具(如SAS软件)自动判断；等等。SAS软件介绍如下：SAS软件是一个模块化、集成化的大型应用软件系统，由多个模块构成，其中包括数据访问、数据存储、应用开发、图形处理、数据分析、预测等功能模块。SAS软件主要用于完成以数据为中心的四大任务，即数据访问、数据管理、数据呈现、数据分析。更进一步，K_MEANS聚类法在SAS中实现方式如下：SAS软件通过PROCFASTCLUS来实现K均值聚类法，默认情况下，PROCFASTCLUS使用欧式距离来计算观测数与种子间的距离。

可选地，确定K类种子可以包括：

S12，获取预先指定的K类种子，即获取用户根据实际需要预先指定的K类种子；或者

S14，按照预设规则从上述电动汽车用户群对应的数据集(即原始数据集)中选定K类种子。

例如，在SAS软件通过PROCFASTCLUS来实现K均值聚类法的默认情况下，PROCFASTCLUS使用欧式距离来计算观测数与种子间的距离的过程中，对种子的选择可以由用户指定，也可以由过程步在原始输入数据集中选择，一般该过程可以自动选出“足够好”的初始种子。

可选地，在确定K类种子包括按照预设规则从上述电动汽车用户群对应的数据集中选定K类种子的情况下，在按照预设规则从上述电动汽车用户群对应的数据集中选定K类种子之前，上述方法还包括：

S16，将上述电动汽车用户群对应的数据集进行标准化处理。

例如，在PROCFASTCLUS使用欧式距离来计算观测数与种子间的距离的过程中，过程步在使用中有如下特点：适用于分析大数据集，因为当数据集小时，该过程步对数据集中的观测数顺序较为敏感，同一数据集观测数顺序的变化会对结果产生较大影响；在该过程步中，方差较大的变量对结果的影响也很大，所以在使用该过程步之前，可以考虑先对数据集进行标准化。

进一步地，为了避免选取分类的变量之间具有相关性，在进行电动汽车用户分类时，需要进行变量相关性检验，引入相关性检验分析。相关性检验是指检验两变量是否存在相关性的一种假设检验。在该假设检验中，ρ是相关系数的参数。相关性检验中原假设H_0和备择假设H_1分别为：H_0：ρ＝0；H_1：ρ≠0。通常情况下，当P<0.05时，则表示两个变量之间的线性关系是显著的，但P值的大小不能表示相关性的强弱，并且P值的大小受样本容量的影响。其中，可以在无相关性的变量中挑选出其中五个作为用户分类依据的变量：用户使用总电量、平均使用/占用情况、最后一次充电距离截止日期的时长、平均卡内剩余金额、开卡总时长。进一步地，为了避免以上变量方差之间差异较大，实施时需要先对数据集进行标准化。SAS中标准化过程如下：Procfastclusdata＝数据集；Var变量；Run。

具体地，在本发明，可以将电动汽车用户群中的用户对象(以下简称为用户)分成长期用户、短期用户、价值型流失用户、价值型客户、非价值型流失用户、非价值型客户六类，其中价值型(非价值型)稳定(不稳定)用户、流失(非流失)稳定(不稳定)用户定义参考如下表1所示。

表1(用户分类形态对应变量)

将分类中各个类别对应评判变量量化结果整理如下表2所示。

表2(各类对应的用户形态)

cluster	频数	是否长期	是否是价值型	是否流失
					1	38	否	否	是
2	7	否	否	否
					3	9467	否	否	是
4	1	是	否	是
					5	610	是	否	否
6	1	是	是	是
					7	2345	是	是	否
8	1	是	是	否
					9	2706	否	否	否
10	642	是	是	是

按照表2中的信息，本次研究按照一人一卡的标准将电卡对应的电动汽车用户分为八个小组，如下表3所示。

表3(用户细分情况)

其中，针对电动汽车用户分类结果，分析如下：

电动汽车用户分类既是行为细分模型的延伸，也是制定营销策略、了解目前用户情况的基础。如表3所示，总结如下：全量数据中共有电卡15818张，其中近70％的电卡均为短期使用(不超过7个月)，只有约30％的电卡为长期使用(超过7个月)；在15818张电卡中，约28％的电卡持有者属于价值型用户，约64％的电卡持有者属于流失型客户；价值型用户完全分布在长期型用户中，而流失型客户大部分分布在短期型客户中。

当然，上述用户分类可能存在以下问题：以电卡为分类目标进行分类，即一张电卡代表一位用户，但在现实使用中，一个用户可以持有多张电卡，且电卡故障率较高，造成本次分类中体现的短期用户较多的情况；在数据预处理过程中，由于检验规则的限制，筛除部分数据，会间接导致分类变量有一定的误差。

针对分类结果的上述分析，提出以下建议：鉴于属于短期使用的充电卡数较多的情况，说明电卡故障、损坏、遗失等情况较多，从电卡管理的角度来说，可以提高电卡质量，以便提升用户体验，减少因电卡使用不便给用户带来的困扰；在分类结果中，价值型用户占18.89％，流失用户占64.16％。由此可见，全量数据中，价值型用户较少，全部集中在长期用户中；而流失的用户较多，大部分集中在短期用户中；在分类结果中，认为“价值型非流失用户”是最好的，相反“价值型流失用户”是需要避免的。全量数据中，“价值型非流失用户”约占15％，这部分用户是需要进一步维护的用户，可以通过积分制等方式奖励这部分用户，进而提升这些用户的忠诚度；“价值型流失用户”约占4％，需要通过走访、问卷调查等方式找出这部分用户流失的原因，如：电卡废弃原因、自身原因等，进而有策略的对充电设施进行维护；另外，对于“非价值型用户”又可分为“长期型非价值型用户”(约占全量数据的4％)和“短期型非价值型用户”(约占全量数据的77％)。其中，“短期型非价值型用户”可能是由于电卡使用时间短的原因，所以其价值仍然有待观察；而“长期型非价值型用户”可能是由于用户手持多张电卡，并非规律的使用一张电卡所导致。由此可见：提高电卡质量对于规范化分析用户充电行为有至关重要的意义。

实施例2

图2是根据本发明实施例的一种可选的对电动汽车用户进行分类的装置的示意图，如图2所示，该装置包括：确定单元202，用于确定电动汽车用户群中的各用户对象；获取单元204，用于获取上述各用户对象的特征属性的属性信息；分类单元206，用于根据获取的属性信息，对上述各用户对象进行分类处理。

可选地，上述分类单元还用于根据获取的属性信息，通过聚类分析的方式对上述各用户对象进行分类。

可选地，上述分类单元包括：确定模块，用于确定K类种子；读取模块，用于读入上述各用户对象；计算模块，用于根据上述获取的属性信息，计算上述各用户对象中的每个用户对象与上述K类种子中的每类种子间的距离；分类模块，用于根据计算结果，将上述每个用户对象归类到与其距离最近的一类种子所属的群体中。

(1)选定K个观测数(如用户对象的属性信息)作为K类种子；

(3)根据已有类中的观测数，重新计算类的中心，即种子；

可选地，上述确定模块还用于：获取预先指定的K类种子；或者按照预设规则从上述电动汽车用户群对应的数据集中选定K类种子。

可选地，上述分类单元还包括：处理模块，用于在确定K类种子包括按照预设规则从上述电动汽车用户群对应的数据集中选定K类种子的情况下，在按照预设规则从上述电动汽车用户群对应的数据集中选定K类种子之前，将上述电动汽车用户群对应的数据集进行标准化处理。

上述本发明实施例序号仅仅为了描述，不代表实施例的优劣。

在本发明的上述实施例中，对各个实施例的描述都各有侧重，某个实施例中没有详述的部分，可以参见其他实施例的相关描述。

在本申请所提供的几个实施例中，应该理解到，所揭露的技术内容，可通过其它的方式实现。其中，以上所描述的装置实施例仅仅是示意性的，例如所述单元的划分，可以为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，单元或模块的间接耦合或通信连接，可以是电性或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本发明各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。

所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、只读存储器(ROM，Read-OnlyMemory)、随机存取存储器(RAM，RandomAccessMemory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述仅是本发明的优选实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本发明原理的前提下，还可以做出若干改进和润饰，这些改进和润饰也应视为本发明的保护范围。

Claims

1.一种对电动汽车用户进行分类的方法，其特征在于，包括：

确定电动汽车用户群中的各用户对象；

获取所述各用户对象的特征属性的属性信息；

根据获取的属性信息，对所述各用户对象进行分类处理。

2.根据权利要求1所述的方法，其特征在于，根据获取的属性信息，对所述各用户对象进行分类处理包括：

根据获取的属性信息，通过聚类分析的方式对所述各用户对象进行分类。

3.根据权利要求2所述的方法，其特征在于，根据获取的属性信息，通过聚类分析的方式对所述各用户对象进行分类包括：

确定K类种子；

读入所述各用户对象；

根据所述获取的属性信息，计算所述各用户对象中的每个用户对象与所述K类种子中的每类种子间的距离；

根据计算结果，将所述每个用户对象归类到与其距离最近的一类种子所属的群体中。

4.根据权利要求3所述的方法，其特征在于，确定K类种子包括：

获取预先指定的K类种子；或者

按照预设规则从所述电动汽车用户群对应的数据集中选定K类种子。

5.根据权利要求3所述的方法，其特征在于，在按照预设规则从所述电动汽车用户群对应的数据集中选定K类种子的情况下，且在按照预设规则从所述电动汽车用户群对应的数据集中选定K类种子之前，所述方法还包括：

将所述电动汽车用户群对应的数据集进行标准化处理。

6.一种对电动汽车用户进行分类的装置，其特征在于，包括：

确定单元，用于确定电动汽车用户群中的各用户对象；

获取单元，用于获取所述各用户对象的特征属性的属性信息；

分类单元，用于根据获取的属性信息，对所述各用户对象进行分类处理。

7.根据权利要求6所述的装置，其特征在于，所述分类单元还用于根据获取的属性信息，通过聚类分析的方式对所述各用户对象进行分类。

8.根据权利要求7所述的装置，其特征在于，所述分类单元包括：

确定模块，用于确定K类种子；

读取模块，用于读入所述各用户对象；

计算模块，用于根据所述获取的属性信息，计算所述各用户对象中的每个用户对象与所述K类种子中的每类种子间的距离；

分类模块，用于根据计算结果，将所述每个用户对象归类到与其距离最近的一类种子所属的群体中。

9.根据权利要求8所述的装置，其特征在于，所述确定模块还用于：

获取预先指定的K类种子；或者

10.根据权利要求8所述的装置，其特征在于，所述分类单元还包括：

处理模块，用于在按照预设规则从所述电动汽车用户群对应的数据集中选定K类种子的情况下，且在按照预设规则从所述电动汽车用户群对应的数据集中选定K类种子之前，将所述电动汽车用户群对应的数据集进行标准化处理。