CN112001761A - 用户分类方法及相关装置 - Google Patents
用户分类方法及相关装置 Download PDFInfo
- Publication number
- CN112001761A CN112001761A CN202010896133.7A CN202010896133A CN112001761A CN 112001761 A CN112001761 A CN 112001761A CN 202010896133 A CN202010896133 A CN 202010896133A CN 112001761 A CN112001761 A CN 112001761A
- Authority
- CN
- China
- Prior art keywords
- user
- classification
- similarity
- matched
- vehicle
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 57
- 230000015654 memory Effects 0.000 claims description 33
- 230000006399 behavior Effects 0.000 claims description 27
- 239000013598 vector Substances 0.000 claims description 26
- 238000004590 computer program Methods 0.000 claims description 14
- 238000004891 communication Methods 0.000 claims description 13
- 230000009286 beneficial effect Effects 0.000 abstract description 6
- 238000010586 diagram Methods 0.000 description 6
- 230000000694 effects Effects 0.000 description 5
- 230000003287 optical effect Effects 0.000 description 5
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 230000004308 accommodation Effects 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 238000005065 mining Methods 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- 239000003086 colorant Substances 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000011524 similarity measure Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0207—Discounts or incentives, e.g. coupons or rebates
- G06Q30/0224—Discounts or incentives, e.g. coupons or rebates based on user history
Landscapes
- Business, Economics & Management (AREA)
- Strategic Management (AREA)
- Engineering & Computer Science (AREA)
- Accounting & Taxation (AREA)
- Development Economics (AREA)
- Finance (AREA)
- Entrepreneurship & Innovation (AREA)
- Game Theory and Decision Science (AREA)
- Economics (AREA)
- Marketing (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请实施例公开了一种用户分类方法及相关装置,方法包括:获取每个用户的浏览行为数据,第一用户的浏览行为数据包括:第一用户针对M个类别的浏览次数;根据第一用户针对M个类别的浏览次数,确定第一用户与每个分类基准用户的第一相似度;根据第一用户与每个分类基准用户对应的第一相似度,确定与第一用户匹配的分类基准用户;将第一用户划分至匹配的分类基准用户对应的参考分组中;根据第一用户针对M个类别中每个类别的浏览次数,确定第一用户与匹配的分类基准用户在每个类别上的相似度,得到第一用户与匹配的分类基准用户对应的M个第二相似度;将第一用户划分至与M个第二相似度对应的目标分组中。本申请实施例有利于对用户进行精准分类。
Description
技术领域
本申请涉及数据处理技术领域,具体涉及一种用户分类方法及相关装置。
背景技术
在各种营销业务活动安排中,例如车辆营销过程中,对于潜在客户进行挖掘时,营销人员往往需要了解不同客户的喜好和需求,才能针对性的安排营销活动,由于用户的喜好往往是综合复杂的,营销人员对于大量的用户而言,无法准确的确定出每个用户的偏好,也就无法针对性的对不同类型的用户进行差异化的营销互动,导致营销效率低。
发明内容
本申请实施例提供了一种用户分类方法及相关装置,以期对用户进行精准分类。
第一方面,本申请实施例提供一种用户分类方法,包括:
获取至少一个用户中每个用户的浏览行为数据,第一用户的浏览行为数据包括:所述第一用户针对M个类别的浏览次数,所述M为正整数,所述第一用户为所述至少一个用户中的任意一个用户;
根据所述第一用户针对所述M个类别的浏览次数,确定所述第一用户与每个分类基准用户的第一相似度;
根据所述第一用户与每个分类基准用户对应的第一相似度,确定与所述第一用户匹配的分类基准用户;
将所述第一用户划分至所述匹配的分类基准用户对应的参考分组中,所述参考分组对应多个目标分组;
根据所述第一用户针对所述M个类别中每个类别的浏览次数,确定所述第一用户与所述匹配的分类基准用户在每个类别上的相似度,得到所述第一用户与所述匹配的分类基准用户对应的M个第二相似度;
将所述第一用户划分至所述多个目标分组中与所述M个第二相似度对应的目标分组中。
结合本申请的第一方面,在本申请第一方面的一种可能的实施方式中,所述根据所述第一用户针对所述M个类别的浏览次数,确定所述第一用户与每个分类基准用户的第一相似度,包括:
建立多维坐标系;
根据所述M个类别的浏览次数,确定所述第一用户在所述多维坐标系的第一特征向量;
确定每个分类基准用户在所述多维坐标系的第二特征向量;
计算所述第一特征向量与每个分类基准用户对应的第二特征向量的余弦相似度,将所述余弦相似度作为所述第一用户与每个分类基准用户的第一相似度。
结合本申请的第一方面,在本申请第一方面的一种可能的实施方式中,所述将所述第一用户划分至所述多个目标分组中与所述M个第二相似度对应的目标分组中,包括:
根据所述第一用户对应的M个第二相似度,确定所述第一用户的第一分类标准;
从多个预设分类标准中确定出与所述第一分类标准匹配的第一预设分类标准,所述多个预设分类标准与所述多个目标分组一一对应;
将所述第一用户划分至与所述第一预设分类标准对应的目标分组中。
结合本申请的第一方面,在本申请第一方面的一种可能的实施方式中,在所述分类基准用户为已购车用户的情况下,所述方法还包括:
获取所述分类基准用户已购车的车辆参数,所述车辆参数包括以下至少一种:车型、颜色、尺寸、性能、价格;
从数据库获取与所述分类基准用户已购车的车辆参数匹配的候选车,所述数据库中存储有汽车销售方当前在售车辆的数据;
将所述候选车推送给所述第一用户。
结合本申请的第一方面,在本申请第一方面的一种可能的实施方式中,在所述分类基准用户为已购理财产品用户的情况下,所述方法还包括:
获取所述分类基准用户已购理财产品的产品参数,所述产品参数包括以下至少一种:产品类别、风险程度、获利能力、资金可流动性;
从理财产品数据库中,获取与所述分类基准用户已购理财产品的产品参数匹配的候选理财产品;
将所述候选理财产品推送给所述第一用户。
结合本申请的第一方面,在本申请第一方面的一种可能的实施方式中,在所述分类基准用户为已购车辆保险用户的情况下,所述方法还包括:
获取所述分类基准用户已购车辆保险的保险信息,所述保险信息包括以下至少一种:保险险种、保险费用、保障额度、保险公司、保险公司信用等级;
从车辆保险数据库中,获取与所述分类基准用户已购车辆保险的保险信息匹配的候选车辆保险;
将所述候选车辆保险推送给所述第一用户。
结合本申请的第一方面,在本申请第一方面的一种可能的实施方式中,在所述分类基准用户为已购出行服务用户的情况下,所述方法还包括:
获取所述分类基准用户已购出行服务的服务信息,所述服务信息包括以下至少一种:出行目的地、出行交通方式、出行时长、出行费用构成;
从出行服务数据库中,获取与所述分类基准用户已购出行服务的服务信息匹配的候选出行服务;
将所述候选出行服务推送给所述第一用户。
第二方面,本申请实施例提供一种用户分类装置,包括:
获取单元,用于获取至少一个用户中每个用户的浏览行为数据,第一用户的浏览行为数据包括:所述第一用户针对M个类别的浏览次数,所述M为正整数,所述第一用户为所述至少一个用户中的任意一个用户;
第一确定单元,用于根据所述第一用户针对所述M个类别的浏览次数,确定所述第一用户与每个分类基准用户的第一相似度;
第二确定单元,用于根据所述第一用户与每个分类基准用户对应的第一相似度,确定与所述第一用户匹配的分类基准用户;
第一分组单元,用于将所述第一用户划分至所述匹配的分类基准用户对应的参考分组中,所述参考分组对应多个目标分组;
第三确定单元,用于根据所述第一用户针对所述M个类别中每个类别的浏览次数,确定所述第一用户与所述匹配的分类基准用户在每个类别上的相似度,得到所述第一用户与所述匹配的分类基准用户对应的M个第二相似度;
第二分组单元,用于将所述第一用户划分至所述多个目标分组中与所述M个第二相似度对应的目标分组中。
第三方面,本申请实施例提供了一种电子设备,包括处理器、存储器以及通信接口,所述处理器、存储器和通信接口相互连接,其中,所述通信接口用于接收或发送数据,所述存储器用于存储电子设备执行上述方法的应用程序代码,所述处理器被配置用于执行上述第一方面的任一方法。
第四方面,本申请实施例提供了一种计算机可读存储介质,用于电子数据交换的计算机程序,其中,上述计算机程序使得计算机执行如本申请实施例第一方面任一方法中所描述的部分或全部步骤。
第五方面,本申请实施例提供了一种计算机程序产品,其中,上述计算机程序产品包括存储了计算机程序的非瞬时性计算机可读存储介质,上述计算机程序可操作来使计算机执行如本申请实施例第一方面任一方法中所描述的部分或全部步骤。该计算机程序产品可以为一个软件安装包。
可以看出,本申请实施例中,电子设备先获取每个用户的浏览行为数据,第一用户的浏览行为数据包括:第一用户针对M个类别的浏览次数,然后根据第一用户针对M个类别的浏览次数,确定第一用户与每个分类基准用户的第一相似度,并进一步根据第一相似度,将第一用户划分至匹配的分类基准用户对应的参考分组中,然后再根据第一用户针对M个类别中每个类别的浏览次数,确定第一用户与匹配的分类基准用户在每个类别上的相似度,并将第一用户划分至与M个第二相似度对应的目标分组中,可见,根据用户针对M个类别的浏览次数,分别确定出用户与分类基准用户的第一相似度和M个第二相似度,并根据第一相似度和第二相似度对用户两次分组,有利于对用户进行精准分类。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例提供的一种用户分类系统的架构图;
图2是本申请实施例提供的一种用户分类方法的流程示意图;
图3是本申请实施例提供的一种用户分类装置的组成结构示意图;
图4是本申请实施例提供的一种电子设备的组成结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别不同对象,而不是用于描述特定顺序。此外,术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其他步骤或单元。
在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。
“多个”是指两个或两个以上。“和/或”,描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。
下面结合附图对本申请的实施例进行描述。
请参阅图1,图1是本申请实施例提供的一种用户分类系统的架构图,如图所示,本用户分类系统可以包括服务器100,以及终端设备101,终端设备101可以是一个或多个,每个终端设备101可以与服务器建立通信连接,服务器100可以获取来自终端设备101发送的用户的浏览行为数据,也可以向终端设备101发送相应的数据,此外,服务器100还可以与其他服务器建立通信连接,获取其他服务器的数据库中存储的数据,例如获取车辆数据库中存储的车辆参数,或者服务器100中设置有相应的数据库如车辆参数数据库等。
请参阅图2,图2是本申请实施例提供的一种用户分类方法的流程示意图,如图所示,本用户分类方法包括以下操作:
S201,电子设备获取至少一个用户中每个用户的浏览行为数据,第一用户的浏览行为数据包括:所述第一用户针对M个类别的浏览次数。
其中,所述M为正整数,所述第一用户为所述至少一个用户中的任意一个用户;电子设备可以是如图1所示的服务器。
具体实现中,可以通过数据埋点的方式采集用户的浏览行为数据,浏览行为数据可以是用户在线浏览行为产生的,例如用户在各种公众号、小程序或者手机应用程序中浏览产生的数据。考虑到不同场景中对用户进行分类的需求不同,M个类别可以是根据实际需要预先设置的,获取用户浏览行为数据时,只获取用户针对预先设置好的M个类别的浏览行为数据。当然也可以获取每个用户的所有浏览行为数据,M个类别则包括每个用户浏览的每个类别。
此外,类别的划分也可根据实际情况进行调整,在不同场景中,不同的内容可以被划分到不同的类别中,例如,在挖掘货运车潜在客户场景中,有关家庭用车的多种内容都可以划分至一个类别,而在挖掘某款适合家用的车型的潜在客户时,有关家庭用车的内容可以划分至多个类别,例如有关小型家用车的内容划分至一类,大型家用车的内容划分至一类。
S202,电子设备根据所述第一用户针对所述M个类别的浏览次数,确定所述第一用户与每个分类基准用户的第一相似度。
S203,电子设备根据所述第一用户与每个分类基准用户对应的第一相似度,确定与所述第一用户匹配的分类基准用户。
S204,电子设备将所述第一用户划分至所述匹配的分类基准用户对应的参考分组中,所述参考分组对应多个目标分组。
S202、S203和S204中,分类基准用户可以是根据实际需要设置的虚拟用户,也可以是选择的具体用户;分类基准用户的数据可以是一个,也可以是多个,可根据实际需要进行设置,此处不做限定。对于一个用户而言,综合其针对多个类别的内容的浏览次数,可以了解用户对于不同类别的偏好,因而根据第一用户针对M个类别的浏览次数,确定出的第一用户与每个分类基准用户的第一相似度,可用于表征第一用户与每个分类基准用户在类别偏好上的相似度。
例如在汽车销售中潜在客户挖掘场景中,目标是分别确定出三款车的潜在客户,可以针对每款车选择一个已经购买该车的用户作为分类基准用户,或者也可以直接根据需要设置三个分别对应三款车的虚拟用户作为分类基准用户,根据每个用户针对不同类别内容的浏览次数,确定每个用户与每个分类基准用户的第一相似度,然后将其划分至与其匹配的分类基准用户对应的参考分组中,其中,与某用户匹配的分类基准用户,可以是与该用户第一相似度在预设阈值范围内的分类基准用户,如此,一个参考分组中的用户在浏览类别的偏好上与该分组的分类基准用户是相似的,故而一个参考分组中的用户购买与分类基准用户对应的车的可能性较大,可以作为该车的潜在用户,将不同的用户进行分类,便于对用户进行差异化的营销。
此外,根据实际需要,一个分类基准用户可以对应一个或多个参考分组,若用户与分类基准用户的第一相似度在一定阈值范围内,则确定该分类基准用户与该用户匹配,一个分类基准用户对应的多个用户中,每个用户与其的第一相似度可能不同,因而若想进一步对用户进行分类,可将上述一定阈值范围划分成多个更小的范围,每个范围对应一个参考分组,将与一个分类基准用户匹配的多个用户划分至更精细的参考分组中。
举例来说,预设两个用户的第一相似度为0-1,则认为两个用户相似,而0-0.5为一般相似,0.6-1为极相似。若只需要将与分类基准用户相似的用户分到一个参考分组中,即只要相似则认为匹配,则一个分类基准用户对应一个参考分组,该参考分组中每个用户与分类基准用户的第一相似度在0-1之间;若需要将与分类基准用户极相似和一般相似的用户分到不同的参考分组中,则可划分两个参考分组,一个参考分组中每个用户与分类基准用户的第一相似度均在0-0.5之间,另一个参考分组中每个用户与分类基准用户的第一相似度均在0.6-1之间,则进一步将与分类基准用户匹配的用户划分到了极相似和一般相似两个更精细的参考分组中。
S205,电子设备根据所述第一用户针对所述M个类别中每个类别的浏览次数,确定所述第一用户与所述匹配的分类基准用户在每个类别上的相似度,得到所述第一用户与所述匹配的分类基准用户对应的M个第二相似度。
具体实现中,确定第一用户与匹配的分类基准用户在每个类别上的相似度,可以将第一用户和分类基准用户的数据对应到的坐标系中的点,计算第一用户与分类基准用户在每个类别的欧式距离,通过欧式距离表示第一用户与分类基准用户的第二相似度,第二相似度可以用于表征用户对同一类别的内容在喜好程度上的相似程度。举例来说,若预先设置欧式距离在0-10为很相似,10-20为比较相似,20以上为不相似,第一用户在A类别的浏览次数为10次,分类基准用户在A类别的浏览次数为15次,根据欧式距离的计算公式:其中p为第一用户的坐标,q为分类基准用户的坐标,只计算一个类别的欧式距离时,则n=1,计算得到的欧式距离为因而得到第一用户和分类基准用户在A类别的第二相似度,该第二相似度表征该第一用户与该分类基准用户对A类别的喜好程度很相似。由于欧式距离得到的值为0到无穷大,在实际应用中需要做二次转化为[0,1]之间以方便计算,使用如下公式:
S206,电子设备将所述第一用户划分至所述多个目标分组中与所述M个第二相似度对应的目标分组中。
S205和S206中,以汽车营销为例,将浏览类别偏好相似的用户划分到一个分组后,还可以对类别偏好相似的用户进行进一步精细的分群,确定出一个用户与对应的分类基准用户具体在每个类别上的相似度,例如第一用户、第二用户与分类基准用户在浏览类别偏好上,都是浏览家庭类、旅游类较多,浏览汽车科技类较少的用户,而具体到某一个类别时,可能第一用户相对来说浏览家庭类的次数较高,旅游类较低,而第二用户浏览家庭类的次数较低,旅游类较高,在对用户分类时,第一用户和第二用户还可以继续划分到不同的分组中,对用户进行更精细的分类,在后续营销时,针对第一用户可以推荐更偏向家庭类的车型、第二用户可以推荐更偏向旅游类的车型,或者是向第一用户和第二用户分别推荐分类基准用户对应的车型的不同配置,根据用户得喜好和需求安排营销活动,此外,若车辆营销商想要针对特定的某款车辆安排营销活动,分类基准用户则可以是已经购买该车辆的用户,与该分类基准用户匹配的用户认为购买该车的可能性较高,为该车潜在客户可在该车营销时重点关注,而与该分类基准用户不匹配的用户,则认为其购买该车的可能性相对较小,可以暂时不将其考虑到该车营销活动中。
可以看出,本申请实施例中,电子设备先获取每个用户的浏览行为数据,第一用户的浏览行为数据包括:第一用户针对M个类别的浏览次数,然后根据第一用户针对M个类别的浏览次数,确定第一用户与每个分类基准用户的第一相似度,并进一步根据第一相似度,将第一用户划分至匹配的分类基准用户对应的参考分组中,然后再根据第一用户针对M个类别中每个类别的浏览次数,确定第一用户与匹配的分类基准用户在每个类别上的相似度,并将第一用户划分至与M个第二相似度对应的目标分组中,可见,根据用户针对M个类别的浏览次数,分别确定出用户与分类基准用户的第一相似度和M个第二相似度,并根据第一相似度和第二相似度对用户两次分组,有利于对用户进行精准分类。
在一个可能的示例中,所述根据所述第一用户针对所述M个类别的浏览次数,确定每个用户与每个分类基准用户的第一相似度,包括:建立多维坐标系;根据所述M个类别的浏览次数,确定所述第一用户在所述多维坐标系的第一特征向量;确定每个基准用户在所述多维坐标系的第二特征向量;计算所述第一特征向量与每个分类基准用户对应的第二特征向量的余弦相似度,将所述余弦相似度作为所述第一用户与每个分类基准用户的第一相似度。
具体实现中,建立的多维坐标系的维度可以与M个类别一一对应,用户针对某个类别的浏览次数,则可以在坐标系中该类别对应维度的坐标值上体现,例如用户浏览某类别的次数直接作为对应维度的坐标值,或者在浏览次数较大时,浏览次数N次对应坐标上1个单位。举例来说,例如有A、B、C三个类别,建立三维坐标系,用户1浏览A类别100次,B类别50次,C类别10次,则用户分别对应三个维度的坐标值可以是100、50、10,用户1的特征向量可以表示为(100,50,10),或者浏览次数10次对应坐标上一个单位,用户1的特征向量可以表示为(10,5,1)。
第一特征向量和一个第二特征向量的余弦相似度计算的公式为:其中,p,q分别为第一特征向量和第二特征向量,i的取值等于M。余弦相似度量的是两个向量之间的夹角,当两个向量的夹角为0度时,余弦值为1,当夹角为90度时,余弦值为0,为180度时,余弦值则为-1,余弦相似度的设计思想是:两个向量,只要方向一致,无论程度强弱,都可以视为“相似”。
其中,确定与第一用户匹配的分类基准用户时,可以是第一用户与某个分类基准用户的余弦相似度在某个阈值范围之内时,则确定该分类基准用户与第一用户匹配,例如设置与用户余弦相似度在0-1之间的分类基准用户与该用户匹配,阈值范围可以根据实际情况进行调整,若一个用户存在多个余弦相似度满足条件的分类基准用户,可以将相似度最高的分类基准用户作为匹配的基准用户。
可见,本示例中,在确定第一用户与每个分类基准用户的第一相似度时,先建立多维坐标系,然后根据M个类别的浏览次数,确定第一用户在多维坐标系的第一特征向量,以及每个基准用户在多维坐标系的第二特征向量,并计算第一特征向量与每个第二特征向量的余弦相似度,将数据映射到多为坐标系中,根据对应的向量进行计算,有利于提高确定第一相似度的准确性。
在一个可能的示例中,所述将所述第一用户划分至所述多个目标分组中与所述M个第二相似度对应的目标分组中,包括:根据所述第一用户对应的M个第二相似度,确定所述第一用户的第一分类标准;从多个预设分类标准中确定出与所述第一分类标准匹配的第一预设分类标准,所述多个预设分类标准与所述多个目标分组一一对应;将所述第一用户划分至与所述第一预设分类标准对应的目标分组中。
举例来说,以A、B两个类别,将第二相似度为0-0.3分为高相似、第二项相似度为0.4-1分为低相似两种程度进行描述,多个预设分类标准包括:“A:高相似、B:高相似”,对应目标分组1;“A:低相似、B:高相似”,对应目标分组2;“A:高相似、B:低相似”,对应目标分组3;“A:低相似,B:低相似”,对应目标分组3为例。若确定出第一用户与匹配的分类基准用户在A、B两类的第二相似度分别为0.2和0.5,则该第一用户的第一分类标准可以为“A:低相似、B:高相似”,因此,第一用户的第一分类标准对应的第一预设分类标准为“A:低相似、B:高相似”,将该第一用户划分至目标分组2中。一个目标分组中的每个用户与匹配的分类基准用户,在每个类别上的第二相似度均满足同一分类标准。
可见,本示例中,先根据第一用户对应的M个第二相似度,确定第一用户的第一分类标准,然后从多个预设分类标准中确定出与第一分类标准匹配的第一预设分类标准,进而将第一用户划分至与第一预设分类标准对应的目标分组中,同一目标分组中的用户在每个类别上的第二相似度都满足同一分类标准,有利于对用户进行精细化分类。
在一个可能的示例中,在所述分类基准用户为已购车用户的情况下,所述方法还包括:获取所述分类基准用户已购车的车辆参数,所述车辆参数包括以下至少一种:车型、颜色、尺寸、性能、价格;从数据库获取与所述分类基准用户已购车的车辆参数匹配的候选车,所述数据库中存储有汽车销售方当前在售车辆的数据;将所述候选车推送给所述第一用户。
具体实现中,候选车可以是与分类基准用户已购车辆相同的车,或者是在各种参数与分类基准用户已购车辆相似的车,例如已购车辆为中型家用汽车、颜色为黑色、性能较好、价格25万,则可以从数据库中确定出中型家用汽车、颜色为深色、性能较好,价格在20-30万之间的车作为候选车推送给第一用户。
另外,由于同一参考分组对应的多个目标分组中,每个目标分组内用户对应的第一分类标准都存在一定差异,即不同目标分组中用户与分类基准用户在每个类别上的第二相似度存在差异,因此在获取参数与分类基准用户已购车辆相似的候选车时,可以根据不同目标分组中用户对应的第一分类标准,确定候选车辆的车辆参数范围,即从数据库获取与分类基准用户已购车的车辆参数匹配的候选车,包括:获取第一用户对应的第一分类标准,从数据库中获取与分类基准用户已购车的车辆参数和该第一分类标准匹配的候选车。
以分类基准用户已购车辆为中型家用汽车、颜色为黑色为例,若获取到第一用户对应的第一分类标准为:深色车辆类别高相似,中型车辆类别低相似,即第一用户与分类基准用户在深色车辆类别上的第二相似度为高,在中型车辆类别上的第二相似度为低,在获取候选车辆时,车型范围可以扩宽一些,而车辆颜色的范围可以相对较小,获取到的候选车辆可以是为中小型-中大型家用车,颜色为深色。若第一用户对应的第一分类标准为:深色车辆类别低相似,中型车辆类别高相似,则候选车辆可以是中型家用车、颜色为深色或浅色。
可见,本示例中,在分类基准用户为已购车用户的情况下,还可以获取分类基准用户已购车的车辆参数,然后从数据库获取与分类基准用户已购车的车辆参数匹配的候选车,将其推送给第一用户,由于第一用户和分类基准用户浏览喜好相似,因此该候选车辆更可能符合第一用户的喜好和需求,有利于根据用户分类结果进行精细化的业务活动安排。
在一个可能的示例中,在所述分类基准用户为已购理财产品用户的情况下,所述方法还包括:获取所述分类基准用户已购理财产品的产品参数,所述产品参数包括以下至少一种:产品类别、风险程度、获利能力、资金可流动性;从理财产品数据库中,获取与所述分类基准用户已购理财产品的产品参数匹配的候选理财产品;将所述候选理财产品推送给所述第一用户。
具体实现中,候选理财产品可以是与分类基准用户已购理财产品相同的理财产品,或者是在各种参数与分类基准用户已购理财产品相似的理财产品,例如已购理财产品为基金,风险程度为中,获利能力为中,资金可流动性较强,则可以在数据库中确定出产品参数符合上述标准的理财产品作为候选理财产品推送给第一用户。
另外,由于同一参考分组对应的多个目标分组中,每个目标分组内用户对应的第一分类标准都存在一定差异,即不同目标分组中用户与分类基准用户在每个类别上的第二相似度存在差异,因此在获取参数与分类基准用户已购理财产品相似的理财产品时,可以根据不同目标分组中用户对应的第一分类标准,确定候选理财产品的产品参数范围,即从数据库获取与分类基准用户已购理财产品的产品参数匹配的候选车,包括:获取第一用户对应的第一分类标准,从理财产品数据库中,获取与分类基准用户已购理财产品的产品参数和该第一分类标准匹配的候选理财产品。
可见,本示例中,在分类基准用户为已购理财产品用户的情况下,还可以获取分类基准用户已购理财产品的产品参数,然后从产品数据库中获取与分类基准用户已购理财产品匹配的候选理财产品,并将其推送给第一用户,由于第一用户和分类基准用户浏览喜好相似,因此该候选理财产品更可能符合第一用户的喜好和需求,有利于根据用户分类结果进行精细化的业务活动安排。
在一个可能的示例中,在所述分类基准用户为已购车辆保险用户的情况下,所述方法还包括:获取所述分类基准用户已购车辆保险的保险信息,所述保险信息包括以下至少一种:保险险种、保险费用、保障额度、保险公司、保险公司信用等级;从车辆保险数据库中,获取与所述分类基准用户已购车辆保险的保险信息匹配的候选车辆保险;将所述候选车辆保险推送给所述第一用户。
具体实现中,候选车辆保险可以是与分类基准用户已购车辆保险相同的车辆保险,或者是保险信息与分类基准用户已购车辆保险相似的车辆保险,例如分类基准用户购买了保险产品1,保险险种为全车抢盗险,保险费用为五百元每年,保障额度为一万元,保险公司为A公司,A公司的信用等级为优,则可以直接选择该保险产品为候选车辆保险,或者,可以确定出全车抢盗险中,保险费用为每年450-550元、保证额度为9000-11000元、保险公司的信用等级为优的车辆保险,作为候选车辆保险推送给第一用户。
另外,由于同一参考分组对应的多个目标分组中,每个目标分组内用户对应的第一分类标准都存在一定差异,即不同目标分组中用户与分类基准用户在每个类别上的第二相似度存在差异,因此在获取参数与分类基准用户已购车辆保险相似的候选车辆保险时,可以根据不同目标分组中用户对应的第一分类标准,确定候选车辆保险的保险信息选择范围,即从数据库获取与分类基准用户已购车辆保险的保险信息匹配的候选车,包括:获取第一用户对应的第一分类标准,从车辆保险数据库中,获取与分类基准用户已购车辆保险的保险信息和该第一分类标准匹配的候选车。
可见,本示例中,在分类基准用户为已购车辆保险用户的情况下,还可以获取分类基准用户已购车辆保险的保险信息,然后从车辆保险数据库中,获取与分类基准用户已购车辆保险的保险信息匹配的候选车辆保险,并将其推送给第一用户,由于第一用户和分类基准用户浏览喜好相似,因此该候选车辆保险更可能符合第一用户的喜好和需求,有利于根据用户分类结果进行精细化的业务活动安排。
在一个可能的示例中,在所述分类基准用户为已购出行服务用户的情况下,所述方法还包括:获取所述分类基准用户已购出行服务的服务信息,所述服务信息包括以下至少一种:出行目的地、出行交通方式、出行时长、出行费用构成;从出行服务数据库中,获取与所述分类基准用户已购出行服务的服务信息匹配的候选出行服务;将所述候选出行服务推送给所述第一用户。
举例来说,分类基准用户出行目的地为A地,出行方式为飞机直达,出行共3天,出行费用共3000元,其中机票1000元、一般酒店住宿1000元、餐饮消费1000元,则可以将服务信息与分类基准用户已购的出行服务相同的出行服务作为候选服务,推送给第一用户,也可以确定出数据库中服务信息包括:出行目的地为与A地相同类型的出行地点、出行方式为公共交通直达、出行时长为2-7天、出行费用中交通费用在900-1100元、住宿为单天200-400元的一般酒店、餐饮消费在900-1100元的出行服务,将该出行服务确定为候选出行服务推送给第一用户。
另外,由于同一参考分组对应的多个目标分组中,每个目标分组内用户对应的第一分类标准都存在一定差异,即不同目标分组中用户与分类基准用户在每个类别上的第二相似度存在差异,因此在获取参数与分类基准用户已购出行服务相似的出行服务时,可以根据不同目标分组中用户对应的第一分类标准,确定候选出行服务的服务信息选择范围,即从数据库获取与分类基准用户已购出行服务的服务信息匹配的候选出行服务,包括:获取第一用户对应的第一分类标准,从出行服务数据库中,获取与分类基准用户已购出行服务的服务信息和该第一分类标准匹配的候选车。
可见,本示例中,在分类基准用户为已购出行服务用户的情况下,还可以获取分类基准用户已购出行服务的服务信息,然后从出行服务数据库中,获取与分类基准用户已购出行服务的服务信息匹配的候选出行服务并将其推送给第一用户,由于第一用户和分类基准用户浏览喜好相似,因此该候选出行服务更可能符合第一用户的喜好和需求,有利于根据用户分类结果进行精细化的业务活动安排。
上面介绍了本申请实施例的方法,下面介绍本申请实施例的装置。
请参阅图3,图3是本申请实施例提供的一种用户分类装置的组成结构示意图,该装置30包括:
获取单元301,用于获取至少一个用户中每个用户的浏览行为数据,第一用户的浏览行为数据包括:所述第一用户针对M个类别的浏览次数,所述M为正整数,所述第一用户为所述至少一个用户中的任意一个用户;
第一确定单元302,用于根据所述第一用户针对所述M个类别的浏览次数,确定所述第一用户与每个分类基准用户的第一相似度;根据所述第一用户与每个分类基准用户对应的第一相似度,确定与所述第一用户匹配的分类基准用户;
第一分组单元303,用于将所述第一用户划分至所述匹配的分类基准用户对应的参考分组中,所述参考分组对应多个目标分组;
第二确定单元304,用于根据所述第一用户针对所述M个类别中每个类别的浏览次数,确定所述第一用户与所述匹配的分类基准用户在每个类别上的相似度,得到所述第一用户与所述匹配的分类基准用户对应的M个第二相似度;
第二分组单元305,用于将所述第一用户划分至所述多个目标分组中与所述M个第二相似度对应的目标分组中。
在一个可能的示例中,在所述根据所述第一用户针对所述M个类别的浏览次数,确定所述第一用户与每个分类基准用户的第一相似度方面,所述第一确定单元302具体用于:建立多维坐标系;根据所述M个类别的浏览次数,确定所述第一用户在所述多维坐标系的第一特征向量;确定每个分类基准用户在所述多维坐标系的第二特征向量;计算所述第一特征向量与每个分类基准用户对应的第二特征向量的余弦相似度,将所述余弦相似度作为所述第一用户与每个分类基准用户的第一相似度。
在一个可能的示例中,所述第二分组单元305具体用于:根据所述第一用户对应的M个第二相似度,确定所述第一用户的第一分类标准;从多个预设分类标准中确定出与所述第一分类标准匹配的第一预设分类标准,所述多个预设分类标准与所述多个目标分组一一对应;将所述第一用户划分至与所述第一预设分类标准对应的目标分组中。
在一个可能的示例中,在所述分类基准用户为已购车用户的情况下,所述装置30还包括:第一推送单元306,用于获取所述分类基准用户已购车的车辆参数,所述车辆参数包括以下至少一种:车型、颜色、尺寸、性能、价格;从数据库获取与所述分类基准用户已购车的车辆参数匹配的候选车,所述数据库中存储有汽车销售方当前在售车辆的数据;将所述候选车推送给所述第一用户。
在一个可能的示例中,在所述分类基准用户为已购理财产品用户的情况下,所述装置30还包括:第二推送单元307,用于获取所述分类基准用户已购理财产品的产品参数,所述产品参数包括以下至少一种:产品类别、风险程度、获利能力、资金可流动性;从理财产品数据库中,获取与所述分类基准用户已购理财产品的产品参数匹配的候选理财产品;将所述候选理财产品推送给所述第一用户。
在一个可能的示例中,在所述分类基准用户为已购车辆保险用户的情况下,所述装置30还包括:第三推送单元308,用于获取所述分类基准用户已购车辆保险的保险信息,所述保险信息包括以下至少一种:保险险种、保险费用、保障额度、保险公司、保险公司信用等级;从车辆保险数据库中,获取与所述分类基准用户已购车辆保险的保险信息匹配的候选车辆保险;将所述候选车辆保险推送给所述第一用户。
在一个可能的示例中,在所述分类基准用户为已购出行服务用户的情况下,所述装置30还包括:第四推送单元309,用于获取所述分类基准用户已购出行服务的服务信息,所述服务信息包括以下至少一种:出行目的地、出行交通方式、出行时长、出行费用构成;从出行服务数据库中,获取与所述分类基准用户已购出行服务的服务信息匹配的候选出行服务;将所述候选出行服务推送给所述第一用户。
可以看出,本申请实施例中,用户分类装置可通过各单元实现:先获取每个用户的浏览行为数据,第一用户的浏览行为数据包括:第一用户针对M个类别的浏览次数,然后根据第一用户针对M个类别的浏览次数,确定第一用户与每个分类基准用户的第一相似度,并进一步根据第一相似度,将第一用户划分至匹配的分类基准用户对应的参考分组中,然后再根据第一用户针对M个类别中每个类别的浏览次数,确定第一用户与匹配的分类基准用户在每个类别上的相似度,并将第一用户划分至与M个第二相似度对应的目标分组中,可见,根据用户针对M个类别的浏览次数,分别确定出用户与分类基准用户的第一相似度和M个第二相似度,并根据第一相似度和第二相似度对用户两次分组,有利于对用户进行精准分类。
需要说明的是,上述各单元(获取单元301、第一确定单元302、第一分组单元303、第二确定单元304和第二分组单元305)用于执行上述方法的相关步骤。比如获取单元301用于执行S201的相关内容,第一确定单元302用于执行S202和S203的相关内容,第一分组单元303用于执行S204的相关内容,第二确定单元304用于执行S205的相关内容,第二分组单元305用于执行S206的相关内容。
可以理解的是,由于方法实施例与装置实施例为相同技术构思的不同呈现形式,因此,本申请中方法实施例部分的内容应同步适配于装置实施例部分,此处不再赘述。
在本实施例中,用户分类装置30是以单元的形式来呈现。这里的“单元”可以指特定应用集成电路(application-specific integrated circuit,ASIC),执行一个或多个软件或固件程序的处理器和存储器,集成逻辑电路,和/或其他可以提供上述功能的器件。
请参阅图4,图4是本申请实施例提供的一种电子设备的组成结构示意图,该电子设备40包括处理器401、存储器402以及通信接口403。处理器401连接到存储器402和通信接口403,例如处理器401可以通过总线连接到存储器402和通信接口403。
处理器401可以是通用中央处理器(CPU),微处理器,特定应用集成电路(application-specific integrated circuit,ASIC),或一个或多个用于控制以上方案程序执行的集成电路。
通信接口403,用于与其他设备或通信网络通信,如以太网,无线接入网(RAN),无线局域网(Wireless Local Area Networks,WLAN)等。
存储器402可以是只读存储器(read-only memory,ROM)或可存储静态信息和指令的其他类型的静态存储设备,随机存取存储器(random access memory,RAM)或者可存储信息和指令的其他类型的动态存储设备,也可以是电可擦可编程只读存储器(ElectricallyErasable Programmable Read-Only Memory,EEPROM)、只读光盘(Compact Disc Read-Only Memory,CD-ROM)或其他光盘存储、光碟存储(包括压缩光碟、激光碟、光碟、数字通用光碟、蓝光光碟等)、磁盘存储介质或者其他磁存储设备、或者能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质,但不限于此。存储器可以是独立存在,通过总线与处理器相连接。存储器也可以和处理器集成在一起。
其中,所述存储器402用于存储执行以上方案的应用程序代码,并由处理器401来控制执行。所述处理器401用于执行所述存储器402中存储的应用程序代码。存储器402存储的代码可执行以上提供的任一种用户分类方法。
在一个可能的示例中,存储器402存储的代码用于执行以下步骤:获取至少一个用户中每个用户的浏览行为数据,第一用户的浏览行为数据包括:所述第一用户针对M个类别的浏览次数,所述M为正整数,所述第一用户为所述至少一个用户中的任意一个用户;根据所述第一用户针对所述M个类别的浏览次数,确定所述第一用户与每个分类基准用户的第一相似度;根据所述第一用户与每个分类基准用户对应的第一相似度,确定与所述第一用户匹配的分类基准用户;将所述第一用户划分至所述匹配的分类基准用户对应的参考分组中,所述参考分组对应多个目标分组;根据所述第一用户针对所述M个类别中每个类别的浏览次数,确定所述第一用户与所述匹配的分类基准用户在每个类别上的相似度,得到所述第一用户与所述匹配的分类基准用户对应的M个第二相似度;将所述第一用户划分至所述多个目标分组中与所述M个第二相似度对应的目标分组中。
在一个可能的示例中,在所述根据所述第一用户针对所述M个类别的浏览次数,确定所述第一用户与每个分类基准用户的第一相似度方面,存储器402存储的代码具体用于执行以下步骤:建立多维坐标系;根据所述M个类别的浏览次数,确定所述第一用户在所述多维坐标系的第一特征向量;确定每个分类基准用户在所述多维坐标系的第二特征向量;计算所述第一特征向量与每个分类基准用户对应的第二特征向量的余弦相似度,将所述余弦相似度作为所述第一用户与每个分类基准用户的第一相似度。
在一个可能的示例中,在所述将所述第一用户划分至所述多个目标分组中与所述M个第二相似度对应的目标分组中方面,存储器402存储的代码具体用于执行以下步骤:根据所述第一用户对应的M个第二相似度,确定所述第一用户的第一分类标准;从多个预设分类标准中确定出与所述第一分类标准匹配的第一预设分类标准,所述多个预设分类标准与所述多个目标分组一一对应;将所述第一用户划分至与所述第一预设分类标准对应的目标分组中。
在一个可能的示例中,在所述分类基准用户为已购车用户的情况下,存储器402存储的代码还用于执行以下步骤:获取所述分类基准用户已购车的车辆参数,所述车辆参数包括以下至少一种:车型、颜色、尺寸、性能、价格;从数据库获取与所述分类基准用户已购车的车辆参数匹配的候选车,所述数据库中存储有汽车销售方当前在售车辆的数据;将所述候选车推送给所述第一用户。
在一个可能的示例中,在所述分类基准用户为已购理财产品用户的情况下,存储器402存储的代码还用于执行以下步骤:获取所述分类基准用户已购理财产品的产品参数,所述产品参数包括以下至少一种:产品类别、风险程度、获利能力、资金可流动性;从理财产品数据库中,获取与所述分类基准用户已购理财产品的产品参数匹配的候选理财产品;将所述候选理财产品推送给所述第一用户。
在一个可能的示例中,在所述分类基准用户为已购车辆保险用户的情况下,存储器402存储的代码还用于执行以下步骤:获取所述分类基准用户已购车辆保险的保险信息,所述保险信息包括以下至少一种:保险险种、保险费用、保障额度、保险公司、保险公司信用等级;从车辆保险数据库中,获取与所述分类基准用户已购车辆保险的保险信息匹配的候选车辆保险;将所述候选车辆保险推送给所述第一用户。
在一个可能的示例中,在所述分类基准用户为已购出行服务用户的情况下,存储器402存储的代码还用于执行以下步骤:获取所述分类基准用户已购出行服务的服务信息,所述服务信息包括以下至少一种:出行目的地、出行交通方式、出行时长、出行费用构成;从出行服务数据库中,获取与所述分类基准用户已购出行服务的服务信息匹配的候选出行服务;将所述候选出行服务推送给所述第一用户。
本申请实施例还提供一种计算机存储介质,其中,该计算机存储介质存储用于电子数据交换的计算机程序,该计算机程序使得计算机执行如上述方法实施例中记载的任一方法的部分或全部步骤。
本申请实施例还提供一种计算机程序产品,上述计算机程序产品包括存储了计算机程序的非瞬时性计算机可读存储介质,上述计算机程序可操作来使计算机执行如上述方法实施例中记载的任一方法的部分或全部步骤。该计算机程序产品可以为一个软件安装包。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请并不受所描述的动作顺序的限制,因为依据本申请,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本申请所必须的。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置,可通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如上述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性或其它的形式。
上述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
上述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储器中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储器中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本申请各个实施例上述方法的全部或部分步骤。而前述的存储器包括:U盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储器中,存储器可以包括:闪存盘、只读存储器(英文:Read-Only Memory,简称:ROM)、随机存取器(英文:Random Access Memory,简称:RAM)、磁盘或光盘等。
以上对本申请实施例进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。
Claims (10)
1.一种用户分类方法,其特征在于,包括:
获取至少一个用户中每个用户的浏览行为数据,第一用户的浏览行为数据包括:所述第一用户针对M个类别的浏览次数,所述M为正整数,所述第一用户为所述至少一个用户中的任意一个用户;
根据所述第一用户针对所述M个类别的浏览次数,确定所述第一用户与每个分类基准用户的第一相似度;
根据所述第一用户与每个分类基准用户对应的第一相似度,确定与所述第一用户匹配的分类基准用户;
将所述第一用户划分至所述匹配的分类基准用户对应的参考分组中,所述参考分组对应多个目标分组;
根据所述第一用户针对所述M个类别中每个类别的浏览次数,确定所述第一用户与所述匹配的分类基准用户在每个类别上的相似度,得到所述第一用户与所述匹配的分类基准用户对应的M个第二相似度;
将所述第一用户划分至所述多个目标分组中与所述M个第二相似度对应的目标分组中。
2.根据权利要求1所述的方法,其特征在于,所述根据所述第一用户针对所述M个类别的浏览次数,确定所述第一用户与每个分类基准用户的第一相似度,包括:
建立多维坐标系;
根据所述M个类别的浏览次数,确定所述第一用户在所述多维坐标系的第一特征向量;
确定每个分类基准用户在所述多维坐标系的第二特征向量;
计算所述第一特征向量与每个分类基准用户对应的第二特征向量的余弦相似度,将所述余弦相似度作为所述第一用户与每个分类基准用户的第一相似度。
3.根据权利要求1所述的方法,其特征在于,所述将所述第一用户划分至所述多个目标分组中与所述M个第二相似度对应的目标分组中,包括:
根据所述第一用户对应的M个第二相似度,确定所述第一用户的第一分类标准;
从多个预设分类标准中确定出与所述第一分类标准匹配的第一预设分类标准,所述多个预设分类标准与所述多个目标分组一一对应;
将所述第一用户划分至与所述第一预设分类标准对应的目标分组中。
4.根据权利要求1-3任一项所述的方法,其特征在于,在所述分类基准用户为已购车用户的情况下,所述方法还包括:
获取所述分类基准用户已购车的车辆参数,所述车辆参数包括以下至少一种:车型、颜色、尺寸、性能、价格;
从数据库获取与所述分类基准用户已购车的车辆参数匹配的候选车,所述数据库中存储有汽车销售方当前在售车辆的数据;
将所述候选车推送给所述第一用户。
5.根据权利要求1-3任一项所述的方法,其特征在于,在所述分类基准用户为已购理财产品用户的情况下,所述方法还包括:
获取所述分类基准用户已购理财产品的产品参数,所述产品参数包括以下至少一种:产品类别、风险程度、获利能力、资金可流动性;
从理财产品数据库中,获取与所述分类基准用户已购理财产品的产品参数匹配的候选理财产品;
将所述候选理财产品推送给所述第一用户。
6.根据权利要求1-3任一项所述的方法,其特征在于,在所述分类基准用户为已购车辆保险用户的情况下,所述方法还包括:
获取所述分类基准用户已购车辆保险的保险信息,所述保险信息包括以下至少一种:保险险种、保险费用、保障额度、保险公司、保险公司信用等级;
从车辆保险数据库中,获取与所述分类基准用户已购车辆保险的保险信息匹配的候选车辆保险;
将所述候选车辆保险推送给所述第一用户。
7.根据权利要求1-3任一项所述的方法,其特征在于,在所述分类基准用户为已购出行服务用户的情况下,所述方法还包括:
获取所述分类基准用户已购出行服务的服务信息,所述服务信息包括以下至少一种:出行目的地、出行交通方式、出行时长、出行费用构成;
从出行服务数据库中,获取与所述分类基准用户已购出行服务的服务信息匹配的候选出行服务;
将所述候选出行服务推送给所述第一用户。
8.一种用户分类装置,其特征在于,包括:
获取单元,用于获取至少一个用户中每个用户的浏览行为数据,第一用户的浏览行为数据包括:所述第一用户针对M个类别的浏览次数,所述M为正整数,所述第一用户为所述至少一个用户中的任意一个用户;
第一确定单元,用于根据所述第一用户针对所述M个类别的浏览次数,确定所述第一用户与每个分类基准用户的第一相似度;根据所述第一用户与每个分类基准用户对应的第一相似度,确定与所述第一用户匹配的分类基准用户;
第一分组单元,用于将所述第一用户划分至所述匹配的分类基准用户对应的参考分组中,所述参考分组对应多个目标分组;
第二确定单元,用于根据所述第一用户针对所述M个类别中每个类别的浏览次数,确定所述第一用户与所述匹配的分类基准用户在每个类别上的相似度,得到所述第一用户与所述匹配的分类基准用户对应的M个第二相似度;
第二分组单元,用于将所述第一用户划分至所述多个目标分组中与所述M个第二相似度对应的目标分组中。
9.一种电子设备,其特征在于,包括处理器、存储器、通信接口,以及一个或多个程序,所述一个或多个程序被存储在所述存储器中,并且被配置由所述处理器执行,所述程序包括用于执行如权利要求1-7任一项所述的方法中的步骤的指令。
10.一种计算机可读存储介质,其特征在于,存储用于电子数据交换的计算机程序,其中,所述计算机程序使得计算机执行如权利要求1-7任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010896133.7A CN112001761A (zh) | 2020-08-31 | 2020-08-31 | 用户分类方法及相关装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010896133.7A CN112001761A (zh) | 2020-08-31 | 2020-08-31 | 用户分类方法及相关装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112001761A true CN112001761A (zh) | 2020-11-27 |
Family
ID=73464750
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010896133.7A Pending CN112001761A (zh) | 2020-08-31 | 2020-08-31 | 用户分类方法及相关装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112001761A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113902577A (zh) * | 2021-10-29 | 2022-01-07 | 众安在线财产保险股份有限公司 | 保险业务数据的处理方法、装置、电子设备及计算机存储介质 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102411754A (zh) * | 2011-11-29 | 2012-04-11 | 南京大学 | 一种基于商品属性熵值的个性化推荐方法 |
CN102722838A (zh) * | 2012-05-25 | 2012-10-10 | 北京邮电大学 | 用于网站向用户推荐物品的方法和装置 |
CN106296368A (zh) * | 2016-08-19 | 2017-01-04 | 北京好车轰轰电子商务有限公司 | 一种车型推荐系统和方法 |
CN107562793A (zh) * | 2017-08-01 | 2018-01-09 | 佛山市深研信息技术有限公司 | 一种大数据挖掘方法 |
CN109447728A (zh) * | 2018-09-07 | 2019-03-08 | 平安科技(深圳)有限公司 | 金融产品推荐方法、装置、计算机设备及存储介质 |
CN109766913A (zh) * | 2018-12-11 | 2019-05-17 | 东软集团股份有限公司 | 用户分群方法、装置、计算机可读存储介质及电子设备 |
CN110245687A (zh) * | 2019-05-17 | 2019-09-17 | 腾讯科技(上海)有限公司 | 用户分类方法以及装置 |
CN111310009A (zh) * | 2020-01-16 | 2020-06-19 | 珠海格力电器股份有限公司 | 用户分类方法、装置、存储介质、计算机设备 |
-
2020
- 2020-08-31 CN CN202010896133.7A patent/CN112001761A/zh active Pending
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102411754A (zh) * | 2011-11-29 | 2012-04-11 | 南京大学 | 一种基于商品属性熵值的个性化推荐方法 |
CN102722838A (zh) * | 2012-05-25 | 2012-10-10 | 北京邮电大学 | 用于网站向用户推荐物品的方法和装置 |
CN106296368A (zh) * | 2016-08-19 | 2017-01-04 | 北京好车轰轰电子商务有限公司 | 一种车型推荐系统和方法 |
CN107562793A (zh) * | 2017-08-01 | 2018-01-09 | 佛山市深研信息技术有限公司 | 一种大数据挖掘方法 |
CN109447728A (zh) * | 2018-09-07 | 2019-03-08 | 平安科技(深圳)有限公司 | 金融产品推荐方法、装置、计算机设备及存储介质 |
CN109766913A (zh) * | 2018-12-11 | 2019-05-17 | 东软集团股份有限公司 | 用户分群方法、装置、计算机可读存储介质及电子设备 |
CN110245687A (zh) * | 2019-05-17 | 2019-09-17 | 腾讯科技(上海)有限公司 | 用户分类方法以及装置 |
CN111310009A (zh) * | 2020-01-16 | 2020-06-19 | 珠海格力电器股份有限公司 | 用户分类方法、装置、存储介质、计算机设备 |
Non-Patent Citations (3)
Title |
---|
于洪涛;段军义;: "基于分类和聚类相结合的个性化检索方法研究", 燕山大学学报, no. 06, pages 23 - 26 * |
刘贵平;: "基于浏览行为的用户价值细分研究", 内蒙古大学学报(自然科学版), no. 06, pages 67 - 71 * |
李辉;梅佩;易军凯;: "基于混合度量方法的用户兴趣模型", 计算机工程与设计, no. 03, pages 98 - 102 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113902577A (zh) * | 2021-10-29 | 2022-01-07 | 众安在线财产保险股份有限公司 | 保险业务数据的处理方法、装置、电子设备及计算机存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108121737B (zh) | 一种业务对象属性标识的生成方法、装置和系统 | |
US9691096B1 (en) | Identifying item recommendations through recognized navigational patterns | |
CN107291732B (zh) | 一种信息推送方法及装置 | |
CN108573428A (zh) | 一种资源推荐方法和装置 | |
EP2813989A2 (en) | Search method and device based on e-commerce platform | |
US20130238397A1 (en) | Data Processing Based on Online Transaction Platform | |
CN112102031A (zh) | 一种推荐方法、推荐装置及终端设备 | |
CN108429776B (zh) | 网络对象的推送方法、装置、客户端、交互设备以及系统 | |
CN103425664A (zh) | 一种对实体数据单元进行搜索、显示的方法和设备 | |
CN110674391B (zh) | 基于大数据的产品数据推送方法、系统和计算机设备 | |
CN109767302B (zh) | 大数据精准模型的构建方法及装置 | |
CN112513898A (zh) | 酒精饮料信息管理系统及管理方法 | |
CN112465598A (zh) | 一种用户画像生成方法、装置、设备及计算机存储介质 | |
CN112001761A (zh) | 用户分类方法及相关装置 | |
CN111198989A (zh) | 确定出行推荐数据的方法、装置、存储介质及电子设备 | |
CN113327132A (zh) | 多媒体推荐方法、装置、设备及存储介质 | |
CN107977876B (zh) | 用于处理订单信息的方法及装置 | |
CN106204163B (zh) | 一种用户属性特征的确定方法和装置 | |
CN108510302A (zh) | 一种营销决策方法及交易服务器 | |
CN110020135B (zh) | 一种需求确定方法、资源推荐方法和相关装置 | |
CN103778551A (zh) | 商品信息提示方法及装置 | |
CN111274471A (zh) | 信息推送方法、装置、服务器及可读存储介质 | |
CN115578155A (zh) | 一种订单搜索方法、装置、计算机设备和存储介质 | |
CN113761345A (zh) | 搜索处理方法、装置、设备及存储介质 | |
CN106790522B (zh) | 对象推荐方法、装置和电商平台服务器 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
CB02 | Change of applicant information |
Address after: 201821 room 208, building 4, No. 1411, Yecheng Road, Jiading Industrial Zone, Jiading District, Shanghai Applicant after: Botai vehicle networking technology (Shanghai) Co.,Ltd. Address before: Room 208, building 4, 1411 Yecheng Road, Jiading Industrial Zone, Jiading District, Shanghai, 201800 Applicant before: SHANGHAI PATEO ELECTRONIC EQUIPMENT MANUFACTURING Co.,Ltd. |
|
CB02 | Change of applicant information |