CN109977177A - 生成用户画像的方法及装置 - Google Patents
生成用户画像的方法及装置 Download PDFInfo
- Publication number
- CN109977177A CN109977177A CN201910236658.5A CN201910236658A CN109977177A CN 109977177 A CN109977177 A CN 109977177A CN 201910236658 A CN201910236658 A CN 201910236658A CN 109977177 A CN109977177 A CN 109977177A
- Authority
- CN
- China
- Prior art keywords
- dimension
- portrait
- cluster
- dimension data
- user
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种生成用户画像的方法、装置、可读存储介质及电子设备,方法包括:获取多个用户在至少一个画像维度下的维度数据;针对每个所述画像维度,对在所述画像维度下的各个所述维度数据进行聚类以形成至少两个类簇,并确定各个所述类簇分别对应的标签名称;针对每个所述用户,检测所述用户在每个所述画像维度下的所述维度数据所属的当前类簇,并利用各个所述当前类簇分别对应的所述标签名称组成所述用户的用户画像。通过本发明的技术方案,生成的用户画像能够更为准确的体现用户信息。
Description
技术领域
本发明涉及计算机技术领域,尤其涉及生成用户画像的方法及装置。
背景技术
服务提供方(比如售电公司)为用户(比如企业及工厂等用电对象)提供服务时,通常需要针对每个用户生成该用户所对应的用户画像,根据用户画像体现的用户信息对不同的用户实施差别营销策略,从而提高用户体验以及达到其他业务目的。
目前,生成用户画像时,未能横向参考不同用户在相同画像维度(比如月均用电量)下的维度数据,根据用户在某一画像维度下的维度数据确定的标签名称具有较大的局限性,从而导致生成的用户画像无法准确体现用户信息。
发明内容
本发明提供一种生成用户画像的方法、装置、可读存储介质及电子设备,生成的用户画像能够更为准确的体现用户信息。
第一方面,本发明提供了一种生成用户画像的方法,包括:
获取多个用户在至少一个画像维度下的维度数据;
针对每个所述画像维度,对在所述画像维度下的各个所述维度数据进行聚类以形成至少两个类簇,并确定各个所述类簇分别对应的标签名称;
针对每个所述用户,检测所述用户在每个所述画像维度下的所述维度数据所属的当前类簇,并利用各个所述当前类簇分别对应的所述标签名称组成所述用户的用户画像。
优选地,
所述对在所述画像维度下的各个所述维度数据进行聚类以形成至少两个类簇,包括:
S1、从所述画像维度下的各个所述维度数据中选择预设数量个聚类中心;
S2、针对所述画像维度下的每个所述维度数据,计算所述维度数据与每个所述聚类中心之间的距离值;
S3、根据每个所述维度数据分别与每个所述聚类中心之间的距离值,将各个所述维度数据划分为至少两个候选类簇;
S4、计算各个所述候选类簇的实际聚类中心,并将计算的各个所述实际聚类中心分别作为所述聚类中心;
S5、检测所述至少两个候选类簇是否满足预设的收敛条件,如果是,则执行S6;否则执行S2;
S6、将各个所述候选类簇分别作为一个类簇。
优选地,
在所述将各个所述候选类簇分别作为一个类簇之前,还包括:
基于误差平方和准则函数检测所述预设数量是否合理,若是,则执行所述将各个所述候选类簇分别作为一个类簇。
优选地,
所述S3,包括:
针对每个所述维度数据,根据所述维度数据与每个所述聚类中心之间的距离值,记录所述维度数据与目标聚类中心之间的对应关系,其中,所述维度数据与所述目标聚类中心之间的所述距离值为计算的各个所述距离值中的最小值;
针对每个所述聚类中心,根据记录的各个所述对应关系,确定与所述聚类中心相对应的至少一个目标维度数据,并利用确定的各个所述目标维度数据组成一个候选类簇。
优选地,
所述至少一个画像维度,包括:平均用电量、节能设备比例、环境污染评价值、单位能耗、用电稳定性、日均峰谷比率中的任意一个或多个。
第二方面,本发明提供了一种生成用户画像的装置,包括:
数据获取模块,用于获取多个用户在至少一个画像维度下的维度数据;
分析处理模块,用于针对每个所述画像维度,对在所述画像维度下的各个所述维度数据进行聚类以形成至少两个类簇,并确定各个所述类簇分别对应的标签名称;
画像处理模块,用于针对每个所述用户,检测所述用户在每个所述画像维度下的所述维度数据所属的当前类簇,并利用各个所述当前类簇分别对应的所述标签名称组成所述用户的用户画像。
优选地,
所述分析处理模块,包括:配置单元、距离计算单元、聚类划分单元、迭代更新单元、收敛检测单元及确定单元;其中,
所述配置单元,用于从所述画像维度下的各个所述维度数据中选择预设数量个聚类中心;
所述距离计算单元,用于针对所述画像维度下的每个所述维度数据,计算所述维度数据与每个所述聚类中心之间的距离值;
所述聚类划分单元,用于根据每个所述维度数据分别与每个所述聚类中心之间的距离值,将各个所述维度数据划分为至少两个候选类簇;
所述迭代更新单元,用于计算各个所述候选类簇的实际聚类中心,并将计算的各个所述实际聚类中心分别作为所述聚类中心;
所述收敛检测单元,用于检测所述至少两个候选类簇是否满足预设的收敛条件,如果是,则触发所述确定单元;否则触发所述距离计算单元;
所述确定单元,用于在所述收敛检测单元的触发下将各个所述候选类簇分别作为一个类簇。
优选地,
所述分析处理模块,还包括:参数检测单元;其中,
所述参数检测单元,用于当所述至少两个候选类簇满足预设的收敛条件时,基于误差平方和准则函数检测所述预设数量是否合理,若是,则触发所述确定单元。
优选地,
所述聚类划分单元,用于针对每个所述维度数据,根据所述维度数据与每个所述聚类中心之间的距离值,记录所述维度数据与目标聚类中心之间的对应关系,其中,所述维度数据与所述目标聚类中心之间的所述距离值为计算的各个所述距离值中的最小值;针对每个所述聚类中心,根据记录的各个所述对应关系,确定与所述聚类中心相对应的至少一个目标维度数据,并利用确定的各个所述目标维度数据组成一个候选类簇。
第三方面,本发明提供了一种可读存储介质,包括执行指令,当电子设备的处理器执行所述执行指令时,所述处理器执行如第一方面中任一所述的方法。
第四方面,本发明提供了一种电子设备,包括处理器以及存储有执行指令的存储器,当所述处理器执行所述存储器存储的所述执行指令时,所述处理器执行如第一方面中任一所述的方法。
本发明提供了一种生成用户画像的方法、装置、可读存储介质及电子设备,该方法通过获取多个用户在至少一个画像维度下的维度数据,然后针对每个画像维度,对在该画像维度下的各个维度数据进行聚类以形成至少两个类簇,并确定各个类簇分别对应的标签名称,后续即可针对每个用户,检测该用户在每个画像维度下的维度数据所属的当前类簇,并利用各个当前类簇分别对应的标签名称组成用户的用户画像。根据用户在一个画像维度下的维度数据确定相应的用户标签时,通过聚类的方式综合考虑了多个不同用户在相同画像维度下的维度数据,从而使得生成的用户画像能够更为准确的体现用户信息。
附图说明
为了更清楚地说明本发明实施例或现有的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明一实施例提供的一种生成用户画像的方法的流程示意图;
图2为本发明一实施例提供的一种生成用户画像的装置的结构示意图;
图3为本发明一实施例提供的一种电子设备的结构示意图;
图4为本发明一实施例提供的另一种生成用户画像的装置中分析处理模块的结构示意图;
图5是本发明一实施例提供的又一种生成用户画像的装置中分析处理模块的结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合具体实施例及相应的附图对本发明的技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
如图1所示,本发明实施例提供了一种生成用户画像的方法,包括如下步骤101~步骤103:
步骤101,获取多个用户在至少一个画像维度下的维度数据。
这里,以用户具体包括各个企业及工厂等用电对象为例,可从售电公司的售电系统及其他业务平台获取大量用电对象在各个预设的画像维度下的维度数据;各个画像维度主要从每个用电对象的市场价值及潜在价值等两个方面进行考虑以设置,一般的,各个画像维度包括但不限于月均用电量、节能设备比例、单位能耗、用电稳定性以及日均峰谷比率中的任意一个或多个,比如,还可以包括基于用电对象的潜在价值而设置的用户忠诚度、用户信用度、合作可能性等。
举例来说,预设的画像维度包括月均用电量,有效参考时间是1年,对于一个用户A,即可获取用户A在当前时刻之前的连续12个月内的实际月均用电量,获取的实际月均用电量即为用户A对应在画像维度“月均用电量”下的维度数据。
步骤102,针对每个所述画像维度,对在所述画像维度下的各个所述维度数据进行聚类以形成至少两个类簇,并确定各个所述类簇分别对应的标签名称。
需要说明的是,各个类簇分别对应的标签名称可以由用户结合实际业务场景进行自定义设置。
作为一种实施方式,所述对在所述画像维度下的各个所述维度数据进行聚类以形成至少两个类簇,包括如下步骤S1~步骤S6:
步骤S1、从所述画像维度下的各个所述维度数据中选择预设数量个聚类中心。
需要说明的是,预设数量为经验值,其取值包括但不限于3、4、5、6中的任意一个。
步骤S2、针对所述画像维度下的每个所述维度数据,计算所述维度数据与每个所述聚类中心之间的距离值。
这里,距离值具体可以是维度数据与聚类中心之间的绝对差值。
步骤S3、根据每个所述维度数据分别与每个所述聚类中心之间的距离值,将各个所述维度数据划分为至少两个候选类簇。
作为一种实施方式,所述步骤S3包括如下步骤S31级步骤S32:
步骤S31、针对每个所述维度数据,根据所述维度数据与每个所述聚类中心之间的距离值,记录所述维度数据与目标聚类中心之间的对应关系,其中,所述维度数据与所述目标聚类中心之间的所述距离值为计算的各个所述距离值中的最小值。
举例来说,维度数据a与聚类中心A1、A2、A3、A4之间的距离值依次为a1、a2、a3、a4,对各个距离值按照由小到大的顺序进行排序,其排序结果为:a3、a2、a4、a1,那么,即可记录维度数据a与距离值a3所对应的聚类中心A3之间的对应关系。
步骤S32、针对每个所述聚类中心,根据记录的各个所述对应关系,确定与所述聚类中心相对应的至少一个目标维度数据,并利用确定的各个所述目标维度数据组成一个候选类簇。
举例来说,对于一个聚类中心A1,根据记录的各个对应关系,确定出与聚类中心A1存在对应关系的维度数据包括有a、b、c、d,那么,即可利用维度数据a、b、c、d组成聚类中心A1对应的候选类簇。
步骤S4、计算各个所述候选类簇的实际聚类中心,并将计算的各个所述实际聚类中心分别作为所述聚类中心。
以聚类中心A1对应的候选类簇具体由维度数据包括有a、b、c、d组成为例,即可计算维度数据a、b、c、d的几何重心,并将计算的几何重心作为实际聚类中心。
需要说明的是,为了方便后续检测是否满足收敛条件,每次执行步骤S4时,可将记录的迭代次数加1。
步骤S5、检测所述至少两个候选类簇是否满足预设的收敛条件,如果是,则执行步骤S6;否则执行步骤S2。
不难理解的,预设的收敛条件包括但不限于最大迭代次数,即检测记录的迭代次数是否达到预设的最大迭代次数,如果是,则说明满足收敛条件;比如,还可以包括聚类中心与该聚类中心所对应的候选类簇的实际聚类中心之间的绝对偏差,当本次迭代过程中,每个聚类中心分别与其对应的候选类簇的实际聚类中心之间的偏差值均小于该绝对偏差时,则说明满足收敛条件。
步骤S6、将各个所述候选类簇分别作为一个类簇。
本本发明一个实施例中,在所述步骤S6之前,还包括:基于误差平方和准则函数检测所述预设数量是否合理,若是,则执行所述步骤S6。
该实施例中,预设数量可能是用户预先设置的经验值,且对于不同的画像维度可能适用不同的经验值;基于误差平方和准则函数检测预设数量是否合理,当检测到预设数量不合理时,即基于误差平方和准则函数计算得到的误差平方和大于一定数值时,可修改预设数量,并根据修改后的预设数量再次执行前述各个步骤S1~步骤S5,当且仅当检测到预设数量合理时,即针对画像维度下的维度数据进行聚类后得到的候选类簇的数量合理时,才将各个候选类簇分别作为一个类簇,合理划分的类簇能够确保后续得到的用户画像能够更为准确的体现用户信息。
步骤103,针对每个所述用户,检测所述用户在每个所述画像维度下的所述维度数据所属的当前类簇,并利用各个所述当前类簇分别对应的所述标签名称组成所述用户的用户画像。
举例来说,画像维度包括“月均用电量”以及“用电稳定性”,用户A在画像维度“月均用电量”下的维度数据为“100kW·h”、在画像维度用电稳定性下的维度数据是“90%”,对画像维度“月均用电量”下的各个维度数据进行聚类以形成的类簇包括X1、X2及X3,对画像维度“用电稳定性”下的各个维度数据进行聚类以形成的类簇包括Y1、Y2及Y3,维度数据“100kW·h”所属的当前类簇为X1、维度数据“90%”所属的当前类簇为Y2,那么,即可根据利用当前类簇X1、当前类簇Y2分别对应的标签名称组成用户A的用户画像。
基于与本发明方法实施例相同的构思,请参考图2,本发明实施例还提供了一种生成用户画像的装置,在一较佳实施例中,生成用户画像的装置是由计算机程序指令组成的若干个程序模块构成,本发明所称的模块是指一种电子设备(如图3)的处理器执行并且能够完成固定功能的一系列计算机程序指令段,其存储在存储器中。所述生成用户画像的装置包括:
数据获取模块201,用于获取多个用户在至少一个画像维度下的维度数据;
分析处理模块202,用于针对每个所述画像维度,对在所述画像维度下的各个所述维度数据进行聚类以形成至少两个类簇,并确定各个所述类簇分别对应的标签名称;
画像处理模块203,用于针对每个所述用户,检测所述用户在每个所述画像维度下的所述维度数据所属的当前类簇,并利用各个所述当前类簇分别对应的所述标签名称组成所述用户的用户画像。
请参考图4,本发明一个实施例中,所述分析处理模块202,包括:配置单元2021、距离计算单元2022、聚类划分单元2023、迭代更新单元2024、收敛检测单元2025及确定单元2026;其中,
所述配置单元2021,用于从所述画像维度下的各个所述维度数据中选择预设数量个聚类中心;
所述距离计算单元2022,用于针对所述画像维度下的每个所述维度数据,计算所述维度数据与每个所述聚类中心之间的距离值;
所述聚类划分单元2023,用于根据每个所述维度数据分别与每个所述聚类中心之间的距离值,将各个所述维度数据划分为至少两个候选类簇;
所述迭代更新单元2024,用于计算各个所述候选类簇的实际聚类中心,并将计算的各个所述实际聚类中心分别作为所述聚类中心;
所述收敛检测单元2025,用于检测所述至少两个候选类簇是否满足预设的收敛条件,如果是,则触发所述确定单元2026;否则触发所述距离计算单元2022;
所述确定单元2026,用于在所述收敛检测单元2025的触发下将各个所述候选类簇分别作为一个类簇。
请参考图5,本发明一个实施例中,所述分析处理模块,还包括:参数检测单元2027;其中,
所述参数检测单元2027,用于当所述至少两个候选类簇满足预设的收敛条件时,基于误差平方和准则函数检测所述预设数量是否合理,若是,则触发所述确定单元2026。
本发明一个实施例中,所述聚类划分单元2023,用于针对每个所述维度数据,根据所述维度数据与每个所述聚类中心之间的距离值,记录所述维度数据与目标聚类中心之间的对应关系,其中,所述维度数据与所述目标聚类中心之间的所述距离值为计算的各个所述距离值中的最小值;针对每个所述聚类中心,根据记录的各个所述对应关系,确定与所述聚类中心相对应的至少一个目标维度数据,并利用确定的各个所述目标维度数据组成一个候选类簇。
为了描述的方便,描述以上装置实施例时以功能分为各种单元或模块分别描述,在实施本发明时可以把各单元或模块的功能在同一个或多个软件和/或硬件中实现。
图3是本发明实施例提供的一种电子设备的结构示意图。在硬件层面,该电子设备包括处理器301以及存储有执行指令的存储器302,可选地还包括内部总线303及网络接口304。其中,存储器302可能包含内存3021,例如高速随机存取存储器(Random-AccessMemory,RAM),也可能还包括非易失性存储器3022(non-volatile memory),例如至少1个磁盘存储器等;处理器301、网络接口302和存储器可以通过内部总线303相互连接,该内部总线303可以是ISA(Industry Standard Architecture,工业标准体系结构)总线、PCI(Peripheral Component Interconnect,外设部件互连标准)总线或EISA(ExtendedIndustry Standard Architecture,扩展工业标准结构)总线等;所述内部总线303可以分为地址总线、数据总线、控制总线等,为便于表示,图3中仅用一个双向箭头表示,但并不表示仅有一根总线或一种类型的总线。当然,该电子设备还可能包括其他业务所需要的硬件。当处理器执行存储器存储的执行指令时,处理器执行本发明任意一个实施例中所述的方法,并至少用于执行:
获取多个用户在至少一个画像维度下的维度数据;
针对每个所述画像维度,对在所述画像维度下的各个所述维度数据进行聚类以形成至少两个类簇,并确定各个所述类簇分别对应的标签名称;
针对每个所述用户,检测所述用户在每个所述画像维度下的所述维度数据所属的当前类簇,并利用各个所述当前类簇分别对应的所述标签名称组成所述用户的用户画像。
在一种可能实现的方式中,处理器从非易失性存储器中读取对应的执行指令到内存中然后运行,也可从其它设备上获取相应的执行指令,以在逻辑层面上形成生成用户画像的装置。处理器执行存储器所存放的执行指令,以通过执行的执行指令实现本发明任一实施例中提供的生成用户画像的方法。
处理器可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器可以是通用处理器,包括中央处理器(Central Processing Unit,CPU)、网络处理器(Network Processor,NP)等;还可以是数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
本发明实施例还提供了一种计算机可读存储介质,包括执行指令,当电子设备的处理器执行所述执行指令时,所述电子设备执行本发明任意一个实施例中提供的方法。该电子设备具体可以是如图3所示的电子设备;执行指令是生成用户画像的装置所对应计算机程序。
前述各个实施例中所述的电子设备可以为计算机。
综上所述,本发明各个实施例至少具有如下有益效果:
1、本发明一个实施例中,通过获取多个用户在至少一个画像维度下的维度数据,然后针对每个画像维度,对在该画像维度下的各个维度数据进行聚类以形成至少两个类簇,并确定各个类簇分别对应的标签名称,后续即可针对每个用户,检测该用户在每个画像维度下的维度数据所属的当前类簇,并利用各个当前类簇分别对应的标签名称组成用户的用户画像。根据用户在一个画像维度下的维度数据确定相应的用户标签时,通过聚类的方式综合考虑了多个不同用户在相同画像维度下的维度数据,从而使得生成的用户画像能够更为准确的体现用户信息。
2、本发明一个实施例中,预设数量可能是用户预先设置的经验值,且对于不同的画像维度可能适用不同的经验值;基于误差平方和准则函数检测预设数量是否合理,当检测到预设数量不合理时,即基于误差平方和准则函数计算得到的误差平方和大于一定数值时,可修改预设数量,并根据修改后的预设数量再次执行前述各个步骤S1~步骤S5,当且仅当检测到预设数量合理时,即针对画像维度下的维度数据进行聚类后得到的候选类簇的数量合理时,才将各个候选类簇分别作为一个类簇,合理划分的类簇能够确保后续得到的用户画像能够更为准确的体现用户信息。
本领域内的技术人员应明白,本发明的实施例可提供为方法或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例,或软件和硬件相结合的形式。
本发明中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
以上所述仅为本发明的实施例而已,并不用于限制本发明。对于本领域技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本发明的权利要求范围之内。
Claims (10)
1.一种生成用户画像的方法,其特征在于,包括:
获取多个用户在至少一个画像维度下的维度数据;
针对每个所述画像维度,对在所述画像维度下的各个所述维度数据进行聚类以形成至少两个类簇,并确定各个所述类簇分别对应的标签名称;
针对每个所述用户,检测所述用户在每个所述画像维度下的所述维度数据所属的当前类簇,并利用各个所述当前类簇分别对应的所述标签名称组成所述用户的用户画像。
2.根据权利要求1所述的方法,其特征在于,
所述对在所述画像维度下的各个所述维度数据进行聚类以形成至少两个类簇,包括:
S1、从所述画像维度下的各个所述维度数据中选择预设数量个聚类中心;
S2、针对所述画像维度下的每个所述维度数据,计算所述维度数据与每个所述聚类中心之间的距离值;
S3、根据每个所述维度数据分别与每个所述聚类中心之间的距离值,将各个所述维度数据划分为至少两个候选类簇;
S4、计算各个所述候选类簇的实际聚类中心,并将计算的各个所述实际聚类中心分别作为所述聚类中心;
S5、检测所述至少两个候选类簇是否满足预设的收敛条件,如果是,则执行S6;否则执行S2;
S6、将各个所述候选类簇分别作为一个类簇。
3.根据权利要求2所述的方法,其特征在于,
在所述将各个所述候选类簇分别作为一个类簇之前,还包括:
基于误差平方和准则函数检测所述预设数量是否合理,若是,则执行所述将各个所述候选类簇分别作为一个类簇。
4.根据权利要求2所述的方法,其特征在于,
所述S3,包括:
针对每个所述维度数据,根据所述维度数据与每个所述聚类中心之间的距离值,记录所述维度数据与目标聚类中心之间的对应关系,其中,所述维度数据与所述目标聚类中心之间的所述距离值为计算的各个所述距离值中的最小值;
针对每个所述聚类中心,根据记录的各个所述对应关系,确定与所述聚类中心相对应的至少一个目标维度数据,并利用确定的各个所述目标维度数据组成一个候选类簇。
5.根据权利要求1至4中任一所述的方法,其特征在于,
所述至少一个画像维度,包括:平均用电量、节能设备比例、环境污染评价值、单位能耗、用电稳定性、日均峰谷比率中的任意一个或多个。
6.一种生成用户画像的装置,其特征在于,包括:
数据获取模块,用于获取多个用户在至少一个画像维度下的维度数据;
分析处理模块,用于针对每个所述画像维度,对在所述画像维度下的各个所述维度数据进行聚类以形成至少两个类簇,并确定各个所述类簇分别对应的标签名称;
画像处理模块,用于针对每个所述用户,检测所述用户在每个所述画像维度下的所述维度数据所属的当前类簇,并利用各个所述当前类簇分别对应的所述标签名称组成所述用户的用户画像。
7.根据权利要求6所述的装置,其特征在于,
所述分析处理模块,包括:配置单元、距离计算单元、聚类划分单元、迭代更新单元、收敛检测单元及确定单元;其中,
所述配置单元,用于从所述画像维度下的各个所述维度数据中选择预设数量个聚类中心;
所述距离计算单元,用于针对所述画像维度下的每个所述维度数据,计算所述维度数据与每个所述聚类中心之间的距离值;
所述聚类划分单元,用于根据每个所述维度数据分别与每个所述聚类中心之间的距离值,将各个所述维度数据划分为至少两个候选类簇;
所述迭代更新单元,用于计算各个所述候选类簇的实际聚类中心,并将计算的各个所述实际聚类中心分别作为所述聚类中心;
所述收敛检测单元,用于检测所述至少两个候选类簇是否满足预设的收敛条件,如果是,则触发所述确定单元;否则触发所述距离计算单元;
所述确定单元,用于在所述收敛检测单元的触发下将各个所述候选类簇分别作为一个类簇。
8.根据权利要求7所述的方法,其特征在于,
所述分析处理模块,还包括:参数检测单元;其中,所述参数检测单元,用于当所述至少两个候选类簇满足预设的收敛条件时,基于误差平方和准则函数检测所述预设数量是否合理,若是,则触发所述确定单元;
和/或,
所述聚类划分单元,用于针对每个所述维度数据,根据所述维度数据与每个所述聚类中心之间的距离值,记录所述维度数据与目标聚类中心之间的对应关系,其中,所述维度数据与所述目标聚类中心之间的所述距离值为计算的各个所述距离值中的最小值;针对每个所述聚类中心,根据记录的各个所述对应关系,确定与所述聚类中心相对应的至少一个目标维度数据,并利用确定的各个所述目标维度数据组成一个候选类簇。
9.一种可读存储介质,包括执行指令,当电子设备的处理器执行所述执行指令时,所述处理器执行如权利要求1至4中任一所述的方法。
10.一种电子设备,包括处理器以及存储有执行指令的存储器,当所述处理器执行所述存储器存储的所述执行指令时,所述处理器执行如权利要求1至4中任一所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910236658.5A CN109977177A (zh) | 2019-03-27 | 2019-03-27 | 生成用户画像的方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910236658.5A CN109977177A (zh) | 2019-03-27 | 2019-03-27 | 生成用户画像的方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109977177A true CN109977177A (zh) | 2019-07-05 |
Family
ID=67080816
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910236658.5A Pending CN109977177A (zh) | 2019-03-27 | 2019-03-27 | 生成用户画像的方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109977177A (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111242172A (zh) * | 2019-12-31 | 2020-06-05 | 浙江吉利新能源商用车集团有限公司 | 一种电池画像标签生成方法及装置 |
CN112116205A (zh) * | 2020-08-21 | 2020-12-22 | 国网上海市电力公司 | 针对台区用电特征的画像方法、装置和存储介质 |
CN113554041A (zh) * | 2020-04-03 | 2021-10-26 | 北京京东振世信息技术有限公司 | 一种对用户标记标签的方法和装置 |
CN114119111A (zh) * | 2022-01-27 | 2022-03-01 | 深圳江行联加智能科技有限公司 | 基于大数据的电力交易用户管理方法、装置、设备及介质 |
CN115145449A (zh) * | 2022-06-27 | 2022-10-04 | 掌阅科技股份有限公司 | 书单生成方法、电子设备及计算机存储介质 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20120109956A1 (en) * | 2010-10-29 | 2012-05-03 | Yahoo! Inc. | Profile prediction for shared computers |
CN107944481A (zh) * | 2017-11-16 | 2018-04-20 | 百度在线网络技术(北京)有限公司 | 用于生成信息的方法和装置 |
CN107958338A (zh) * | 2017-12-08 | 2018-04-24 | 合肥工业大学 | 用电策略推荐方法及装置、存储介质 |
CN108108451A (zh) * | 2017-12-27 | 2018-06-01 | 合肥美的智能科技有限公司 | 群体的群体用户画像获取方法和装置 |
CN108197285A (zh) * | 2018-01-15 | 2018-06-22 | 腾讯科技(深圳)有限公司 | 一种数据推荐方法以及装置 |
CN108681973A (zh) * | 2018-05-14 | 2018-10-19 | 广州供电局有限公司 | 电力用户的分类方法、装置、计算机设备和存储介质 |
CN108764984A (zh) * | 2018-05-17 | 2018-11-06 | 国网冀北电力有限公司电力科学研究院 | 一种基于大数据的电力用户画像构建方法及系统 |
CN109272009A (zh) * | 2018-07-23 | 2019-01-25 | 武汉普利商用机器有限公司 | 一种基于大数据分析的人群画像提取方法及装置 |
-
2019
- 2019-03-27 CN CN201910236658.5A patent/CN109977177A/zh active Pending
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20120109956A1 (en) * | 2010-10-29 | 2012-05-03 | Yahoo! Inc. | Profile prediction for shared computers |
CN107944481A (zh) * | 2017-11-16 | 2018-04-20 | 百度在线网络技术(北京)有限公司 | 用于生成信息的方法和装置 |
CN107958338A (zh) * | 2017-12-08 | 2018-04-24 | 合肥工业大学 | 用电策略推荐方法及装置、存储介质 |
CN108108451A (zh) * | 2017-12-27 | 2018-06-01 | 合肥美的智能科技有限公司 | 群体的群体用户画像获取方法和装置 |
CN108197285A (zh) * | 2018-01-15 | 2018-06-22 | 腾讯科技(深圳)有限公司 | 一种数据推荐方法以及装置 |
CN108681973A (zh) * | 2018-05-14 | 2018-10-19 | 广州供电局有限公司 | 电力用户的分类方法、装置、计算机设备和存储介质 |
CN108764984A (zh) * | 2018-05-17 | 2018-11-06 | 国网冀北电力有限公司电力科学研究院 | 一种基于大数据的电力用户画像构建方法及系统 |
CN109272009A (zh) * | 2018-07-23 | 2019-01-25 | 武汉普利商用机器有限公司 | 一种基于大数据分析的人群画像提取方法及装置 |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111242172A (zh) * | 2019-12-31 | 2020-06-05 | 浙江吉利新能源商用车集团有限公司 | 一种电池画像标签生成方法及装置 |
CN113554041A (zh) * | 2020-04-03 | 2021-10-26 | 北京京东振世信息技术有限公司 | 一种对用户标记标签的方法和装置 |
CN113554041B (zh) * | 2020-04-03 | 2023-09-26 | 北京京东振世信息技术有限公司 | 一种对用户标记标签的方法和装置 |
CN112116205A (zh) * | 2020-08-21 | 2020-12-22 | 国网上海市电力公司 | 针对台区用电特征的画像方法、装置和存储介质 |
CN112116205B (zh) * | 2020-08-21 | 2024-03-12 | 国网上海市电力公司 | 针对台区用电特征的画像方法、装置和存储介质 |
CN114119111A (zh) * | 2022-01-27 | 2022-03-01 | 深圳江行联加智能科技有限公司 | 基于大数据的电力交易用户管理方法、装置、设备及介质 |
CN115145449A (zh) * | 2022-06-27 | 2022-10-04 | 掌阅科技股份有限公司 | 书单生成方法、电子设备及计算机存储介质 |
CN115145449B (zh) * | 2022-06-27 | 2024-05-31 | 掌阅科技股份有限公司 | 书单生成方法、电子设备及计算机存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109977177A (zh) | 生成用户画像的方法及装置 | |
CN104239351B (zh) | 一种用户行为的机器学习模型的训练方法及装置 | |
CN109559208A (zh) | 一种信息推荐方法、服务器及计算机可读介质 | |
TW202008237A (zh) | 針對新場景的預測模型訓練方法及裝置 | |
CN106157083B (zh) | 挖掘潜在客户的方法和装置 | |
CN106777360A (zh) | 内容推荐方法及装置 | |
CN105989146B (zh) | 对象展示方法及装置 | |
CN110413870A (zh) | 商品推荐方法、装置及服务器 | |
TW201939378A (zh) | 資源推薦方法及裝置 | |
CN103578022A (zh) | 自动化网购装置及方法 | |
CN108932217A (zh) | 能耗统计的方法及装置 | |
CN110222871A (zh) | 用于电力负荷预测的相似日的选择方法及装置 | |
US20200219022A1 (en) | Method and apparatus for determining similarity between user and merchant, and electronic device | |
US11182436B2 (en) | Predicting locations based on transaction records | |
CN113505942A (zh) | 项目工程造价预估方法、装置、电子设备及存储介质 | |
CN106919995A (zh) | 一种判断用户群体流失倾向的方法及装置 | |
CN110310153A (zh) | 一种交易预测方法及装置 | |
CN111523043A (zh) | 资源信息展示、管理方法及装置 | |
CN107704317A (zh) | 智能设备及其应用管理方法和具有存储功能的装置 | |
CN109784666A (zh) | 设备质量的检测方法及装置 | |
CN116595390A (zh) | 商品信息处理方法及电子设备 | |
CN110189188A (zh) | 商品管理方法、装置、计算机设备及存储介质 | |
CN113989005A (zh) | 一种税务风险企业挖掘方法及装置 | |
CN109903074A (zh) | 基于数据分析的市场状态划分方法和装置 | |
CN114139975A (zh) | 计量物资的生命周期数据处理方法、装置、设备和介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20190705 |
|
RJ01 | Rejection of invention patent application after publication |