CN105893406A - 群体用户画像方法及系统 - Google Patents
群体用户画像方法及系统 Download PDFInfo
- Publication number
- CN105893406A CN105893406A CN201510772095.3A CN201510772095A CN105893406A CN 105893406 A CN105893406 A CN 105893406A CN 201510772095 A CN201510772095 A CN 201510772095A CN 105893406 A CN105893406 A CN 105893406A
- Authority
- CN
- China
- Prior art keywords
- attribute
- user
- weight
- label
- under
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提出了一种群体用户画像方法,包括:根据包括标签、标签下的属性和参照属性权重的标签属性权重库,检测目标群体用户中每一用户的用户行为,打上相应的标签;参照所述标签属性权重库,确定所述目标群体用户的所有用户的各种标签下的各种属性的属性权重,按照属性的种类对所述属性权重进行加权平均,确定目标群体用户在各种属性下的属性权重;根据所确定的目标群体用户在各种属性下的属性权重,得到所述目标群体用户的群体用户画像。本发明还提出了一种群体用户画像系统。能有效提高群体用户画像的精准度。
Description
技术领域
本发明实施例涉及用户画像领域,尤其涉及一种群体用户画像方法及系统。
背景技术
在互联网逐渐步入大数据时代后,消费者的一切行为在企业面前似乎都将是“可视化”的。企业的专注点日也开始益聚焦于怎样利用大数据来为精准营销服务,进而深入挖掘潜在的商业价值。于是,“用户画像”的概念也就应运而生。
大数据使得企业能够通过互联网便利地获取用户更为广泛的反馈信息,为进一步精准、快速地分析用户行为习惯、消费习惯等重要商业信息,提供了足够的数据基础。伴随着对人的了解逐步深入,一个概念悄然而生:用户画像(UserProfile),完美地抽象出一个用户的信息全貌,可以看作企业应用大数据的根基。
用户画像,即用户信息标签化,就是企业通过收集与分析消费者社会属性、生活习惯、消费行为等主要信息的数据之后,完美地抽象出一个用户的商业全貌,可以看作是企业应用大数据技术的基本方式。
用户画像分为个体用户画像和群体用户画像。前者主要用于个性化定制,而后者用于对群体用户的定位。目前所有的群体用户画像都是基于个人的用户画像,即先画个人用户的画像(确定每个人的各属性的属性值),而后再画成群体的画像(统计各属性值在各属性中所占的比例)。
用户画像领域中常见的的几个专业术语有属性、属性值以及在群体用户画像中常用的属性权重,其中属性是指:进行用户画像需要统计的维度,如性别下的男和女,年龄下的少年、青年、中年、老年,收入等级下的贫困,中低,中等,富裕等;属性权重在个体用户画像中解释为可能性,例如男女权重0.8:0.2,解释为该用户80%可为男性20%可能为女性,而在群体用户画像中则解释为80%的用户为男性,20%的用户为女性。
现有技术中个体用户画像方法主要有两种:通过用户的注册信息直接画出用户画像的方法和对用户的行为进行监测,而后为用户打上各种标签,后台工作人员利用个人经验对所有标签进行分析推导得出用户画像的方法。
关于前一种个体用户画像的方法,存在以下缺点:目前很多的网站/媒体的访问并不需要提前注册,故这些网站/媒体也并不清楚自己的用户的属性;另外,有些用户也不愿意注册用户信息,即使用户注册了信息,也很难保证注册信息的准确性(比如,涉及用户的个人隐私、时间因素等),这样就很难得到准确的用户画像。
关于后一种个体用户画像的方法,存在以下缺点:过于依赖后台工作人员个人因素会导致得到的用户画像结果的差异性很大,而且也没有考虑到标签的时效性,会导致最终得到的用户画像不够精确。
现有技术中的群体用户画像方法是基于现有技术中所得的个体用户画像构建而成的群体用户画像,由此使得个体用户画像的误差在被统计成群体用户画像时被叠加放大,导致群体用户画像的精确度不高。
发明内容
本发明实施例提供一种群体用户画像方法,解决现有技术中因个人差异为用户画像而造成的差异而使得群体用户画像不够精确的技术问题。
本发明一实施例提供一种群体用户画像方法,包括:
根据包括标签、标签下的属性和参照属性权重的标签属性权重库,检测目标群体用户中每一用户的用户行为,打上相应的标签;
参照所述标签属性权重库,确定所述目标群体用户的所有用户的各种标签下的各种属性的属性权重,按照属性的种类对所述属性权重进行加权平均,确定目标群体用户在各种属性下的属性权重;
根据所确定的目标群体用户在各种属性下的属性权重,得到所述目标群体用户的群体用户画像。
本发明一实施例提供一种群体用户画像系统,包括:
行为检测单元,配置以:根据包括标签、标签下的属性和参照属性权重的标签属性权重库,检测目标群体用户中每一用户的用户行为,打上相应的标签;
属性权重确定单元,配置以:参照所述标签属性权重库,确定所述目标群体用户的所有用户的各种标签下的各种属性的属性权重,按照属性的种类对所述属性权重进行加权平均,确定目标群体用户在各种属性下的属性权重;
用户画像生成单元,配置以:根据所确定的目标群体用户在各种属性下的属性权重,得到所述目标群体用户的群体用户画像。
本发明实施例提出了一套通过建立标签属性权重库,查询匹配标签属性权重库,确定目标群体用户的群体属性权重,最终得到群体用户画像;其中标签属性权重库中的参照属性权重指代的是大众平均化的标签属性权重,将此参照属性权重应用于群体用户画像中,降低了个体用户画像的误差对群体用户画像的干扰,提高了群体用户画像的精确性。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1示出了本发明一实施例的群体用户画像方法的流程图;
图2示出了图1中方法中的步骤S102的一种具体实施方式的详细执行图;
图3示出了本发明一实施例的群体用户画像系统的示意图;
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
参见图1,示出的是本发明一具体实施例的群体用户画像方法的流程图,所述方法包括:
S101:根据包括标签、标签下的属性和参照属性权重的标签属性权重库,检测目标群体用户中每一用户的用户行为,打上相应的标签;
S102:参照所述标签属性权重库,确定所述目标群体用户的所有用户的各种标签下的各种属性的属性权重,按照属性的种类对所述属性权重进行加权平均,确定目标群体用户在各种属性下的属性权重;
S103:根据所确定的目标群体用户在各种属性下的属性权重,得到所述目标群体用户的群体用户画像。
在本发明方法的一种实施方式中,在所述根据包括标签、标签下的属性和参照属性权重的标签属性权重库,检测目标群体用户中每一用户的用户行为,打上相应的标签之前,还包括建立标签属性权重库;关于建立标签属性权重库的执行,可以包括如下子步骤:
选择与所述目标群体用户相关的参照群体用户;
根据参照群体用户中每一用户的用户行为,打上相应的标签;
根据所述参照群体用户中每一用户的标签,确定参照群体用户中每一用户在各种属性下的属性权重;
将每一用户在各种属性下的属性权重赋予到与属性相对应的标签中;
按照标签的种类对参照群体用户中所有用户的属性权重加权平均,确定参照群体用户在每种标签下各种属性的参照属性权重;
根据标签、标签下的属性和参照属性权重建立标签属性权重库。
由此所得的标签属性权重库中的参照属性权重指代的是大众平均化的标签属性权重,将此参照属性权重应用于目标群体用户画像中,降低了个体用户画像的误差对群体用户画像的干扰,提高了群体用户画像的精确性。
在本发明方法的一种实施方式中,关于建立标签属性权重库的具体执行过程还可以包括:
根据参照群体用户中每一用户的历史表现,基于用户属性挖掘模型,确定每一用户在各种属性下的属性权重;常见的用户属性挖掘模型包括svm、贝叶斯、聚类、加权平均等各种算法模型。
不同于现有技术中对群体用户的各个个体用户的属性进行推导,再将个体用户已确定的属性应用在群体用户中,得到群体用户画像;本发明实施例方法是基于参照群体用户中每一用户的历史表现对每一用户的属性权重进行推导,是对用户属性的一种模糊化处理,并将所得的属性权重赋予到相应的标签中,使得标签相对于属性具有更高的参考价值,进一步地使得基于标签所获得的群体用户画像更加精确。
在本发明方法的一种实施方式中,所述将所述标签释义分类,获取对应于各种属性的各个匹配标签,可以通过关键词分类工具来实现,所述匹配标签与属性之间具有一定的逻辑关系即可,不一定要求所述匹配标签一定能够推导得出属性。例如,当匹配标签为“化妆品”时,即可推导得出相对应的属性为用户性别属性,更进一步地,涉及的属性权重即为男女比例。
在本发明方法的一种实施方式中,标签属性权重库还可以是由多个子标签属性权重库构成,不同的子标签属性权重库与不同维度的属性相对应,例如:年龄标签属性权重库与用户年龄维度属性相对应、收入等级标签属性权重库与用户收入等级维度属性相对应、消费等级标签属性权重库与用户消费等级维度属性相对应、消费喜好标签属性权重库与用户消费喜好维度属性相对应等,由用户各个不同维度的属性共同构成了用户画像。
在本发明方法的一种实施方式中,标签的一种表现形式为匹配关键词,所述匹配关键词对应着用户行为;由于用户在各个数据源对应的网页上执行诸如浏览产品操作、购买产品操作、关注产品操作或收藏产品操作时,均可触发日志信息的生成,相应地日志信息的生成时间用于说明用户执行上述诸如浏览产品操作、购买产品操作、关注产品操作或收藏产品操作所对应的时间;针对上述用户行为的情形,可以选择将产品信息或产品的分类信息作为用户行为与用户标签相匹配的匹配关键词。
本发明方法的一种实施例提供一种群体用户画像思路,根据用户行为,对所有用户(包括参照群体用户和目标群体用户)打标签。根据经验分析,对参照群体用户中的一个参照用户进行模糊化推理,推出该参照用户每个属性的属性权重;将每个属性的属性权重赋予到该用户的每个标签中;依次类推,直至参照群体用户中所有的参照用户均完成相同的步骤;对每个标签的所有属性权重加权平均,得到最终的属性权重,由此建立标签的属性权重库。将一个测试用户的所有标签放入库中,得到它们的各属性的权重值,然后后加权平均,得到该测试用户最终的各属性的权重值,依次类推,直到目标群体用户中所有的测试用户均完成相同的步骤;对所有测试用户的各属性权重值加权平均,得到群用户画像。
作为图1所示实施例方法的进一步优化,在根据标签、标签下的属性和参照属性权重建立标签属性权重库后,定期补充参照群体用户中的用户数量,对参照属性权重进行修正更新。
当参照群体用户中参照用户的数量越多,参照属性权重就越精确,通过定期补充参照群体用户中的用户数量,对参照属性权重进行修正更新,由此实现了参照属性权重的定期修正,更保障了群体用户画像的精准性。
作为图1所示实施例方法的进一步优化,查询标签属性权重库,若在标签属性权重库中没有找到与测试群体用户所生成的标签相匹配的标签时,则将此标签及此标签所对应的属性和属性权重添加至标签属性权重库;
由此实现了标签属性权重库的学习与扩充;在一种情况下,目标群体用户的所有属性均可参照参照群体用户的参照属性权重,更加提高了群体用户画像的精准度。
作为图1所示实施例方法的进一步优化,图1所示的实施例方法的S103步骤之后还包括:
在完成群体用户画像后,根据群体用户画像为群体用户进行个性化信息推送,继续检测群体用户在收到所述个性化信息推送后的行为以重新确定用户属性权重。
基于群体用户画像为群体用户进行个性化信息推送,根据群体用户对个性化信息推送反馈的用户行为,重新确定群体用户的属性权重,实现了对群体用户属性权重和群体用户画像的校准,同时也避免了对群体用户信息推送的一成不变。
继续参照图2,作为图1所示实施例方法的进一步优化,关于图1中的S102步骤的执行,可以包括如下子步骤:
S1021:将所述目标群体用户中的一个用户的所有标签放入所述参照所述标签属性权重库中,确定所述一个用户的所有标签的各种属性的属性权重;
S1022:按照属性的种类对所述属性权重进行加权平均,确定所述一个用户在各种属性下的属性权重;
S1023:以此类推,确定所述目标群体用户中的所有用户在各种属性下的属性权重;
S1024:对所述目标群体用户中的所有用户在各种属性下的属性权重加权平均,确定目标群体用户在各种属性下的属性权重。
一方面,通过目标群体用户的多种标签共同确定目标群体用户属性,由此提高了所获得的群体用户属性的精确度;另一方面,通过对目标群体用户中的所有用户在各种属性下的属性权重进行加权平均,由此避免了因个体用户画像差异对群体用户画像的干扰,提高了群体用户画像的精确度。
在本发明方法的一种实施方式中,关于S102步骤的更具体的执行过程可以是:
将所述目标群体用户中的一个用户的所有标签放入所述参照所述标签属性权重库中,确定所述一个用户的所有标签的各种属性的属性权重;例如:将所述目标群体用户中的一个用户的所有标签放入所述参照所述标签属性权重库中,通过将所述一个用户的所有标签以标签为key遍历所述标签属性权重库,确定所述一个用户的所有标签所对应的各种属性及各种属性的属性权重;
按照属性的种类对所述属性权重进行加权平均,确定所述一个用户在各种属性下的属性权重;例如:将所述一个用户对应于用户年龄属性的所有标签的属性权重进行加权平均,将得到的平均值作为所述一个用户在用户年龄属性下的属性权重,以此类推,可以得到所述一个用户在各种属性下的属性权重,例如,可以得到所述一个用户的用户消费等级属性和用户性别属性等各种属性下的属性权重;
以此类推,确定所述目标群体用户中的所有用户在各种属性下的属性权重;例如:对目标群体用户中的其他用户重复上述步骤,由此得到目标群体用户相在各种属性下的属性权重,可以得到所述目标群体的所有用户在用户年龄属性、用户消费等级属性和用户性别属性等各种属性下的属性权重;
对所述目标群体用户中的所有用户在各种属性下的属性权重加权平均,确定目标群体用户在各种属性下的属性权重;例如:对所述目标群体用户中所有用户在用户年龄属性下的属性权重进行加权平均,将所得到的平均值作为所述群体用户在用户年龄属性下的属性权重;以此类推,得到目标群体用户在用户消费等级属性和用户性别属性各种属性下的属性权重。
关于图1中的S103步骤的执行,根据所确定的目标群体用户在各种属性下的属性权重,得到所述目标群体用户的群体用户画像。示例性地,将所确定的目标群体用户在各种属性下的属性权重应用于目标群体用户的属性中,例如确定目标群体用户在性别维度下的属性权重为0.7:0.3(男:女),相应地可确定目标群体用户中70%的用户为男性和30%的用户为女性。
在本发明实施例所述的方法中,属性权重是对用户属性的一种模糊化的处理的体现形式,在确定群体用户的属性权重后,将模糊的属性权重转化为清晰的关于群体用户属性的人群比例,由此确定群体用户画像;本发明实施例所述的群体用户画像方法操作方便,通过本实施例方法所得的群体用户画像具有较高的精确度。
本发明实施例方法提供的一种技术方案,主要实现了:不需要准确的用户注册信息,即使是对用户的模糊推理,对群体用户中的个体用户属性的确定不需要十分的准确与具体,只要能推导得到群体用户中所有个体用户的属性权重即可,例如,对群体用户的性别属性进行推导的时候,只需要对群体用户中每个个体用户的性别进行模糊推理,不需要完全确定个体用户的性别是男或女,只需要得到个体用户在性别属性下的属性权重,所述属性权重的大小与此个体用户性别为男或女可能性的强弱相对应;同时在标签属性权重数据库建立之时,选定一个与目标群体用户相关的参照群体用户,在一种情况下,标签的参照属性权重会随着参照群体用户中参照用户的数量的增多而修正并使得属性权重趋于大众平均化水平,故参照属性权重代表的是群体用户属性在大众平均化下的属性权重,将此参照属性权重应用于群体用户画像中,修正了因个体误差对群体用户画像造成的干扰。
其中上述图1的方法,可以根据本发明的下述系统(参照图3)予以操作来实现。
一种群体用户画像系统,包括:
行为检测单元,配置以:根据包括标签、标签下的属性和参照属性权重的标签属性权重库,检测目标群体用户中每一用户的用户行为,打上相应的标签;
属性权重确定单元,配置以:参照所述标签属性权重库,确定所述目标群体用户的所有用户的各种标签下的各种属性的属性权重,按照属性的种类对所述属性权重进行加权平均,确定目标群体用户在各种属性下的属性权重;
用户画像生成单元,配置以:根据所确定的目标群体用户在各种属性下的属性权重,得到所述目标群体用户的群体用户画像。
作为图3所述实施例系统的进一步优化,所述系统还包括标签属性权重库建立单元,所述标签属性权重库建立单元配置以:
选择与所述目标群体用户相关的参照群体用户;
根据参照群体用户中每一用户的用户行为,打上相应的标签;
根据所述参照群体用户中每一用户的标签,确定参照群体用户中每一用户在各种属性下的属性权重;
将每一用户在各种属性下的属性权重赋予到与属性相对应的标签中;
按照标签的种类对参照群体用户中所有用户的属性权重加权平均,确定参照群体用户在每种标签下各种属性的参照属性权重;
根据标签、标签下的属性和参照属性权重建立标签属性权重库。
由此所得的标签属性权重库中的参照属性权重指代的是大众平均化的标签属性权重,将此参照属性权重应用于目标群体用户画像中,降低了个体用户画像的误差对群体用户画像的干扰,提高了群体用户画像的精确性。
作为图3所示实施例系统的进一步优化,标签属性权重库还包括属性权重确定模块,所述属性权重确定模块配置以:根据参照群体用户中每一用户的历史表现,基于用户属性挖掘模型,确定每一用户在各种属性下的属性权重;常见的用户挖掘模型有:常见的用户属性挖掘模型包括svm、贝叶斯、聚类、加权平均等各种算法模型。
不同于现有技术中对群体用户的各个个体用户的属性进行推导,再将个体用户已确定的属性应用在群体用户中,得到群体用户画像;本发明实施例方法是基于参照群体用户中每一用户的历史表现对每一用户的属性权重进行推导,是对用户属性的一种模糊化处理,并将所得的属性权重赋予到相应的标签中,使得标签相对于属性具有更高的参考价值,进一步地使得基于标签所获得的群体用户画像更加精确。
作为图3所示实施例系统的进一步优化,所述标签属性权重库还包括扩充修正模块,所述扩充修正模块配置以:在根据标签、标签下的属性和参照属性权重建立标签属性权重库后,定期补充参照群体用户中的用户数量,对参照属性权重进行修正更新。
当参照群体用户中参照用户的数量越多,参照属性权重就越精确,通过定期补充参照群体用户中的用户数量,对参照属性权重进行修正更新,由此实现了参照属性权重的定期修正,更保障了群体用户画像的精准性。
作为图3所示实施例系统的进一步优化,所述系统还包括信息推送,所述信息推送单元配置以:
在完成群体用户画像后,根据群体用户画像为群体用户进行个性化信息推送,继续检测群体用户在收到所述个性化信息推送后的行为以重新确定用户属性权重。
基于群体用户画像为群体用户进行个性化信息推送,根据群体用户对个性化信息推送反馈的用户行为,重新确定群体用户的属性权重,实现了对群体用户属性权重和群体用户画像的校准,同时也避免了对群体用户信息推送的一成不变。
作为图3所示实施例系统的进一步优化,关于图3中的属性权重确定单元,其具体的工作方式可以是配置以:
将所述目标群体用户中的一个用户的所有标签放入所述参照所述标签属性权重库中,确定所述一个用户的所有标签的各种属性的属性权重;按照属性的种类对所述属性权重进行加权平均,确定所述一个用户在各种属性下的属性权重;以此类推,确定所述目标群体用户中的所有用户在各种属性下的属性权重;对所述目标群体用户中的所有用户在各种属性下的属性权重加权平均,确定目标群体用户在各种属性下的属性权重。
一方面,通过目标群体用户的多种标签共同确定目标群体用户属性,由此提高了所获得的群体用户属性的精确度;另一方面,通过对目标群体用户中的所有用户在各种属性下的属性权重进行加权平均,由此避免了因个体用户画像差异对群体用户画像的干扰,提高了群体用户画像的精确度。
在本发明一方面的应用上,本发明实施例中的群体用户画像系统可以是作为功能元件的形式内嵌于网站服务器中;作为本发明的另一方面的应用,本发明实施例中的群体用户画像系统还可以内嵌于云计算服务器中,此云计算服务器连接于网站服务器和用户终端之间。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
Claims (10)
1.一种群体用户画像方法,包括:
根据包括标签、标签下的属性和参照属性权重的标签属性权重库,检测目标群体用户中每一用户的用户行为,打上相应的标签;
参照所述标签属性权重库,确定所述目标群体用户的所有用户的各种标签下的各种属性的属性权重,按照属性的种类对所述属性权重进行加权平均,确定目标群体用户在各种属性下的属性权重;
根据所确定的目标群体用户在各种属性下的属性权重,得到所述目标群体用户的群体用户画像。
2.根据权利要求1所述的方法,其特征在于,在所述根据包括标签、标签下的属性和参照属性权重的标签属性权重库,检测目标群体用户中每一用户的用户行为,打上相应的标签之前,还包括建立标签属性权重库:
选择与所述目标群体用户相关的参照群体用户;
根据参照群体用户中每一用户的用户行为,打上相应的标签;
根据所述参照群体用户中每一用户的标签,确定参照群体用户中每一用户在各种属性下的属性权重;
将每一用户在各种属性下的属性权重赋予到与属性相对应的标签中;
按照标签的种类对参照群体用户中所有用户的属性权重加权平均,确定参照群体用户在每种标签下各种属性的参照属性权重;
根据标签、标签下的属性和参照属性权重建立标签属性权重库。
3.根据权利要求1所述的方法,其特征在于,所述参照所述标签属性权重库,确定所述目标群体用户的所有用户的各种标签下的各种属性的属性权重,按照属性的种类对所述属性权重进行加权平均,确定目标群体用户在各种属性下的属性权重包括:
将所述目标群体用户中的一个用户的所有标签放入所述参照所述标签属性权重库中,确定所述一个用户的所有标签的各种属性的属性权重;
按照属性的种类对所述属性权重进行加权平均,确定所述一个用户在各种属性下的属性权重;
以此类推,确定所述目标群体用户中的所有用户在各种属性下的属性权重;
对所述目标群体用户中的所有用户在各种属性下的属性权重加权平均,确定目标群体用户在各种属性下的属性权重。
4.根据权利要求2所述的方法,其特征在于,在根据标签、标签下的属性和参照属性权重建立标签属性权重库后,定期补充参照群体用户中的用户数量,对参照属性权重进行修正更新。
5.根据权利要求2所述的方法,其特征在于,所述确定参照群体用户中每一用户在各种属性下的属性权重包括:
根据参照群体用户中每一用户的历史表现,基于用户属性挖掘模型,确定每一用户在各种属性下的属性权重。
6.一种群体用户画像系统,包括:
行为检测单元,配置以:根据包括标签、标签下的属性和参照属性权重的标签属性权重库,检测目标群体用户中每一用户的用户行为,打上相应的标签;
属性权重确定单元,配置以:参照所述标签属性权重库,确定所述目标群体用户的所有用户的各种标签下的各种属性的属性权重,按照属性的种类对所述属性权重进行加权平均,确定目标群体用户在各种属性下的属性权重;
用户画像生成单元,配置以:根据所确定的目标群体用户在各种属性下的属性权重,得到所述目标群体用户的群体用户画像。
7.根据权利要求6所述的系统,其特征在于,所述系统还包括标签属性权重库建立单元,所述标签属性权重库建立单元配置以:
选择与所述目标群体用户相关的参照群体用户;
根据参照群体用户中每一用户的用户行为,打上相应的标签;
根据所述参照群体用户中每一用户的标签,确定参照群体用户中每一用户在各种属性下的属性权重;
将每一用户在各种属性下的属性权重赋予到与属性相对应的标签中;
按照标签的种类对参照群体用户中所有用户的属性权重加权平均,确定参照群体用户在每种标签下各种属性的参照属性权重;
根据标签、标签下的属性和参照属性权重建立标签属性权重库。
8.根据权利要求6所述的系统,其特征在于,所述属性权重确定单元配置以:
将所述目标群体用户中的一个用户的所有标签放入所述参照所述标签属性权重库中,确定所述一个用户的所有标签的各种属性的属性权重;
按照属性的种类对所述属性权重进行加权平均,确定所述一个用户在各种属性下的属性权重;
以此类推,确定所述目标群体用户中的所有用户在各种属性下的属性权重;
对所述目标群体用户中的所有用户在各种属性下的属性权重加权平均,确定目标群体用户在各种属性下的属性权重。
9.根据权利要求7所述的系统,其特征在于,所述标签属性权重库还包括扩充修正模块,所述扩充修正模块配置以:在根据标签、标签下的属性和参照属性权重建立标签属性权重库后,定期补充参照群体用户中的用户数量,对参照属性权重进行修正更新。
10.根据权利要求7所述的系统,其特征在于,所述标签属性权重库还包括属性权重确定模块,所述属性权重确定模块配置以:根据参照群体用户中每一用户的历史表现,基于用户属性挖掘模型,确定每一用户在各种属性下的属性权重。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510772095.3A CN105893406A (zh) | 2015-11-12 | 2015-11-12 | 群体用户画像方法及系统 |
PCT/CN2016/083164 WO2017080170A1 (zh) | 2015-11-12 | 2016-05-24 | 群体用户画像方法及系统 |
US15/248,656 US20170142119A1 (en) | 2015-11-12 | 2016-08-26 | Method for creating group user profile, electronic device, and non-transitory computer-readable storage medium |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510772095.3A CN105893406A (zh) | 2015-11-12 | 2015-11-12 | 群体用户画像方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN105893406A true CN105893406A (zh) | 2016-08-24 |
Family
ID=57002340
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510772095.3A Pending CN105893406A (zh) | 2015-11-12 | 2015-11-12 | 群体用户画像方法及系统 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN105893406A (zh) |
WO (1) | WO2017080170A1 (zh) |
Cited By (24)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107317688A (zh) * | 2017-07-25 | 2017-11-03 | 薛江炜 | 基于分类标签创建通信群组的装置及方法 |
CN107315810A (zh) * | 2017-06-27 | 2017-11-03 | 济南浪潮高新科技投资发展有限公司 | 一种物联网设备行为画像方法 |
CN107786376A (zh) * | 2017-10-20 | 2018-03-09 | 广州优视网络科技有限公司 | 内容推送方法、装置及计算机设备 |
CN107844548A (zh) * | 2017-10-30 | 2018-03-27 | 北京锐安科技有限公司 | 一种数据标签方法和装置 |
CN108564262A (zh) * | 2018-03-31 | 2018-09-21 | 甘肃万维信息技术有限责任公司 | 基于大数据分析的企业画像大数据模型系统 |
CN108572967A (zh) * | 2017-03-09 | 2018-09-25 | 神州数码系统集成服务有限公司 | 一种创建企业画像的方法及装置 |
CN109034876A (zh) * | 2018-07-05 | 2018-12-18 | 天津璧合信息技术有限公司 | 一种行业画像分析方法及装置 |
CN109086384A (zh) * | 2018-07-26 | 2018-12-25 | 珠海卓邦科技有限公司 | 基于用户画像的水务管理方法及系统 |
WO2019062081A1 (zh) * | 2017-09-28 | 2019-04-04 | 平安科技(深圳)有限公司 | 业务员画像形成方法、电子装置及计算机可读存储介质 |
CN110009438A (zh) * | 2018-11-07 | 2019-07-12 | 爱保科技(横琴)有限公司 | 基于车主社群的信息处理方法及装置 |
CN110245070A (zh) * | 2019-05-07 | 2019-09-17 | 平安科技(深圳)有限公司 | 测试用户筛选方法、装置、计算机设备及存储介质 |
CN110431585A (zh) * | 2018-01-22 | 2019-11-08 | 华为技术有限公司 | 一种用户画像的生成方法及装置 |
CN110532306A (zh) * | 2019-05-27 | 2019-12-03 | 浙江工业大学 | 一种基于多视角二分k-means的高校图书馆用户画像模型构建方法 |
WO2019232891A1 (zh) * | 2018-06-06 | 2019-12-12 | 平安科技(深圳)有限公司 | 用户画像获取方法、装置、计算机设备以及存储介质 |
CN110928990A (zh) * | 2019-10-31 | 2020-03-27 | 南方电网调峰调频发电有限公司 | 一种基于用户画像专用于电力设备台账数据推荐的方法 |
WO2020098308A1 (zh) * | 2018-11-12 | 2020-05-22 | 平安科技(深圳)有限公司 | 人群画像分类模型的建立方法、装置、设备和存储介质 |
CN111612551A (zh) * | 2020-06-03 | 2020-09-01 | 陈包容 | 商家进行用户数据引流的方法及系统 |
CN111625718A (zh) * | 2020-05-19 | 2020-09-04 | 辽宁工程技术大学 | 一种基于用户搜索关键词数据的用户画像构建方法 |
CN112037052A (zh) * | 2020-11-04 | 2020-12-04 | 上海冰鉴信息科技有限公司 | 用户行为检测方法及装置 |
CN112905783A (zh) * | 2021-02-19 | 2021-06-04 | 卓尔智联(武汉)研究院有限公司 | 一种群体用户画像获取方法、装置、电子设备及存储介质 |
CN113366523A (zh) * | 2019-06-20 | 2021-09-07 | 深圳市欢太科技有限公司 | 资源推送方法及相关产品 |
CN116091112A (zh) * | 2022-12-29 | 2023-05-09 | 江苏玖益贰信息科技有限公司 | 一种消费者画像生成装置及画像分析方法 |
CN117407809A (zh) * | 2023-12-01 | 2024-01-16 | 广东铭太信息科技有限公司 | 基于多用户画像融合的审计管理系统及方法 |
CN117407809B (zh) * | 2023-12-01 | 2024-06-21 | 广东铭太信息科技有限公司 | 基于多用户画像融合的审计管理系统及方法 |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109658478B (zh) * | 2017-10-10 | 2022-11-15 | 爱信诺征信有限公司 | 一种提供企业画像的方法及系统 |
CN111028012B (zh) * | 2019-12-10 | 2023-04-21 | 浙江力石科技股份有限公司 | 景区客群定位方法、系统、装置及其可存储介质 |
CN113055423B (zh) * | 2019-12-27 | 2022-11-15 | Oppo广东移动通信有限公司 | 策略的推送方法、策略的执行方法、装置、设备及介质 |
CN113055419B (zh) * | 2019-12-27 | 2023-04-07 | 中国移动通信集团湖南有限公司 | 一种信息发送方法及装置 |
CN111177481B (zh) * | 2019-12-30 | 2023-12-19 | 北京友信科技有限公司 | 用户标识映射方法及装置 |
CN112270008A (zh) * | 2020-11-16 | 2021-01-26 | 加和(北京)信息科技有限公司 | 一种精准计算群体特征的方法及系统 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103577549A (zh) * | 2013-10-16 | 2014-02-12 | 复旦大学 | 一种基于微博标签的人群画像系统和方法 |
CN103778555A (zh) * | 2014-01-21 | 2014-05-07 | 北京集奥聚合科技有限公司 | 基于用户标签的用户属性挖掘方法和系统 |
CN104750731A (zh) * | 2013-12-30 | 2015-07-01 | 华为技术有限公司 | 一种获取完整用户画像的方法及装置 |
CN104867037A (zh) * | 2015-05-29 | 2015-08-26 | 北京京东尚科信息技术有限公司 | 一种画像特征的数据处理方法及装置 |
CN105005587A (zh) * | 2015-06-26 | 2015-10-28 | 深圳市腾讯计算机系统有限公司 | 一种用户画像的更新方法、装置和系统 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8055664B2 (en) * | 2007-05-01 | 2011-11-08 | Google Inc. | Inferring user interests |
EP2456238A1 (en) * | 2010-11-17 | 2012-05-23 | Alcatel Lucent | System for broadcasting services to a group of users |
-
2015
- 2015-11-12 CN CN201510772095.3A patent/CN105893406A/zh active Pending
-
2016
- 2016-05-24 WO PCT/CN2016/083164 patent/WO2017080170A1/zh active Application Filing
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103577549A (zh) * | 2013-10-16 | 2014-02-12 | 复旦大学 | 一种基于微博标签的人群画像系统和方法 |
CN104750731A (zh) * | 2013-12-30 | 2015-07-01 | 华为技术有限公司 | 一种获取完整用户画像的方法及装置 |
CN103778555A (zh) * | 2014-01-21 | 2014-05-07 | 北京集奥聚合科技有限公司 | 基于用户标签的用户属性挖掘方法和系统 |
CN104867037A (zh) * | 2015-05-29 | 2015-08-26 | 北京京东尚科信息技术有限公司 | 一种画像特征的数据处理方法及装置 |
CN105005587A (zh) * | 2015-06-26 | 2015-10-28 | 深圳市腾讯计算机系统有限公司 | 一种用户画像的更新方法、装置和系统 |
Cited By (30)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108572967A (zh) * | 2017-03-09 | 2018-09-25 | 神州数码系统集成服务有限公司 | 一种创建企业画像的方法及装置 |
CN107315810A (zh) * | 2017-06-27 | 2017-11-03 | 济南浪潮高新科技投资发展有限公司 | 一种物联网设备行为画像方法 |
CN107315810B (zh) * | 2017-06-27 | 2020-04-21 | 浪潮集团有限公司 | 一种物联网设备行为画像方法 |
CN107317688A (zh) * | 2017-07-25 | 2017-11-03 | 薛江炜 | 基于分类标签创建通信群组的装置及方法 |
WO2019062081A1 (zh) * | 2017-09-28 | 2019-04-04 | 平安科技(深圳)有限公司 | 业务员画像形成方法、电子装置及计算机可读存储介质 |
CN107786376A (zh) * | 2017-10-20 | 2018-03-09 | 广州优视网络科技有限公司 | 内容推送方法、装置及计算机设备 |
CN107844548A (zh) * | 2017-10-30 | 2018-03-27 | 北京锐安科技有限公司 | 一种数据标签方法和装置 |
CN110431585A (zh) * | 2018-01-22 | 2019-11-08 | 华为技术有限公司 | 一种用户画像的生成方法及装置 |
CN110431585B (zh) * | 2018-01-22 | 2024-03-15 | 华为技术有限公司 | 一种用户画像的生成方法及装置 |
CN108564262A (zh) * | 2018-03-31 | 2018-09-21 | 甘肃万维信息技术有限责任公司 | 基于大数据分析的企业画像大数据模型系统 |
WO2019232891A1 (zh) * | 2018-06-06 | 2019-12-12 | 平安科技(深圳)有限公司 | 用户画像获取方法、装置、计算机设备以及存储介质 |
CN109034876A (zh) * | 2018-07-05 | 2018-12-18 | 天津璧合信息技术有限公司 | 一种行业画像分析方法及装置 |
CN109086384A (zh) * | 2018-07-26 | 2018-12-25 | 珠海卓邦科技有限公司 | 基于用户画像的水务管理方法及系统 |
CN110009438A (zh) * | 2018-11-07 | 2019-07-12 | 爱保科技(横琴)有限公司 | 基于车主社群的信息处理方法及装置 |
WO2020098308A1 (zh) * | 2018-11-12 | 2020-05-22 | 平安科技(深圳)有限公司 | 人群画像分类模型的建立方法、装置、设备和存储介质 |
CN110245070A (zh) * | 2019-05-07 | 2019-09-17 | 平安科技(深圳)有限公司 | 测试用户筛选方法、装置、计算机设备及存储介质 |
CN110245070B (zh) * | 2019-05-07 | 2024-05-31 | 平安科技(深圳)有限公司 | 测试用户筛选方法、装置、计算机设备及存储介质 |
CN110532306A (zh) * | 2019-05-27 | 2019-12-03 | 浙江工业大学 | 一种基于多视角二分k-means的高校图书馆用户画像模型构建方法 |
CN110532306B (zh) * | 2019-05-27 | 2021-12-17 | 浙江工业大学 | 一种基于多视角二分k-means的高校图书馆用户画像模型构建方法 |
CN113366523A (zh) * | 2019-06-20 | 2021-09-07 | 深圳市欢太科技有限公司 | 资源推送方法及相关产品 |
CN113366523B (zh) * | 2019-06-20 | 2024-05-07 | 深圳市欢太科技有限公司 | 资源推送方法及相关产品 |
CN110928990B (zh) * | 2019-10-31 | 2023-08-22 | 南方电网调峰调频发电有限公司 | 一种基于用户画像专用于电力设备台账数据推荐的方法 |
CN110928990A (zh) * | 2019-10-31 | 2020-03-27 | 南方电网调峰调频发电有限公司 | 一种基于用户画像专用于电力设备台账数据推荐的方法 |
CN111625718A (zh) * | 2020-05-19 | 2020-09-04 | 辽宁工程技术大学 | 一种基于用户搜索关键词数据的用户画像构建方法 |
CN111612551A (zh) * | 2020-06-03 | 2020-09-01 | 陈包容 | 商家进行用户数据引流的方法及系统 |
CN112037052A (zh) * | 2020-11-04 | 2020-12-04 | 上海冰鉴信息科技有限公司 | 用户行为检测方法及装置 |
CN112905783A (zh) * | 2021-02-19 | 2021-06-04 | 卓尔智联(武汉)研究院有限公司 | 一种群体用户画像获取方法、装置、电子设备及存储介质 |
CN116091112A (zh) * | 2022-12-29 | 2023-05-09 | 江苏玖益贰信息科技有限公司 | 一种消费者画像生成装置及画像分析方法 |
CN117407809A (zh) * | 2023-12-01 | 2024-01-16 | 广东铭太信息科技有限公司 | 基于多用户画像融合的审计管理系统及方法 |
CN117407809B (zh) * | 2023-12-01 | 2024-06-21 | 广东铭太信息科技有限公司 | 基于多用户画像融合的审计管理系统及方法 |
Also Published As
Publication number | Publication date |
---|---|
WO2017080170A1 (zh) | 2017-05-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105893406A (zh) | 群体用户画像方法及系统 | |
CN105893407A (zh) | 个体用户画像方法和系统 | |
Liu et al. | Learning geographical preferences for point-of-interest recommendation | |
Li et al. | Towards social user profiling: unified and discriminative influence model for inferring home locations | |
CN102708131B (zh) | 将消费者自动分类到微细分中 | |
CN102737334B (zh) | 微细分定义系统 | |
CN108363821A (zh) | 一种信息推送方法、装置、终端设备及存储介质 | |
WO2017190610A1 (zh) | 目标用户定向方法、装置和计算机存储介质 | |
US8341101B1 (en) | Determining relationships between data items and individuals, and dynamically calculating a metric score based on groups of characteristics | |
US20140351046A1 (en) | System and Method for Predicting an Outcome By a User in a Single Score | |
CA2941700A1 (en) | Clickstream purchase prediction using hidden markov models | |
CN103295145A (zh) | 一种基于用户消费特征向量的手机广告投放方法 | |
CN107908616B (zh) | 预测趋势词的方法和装置 | |
CN111008335B (zh) | 一种信息处理方法、装置、设备及存储介质 | |
CN107633257B (zh) | 数据质量评估方法及装置、计算机可读存储介质、终端 | |
US20170142119A1 (en) | Method for creating group user profile, electronic device, and non-transitory computer-readable storage medium | |
Zhao et al. | Gender profiling from a single snapshot of apps installed on a smartphone: An empirical study | |
CN109783726A (zh) | 一种房地产大数据计算处理方法及其系统 | |
US8478702B1 (en) | Tools and methods for determining semantic relationship indexes | |
Ding et al. | Establishing smartphone user behavior model based on energy consumption data | |
KR20220006580A (ko) | 방문 예측 | |
US10296928B1 (en) | System and methods for measuring and influencing customer trajectory within a product space | |
CN112632275B (zh) | 基于个人文本信息的人群聚类数据处理方法、装置及设备 | |
CN112967100B (zh) | 相似人群扩展方法、装置、计算设备以及介质 | |
CN112200602B (zh) | 用于广告推荐的神经网络模型训练方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20160824 |
|
WD01 | Invention patent application deemed withdrawn after publication |