CN111400599A - 一种用户群画像生成方法、装置及系统 - Google Patents
一种用户群画像生成方法、装置及系统 Download PDFInfo
- Publication number
- CN111400599A CN111400599A CN202010187473.2A CN202010187473A CN111400599A CN 111400599 A CN111400599 A CN 111400599A CN 202010187473 A CN202010187473 A CN 202010187473A CN 111400599 A CN111400599 A CN 111400599A
- Authority
- CN
- China
- Prior art keywords
- target
- data
- label
- user group
- search engine
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 33
- 238000004458 analytical method Methods 0.000 claims abstract description 62
- 238000007621 cluster analysis Methods 0.000 claims abstract description 18
- 238000002372 labelling Methods 0.000 claims abstract description 15
- 230000006399 behavior Effects 0.000 claims description 53
- 238000012800 visualization Methods 0.000 claims description 11
- 230000000007 visual effect Effects 0.000 claims description 9
- 238000004891 communication Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 238000007405 data analysis Methods 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 238000004220 aggregation Methods 0.000 description 2
- 230000002776 aggregation Effects 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000009795 derivation Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种用户群画像生成方法、装置及系统。其中所述方法包括:获取用户的行为数据进行分析,根据分析结果对所述数据标注对应的标签后存入搜索引擎数据库;接收输入的至少一个目标标签;所述目标标签对应目标用户群;根据所有所述目标标签在所述搜索引擎数据库中进行查询获得目标用户群的数据;以输入的至少一个分析维度为基础,对所述目标用户群的数据进行聚类分析得到所述目标用户群画像。本发明可准确快速进行用户群的画像生成。
Description
技术领域
本发明涉及画像技术领域,具体涉及一种基于大数据的用户群画像生成方法、装置及系统。
背景技术
随着互联网技术的日益成熟,近些年互联网用户数量增长迅速。用户针对互联网创建和访问的信息数量呈指数级递增。互联网企业和各大产品厂家为了实现针对性的信息推送,需要采集数据进行数据分析,根据用户标签进行信息推送。
但面对数量如此庞大的用户和海量的访问数据,如何准确、快速的对用户行为数据进行分析以生成用户画像是目前急需解决的问题。
发明内容
本发明的目的在于提供一种用户群画像生成方法、装置及系统,实现准确快速的分析以生成用户画像,解决现有技术的问题。
为达此目的,本发明采用以下技术方案:
本发明第一方面公开一种用户群画像生成方法,所述方法包括:
获取用户的行为数据进行分析,根据分析结果对所述数据标注对应的标签后存入搜索引擎数据库;
接收输入的至少一个目标标签;所述目标标签对应目标用户群;
根据所有所述目标标签在所述搜索引擎数据库中进行查询获得目标用户群的数据;
以输入的至少一个分析维度为基础,对所述目标用户群的数据进行聚类分析得到所述目标用户群画像。
优选的,所述以输入的至少一个分析维度为基础,对所述目标用户群的数据进行聚类分析得到所述目标用户群画像包括:
以每一所述分析维度为一次请求,通过高并发接口在所述搜索引擎数据库中进行查询获得所述分析维度的用户分布信息;
以所述分析维度的用户分布信息为基础,对所述目标用户群的数据进行聚类分析得到所述目标用户群画像。
优选的,所述方法还包括:
根据所述搜索引擎数据库中的标签数据在可视化界面中展示所有可选标签;
所述接收输入的至少一个目标标签包括:
接收在所述可视化界面从所述可选标签中选择的至少一个目标标签;
所述根据所有所述目标标签在所述搜索引擎数据库中进行查询获得目标用户群的数据包括:
按照预置的分类规则对所述目标标签进行分类;
根据所述目标标签的分类结果和预置的分类与语法的对应关系,确定每一所述目标标签的语法;
根据所述目标标签和对应的语法拼装查询语句,并根据所述查询语句在所述搜索引擎数据库中进行查询获得目标用户群的数据。
优选的,所述语法包括目标标签之间为取并集或目标标签之间为取交集。
优选的,所述获取用户的行为数据进行分析,根据分析结果对所述数据标注对应的标签后存入搜索引擎数据库包括:
获取用户的实时行为数据,对所述实时行为数据进行分析,根据分析结果对所述实时行为数据标注对应的准实时标签后存入所述搜索引擎数据库;
获取用户的离线行为数据,对所述离线行为数据进行分析,根据分析结果对所述离线行为数据标注对应的离线标签后存入所述搜索引擎数据库。
优选的,所述方法还包括:
判断所述用户当前新标注的标签是否在搜索引擎数据库中具有同一字段的历史标签;
若有,则判断新标注的标签是否与所述历史标签不同;
若不同,则根据所述用户标识,利用所述新标注的标签更新所述历史标签。
优选的,所述方法:
通过kafka获取所述用户的实时行为数据并对所述实时行为数据进行分析;
通过大数据平台对所述离线行为数据进行分析;
所述搜索引擎数据库为ES搜索引擎数据库。
本发明第二方面还公开一种用户群画像生成装置,所述装置包括:
数据获取单元,用于获取用户的行为数据进行分析,根据分析结果对所述数据标注对应的标签后存入搜索引擎数据库;
目标标签单元,用于接收输入的至少一个目标标签;所述目标标签对应目标用户群;
查询单元,用于根据所有所述目标标签在所述搜索引擎数据库中进行查询获得目标用户群的数据;
聚类分析单元,用于以输入的至少一个分析维度为基础,对所述目标用户群的数据进行聚类分析得到所述目标用户群画像。
优选的,所述装置还包括:
标签可视化展示单元,用于根据所述搜索引擎数据库中的标签数据在可视化界面中展示所有可选标签;
所述目标标签单元,具体用于接收在所述可视化界面从所述可选标签中选择的至少一个目标标签;
所述查询单元包括:
标签分类单元,用于按照预置的分类规则对所述目标标签进行分类;
语法确定单元,用于根据所述目标标签的分类结果和预置的分类与语法的对应关系,确定每一所述目标标签的语法;
查询子单元,用于根据所述目标标签和对应的语法拼装查询语句,并根据所述查询语句在所述搜索引擎数据库中进行查询获得目标用户群的数据。
本发明第三方面还公开了一种计算机系统,包括:
一个或多个处理器;以及
与所述一个或多个处理器关联的存储器,所述存储器用于存储程序指令,所述程序指令在被所述一个或多个处理器读取执行时,执行上所述的操作。
本发明的有益效果:
1、本发明可以在数据分析打标的基础上,继续选择分析维度,对特定用户群的共有属性进行进一步的多维度的动态聚类分析,实现更深层次的用户画像刻画,结果更准确。
2、标签可视化展示并可根据需求可任意组合标签,并进而根据标签的语法生成查询语句进行查询,避免了一步步的手动逐个进行每个标签的查询,实现了快速的个性化分析,提高了分析效率。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例中所需要使用的附图作简单地介绍。显而易见地,下面所描述的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明系统框架图;
图2是本发明聚类分析结果示意图;
图3是本发明方法实施例流程图;
图4是本发明计算机系统架构图。
具体实施方式
下面结合附图并通过具体实施方式来进一步说明本发明的技术方案。
其中,附图仅用于示例性说明,表示的仅是示意图,而非实物图,不能理解为对本专利的限制;为了更好地说明本发明的实施例,附图某些部件会有省略、放大或缩小,并不代表实际产品的尺寸;对本领域技术人员来说,附图中某些公知结构及其说明可能省略是可以理解的。
本发明实施例的附图中相同或相似的标号对应相同或相似的部件;在本发明的描述中,需要理解的是,若出现术语“上”、“下”、“左”、“右”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此附图中描述位置关系的用语仅用于示例性说明,不能理解为对本专利的限制,对于本领域的普通技术人员而言,可以根据具体情况理解上述术语的具体含义。
在本发明的描述中,除非另有明确的规定和限定,若出现术语“连接”等指示部件之间的连接关系,该术语应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或成一体;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个部件内部的连通或两个部件的相互作用关系。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本发明中的具体含义。
如图1所示,为本发明的系统框架图,本发明中通过Kafka获取用户的实时行为数据如订单数据、注册数据等并进行分析打标,通过大数据平台对离线数据进行分析打标,打标的结果均存入ES即Elasticsearch搜索引擎数据库。根据搜索引擎数据库中的标签数据在可视化界面展示所有可选标签供请求方选择。如请求方可以选择其中三个标签进行组合,这三个标签的组合结果即指向一个目标用户群。之后通过可视化界面接收请求方输入的分析维度,如学历。以此维度对目标用户群进行聚类分析,得到目标用户群的学历分布结果。
在本发明中,请求方输入的标签组合为限制条件,限制了待分析的用户群数据范围。在该范围内进行设定的维度分析,得到该用户群的设定维度的聚类分析结果,以实现更深更细维度的用户群画像,提高画像的准确度。
本发明中首先需要获取用户的行为数据进行打标,一种是实时行为数据,一种是离线行为数据:
关于实时行为数据,本发明中通过kafka去订阅topic,实时获取用户的浏览行为,购物车信息,购买商品,理财产品等信息,kafka对这些信息进行加工,生成准实时标签存入ElasticSearch。
如:kafka通过接收用户浏览商品的时长topic和用户浏览商品的次数的topic,系统可以分析出用户对这类商品是否感兴趣。即:在一定的时间区间内,把用户的浏览时长做合计,再根据浏览的次数分析,当时长和次数达到某一个点时,系统会根据用户的ID去更新ElasticSearch的这一个字段的值。
如:kafka通过接收用户登录的topic数据,根据用户的登录信息算出用户近3天的活跃度标签。
关于离线数据,通过大数据平台对离线数据进行分析,生成离线标签,存入ElasticSearch。
大数据平台对数亿的会员进行全量的数据分析,即:查找当天和昨天的数据不一样的用户,如用户等级提升/降低了,用户资产提升/降低了等,只要有一个数据列变化了,就认为用户数据标签变化了,然后HIVE把这些变化的数据生成文件,通过ElasticSearch的标准接口批量对这些数据进行更新。
上述实时行为数据和离线行为数据包括但不限于用户的年龄、职业、性别、行为特征、消费方式、消费水平、投资偏好、资产特征、浏览习惯、购物车信息、商品购买记录、理财信息、账号等级中的任意一种或多种。
接着,通过系统的标签筛选可视化界面服务,在系统中挑选N个标签创建一个用户群,N为大于等于1的整数。
具体的可根据搜索引擎数据库中的标签数据列出所有可选标签,并在可视化界面中展示。所有标签都有列表展示页,每个标签的说明解释可以从列表页获取,用户可以在展示的标签中任意挑选N个进行组合。
这N个标签的组合就指向一个目标用户群。后续的分析即以此用户群数据范围为限。
每组标签组合对应一个用户群,可以作为历史用户群展示在用户群画像页面。
同时,接收请求方输入的分析维度,可以是多个分析维度,并可以通过可视化界面选择或自行输入,维度配置灵活多样。
之后,点击对应的目标用户群分析按钮,即可利用调用接口在ElasticSearch中,按照上述维度对目标用户群数据进行聚合计算,并可以对聚合计算的结果进行图表展示或图表导出。
点击分析按钮时,获取目标用户群对应的标签组合,对每一个标签按照分类进行梳理,对不同的分类匹配不同的语法,最终拼装ElasticSearch的查询语句,对查询语句加上进行分组语法,发送http请求到服务器,获取数据进行聚类分析。图2示出了一种聚类分析结果。
实施例1
综上,本发明实施例1提供了一种用户群画像生成方法,如图3所示,所述方法包括:
S31获取用户的行为数据进行分析,根据分析结果对所述数据标注对应的标签后存入搜索引擎数据库。
具体可包括:
获取用户的实时行为数据,对所述实时行为数据进行分析,根据分析结果对所述实时行为数据标注对应的准实时标签后存入所述搜索引擎数据库;
获取用户的离线行为数据,对所述离线行为数据进行分析,根据分析结果对所述离线行为数据标注对应的离线标签后存入所述搜索引擎数据库。
可通过kafka获取所述用户的实时行为数据并对所述实时行为数据进行分析,可通过大数据平台对所述离线行为数据进行分析,上述搜索引擎数据库优选为ES搜索引擎数据库。
S32接收输入的至少一个目标标签;所述目标标签对应目标用户群。
S33根据所有所述目标标签在所述搜索引擎数据库中进行查询获得目标用户群的数据。
S34以输入的至少一个分析维度为基础,对所述目标用户群的数据进行聚类分析得到所述目标用户群画像。
其中,步骤S34包括:
以每一所述分析维度为一次请求,通过高并发接口在所述搜索引擎数据库中进行查询获得所述分析维度的用户分布信息;
以所述分析维度的用户分布信息为基础,对所述目标用户群的数据进行聚类分析得到所述目标用户群画像。
优选实施例中,所述方法还包括:
根据所述搜索引擎数据库中的标签数据在可视化界面中展示所有可选标签;
所述接收输入的至少一个目标标签包括:
接收在所述可视化界面从所述可选标签中选择的至少一个目标标签;
所述根据所有所述目标标签在所述搜索引擎数据库中进行查询获得目标用户群的数据包括:
按照预置的分类规则对所述目标标签进行分类;
根据预置的分类与语法的对应关系,确定每一所述目标标签的语法;所述语法包括目标标签之间取并集或目标标签之间取交集。如:年龄段包含80后,年龄段标签用的字段类型是keyword,语法为"match":{"ageType":"80"};年龄大于20岁且小于30岁,年龄的标签用的字段类型是integer,语法为:"range":{"age":{"gte":"20","lte":"30"}}。
根据所述目标标签和对应的语法拼装查询语句,并根据所述查询语句在所述搜索引擎数据库中进行查询获得目标用户群的数据。
优选的,本发明还包括根据新数据对搜索引擎数据库中的数据进行更新:
判断所述用户当前新标注的标签是否在搜索引擎数据库中具有同一字段的历史标签;
若有,则判断新标注的标签是否与所述历史标签不同;
若不同,则根据所述用户标识,利用所述新标注的标签更新所述历史标签。
实施例2
本发明实施例2还公开一种用户群画像生成装置,所述装置包括:
数据获取单元,用于获取用户的行为数据进行分析,根据分析结果对所述数据标注对应的标签后存入搜索引擎数据库。
数据获取单元,具体用于获取用户的实时行为数据,对所述实时行为数据进行分析,根据分析结果对所述实时行为数据标注对应的准实时标签后存入所述搜索引擎数据库;
数据获取单元,具体用于获取用户的离线行为数据,对所述离线行为数据进行分析,根据分析结果对所述离线行为数据标注对应的离线标签后存入所述搜索引擎数据库。
数据获取单元,具体可通过kafka获取所述用户的实时行为数据并对所述实时行为数据进行分析,通过大数据平台对所述离线行为数据进行分析。
上述搜索引擎数据库优选为ES搜索引擎数据库。
目标标签单元,用于接收输入的至少一个目标标签;所述目标标签对应目标用户群;
查询单元,用于根据所有所述目标标签在所述搜索引擎数据库中进行查询获得目标用户群的数据;
聚类分析单元,用于以输入的至少一个分析维度为基础,对所述目标用户群的数据进行聚类分析得到所述目标用户群画像。
聚类分析单元,具体用于以每一所述分析维度为一次请求,通过高并发接口在所述搜索引擎数据库中进行查询获得所述分析维度的用户分布信息,以所述分析维度的用户分布信息为基础,对所述目标用户群的数据进行聚类分析得到所述目标用户群画像。
所述装置还包括:
标签可视化展示单元,用于根据所述搜索引擎数据库中的标签数据在可视化界面中展示所有可选标签;
所述目标标签单元,具体用于接收在所述可视化界面从所述可选标签中选择的至少一个目标标签;
所述查询单元包括:
标签分类单元,用于按照预置的分类规则对所述目标标签进行分类;
语法确定单元,用于根据所述目标标签的分类结果和预置的分类与语法的对应关系,确定每一所述目标标签的语法;所述语法包括目标标签之间为取并集或目标标签之间为取交集。
查询子单元,用于根据所述目标标签和对应的语法拼装查询语句,并根据所述查询语句在所述搜索引擎数据库中进行查询获得目标用户群的数据。
优选的,装置还包括数据标签更新单元,用于在判断到用户当前新标注的标签在搜索引擎数据库中具有同一字段的历史标签时,判断新标注的标签是否与所述历史标签不同并在不同时,根据所述用户标识,利用所述新标注的标签更新所述历史标签。
实施例3
本发明还提供了一种计算机系统,所述系统包括:
一个或多个处理器;以及
与所述一个或多个处理器关联的存储器,所述存储器用于存储程序指令,所述程序指令在被所述一个或多个处理器读取执行时,执行上述实施例的方法步骤对应的操作。
其中,图4示例性的展示出了计算机系统的架构,具体可以包括处理器1510,视频显示适配器1511,磁盘驱动器1512,输入/输出接口1513,网络接口1514,以及存储器1520。上述处理器1510、视频显示适配器1511、磁盘驱动器1512、输入/输出接口1513、网络接口1514,与存储器1520之间可以通过通信总线1530进行通信连接。
其中,处理器1510可以采用通用的CPU(Central ProcElasticsearchsing Unit,中央处理器)、微处理器、应用专用集成电路(Application Specific IntegratedCircuit,ASIC)、或者一个或多个集成电路等方式实现,用于执行相关程序,以实现本发明所提供的技术方案。
存储器1520可以采用ROM(Read Only Memory,只读存储器)、RAM(RandomAccElasticsearchs Memory,随机存取存储器)、静态存储设备,动态存储设备等形式实现。存储器1520可以存储用于控制计算机系统1500运行的操作系统1521,用于控制计算机系统1500的低级别操作的基本输入输出系统(BIOS)。另外,还可以存储网页浏览器1523,数据存储管理系统1524,以及图标字体处理系统1525等等。上述图标字体处理系统1525就可以是本发明实施例中具体实现前述各步骤操作的应用程序。总之,在通过软件或者固件来实现本发明所提供的技术方案时,相关的程序代码保存在存储器1520中,并由处理器1510来调用执行。
输入/输出接口1513用于连接输入/输出模块,以实现信息输入及输出。输入输出/模块可以作为组件配置在设备中(图中未示出),也可以外接于设备以提供相应功能。其中输入设备可以包括键盘、鼠标、触摸屏、麦克风、各类传感器等,输出设备可以包括显示器、扬声器、振动器、指示灯等。
网络接口1514用于连接通信模块(图中未示出),以实现本设备与其他设备的通信交互。其中通信模块可以通过有线方式(例如USB、网线等)实现通信,也可以通过无线方式(例如移动网络、WIFI、蓝牙等)实现通信。
总线1530包括一通路,在设备的各个组件(例如处理器1510、视频显示适配器1511、磁盘驱动器1512、输入/输出接口1513、网络接口1514,与存储器1520)之间传输信息。
另外,该计算机系统1500还可以从虚拟资源对象领取条件信息数据库1541中获得具体领取条件的信息,以用于进行条件判断,等等。
需要说明的是,尽管上述设备仅示出了处理器1510、视频显示适配器1511、磁盘驱动器1512、输入/输出接口1513、网络接口1514,存储器1520,总线1530等,但是在具体实施过程中,该设备还可以包括实现正常运行所必需的其他组件。此外,本领域的技术人员可以理解的是,上述设备中也可以仅包含实现本发明方案所必需的组件,而不必包含图中所示的全部组件。
通过以上的实施方式的描述可知,本领域的技术人员可以清楚地了解到本发明可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,云服务器,或者网络设备等)执行本发明各个实施例或者实施例的某些部分所述的方法。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统或系统实施例而言,由于其基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。以上所描述的系统及系统实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
以上对本发明所提供的方法、装置及系统,进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处。综上所述,本说明书内容不应理解为对本发明的限制。
Claims (10)
1.一种用户群画像生成方法,其特征在于,所述方法包括:
获取用户的行为数据进行分析,根据分析结果对所述数据标注对应的标签后存入搜索引擎数据库;
接收输入的至少一个目标标签;所述目标标签对应目标用户群;
根据所有所述目标标签在所述搜索引擎数据库中进行查询获得目标用户群的数据;
以输入的至少一个分析维度为基础,对所述目标用户群的数据进行聚类分析得到所述目标用户群画像。
2.如权利要求1所述的方法,其特征在于,所述以输入的至少一个分析维度为基础,对所述目标用户群的数据进行聚类分析得到所述目标用户群画像包括:
以每一所述分析维度为一次请求,通过高并发接口在所述搜索引擎数据库中进行查询获得所述分析维度的用户分布信息;
以所述分析维度的用户分布信息为基础,对所述目标用户群的数据进行聚类分析得到所述目标用户群画像。
3.如权利要求1所述的方法,其特征在于,所述方法还包括:
根据所述搜索引擎数据库中的标签数据在可视化界面中展示所有可选标签;
所述接收输入的至少一个目标标签包括:
接收在所述可视化界面从所述可选标签中选择的至少一个目标标签;
所述根据所有所述目标标签在所述搜索引擎数据库中进行查询获得目标用户群的数据包括:
按照预置的分类规则对所述目标标签进行分类;
根据所述目标标签的分类结果和预置的分类与语法的对应关系,确定每一所述目标标签的语法;
根据所述目标标签和对应的语法拼装查询语句,并根据所述查询语句在所述搜索引擎数据库中进行查询获得目标用户群的数据。
4.如权利要求3所述的方法,其特征在于,所述语法包括目标标签之间为取并集或目标标签之间为取交集。
5.如权利要求1所述的方法,其特征在于,所述获取用户的行为数据进行分析,根据分析结果对所述数据标注对应的标签后存入搜索引擎数据库包括:
获取用户的实时行为数据,对所述实时行为数据进行分析,根据分析结果对所述实时行为数据标注对应的准实时标签后存入所述搜索引擎数据库;
获取用户的离线行为数据,对所述离线行为数据进行分析,根据分析结果对所述离线行为数据标注对应的离线标签后存入所述搜索引擎数据库。
6.如权利要求1-5任一项所述的方法,其特征在于,所述方法还包括:
判断所述用户当前新标注的标签是否在搜索引擎数据库中具有同一字段的历史标签;
若有,则判断新标注的标签是否与所述历史标签不同;
若不同,则根据所述用户标识,利用所述新标注的标签更新所述历史标签。
7.如权利要求5所述的方法,其特征在于,所述方法:
通过kafka获取所述用户的实时行为数据并对所述实时行为数据进行分析;
通过大数据平台对所述离线行为数据进行分析;
所述搜索引擎数据库为ES搜索引擎数据库。
8.一种用户群画像生成装置,其特征在于,所述装置包括:
数据获取单元,用于获取用户的行为数据进行分析,根据分析结果对所述数据标注对应的标签后存入搜索引擎数据库;
目标标签单元,用于接收输入的至少一个目标标签;所述目标标签对应目标用户群;
查询单元,用于根据所有所述目标标签在所述搜索引擎数据库中进行查询获得目标用户群的数据;
聚类分析单元,用于以输入的至少一个分析维度为基础,对所述目标用户群的数据进行聚类分析得到所述目标用户群画像。
9.如权利要求8所述的装置,其特征在于,所述装置还包括:
标签可视化展示单元,用于根据所述搜索引擎数据库中的标签数据在可视化界面中展示所有可选标签;
所述目标标签单元,具体用于接收在所述可视化界面从所述可选标签中选择的至少一个目标标签;
所述查询单元包括:
标签分类单元,用于按照预置的分类规则对所述目标标签进行分类;
语法确定单元,用于根据所述目标标签的分类结果和预置的分类与语法的对应关系,确定每一所述目标标签的语法;
查询子单元,用于根据所述目标标签和对应的语法拼装查询语句,并根据所述查询语句在所述搜索引擎数据库中进行查询获得目标用户群的数据。
10.一种计算机系统,其特征在于,包括:
一个或多个处理器;以及
与所述一个或多个处理器关联的存储器,所述存储器用于存储程序指令,所述程序指令在被所述一个或多个处理器读取执行时,执行如权利要求1-7任一项所述的操作。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010187473.2A CN111400599A (zh) | 2020-03-17 | 2020-03-17 | 一种用户群画像生成方法、装置及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010187473.2A CN111400599A (zh) | 2020-03-17 | 2020-03-17 | 一种用户群画像生成方法、装置及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111400599A true CN111400599A (zh) | 2020-07-10 |
Family
ID=71428852
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010187473.2A Pending CN111400599A (zh) | 2020-03-17 | 2020-03-17 | 一种用户群画像生成方法、装置及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111400599A (zh) |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112559899A (zh) * | 2021-02-25 | 2021-03-26 | 北京睿企信息科技有限公司 | 一种用户画像生成方法 |
CN112637684A (zh) * | 2020-12-25 | 2021-04-09 | 四川长虹电器股份有限公司 | 智能电视端探测用户画像标签的方法 |
CN112733017A (zh) * | 2020-12-30 | 2021-04-30 | 青岛海尔科技有限公司 | 一种标签管理方法、装置、存储介质及电子装置 |
CN112860808A (zh) * | 2020-12-30 | 2021-05-28 | 深圳市华傲数据技术有限公司 | 基于数据标签的用户画像分析方法、装置、介质和设备 |
CN113297287A (zh) * | 2021-04-28 | 2021-08-24 | 上海淇玥信息技术有限公司 | 用户策略自动部署方法、装置及电子设备 |
CN113297290A (zh) * | 2021-04-28 | 2021-08-24 | 上海淇玥信息技术有限公司 | 实时用户策略配置方法、装置及电子设备 |
CN113434742A (zh) * | 2021-06-28 | 2021-09-24 | 青岛海尔科技有限公司 | 账号的筛选方法和装置、存储介质及电子装置 |
CN114820080A (zh) * | 2022-05-24 | 2022-07-29 | 上海钧正网络科技有限公司 | 基于人群流转的用户分群方法、系统、装置及介质 |
CN115545791A (zh) * | 2022-10-19 | 2022-12-30 | 中电金信软件有限公司 | 一种客群画像生成方法、装置、电子设备及存储介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106503015A (zh) * | 2015-09-07 | 2017-03-15 | 国家计算机网络与信息安全管理中心 | 一种构建用户画像的方法 |
CN108810060A (zh) * | 2017-05-05 | 2018-11-13 | 阿里巴巴集团控股有限公司 | 业务信息的提供、接收、用户聚合方法、服务器及客户端 |
CN109710820A (zh) * | 2018-12-06 | 2019-05-03 | 南京安讯科技有限责任公司 | 一种基于大数据任意客群多维度实时聚类分析的方法 |
CN109919652A (zh) * | 2019-01-17 | 2019-06-21 | 平安城市建设科技(深圳)有限公司 | 用户群体分类方法、装置、设备及存储介质 |
-
2020
- 2020-03-17 CN CN202010187473.2A patent/CN111400599A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106503015A (zh) * | 2015-09-07 | 2017-03-15 | 国家计算机网络与信息安全管理中心 | 一种构建用户画像的方法 |
CN108810060A (zh) * | 2017-05-05 | 2018-11-13 | 阿里巴巴集团控股有限公司 | 业务信息的提供、接收、用户聚合方法、服务器及客户端 |
CN109710820A (zh) * | 2018-12-06 | 2019-05-03 | 南京安讯科技有限责任公司 | 一种基于大数据任意客群多维度实时聚类分析的方法 |
CN109919652A (zh) * | 2019-01-17 | 2019-06-21 | 平安城市建设科技(深圳)有限公司 | 用户群体分类方法、装置、设备及存储介质 |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112637684A (zh) * | 2020-12-25 | 2021-04-09 | 四川长虹电器股份有限公司 | 智能电视端探测用户画像标签的方法 |
CN112733017A (zh) * | 2020-12-30 | 2021-04-30 | 青岛海尔科技有限公司 | 一种标签管理方法、装置、存储介质及电子装置 |
CN112860808A (zh) * | 2020-12-30 | 2021-05-28 | 深圳市华傲数据技术有限公司 | 基于数据标签的用户画像分析方法、装置、介质和设备 |
CN112559899A (zh) * | 2021-02-25 | 2021-03-26 | 北京睿企信息科技有限公司 | 一种用户画像生成方法 |
CN113297287A (zh) * | 2021-04-28 | 2021-08-24 | 上海淇玥信息技术有限公司 | 用户策略自动部署方法、装置及电子设备 |
CN113297290A (zh) * | 2021-04-28 | 2021-08-24 | 上海淇玥信息技术有限公司 | 实时用户策略配置方法、装置及电子设备 |
CN113434742A (zh) * | 2021-06-28 | 2021-09-24 | 青岛海尔科技有限公司 | 账号的筛选方法和装置、存储介质及电子装置 |
CN114820080A (zh) * | 2022-05-24 | 2022-07-29 | 上海钧正网络科技有限公司 | 基于人群流转的用户分群方法、系统、装置及介质 |
CN115545791A (zh) * | 2022-10-19 | 2022-12-30 | 中电金信软件有限公司 | 一种客群画像生成方法、装置、电子设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111400599A (zh) | 一种用户群画像生成方法、装置及系统 | |
CN109460513B (zh) | 用于生成点击率预测模型的方法和装置 | |
CN109697629B (zh) | 产品数据推送方法及装置、存储介质、计算机设备 | |
CN108205768B (zh) | 数据库建立方法和数据推荐方法及装置、设备和存储介质 | |
US9659103B2 (en) | Auto-aligning website elements by grouping elements based on a plurality of contextual indicators | |
CN105893406A (zh) | 群体用户画像方法及系统 | |
US20210406685A1 (en) | Artificial intelligence for keyword recommendation | |
CN112115363A (zh) | 一种推荐方法、计算设备及存储介质 | |
JP6703572B2 (ja) | 情報処理装置、情報処理方法および情報処理プログラム | |
WO2013119280A1 (en) | Tools and methods for determining relationship values | |
CN112905897B (zh) | 相似用户确定方法、向量转化模型、装置、介质及设备 | |
CN110019699A (zh) | 域间通过语法槽的分类 | |
US10290032B2 (en) | Blacklisting based on image feature analysis and collaborative filtering | |
CN112070577A (zh) | 一种商品推荐方法、系统、设备及介质 | |
EP3961426A2 (en) | Method and apparatus for recommending document, electronic device and medium | |
CN113032668A (zh) | 基于用户画像的产品推荐方法、装置、设备及存储介质 | |
US10152469B2 (en) | Analytics report segments and controls | |
CN111339406A (zh) | 个性化推荐方法、装置、设备及存储介质 | |
CN106484913B (zh) | 一种目标图片确定的方法以及服务器 | |
CN109934631A (zh) | 问答信息处理方法、装置及计算机设备 | |
JP2020035167A (ja) | 情報処理装置、情報処理方法および情報処理プログラム | |
CN114429384B (zh) | 基于电商平台的产品智能推荐方法及系统 | |
CN111768218A (zh) | 用于处理用户交互信息的方法和装置 | |
CN115796914A (zh) | 运营数据分析方法、系统、计算机设备及存储介质 | |
CN114549125A (zh) | 物品推荐方法及装置、电子设备和计算机可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20200710 |