CN115357767A - 一种用户标签画像方法和系统 - Google Patents
一种用户标签画像方法和系统 Download PDFInfo
- Publication number
- CN115357767A CN115357767A CN202211011399.4A CN202211011399A CN115357767A CN 115357767 A CN115357767 A CN 115357767A CN 202211011399 A CN202211011399 A CN 202211011399A CN 115357767 A CN115357767 A CN 115357767A
- Authority
- CN
- China
- Prior art keywords
- user
- data table
- tag
- derivative
- tags
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 38
- 238000012216 screening Methods 0.000 claims description 19
- 238000013507 mapping Methods 0.000 claims description 14
- 230000006835 compression Effects 0.000 claims description 6
- 238000007906 compression Methods 0.000 claims description 6
- 238000010276 construction Methods 0.000 claims description 6
- 238000007493 shaping process Methods 0.000 claims description 5
- 230000008569 process Effects 0.000 claims description 3
- 238000012545 processing Methods 0.000 claims description 3
- 238000003384 imaging method Methods 0.000 claims 3
- 238000011161 development Methods 0.000 abstract description 5
- 238000004458 analytical method Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 238000012360 testing method Methods 0.000 description 4
- 238000007726 management method Methods 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 238000011144 upstream manufacturing Methods 0.000 description 2
- 230000004075 alteration Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000010191 image analysis Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000009877 rendering Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012800 visualization Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/903—Querying
- G06F16/9035—Filtering based on additional data, e.g. user or group profiles
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/22—Indexing; Data structures therefor; Storage structures
- G06F16/2282—Tablespace storage structures; Management thereof
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2455—Query execution
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Software Systems (AREA)
- Information Transfer Between Computers (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提供了一种用户标签画像方法和系统,所述用户标签画像方法包括:采集若干第一用户的原始数据,构建基础标签;对基础标签进行分层配置,获得衍生标签,构建标签数据表;响应对第二用户的画像请求,根据第二用户的标识匹配对应的u_id,通过查询所述标签数据表,匹配与所述第二用户对应的不少于一个衍生标签,获得针对所述第二用户的画像;其中,所述若干第一用户包括所述第二用户。相比于现有技术,基于用户的数据进而构建基础标签,在基础标签的基础上分层配置,获得衍生标签,相比现有技术提前定义基础标签和衍生标签,具有更高的灵活性,且能适用于更多的业务场景,针对复杂的属性无需后台开发。
Description
技术领域
本发明涉及用户标签领域,尤其涉及一种用户标签画像方法和系统。
背景技术
现有技术通过构建画像和标签实现批量用户管理,以实现对用户进行有效、精准的信息推送。
目前,在标签系统中,市面上的产品主要是在系统中构建映射表,通过数仓下发数据。并且在基础标签库通过存入oracle、mysql等,生成相应的源表数据。然后,相关人员在基础标签的基础上,提前配置好衍生标签和规则,针对不同用户匹配上对应的用户衍生标签,并通过不同的规则进行衍生标签宽表的生成,用户画像的查询和分析。这种方法由于基础标签以及衍生标签都是预定义的,因此灵活性较低。
发明内容
本发明提供了一种用户标签画像方法和系统,以解决如何提高灵活性的技术问题。
为了解决上述技术问题,本发明实施例提供了一种用户标签画像方法,包括:
采集若干第一用户的原始数据,并基于所述原始数据,构建若干基础标签;
对所述若干基础标签进行分层配置,获得若干衍生标签;其中,每个分层为一个或多个所述基础标签的合集;每个所述衍生标签包括不少于两个分层;
根据所述若干衍生标签,构建标签数据表;其中,所述标签数据表包括若干与u_id集合,所述u_id集合中包括所有与所述第一用户一一对应的u_id;所述u_id集合与一衍生标签一一对应;
响应对第二用户的画像请求,根据第二用户的标识匹配对应的u_id,通过所述第二用户的u_id查询所述标签数据表,匹配与所述第二用户对应的不少于一个衍生标签,获得针对所述第二用户的画像;其中,所述若干第一用户包括所述第二用户。
作为一种可能的实施方式,所述根据所述若干衍生标签,构建标签数据表,具体为:
将所述若干衍生标签处理成用户id和u_id数组,所述u_id数组中存储有与各衍生标签对应的u_id集合,根据所有所述u_id集合,构建所述标签数据表。
作为一种可能的实施方式,所述标签数据表中的所有u_id集合通过bitmap的方式进行存储;
所述构建所述标签数据表之前还包括:
对所有u_id集合通过位图压缩算法生成RoaringBitmap结构,并存储为bitmap集合。
作为一种可能的实施方式,所述用户标签画像方法还包括:
获取目标筛选信息,并查询所述标签数据表;根据所述目标筛选信息与所述标签数据表中的衍生标签,生成新的u_id集合;基于所述新的u_id集合,通过查询用户与u_id的映射表,获得目标用户集合。
作为一种可能的实施方式,所述采集若干第一用户的原始数据,具体为:通过配置接入方式,采集若干所述第一用户的行为数据和状态数据;其中,所述配置接入方式包括配置数据库信息和配置Kafta消费队列。
作为一种可能的实施方式,在所述采集若干第一用户的原始数据之前,还包括:
通过32位整形数字对所有第一用户进行编码,通过与各第一用户的用户标识进行映射,生成各第一用户的u_id,并构建用户与u_id映射表。
相应的,本发明实施例还提供了一种用户标签画像系统,包括采集模块、分层配置模块、标签数据表构建模块和画像模块,其中,
所述采集模块,用于采集若干第一用户的原始数据,并基于所述原始数据,构建若干基础标签;
所述分层配置模块,用于对所述若干基础标签进行分层配置,获得若干衍生标签;其中,每个分层为一个或多个所述基础标签的合集;每个所述衍生标签包括不少于两个分层;
所述标签数据表构建模块,用于根据所述若干衍生标签,构建标签数据表;其中,所述标签数据表包括若干与u_id集合,所述u_id集合中包括所有与所述第一用户一一对应的u_id;所述u_id集合与一衍生标签一一对应;
所述画像模块,用于响应对第二用户的画像请求,根据第二用户的标识匹配对应的u_id,通过所述第二用户的u_id查询所述标签数据表,匹配与所述第二用户对应的不少于一个衍生标签,获得针对所述第二用户的画像;其中,所述若干第一用户包括所述第二用户。
作为一种可能的实施方式,所述标签数据表构建模块根据所述若干衍生标签,构建标签数据表,具体为:
所述标签数据表构建模块将所述若干衍生标签处理成用户id和u_id数组,所述u_id数组中存储有与各衍生标签对应的u_id集合,根据所有所述u_id集合,构建所述标签数据表。
作为一种可能的实施方式,所述标签数据表中的所有u_id集合通过bitmap的方式进行存储;
所述用户标签画像系统还包括存储模块,所述存储模块用于在所述标签数据表构建模块构建所述标签数据表之前,对所有u_id集合通过位图压缩算法生成RoaringBitmap结构,并存储为bitmap集合。
作为一种可能的实施方式,所述用户标签画像系统还包括逆向筛选模块;
所述逆向筛选模块,用于获取目标筛选信息,并查询所述标签数据表;根据所述目标筛选信息与所述标签数据表中的衍生标签,生成新的u_id集合;基于所述新的u_id集合,通过查询用户与u_id的映射表,获得目标用户集合。
相比于现有技术,本发明实施例具有如下有益效果:
本发明实施例提供了一种用户标签画像方法和系统,所述用户标签画像方法包括:采集若干第一用户的原始数据,并基于所述原始数据,构建若干基础标签;对所述若干基础标签进行分层配置,获得若干衍生标签;其中,每个分层为一个或多个所述基础标签的合集;每个所述衍生标签包括不少于两个分层;根据所述若干衍生标签,构建标签数据表;其中,所述标签数据表包括若干与u_id集合,所述u_id集合中包括所有与所述第一用户一一对应的u_id;所述u_id集合与一衍生标签一一对应;响应对第二用户的画像请求,根据第二用户的标识匹配对应的u_id,通过所述第二用户的u_id查询所述标签数据表,匹配与所述第二用户对应的不少于一个衍生标签,获得针对所述第二用户的画像;其中,所述若干第一用户包括所述第二用户。相比于现有技术,基于用户的数据进而构建基础标签,在基础标签的基础上分层配置,获得衍生标签,相比现有技术提前定义基础标签和衍生标签,具有更高的灵活性,且能适用于更多的业务场景,针对复杂的属性(例如api、全量展示和分页展示)无需后台开发。
附图说明
图1:为本发明提供的用户标签画像方法的一种实施例的流程示意图。
图2:为本发明提供的用户标签画像系统的一种实施例的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例一:
根据相关技术记载,传统的标签方法在新建映射表时,通过数仓下发数据,基础标签库通过存入oracle、mysql等,生成相应的源表数据,需要相关人员提前配置好衍生标签和规则,然后根据配置好的规则,使用户匹配上对应的衍生标签。
但是这些传统的技术不能灵活地配置基础标签以及衍生标签,基础属性和值的管理都是提前预定义的,对于复杂属性(例如API、全量展示和分页展示)都依赖开发,并且基本采用后台开发,不具备页面进行配置的功能。
另一方面,现有的系统都是针对入库数据(所使用的基础标签数据全部存储至画像系统),按照逻辑规则进行打上标签,对于未入库数据(系统中未存储的数据),则无法对之进行分析。此外,该方法在数据获取方面依赖数仓或者上游供给数据,具有实时性低的问题,难以进行监控。并且,在存储方式上,随着衍生标签的数量以及逻辑复杂度,运算效率会明显下降,因此亟需一种能解决上述一个或多个技术问题的画像分析和打标方法。
针对上述一个或多个技术问题,请参照图1,图1为本发明实施例提供的一种用户标签画像方法,包括步骤S1至步骤S4,其中,
步骤S1,采集若干第一用户的原始数据,并基于所述原始数据,构建若干基础标签。
在本实施例中,首先通过32位整形数字对所有第一用户进行编码,通过与各第一用户的用户标识进行映射,生成各第一用户的u_id,然后构建用户与u_id映射表。
进一步地,通过配置接入方式,采集若干所述第一用户的行为数据和状态数据(原始数据包括所述行为数据和状态数据);其中,所述配置接入方式包括配置数据库信息和配置Kafta消费队列。
本实施例中数据源的接入采用数据同步策略进行接入,包括主动抽取和队列接收两种方式。其中,主动抽取就是通过配置数据库信息,例如,包括但不限于JDBC驱动、数据源地址、用户名、密码、表名和表字段信息等。另外,队列接收则是配置Kafta消费队列,主要是按照约定的模板来推送数据,譬如,包括myql驱动、username、password、test表,而test表包含主键、姓名、性别、贷款产品四个字段等。实施本申请实施例,开通了网络策略,上游无需改造即可直接抽取,可以保证数据的有效连通性。
在采集若干第一用户的原始数据之后,将所有的原始数据存储至本地数据库,并基于所述原始数据,构建若干基础标签。
所述基础标签的组成包括名称、运算符和值,且三个组成部分完全解耦。基础标签可以配置包括但不限于API接口以及字典值,运算符号包括大于、小于、交集、并集和异或等运算,且可以针对数据类型,自定义运算值选项类型,以覆盖所有的运算场景。
优选地,在基础标签的配置中,还包括对运算、运算符以及属性类型的配置,例如上述test表,a基础标签:性别配置为字典项(男、女),运算符为“等于”,属性类型配置为下拉;b基础标签:贷款产品配置API接口,运算符为“包含”,属性为下拉,此时则实现了a基础标签和b基础标签的配置。
步骤S2,对所述若干基础标签进行分层配置,获得若干衍生标签;其中,每个分层为一个或多个所述基础标签的合集;每个所述衍生标签包括不少于两个分层。
作为优选方案,衍生标签的配置是一系列基础标签的衍生。譬如针对上述test表,针对男性的用户申请A、B产品的人员,在前台进行配置,通过基础标签进行组合,生成分层。具体为基础标签+属性+属性值,例如“性别”+“等于”+“男”,以及“贷款产品”+“包含”+“A、B”,由此生成了一个分层(包括两个基础标签)的衍生标签。在分层保存后,生成HR和LR两个规则,HR用于页面逻辑规则展示,LR用于对数据进行规则判断。对于生成的衍生标签提供实时和定时处理,配置了版本管理功能,且可针对衍生标签生成模板,用于后续的客群生成和分析。
进一步地,衍生标签规则包括前端规则和后端规则算子,前端规则用于快速渲染HTML页面规则,后端规则通过逆波兰表达式,将前端规则解析为可识别的算子框架,用于衍生数据的生成等功能。
步骤S3,根据所述若干衍生标签,构建标签数据表;其中,所述标签数据表包括若干与u_id集合,所述u_id集合中包括所有与所述第一用户一一对应的u_id;所述u_id集合与一衍生标签一一对应。
在本实施例中,对所述若干衍生标签进行加工,处理成用户id和u_id数组,所述u_id数组中存储有与各衍生标签对应的u_id集合,根据所有所述u_id集合,构建所述标签数据表。
进一步地,在构建所述标签数据表之前还包括:
对所有u_id集合通过位图压缩算法生成RoaringBitmap结构,并存储为bitmap集合。在数据存储方面,通过RoaringBitmap的数据结构进行存储,并且用户通过连续的32位整形数字进行编码,然后通过压缩位图RoaringBitmap进行存储,在海量数据下可以有效节约存储的空间,并且在后续的运算时可以实现快速查询。
步骤S4,响应对第二用户的画像请求,根据第二用户的标识匹配对应的u_id,通过所述第二用户的u_id查询所述标签数据表,匹配与所述第二用户对应的不少于一个衍生标签,获得针对所述第二用户的画像;其中,所述若干第一用户包括所述第二用户。
在本实施例中,在需要针对用户进行画像时,接收并响应对第二用户也就是目标用户的画像请求。第二用户可以为个人也可以为客群。在针对第二用户进行分析时,根据第二用户的标识匹配对应的u_id,然后通过所述第二用户的u_id查询所述标签数据表,确定命中的所有衍生标签,获得所述第二用户的衍生标签数组,呈现为基础标签的占比以及明细,可以用于对单个用户或者客群进行视图分析。
作为优选实施方式,可以通过对多个衍生标签进行组合以实现客群分析。所述用户标签画像方法还包括:获取目标筛选信息,所述目标筛选信息可以从外部手动导入,然后查询所述标签数据表;根据所述目标筛选信息与所述标签数据表中的衍生标签,生成新的u_id集合(对两个衍生标签的标签数据的RoaringBitmap进行交集、并集、差集等运算获得);基于所述新的u_id集合,通过查询用户与u_id的映射表,获得目标用户集合。
譬如针对a衍生标签:男性的用户申请A、B产品,以及b衍生标签:女性申请B、C、D三个产品,在需要筛选男女共同申请B产品的客群时(手动导入的目标筛选信息,也就是未入库信息,未进入系统),a衍生标签为一种分层,b衍生标签为一种分层(实际应用中衍生标签可以为多个分层,上述的a和b衍生标签只是作为一种举例),此时对两个分层进行交集操作,则完成了客群的筛选和分析。实施本申请实施例,通过将传统的客户+衍生标签(作为属性列)的模式(即一个客户一条数据、以及一个属性对应一个数据表列),解耦转换成了标签=分层(业务维度)+页面规则(前端)+后台规则(后端),和客群=衍生标签(key)+客户群(value,32位整形数值编码的客户集合)的双驱动模式,可以基于用户的数据构建基础标签,进而分层配置,正向生成衍生标签从而实现对用户的画像,也可以逆向查看未入库数据(譬如外部数据或手动导入数据,即目标筛选信息),实现逆向快速打上标签,提高了运算效率和相比于现有技术更强的查询能力。另一方面,基础标签和衍生标签都是灵活配置的,不需要提前预定义,对于复杂的属性都能进行配置,且具备页面配置功能,实现了可视化,提高了对用户画像和分析的效率。
相应的,参照图2,本发明实施例还提供了一种用户标签画像系统,包括采集模块101、分层配置模块102、标签数据表构建模块103和画像模块104,其中,
所述采集模块101,用于采集若干第一用户的原始数据,并基于所述原始数据,构建若干基础标签;
所述分层配置模块102,用于对所述若干基础标签进行分层配置,获得若干衍生标签;其中,每个分层为一个或多个所述基础标签的合集;每个所述衍生标签包括不少于两个分层;
所述标签数据表构建模块103,用于根据所述若干衍生标签,构建标签数据表;其中,所述标签数据表包括若干与u_id集合,所述u_id集合中包括所有与所述第一用户一一对应的u_id;所述u_id集合与一衍生标签一一对应;
所述画像模块104,用于响应对第二用户的画像请求,根据第二用户的标识匹配对应的u_id,通过所述第二用户的u_id查询所述标签数据表,匹配与所述第二用户对应的不少于一个衍生标签,获得针对所述第二用户的画像;其中,所述若干第一用户包括所述第二用户。
作为一种优选的实施方式,所述标签数据表构建模块103根据所述若干衍生标签,构建标签数据表,具体为:
所述标签数据表构建模块103将所述若干衍生标签处理成用户id和u_id数组,所述u_id数组中存储有与各衍生标签对应的u_id集合,根据所有所述u_id集合,构建所述标签数据表。
作为一种优选的实施方式,所述标签数据表中的所有u_id集合通过bitmap的方式进行存储;
所述用户标签画像系统还包括存储模块,所述存储模块用于在所述标签数据表构建模块构建所述标签数据表之前,对所有u_id集合通过位图压缩算法生成RoaringBitmap结构,并存储为bitmap集合。
作为一种优选的实施方式,所述用户标签画像系统还包括逆向筛选模块;
所述逆向筛选模块,用于获取目标筛选信息,并查询所述标签数据表;根据所述目标筛选信息与所述标签数据表中的衍生标签,生成新的u_id集合;基于所述新的u_id集合,通过查询用户与u_id的映射表,获得目标用户集合。
相比于现有技术,本发明实施例具有如下有益效果:
本发明实施例提供了一种用户标签画像方法和系统,所述用户标签画像方法包括:采集若干第一用户的原始数据,并基于所述原始数据,构建若干基础标签;对所述若干基础标签进行分层配置,获得若干衍生标签;其中,每个分层为一个或多个所述基础标签的合集;每个所述衍生标签包括不少于两个分层;根据所述若干衍生标签,构建标签数据表;其中,所述标签数据表包括若干与u_id集合,所述u_id集合中包括所有与所述第一用户一一对应的u_id;所述u_id集合与一衍生标签一一对应;响应对第二用户的画像请求,根据第二用户的标识匹配对应的u_id,通过所述第二用户的u_id查询所述标签数据表,匹配与所述第二用户对应的不少于一个衍生标签,获得针对所述第二用户的画像;其中,所述若干第一用户包括所述第二用户。相比于现有技术,基于用户的数据进而构建基础标签,在基础标签的基础上分层配置,获得衍生标签,相比现有技术提前定义基础标签和衍生标签,具有更高的灵活性,且能适用于更多的业务场景,针对复杂的属性(例如api、全量展示和分页展示)无需后台开发。
以上所述的具体实施例,对本发明的目的、技术方案和有益效果进行了进一步的详细说明,应当理解,以上所述仅为本发明的具体实施例而已,并不用于限定本发明的保护范围。特别指出,对于本领域技术人员来说,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (10)
1.一种用户标签画像方法,其特征在于,包括:
采集若干第一用户的原始数据,并基于所述原始数据,构建若干基础标签;
对所述若干基础标签进行分层配置,获得若干衍生标签;其中,每个分层为一个或多个所述基础标签的合集;每个所述衍生标签包括不少于两个分层;
根据所述若干衍生标签,构建标签数据表;其中,所述标签数据表包括若干与u_id集合,所述u_id集合中包括所有与所述第一用户一一对应的u_id;所述u_id集合与一衍生标签一一对应;
响应对第二用户的画像请求,根据第二用户的标识匹配对应的u_id,通过所述第二用户的u_id查询所述标签数据表,匹配与所述第二用户对应的不少于一个衍生标签,获得针对所述第二用户的画像;其中,所述若干第一用户包括所述第二用户。
2.如权利要求1所述的一种用户标签画像方法,其特征在于,所述根据所述若干衍生标签,构建标签数据表,具体为:
将所述若干衍生标签处理成用户id和u_id数组,所述u_id数组中存储有与各衍生标签对应的u_id集合,根据所有所述u_id集合,构建所述标签数据表。
3.如权利要求2所述的一种用户标签画像方法,其特征在于,所述标签数据表中的所有u_id集合通过bitmap的方式进行存储;
所述构建所述标签数据表之前还包括:
对所有u_id集合通过位图压缩算法生成RoaringBitmap结构,并存储为bitmap集合。
4.如权利要求1所述的一种用户标签画像方法,其特征在于,所述用户标签画像方法还包括:
获取目标筛选信息,并查询所述标签数据表;根据所述目标筛选信息与所述标签数据表中的衍生标签,生成新的u_id集合;基于所述新的u_id集合,通过查询用户与u_id的映射表,获得目标用户集合。
5.如权利要求1所述的一种用户标签画像方法,其特征在于,所述采集若干第一用户的原始数据,具体为:通过配置接入方式,采集若干所述第一用户的行为数据和状态数据;其中,所述配置接入方式包括配置数据库信息和配置Kafta消费队列。
6.如权利要求1至5任意一项所述的一种用户标签画像方法,其特征在于,在所述采集若干第一用户的原始数据之前,还包括:
通过32位整形数字对所有第一用户进行编码,通过与各第一用户的用户标识进行映射,生成各第一用户的u_id,并构建用户与u_id映射表。
7.一种用户标签画像系统,其特征在于,包括采集模块、分层配置模块、标签数据表构建模块和画像模块,其中,
所述采集模块,用于采集若干第一用户的原始数据,并基于所述原始数据,构建若干基础标签;
所述分层配置模块,用于对所述若干基础标签进行分层配置,获得若干衍生标签;其中,每个分层为一个或多个所述基础标签的合集;每个所述衍生标签包括不少于两个分层;
所述标签数据表构建模块,用于根据所述若干衍生标签,构建标签数据表;其中,所述标签数据表包括若干与u_id集合,所述u_id集合中包括所有与所述第一用户一一对应的u_id;所述u_id集合与一衍生标签一一对应;
所述画像模块,用于响应对第二用户的画像请求,根据第二用户的标识匹配对应的u_id,通过所述第二用户的u_id查询所述标签数据表,匹配与所述第二用户对应的不少于一个衍生标签,获得针对所述第二用户的画像;其中,所述若干第一用户包括所述第二用户。
8.如权利要求7所述的一种用户标签画像系统,其特征在于,所述标签数据表构建模块根据所述若干衍生标签,构建标签数据表,具体为:
所述标签数据表构建模块将所述若干衍生标签处理成用户id和u_id数组,所述u_id数组中存储有与各衍生标签对应的u_id集合,根据所有所述u_id集合,构建所述标签数据表。
9.如权利要求8所述的一种用户标签画像系统,其特征在于,所述标签数据表中的所有u_id集合通过bitmap的方式进行存储;
所述用户标签画像系统还包括存储模块,所述存储模块用于在所述标签数据表构建模块构建所述标签数据表之前,对所有u_id集合通过位图压缩算法生成RoaringBitmap结构,并存储为bitmap集合。
10.如权利要求7所述的一种用户标签画像系统,其特征在于,所述用户标签画像系统还包括逆向筛选模块;
所述逆向筛选模块,用于获取目标筛选信息,并查询所述标签数据表;根据所述目标筛选信息与所述标签数据表中的衍生标签,生成新的u_id集合;基于所述新的u_id集合,通过查询用户与u_id的映射表,获得目标用户集合。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211011399.4A CN115357767B (zh) | 2022-08-23 | 2022-08-23 | 一种用户标签画像方法和系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211011399.4A CN115357767B (zh) | 2022-08-23 | 2022-08-23 | 一种用户标签画像方法和系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115357767A true CN115357767A (zh) | 2022-11-18 |
CN115357767B CN115357767B (zh) | 2023-12-19 |
Family
ID=84002559
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211011399.4A Active CN115357767B (zh) | 2022-08-23 | 2022-08-23 | 一种用户标签画像方法和系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115357767B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116010693A (zh) * | 2022-12-28 | 2023-04-25 | 广州市玄武无线科技股份有限公司 | 基于客群的信息推送方法、装置、设备和计算机存储介质 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20060149720A1 (en) * | 2004-12-30 | 2006-07-06 | Dehlinger Peter J | System and method for retrieving information from citation-rich documents |
CN109191158A (zh) * | 2018-06-28 | 2019-01-11 | 深圳市彬讯科技有限公司 | 用户画像标签数据的处理方法及处理设备 |
CN109919652A (zh) * | 2019-01-17 | 2019-06-21 | 平安城市建设科技(深圳)有限公司 | 用户群体分类方法、装置、设备及存储介质 |
CN111858617A (zh) * | 2020-08-06 | 2020-10-30 | 贝壳技术有限公司 | 用户查找方法和装置、计算机可读存储介质、电子设备 |
CN111915366A (zh) * | 2020-07-20 | 2020-11-10 | 上海燕汐软件信息科技有限公司 | 一种用户画像构建方法、装置、计算机设备及存储介质 |
CN112347101A (zh) * | 2020-10-28 | 2021-02-09 | 北京北明数科信息技术有限公司 | 标签数据存储方法、计算机装置和存储介质 |
CN113177051A (zh) * | 2021-05-20 | 2021-07-27 | 武汉众邦银行股份有限公司 | 一种数据标签动态新增维护的方法 |
CN113485638A (zh) * | 2021-06-07 | 2021-10-08 | 贵州大学 | 一种面向海量天文数据的存取优化系统 |
-
2022
- 2022-08-23 CN CN202211011399.4A patent/CN115357767B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20060149720A1 (en) * | 2004-12-30 | 2006-07-06 | Dehlinger Peter J | System and method for retrieving information from citation-rich documents |
CN109191158A (zh) * | 2018-06-28 | 2019-01-11 | 深圳市彬讯科技有限公司 | 用户画像标签数据的处理方法及处理设备 |
CN109919652A (zh) * | 2019-01-17 | 2019-06-21 | 平安城市建设科技(深圳)有限公司 | 用户群体分类方法、装置、设备及存储介质 |
CN111915366A (zh) * | 2020-07-20 | 2020-11-10 | 上海燕汐软件信息科技有限公司 | 一种用户画像构建方法、装置、计算机设备及存储介质 |
CN111858617A (zh) * | 2020-08-06 | 2020-10-30 | 贝壳技术有限公司 | 用户查找方法和装置、计算机可读存储介质、电子设备 |
CN112347101A (zh) * | 2020-10-28 | 2021-02-09 | 北京北明数科信息技术有限公司 | 标签数据存储方法、计算机装置和存储介质 |
CN113177051A (zh) * | 2021-05-20 | 2021-07-27 | 武汉众邦银行股份有限公司 | 一种数据标签动态新增维护的方法 |
CN113485638A (zh) * | 2021-06-07 | 2021-10-08 | 贵州大学 | 一种面向海量天文数据的存取优化系统 |
Non-Patent Citations (2)
Title |
---|
WEI-ZHI NIE ET AL.: "Multimedia venue semantic modeling based on multimodal data", 《JOURNAL OF VISUAL COMMUNICATION AND IMAGE REPRESENTATION》, pages 375 - 385 * |
查明志: "基于用户画像的运营商客户分析营销系统的设计与实现", 《中国优秀硕士学位论文全文数据库 信息科技辑》, pages 138 - 385 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116010693A (zh) * | 2022-12-28 | 2023-04-25 | 广州市玄武无线科技股份有限公司 | 基于客群的信息推送方法、装置、设备和计算机存储介质 |
CN116010693B (zh) * | 2022-12-28 | 2023-11-07 | 广州市玄武无线科技股份有限公司 | 基于客群的信息推送方法、装置、设备和计算机存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN115357767B (zh) | 2023-12-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106372194B (zh) | 一种呈现搜索结果的方法和系统 | |
US7904415B2 (en) | Systems and computer program products to manage the display of data entities and relational database structures | |
Abel et al. | Spatial join strategies in distributed spatial DBMS | |
CN106067132A (zh) | 商品属性的设置方法及装置 | |
CN115357767A (zh) | 一种用户标签画像方法和系统 | |
CN112527920A (zh) | 一种数据处理的方法和装置 | |
CN116739836A (zh) | 一种基于知识图谱的餐饮数据分析方法及系统 | |
WO2024159959A1 (zh) | 一种基于bev多任务模型框架的任务处理方法、装置 | |
CN114461705A (zh) | 数据可视化生成方法、装置、电子设备及存储介质 | |
CN117150138B (zh) | 一种基于高维空间映射的科技资源组织方法及系统 | |
CN117151350A (zh) | 用于决策管理的可视化看板系统、方法、设备以及介质 | |
CN110930105B (zh) | 任务清单的处理方法、装置、计算机设备和存储介质 | |
CN110389944B (zh) | 一种基于模型的元数据管理系统及方法 | |
CN117390011A (zh) | 报表数据处理方法、装置、计算机设备和存储介质 | |
CN116610667A (zh) | 业务数据处理方法、装置、计算机设备和存储介质 | |
CN116401828A (zh) | 基于数据特征的关键事件可视化显示方法 | |
CN111611322A (zh) | 一种用户信息关联的方法及系统 | |
CN116303657A (zh) | 群体画像生成方法、装置、计算机设备和存储介质 | |
CN114510520A (zh) | 动态交易路径可视化交互方法、装置、设备及介质 | |
CN114049484A (zh) | 商品图像检索方法及其装置、设备、介质、产品 | |
CN117319630B (zh) | 一种显示展览三维信息处理方法及系统 | |
CN111582799B (zh) | 一种物品画像的构建方法及装置 | |
Pham | Interactive visual data query & exploration: techniques for visual data analytics through visual query modelling and multidimensional data interaction | |
CN117370281A (zh) | 数据维护方法、装置、计算机设备和存储介质 | |
CN115801887A (zh) | 作业指导文件的播放方法、装置、计算机设备、存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |