CN115048456A - 用户标签的生成方法、装置、计算机设备及可读存储介质 - Google Patents

用户标签的生成方法、装置、计算机设备及可读存储介质 Download PDF

Info

Publication number
CN115048456A
CN115048456A CN202210588671.9A CN202210588671A CN115048456A CN 115048456 A CN115048456 A CN 115048456A CN 202210588671 A CN202210588671 A CN 202210588671A CN 115048456 A CN115048456 A CN 115048456A
Authority
CN
China
Prior art keywords
tag
label
target user
target
generating
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210588671.9A
Other languages
English (en)
Inventor
李慎刚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Property and Casualty Insurance Company of China Ltd
Original Assignee
Ping An Property and Casualty Insurance Company of China Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Property and Casualty Insurance Company of China Ltd filed Critical Ping An Property and Casualty Insurance Company of China Ltd
Priority to CN202210588671.9A priority Critical patent/CN115048456A/zh
Publication of CN115048456A publication Critical patent/CN115048456A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/27Replication, distribution or synchronisation of data between databases or within a distributed database system; Distributed database system architectures therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/221Column-oriented storage; Management thereof
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/2282Tablespace storage structures; Management thereof
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/242Query formulation
    • G06F16/2433Query languages

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Computational Linguistics (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Testing Of Engines (AREA)

Abstract

本申请属于数据分析技术领域,提供了一种用户标签的生成方法、装置、计算机设备及可读存储介质,该方法包括:将离线数据仓中的标签管理表同步至列式存储引擎中,其中,标签管理表存储有若干预设标签内容;显示标签配置页面,基于列式存储引擎从所述标签管理表中获取与目标用户标签相关的标签内容,并根据获取到的所述标签内容在标签配置页面执行标签配置功能,以获取目标用户标签的需求数据;根据所述需求数据生成目标用户标签对应的sql语句;根据所述sql语句生成目标用户标签,并在列式存储引擎中对目标用户标签进行落表。本申请能够实现基于列式存储引擎为业务人员提供标签配置辅助,从而简化业务人员的操作,利于业务人员开展运营工作。

Description

用户标签的生成方法、装置、计算机设备及可读存储介质
技术领域
本申请涉及数据分析技术领域,尤其涉及一种用户标签的生成方法、装置、计算机设备及可读存储介质。
背景技术
为了提升用户转化率和留存率,通常需要标签开发人员预先从数以亿计的海量用户数据中挖掘分析出用户标签提供给业务人员,帮助业务人员通过用户标签对用户进行更好的了解,实现对用户的精准化运营。然而,在业务人员的实际运营中,业务人员往往有新用户标签的需求,将新用户标签的需求提交给标签开发人员后,标签开发人员还得排期开发,业务人员等待时间较久,不利于业务人员开展运营工作。
发明内容
本申请的主要目的在于提供一种用户标签的生成方法、装置、计算机设备及可读存储介质,旨在实现基于列式存储引擎为业务人员提供标签配置辅助,从而简化业务人员的操作,利于业务人员开展运营工作。
第一方面,本申请提供了一种用户标签的生成方法,所述方法包括:
将离线数据仓中的标签管理表同步至列式存储引擎中,其中,所述标签管理表存储有若干预设标签内容;
显示标签配置页面,基于列式存储引擎从所述标签管理表中获取与目标用户标签相关的标签内容,并根据获取到的所述标签内容在标签配置页面执行标签配置功能,以获取目标用户标签的需求数据;
根据所述需求数据生成目标用户标签对应的sql语句;
根据所述sql语句生成目标用户标签,并在列式存储引擎中对目标用户标签进行落表。
第二方面,本申请还提供了一种用户标签的生成装置,所述装置包括:
同步模块,用于将离线数据仓中的标签管理表同步至列式存储引擎中,其中,所述标签管理表存储有若干预设标签内容;
配置模块,用于显示标签配置页面,基于列式存储引擎从所述标签管理表中获取与目标用户标签相关的标签内容,并根据获取到的所述标签内容在标签配置页面执行标签配置功能,以获取目标用户标签的需求数据;
第一生成模块,用于根据所述需求数据生成目标用户标签对应的sql语句;
第二生成模块,用于根据所述sql语句生成目标用户标签,并在列式存储引擎中对目标用户标签进行落表。
第三方面,本申请还提供了一种计算机设备,所述计算机设备包括处理器、存储器、以及存储在所述存储器上并可被所述处理器执行的计算机程序,其中所述计算机程序被所述处理器执行时,实现如上述的用户标签的生成方法的步骤。
第四方面,本申请还提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,其中所述计算机程序被处理器执行时,实现如上述的用户标签的生成方法。
本申请公开了一种用户标签的生成方法、装置、计算机设备及可读存储介质,该用户标签的生成方法,将离线数据仓中的标签管理表同步至列式存储引擎中,其中,该标签管理表存储有若干预设标签内容;然后显示标签配置页面,基于列式存储引擎从该标签管理表中获取与目标用户标签相关的标签内容,并根据获取到的标签内容在标签配置页面执行标签配置功能,以获取目标用户标签的需求数据,从而根据所述需求数据生成目标用户标签对应的sql语句,最终根据该sql语句生成目标用户标签,并在列式存储引擎中对目标用户标签进行落表。通过上述方式,实现基于列式存储引擎为业务人员提供标签配置辅助,使得业务人员可以在标签配置页面配置任意想要的目标用户标签,不仅简化了业务人员的操作,而且业务人员再也不用通过标签开发人员才能满足新用户标签的需求,提升了获得新用户标签的效率,减少了业务人员的等待时间,利于业务人员开展运营工作。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本申请。
附图说明
为了更清楚地说明本申请实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请用户标签的生成方法一实施例的流程示意图;
图2为本申请用户标签的生成方法一实施例涉及的标签配置页面的示例图;
图3为本申请用户标签的生成方法一实施例涉及的在标签配置页面执行标签配置功能的示例图;
图4为本申请用户标签的生成方法一实施例涉及的一场景示意图;
图5为本申请一实施例提供的一种用户标签的生成装置的示意性框图;
图6为本申请一实施例涉及的计算机设备的结构示意框图。
本申请目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
附图中所示的流程图仅是示例说明,不是必须包括所有的内容和操作/步骤,也不是必须按所描述的顺序执行。例如,有的操作/步骤还可以分解、组合或部分合并,因此实际执行的顺序有可能根据实际情况改变。
应当理解,在此本申请说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本申请。如在本申请说明书和所附权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。
还应当进理解,在本申请说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
本申请的实施例提供了一种用户标签的生成方法、装置、计算机设备及可读存储介质。该用户标签的生成方法主要应用于用户标签的生成设备,该用户标签的生成设备可以是服务器等具有数据处理功能的终端设备。
其中,服务器可以是独立的服务器,也可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(CoNteNtDelivery Network,CDN)、以及大数据和数据分析平台等基础云计算服务的云服务器。
下面结合附图,对本申请的一些实施方式作详细说明。在不冲突的情况下,下述的实施例及实施例中的特征可以相互组合。
目前,从数以亿计的海量用户数据中挖掘分析出的成千上百的用户标签都存储在es(Elasticsearch Elasticsearch)文件搜索引擎中,不仅存储压力大,而且查询压力大,导致查询速度很慢,每次查询需好几分钟。标签开发人员对新增用户标签的更新速度也比较慢,常常以天级别算。那么,业务人员在有新用户标签需求时,需将新用户标签的需求提交给标签开发人员后,标签开发人员再排期开发,等标签开发人员开发完更新至es中,往往过去了好几天,业务人员无法获得及时的反馈,不利于业务人员开展运营工作。
为此,本申请提供一种用户标签的生成方法、装置、计算机设备及可读存储介质,该用户标签的生成方法旨在实现基于列式存储引擎为业务人员提供标签配置辅助,从而为业务人员获得新用户标签提供便捷,利于业务人员开展运营工作。
请参照图1,图1为本申请的实施例提供的一种用户标签的生成方法的流程示意图。
如图1所示,该用户标签的生成方法包括步骤S101至步骤S104。
步骤S101、将离线数据仓中的标签管理表同步至列式存储引擎中,其中,所述标签管理表存储有若干预设标签内容。
该用户标签的生成方法的专业术语介绍:
Hive:一种离线的SQL数据仓库。
Clickhouse:是一个用于联机分析(OLAP,Online Analytical Processing)的列式数据库管理引擎(DBMS,Database Management System)。
其中,标签是对用户的属性数据(例如年龄、性别、地域、行业、教育程度等)、行为数据(例如投保渠道、保费偏好等)等进行业务化整合后产生的对用户某个特征维度的描述。在数据结构上,标签包含标签维度名称及标签维度名称的指标值(包括中文形式和英文形式)等内容,具有高度概括、相互独立的特点。示例性的,例如为“车标的号为123”的车险用户打上标签“价格敏感程度较低”,其中“车标的号”为标签对象,“价格敏感程度”为标签维度名称,其指标值为“高”。
可以理解的是,提供业务服务的业务系统记录有大量用户的属性数据和行为数据等。预先对业务系统已有的大量用户的属性数据和行为数据进行业务化整合,生成若干原始用户标签。生成的若干原始用户标签属于离线数据,因此以标签对象(例如车险业务中将车标的号作为标签对象)为主键,将预先生成的多个原始用户标签存储至离线数据仓库(Hive)中,具体可以存储于Hive中的标签管理表(label_management)中。
由于Hive存储是分布式(hdfs)文件系统,查询效率不高,不适合即席查询。因此,当业务人员具有生成目标用户标签的需求时,可以触发目标用户标签生成请求,在接收到目标用户标签生成请求时,将Hive中存储有多个原始用户标签的标签管理表同步至列式存储引擎Clickhouse中。
其中,相比于传统数据库,Clickhouse具有在线实时查询、完整的DBMS(ClickHouse是一个DBMS,而不是一个单一的数据库,它允许在运行时创建表和数据库、加载数据和运行查询,而无需重新配置和重新启动服务器)、列式存储、不需要任何数据预处理、支持批量更新、具有非常完善的SQL支持和函数、支持高可用等特点。列式存储的特点,使得在Clickhouse中,针对查询通常只需要读取表的一小部分列,例如100列中只有5列是需要查询的数据,那么可以只读取这5列。
示例性的,原始用户标签在Clickhouse中的列式存储结构例如:
Figure BDA0003666788460000051
步骤S102、显示标签配置页面,基于列式存储引擎从所述标签管理表中获取与目标用户标签相关的标签内容,并根据获取到的所述标签内容在标签配置页面执行标签配置功能,以获取目标用户标签的需求数据。
将离线数据仓库中的标签管理表同步至Clickhouse中之后,显示标签配置页面,请参阅图2,图2为标签配置页面的示例图,业务人员可以在标签配置页面配置目标用户标签。
具体地,基于Clickhouse从标签管理表中获取与目标用户标签相关的标签内容,根据获得到的标签内容在标签配置页面执行标签配置功能,以辅助业务人员获取目标用户标签的需求数据。
在一些实施例中,所述基于列式存储引擎从所述标签管理表中获取与目标用户标签相关的标签内容,具体为:获取基于标签配置页面配置的目标用户标签对应的目标标签对象;基于列式存储引擎将所述目标标签对象与所述标签管理表进行匹配,以从所述标签管理表中获取所述目标标签对象对应的标签内容;将所述目标标签对象对应的标签内容作为与目标用户标签相关的标签内容。
显示标签配置页面后,可以在标签配置页面显示提示业务人员配置目标用户标签对应的目标标签对象的指引信息,指引业务人员在标签配置页面配置目标用户标签对应的目标标签对象,从而接收业务人员基于标签配置页面配置的目标标签对象,通过列式存储引擎将目标标签对象与标签管理表进行比对,查找到标签管理表中与目标标签对象匹配的预存标签对象,然后从标签管理表中,提取与目标标签对象匹配的预存标签对象对应的所有标签内容,作为与目标用户标签相关的标签内容。
在一些实施例中,所述根据获取的所述标签内容在标签配置页面执行标签配置功能,以获取基于标签配置页面配置的目标用户标签所需的需求数据,具体为:将与目标用户标签相关的标签内容作为标签内容选择项;在标签配置页面中的标签列待填写项下加载所述标签内容选择项;接收基于所述标签内容选择项的选择指令,根据所述选择指令选择对应的标签内容填充至所述标签列待填写项中;将填充至所述标签列待填写项中的标签内容作为目标用户标签所需的目标标签内容;获取基于标签配置页面配置的过滤条件,所述过滤条件和所述目标标签内容构成所述需求数据。
为了执行标签配置功能,获取到与目标用户标签相关的标签内容之后,将与目标用户标签相关的标签内容作为标签内容选择项,在标签配置页面中的标签列待填写项下加载标签内容选择项。具体可以在标签配置页面显示提示业务人员选择标签列的指引信息,指引业务人员从标签内容选择项中选取目标用户标签所需的目标标签内容,从而接收业务人员基于标签内容选择项的选择指令,根据选择指令对选择对应的标签内容填充至标签列待填写项中,填充至标签列待填写项中的标签内容即为目标用户标签所需的目标标签内容。
由于通过上述方式所筛选的目标标签内容的范围还是比较广的,无法获得生成目标用户标签的需求数据,因此,业务人员还需在标签配置页面配置过滤条件。可以在标签配置页面显示提示业务人员配置过滤条件的指引信息,指引业务人员配置过滤条件,从而接收基于标签配置页面配置的过滤条件。目标标签内容和过滤条件构成目标用户标签的需求数据。
示例性的,请参阅图3,图3为在标签配置页面执行标签配置功能的示例图。结合图3对在标签页面执行标签配置功能,以获取目标用户标签的需求数据进行说明。在图3所示的标签配置页面中,业务人员可以根据指引在标签配置页面配置“车标的号”为目标标签对象,接收业务人员基于标签配置页面配置的目标标签对象“车标的号”后,基于Clickhouse从标签管理表中将主键为“车标的号”的所有字段加载至标签列待填写项下,作为标签内容选择项供业务人员选择。那么业务人员便可在标签配置页面通过拖拉拽的方式,从标签内容选择项中选择如“车险投保渠道”和“价格敏感程度”这两个标签维度名称作为目标标签维度名称,那么“车险投保渠道”和“价格敏感程度”对应的指标值即为目标标签维度名称的目标指标值,目标标签维度名称和目标标签维度名称的指标值构成目标用户标签所需的目标标签内容。之后,业务人员可以根据指引在标签配置页面配置“投保二级机构、等于、230”的过滤条件,由此,得到目标用户标签所需的需求数据。
步骤S103、根据所述需求数据生成目标用户标签对应的sql语句。
在获取到目标用户标签的需求数据后,根据目标用户标签的需求数据,生成目标用户标签对应的sql语句。
在一些实施例中,步骤S103具体为:将所述需求数据转换为sql逻辑代码;根据所述sql逻辑代码生成目标用户标签对应的sql语句。
为了生成目标用户标签对应的sql语句,先将目标用户标签的需求数据转换为sql逻辑代码,从而根据转换得到的sql逻辑代码生成目标用户标签对应的sql语句。
在一些实施例中,所述将所述需求数据转换为sql逻辑代码,具体为:将所述过滤条件映射成为sql代码片段,将所述目标标签维度名称及所述目标指标值映射成为表字段,所述sql代码片段和所述表字段构成所述sql逻辑代码。
对于需求数据中的过滤条件,将其映射成为sql代码片段;对于需求数据中目标标签内容包含的目标标签维度名称及目标指标值,则映射成为表字段;sql代码片段和表字段构成sql逻辑代码。
在一些实施例中,所述根据所述sql逻辑代码生成目标用户标签对应的sql语句具体为:将所述sql逻辑代码填充至预设标签sql模板,得到目标用户标签对应的sql语句。
将sql逻辑代码填充至预设标签sql模板中,以将sql代码片段和表字段的拼接成为目标用户标签对应的sql语句。
示例性的,例如图3中业务人员选择了“车险投保渠道”和“价格敏感程度”这两个标签维度名称作为目标标签维度名称,则将“车险投保渠道”和“价格敏感程度”映射成表字段“p1_vi_channel”、“p2_sensi”;业务人员还选择了“投保二级机构、等于、230”的过滤条件,则将过滤条件:“投保二级机构、等于230”,映射成为sql片段“p1_sec_department_code='230'”。之后,将表字段“p1_vi_channel”、“p2_sensi”,以及sql片段“p1_sec_department_code='230'”填充至预设标签sql模板中,以拼接成可执行的sql:
select p1_vi_channel,p2_sensi,count(vehicle_no)totalNum fromcx_dwf_safe.dwc_vehicle_insurance_ply_attr_d_all where(p1_sec_department_code='230')group by p1_vi_channel,p2_sensi。
步骤S104、根据所述sql语句生成目标用户标签,并在列式存储引擎中对目标用户标签进行落表。
在生成目标用户标签对应的sql语句后,根据该sql语句生成目标用户标签,并在列式存储引擎中对目标用户标签进行落表。
在一些实施例中,所述根据所述sql语句生成目标用户标签,具体为:创建根据所述sql语句生成目标用户标签的任务;基于预设任务调度工具调度执行所述任务,生成目标用户标签。
创建根据sql语句生成目标用户标签的任务,基于预设任务调度工具LINKDO对sql语句进行调度跑数,以执行该任务,从而生成目标用户标签,然后将目标用户标签写入至Clickhouse的落地表中。该落地表可以是前述标签管理表,也可以是用于存储目标用户标签的新建标签管理表。
为更好理解上述实施例,请参阅图6,举例应用场景如下:
首先将离线数据仓Hive中存储有若干原始用户标签的标签内容的标签管理表同步至Clickhouse中;然后显示标签配置页面,基于Clickhouse从标签管理表中获取与新用户标签相关的标签内容,并根据与新用户标签相关的标签内容在标签配置页面执行标签配置功能,以获取新用户标签的需求数据,新用户标签的需求数据包括过滤条件、目标标签维度名称及目标标签维度名称的指标值;再根据该需求数据生成新用户标签对应的sql语句;接着创建根据sql语句生成新用户标签的定时任务,利用LINKDO任务调度工具调度执行该定时任务,从而生成新用户标签,并在Clickhouse中对新用户标签进行落表。通过上述方式,将很大程度上节省业务人员获得新用户标签的时间,也避免了业务人员配置出错的情况,提升了业务人员获得新用户标签的效率,能够满足业务人员的需求。
上述实施例提供的用户标签的生成方法,将离线数据仓中的标签管理表同步至列式存储引擎中,其中,该标签管理表存储有若干预设标签内容;然后显示标签配置页面,基于列式存储引擎从该标签管理表中获取与目标用户标签相关的标签内容,并根据获取到的标签内容在标签配置页面执行标签配置功能,以获取目标用户标签的需求数据,从而根据所述需求数据生成目标用户标签对应的sql语句,最终根据该sql语句生成目标用户标签,并在列式存储引擎中对目标用户标签进行落表。通过上述方式,实现基于列式存储引擎为业务人员提供标签配置辅助,使得业务人员可以在标签配置页面配置任意想要的目标用户标签,不仅简化了业务人员的操作,而且业务人员再也不用通过标签开发人员才能满足新用户标签的需求,提升了获得新用户标签的效率,减少了业务人员的等待时间,利于业务人员开展运营工作。
请参照图5,图5为本申请实施例提供的一种合同条款正则表达式生成用户标签的生成装置的示意性框图。
如图5所示,该装置300,包括:同步模块301、配置模块302、第一生成模块303和第二生成模块304。
同步模块301,用于将离线数据仓中的标签管理表同步至列式存储引擎中,其中,所述标签管理表存储有若干预设标签内容;
配置模块302,用于显示标签配置页面,基于列式存储引擎从所述标签管理表中获取与目标用户标签相关的标签内容,并根据获取到的所述标签内容在标签配置页面执行标签配置功能,以获取目标用户标签的需求数据;
第一生成模块303,用于根据所述需求数据生成目标用户标签对应的sql语句;
第二生成模块304,用于根据所述sql语句生成目标用户标签,并在列式存储引擎中对目标用户标签进行落表。
需要说明的是,所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,上述描述的装置和各模块及单元的具体工作过程,可以参考前述用户标签的生成方法实施例中的对应过程,在此不再赘述。
上述实施例提供的装置可以实现为一种计算机程序的形式,该计算机程序可以在如图6所示的计算机设备上运行。
请参阅图6,图6为本申请实施例提供的一种计算机设备的结构示意性框图。该计算机设备可以是个人计算机(persoNal computer,PC)、服务器等具有数据处理功能的设备。
如图6所示,该计算机设备包括通过系统总线连接的处理器、存储器和网络接口,其中,存储器可以包括非易失性存储介质和内存储器。
非易失性存储介质可存储操作系统和计算机程序。该计算机程序包括程序指令,该程序指令被执行时,可使得处理器执行任意一种用户标签的生成方法。
处理器用于提供计算和控制能力,支撑整个计算机设备的运行。
内存储器为非易失性存储介质中的计算机程序的运行提供环境,该计算机程序被处理器执行时,可使得处理器执行任意一种用户标签的生成方法。
该网络接口用于进行网络通信,如发送分配的任务等。本领域技术人员可以理解,图6中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
应当理解的是,处理器可以是中央处理单元(CeNtral ProcessiNg UNit,CPU),该处理器还可以是其他通用处理器、数字信号处理器(Digital SigNal Processor,DSP)、专用集成电路(ApplicatioN Specific INtegrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。其中,通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
其中,在一个实施例中,所述处理器用于运行存储在存储器中的计算机程序,以实现如下步骤:
将离线数据仓中的标签管理表同步至列式存储引擎中,其中,所述标签管理表存储有若干预设标签内容;显示标签配置页面,基于列式存储引擎从所述标签管理表中获取与目标用户标签相关的标签内容,并根据获取到的所述标签内容在标签配置页面执行标签配置功能,以获取目标用户标签的需求数据;根据所述需求数据生成目标用户标签对应的sql语句;根据所述sql语句生成目标用户标签,并在列式存储引擎中对目标用户标签进行落表。
在一些实施例中,所述处理器实现所述基于列式存储引擎从所述标签管理表中获取与目标用户标签相关的标签内容时,用于实现:
获取基于标签配置页面配置的目标用户标签对应的目标标签对象;
基于列式存储引擎将所述目标标签对象与所述标签管理表进行匹配,以从所述标签管理表中获取所述目标标签对象对应的标签内容;
将所述目标标签对象对应的标签内容作为与目标用户标签相关的标签内容。
在一些实施例中,所述处理器实现所述根据获取的所述标签内容在标签配置页面执行标签配置功能,以获取基于标签配置页面配置的目标用户标签所需的需求数据时,用于实现:
将与目标用户标签相关的标签内容作为标签内容选择项;
在标签配置页面中的标签列待填写项下加载所述标签内容选择项;
接收基于所述标签内容选择项的选择指令,根据所述选择指令选择对应的标签内容填充至所述标签列待填写项中;
将填充至所述标签列待填写项中的标签内容作为目标用户标签所需的目标标签内容;
获取基于标签配置页面配置的过滤条件,所述过滤条件和所述目标标签内容构成所述需求数据。
在一些实施例中,所述处理器实现所述根据所述需求数据生成目标用户标签对应的sql语句时,用于实现:
将所述需求数据转换为sql逻辑代码;
根据所述sql逻辑代码生成目标用户标签对应的sql语句。
在一些实施例中,所述处理器实现所述所述目标标签内容包括目标标签维度名称及所述目标标签维度名称的目标指标值,所述将所述需求数据转换为sql逻辑代码时,用于实现:
将所述过滤条件映射成为sql代码片段,将所述目标标签维度名称及所述目标指标值映射成为表字段,所述sql代码片段和所述表字段构成所述sql逻辑代码。
在一些实施例中,所述处理器实现所述根据所述sql逻辑代码生成目标用户标签对应的sql语句时,用于实现:
将所述sql逻辑代码填充至预设标签sql模板,得到目标用户标签对应的sql语句。
在一些实施例中,所述处理器实现所述根据所述sql语句生成目标用户标签时,用于实现:
创建根据所述sql语句生成目标用户标签的任务;
基于预设任务调度工具调度执行所述任务,生成目标用户标签。
本申请实施例还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序中包括程序指令,所述程序指令被执行时所实现的方法可参照本申请用户标签的生成方法的各个实施例。
其中,所述计算机可读存储介质可以是前述实施例所述的计算机设备的内部存储单元,例如所述计算机设备的硬盘或内存。所述计算机可读存储介质也可以是所述计算机设备的外部存储设备,例如所述计算机设备上配备的插接式硬盘,智能存储卡(SmartMedia Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。
进一步地,所述计算机可读存储介质可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序等;存储数据区可存储根据区块链节点的使用所创建的数据等。
本发明所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。
上述本申请实施例序号仅仅为了描述,不代表实施例的优劣。以上所述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以权利要求的保护范围为准。

Claims (10)

1.一种用户标签的生成方法,其特征在于,所述方法包括以下步骤:
将离线数据仓中的标签管理表同步至列式存储引擎中,其中,所述标签管理表存储有若干预设标签内容;
显示标签配置页面,基于列式存储引擎从所述标签管理表中获取与目标用户标签相关的标签内容,并根据获取到的所述标签内容在标签配置页面执行标签配置功能,以获取目标用户标签的需求数据;
根据所述需求数据生成目标用户标签对应的sql语句;
根据所述sql语句生成目标用户标签,并在列式存储引擎中对目标用户标签进行落表。
2.根据权利要求1所述的用户标签的生成方法,其特征在于,所述基于列式存储引擎从所述标签管理表中获取与目标用户标签相关的标签内容,包括:
获取基于标签配置页面配置的目标用户标签对应的目标标签对象;
基于列式存储引擎将所述目标标签对象与所述标签管理表进行匹配,以从所述标签管理表中获取所述目标标签对象对应的标签内容;
将所述目标标签对象对应的标签内容作为与目标用户标签相关的标签内容。
3.根据权利要求1所述的用户标签的生成方法,其特征在于,所述根据获取的所述标签内容在标签配置页面执行标签配置功能,以获取基于标签配置页面配置的目标用户标签所需的需求数据,包括:
将与目标用户标签相关的标签内容作为标签内容选择项;
在标签配置页面中的标签列待填写项下加载所述标签内容选择项;
接收基于所述标签内容选择项的选择指令,根据所述选择指令选择对应的标签内容填充至所述标签列待填写项中;
将填充至所述标签列待填写项中的标签内容作为目标用户标签所需的目标标签内容;
获取基于标签配置页面配置的过滤条件,所述过滤条件和所述目标标签内容构成所述需求数据。
4.根据权利要求3所述的用户标签的生成方法,其特征在于,所述根据所述需求数据生成目标用户标签对应的sql语句,包括:
将所述需求数据转换为sql逻辑代码;
根据所述sql逻辑代码生成目标用户标签对应的sql语句。
5.根据权利要求4所述的用户标签的生成方法,其特征在于,所述目标标签内容包括目标标签维度名称及所述目标标签维度名称的目标指标值,所述将所述需求数据转换为sql逻辑代码,包括:
将所述过滤条件映射成为sql代码片段,将所述目标标签维度名称及所述目标指标值映射成为表字段,所述sql代码片段和所述表字段构成所述sql逻辑代码。
6.根据权利要求5所述的用户标签的生成方法,其特征在于,所述根据所述sql逻辑代码生成目标用户标签对应的sql语句,包括:
将所述sql逻辑代码填充至预设标签sql模板,得到目标用户标签对应的sql语句。
7.根据权利要求1所述的用户标签的生成方法,其特征在于,所述根据所述sql语句生成目标用户标签,包括:
创建根据所述sql语句生成目标用户标签的任务;
基于预设任务调度工具调度执行所述任务,生成目标用户标签。
8.一种用户标签的生成装置,其特征在于,所述用户标签的生成装置包括:
同步模块,用于将离线数据仓中的标签管理表同步至列式存储引擎中,其中,所述标签管理表存储有若干预设标签内容;
配置模块,用于显示标签配置页面,基于列式存储引擎从所述标签管理表中获取与目标用户标签相关的标签内容,并根据获取到的所述标签内容在标签配置页面执行标签配置功能,以获取目标用户标签的需求数据;
第一生成模块,用于根据所述需求数据生成目标用户标签对应的sql语句;
第二生成模块,用于根据所述sql语句生成目标用户标签,并在列式存储引擎中对目标用户标签进行落表。
9.一种计算机设备,其特征在于,所述计算机设备包括处理器、存储器、以及存储在所述存储器上并可被所述处理器执行的计算机程序,其中所述计算机程序被所述处理器执行时,实现如权利要求1至7中任一项所述的用户标签的生成方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,其中所述计算机程序被处理器执行时,实现如权利要求1至7中任一项所述的用户标签的生成方法的步骤。
CN202210588671.9A 2022-05-27 2022-05-27 用户标签的生成方法、装置、计算机设备及可读存储介质 Pending CN115048456A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210588671.9A CN115048456A (zh) 2022-05-27 2022-05-27 用户标签的生成方法、装置、计算机设备及可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210588671.9A CN115048456A (zh) 2022-05-27 2022-05-27 用户标签的生成方法、装置、计算机设备及可读存储介质

Publications (1)

Publication Number Publication Date
CN115048456A true CN115048456A (zh) 2022-09-13

Family

ID=83160174

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210588671.9A Pending CN115048456A (zh) 2022-05-27 2022-05-27 用户标签的生成方法、装置、计算机设备及可读存储介质

Country Status (1)

Country Link
CN (1) CN115048456A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117032602A (zh) * 2023-10-10 2023-11-10 海通安恒科技股份有限公司 一种快速实现标签字段映射及标签规则配置的打印方法及系统

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117032602A (zh) * 2023-10-10 2023-11-10 海通安恒科技股份有限公司 一种快速实现标签字段映射及标签规则配置的打印方法及系统
CN117032602B (zh) * 2023-10-10 2024-01-26 海通安恒科技股份有限公司 一种快速实现标签字段映射及标签规则配置的打印方法及系统

Similar Documents

Publication Publication Date Title
US10853338B2 (en) Universal data pipeline
US20230049931A1 (en) Method of training machine learning models for making simulated estimations
AU2014233672B2 (en) System for metadata management
CN113297320B (zh) 分布式数据库系统及数据处理方法
US20170139891A1 (en) Shared elements for business information documents
EP1990740A1 (en) Schema matching for data migration
US20130166563A1 (en) Integration of Text Analysis and Search Functionality
CN112579586A (zh) 数据处理方法、装置、设备及存储介质
CN111061733A (zh) 数据处理方法、装置、电子设备和计算机可读存储介质
CN114238808A (zh) 页面展示方法、装置、计算机设备和存储介质
CN116414801A (zh) 数据迁移方法、装置、计算机设备和存储介质
CN115857918A (zh) 数据处理方法、装置、电子设备及存储介质
US9330372B2 (en) Generating an improved development infrastructure
CN115048456A (zh) 用户标签的生成方法、装置、计算机设备及可读存储介质
US10387969B1 (en) Computer implemented methods systems and articles of manufacture for suggestion-based interview engine for tax return preparation application
CN103092574B (zh) 一种基于递归自主式复杂任务分解系统及方法
US20210357372A1 (en) Data analysis assistance device, data analysis assistance method, and data analysis assistance program
US20230394015A1 (en) LIST-BASED DATA STORAGE FOR DATA SEARCHPeter
Myntti et al. Use existing data first: Reconcile metadata before creating new controlled vocabularies
CN115774672A (zh) 测试用例的生成方法、生成装置、服务器和存储介质
CN114356945A (zh) 数据处理方法、装置、计算机设备和存储介质
US20090271439A1 (en) Systems to implement business processes in computing environment
Marotta et al. Managing source schema evolution in web warehouses
US10915970B1 (en) Computer implemented methods systems and articles of manufacture for communicating and resolving electronic tax return errors and inconsistent data
CN117891531B (zh) 用于saas软件的系统参数配置方法、系统、介质及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination