CN109145047B - 用户标签画像的配置方法、数据处理装置及存储介质 - Google Patents
用户标签画像的配置方法、数据处理装置及存储介质 Download PDFInfo
- Publication number
- CN109145047B CN109145047B CN201810712747.8A CN201810712747A CN109145047B CN 109145047 B CN109145047 B CN 109145047B CN 201810712747 A CN201810712747 A CN 201810712747A CN 109145047 B CN109145047 B CN 109145047B
- Authority
- CN
- China
- Prior art keywords
- label
- user
- preset
- attribute
- tag
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种用户标签画像的配置方法,包括:根据欲构建的用户标签画像的类型信息,获取预设的标签模板;根据确定的所述标签模板,获取该标签模板对应的预设标签属性和预设标签属性取值;响应用户对所述预设标签属性和预设标签属性取值的修改或确认,生成包括用户对所述预设标签属性进行修改或确认后得到的目标标签属性以及用户对所述预设标签属性取值进行修改或确认后得到的目标标签属性取值的目标标签目录;根据所述目标标签目录,针对相应的用户构建对应的用户标签画像,具有用户标签画像更新处理速度快,画像配置简单的优点。本发明还提供一种数据处理装置以及计算机可读存储介质。
Description
技术领域
本发明涉及数据处理技术领域,尤其涉及一种用户标签画像的配置方法、数据处理装置以及计算机可读存储介质。
背景技术
用户画像,又称用户角色(Persona),是一种用于勾画目标用户、联系用户诉求与设计方向的有效工具,其在各领域均得到了广泛的应用。例如,具体实现时,一般是将用户画像作为用于刻画用户特征的标签(tag)集合,比如,可以包括年龄、性别和/或学历等基础属性,也包括表示用户的兴趣特征,如女装和/或服饰等的社会属性或行为属性。用户画像的确定和更新对于后续的信息的定向传播,比如广告的定向投放有着重要的意义。
现有用户画像的更新主要依靠离线计算,比如,可以将用户行为日志保存下来,然后,在一定时间窗口内,遍历所有的用户行为日志,按照某种时间权重衰减函数对其进行计算,便可得到当前最新的用户画像。
其中,现有技术中需要对所有日志进行分析提取关键字,匹配标签信息,确定标签信息对应的类目,及类目所对应的数据值,形成用户画像;因此,现有技术的用户画像更新需要花费较多的存储资源,而且,由于每次更新用户画像时,均需要遍历所有的用户行为日志并批量进行计算,计算量也较大,导致处理效率较低,以及更新速度慢不及时;同时,现有的用户画像更新只能按照预先设置的画像模板或者规则来生成用户画像,如果需要更改用户标签画像的配置,需要通过重新写入程序来变更,配置方式复杂。
因此,有必要提出一种全新的动态用户画像配置方法,以解决上述技术问题。
发明内容
本发明的主要目的在于提供一种用户标签画像的配置方法、数据处理装置以及计算机可读存储介质旨在解决现有的用户标签画像更新处理速度慢,用户标签画像配置方式复杂的技术问题。
为实现上述目的,本发明提供了一种用户标签画像的配置方法,包括:
根据欲构建的用户标签画像的类型信息,获取预设的标签模板;
根据确定的所述标签模板,获取该标签模板对应的预设标签属性和预设标签属性取值;
响应用户对所述预设标签属性和预设标签属性取值的修改或确认,生成目标标签目录;其中,所述目标标签目录包括用户对所述预设标签属性进行修改或确认后得到的目标标签属性,以及用户对所述预设标签属性取值进行修改或确认后得到的目标标签属性取值;
根据所述目标标签目录,针对相应的用户构建对应的用户标签画像。
进一步地,还包括步骤:
在基于hive开源数据仓库的事实层构建标签目录表;其中,所述标签目录表记录有多条所标签属性所属的标签类别、各级类目信息、以及该标签属性对应的标签属性取值;
所述根据确定的所述标签模板,获取该标签模板对应的预设标签属性和预设标签属性取值的步骤包括:
根据确定的所述标签模板以及所述标签目录表,获取该标签模板对应的所述预设标签属性和所述预设标签属性取值;
提供一可视化界面,显示所述标签目录表,以及所述预设标签属性和所述预设标签属性取值。
进一步地,所述响应用户对所述预设标签属性和预设标签属性取值的修改或确认,生成目标标签目录的步骤,包括以下步骤中的一个或多个步骤:
响应用户对显示在所述可视化界面上的所述标签目录表中的标签属性的选择,将所述被选择的标签属性及其标签属性取值作为目标标签属性和目标标签属性取值,增加到所述目标标签目录中;
响应用户对显示在所述可视化界面上的所述预设标签属性和/或预设标签属性取值的修改,将修改后的所述预设标签属性和/或预设标签属性取值作为目标标签属性和目标标签属性取值,增加到所述目标标签目录中;
响应用户对显示在所述可视化界面上确认操作,将当前所述预设标签属性和预设标签属性取值作为目标标签属性和目标标签属性取值,增加到所述目标标签目录中。
进一步地,还包括:
实时采集用户的日志信息;
对所述日志信息进行过滤,得到所述日志信息的关键字段;
根据所述关键字段匹配对应的标签属性和标签属性取值;
将匹配所述关键字段得到的标签属性和标签属性取值更新到所述数据库的集市层的数据集市中。
进一步地,所述数据库的事实层还存储有汇总表,所述汇总表用于定期汇总更新的标签属性和标签属性取值信息;所述用户标签画像的配置方法还包括:
按照预设的时间间隔,定期将所述集市层中的被更新的所述标签属性和标签属性取值更新到所述汇总表中;
根据所述汇总表中记录的被更新的所述标签属性和标签属性取值,更新所述标签目录表。
进一步地,还包括步骤:
响应用户对所述标签目录表的修改,将被修改标签属性所属的标签类别、各级类目信息、以及该标签属性对应的标签属性取值定期同步到所述集市层的数据集市中。
进一步地,所述根据欲构建的用户标签画像的类型信息,获取预设的标签模板的步骤,包括:
响应用户选择的用户画像模板,确定用户欲构建的用户标签画像的类型信息;
根据所述类型信息,获取用户欲构建的用户标签画像对应的所述预设的标签模板。
进一步地,还包括:
将所述标签模板对应的所述预设标签属性和预设标签属性取值更新为所述目标标签目录中的目标标签属性和目标标签属性取值。
本发明还提供了一种数据处理装置,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上任一项所述的用户标签画像的配置方法的步骤。
本发明还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如上任一项所述用户标签画像的配置的方法的步骤。
本发明的上述方案至少包括以下有益效果:
在本发明的实施例中,通过预先设置预设的标签模板,在用户欲构建用户标签画像时,直接调用所述标签模板,获取该标签模板对应的预设标签属性和预设标签属性取值;并可以根据用户对所述预设标签属性和预设标签属性取值的修改或确认,生成包括用户对所述预设标签属性进行修改或确认后得到的目标标签属性以及用户对所述预设标签属性取值进行修改或确认后得到的目标标签属性取值的目标标签目录;然后针对相应的用户构建对应的用户标签画像;只需要从数据库中获取该标签模板对应的预设标签属性和预设标签属性取值,就可以生成对应的用户标签画像;同时,可以根据用户对所述预设标签属性和预设标签属性取值的修改或确认,生成包括用户对所述预设标签属性进行修改或确认后得到的目标标签属性以及用户对所述预设标签属性取值进行修改或确认后得到的目标标签属性取值的目标标签目录;然后针对相应的用户构建对应的用户标签画像,用户标签画像配置方式简单、快速。
附图说明
图1为本发明一实施例中的数据处理装置的模块架构示意图;
图2为一实施例中的用户标签画像系统的体系架构图;
图3为一实施例中的标签目录表的示例图;
图4为一实施例中的用户标签画像的示例图;
图5为本发明第一实施例中的一种用户标签画像的配置方法的流程示意图;
图6为另一实施例中的用户标签画像的示例图;
图7为本发明第二实施例中的一种用户标签画像的配置方法的流程示意图;
图8为本发明的用户标签画像的配置方法中的数据库维护与更新方法的流程图;
图9为图5中步骤S10的子流程示意图.
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
下面将参照附图更详细地描述本发明的示例性实施例。虽然附图中显示了本发明的示例性实施例,然而应当理解,可以以各种形式实现本发明而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本发明,并且能够将本发明的范围完整的传达给本领域的技术人员。
请一并参考图1,为本申请提供一实施例中的数据处理装置100的模块架构示意图。
数据处理装置100为用于提供数据处理的服务后台;其中,该数据处理装置100可以是服务器硬件,用于提供数据的存储以及对数据的处理功能;例如,可以是一个或者多个服务器,所述服务器可以是本地服务器,远程服务器,或者云端服务器,还可以是本地服务器、远程服务器和云端服务器中一个或多个的集合。
可以理解都是,数据处理装置100也可以包括装在有数据的处理的软件的计算机装置,例如,基于RPC(Remote Promote Call,进程间通信)框架的数据处理业务服务层程序的计算机装置,或者基于数据库的SQL(Structured Query Language,结构化查询语言)的数据处理程序的计算机装置等。
后续描述中将以数据服务器为例进行说明,本领域技术人员将理解的是,除了特别用于其他目的的元件之外,根据本发明的实施方式的构造也能够应用于其他本地或者远端的数据处理服务器。
该数据处理装置100可以包括:存储器51、处理器52等部件。本领域技术人员可以理解,图1中示出的数据处理装置的结构并不构成对数据处理装置100的限定,数据处理装置100可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置;例如,所述数据处理装置100还可以包括WiFi模块、输入单元以及传感器等。
存储器51可用于存储软件程序以及各种数据。存储器51可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如数据计算功能、数据读写等)等;存储数据区可存储根据对应数据(比如用户日志信息、标签信息等)等。此外,存储器51可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
处理器52是数据处理装置100的控制中心,利用各种接口和线路连接整个数据处理装置的各个部分,通过运行或执行存储在存储器51内的软件程序和/或模块,以及调用存储在存储器51内的数据,执行数据处理装置100的各种功能和处理数据,从而对数据处理装置100进行整体监控。处理器52可包括一个或多个处理单元;优选的,处理器52可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器52中。
数据处理装置100还可以包括给各个部件供电的电源(比如电池),优选的,电源可以通过电源管理系统与处理器52逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。
请一并结合图2,为一实施例中本申请的用户标签画像应用的体系架构图。
本申请提供的用户标签画像的配置方法和用户标签画像系统中,基于hive开源数据仓库构建数据的事实层10和标签的集市层20,基于Hadoop databse(Hbase)数据库构建标签的应用层30,并通过关系型数据库管理系统(MySQL)实现标签的生成配置和调度。
具体的,事实层10通常包含事实表信息,用于记录成员的主体(用户、房屋、项目)属性、行为明细和汇总等;事实表信息的数据来源为从数据中心的源数据或者数仓层获得。
集市层20包括但不限于构建了标签目录表,标签公共字典表,成员标签关系表,标签记录历史表等。
其中,用户标签画像中的每一个标签是根据标签类型来区分标签主体范围的(用户、房屋、项目等),标签目录表保存了每一个标签的标签名称、以及每个标签名称对应的标签标识、标签属性(基础属性、行为属性、事实属性等)、标签属性值及其各级类目信息,如图3所示。具体的,在本发明的具体实施例中,上述数据的事实层10中的标签数据(即用户标签画像数据)可以来自多个不同的标签数据采集平台,例如音乐播放平台、通信运营商平台等。其中,上述标签数据包括主体属性、基本属性、行为属性、使用习惯等数据内容,例如某个男性用户对应的年收入为XX万,拥有的房产为XX套;上述标签名称可以为年收入、房产等;上述标签标识为用于表征对应的标签名称的字符串(例如数值);上述主体属性可以为用户、项目、房屋等;上述类目信息为标签名称所属的类目,且每个标签名称对应至少一级类目信息,例如基础属性、行为属性等。
其中,所述标签公共字典表记录有至少一个标签标识以及每个标签标识对应的标签取值和标签取值标识,即记录了对标签进行标签属性值的细化信息,标签属性值可以扩展(比如性别标签有男女两个值);标签成员关系表,保存了成员和标签属性值的对应关系,即通常记录有至少一个主体属性以及每个主体属性对应的成员编号;标签记录历史表,用于保存成员的属性标签和事实标签,成员标签关系表记录有至少一个成员编号以及每个成员编号对应的标签取值标识。具体的,上述成员编号与主体属性相对应,例如当主体属性为用户时,成员编号为用户身份标识号(ID);当主体属性为项目时,成员编号为项目ID;标签取值用于表征成员对应于标签取值对应的标签名称的结果值,例如标签名称为性别,标签取值可以为男或者女;标签取值标识为用于表征对应的标签取值的字符串(例如数值)。
可以理解的,用户可以自建标签,自定义标签能从事实层10计算得出,也可以由已有的标签值进行组合得出。
此外,本申请中提供的用户标签画像的配置方法和用户标签画像系统,
图3为本发明的一具体实施例中的标签目录表的示意图。从图3可以看出标签目录表清楚的记录了标签标识、主体属性标识、主体属性、各级类目标识、各级类目名称以及标签名称之间的对应关系。另外,
在本发明的具体实施例中,所述用户标签画像可以包括成员的所有标签名称。举例来说,假设成员为用户,成员编号为1(即用户编号为1),标签名称包括性别、年收入、房产,且性别标签名称对应的标签取值为男,年收入标签名称对应的标签取值为30万,房产标签名称对应的标签取值为3套,那么生成的用户标签画像可如图4所示。
请参考图5,为本申请提供第一实施例中的一种用户标签画像的配置方法110的流程示意图,在本实施例中,该用户标签画像的配置方法110包括:
步骤S10,根据欲构建的用户标签画像的类型信息,获取预设的标签模板。
根据不同的场景,通常会需要构建一个或多个用户不同数据角度的用户标签画像,例如,查看某一年龄段的用户的年收入与房产数据构成的用户标签画像,或者查看某一区域内的用户的房产量与职业领域数据构成的用户标签画像等。
预先可以设置某一类型的用户标签画像对应的预设的标签模板,该标签模板中记录了生成这一类型的用户标签画像所需要的预设标签属性,即这一类型的用户标签画像所需要包含的基础属性、行为属性、事实属性等。
步骤S20,根据确定的所述标签模板,获取该标签模板对应的预设标签属性和预设标签属性取值;
具体的,根据确定的所述标签模板,可以获取到这一类型的用户标签画像所需要包含的预设标签属性,例如基础属性、行为属性、事实属性等信息;然而,标签目录表保存了每一个标签的标签名称、以及每个标签名称对应的标签标识、标签属性(基础属性、行为属性、事实属性等)、标签属性值及其各级类目信息;在本实施例中,根据所述标签模板包含的欲构建的用户标签画像所需要包含的基础属性、行为属性、事实属性等信息,然后从所述标签目录表中获取该标签模板对应的预设标签属性和预设标签属性取值。
步骤S30,响应用户对所述预设标签属性和预设标签属性取值的修改或确认,生成目标标签目录;其中,所述目标标签目录包括用户对所述预设标签属性进行修改或确认后得到的目标标签属性,以及用户对所述预设标签属性取值进行修改或确认后得到的目标标签属性取值。
在获取到所述标签模板对应的预设标签属性和预设标签属性取值后,用户可以对所述预设标签属性和预设标签属性取值进行修改,例如对所述预设标签属性进行增删,或者对所述预设标签属性取值进行修正。
在用户对所述预设标签属性和预设标签属性取值的修改后,将修改后的预设标签属性以及增加的标签属性作为目标标签属性,将修改后的所述预设标签属性取值作为目标标签属性取值;根据所述目标标签属性以及目标标签属性取值生成所述目标标签目录。
步骤S40,根据所述目标标签目录,针对相应的用户构建对应的用户标签画像。
举例来说,请一并参考图6,假设欲构建的用户标签画像为用户1-10中不同的年龄段的用户的年收入与房产数据构成;所述预设的标签模板A可以包括性别属性、姓名属性等基础属性标签,年收入属性、房产数量标签等行为属性标签。
在该用户标签画像的配置方法110中,先根据欲构建的用户标签画像的类型信息:用户1-10中不同的年龄段的用户的年收入与房产数据构成,获取预设的标签模板A;根据确定的所述标签模板,从数据库中的所有的用户数据中获取该标签模板对应的预设标签属性和预设标签属性取值;在用户对所述预设标签属性和预设标签属性取值进行修改或确认后,生成目标标签目录;根据所述目标标签目录,针对相应的用户1-10构建对应的用户标签画像。
在本实施例中,通过预先设置预设的标签模板,在用户欲构建用户标签画像时,直接调用所述标签模板,获取该标签模板对应的预设标签属性和预设标签属性取值;并可以根据用户对所述预设标签属性和预设标签属性取值的修改或确认,生成包括用户对所述预设标签属性进行修改或确认后得到的目标标签属性以及用户对所述预设标签属性取值进行修改或确认后得到的目标标签属性取值的目标标签目录;然后针对相应的用户构建对应的用户标签画像;只需要从数据库中获取该标签模板对应的预设标签属性和预设标签属性取值,就可以生成对应的用户标签画像;同时,可以根据用户对所述预设标签属性和预设标签属性取值的修改或确认,生成包括用户对所述预设标签属性进行修改或确认后得到的目标标签属性以及用户对所述预设标签属性取值进行修改或确认后得到的目标标签属性取值的目标标签目录;然后针对相应的用户构建对应的用户标签画像,用户标签画像配置方式简单、快速。
请一并结合图7,为本申请提供第二实施例中的一种用户标签画像的配置方法210的流程示意图,在本实施例中,该用户标签画像的配置方法210中所述步骤S12、S32以及S42均与第一实施例中相同,在此不再赘述;其不同在于,还包括:
步骤S11,在基于hive开源数据仓库的事实层构建标签目录表;其中,所述标签目录表记录有多条标签属性所属的标签类别、各级类目信息、以及该标签属性对应的标签属性取值。
所述步骤S22包括:
步骤S221,根据确定的所述标签模板以及所述标签目录表,获取该标签模板对应的预设标签属性和预设标签属性取值;
步骤S222,提供一可视化界面,显示所述标签目录表,以及所述预设标签属性和预设标签属性取值。
在获取到所述标签模板对应的预设标签属性和预设标签属性取值后,提供一可视化界面,显示所述标签目录表,以及所述预设标签属性和预设标签属性取值用户可以对所述预设标签属性和预设标签属性取值进行修改,例如对所述预设标签属性进行增删,或者对所述预设标签属性取值进行修正。
在本实施例中,通过预先采用基于hive开源数据仓库的事实层构建标签目录表,然后在根据预设的标签模板从标签目录表中获取该标签模板对应的预设标签属性和预设标签属性取值;同时,在可视化界面上提供所述标签目录表,以及所述预设标签属性和预设标签属性取值;用户可以直接根据所述标签目录表,以修改、输入、删除等方式编辑所述预设标签属性和预设标签属性取值。
进一步地,在该用户标签画像的配置方法210中,所述步骤S42之后还包括:
步骤S44,将所述标签模板对应的所述预设标签属性和预设标签属性取值更新为所述目标标签目录中的目标标签属性和目标标签属性取值。
具体的,通过使用所述目标标签目录中的目标标签属性和目标标签属性取值来替换预设的标签模板,从而实现保存用户的喜好和修改,是的用户在下一次调用该预设的标签模板时,无需再次进行修改。
进一步地,在该用户标签画像的配置方法210中,所述步骤S32:响应用户对所述预设标签属性和预设标签属性取值的修改或确认,生成目标标签目录,可以包括以下步骤中的一个或多个步骤:
步骤S321,响应用户对显示在所述可视化界面上的所述标签目录表中的标签属性的选择,将所述被选择的标签属性及其标签属性取值作为目标标签属性和目标标签属性取值,增加到所述目标标签目录中;
步骤S322,响应用户对显示在所述可视化界面上的所述预设标签属性和/或预设标签属性取值的修改,将修改后的所述预设标签属性和/或预设标签属性取值作为目标标签属性和目标标签属性取值,增加到所述目标标签目录中;以及
步骤S323,响应用户对显示在所述可视化界面上确认操作,将当前所述预设标签属性和预设标签属性取值作为目标标签属性和目标标签属性取值,增加到所述目标标签目录中。
可选的,请参考图8,在一实施例中,所述用户标签画像的配置方法还可以包括对所述数据库的集市层20中记录的标签属性、标签属性取值以及目标标签目录进行维护和更新的步骤;具体的,可以包括:
步骤S51,实时采集用户的日志信息;具体的,可以实时的采集用户最近一次使用设备型号、最近一次使用设备品牌厂商、最近一次使用操作系统版本、最近一次使用手机网络运营商、性别、年收入、房产等信息,并将所述采集到的用户的日志信息更新到数据中心的源数据或者数仓层。
步骤S52,对所述日志信息进行过滤,得到所述日志信息的关键字段。
步骤S53,根据所述关键字段匹配对应的标签属性和标签属性取值。
在一具体的实例中,可以通过关键字段提取和识别的方式,来对日志信息进行识别和匹配,并为该日志信息匹配出对应的标签属性和标签属性取值,在此不再赘述。
步骤S54,将匹配所述关键字段得到的标签属性和标签属性取值更新到所述数据库的集市层的数据集市中。
进一步的,所述数据库的事实层10还存储有汇总表,所述汇总表用于定期汇总更新的标签属性和标签属性取值信息;所述用户标签画像的配置方法还包括:
步骤S55,按照预设的时间间隔,定期将所述集市层中的被更新的所述标签属性和标签属性取值更新到所述汇总表中;
步骤S56,根据所述汇总表中记录的被更新的所述标签属性和标签属性取值,更新所述标签目录表。
在本实施例中,通过实时的采集用户的日志信息,以及对所述日志信息的分析和提取,可以实时的更新所述数据库的集市层的数据集市,以保证数据库中数据的及时性和有效性。
进一步的,在一实施例中,所述用户标签画像的配置方法还可以包括对所述标签目录表进行修改的步骤,具体的,还包括:
步骤S60,响应用户对所述标签目录表的修改,将被修改标签属性所属的标签类别、各级类目信息、以及该标签属性对应的标签属性取值定期同步到所述集市层的数据集市中。
请一并参考图9,所述步骤S10可以具体包括:
步骤S110,响应用户选择的用户画像模板,确定用户欲构建的用户标签画像的类型信息;
步骤S120,根据所述类型信息,获取用户欲构建的用户标签画像对应的所述预设的标签模板。
在本实施例中,可以通过预先设置和存储多个用户画像模板,每个画像模板对应设置所述预设的标签模板,方便用户在选择用户画像模板时,可以直接调用。
请再次参考图2,本发明的一具体实施例提供了一种数据库服务端102,包括存储器51、处理器52以及存储在存储器51中并可在处理器52上运行的计算机程序53,该处理器52执行计算机程序53时实现上述的实施例中任一项所述的多租户数据库的隔离访问方法的步骤。
具体的,在本发明的具体实施例中,处理器52执行计算机程序53时实现如下步骤:
步骤S10,根据欲构建的用户标签画像的类型信息,获取预设的标签模板;
步骤S20,根据确定的所述标签模板,获取该标签模板对应的预设标签属性和预设标签属性取值;
步骤S30,响应用户对所述预设标签属性和预设标签属性取值的修改或确认,生成目标标签目录;其中,所述目标标签目录包括用户对所述预设标签属性进行修改或确认后得到的目标标签属性,以及用户对所述预设标签属性取值进行修改或确认后得到的目标标签属性取值;
步骤S40,据所述目标标签目录,针对相应的用户构建对应的用户标签画像。
可选的,处理器52执行计算机程序53时还可以实现:
步骤S11,在基于hive开源数据仓库的事实层构建标签目录表;其中,所述标签目录表记录有多条标签属性所属的标签类别、各级类目信息、以及该标签属性对应的标签属性取值;
步骤S12,根据欲构建的用户标签画像的类型信息,获取预设的标签模板;
步骤S20包括:
步骤S221,根据确定的所述标签模板以及所述标签目录表,获取该标签模板对应的预设标签属性和预设标签属性取值;
步骤S222,提供一可视化界面,显示所述标签目录表,以及所述预设标签属性和预设标签属性取值;
步骤S32,响应用户对所述预设标签属性和预设标签属性取值的修改或确认,生成目标标签目录;其中,所述目标标签目录包括用户对所述预设标签属性进行修改或确认后得到的目标标签属性,以及用户对所述预设标签属性取值进行修改或确认后得到的目标标签属性取值;
步骤S42,据所述目标标签目录,针对相应的用户构建对应的用户标签画像。
进一步地,所述步骤S42之后还包括:
步骤S44,将所述标签模板对应的所述预设标签属性和预设标签属性取值更新为所述目标标签目录中的目标标签属性和目标标签属性取值。
进一步地,所述步骤S32:响应用户对所述预设标签属性和预设标签属性取值的修改或确认,生成目标标签目录,可以包括以下步骤中的一个或多个步骤:
步骤S321,响应用户对显示在所述可视化界面上的所述标签目录表中的标签属性的选择,将所述被选择的标签属性及其标签属性取值作为目标标签属性和目标标签属性取值,增加到所述目标标签目录中;
步骤S322,响应用户对显示在所述可视化界面上的所述预设标签属性和/或预设标签属性取值的修改,将修改后的所述预设标签属性和/或预设标签属性取值作为目标标签属性和目标标签属性取值,增加到所述目标标签目录中;以及
步骤S323,响应用户对显示在所述可视化界面上确认操作,将当前所述预设标签属性和预设标签属性取值作为目标标签属性和目标标签属性取值,增加到所述目标标签目录中。
可选的,处理器52执行计算机程序53时还可以实现:
步骤S51,实时采集用户的日志信息;
步骤S52,对所述日志信息进行过滤,得到所述日志信息的关键字段;
步骤S53,根据所述关键字段匹配对应的标签属性和标签属性取值;
步骤S54,将匹配所述关键字段得到的标签属性和标签属性取值更新到所述数据库的集市层的数据集市中。
进一步的,所述数据库的事实层10还存储有汇总表,所述汇总表用于定期汇总更新的标签属性和标签属性取值信息;处理器52执行计算机程序53时还可以实现:
步骤S55,按照预设的时间间隔,定期将所述集市层中的被更新的所述标签属性和标签属性取值更新到所述汇总表中;
步骤S56,根据所述汇总表中记录的被更新的所述标签属性和标签属性取值,更新所述标签目录表。
可选的,处理器52执行计算机程序53时还可以实现:
步骤S60,响应用户对所述标签目录表的修改,将被修改标签属性所属的标签类别、各级类目信息、以及该标签属性对应的标签属性取值定期同步到所述集市层的数据集市中。
可选的,处理器52执行计算机程序53时还可以实现所述步骤S10具体包括:
步骤S11,响应用户选择的用户画像模板,确定用户欲构建的用户标签画像的类型信息;
步骤S12,根据所述类型信息,获取用户欲构建的用户标签画像对应的所述预设的标签模板。
本发明的一具体实施例还提供了一种计算机可读存储介质,计算机可读存储介质存储有计算机程序,该计算机程序被处理器执行时实现上述的实施例中任一项所述的用户标签画像的配置方法的步骤,所述具体步骤在此不再赘述。
示例性的,计算机可读存储介质的计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、电载波信号、电信信号以及软件分发介质等。
需要说明的是,由于计算机可读存储介质的计算机程序被处理器执行时实现上述的多租户数据库的隔离访问方法的步骤,因此上述多租户数据库的隔离访问方法的所有实施例均适用于该计算机可读存储介质,且均能达到相同或相似的有益效果。
在本说明书的描述中,参考术语“一实施例”、“另一实施例”、“其他实施例”、或“第一实施例~第X实施例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料、方法步骤或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。
Claims (5)
1.一种用户标签画像的配置方法,其特征在于,包括:
根据欲构建的用户标签画像的类型信息,获取预设的标签模板;
在用户欲构建用户标签画像时,直接调用所述标签模板,根据确定的所述标签模板,获取该标签模板对应的预设标签属性和预设标签属性取值;
响应用户对所述预设标签属性和预设标签属性取值的修改或确认,生成目标标签目录;其中,所述目标标签目录包括用户对所述预设标签属性进行修改或确认后得到的目标标签属性,以及用户对所述预设标签属性取值进行修改或确认后得到的目标标签属性取值;
根据所述目标标签目录,针对相应的用户构建对应的用户标签画像;
还包括步骤:
在基于hive开源数据仓库的事实层构建标签目录表;其中,所述标签目录表记录有多条标签属性所属的标签类别、各级类目信息、以及该标签属性对应的标签属性取值;
所述根据确定的所述标签模板,获取该标签模板对应的预设标签属性和预设标签属性取值的步骤包括:
根据确定的所述标签模板以及所述标签目录表,获取该标签模板对应的所述预设标签属性和所述预设标签属性取值;
在获取到所述标签模板对应的所述预设标签属性和所述预设标签属性取值后,提供一可视化界面,显示所述标签目录表,以及所述预设标签属性和所述预设标签属性取值;
所述响应用户对所述预设标签属性和预设标签属性取值的修改或确认,生成目标标签目录的步骤,包括以下步骤中的一个或多个步骤:
响应用户对显示在所述可视化界面上的所述标签目录表中的标签属性的选择,将所述被选择的标签属性及其标签属性取值作为目标标签属性和目标标签属性取值,增加到所述目标标签目录中;
响应用户对显示在所述可视化界面上的所述预设标签属性和/或预设标签属性取值的修改,将修改后的所述预设标签属性和/或预设标签属性取值作为目标标签属性和目标标签属性取值,增加到所述目标标签目录中;
响应用户对显示在所述可视化界面上确认操作,将当前所述预设标签属性和预设标签属性取值作为目标标签属性和目标标签属性取值,增加到所述目标标签目录中;
还包括:
实时采集用户的日志信息;
对所述日志信息进行过滤,得到所述日志信息的关键字段;
根据所述关键字段匹配对应的标签属性和标签属性取值;
将匹配所述关键字段得到的标签属性和标签属性取值更新到所述数据库的集市层的数据集市中;
所述数据库的事实层还存储有汇总表,所述汇总表用于定期汇总更新的标签属性和标签属性取值信息;所述用户标签画像的配置方法还包括:
按照预设的时间间隔,定期将所述集市层中的被更新的所述标签属性和标签属性取值更新到所述汇总表中;
根据所述汇总表中记录的被更新的所述标签属性和标签属性取值,更新所述标签目录表;
所述根据欲构建的用户标签画像的类型信息,获取预设的标签模板的步骤,包括:
响应用户选择的用户画像模板,确定用户欲构建的用户标签画像的类型信息;
根据所述类型信息,获取用户欲构建的用户标签画像对应的所述预设的标签模板。
2.根据权利要求1所述的用户标签画像的配置方法,其特征在于,还包括步骤:
响应用户对所述标签目录表的修改,将被修改标签属性所属的标签类别、各级类目信息、以及该标签属性对应的标签属性取值定期同步到所述集市层的数据集市中。
3.根据权利要求1-2中任一项所述的用户标签画像的配置方法,其特征在于,还包括:
将所述标签模板对应的所述预设标签属性和预设标签属性取值更新为所述目标标签目录中的目标标签属性和目标标签属性取值。
4.一种数据处理装置,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至3任一项所述的用户标签画像的配置方法的步骤。
5.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至3任一项所述的用户标签画像的配置方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810712747.8A CN109145047B (zh) | 2018-06-29 | 2018-06-29 | 用户标签画像的配置方法、数据处理装置及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810712747.8A CN109145047B (zh) | 2018-06-29 | 2018-06-29 | 用户标签画像的配置方法、数据处理装置及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109145047A CN109145047A (zh) | 2019-01-04 |
CN109145047B true CN109145047B (zh) | 2023-02-03 |
Family
ID=64799665
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810712747.8A Active CN109145047B (zh) | 2018-06-29 | 2018-06-29 | 用户标签画像的配置方法、数据处理装置及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109145047B (zh) |
Families Citing this family (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109815257A (zh) * | 2019-01-16 | 2019-05-28 | 四川驹马科技有限公司 | 可伸缩实时高可用画像算法服务方法及其系统 |
CN109685632A (zh) * | 2019-01-22 | 2019-04-26 | 重庆建筑工程职业学院 | 基于互联网的商品自动化共享系统及方法 |
CN110069702A (zh) * | 2019-03-15 | 2019-07-30 | 深圳壹账通智能科技有限公司 | 用户行为数据分析方法、装置、计算机设备及存储介质 |
CN110134689B (zh) * | 2019-05-14 | 2021-03-26 | 佰聆数据股份有限公司 | 基于主体对象标签变化的目标群体筛选方法、系统及计算机设备 |
CN110517079B (zh) * | 2019-08-23 | 2022-11-08 | 北京百度网讯科技有限公司 | 数据处理方法、装置、电子设备和存储介质 |
CN111090815A (zh) * | 2019-12-31 | 2020-05-01 | 恩亿科(北京)数据科技有限公司 | 一种标签的生成方法及装置 |
CN111090656B (zh) * | 2020-03-23 | 2020-07-17 | 北京大数元科技发展有限公司 | 一种动态构建对象画像的方法及系统 |
CN111813842B (zh) * | 2020-09-10 | 2021-03-05 | 杭州城市大数据运营有限公司 | 一种数据处理方法、装置、系统、设备和存储介质 |
CN112631889B (zh) * | 2020-12-31 | 2024-02-23 | 中国农业银行股份有限公司 | 针对应用系统的画像方法、装置、设备及可读存储介质 |
CN113077142B (zh) * | 2021-03-31 | 2022-12-27 | 国家电网有限公司 | 智能学员画像方法、系统及终端设备 |
CN113282683A (zh) * | 2021-05-21 | 2021-08-20 | 青岛海尔科技有限公司 | 设备画像的确定方法、装置、存储介质及电子装置 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101751382A (zh) * | 2008-11-28 | 2010-06-23 | 方正国际软件(北京)有限公司 | 一种基于标签的数据采集方法与系统 |
CN106354519A (zh) * | 2016-09-30 | 2017-01-25 | 乐视控股(北京)有限公司 | 一种用户画像的标签生成方法和装置 |
CN107145586A (zh) * | 2017-05-10 | 2017-09-08 | 中国电力科学研究院 | 一种基于电力营销数据的标签产出方法和装置 |
CN107256495A (zh) * | 2017-05-27 | 2017-10-17 | 上海非码网络科技有限公司 | 基于多平台数据按标签划分顾客群的方法及系统、服务器 |
CN107391752A (zh) * | 2017-08-16 | 2017-11-24 | 四川长虹电器股份有限公司 | 一种基于hadoop平台构建用户标签信息的方法 |
-
2018
- 2018-06-29 CN CN201810712747.8A patent/CN109145047B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101751382A (zh) * | 2008-11-28 | 2010-06-23 | 方正国际软件(北京)有限公司 | 一种基于标签的数据采集方法与系统 |
CN106354519A (zh) * | 2016-09-30 | 2017-01-25 | 乐视控股(北京)有限公司 | 一种用户画像的标签生成方法和装置 |
CN107145586A (zh) * | 2017-05-10 | 2017-09-08 | 中国电力科学研究院 | 一种基于电力营销数据的标签产出方法和装置 |
CN107256495A (zh) * | 2017-05-27 | 2017-10-17 | 上海非码网络科技有限公司 | 基于多平台数据按标签划分顾客群的方法及系统、服务器 |
CN107391752A (zh) * | 2017-08-16 | 2017-11-24 | 四川长虹电器股份有限公司 | 一种基于hadoop平台构建用户标签信息的方法 |
Also Published As
Publication number | Publication date |
---|---|
CN109145047A (zh) | 2019-01-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109145047B (zh) | 用户标签画像的配置方法、数据处理装置及存储介质 | |
US20090138430A1 (en) | Method for assembly of personalized enterprise information integrators over conjunctive queries | |
JP2011081828A (ja) | カスタマのアクティビティを統合、管理、および調整するためのシステムおよび方法 | |
CN102541867A (zh) | 数据字典生成方法及系统 | |
CN112084270A (zh) | 一种数据血缘处理方法、装置、存储介质及设备 | |
CN112464625B (zh) | 单据生成方法、装置、计算机设备和存储介质 | |
CN109063215B (zh) | 数据检索方法及装置 | |
CN113312265A (zh) | 测试用例的应用方法及相关产品 | |
CN112433712A (zh) | 报表展示方法、装置、计算机设备和存储介质 | |
CN111310032A (zh) | 资源推荐方法、装置、计算机设备及可读存储介质 | |
CN114936301A (zh) | 智能家居建材数据的管理方法、装置、设备及存储介质 | |
CN115544050A (zh) | 操作日志记录方法、装置、设备及存储介质 | |
EP1618456A2 (en) | System and method for providing a territory management tool | |
CN108549722B (zh) | 多平台数据发布方法、系统及介质 | |
CN116414854A (zh) | 数据资产查询方法、装置、计算机设备和存储介质 | |
CN110062112A (zh) | 数据处理方法、装置、设备及计算机可读存储介质 | |
CN108205564B (zh) | 知识体系构建方法及系统 | |
CN115878864A (zh) | 一种数据检索方法、装置、设备及可读存储介质 | |
CN114298525A (zh) | 一种数据库风险评估方法及装置 | |
KR100785331B1 (ko) | 인물 관계링크 설정을 이용하여 인맥관리할 수 있는휴대단말기 및 인맥관리방법 | |
CN114356945A (zh) | 数据处理方法、装置、计算机设备和存储介质 | |
CN110851543A (zh) | 一种数据建模的方法、装置、设备以及存储介质 | |
CN105574145A (zh) | 一种现代家庭档案电子化管理方法和系统 | |
CN118154140B (zh) | 一种基于源端静态数据的智能数据建模管理系统及方法 | |
CN110019562B (zh) | 用户画像标签的配置管理方法及配置管理设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
CB02 | Change of applicant information |
Address after: 518000 R & D room 3501, block a, building 7, Vanke Cloud City Phase I, Xingke 1st Street, Xili community, Xili street, Nanshan District, Shenzhen City, Guangdong Province Applicant after: Tubatu Group Co.,Ltd. Address before: 1001-a, 10th floor, bike technology building, No.9, Keke Road, high tech Zone, Nanshan District, Shenzhen, Guangdong 518000 Applicant before: SHENZHEN BINCENT TECHNOLOGY Co.,Ltd. |
|
CB02 | Change of applicant information | ||
GR01 | Patent grant | ||
GR01 | Patent grant |