CN111090815A - 一种标签的生成方法及装置 - Google Patents
一种标签的生成方法及装置 Download PDFInfo
- Publication number
- CN111090815A CN111090815A CN201911411994.5A CN201911411994A CN111090815A CN 111090815 A CN111090815 A CN 111090815A CN 201911411994 A CN201911411994 A CN 201911411994A CN 111090815 A CN111090815 A CN 111090815A
- Authority
- CN
- China
- Prior art keywords
- attribute
- information
- user log
- type
- target
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9536—Search customisation based on social or collaborative filtering
Abstract
本申请提供了一种标签的生成方法及装置,其中,该方法包括:首先获取多条符合用户日志筛选条件的用户日志;并基于所述用户日志,确定所述用户日志中归属于目标属性下的目标用户日志的属性更新周期信息;最后,基于所述属性更新周期信息,确定所述用户日志所对应用户的标签信息。在该过程中,通过对所述用户日志中归属于目标属性下的目标用户日志的属性更新周期信息的判断,对目标用户日志的属性进行更新,并确定所述用户日志所对应用户的标签信息,提高对所述用户日志所对应用户进行标签化处理的准确性。
Description
技术领域
本申请涉及大数据技术领域,尤其是涉及一种标签的生成方法及装置。
背景技术
随着互联网时代的迅猛发展,网络上的数据量呈现井喷式的增长从海量数据里获取目标数据的难度越来越高,由此,可以采用对海量数据所对应的用户标签化的方法来获取目标数据。
在现有技术中,通常采用人工处理的方法,对数据所对应的用户进行标签化处理,当数据量较大时,需要消耗较多的人力,且人工进行标签化处理的适用的范围具有一定的局限性,无法达到对海量数据所对应的用户进行标签化的目的。
因此,如何对海量数据所对应的用户进行标签化处理就显得尤为重要。
发明内容
有鉴于此,本申请实施例的目的在于提供一种标签的生成方法及装置,能够提高对所述用户日志所对应用户进行标签化处理的准确性。
第一方面,本申请实施例提供了一种标签的生成方法,包括:
获取多条符合用户日志筛选条件的用户日志;
基于所述用户日志,确定所述用户日志中归属于目标属性下的目标用户日志的属性更新周期信息;
基于所述属性更新周期信息,确定所述用户日志所对应用户的标签信息。
一种可选实施方式中,所述用户日志筛选条件包括下述至少一种:
所述用户日志的数据来源、所述用户日志的种类以及所述用户日志对应的用户身份标识。
一种可选实施方式中,所述基于所述属性更新周期信息,确定所述用户日志所对应用户的标签信息,包括:
将所述用户日志中归属于目标属性下的目标用户日志的属性更新周期信息,与预设的属性更新周期阈值进行对比。
一种可选实施方式中,在将所述用户日志中归属于目标属性下的目标用户日志的属性更新周期信息,与预设的属性更新周期阈值进行对比之后,包括:
若所述属性更新周期信息超过预设的属性更新周期阈值,则依照与所述目标属性对应的更新规则,对所述用户日志中归属于目标属性下的目标用户日志的属性信息进行更新处理,得到更新后的属性信息,并将所述更新后的属性信息确定所述用户日志所对应用户的标签信息。
一种可选实施方式中,在将所述用户日志中归属于目标属性下的目标用户日志的属性更新周期信息,与预设的属性更新周期阈值进行对比之后,还包括:
若所述属性更新周期信息未超过预设的属性更新周期阈值,则直接将所述用户日志中归属于目标属性下的目标用户日志的属性信息,确定所述用户日志所对应用户的标签信息。
一种可选实施方式中,所述用户日志中归属于目标属性下的目标用户日志的属性信息的类型包括下述任意一种:
字符型、数值型、数组型、布尔型、键值型以及标记型。
一种可选实施方式中,所述与所述目标属性对应的更新规则,包括:
针对属性类型为字符型的属性信息,对所述属性信息中的字符型信息按照预设规则进行以下至少一种处理,包括:对所述属性信息中的字符型信息进行添加处理、对所述属性信息中的字符型信息进行删除处理;
针对属性类型为数值型的属性信息,对所述属性信息中的数值型信息按照预设规则进行以下至少一种处理,包括:对所述属性信息中的数值型信息进行添加处理、对所述属性信息中的数值型信息进行添加处理、对所述属性信息中的数值型信息进行运算处理;
针对属性类型为数组型的属性信息,对所述属性信息中的数组型信息按照预设规则进行以下至少一种处理,包括:对所述属性信息中的数组型信息进行添加处理、对所述属性信息中的数组型信息进行添加处理、对所述属性信息中的数组型信息进行覆盖处理;
针对属性类型为布尔型的属性信息,对所述属性信息赋予用于表示所述属性信息是否为满足更新条件的标识;
针对属性类型为键值型的属性信息,对所述属性信息中的键值型信息按照预设规则进行以下至少一种处理,包括:对所述属性信息中的键值型信息进行添加处理、对所述属性信息中的键值型信息进行删除处理;
针对属性类型为标记型的属性信息,对所述属性信息中的标记型信息按照预设规则进行以下至少一种处理,包括:对所述属性信息中的标记型信息进行添加处理、对所述属性信息中的标记型信息进行删除处理。
第二方面,本申请实施例还提供一种标签的生成装置,该标签的生成装置包括:获取模块、第一确定模块以及第二确定模块,其中:
所述获取模块,用于获取多条符合用户日志筛选条件的用户日志;
所述第一确定模块,用于基于所述用户日志,确定所述用户日志中归属于目标属性下的目标用户日志的属性更新周期信息;
所述第二确定模块,用于基于所述属性更新周期信息,确定所述用户日志所对应用户的标签信息。
一种可选实施方式中,所述用户日志筛选条件包括下述至少一种:
所述用户日志的数据来源、所述用户日志的种类以及所述用户日志对应的用户身份标识。
一种可选实施方式中,所述第二确定模块,用于基于所述属性更新周期信息,确定所述用户日志所对应用户的标签信息时,还用于:
所述对比模块,用于将所述用户日志中归属于目标属性下的目标用户日志的属性更新周期信息,与预设的属性更新周期阈值进行对比。
一种可选实施方式中,在所述对比模块,用于将所述用户日志中归属于目标属性下的目标用户日志的属性更新周期信息,与预设的属性更新周期阈值进行对比之后,具体用于:
若所述属性更新周期信息超过预设的属性更新周期阈值,则依照与所述目标属性对应的更新规则,对所述用户日志中归属于目标属性下的目标用户日志的属性信息进行更新处理,得到更新后的属性信息,并将所述更新后的属性信息确定所述用户日志所对应用户的标签信息。
一种可选实施方式中,在所述对比模块,用于将所述用户日志中归属于目标属性下的目标用户日志的属性更新周期信息,与预设的属性更新周期阈值进行对比之后,还具体用于:
若所述属性更新周期信息未超过预设的属性更新周期阈值,则直接将所述用户日志中归属于目标属性下的目标用户日志的属性信息,确定所述用户日志所对应用户的标签信息。
一种可选实施方式中,所述用户日志中归属于目标属性下的目标用户日志的属性信息的类型包括下述任意一种:
字符型、数值型、数组型、布尔型、键值型以及标记型。
一种可选实施方式中,所述与所述目标属性对应的更新规则,包括:
针对属性类型为字符型的属性信息,对所述属性信息中的字符型信息按照预设规则进行以下至少一种处理,包括:对所述属性信息中的字符型信息进行添加处理、对所述属性信息中的字符型信息进行删除处理;
针对属性类型为数值型的属性信息,对所述属性信息中的数值型信息按照预设规则进行以下至少一种处理,包括:对所述属性信息中的数值型信息进行添加处理、对所述属性信息中的数值型信息进行添加处理、对所述属性信息中的数值型信息进行运算处理;
针对属性类型为数组型的属性信息,对所述属性信息中的数组型信息按照预设规则进行以下至少一种处理,包括:对所述属性信息中的数组型信息进行添加处理、对所述属性信息中的数组型信息进行添加处理、对所述属性信息中的数组型信息进行覆盖处理;
针对属性类型为布尔型的属性信息,对所述属性信息赋予用于表示所述属性信息是否为满足更新条件的标识;
针对属性类型为键值型的属性信息,对所述属性信息中的键值型信息按照预设规则进行以下至少一种处理,包括:对所述属性信息中的键值型信息进行添加处理、对所述属性信息中的键值型信息进行删除处理;
针对属性类型为标记型的属性信息,对所述属性信息中的标记型信息按照预设规则进行以下至少一种处理,包括:对所述属性信息中的标记型信息进行添加处理、对所述属性信息中的标记型信息进行删除处理。
第三方面,本申请实施例还提供一种计算机设备,包括:处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,当计算机设备运行时,所述处理器与所述存储器之间通过总线通信,所述机器可读指令被所述处理器执行时执行上述第一方面、或第一方面中任一种可能的实施方式中的步骤。
第四方面,本申请实施例还提供一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行上述第一方面、或第一方面中任一种可能的实施方式中的步骤。
本申请实施例提供的一种标签的生成方法及装置。在本申请中,首先获取多条符合用户日志筛选条件的用户日志;并基于所述用户日志,确定所述用户日志中归属于目标属性下的目标用户日志的属性更新周期信息;最后,基于所述属性更新周期信息,确定所述用户日志所对应用户的标签信息。在该过程中,通过对所述用户日志中归属于目标属性下的目标用户日志的属性更新周期信息的判断,对目标用户日志的属性进行更新,并确定所述用户日志所对应用户的标签信息,提高对所述用户日志所对应用户进行标签化处理的准确性。
为使本申请的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1示出了本申请实施例所提供的一种标签的生成方法的流程图;
图2示出了本申请实施例所提供的另一种标签的生成方法的流程图;
图3示出了本申请实施例所提供的一种标签的生成装置的结构示意图;
图4示出了本申请实施例所提供的一种计算机设备的结构示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。
考虑到现有技术中,通常采用人工处理的方法,对数据所对应的用户进行标签化处理,当数据量较大时,需要消耗较多的人力,且人工进行标签化处理的适用的范围具有一定的局限性,无法达到对海量数据所对应的用户进行标签化的目的,同时,由于人工处理的自身特性,其对海量数据所对应的用户进行标签化的准确度也无法保证。
基于上述研究,本申请实施例提供的一种标签的生成方法及装置。在本申请中,首先获取多条符合用户日志筛选条件的用户日志;并基于所述用户日志,确定所述用户日志中归属于目标属性下的目标用户日志的属性更新周期信息;最后,基于所述属性更新周期信息,确定所述用户日志所对应用户的标签信息。在该过程中,通过对所述用户日志中归属于目标属性下的目标用户日志的属性更新周期信息的判断,对目标用户日志的属性进行更新,并确定所述用户日志所对应用户的标签信息,提高对所述用户日志所对应用户进行标签化处理的准确性。
针对以上方案所存在的缺陷,均是发明人在经过实践并仔细研究后得出的结果,因此,上述问题的发现过程以及下文中本申请针对上述问题所提出的解决方案,都应该是发明人在本申请过程中对本申请做出的贡献。
下面将结合本申请中附图,对本申请中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
本公开实施例所提供的一种标签的生成方法的执行主体一般为具有一定计算能力的计算机设备,该计算机设备例如包括:终端设备或服务器或其它处理设备,终端设备可以为用户设备(User Equipment,UE)、移动设备、用户终端、终端、蜂窝电话、无绳电话、个人数字处理(Personal Digital Assistant,PDA)、手持设备、计算设备、车载设备、可穿戴设备等。在一些可能的实现方式中,该一种标签的生成方法可以通过处理器调用存储器中存储的计算机可读指令的方式来实现。
下面以执行主体为计算机设备为例对本公开实施例提供的一种标签的生成方法加以说明。
实施例一
参见图1所示,为本申请实施例一提供的一种标签的生成方法的流程图,所述方法包括步骤S101~S103,其中:
S101:获取多条符合用户日志筛选条件的用户日志。
S102:基于所述用户日志,确定所述用户日志中归属于目标属性下的目标用户日志的属性更新周期信息。
S103:基于所述属性更新周期信息,确定所述用户日志所对应用户的标签信息。
下面分别对上述S101~S103分别加以详细说明。
一:在上述S101中,获取多条符合用户日志筛选条件的用户日志。
其中,所述用户日志筛选条件包括下述至少一种:
所述用户日志的数据来源、所述用户日志的种类以及所述用户日志对应的用户身份标识。
示例性的,基于想要获取的信息,确定用户日志筛选条件,例如:所述用户为特定的职业、特定的居住地、特定的爱好等;还可以是,来自特定媒体平台的监测日志、特定时间段的监测日志、或是对特定监测内容的监测日志等;还可以是,对广告的监测日志、对特定商品浏览与点击的监测日志等。
示例性的,所述用户日志筛选条件还可以是,上述多种筛选条件的组合,例如:与、或、除了等。
示例性的,所述用户日志筛选条件还可以是以上述筛选条件为判断标准的其他筛选条件,例如:大于、小于、在……之间、以……开头等多种形式的筛选条件。
基于确定出的用户日志筛选条件,对大量原始日志进行筛选,获取多条符合用户日志筛选条件的用户日志。
二:在上述S102中,基于上述步骤中获取的所述用户日志,确定所述用户日志中归属于目标属性下的目标用户日志的属性更新周期信息。
其中,所述属性更新周期信息为该属性每两次更新之间的时间间隔。
此外,基于上述步骤中获取的所述用户日志,还可以确定所述用户日志中归属于目标属性下的目标用户日志的其他属性信息。
示例性的,所述属性信息包括:基于不同的目标属性,目标用户对其的行为差异等,例如:对于一广告信息的点击浏览行为的改变、对于一商品的点击行为信息等。
三:在上述S103中,基于上述步骤中获取的所述属性更新周期信息,确定所述用户日志所对应用户的标签信息。
请参阅图2,图2为本申请实施例所提供的另一种标签的生成方法的流程图。
其中,所述基于所述属性更新周期信息,确定所述用户日志所对应用户的标签信息,包括:
将所述用户日志中归属于目标属性下的目标用户日志的属性更新周期信息,与预设的属性更新周期阈值进行对比。
示例性的,对于目标用户对于一商品的点击浏览行为,其预设的属性更新周期阈值为3个月,那么可以将所述用户日志中归属于目标属性下的目标用户日志的属性更新周期信息,与预设的属性更新周期阈值,即3个月进行对比。
在将所述用户日志中归属于目标属性下的目标用户日志的属性更新周期信息,与预设的属性更新周期阈值进行对比之后,包括:
若所述属性更新周期信息超过预设的属性更新周期阈值,则依照与所述目标属性对应的更新规则,对所述用户日志中归属于目标属性下的目标用户日志的属性信息进行更新处理,得到更新后的属性信息,并将所述更新后的属性信息确定所述用户日志所对应用户的标签信息。
若所述属性更新周期信息未超过预设的属性更新周期阈值,则直接将所述用户日志中归属于目标属性下的目标用户日志的属性信息,确定所述用户日志所对应用户的标签信息。
其中,所述用户日志中归属于目标属性下的目标用户日志的属性信息的类型包括下述任意一种:
字符型、数值型、数组型、布尔型、键值型以及标记型。
示例性的,字符型为属性存储的值为字符,例如:性别,其值为“男性”或“女性”。
数值型为属性存储的值为数值,例如:收入,其值为“8000”等数字。
数组型为属性存储的值为数组,例如:兴趣爱好,其值为[音乐,旅游,足球]等形式。
布尔型为属性存储的值为“是”或“否”,例如:高价值用户。
键值型为属性存储的值为分布式存储系统(key:value)形式的map,例如:活动曝光,其值为{活动一:6,活动:4},用于描述一个消费者在不同活动下曝光的次数。
标记型的属性不单独存储,所有标记型的属性共用一个数组,存放的元素为标记型属性的属性身份标识ID,例如:[marked_1001,marked_1002...]等形式。
所述与所述目标属性对应的更新规则,包括:
针对属性类型为字符型的属性信息,对所述属性信息中的字符型信息按照预设规则进行以下至少一种处理,包括:对所述属性信息中的字符型信息进行添加处理、对所述属性信息中的字符型信息进行删除处理。
示例性的,选择属性信息中的某一字段,当字段通过规则判定后,该字段的值以字符的形式存入,作为属性的值。
示例性的,选择属性信息中的某一字段,当字段通过规则判定后,将属性信息中已存在字段的值移除。
针对属性类型为数值型的属性信息,对所述属性信息中的数值型信息按照预设规则进行以下至少一种处理,包括:对所述属性信息中的数值型信息进行添加处理、对所述属性信息中的数值型信息进行添加处理、对所述属性信息中的数值型信息进行运算处理。
示例性的,选择属性信息中的某一字段(必须为数值),当字段通过规则判定后,该字段的值以数值的形式存入,作为属性的值。
示例性的,选择属性信息中的两个字段(必须为数值),当字段通过规则判定后,将这两个字段的数值相加,相加的和以数值的形式存入,作为属性的值。
示例性的,选择属性信息中的某一字段(必须为数值),当字段通过规则判定后,该字段的值以数值的形式存入,作为属性的值;若属性信息中已存在值,则将已存在的值与新的数值相加,以相加的和作为属性的值。
示例性的,选择属性信息中的某一字段,当字段通过规则判定后,将属性信息中已存在字段的值移除。
针对属性类型为数组型的属性信息,对所述属性信息中的数组型信息按照预设规则进行以下至少一种处理,包括:对所述属性信息中的数组型信息进行添加处理、对所述属性信息中的数组型信息进行添加处理、对所述属性信息中的数组型信息进行覆盖处理。
示例性的,选择属性信息中的某一字段,当字段通过规则判定后,该字段的值以数组元素的形式存入属性的数组。
示例性的,选择属性信息中的某一字段(必须为数组),当字段通过规则判定后,该字段的值以数组的形式覆盖属性的数组。
示例性的,当字段通过规则判定后,将属性已存在的数组移除。
针对属性类型为布尔型的属性信息,对所述属性信息赋予用于表示所述属性信息是否为满足更新条件的标识;
示例性的,当属性信息通过规则判定后,赋予属性信息“是”或“否”标识。
针对属性类型为键值型的属性信息,对所述属性信息中的键值型信息按照预设规则进行以下至少一种处理,包括:对所述属性信息中的键值型信息进行添加处理、对所述属性信息中的键值型信息进行删除处理。
示例性的,选择属性信息中的某一字段当作键,另一字段为值,当数据通过规则判定后,将键和值以key:value存入属性;若键已存在,则键中的值和新值进行相加后作为新的值存入属性。
示例性的,选择属性信息中的某一字段(必须为键值),当阻断通过规则判定后,将该字段的值以键值的形式存入属性。
示例性的,当字段通过规则判定后,将属性已存在的键值移除。
针对属性类型为标记型的属性信息,对所述属性信息中的标记型信息按照预设规则进行以下至少一种处理,包括:对所述属性信息中的标记型信息进行添加处理、对所述属性信息中的标记型信息进行删除处理。
示例性的,当属性信息通过规则判定后,将该属性信息的ID以元素的形式存入标记共用的数组。
示例性的,当属性信息通过规则判定后,将该属性信息的ID从标记共用的数组中移除。
此外,还可以将确定的所述用户日志所对应用户的标签信息输入至ElasticSearch或是Greenplum当中,以提高后续操作过程中用户搜索的准确性。
本申请提供一种标签的生成方法。在本申请中,首先获取多条符合用户日志筛选条件的用户日志;并基于所述用户日志,确定所述用户日志中归属于目标属性下的目标用户日志的属性更新周期信息;最后,基于所述属性更新周期信息,确定所述用户日志所对应用户的标签信息。在该过程中,通过对所述用户日志中归属于目标属性下的目标用户日志的属性更新周期信息的判断,对目标用户日志的属性进行更新,并确定所述用户日志所对应用户的标签信息,提高对所述用户日志所对应用户进行标签化处理的准确性。
实施例二
参照图3所示,为本申请实施例二提供的一种标签的生成装置的示意图,所述装置包括:获取模块31、第一确定模块32以及第二确定模块33,其中:
获取模块31,用于获取多条符合用户日志筛选条件的用户日志;
所述第一确定模块32,用于基于所述用户日志,确定所述用户日志中归属于目标属性下的目标用户日志的属性更新周期信息;
所述第二确定模块33,用于基于所述属性更新周期信息,确定所述用户日志所对应用户的标签信息。
基于上述研究,本申请提供了一种标签的生成装置。在本申请中,首先获取多条符合用户日志筛选条件的用户日志;并基于所述用户日志,确定所述用户日志中归属于目标属性下的目标用户日志的属性更新周期信息;最后,基于所述属性更新周期信息,确定所述用户日志所对应用户的标签信息。在该过程中,通过对所述用户日志中归属于目标属性下的目标用户日志的属性更新周期信息的判断,对目标用户日志的属性进行更新,并确定所述用户日志所对应用户的标签信息,提高对所述用户日志所对应用户进行标签化处理的准确性。
一种可能的实施方式中,所述用户日志筛选条件包括下述至少一种:
所述用户日志的数据来源、所述用户日志的种类以及所述用户日志对应的用户身份标识。
一种可能的实施方式中,所述第二确定模块33,用于基于所述属性更新周期信息,确定所述用户日志所对应用户的标签信息时,还包括:对比模块34,其中:
所述对比模块34,用于将所述用户日志中归属于目标属性下的目标用户日志的属性更新周期信息,与预设的属性更新周期阈值进行对比。
一种可能的实施方式中,在所述对比模块34,用于将所述用户日志中归属于目标属性下的目标用户日志的属性更新周期信息,与预设的属性更新周期阈值进行对比之后,具体用于:
若所述属性更新周期信息超过预设的属性更新周期阈值,则依照与所述目标属性对应的更新规则,对所述用户日志中归属于目标属性下的目标用户日志的属性信息进行更新处理,得到更新后的属性信息,并将所述更新后的属性信息确定所述用户日志所对应用户的标签信息。
一种可能的实施方式中,在所述对比模块34,用于将所述用户日志中归属于目标属性下的目标用户日志的属性更新周期信息,与预设的属性更新周期阈值进行对比之后,还具体用于:
若所述属性更新周期信息未超过预设的属性更新周期阈值,则直接将所述用户日志中归属于目标属性下的目标用户日志的属性信息,确定所述用户日志所对应用户的标签信息。
一种可能的实施方式中,所述用户日志中归属于目标属性下的目标用户日志的属性信息的类型包括下述任意一种:
字符型、数值型、数组型、布尔型、键值型以及标记型。
一种可能的实施方式中,所述与所述目标属性对应的更新规则,包括:
针对属性类型为字符型的属性信息,对所述属性信息中的字符型信息按照预设规则进行以下至少一种处理,包括:对所述属性信息中的字符型信息进行添加处理、对所述属性信息中的字符型信息进行删除处理;
针对属性类型为数值型的属性信息,对所述属性信息中的数值型信息按照预设规则进行以下至少一种处理,包括:对所述属性信息中的数值型信息进行添加处理、对所述属性信息中的数值型信息进行添加处理、对所述属性信息中的数值型信息进行运算处理;
针对属性类型为数组型的属性信息,对所述属性信息中的数组型信息按照预设规则进行以下至少一种处理,包括:对所述属性信息中的数组型信息进行添加处理、对所述属性信息中的数组型信息进行添加处理、对所述属性信息中的数组型信息进行覆盖处理;
针对属性类型为布尔型的属性信息,对所述属性信息赋予用于表示所述属性信息是否为满足更新条件的标识;
针对属性类型为键值型的属性信息,对所述属性信息中的键值型信息按照预设规则进行以下至少一种处理,包括:对所述属性信息中的键值型信息进行添加处理、对所述属性信息中的键值型信息进行删除处理;
针对属性类型为标记型的属性信息,对所述属性信息中的标记型信息按照预设规则进行以下至少一种处理,包括:对所述属性信息中的标记型信息进行添加处理、对所述属性信息中的标记型信息进行删除处理。
实施例三
本申请实施例还提供了一种计算机设备400,如图4所示,为本申请实施例提供的计算机设备400结构示意图,包括:
处理器41、存储器42、和总线43;存储器42用于存储执行指令,包括内存421和外部存储器422;这里的内存421也称内存储器,用于暂时存放处理器41中的运算数据,以及与硬盘等外部存储器422交换的数据,处理器41通过内存421与外部存储器422进行数据交换,当所述计算机设备400运行时,所述处理器41与所述存储器42之间通过总线43通信,使得所述处理器41在用户态执行以下指令:
获取多条符合用户日志筛选条件的用户日志;
基于所述用户日志,确定所述用户日志中归属于目标属性下的目标用户日志的属性更新周期信息;
基于所述属性更新周期信息,确定所述用户日志所对应用户的标签信息。
一种可能的实施方式中,处理器41执行的指令中,所述用户日志筛选条件包括下述至少一种:
所述用户日志的数据来源、所述用户日志的种类以及所述用户日志对应的用户身份标识。
一种可能的实施方式中,处理器41执行的指令中,所述基于所述属性更新周期信息,确定所述用户日志所对应用户的标签信息,包括:
将所述用户日志中归属于目标属性下的目标用户日志的属性更新周期信息,与预设的属性更新周期阈值进行对比。
一种可能的实施方式中,处理器41执行的指令中,在将所述用户日志中归属于目标属性下的目标用户日志的属性更新周期信息,与预设的属性更新周期阈值进行对比之后,包括:
若所述属性更新周期信息超过预设的属性更新周期阈值,则依照与所述目标属性对应的更新规则,对所述用户日志中归属于目标属性下的目标用户日志的属性信息进行更新处理,得到更新后的属性信息,并将所述更新后的属性信息确定所述用户日志所对应用户的标签信息。
一种可能的实施方式中,处理器41执行的指令中,在将所述用户日志中归属于目标属性下的目标用户日志的属性更新周期信息,与预设的属性更新周期阈值进行对比之后,还包括:
若所述属性更新周期信息未超过预设的属性更新周期阈值,则直接将所述用户日志中归属于目标属性下的目标用户日志的属性信息,确定所述用户日志所对应用户的标签信息。
一种可能的实施方式中,处理器41执行的指令中,所述用户日志中归属于目标属性下的目标用户日志的属性信息的类型包括下述任意一种:
字符型、数值型、数组型、布尔型、键值型以及标记型。
一种可能的实施方式中,处理器41执行的指令中,所述与所述目标属性对应的更新规则,包括:
针对属性类型为字符型的属性信息,对所述属性信息中的字符型信息按照预设规则进行以下至少一种处理,包括:对所述属性信息中的字符型信息进行添加处理、对所述属性信息中的字符型信息进行删除处理;
针对属性类型为数值型的属性信息,对所述属性信息中的数值型信息按照预设规则进行以下至少一种处理,包括:对所述属性信息中的数值型信息进行添加处理、对所述属性信息中的数值型信息进行添加处理、对所述属性信息中的数值型信息进行运算处理;
针对属性类型为数组型的属性信息,对所述属性信息中的数组型信息按照预设规则进行以下至少一种处理,包括:对所述属性信息中的数组型信息进行添加处理、对所述属性信息中的数组型信息进行添加处理、对所述属性信息中的数组型信息进行覆盖处理;
针对属性类型为布尔型的属性信息,对所述属性信息赋予用于表示所述属性信息是否为满足更新条件的标识;
针对属性类型为键值型的属性信息,对所述属性信息中的键值型信息按照预设规则进行以下至少一种处理,包括:对所述属性信息中的键值型信息进行添加处理、对所述属性信息中的键值型信息进行删除处理;
针对属性类型为标记型的属性信息,对所述属性信息中的标记型信息按照预设规则进行以下至少一种处理,包括:对所述属性信息中的标记型信息进行添加处理、对所述属性信息中的标记型信息进行删除处理。
本申请实施例还提供一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行上述方法实施例中所述的标签的生成方法的步骤。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统和装置的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。在本申请所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个处理器可执行的非易失的计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-OnlyMemory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上所述实施例,仅为本申请的具体实施方式,用以说明本申请的技术方案,而非对其限制,本申请的保护范围并不局限于此,尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本申请实施例技术方案的精神和范围,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应所述以权利要求的保护范围为准。
Claims (10)
1.一种标签的生成方法,其特征在于,该方法包括:
获取多条符合用户日志筛选条件的用户日志;
基于所述用户日志,确定所述用户日志中归属于目标属性下的目标用户日志的属性更新周期信息;
基于所述属性更新周期信息,确定所述用户日志所对应用户的标签信息。
2.根据权利要求1所述的方法,其特征在于,所述用户日志筛选条件包括下述至少一种:
所述用户日志的数据来源、所述用户日志的种类以及所述用户日志对应的用户身份标识。
3.根据权利要求1所述的方法,其特征在于,所述基于所述属性更新周期信息,确定所述用户日志所对应用户的标签信息,包括:
将所述用户日志中归属于目标属性下的目标用户日志的属性更新周期信息,与预设的属性更新周期阈值进行对比。
4.根据权利要求3所述的方法,其特征在于,在将所述用户日志中归属于目标属性下的目标用户日志的属性更新周期信息,与预设的属性更新周期阈值进行对比之后,包括:
若所述属性更新周期信息超过预设的属性更新周期阈值,则依照与所述目标属性对应的更新规则,对所述用户日志中归属于目标属性下的目标用户日志的属性信息进行更新处理,得到更新后的属性信息,并将所述更新后的属性信息确定所述用户日志所对应用户的标签信息。
5.根据权利要求3所述的方法,其特征在于,在将所述用户日志中归属于目标属性下的目标用户日志的属性更新周期信息,与预设的属性更新周期阈值进行对比之后,还包括:
若所述属性更新周期信息未超过预设的属性更新周期阈值,则直接将所述用户日志中归属于目标属性下的目标用户日志的属性信息,确定所述用户日志所对应用户的标签信息。
6.根据权利要求4和5任一项所述的方法,其特征在于,所述用户日志中归属于目标属性下的目标用户日志的属性信息的类型包括下述任意一种:
字符型、数值型、数组型、布尔型、键值型以及标记型。
7.根据权利要求6所述的方法,其特征在于,所述与所述目标属性对应的更新规则,包括:
针对属性类型为字符型的属性信息,对所述属性信息中的字符型信息按照预设规则进行以下至少一种处理,包括:对所述属性信息中的字符型信息进行添加处理、对所述属性信息中的字符型信息进行删除处理;
针对属性类型为数值型的属性信息,对所述属性信息中的数值型信息按照预设规则进行以下至少一种处理,包括:对所述属性信息中的数值型信息进行添加处理、对所述属性信息中的数值型信息进行添加处理、对所述属性信息中的数值型信息进行运算处理;
针对属性类型为数组型的属性信息,对所述属性信息中的数组型信息按照预设规则进行以下至少一种处理,包括:对所述属性信息中的数组型信息进行添加处理、对所述属性信息中的数组型信息进行添加处理、对所述属性信息中的数组型信息进行覆盖处理;
针对属性类型为布尔型的属性信息,对所述属性信息赋予用于表示所述属性信息是否为满足更新条件的标识;
针对属性类型为键值型的属性信息,对所述属性信息中的键值型信息按照预设规则进行以下至少一种处理,包括:对所述属性信息中的键值型信息进行添加处理、对所述属性信息中的键值型信息进行删除处理;
针对属性类型为标记型的属性信息,对所述属性信息中的标记型信息按照预设规则进行以下至少一种处理,包括:对所述属性信息中的标记型信息进行添加处理、对所述属性信息中的标记型信息进行删除处理。
8.一种标签的生成装置,其特征在于,该装置包括:
获取模块,用于获取多条符合用户日志筛选条件的用户日志;
第一确定模块,用于基于所述用户日志,确定所述用户日志中归属于目标属性下的目标用户日志的属性更新周期信息;
第二确定模块,用于基于所述属性更新周期信息,确定所述用户日志所对应用户的标签信息。
9.一种计算机设备,其特征在于,包括:处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,当计算机设备运行时,所述处理器与所述存储器之间通过总线通信,所述机器可读指令被所述处理器执行时执行如权利要求1至7任一所述的方法的步骤。
10.一种计算机可读存储介质,其特征在于,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行如权利要求1至7任一所述的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911411994.5A CN111090815A (zh) | 2019-12-31 | 2019-12-31 | 一种标签的生成方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911411994.5A CN111090815A (zh) | 2019-12-31 | 2019-12-31 | 一种标签的生成方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111090815A true CN111090815A (zh) | 2020-05-01 |
Family
ID=70398627
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911411994.5A Pending CN111090815A (zh) | 2019-12-31 | 2019-12-31 | 一种标签的生成方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111090815A (zh) |
Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2001075571A2 (en) * | 2000-04-02 | 2001-10-11 | Tangis Corporation | Logging and analyzing computer user's context data |
CN101420460A (zh) * | 2008-12-08 | 2009-04-29 | 腾讯科技(深圳)有限公司 | 创建聚合容器及为用户匹配聚合容器的方法及装置 |
US20110231408A1 (en) * | 2010-03-18 | 2011-09-22 | Fujitsu Limited | Privacy protection device, privacy protection method, and life log management system |
JP2014217070A (ja) * | 2014-05-28 | 2014-11-17 | ソフトバンクモバイル株式会社 | 情報生成装置及びプログラム |
US20160099963A1 (en) * | 2008-10-21 | 2016-04-07 | Lookout, Inc. | Methods and systems for sharing risk responses between collections of mobile communications devices |
CN105677649A (zh) * | 2014-11-18 | 2016-06-15 | 中国移动通信集团公司 | 一种个性化网页排版的方法及装置 |
CN107436930A (zh) * | 2017-07-17 | 2017-12-05 | 广州特道信息科技有限公司 | 资讯推荐方法及装置 |
CN107766580A (zh) * | 2017-11-20 | 2018-03-06 | 北京奇虎科技有限公司 | 消息的推送方法及装置 |
CN109145047A (zh) * | 2018-06-29 | 2019-01-04 | 深圳市彬讯科技有限公司 | 用户标签画像的配置方法、数据处理装置及存储介质 |
CN109241031A (zh) * | 2018-08-14 | 2019-01-18 | 腾讯科技(深圳)有限公司 | 模型生成方法、模型使用方法、装置、系统及存储介质 |
JP2019179367A (ja) * | 2018-03-30 | 2019-10-17 | 本田技研工業株式会社 | データ管理装置およびデータ管理方法 |
CN110427307A (zh) * | 2019-06-21 | 2019-11-08 | 平安科技(深圳)有限公司 | 日志解析方法、装置、计算机设备及存储介质 |
-
2019
- 2019-12-31 CN CN201911411994.5A patent/CN111090815A/zh active Pending
Patent Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2001075571A2 (en) * | 2000-04-02 | 2001-10-11 | Tangis Corporation | Logging and analyzing computer user's context data |
US20160099963A1 (en) * | 2008-10-21 | 2016-04-07 | Lookout, Inc. | Methods and systems for sharing risk responses between collections of mobile communications devices |
CN101420460A (zh) * | 2008-12-08 | 2009-04-29 | 腾讯科技(深圳)有限公司 | 创建聚合容器及为用户匹配聚合容器的方法及装置 |
US20110231408A1 (en) * | 2010-03-18 | 2011-09-22 | Fujitsu Limited | Privacy protection device, privacy protection method, and life log management system |
JP2014217070A (ja) * | 2014-05-28 | 2014-11-17 | ソフトバンクモバイル株式会社 | 情報生成装置及びプログラム |
CN105677649A (zh) * | 2014-11-18 | 2016-06-15 | 中国移动通信集团公司 | 一种个性化网页排版的方法及装置 |
CN107436930A (zh) * | 2017-07-17 | 2017-12-05 | 广州特道信息科技有限公司 | 资讯推荐方法及装置 |
CN107766580A (zh) * | 2017-11-20 | 2018-03-06 | 北京奇虎科技有限公司 | 消息的推送方法及装置 |
JP2019179367A (ja) * | 2018-03-30 | 2019-10-17 | 本田技研工業株式会社 | データ管理装置およびデータ管理方法 |
CN109145047A (zh) * | 2018-06-29 | 2019-01-04 | 深圳市彬讯科技有限公司 | 用户标签画像的配置方法、数据处理装置及存储介质 |
CN109241031A (zh) * | 2018-08-14 | 2019-01-18 | 腾讯科技(深圳)有限公司 | 模型生成方法、模型使用方法、装置、系统及存储介质 |
CN110427307A (zh) * | 2019-06-21 | 2019-11-08 | 平安科技(深圳)有限公司 | 日志解析方法、装置、计算机设备及存储介质 |
Non-Patent Citations (3)
Title |
---|
刘春辉: "基于用户画像技术的内部威胁检测框架研究", 《CNKI中国知网》 * |
王冬羽: "基于移动互联网行为分析的用户画像系统设计", 《CNKI中国知网》 * |
郭韦昱: "基于用户行为分析的个性化推荐系统设计与实现", 《CNKI中国知网》 * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110472154B (zh) | 一种资源推送方法、装置、电子设备及可读存储介质 | |
CN110110201B (zh) | 一种内容推荐方法和系统 | |
CN111078742B (zh) | 用户分类模型训练方法、用户分类方法及装置 | |
CN109191158B (zh) | 用户画像标签数据的处理方法及处理设备 | |
CN110334279B (zh) | 广告投放方法、装置、服务器及存储介质 | |
CN111090807A (zh) | 一种基于知识图谱的用户识别方法及装置 | |
CN111026753A (zh) | 基于树形结构的标签存储方法及装置 | |
CN110928894A (zh) | 实体对齐的方法及装置 | |
CN112559524A (zh) | 一种指标数据库建立方法、装置及存储介质 | |
CN110188276B (zh) | 数据发送装置、方法、电子设备及计算机可读存储介质 | |
CN111241402A (zh) | 一种信息推送方法、装置、电子设备及可读存储介质 | |
CN106933905B (zh) | 网页访问数据的监测方法和装置 | |
CN110362540B (zh) | 一种数据存储、访客数获取方法及装置 | |
CN113434762A (zh) | 基于用户信息的关联推送方法、装置、设备及存储介质 | |
CN112650946A (zh) | 产品信息的推荐方法、装置、系统及存储介质 | |
CN112307297A (zh) | 一种基于优先级规则的用户标识统一方法及系统 | |
CN111090815A (zh) | 一种标签的生成方法及装置 | |
CN110781375A (zh) | 一种用户状态标识确定方法及装置 | |
CN114429644A (zh) | 图像底库的更新方法、装置、设备及存储介质 | |
CN114036048A (zh) | 一种案例活跃度检测方法、装置、设备及存储介质 | |
CN113849812A (zh) | 应用程序检测方法、装置以及电子设备 | |
US10467322B1 (en) | System and method for highly scalable data clustering | |
CN110598211A (zh) | 文章的识别方法和装置、存储介质及电子装置 | |
CN114880713B (zh) | 基于数据链路的用户行为分析方法、装置、设备及介质 | |
CN110992096B (zh) | 预测模型训练方法、装置以及媒体标识预测方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |