CN109801101A - 标签确定方法、装置、计算机设备和存储介质 - Google Patents

标签确定方法、装置、计算机设备和存储介质 Download PDF

Info

Publication number
CN109801101A
CN109801101A CN201910003477.8A CN201910003477A CN109801101A CN 109801101 A CN109801101 A CN 109801101A CN 201910003477 A CN201910003477 A CN 201910003477A CN 109801101 A CN109801101 A CN 109801101A
Authority
CN
China
Prior art keywords
label
user data
user
data
candidate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910003477.8A
Other languages
English (en)
Inventor
赵云松
江琳
杨镭
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
OneConnect Smart Technology Co Ltd
Original Assignee
OneConnect Smart Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by OneConnect Smart Technology Co Ltd filed Critical OneConnect Smart Technology Co Ltd
Priority to CN201910003477.8A priority Critical patent/CN109801101A/zh
Publication of CN109801101A publication Critical patent/CN109801101A/zh
Pending legal-status Critical Current

Links

Abstract

本申请涉及一种基于大数据的标签确定方法、装置、计算机设备和存储介质,涉及用户画像领域。该方法包括:获取终端上传的待处理用户数据中具有代表性的样本用户数据,计算所述样本用户数据与各候选标签的第一相关性结果,根据所述第一相关性结果符合预设要求的候选标签,为待处理用户数据确定标签。该方法使得标签的确定根据依据来源于待处理用户数据的代表性数据,确定的标签能够反应用户数据的特征,而不是凭经验设置,提高用户画像的准确度。同时,标签确定无需人工分析,提高了标签确定的效率。

Description

标签确定方法、装置、计算机设备和存储介质
技术领域
本申请涉及互联网技术领域,特别是涉及一种标签确定方法、装置、计算机设备和存储介质。
背景技术
随着互联网和大数据技术的发展,各应用平台通过用户大数据分析用户需求,基于需求分析结果进行产品推荐,能够提高产品推荐的转化率。其中,需求分析根据用户数据确定用户标签,根据用户标签进行产品推荐。
产品推荐系统中,预先设置了多个系统标签,系统标签用于描述用户的属性,如用户地域,用户年龄,用户对物品的偏好等。通过对用户数据进行分析,与用户数据匹配的系统标签则确定为用户标签。在产品推荐系统中,正确的用户标签全面反应用户的特征,将提高产品推荐的正确度。而用户标签来源于系统标签,系统标签的全面性、针对性和有效性,能够提高用户标签的准确度。
传统的系统标签为人工凭经验设置,常常不能反应用户数据的真实情况,导致标签与用户的匹配度低,进而导致产品推荐的转化率低。
发明内容
基于此,有必要针对上述技术问题,提供一种能够提高标签与用户的匹配度的标签确定方法、装置、计算机设备和存储介质。
一种标签确定方法,所述方法包括:
获取终端上传的待处理用户数据中具有代表性的样本用户数据;
计算所述样本用户数据与各候选标签的第一相关性结果;
根据所述第一相关性结果符合预设要求的候选标签,为待处理用户数据确定标签。
在其中一个实施例中,计算所述样本用户数据与各候选标签的第一相关性结果的步骤,包括:将各候选标签作为变量,利用logistics模型对所述样本用户数据与各变量之间的相关性进行分析,得到包括各候选标签的预测力和相关性的第一相关性结果;
根据所述第一相关性结果符合预设要求的候选标签,为待处理用户数据确定标签的步骤,包括:根据所述第一相关性结果中预测力和相关性符合预设要求的第一候选标签,为待处理用户数据的确定标签。
在其中一个实施例中,根据所述第一相关性结果中预测力和相关性符合预设要求的第一候选标签,为待处理用户数据的确定标签的步骤,包括:将所述第一相关性结果中预测力和相关性分别满足对应预设阈值的第一候选标签,确定为待处理用户数据的标签。
在其中一个实施例中,根据所述第一相关性结果中预测力和相关性符合预设要求的第一候选标签,为待处理用户数据的确定标签的步骤,包括:
将所述第一相关性结果中预测力和相关性符合预设要求的第一候选标签发送至所述终端;
接收所述终端发送的选定标签,所述标签通过用户从所述第一候选标签中筛选得到。
在其中一个实施例中,所述标签确定方法还包括:
获取基于标签和用户数据,为用户进行产品推荐所反馈的产品推荐转化情况;
根据所述转化情况,调整标签,以根据调整后的标签进行产品推荐。
在其中一个实施例中,根据所述转化情况,调整标签的步骤,包括:
获取所述用户数据中完成预设转化行为的代表用户数据;
根据所述代表用户数据,调整所述标签。
在其中一个实施例中,所述根据所述代表用户数据,调整所标签的步骤,包括:
计算所述代表用户数据与各候选标签的第二相关性结果;
根据所述第二相关性结果符合预设要求的第二候选标签,为所述用户数据更新标签。
一种标签确定装置,所述装置包括:
数据获取模块,用于获取终端上传的待处理用户数据中具有代表性的样本用户数据;
相关性分析模块,用于计算所述样本用户数据与各候选标签的第一相关性结果;
标签确定模块,用于根据所述第一相关性结果符合预设要求的候选标签,为待处理用户数据确定标签。
一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述任一实施例的标签确定方法的步骤。
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述任一实施例的标签确定方法的步骤。
上述标签确定方法、装置、计算机设备和存储介质,通过计算待处理用户数据中具有代表性的样本用户数据,与各候选标签的相关性结果,根据相关性结果符合预设要求的候选标签,为待处理用户确定标签,使得标签的确定根据依据来源于待处理用户数据的代表性数据,确定的标签能够反应用户数据的特征,而不是凭经验设置,提高用户画像的准确度。同时,标签确定无需人工分析,提高了标签确定的效率。
附图说明
图1为一个实施例中标签确定方法的应用场景图;
图2为一个实施例中标签确定方法的流程示意图;
图3为一个实施例中标签确定装置的结构框图;
图4为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
本申请提供的产品推荐方法,可以应用于如图1所示的应用环境中。其中,第一终端102通过网络与服务器104通过网络进行通信,第二终端106通过网络与服务器104通过网络进行通信。第一终端102为产品推荐需求方的用户终端,产品推荐需求方为推荐产品的提供方,如银行,银行提供了多个产品,需要向不同的用户推荐不同的产品。第二终端106为产品推荐接收方的用户终端。其中,第一终端102和第二终端106可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备,服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。在一个实施例中,如图2所示,提供了一种标签确定方法,以该方法应用于图1中的服务器为例进行说明,包括以下步骤:
步骤202,获取终端上传的待处理用户数据中具有代表性的样本用户数据。
用户数据由产品推荐需求方和/或推荐平台运营方提供。用户数据包括了用户基本信息、业务数据和用户行为数据。其中,用户基本信息如姓名、地址和年龄等。业务数据是指用户在产品需求方或推荐平台运营方的相关业务数据,以产品需求方为银行为例,业务数据为用户在银行的相关业务数据,如存款、信用卡、贷款等业务数据,包括信用卡的消费场所,消费金额,是否按时还款,还包括贷款金额,贷款类型,是否按时还贷等。用户行为数据是指用户在相关平台(如产品推荐需求方或推荐平台运营方提供的平台)上的操作行为,如在银行APP上的操作行为。主要数据来源包括平台的业务类数据表、日志数据表和埋点数据表。其中日志数据和埋点数据记录了用户在产品上的全部行为,如用户浏览某个页面、搜索某个关键词、点击了某个点位即会在日志数据中有相应记录。
具体地,样本用户数据由产品推荐需求方上传,可以为从用户数据中挑选数据完整的用户数据作为样本用户数据,也可以按照一定的划分规则,将用户数据分为多个类型,从各类型的用户数据中挑选代表性的用户数据作为样本用户行为数据。如,将用户数据根据年龄分为多个年龄段,再从每个年龄段的用户数据中挑选数据较为完成的用户数据作为代表,组成样本用户数据。如用户上传需要进行产品推荐的用户数据为十万个,则样本用户数据可以为其中由需求方筛选的五千个,这五千个样本用户数据的各个维度,应当完整,从而可以保证分析的全面性。
S204,计算样本用户数据与各候选标签的第一相关性结果。
具体地,候选标签是指产品推荐系统中所使用的用于描述用户属性的各个维度,用于描述用户画像的标签类别,如用户兴趣,社会属性,兴趣爱好,消费意图等。候选标签有多个,是标签的备选,用于从中确定标签。即,标签是候选标签的其中一部分。候选标签可以为推荐系统设置的常用标签,涵盖了较多的标签类别。第一相关性结果表示样本用户数据与候选标签的相关程度,从而剔除候选标签中与用户数据不相关的候选标签。
具体地,用户数据和各候选标签的相关性计算,可使用logistics模型进行计算,其分析结果包括了相关度和预测力两个指标。
S206,根据第一相关性结果符合预设要求的候选标签,为待处理用户数据确定标签。
具体地,候选标签有多个,但对于每一批用户行为数据而言,由于是具有同质化数据的用户行为数据而言,如地域这个标签可能不适合用于体现各用户行为数据的区分度,而且候选标签的类别过多,若用户行为数据匹配每一个候选标签,则将消耗太多时间。本实施例中,样本行为数据为待处理用户数据中的代表,通过计算样本行为数据与各候选标签类别的相关性结果,根据相关性结果为待处理用户行为数据确定标签,能够使标签反应用户数据的特征,进一步提高用户画像的准确度。同时,标签确定无需人工分析,提高了标签确定的效率。
上述的标签确定方法,通过计算待处理用户数据中具有代表性的样本用户数据,与各候选标签的相关性结果,根据相关性结果符合预设要求的候选标签,为待处理用户确定标签,使得标签的确定根据依据来源于待处理用户数据的代表性数据,确定的标签能够反应用户数据的特征,而不是凭经验设置,提高用户画像的准确度。同时,标签确定无需人工分析,提高了标签确定的效率。
在另一个实施例中,计算样本用户数据与各候选标签的第一相关性结果的步骤,包括:将各候选标签作为变量,利用logistics模型对样本用户数据与各变量之间的相关性进行分析,得到包括各候选标签的预测力和相关性的第一相关性结果。
根据第一相关性结果符合预设要求的候选标签,为待处理用户数据确定标签的步骤,包括:根据第一相关性结果中预测力和相关性符合预设要求的第一候选标签,为待处理用户数据的确定标签。
具体地,本实施例中利用logistics模型进行相关性分析。预测力和相关性是相关性分析的两个指标。相关性表示变量与候选标签是否相关,预测力表明变量的预测能力。相关性值越高,表明二者之间越相关,预测力值越低,表明变量在代表用户数据的预测能力越弱。
本实施例中,设置了预测力阈值和相关性阈值,将第一相关性结果中预测力大于预测力阈值且相关性大于相关性阈值的第一候选标签,确定为标签。
本实施例中,利用样本用户数据和候选标签的相关性结果,以预测力和相关性筛选候选标签,过滤预测力弱且与用户数据不相关的候选标签,使得根据样本用户数据中的样本用户数据进行筛选,以样本用户数据为依据,确定的标签更加符合用户数据的特征。
在另一个实施例中,根据预测力和相关性符合预设要求的第一候选标签,为待处理用户数据的确定标签的步骤,包括:将第一相关性结果中预测力和相关性分别满足对应预设阈值的第一候选标签,确定为待处理用户数据的标签。具体地,将第一相关性结果中预测力大于预测力阈值且相关性大于相关性阈值的第一候选标签,确定为待处理用户数据的标签。
本实施例中,以预测力和相关性筛选候选标签,过滤预测力弱且与用户数据不相关的候选标签。
在另一个实施例中,根据第一相关性结果中预测力和相关性符合预设要求的第一候选标签,为待处理用户数据的确定标签的步骤,包括:将第一相关性结果中预测力和相关性符合预设要求的第一候选标签发送至终端,接收终端发送的选定标签,标签通过用户从第一候选标签中筛选得到。
具体地,以预测力和相关性筛选候选标签,进行初步筛选,过滤预测力弱且与用户数据不相关的候选标签,第一候选标签。将第一候选标签发送至产品推荐需求方的终端,由分析需求方根据自身需求,对初步确定的标签进行确认,可根据产品需求增加或删除标签,反馈得到最终的命中标签。由于有人工对相关度分析初步筛选的结果进行确认,能够使确定的命中标签更加符合用户需求。
在另一个实施例中,标签确定方法还包括:获取基于标签和用户数据,为用户进行产品推荐所反馈的产品推荐转化情况,根据转化情况,调整标签,以根据调整后的标签进行产品推荐。
本实施例中,基于确定的标签,进行产品推荐。具体地,根据标签和用户数据,为各用户确定用户画像标签,根据用户画像标签为用户确定推荐产品,将推荐产品的链接发送至用户终端,基于用户对推荐产品的链接的操作,获取产品推荐转化情况,根据转化情况,调整标签,以根据调整后的标签进行产品推荐。
其中,标签,对某一类特定群体或对象的某项特征进行的抽象分类和概括,其值(标签值)具备可分类性。例如,对于“人”这类群体,可将“男”、“女”这类特征进行抽象概括,统称为“性别”,“性别”即一个标签。
用户画像标签,是指根据标签和用户数据,对用户进行画像,得到的用于描述用户特征的标签值。其中,用户画像,由某一特定群体或对象的多项特征构成,输出结果通常是对特征的具体描述。即用户画像标签是由多个标签组合而成,其实例是由多个标签值构成。如某用户的用户画像标签为:男生,具有短期消费意图,具有金融需求。
用户画像根据标签和用户数据确定,因此,设置的标签类型是否能够涵盖用户数据的特征,以得到准确的用户画像标签非常重要。合理的标签类别,将能使用户画像标签全面地体现用户实际特征。而过多的标签类别,导致画像标签过多,却与其它用户的用户画像标签不具有区分性。过少的标签类别,将导致用户画像标签过少,不能全现地体现用户实际特征。例如,一批用户数据来源于同一地域的用户,那么,地域这个标签并不具有区分性,大部分的地域标签值相同,由于不具有区分性,推荐产品并不能个性化的反应客户需求。
匹配用户画像标签和推荐产品,根据用户画像标签为用户确定匹配的推荐产品。如根据一个用户数据,确定该用户具有金融需求和短期消费意图,兴趣爱好为车。则产品推荐时,可根据用户画像标签为其推荐相匹配的金融产品,如车险,车抵押贷等。推荐产品链接可以是推荐产品内容及相关链接地址,如车抵押贷的网页链接地址。
通过推荐平台运营方的服务器,将推荐产品链接地址发送至安装有推荐平台软件的用户终端。
推荐产品的链接可以以图片广告、视频广告的形式,图片广告、视频广告展示在用户终端的推荐平台中软件的相关界面,当用户点解图片广告或视频广告时,根据链接的推荐产品链接,跳转至相关的产品页面。
在实际的应用中,在展示推荐产品广告的显示界面埋点,当用户点击广告时,基于埋点用户终端向服务器上报用户点击行为。
转化是指用户完成一次推广转户期望的行为。其中,转化行为可根据实际需求定义,如可以将转化行为定义为点击行为,也可以将转化行为定义为在用户推荐产品相关页面完成一次推广商户期望的行为,如,在推荐产品相关页面停留一定的时间,浏览了网站上特定页面,如注册页面,联系我们页面,在网站上注册或提交订单,实际付款等等。转化行为可基于埋点向服务器上报。
转化情况可以为完成转化行为的次数,也可以为转化率。转化率是指在一个统计周期内,完成转化行为的次数占推广信息总推广次数的比率。
如前面的,可由工作人员对用户数据进行分析,人工设置标签,如设置兴趣爱好,金融需求,消费意图等。还可根据经验,设置标签。然而人工分析设置标签技术门槛高,费时费力。根据经验设置标签,脱离了用户数据,并不能涵盖用户数据的特征,将导致用户画像标签不完整,或用户画像标签过多却不具有区分性。本实施中,根据转化情况,调整标签。由于转化情况是用户对于推荐产品的真实反馈,因而基于用户反馈,调整标签,能够使得标签的设置更加符合用户数据的特征,提高用户画像的准确率,从而根据调整后的标签进行产品推荐时,提高推荐产品的转化率。
在另一个实施例中,根据转化情况,调整标签的步骤,包括:获取用户数据中完成预设转化行为的代表用户数据,根据代表用户数据,调整标签。
具体地,转化是指用户完成一次推广转户期望的行为。其中,转化行为可根据实际需求定义,如可以将转化行为定义为点击行为,也可以将转化行为定义为在用户推荐产品相关页面完成一次推广商户期望的行为,如,在推荐产品相关页面停留一定的时间,浏览了网站上特定页面,如注册页面,联系我们页面,在网站上注册或提交订单,实际付款等等。转化行为可基于埋点向服务器上报,以便于服务器进行数据统计。
将完成了预设转化行为的用户数据确定为代表用户数据。代表用户数据为基于初设置的标签进行产品推荐后,完成了预设转化行为的用户的数据,是用户对于推荐产品的反馈。若用户完成了转化行为,则表明推荐产品符合用户需求,若用户未完成转化行为,则表明推荐产品不符合用户需求。因此,代表用户数据为对于推荐产品持接受态度的用户的数据,表明对于这一部分用户的产品推荐是成功的。
而产品推荐是基于用户画像标签确定的,表明用户画像标签全面的概括了用户实际特征,故而标签类别的选择是正确的。因此,根据这一部分的代表用户数据,重新调整标签,能够以代表用户数据的标签设置为参照,为用户数据重新设置标签,以提高全部用户数据标签设置的准确度。
在一个实施例中,根据代表用户数据,调整标签的步骤,包括:以调整前的标签和代表用户数据作为训练集,训练标签确定模型,将用户数据输入标签确定模型,得到调整后的标签。
具体地,由于代表用户数据为对于推荐产品持接受态度的用户的数据,表明对于这一部分用户的产品推荐是成功的,标签类别的选择是正确。故本实施例中,以调整前的标签和代表用户数据作为训练集,训练标签确定模型。标签确定模型可采用神经网络模型,将标签作为标注数据,将用户数据输入标签确定模型,输出模型预测的标签,根据预测标签和标注的标签的差异,进行反向传播,调整标签确定模型的参数,不断优化迭代,得到训练好的标签确定模型。再将用户数据输入确定训练模型,得到调整后的标签。
本实施例中,根据代表用户数据,利用模型训练的方式,调整标签,一方面,以代表用户数据的标签设置为参照,为用户数据重新设置标签,以提高全部用户数据标签设置的准确度。另一方面,无需人工标注以及人工分析,提高了标签设置的效率。
在另一个实施例中,根据代表用户数据,调整所标签的步骤,包括:计算代表用户数据与各候选标签的第二相关性结果,根据第二相关性结果符合预设要求的第二候选标签,为用户数据更新标签。
由于代表用户数据为对于推荐产品持接受态度的用户的数据,表明对于这一部分用户的产品推荐是成功的,为代表用户数据所使用的标签是较为合理,能够较为全面的刻画用户画像,得到合适的用户画像标签。因此,本实施例中,将代表用户数据作为用户数据的代表,以此为依据计算与各候选标签的相关性结果。
候选标签是指产品推荐系统中所使用的用于描述用户属性的各个维度,用于描述用户画像的标签类别,如用户兴趣,社会属性,兴趣爱好,消费意图等。候选标签有多个,是标签的备选,用于从中确定标签。即,标签是候选标签的其中一部分。候选标签可以为推荐系统设置的常用标签,涵盖了较多的标签类别。
第二相关性结果表示推荐成功的代表用户数据与候选标签的相关程度。具体地,代表用户数据和各候选标签的相关性计算,可使用logistics模型进行计算,其分析结果包括了相关度和预测力两个指标。
第二相关性结果表示推荐成功的代表用户数据与候选标签的相关程度,且代表用户数据所使用的标签是较为合理,能够较为全面的刻画用户画像。因此,根据第二相关性结果符合预设要求的候选标签,为用户数据更新标签,能够以代表用户数据为参照,获取较为合理的标签设置,提高用户画像的准确度。
可以理解的是,上述利用logistics模型进行相关性分析以及根据分析结果确定标签的方法,同时也可适用于对代表用户数据和各候选标签的第动起来相关性进行分析,以及根据分析结果更新标签。
具体地,计算代表用户数据与各候选标签的第二相关性结果的步骤,包括:
将各候选标签作为变量,利用logistics模型对代表用户数据与各变量之间的相关性进行分析,得到包括各候选标签的预测力和相关性的第二相关性结果。
根据第二相关性结果符合预设要求的第二候选标签,为用户数据更新标签的步骤,包括:根据第一相关性结果中预测力和相关性符合预设要求的第动起来候选标签,为待处理用户数据的确定标签。
应该理解的是,虽然图2的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图2中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
在一个实施例中,如图3所示,提供了一种标签确定装置,包括:数据获取模块、相关性分析模块和标签确定模块,其中:
数据获取模块302,用于获取终端上传的待处理用户数据中具有代表性的样本用户数据。
相关性分析模块304,用于计算样本用户数据与各候选标签的第一相关性结果。
标签确定模块306,用于根据第一相关性结果符合预设要求的候选标签,为待处理用户数据确定标签。
上述标签确定装置,通过计算待处理用户数据中具有代表性的样本用户数据,与各候选标签的相关性结果,根据相关性结果符合预设要求的候选标签,为待处理用户确定标签,使得标签的确定根据依据来源于待处理用户数据的代表性数据,确定的标签能够反应用户数据的特征,而不是凭经验设置,提高用户画像的准确度。同时,标签确定无需人工分析,提高了标签确定的效率。
在另一个实施例中,相关性分析模块,用于将各候选标签作为变量,利用logistics模型对样本用户数据与各变量之间的相关性进行分析,得到包括各候选标签的预测力和相关性的第一相关性结果。
标签确定模块,用于根据第一相关性结果中预测力和相关性符合预设要求的第一候选标签,为待处理用户数据的确定标签。
在另一个实施例中,标签确定模块,用于将第一相关性结果中预测力和相关性分别满足对应预设阈值的第一候选标签,确定为待处理用户数据的标签。
在另一个实施例中,标签确定模块,用于将第一相关性结果中预测力和相关性符合预设要求的第一候选标签发送至终端,接收终端发送的选定标签,标签通过用户从第一候选标签中筛选得到。
在另一个实施例中,标签确定装置还包括:
转化获取模块,用于获取基于标签和用户数据,为用户进行产品推荐所反馈的产品推荐转化情况。
标签调整模块,用于根据转化情况,调整标签,以根据调整后的标签进行产品推荐。
在另一个实施例中,标签调整模块,包括:
代表数据获取模块,用于获取用户数据中完成预设转化行为的代表用户数据。
调整模块,用于根据代表用户数据,调整标签。
在另一个实施例中,标签调整模块,用于计算代表用户数据与各候选标签的第二相关性结果,根据第二相关性结果符合预设要求的第二候选标签,为用户数据更新标签。
关于标签确定装置的具体限定可以参见上文中对于标签确定方法的限定,在此不再赘述。上述标签确定装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是终端,其内部结构图可以如图4所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口、显示屏和输入装置。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种标签确定方法。该计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏,该计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。
本领域技术人员可以理解,图4中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,提供了一种计算机设备,包括存储器和处理器,该存储器存储有计算机程序,该处理器执行计算机程序时实现以下步骤:
获取终端上传的待处理用户数据中具有代表性的样本用户数据;
计算样本用户数据与各候选标签的第一相关性结果;
根据第一相关性结果符合预设要求的候选标签,为待处理用户数据确定标签。
在另一个实施例中,计算样本用户数据与各候选标签的第一相关性结果的步骤,包括:
将各候选标签作为变量,利用logistics模型对样本用户数据与各变量之间的相关性进行分析,得到包括各候选标签的预测力和相关性的第一相关性结果;
根据第一相关性结果符合预设要求的候选标签,为待处理用户数据确定标签的步骤,包括:根据第一相关性结果中预测力和相关性符合预设要求的第一候选标签,为待处理用户数据的确定标签。
在另一个实施例中,根据第一相关性结果中预测力和相关性符合预设要求的第一候选标签,为待处理用户数据的确定标签的步骤,包括:将第一相关性结果中预测力和相关性分别满足对应预设阈值的第一候选标签,确定为待处理用户数据的标签。
在另一个实施例中,根据第一相关性结果中预测力和相关性符合预设要求的第一候选标签,为待处理用户数据的确定标签的步骤,包括:
将第一相关性结果中预测力和相关性符合预设要求的第一候选标签发送至终端;
接收终端发送的选定标签,标签通过用户从第一候选标签中筛选得到。
在另一个实施例中,处理器执行计算机程序时还实现以下步骤:
获取基于标签和用户数据,为用户进行产品推荐所反馈的产品推荐转化情况;
根据转化情况,调整标签,以根据调整后的标签进行产品推荐。
在另一个实施例中,根据转化情况,调整标签的步骤,包括:
获取用户数据中完成预设转化行为的代表用户数据;
根据代表用户数据,调整标签。
在另一个实施例中,根据代表用户数据,调整所标签的步骤,包括:
计算代表用户数据与各候选标签的第二相关性结果;
根据第二相关性结果符合预设要求的第二候选标签,为用户数据更新标签。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:
获取终端上传的待处理用户数据中具有代表性的样本用户数据;
计算样本用户数据与各候选标签的第一相关性结果;
根据第一相关性结果符合预设要求的候选标签,为待处理用户数据确定标签。
在另一个实施例中,计算样本用户数据与各候选标签的第一相关性结果的步骤,包括:
将各候选标签作为变量,利用logistics模型对样本用户数据与各变量之间的相关性进行分析,得到包括各候选标签的预测力和相关性的第一相关性结果;
根据第一相关性结果符合预设要求的候选标签,为待处理用户数据确定标签的步骤,包括:根据第一相关性结果中预测力和相关性符合预设要求的第一候选标签,为待处理用户数据的确定标签。
在另一个实施例中,根据第一相关性结果中预测力和相关性符合预设要求的第一候选标签,为待处理用户数据的确定标签的步骤,包括:将第一相关性结果中预测力和相关性分别满足对应预设阈值的第一候选标签,确定为待处理用户数据的标签。
在另一个实施例中,根据第一相关性结果中预测力和相关性符合预设要求的第一候选标签,为待处理用户数据的确定标签的步骤,包括:
将第一相关性结果中预测力和相关性符合预设要求的第一候选标签发送至终端;
接收终端发送的选定标签,标签通过用户从第一候选标签中筛选得到。
在另一个实施例中,处理器执行计算机程序时还实现以下步骤:
获取基于标签和用户数据,为用户进行产品推荐所反馈的产品推荐转化情况;
根据转化情况,调整标签,以根据调整后的标签进行产品推荐。
在另一个实施例中,根据转化情况,调整标签的步骤,包括:
获取用户数据中完成预设转化行为的代表用户数据;
根据代表用户数据,调整标签。
在另一个实施例中,根据代表用户数据,调整所标签的步骤,包括:
计算代表用户数据与各候选标签的第二相关性结果;
根据第二相关性结果符合预设要求的第二候选标签,为用户数据更新标签。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

Claims (10)

1.一种标签确定方法,所述方法包括:
获取终端上传的待处理用户数据中具有代表性的样本用户数据;
计算所述样本用户数据与各候选标签的第一相关性结果;
根据所述第一相关性结果符合预设要求的候选标签,为待处理用户数据确定标签。
2.根据权利要求1所述的方法,其特征在于,计算所述样本用户数据与各候选标签的第一相关性结果的步骤,包括:
将各候选标签作为变量,利用logistics模型对所述样本用户数据与各变量之间的相关性进行分析,得到包括各候选标签的预测力和相关性的第一相关性结果;
根据所述第一相关性结果符合预设要求的候选标签,为待处理用户数据确定标签的步骤,包括:根据所述第一相关性结果中预测力和相关性符合预设要求的第一候选标签,为待处理用户数据的确定标签。
3.根据权利要求2所述的方法,其特征在于,根据所述第一相关性结果中预测力和相关性符合预设要求的第一候选标签,为待处理用户数据的确定标签的步骤,包括:将所述第一相关性结果中预测力和相关性分别满足对应预设阈值的第一候选标签,确定为待处理用户数据的标签。
4.根据权利要求2所述的就去,其特征在于,根据所述第一相关性结果中预测力和相关性符合预设要求的第一候选标签,为待处理用户数据的确定标签的步骤,包括:
将所述第一相关性结果中预测力和相关性符合预设要求的第一候选标签发送至所述终端;
接收所述终端发送的选定标签,所述标签通过用户从所述第一候选标签中筛选得到。
5.根据权利要求1至4任意一项所述的方法,其特征在于,所述标签确定方法还包括:
获取基于标签和用户数据,为用户进行产品推荐所反馈的产品推荐转化情况;
根据所述转化情况,调整标签,以根据调整后的标签进行产品推荐。
6.根据权利要求5所述的方法,其特征在于,根据所述转化情况,调整标签的步骤,包括:
获取所述用户数据中完成预设转化行为的代表用户数据;
根据所述代表用户数据,调整所述标签。
7.根据权利要求6所述的方法,其特征在于,所述根据所述代表用户数据,调整所标签的步骤,包括:
计算所述代表用户数据与各候选标签的第二相关性结果;
根据所述第二相关性结果符合预设要求的第二候选标签,为所述用户数据更新标签。
8.一种标签确定装置,其特征在于,所述装置包括:
数据获取模块,用于获取终端上传的待处理用户数据中具有代表性的样本用户数据;
相关性分析模块,用于计算所述样本用户数据与各候选标签的第一相关性结果;
标签确定模块,用于根据所述第一相关性结果符合预设要求的候选标签,为待处理用户数据确定标签。
9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。
CN201910003477.8A 2019-01-03 2019-01-03 标签确定方法、装置、计算机设备和存储介质 Pending CN109801101A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910003477.8A CN109801101A (zh) 2019-01-03 2019-01-03 标签确定方法、装置、计算机设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910003477.8A CN109801101A (zh) 2019-01-03 2019-01-03 标签确定方法、装置、计算机设备和存储介质

Publications (1)

Publication Number Publication Date
CN109801101A true CN109801101A (zh) 2019-05-24

Family

ID=66558431

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910003477.8A Pending CN109801101A (zh) 2019-01-03 2019-01-03 标签确定方法、装置、计算机设备和存储介质

Country Status (1)

Country Link
CN (1) CN109801101A (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110609935A (zh) * 2019-08-29 2019-12-24 湖南草花互动网络科技有限公司 用户身份标签生成方法、装置、计算机设备和存储介质
CN110751533A (zh) * 2019-09-09 2020-02-04 上海陆家嘴国际金融资产交易市场股份有限公司 产品画像生成方法、装置、计算机设备和存储介质
CN111538905A (zh) * 2020-04-29 2020-08-14 中国银行股份有限公司 一种对象的推荐方法及装置
CN112802603A (zh) * 2021-02-04 2021-05-14 北京深演智能科技股份有限公司 预测流感程度的方法和装置
CN115495042A (zh) * 2022-11-03 2022-12-20 深圳市云积分科技有限公司 人群标签的选择方法及装置、存储介质、电子设备
CN115564501A (zh) * 2022-11-29 2023-01-03 深圳市云积分科技有限公司 获取目标人群的方法、计算机设备和计算机可读存储介质

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103177093A (zh) * 2013-03-13 2013-06-26 北京开心人信息技术有限公司 一种基于对象标签的通用推荐方法及系统
CN104750789A (zh) * 2015-03-12 2015-07-01 百度在线网络技术(北京)有限公司 标签的推荐方法及装置
US9245271B1 (en) * 2007-05-18 2016-01-26 Amazon Technologies, Inc. Tag scoring for elements associated with a common tag
WO2017219548A1 (zh) * 2016-06-20 2017-12-28 乐视控股(北京)有限公司 用户属性预测方法及装置
CN107688637A (zh) * 2017-08-23 2018-02-13 广东欧珀移动通信有限公司 信息推送方法、装置、存储介质及电子终端
CN107833082A (zh) * 2017-09-15 2018-03-23 广州唯品会研究院有限公司 一种商品图片的推荐方法和装置
CN108038120A (zh) * 2017-11-01 2018-05-15 平安科技(深圳)有限公司 协同过滤推荐方法、电子设备及计算机可读存储介质
CN108629608A (zh) * 2017-03-22 2018-10-09 腾讯科技(深圳)有限公司 用户数据处理方法及装置
CN108711110A (zh) * 2018-08-14 2018-10-26 中国平安人寿保险股份有限公司 保险产品推荐方法、装置、计算机设备和存储介质

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9245271B1 (en) * 2007-05-18 2016-01-26 Amazon Technologies, Inc. Tag scoring for elements associated with a common tag
CN103177093A (zh) * 2013-03-13 2013-06-26 北京开心人信息技术有限公司 一种基于对象标签的通用推荐方法及系统
CN104750789A (zh) * 2015-03-12 2015-07-01 百度在线网络技术(北京)有限公司 标签的推荐方法及装置
WO2017219548A1 (zh) * 2016-06-20 2017-12-28 乐视控股(北京)有限公司 用户属性预测方法及装置
CN108629608A (zh) * 2017-03-22 2018-10-09 腾讯科技(深圳)有限公司 用户数据处理方法及装置
CN107688637A (zh) * 2017-08-23 2018-02-13 广东欧珀移动通信有限公司 信息推送方法、装置、存储介质及电子终端
CN107833082A (zh) * 2017-09-15 2018-03-23 广州唯品会研究院有限公司 一种商品图片的推荐方法和装置
CN108038120A (zh) * 2017-11-01 2018-05-15 平安科技(深圳)有限公司 协同过滤推荐方法、电子设备及计算机可读存储介质
CN108711110A (zh) * 2018-08-14 2018-10-26 中国平安人寿保险股份有限公司 保险产品推荐方法、装置、计算机设备和存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
吴小兰;章成志;: "结合用户关系网和标签共现网的微博用户标签推荐研究", 情报学报, vol. 978, no. 05, pages 126 *

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110609935A (zh) * 2019-08-29 2019-12-24 湖南草花互动网络科技有限公司 用户身份标签生成方法、装置、计算机设备和存储介质
CN110751533A (zh) * 2019-09-09 2020-02-04 上海陆家嘴国际金融资产交易市场股份有限公司 产品画像生成方法、装置、计算机设备和存储介质
CN110751533B (zh) * 2019-09-09 2022-11-15 未鲲(上海)科技服务有限公司 产品画像生成方法、装置、计算机设备和存储介质
CN111538905A (zh) * 2020-04-29 2020-08-14 中国银行股份有限公司 一种对象的推荐方法及装置
CN111538905B (zh) * 2020-04-29 2023-10-20 中国银行股份有限公司 一种对象的推荐方法及装置
CN112802603A (zh) * 2021-02-04 2021-05-14 北京深演智能科技股份有限公司 预测流感程度的方法和装置
CN115495042A (zh) * 2022-11-03 2022-12-20 深圳市云积分科技有限公司 人群标签的选择方法及装置、存储介质、电子设备
CN115564501A (zh) * 2022-11-29 2023-01-03 深圳市云积分科技有限公司 获取目标人群的方法、计算机设备和计算机可读存储介质

Similar Documents

Publication Publication Date Title
CN109783730A (zh) 产品推荐方法、装置、计算机设备和存储介质
CN109493199A (zh) 产品推荐方法、装置、计算机设备和存储介质
CN109345302B (zh) 机器学习模型训练方法、装置、存储介质和计算机设备
US11663663B2 (en) Image analysis and identification using machine learning with output estimation
CN109801101A (zh) 标签确定方法、装置、计算机设备和存储介质
CN110598845B (zh) 数据处理方法、装置、计算机设备和存储介质
CN108885624B (zh) 信息推荐系统及方法
CN110008397B (zh) 一种推荐模型训练方法及装置
US20210056458A1 (en) Predicting a persona class based on overlap-agnostic machine learning models for distributing persona-based digital content
CN109961080B (zh) 终端识别方法及装置
US10783580B2 (en) Image analysis and identification using machine learning with output personalization
US10762562B2 (en) Database image matching using machine learning with output personalization
US20190279263A1 (en) Database image matching using machine learning with output estimation
CN110335064A (zh) 产品推送方法、装置、计算机设备和存储介质
US20230342797A1 (en) Object processing method based on time and value factors
CN113761348A (zh) 一种信息推荐方法、装置、电子设备和存储介质
CN115271886A (zh) 金融产品的推荐方法及装置、存储介质、电子设备
CN113706211A (zh) 基于神经网络的广告点击率预测方法及系统
CN111161009B (zh) 信息推送方法、装置、计算机设备和存储介质
CN112685639A (zh) 活动推荐方法、装置、计算机设备和存储介质
CN111768218A (zh) 用于处理用户交互信息的方法和装置
CN115222112A (zh) 一种行为预测方法、行为预测模型的生成方法及电子设备
CN110837596B (zh) 一种智能推荐方法、装置、计算机设备及存储介质
CN114240553A (zh) 车辆保险产品的推荐方法、装置、设备及存储介质
CN114219184A (zh) 产品交易数据预测方法、装置、设备、介质和程序产品

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination