CN111105117B - 一种用户信息的确定方法和装置 - Google Patents

一种用户信息的确定方法和装置 Download PDF

Info

Publication number
CN111105117B
CN111105117B CN201811264466.7A CN201811264466A CN111105117B CN 111105117 B CN111105117 B CN 111105117B CN 201811264466 A CN201811264466 A CN 201811264466A CN 111105117 B CN111105117 B CN 111105117B
Authority
CN
China
Prior art keywords
data
user
label
term
determining
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811264466.7A
Other languages
English (en)
Other versions
CN111105117A (zh
Inventor
刘莹
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Weimeng Chuangke Network Technology China Co Ltd
Original Assignee
Weimeng Chuangke Network Technology China Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Weimeng Chuangke Network Technology China Co Ltd filed Critical Weimeng Chuangke Network Technology China Co Ltd
Priority to CN201811264466.7A priority Critical patent/CN111105117B/zh
Publication of CN111105117A publication Critical patent/CN111105117A/zh
Application granted granted Critical
Publication of CN111105117B publication Critical patent/CN111105117B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/067Enterprise or organisation modelling
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Strategic Management (AREA)
  • Engineering & Computer Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Economics (AREA)
  • Game Theory and Decision Science (AREA)
  • Educational Administration (AREA)
  • Development Economics (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明实施例提供了一种用户信息的确定方法和装置,所述方法包括:获取多个用户的行为数据;根据任一用户的行为数据确定该用户的短期情景标签,所述短期情景标签表示用户当前生活的行为信息;根据所述短期情景标签确定该用户的长期情景标签,所述长期情景标签表示用户人生阶段的状态信息;确定该用户的长期情景标签对应的评价等级,并根据所述评价等级进行等级优化。通过本技术方案,能够准确地确定用户从短期到中长期各种粒度的标签,建立完整的商业情景标签体系,提升用户体验。

Description

一种用户信息的确定方法和装置
技术领域
本发明涉及计算机技术领域,尤其涉及一种用户信息的确定方法和装置。
背景技术
在移动互联网时代,用户的商业情景标签体系,蕴含着丰富的商业价值,能快速应对多样的商业需求。而商业情景标签,是真实用户在商业场景下,具有时空属性的虚拟代表,是建立在一系列真实用户数据上的商业目标用户模型。有了用户的商业情景标签,有利于使相关人员更有针对性的将关注点放在用户的行为动机和思考模式上,丰富对目标用户群体行为的理解;从而有利于快速、高效应满足短期商业需求。而如何建立完整的商业情景标签体系,是急需解决的问题。
发明内容
本发明实施例提供一种用户信息的确定方法和装置,能够准确地确定用户从短期到中长期各种粒度的标签,建立完整的商业情景标签体系,提升用户体验。
一方面,本发明实施例提供了一种用户信息的确定方法,应用在信息服务器端,包括:获取多个用户的行为数据;根据任一用户的行为数据确定该用户的短期情景标签,所述短期情景标签表示用户当前生活的行为信息;根据所述短期情景标签确定该用户的长期情景标签,所述长期情景标签表示用户人生阶段的状态信息;确定该用户的长期情景标签对应的评价等级,并根据所述评价等级进行等级优化。
另一方面,本发明实施例提供了一种用户信息的确定装置,应用在信息服务器,包括:第一获取单元,获取多个用户的行为数据;第一确定单元,根据任一用户的行为数据确定该用户的短期情景标签,所述短期情景标签表示用户当前生活的行为信息;第二确定单元,根据所述短期情景标签确定该用户的长期情景标签,所述长期情景标签表示用户人生阶段的状态信息;第三确定单元,确定该用户的长期情景标签对应的评价等级,并根据所述评价等级进行等级优化。
上述技术方案具有如下有益效果:根据用户行为数据确定用户的短期情景标签、用户的长期情景标签以及长期情景标签对应的评价等级,并根据评价等级进行等级优化,从而建立完整的商业情景标签以及商业情景标签体系,同时,赋予了该体系可持续优化的方法和方向,进而给用户带来更多的良好体验,为很多上层应用有重要的价值和作用。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明一实施例中的一种用户信息的确定方法的流程图;
图2为本发明一优选实施例中的评价等级进行等级优化的流程图;
图3为本发明另一实施例中的一种用户信息的确定装置的结构示意图;
图4为本发明另一优选实施例中的第三确定单元的结构示意图;
图5为本发明一优选实施例中评价等级的示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
如图1所示,为本发明一实施例中一种用户信息的确定方法,应用在信息服务器,包括:
101:获取多个用户的行为数据。
102:根据任一用户的行为数据确定该用户的短期情景标签,短期情景标签表示用户当前生活的行为信息。
103:根据短期情景标签确定该用户的长期情景标签,长期情景标签表示用户人生阶段的状态信息。
104:确定该用户的长期情景标签对应的评价等级,并根据评价等级进行等级优化。
优选地,获取多个用户的行为数据,包括:接收多个用户中各用户的业务客户端分别记录的行为数据;或接收业务服务器转发的多个用户的行为数据。
优选地,行为数据包括:位置数据、参与话题数据、参与内容互动数据以及应用程序使用数据;其中,参与话题数据包括参与话题类型数据,参与内容互动数据包括参与互动内容类型数据、互动行为数据、互动次数数据,应用程序使用数据包括应用程序类型数据以及应用程序使用行为数据。
其中,根据行为数据确定用户的短期情景标签,包括:分别统计该用户的位置数据、参与话题数据、参与内容互动数据以及应用程序使用数据;将出现次数大于第一次数阈值的位置数据作为位置情景标签;将参与次数大于第二次数阈值的参与话题数据作为话题情景标签;直接将统计后的参与内容互动数据或将互动次数符合第一预置条件的参与内容互动数据作为互动情景标签;将使用次数符合第二预置条件的应用程序使用数据作为APP使用情景标签;其中,所述短期情景标签包括位置情景标签、话题情景标签、互动情景标签以及APP使用情景标签。优选地,该方法进一步包括:获取多个用户的属性数据;
其中,根据短期情景标签确定该用户的长期情景标签,长期情景标签表示用户人生阶段的状态信息,包括:针对该用户的属性数据,将短期情景标签与预置标签进行关联,从预置标签中选出长期情景标签。
优选地,如图2所示,确定该用户的长期情景标签对应的评价等级,并根据评价等级进行等级优化,包括:201:当通过预置预测算法,将短期情景标签与预置标签进行关联从预置标签中选出长期情景标签,则确定评价等级为案例等级;202:获取该用户的认证数据,当认证数据与长期情景标签对应,则评价等级优化为真实等级;203:根据真实等级,向业务客户端发送媒体数据,并根据业务客户端返回对媒体数据的查看状态,确定该用户的兴趣标签,使得评价等级由真实等级优化到效果等级。
优选地,该方法进一步包括:当未获取到该用户的认证数据,则通过预置分类算法,将该用户进行分类;当分类结果与长期情景标签对应,则评价等级优化为真实等级。
如图3所示,为本发明另一实施例中一种用户信息的确定装置,应用在信息服务器,包括:
第一获取单元31,获取多个用户的行为数据。
第一确定单元32,根据任一用户的行为数据确定该用户的短期情景标签,所述短期情景标签表示用户当前生活的行为信息。
第二确定单元33,根据所述短期情景标签确定该用户的长期情景标签,所述长期情景标签表示用户人生阶段的状态信息。
第三确定单元34,确定该用户的长期情景标签对应的评价等级,并根据所述评价等级进行等级优化。
优选地,第一获取单元31,接收多个用户中各用户的业务客户端分别记录的行为数据;或接收业务服务器转发的多个用户的行为数据。
优选地,行为数据包括:位置数据、参与话题数据、参与内容互动数据以及应用程序使用数据;
其中,第一确定单元32,分别统计该用户的位置数据、参与话题数据、参与内容互动数据以及应用程序使用数据,将出现次数大于第一次数阈值的位置数据作为位置情景标签;将参与次数大于第二次数阈值的参与话题数据作为话题情景标签;直接将统计后的参与内容互动数据或将互动次数符合第一预置条件的参与内容互动数据作为互动情景标签;将使用次数符合第二预置条件的应用程序使用数据作为APP使用情景标签;其中,所述短期情景标签包括位置情景标签、话题情景标签、互动情景标签以及APP使用情景标签。
优选地,该装置还包括:第二获取单元,获取多个用户的属性数据;其中,第二确定单元33,针对该用户的属性数据,将短期情景标签与预置标签进行关联,从预置标签中选出长期情景标签。
优选地,如图4所示,第三确定单元34包括:第一确定模块41,当通过预置预测算法,将短期情景标签与预置标签进行关联从预置标签中选出长期情景标签,则确定评价等级为案例等级;优化模块42,获取该用户的认证数据,当认证数据与长期情景标签对应,则评价等级优化为真实等级;第二确定模块43,根据真实等级,向业务客户端发送媒体数据,并根据业务客户端返回对所述媒体数据的查看状态,确定该用户的兴趣标签,使得评价等级由真实等级优化到效果等级。
优选地,第三确定单元34还包括:分类模块44,当未获取到该用户的认证数据,则通过预置分类算法,将该用户进行分类;以及,优化模块42,当分类结果与长期情景标签对应,则评价等级优化为真实等级。
本发明实施例上述技术方案具有如下有益效果:根据用户行为数据确定用户的短期情景标签、用户的长期情景标签以及长期情景标签对应的评价等级,并根据评价等级进行等级优化,从而建立完整的商业情景标签以及商业情景标签体系,同时,赋予了该体系可持续优化的方法和方向,进而给用户带来更多的良好体验,为很多上层应用有重要的价值和作用。
以下结合应用实例对本发明实施例上述技术方案进行详细说明:
本发明应用实例旨是能够准确地确定用户从短期到中长期各种粒度的标签,提升用户体验。
如图1所示,例如,用户通过网络在移动终端上下载了业务客户端,如微博app,并对该app进行授权获取一些信息,如,用户的位置信息、应用程序使用信息等,用户注册并使用了该app,该app将用户注册的信息发送至业务服务器,如微博服务器,微博服务器将该注册的信息发送至情景引擎服务器,用户还可以通过微博app查看微博信息或参与微博话题、参与微博内容,微博服务器将该用户参与微博话题数据、参与微博内容互动数据以及查看的微博信息转发至情景引擎服务器,从而使得情景引擎服务器收集到用户的各种行为数据以及用户属性数据,其中,用户属性数据,可以包括,年龄、注册邮箱、关注账号列表,其中,行为数据可以包括,LBS位置数据(Location Based Service)等;然后,情景引擎服务器通过统计以上数据,特别是位置数据,得到用户在7-9月/2-3月常住地LBS数据与其他月份不同,常住地POI(Point of Interest)点为大学,登陆邮箱是学校邮箱后缀、关注账号列表为大学相关账号(如四六级、大学官方微博、考研账号等)且登陆频率较高,根据统计的信息,得到短期情景标签,从而可以从长期情景标签中选出可能性较高的预置标签“大学生”,根据加权平均算法得到分数,作为判断是否为大学生的标准,如果分数大于阈值,则为大学生。
接下来,由于以上做法使得长期情景标签“大学生”的评价层级停留在案例case级,即只能通过用户的行为数据以及用户属性数据来判断该用户是否真的为大学生,要进一步将案例级进行优化,需要获取能100%确定的认证数据,如得到学信网的数据,或支付宝校园用户认证的数据,作为标注数据,将案例级优化为真实等级;或者,采用有监督的机器学习算法,用户的行为数据作为特征,采用逻辑回归LR、全称梯度下降树GBDT+逻辑回归LR、因子分解机FM等机器学习算法,得到用户是为大学生的分数值,当该分数值大于阈值,则可认证该用户为大学生,完成了一次评价级的优化,由案例级优化为真实等级。
其中,短期情景标签表示用户当前生活的行为信息,短期情景标签可以包括,位置情景标签、话题情景标签、微博互动情景标签以及APP使用情景标签。
其中,位置情景标签可以为用户常住地、工作地、商圈等位置情景标签;话题情景标签可以为用户偏好的微博话题类别等话题情景标签;微博互动情景标签可以为用户偏好的博文类别、偏好的微博互动行为、微博互动频率等微博互动情景标签;APP使用情景标签可以为用户偏好的app类别、偏好的app行为等app使用情景标签。
统计用户LBS地理位置,得到用户周期性的地理位置信息,从而提取出或确定出用户常住地、工作地、商圈等位置情景标签;统计用户参与过的微博话题,从而提取出或确定出用户对微博类别话题的偏好等话题情景标签;统计用户互动过的博文,从而提取出或确定出用户对类别博文的偏好、微博互动行为偏好、微博互动频率等微博互动情景标签;统计用户安装的app列表及安装、卸载时间,从而提取出或确定出用户对类别app的偏好、app行为偏好等app使用情景标签。
长期情景标签表示用户人生阶段的状态信息,可以包括求学状态、婚恋状态、育儿状态、职业状态、房车状态以及旅游状态。其中,求学状态可以为初中以下、高中、大学以及研究生以上,婚恋状态可以为单身、恋爱未婚以及已婚,育儿状态可以为准父母以及婴幼儿父母,职业状态可以为求职中、白领以及高管,房车状态可以为经济型车、中档车、豪华车、准备购房等,旅游状态可以为正在旅行、刚旅游归来、高端商旅、常飞国外。
如图5所示,评价等级分为逻辑logic等级、案例case等级、真实ground truth等级、效果等级。逻辑logic等级对应的数据为恋爱能力以及消费能力的数据,案例case等级对应的数据为旅游状态、常驻地域以及商圈情景的数据,真实ground truth等级对应的数据为性别、年龄、求学状态以及孕育状态的数据、效果等级对应的数据为兴趣标签的数据。
其中,效果等级:可以直接对商业效果负责,有完整的优化闭环,易于验证。这一层级有成熟的机器学习挖掘算法和评价指标、方法,位于这一层级的标签是最成熟,能直接产生商业价值的。真实Ground Truth等级:有真实,可验证的,100%准备的标注数据。这一层级有成熟的机器学习挖掘算法和评价指标、方法,后续的优化依赖更多更可靠的标注数据。案例Case等级:只能具体案例具体分析,没有统一的判断标准。这一层级往往不能以机器学习算法为主要方法,难以实现效果评价和优化。逻辑Logic等级:几乎无法验证,只能推断。这一层级也不能以机器学习算法为主要方法,难以实现效果评价和优化。
用户的行为数据包括:微博行为:关注、转发、评论、赞、收藏、取关、发博、搜索词keyword、参与话题名称、登陆环境wifi或4G等;app安装数据:app安装记录、app卸载记录、搜索行为、app主页关注记录等;广告行为:广告的点击、负反馈、关注广告主、参与广告页面跳转等;分组信息:用户对关注人设置的分组信息;LBS数据:用户LBS数据,包括当前位置、周期性位置、位置变动等。
需要说明的是,本技术方案可以应用在一个物理实体服务器设备上,也可以应用在多个物理实体服务器设备上即服务器集群。
本技术方案根据用户行为数据确定用户的短期情景标签、用户的长期情景标签以及长期情景标签对应的评价等级,并根据评价等级进行等级优化,从而建立完整的商业情景标签以及商业情景标签体系,同时,赋予了该体系可持续优化的方法和方向,进而给用户带来更多的良好体验,为很多上层应用有重要的价值和作用。
在一些实例中,获取多个用户的行为数据,包括:接收多个用户中各用户的业务客户端分别记录的行为数据;或接收业务服务器转发的多个用户的行为数据。
例如,根据前文所述,用户通过网络在移动终端上下载了业务客户端,如微博app,并对该app进行授权获取一些信息,如,位置信息、应用程序使用信息等,微博app记录位置信息以及应用程序使用信息到日志中,将该日志发送至情景引擎服务器。
用户注册并使用了该微博app,该微博app将用户注册的信息发送至业务服务器,如微博服务器,微博服务器将该注册的信息发送至情景引擎服务器,用户还可以通过微博app查看微博信息或参与微博话题、参与微博内容,微博服务器将该用户参与话题数据、参与内容互动数据以及查看的微博信息转发至情景引擎服务器。
在一些实例中,行为数据包括:位置数据、参与话题数据、参与内容互动数据以及应用程序使用数据;其中,根据任一用户的行为数据确定该用户的短期情景标签,包括:分别统计该用户的位置数据、参与话题数据、参与内容互动数据以及应用程序使用数据,将出现次数大于第一次数阈值的位置数据作为位置情景标签;将参与次数大于第二次数阈值的参与话题数据作为话题情景标签;直接将统计后的参与内容互动数据或将互动次数符合第一预置条件的参与内容互动数据作为互动情景标签;将使用次数符合第二预置条件的应用程序使用数据作为APP使用情景标签;其中,所述短期情景标签包括位置情景标签、话题情景标签、互动情景标签以及APP使用情景标签。
具体地,分别统计该用户的位置数据、参与话题类型数据、参与内容互动数据以及应用程序使用数据;将出现次数大于位置次数阈值的位置数据作为位置情景标签;将参与次数大于参与次数阈值的参与话题类型作为话题情景标签;将互动次数大于互动次数阈值的参与互动内容类型、出现次数大于行为次数阈值的互动行为以及预置时间内的互动次数作为互动情景标签(即微博互动情景标签);将安装次数大于安装次数阈值的应用程序类型以及将使用行为次数大于使用次数阈值的应用程序使用行为作为APP使用情景标签;其中,所述短期情景标签包括位置情景标签、话题情景标签、微博互动情景标签以及APP使用情景标签。
其中,第一预置条件可以包括:互动次数大于互动次数阈值的参与互动内容类型、出现次数大于行为次数阈值的互动行为。
第二预置条件可以包括:安装次数大于安装次数阈值的应用程序类型以及将使用行为次数大于使用次数阈值的应用程序使用行为。
例如,根据前文所述,短期情景标签包括,位置情景标签、话题情景标签、微博互动情景标签以及APP使用情景标签,位置情景标签可以为用户常住地、工作地、商圈等位置情景标签(即位置数据);话题情景标签可以为用户偏好的微博话题类别等话题情景标签(即参与话题类型数据);微博互动情景标签可以为用户偏好的微博类别博文、偏好的微博互动行为、微博互动频率等微博互动情景标签(即参与内容互动数据);APP使用情景标签可以为用户偏好的app类别、偏好的app行为等app使用情景标签(即应用程序使用数据)。
统计用户LBS地理位置,即每个地理位置出现的次数,从而得到用户周期性的地理位置,根据统计出的次数(如,最多次数或高于阈值次数)与地理位置对应的时间,确定出用户常住地、工作地、商圈等,如,用户每天9:00am以后出现在xx写字楼,且xx写字楼的次数为一个月20次,高于阈值10次,则认定xx写字楼为工作地;统计用户参与过的微博话题,即参与的每个类型微博话题的次数,根据一个类型微博话题的次数,如,最多的话题次数或高于次数阈值,确定用户对微博类别话题的偏好等;统计用户互动过的博文,即每个类型互动博文的互动次数,统计微博互动行为(如点赞,留言)偏好,即每个微博互动行为的次数,统计微博互动频率,即每次微博互动的互动时间,根据每个类型互动博文的互动次数,如,类型博文的最多的互动次数或高于次数阈值,确定用户对博文类别的偏好,根据每个微博互动行为的次数,如,最多的互动行为的次数或高于次数阈值,确定微博互动行为偏好,根据一定时间内的统计微博互动次数,确定微博互动频率等;统计用户安装的app列表及安装、卸载时间,根据用户安装的app的分类,确定用户对类别app的偏好,根据用户使用app的行为(如,安装app行为)的次数或高于次数阈值,确定app行为偏好等。
在一些实例中,该方法进一步包括:获取多个用户的属性数据。
其中,根据短期情景标签确定该用户的长期情景标签包括:针对该用户的属性数据,将短期情景标签与预置标签进行关联,从预置标签中选出长期情景标签。
将一个用户的短期情景进行长期的积累,挖掘得到一个用户的长期情景标签,称之为人生状态标签,如:求学状态、婚恋状态、育儿状态、职业状态、房车状态、旅行状态、生活态度状态等。
其中,用户的人生状态标签体系需要按照以下原则建立:
1)反映了用户的商业需求、体现用户商业价值、反映用户商业消费能力;
2)分布性原则:a)标签覆盖的用户量不能太少;b)标签对用户的划分具有较高的区分度,标签之间相似度低;c)标签涉及的商业领域扩展性较强;
3)含义明确:标签名称的含义必须符合一般认知,不具有歧义。
用户属性数据是指用户的个人属性信息,包括:性别、年龄、登陆邮箱、关注账号列表、地域、手机型号等。
例如,根据前文所述,可以根据用户的年龄,确定该用户可能的至少一个长期情景标签,如,该用户的短期情景标签是位置情景标签,如,用户在7-9月/2-3月常住地LBS数据与其他月份不同,常住地POI(Point of Interest)点为大学,且该用户20岁,那么可以确定该用户的长期情景标签倾向于可能是求学状态中的大学生而不是职业状态中的老师。
在一些实例中,如图2所示,确定该用户的长期情景标签对应的评价等级,并根据评价等级进行等级优化,包括:201:当通过预置预测算法,将短期情景标签与预置标签进行关联从预置标签中选出长期情景标签,则确定评价等级为案例等级;202:获取该用户的认证数据,当认证数据与长期情景标签对应,则评价等级优化为真实等级;203:根据真实等级,向业务客户端发送媒体数据,并根据业务客户端返回对媒体数据的查看状态,确定该用户的兴趣标签,使得评价等级由真实等级优化到效果等级。
其中,预置预测算法为加权平均算法。
媒体数据可以为广告、视频、微博内容等。
例如,根据前文所述,当通过用户的短期情景标签以及用户的属性数据,来确定长期情景标签倾向于可能为求学状态“大学生”时,可以通过加权平均算法对该用户是大学生的概率进行计算,如将用户的短期情景标签对应的数据以及用户属性数据与各自对应的权重进行求乘积,将各个乘积进行求和,确定该总和对应的平均值,得到该用户为大学生的概率,当大学生的概率大于阈值时,则确定该用户为大学生,那么此时确定该评价等级为案例case等级,因为没有认证数据支持,为了将该案例case等级优化至真实Ground Truth等级,需要获取该用户的认证数据,如从学信网获取到的数据,或从支付宝校园获取到用户认证的数据,作为标注数据,如用户认证为大学生,则该案例case等级优化至真实Ground Truth等级,当确定用户的长期情景标签为大学生且是真实Ground Truth等级评价等级,则向该用户的微博app发送书籍的广告,如果该用户通过微博app点击查看了该广告乃至购买了书籍,则微博app向微博服务器发送该广告被查看的状态信息以及用户通过该广告进行线上购物的信息,从而确定用户的兴趣标签,如读书,则评价等级由真实Ground Truth等级优化到效果等级。
在一些实例中,该方法进一步包括:当未获取到该用户的认证数据,则通过预置分类算法,将该用户进行分类;当分类结果与长期情景标签对应,则评价等级优化为真实等级。
预置分类算法是用来对用户进行分类,从而确定其长期情景标签,如逻辑回归LR、全称梯度下降树GBDT+逻辑回归LR、因子分解机FM等机器学习算法。还可以通过交叉验证cross validation指标、auc曲线下的面积指标、prc精度召回率曲线指标等对机器学习算法得出的长期情景标签进行验证。
例如,根据前文所述,若未获取到该用户的认证数据,则可以通过预置分类算法去对用户进行分类,如将用户的短期情景标签对应的数据以及用户属性数据输入至逻辑回归LR模型,以使逻辑回归LR模型对用户进行分类,得到分类结果为大学生,可以通过交叉验证cross validation指标对该大学生的分类结果进行验证,当大学生的分类结果的概率大于阈值时,则确定该用户为大学生,那么该评价等级由案例case等级优化至真实GroundTruth等级。
本发明实施例提供了一种用户信息的确定装置,可以实现上述提供的方法实施例,具体功能实现请参见方法实施例中的说明,在此不再赘述。
应该明白,公开的过程中的步骤的特定顺序或层次是示例性方法的实例。基于设计偏好,应该理解,过程中的步骤的特定顺序或层次可以在不脱离本公开的保护范围的情况下得到重新安排。所附的方法权利要求以示例性的顺序给出了各种步骤的要素,并且不是要限于所述的特定顺序或层次。
在上述的详细描述中,各种特征一起组合在单个的实施方案中,以简化本公开。不应该将这种公开方法解释为反映了这样的意图,即,所要求保护的主题的实施方案需要比清楚地在每个权利要求中所陈述的特征更多的特征。相反,如所附的权利要求书所反映的那样,本发明处于比所公开的单个实施方案的全部特征少的状态。因此,所附的权利要求书特此清楚地被并入详细描述中,其中每项权利要求独自作为本发明单独的优选实施方案。
为使本领域内的任何技术人员能够实现或者使用本发明,上面对所公开实施例进行了描述。对于本领域技术人员来说;这些实施例的各种修改方式都是显而易见的,并且本文定义的一般原理也可以在不脱离本公开的精神和保护范围的基础上适用于其它实施例。因此,本公开并不限于本文给出的实施例,而是与本申请公开的原理和新颖性特征的最广范围相一致。
上文的描述包括一个或多个实施例的举例。当然,为了描述上述实施例而描述部件或方法的所有可能的结合是不可能的,但是本领域普通技术人员应该认识到,各个实施例可以做进一步的组合和排列。因此,本文中描述的实施例旨在涵盖落入所附权利要求书的保护范围内的所有这样的改变、修改和变型。此外,就说明书或权利要求书中使用的术语“包含”,该词的涵盖方式类似于术语“包括”,就如同“包括,”在权利要求中用作衔接词所解释的那样。此外,使用在权利要求书的说明书中的任何一个术语“或者”是要表示“非排它性的或者”。
本领域技术人员还可以了解到本发明实施例列出的各种说明性逻辑块(illustrative logical block),单元,和步骤可以通过电子硬件、电脑软件,或两者的结合进行实现。为清楚展示硬件和软件的可替换性(interchangeability),上述的各种说明性部件(illustrative components),单元和步骤已经通用地描述了它们的功能。这样的功能是通过硬件还是软件来实现取决于特定的应用和整个系统的设计要求。本领域技术人员可以对于每种特定的应用,可以使用各种方法实现所述的功能,但这种实现不应被理解为超出本发明实施例保护的范围。
本发明实施例中所描述的各种说明性的逻辑块,或单元都可以通过通用处理器,数字信号处理器,专用集成电路(ASIC),现场可编程门阵列或其它可编程逻辑装置,离散门或晶体管逻辑,离散硬件部件,或上述任何组合的设计来实现或操作所描述的功能。通用处理器可以为微处理器,可选地,该通用处理器也可以为任何传统的处理器、控制器、微控制器或状态机。处理器也可以通过计算装置的组合来实现,例如数字信号处理器和微处理器,多个微处理器,一个或多个微处理器联合一个数字信号处理器核,或任何其它类似的配置来实现。
本发明实施例中所描述的方法或算法的步骤可以直接嵌入硬件、处理器执行的软件模块、或者这两者的结合。软件模块可以存储于RAM存储器、闪存、ROM存储器、EPROM存储器、EEPROM存储器、寄存器、硬盘、可移动磁盘、CD-ROM或本领域中其它任意形式的存储媒介中。示例性地,存储媒介可以与处理器连接,以使得处理器可以从存储媒介中读取信息,并可以向存储媒介存写信息。可选地,存储媒介还可以集成到处理器中。处理器和存储媒介可以设置于ASIC中,ASIC可以设置于用户终端中。可选地,处理器和存储媒介也可以设置于用户终端中的不同的部件中。
在一个或多个示例性的设计中,本发明实施例所描述的上述功能可以在硬件、软件、固件或这三者的任意组合来实现。如果在软件中实现,这些功能可以存储与电脑可读的媒介上,或以一个或多个指令或代码形式传输于电脑可读的媒介上。电脑可读媒介包括电脑存储媒介和便于使得让电脑程序从一个地方转移到其它地方的通信媒介。存储媒介可以是任何通用或特殊电脑可以接入访问的可用媒体。例如,这样的电脑可读媒体可以包括但不限于RAM、ROM、EEPROM、CD-ROM或其它光盘存储、磁盘存储或其它磁性存储装置,或其它任何可以用于承载或存储以指令或数据结构和其它可被通用或特殊电脑、或通用或特殊处理器读取形式的程序代码的媒介。此外,任何连接都可以被适当地定义为电脑可读媒介,例如,如果软件是从一个网站站点、服务器或其它远程资源通过一个同轴电缆、光纤电缆、双绞线、数字用户线(DSL)或以例如红外、无线和微波等无线方式传输的也被包含在所定义的电脑可读媒介中。所述的碟片(disk)和磁盘(disc)包括压缩磁盘、镭射盘、光盘、DVD、软盘和蓝光光盘,磁盘通常以磁性复制数据,而碟片通常以激光进行光学复制数据。上述的组合也可以包含在电脑可读媒介中。
以上所述的具体实施方式,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施方式而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (8)

1.一种用户信息的确定方法,其特征在于,应用在信息服务器端,包括:
获取多个用户的行为数据;
获取所述多个用户的属性数据;
根据任一用户的行为数据确定该用户的短期情景标签,所述短期情景标签表示用户当前生活的行为信息;
根据所述短期情景标签确定该用户的长期情景标签,所述长期情景标签表示用户人生阶段的状态信息;
确定该用户的长期情景标签对应的评价等级,并根据所述评价等级进行等级优化;
其中,所述根据所述短期情景标签确定该用户的长期情景标签,包括:
针对该用户的属性数据,将短期情景标签与预置标签进行关联,从预置标签中选出长期情景标签;
所述确定该用户的长期情景标签对应的评价等级,并根据所述评价等级进行等级优化,包括:
当通过预置预测算法,将所述短期情景标签与预置标签进行关联并从预置标签中选出长期情景标签,则确定所述评价等级为案例等级;
获取该用户的认证数据,当所述认证数据与所述长期情景标签对应,则所述评价等级优化为真实等级;
根据所述真实等级,向业务客户端发送媒体数据,并根据所述业务客户端返回对所述媒体数据的查看状态,确定该用户的兴趣标签,使得所述评价等级由真实等级优化到效果等级。
2.根据权利要求1所述的方法,其特征在于,所述获取多个用户的行为数据,包括:
接收所述多个用户中各用户的业务客户端分别记录的行为数据;或
接收业务服务器转发的所述多个用户的行为数据。
3.根据权利要求1或2所述的方法,其特征在于,所述行为数据包括:位置数据、参与话题数据、参与内容互动数据以及应用程序使用数据;
其中,所述根据所述行为数据确定该用户的短期情景标签,包括:
分别统计该用户的位置数据、参与话题数据、参与内容互动数据以及应用程序使用数据;
将出现次数大于第一次数阈值的位置数据作为位置情景标签;
将参与次数大于第二次数阈值的参与话题数据作为话题情景标签;
直接将统计后的参与内容互动数据或将互动次数符合第一预置条件的参与内容互动数据作为互动情景标签;
将使用次数符合第二预置条件的应用程序使用数据作为APP使用情景标签;
其中,所述短期情景标签包括位置情景标签、话题情景标签、互动情景标签以及APP使用情景标签。
4.根据权利要求1所述的方法,其特征在于,所述方法进一步包括:
当未获取到该用户的认证数据,则通过预置分类算法,将该用户进行分类;
当分类结果与所述长期情景标签对应,则所述评价等级优化为真实等级。
5.一种用户信息的确定装置,其特征在于,应用在信息服务器,包括:
第一获取单元,获取多个用户的行为数据;
第二获取单元,获取所述多个用户的属性数据;
第一确定单元,根据任一用户的行为数据确定该用户的短期情景标签,所述短期情景标签表示用户当前生活的行为信息;
第二确定单元,根据所述短期情景标签确定该用户的长期情景标签,所述长期情景标签表示用户人生阶段的状态信息;
第三确定单元,确定该用户的长期情景标签对应的评价等级,并根据所述评价等级进行等级优化;
其中,所述第二确定单元,针对该用户的属性数据,将短期情景标签与预置标签进行关联,从预置标签中选出长期情景标签;
所述第三确定单元包括:
第一确定模块,当通过预置预测算法,将所述短期情景标签与预置标签进行关联从预置标签中选出长期情景标签,则确定所述评价等级为案例等级;
优化模块,获取该用户的认证数据,当所述认证数据与所述长期情景标签对应,则所述评价等级优化为真实等级;
第二确定模块,根据所述真实等级,向业务客户端发送媒体数据,并根据所述业务客户端返回对所述媒体数据的查看状态,确定该用户的兴趣标签,使得所述评价等级由真实等级优化到效果等级。
6.根据权利要求5所述的装置,其特征在于,所述第一获取单元,接收所述多个用户中各用户的业务客户端分别记录的行为数据;或接收业务服务器转发的多个用户的所述行为数据。
7.根据权利要求5或6所述的装置,其特征在于,所述行为数据包括:位置数据、参与话题数据、参与内容互动数据以及应用程序使用数据;
其中,所述第一确定单元,分别统计该用户的位置数据、参与话题数据、参与内容互动数据以及应用程序使用数据;将出现次数大于第一次数阈值的位置数据作为位置情景标签;将参与次数大于第二次数阈值的参与话题数据作为话题情景标签;直接将统计后的参与内容互动数据或将互动次数符合第一预置条件的参与内容互动数据作为互动情景标签;将使用次数符合第二预置条件的应用程序使用数据作为APP使用情景标签;其中,所述短期情景标签包括位置情景标签、话题情景标签、互动情景标签以及APP使用情景标签。
8.根据权利要求5所述的装置,其特征在于,所述第三确定单元还包括:
分类模块,当未获取到该用户的认证数据,则通过预置分类算法,将该用户进行分类;以及
所述优化模块,当分类结果与所述长期情景标签对应,则所述评价等级优化为真实等级。
CN201811264466.7A 2018-10-29 2018-10-29 一种用户信息的确定方法和装置 Active CN111105117B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811264466.7A CN111105117B (zh) 2018-10-29 2018-10-29 一种用户信息的确定方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811264466.7A CN111105117B (zh) 2018-10-29 2018-10-29 一种用户信息的确定方法和装置

Publications (2)

Publication Number Publication Date
CN111105117A CN111105117A (zh) 2020-05-05
CN111105117B true CN111105117B (zh) 2023-06-23

Family

ID=70420339

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811264466.7A Active CN111105117B (zh) 2018-10-29 2018-10-29 一种用户信息的确定方法和装置

Country Status (1)

Country Link
CN (1) CN111105117B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111626202B (zh) 2020-05-27 2023-08-29 北京百度网讯科技有限公司 用于识别视频的方法及装置
CN116050939B (zh) * 2023-03-07 2023-06-27 深圳市人马互动科技有限公司 基于互动小说的用户测评方法及相关装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106920119A (zh) * 2015-12-25 2017-07-04 北京国双科技有限公司 一种用户价值的评价方法及装置
CN107360336A (zh) * 2017-06-28 2017-11-17 上海航动科技有限公司 一种基于语音服务的智能派单系统及方法
CN108347367A (zh) * 2017-01-24 2018-07-31 中国移动通信有限公司研究院 一种电子邮件处理方法、装置、服务器及客户端

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8510309B2 (en) * 2010-08-31 2013-08-13 Apple Inc. Selection and delivery of invitational content based on prediction of user interest
CN106126597A (zh) * 2016-06-20 2016-11-16 乐视控股(北京)有限公司 用户属性预测方法及装置
CN106649509B (zh) * 2016-10-12 2020-04-07 腾讯科技(北京)有限公司 用户特征提取方法及装置
US20180197099A1 (en) * 2017-01-11 2018-07-12 Google Inc. User state predictions for presenting information
US10990896B2 (en) * 2017-01-27 2021-04-27 Facebook, Inc. Systems and methods for incorporating long-term patterns in online fraud detection
CN107330081A (zh) * 2017-07-03 2017-11-07 深圳市比量科技传媒有限公司 一种信息特征提取方法
CN107730038A (zh) * 2017-10-09 2018-02-23 小草数语(北京)科技有限公司 用户偏好性别的预测方法、装置及其设备

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106920119A (zh) * 2015-12-25 2017-07-04 北京国双科技有限公司 一种用户价值的评价方法及装置
CN108347367A (zh) * 2017-01-24 2018-07-31 中国移动通信有限公司研究院 一种电子邮件处理方法、装置、服务器及客户端
CN107360336A (zh) * 2017-06-28 2017-11-17 上海航动科技有限公司 一种基于语音服务的智能派单系统及方法

Also Published As

Publication number Publication date
CN111105117A (zh) 2020-05-05

Similar Documents

Publication Publication Date Title
US9252961B2 (en) Identify experts and influencers in a social network
US9946782B2 (en) System and method for message clustering
KR102067278B1 (ko) 친구 추천 방법 및 이를 위한 서버 및 단말
CN102591911B (zh) 位置相关实体的实时个性化推荐
US9183497B2 (en) Performance-efficient system for predicting user activities based on time-related features
US20140040370A1 (en) Content feed for facilitating topic discovery in social networking environments
US20160171557A1 (en) Customer Insight System Architecture
US20150112963A1 (en) Time and location based information search and discovery
US20100082427A1 (en) System and Method for Context Enhanced Ad Creation
US20160048698A1 (en) Data storage service for personalization system
CN107193974B (zh) 基于人工智能的地域性信息确定方法和装置
CN107464133B (zh) 一种投放广告的方法及装置
US20180285936A1 (en) Intelligent visual object management system
US20170214646A1 (en) Systems and methods for providing social media location information
US9741259B2 (en) Identification for performing tasks in open social media
EP2910028B1 (en) Filtering a stream of content
CN113711260A (zh) 使用计算机视觉检测的自动视觉建议、生成和评估
CN109767267B (zh) 一种用于广告投放的目标用户推荐方法及装置
US20120226521A1 (en) Utilize Experts and Influencers in a Social Network
US20170323326A1 (en) Method and systems for determining programmatically expected performances
CN108932646B (zh) 基于运营商的用户标签验证方法、装置和电子设备
CN111105117B (zh) 一种用户信息的确定方法和装置
CN114912717B (zh) 基于物联网的智慧城市保障住房申请风险评估方法和系统
US20190114653A1 (en) Electronic survey and entity matching marketplace
US9536207B2 (en) Using data obtained from an online social network to optimize subscription offers

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant