CN110472157A - 一种用户动态兴趣确定方法及装置 - Google Patents
一种用户动态兴趣确定方法及装置 Download PDFInfo
- Publication number
- CN110472157A CN110472157A CN201910631210.3A CN201910631210A CN110472157A CN 110472157 A CN110472157 A CN 110472157A CN 201910631210 A CN201910631210 A CN 201910631210A CN 110472157 A CN110472157 A CN 110472157A
- Authority
- CN
- China
- Prior art keywords
- user
- interest
- classification
- weight
- interest classification
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 45
- 230000003542 behavioural effect Effects 0.000 claims abstract description 31
- 230000004927 fusion Effects 0.000 claims abstract description 9
- 210000003813 thumb Anatomy 0.000 claims description 4
- 238000012545 processing Methods 0.000 claims description 3
- 230000006870 function Effects 0.000 description 7
- 238000010586 diagram Methods 0.000 description 4
- 238000003860 storage Methods 0.000 description 4
- 230000006399 behavior Effects 0.000 description 3
- 238000013461 design Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 239000000284 extract Substances 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 210000004556 brain Anatomy 0.000 description 1
- 238000004140 cleaning Methods 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 239000006185 dispersion Substances 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000005611 electricity Effects 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 238000012417 linear regression Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 230000014759 maintenance of location Effects 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012549 training Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9536—Search customisation based on social or collaborative filtering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/958—Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/01—Social networking
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Human Resources & Organizations (AREA)
- Health & Medical Sciences (AREA)
- Economics (AREA)
- General Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明实施例提供一种用户动态兴趣确定方法及装置,其中,所述方法包括:根据用户行为数据以及所述行为数据对应的博文的兴趣类目,确定用户的一度兴趣;根据用户的网络社交数据确定用户的相关用户,根据所述相关用户确定用户的二度兴趣;以设定权重融合用户的一度兴趣以及二度兴趣,获得用户的初级兴趣类目;根据广告主的历史投放数据预估每天每个兴趣类目的广告投放需求,根据所述广告投放需求确定每天每个兴趣类目对应的用户数量,若存在对应的用户数量低于预设用户数量阈值的兴趣类目,则扩展该兴趣类目对应的用户数量。本技术方案从用户及其相关用户两方面来进行用户兴趣的获取,充分地利用了社交网络数据,更全方位的对用户兴趣进行了刻画。
Description
技术领域
本发明涉及互联网信息领域,具体涉及一种用户动态兴趣确定方法及装置。
背景技术
随着互联网科技的发展,和大数据计算的应用,用户分析成为了一个网站或者App的基础工作,因为它对于分析网站的功能,改进用户的需求,以及网站的商业化都是至关重要的。通过分析现有的相关工作,主要涉及一下两个个方面:
一方面,基于某种数据的用户画像方法和系统,这种方法和系统主要提出一种基于大数据的用户画像建立方法和用户画像管理系统。首先通过各种方法收集到相关方面的数据,有的是相关网站或者App的,有的从网络爬取的,或者其它方面的数据,然后对数据进行清洗和加工,然后根据相关数据的特点,运用数据挖掘和机器学习,建立合适的模型,构建用户画像的方法。比如,用户画像首要工作就是分析用户的人口统计属性,即年龄性别地域等等。
另一方面,构建网站的兴趣确定方法,这种方法和系统主要提出一种获得用户兴趣词的方法,这类方法主要是用于网络方面,通过用户的网络浏览和点击行为,结合相关web页面的主题,提出具有针对性的数据挖掘算法,来计算出相关的用户兴趣。
目前的上述两方面的技术,均是基于用户的相关行为进行的数据统计,而没有涉及到基于社交网络的用户兴趣计算的相关方法。
发明内容
本发明实施例提供一种用户动态兴趣确定方法和装置,基于用户的社交网络数据进行的用户兴趣的获取,并结合广告主方的数据对用户兴趣进行动态的调整。
为实现上述目的,一方面,本发明实施例提供了一种用户动态兴趣确定方法,所述方法包括:
根据用户的行为数据以及所述行为数据对应的博文的兴趣类目,确定用户的一度兴趣;
根据用户的网络社交数据确定用户的相关用户,根据所述相关用户确定用户的二度兴趣;
以设定权重融合用户的一度兴趣以及二度兴趣,获得用户的初级兴趣类目;
根据广告主的历史投放数据预估每天每个兴趣类目的广告投放需求,根据所述广告投放需求确定每天每个兴趣类目对应的用户数量,若存在对应的用户数量低于预设用户数量阈值的兴趣类目,则扩展该兴趣类目对应的用户数量。
另一方面,本发明实施例提供了一种用户动态兴趣确定装置,所述装置包括:
一度兴趣确定单元,用于根据用户的行为数据以及所述行为数据对应的博文的兴趣类目,确定用户的一度兴趣;
二度兴趣确定单元,用于根据用户的网络社交数据确定用户的相关用户,根据所述相关用户确定用户的二度兴趣;
初级兴趣类目确定单元,用于以设定权重融合用户的一度兴趣以及二度兴趣,获得用户的初级兴趣类目;
兴趣类目扩展单元,用于根据广告主的历史投放数据预估每天每个兴趣类目的广告投放需求,根据所述广告投放需求确定每天每个兴趣类目对应的用户数量,若存在对应的用户数量低于预设用户数量阈值的兴趣类目,则扩展该兴趣类目对应的用户数量。
上述技术方案具有如下有益效果:
本发明的技术方案提供了一种基于微博社交网络数据的用户兴趣确定方法和装置,这个方法从效果上看,提取了较为细粒度的用户兴趣。并且从用户的关注点以及用户的相关用户两方面来进行用户兴趣的获取,充分地利用了社交网络数据,更全方位的对用户兴趣进行了刻画,并结合广告主的需求来对用户兴趣进行扩展与评估,使得用户兴趣更好的应用于实际。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例一种用户动态兴趣确定方法的流程图;
图2是本发明实施例一种用户动态兴趣确定装置的结构示意图;
图3是本发明实施例中一度兴趣确定单元的结构示意图;
图4是本发明实施例中二度兴趣确定单元的结构示意图;
图5是本发明又一实施例一种用户动态兴趣确定方法的流程图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
如图1所示,是本发明实施例一种用户动态兴趣确定方法的流程图,所述方法包括:
S101、根据用户的行为数据以及所述行为数据对应的博文的兴趣类目,确定用户的一度兴趣。
优选地,所述用户的行为数据包括用户对博文的转发、评论以及点赞;所述根据用户的行为数据以及所述行为数据对应的博文的兴趣类目,构建用户的一度兴趣,包括:
根据博文的标签类目确定博文的兴趣类目;例如可以获取微博每条博文的标签类目,表示这条博文相关的主题,一般是一到三个或者若干个主题不等。
根据用户的行为数据确定博文相对于用户的权重;例如根据用户的行为数据,例如转评赞博文,通过一定时间历史数据,运用规则方法给若干用户和兴趣之间标记一个相关度,然后提取特征建立用户和兴趣的相关度模型;对于特征的提取,可以构建了一套特征体系,包括用户的人口属性,用户的关注大号列表(根据一些条件判断一些用户为大号),用户发博文的类目,用户的行为转评赞等等,通过一定特征构建方法例如等频离散化、等值离散化或者用gbdt提取特征,将提取的特征转化为one-hot编码作为特征,然后根据提出的特征用Factorization Machine算法,训练出一个模型,预测每个用户和兴趣的相关度权重。这样可以得到用户的一度兴趣,也就是用户的直接兴趣。
例如针对任一用户k,获取用户k的行为数据对应的博文的兴趣类目;
根据用户k的行为数据确定博文相对于用户k的权重;
选定权重大于设定的第一权重阈值的博文对应的兴趣类目作为用户k的一度兴趣I1,I1表示为其中,
表示用户k的第m个兴趣类目,表示第m个兴趣类目对应的博文相对于用户k的权重,M为用户k的兴趣类目的数量,1≤m≤M。
S102、根据用户的网络社交数据确定用户的相关用户,根据所述相关用户确定用户的二度兴趣。
优选地,所述根据用户的网络社交数据确定用户的相关用户,根据所述相关用户确定用户的二度兴趣,包括:
将用户的网络社交数据以向量表示,将与用户的向量的相关度大于设定的相关度阈值的向量所对应的用户确定为用户的相关用户;例如根据微博社交数据,运用模型的方法建立用户间的相关度;例如运用word2vec的算法,把相关的用户作为一个训练样本,用word2vec算法训练出每个用户的向量表示,例如将一对用户id作为算法的输入,比如微博中相互关注的用户,然后经过多次迭代,可以把主要的用户转化为一个高纬度的向量(例如一百维),然后用向量的相关度计算公式,比如欧式距离等,计算出用户之间的相关度。可以得到用户之间的关系矩阵S,则任意两个用户uidk和uidj的相似关系为skj。
针对任一用户k,将用户k的网络社交数据以向量表示,将与用户k的向量的相关度大于设定的相关度阈值的向量所对应的用户确定为用户k的相关用户;
根据所述相关用户以及所述相关用户的博文的兴趣类目确定用户k的二度兴趣I2,I2表示为
其中,表示用户k的相关用户j的具有第m个兴趣类目的博文相对于用户j的权重,skj表示用户k与相关用户j的相关度,n表示用户k的相关用户的总数,
S103、以设定权重融合用户的一度兴趣以及二度兴趣,获得用户的初级兴趣类目;
优选地,所述以设定权重融合所述用户的一度兴趣以及二度兴趣,获得所述用户的初级兴趣类目,包括:
通过下式获得所述用户k的初级兴趣类目I,I表示为:
其中,表示兴趣类目m相对于用户k的总权重,P1为用户k的一度兴趣的设定权重,P2为用户k的二度兴趣的设定权重,P1+P2=1。对于权重P1、P2,可以根据历史数据的经验设置一定的计算权重公式,融合用户的一、二度兴趣,例如根据历史数据的经验确定初步权重P1’=0.5、P2’=1,经过标准化P1+P2=1计算,得到P1=P1/(P1+P2)=0.5/(0.5+1)=0.33;P2=P2/(P1+P2)=1/(0.5+1)=0.67。
S104、根据广告主的历史投放数据预估每天每个兴趣类目的广告投放需求,根据所述广告投放需求确定每天每个兴趣类目对应的用户数量,若存在对应的用户数量低于预设用户数量阈值的兴趣类目,则扩展该兴趣类目对应的用户数量。
具体地,建立一个方法动态的预估每天每个兴趣类目的数据量,例如根据一定时间内,各个业务对于兴趣使用的需求,提取相关的特征,用一个回归模型来预估兴趣类目的数量;也就是说,我们把这个问题提炼为一个回归的问题,通过构建了一套特征体系,包括广告主每天的消耗,广告主的总的预算,之前若干天每天使用的兴趣数量,时间衰减因素等等,运用多元线性回归模型f(x)=wTx+b训练出每天每个兴趣的类目量级,从而可以动态的调整兴趣。
优选地,所述扩展该兴趣类目对应的用户数量,包括:
确定所述兴趣类目对应用户的相关用户,将所述兴趣类目对应用户与其相关用户的相关度、以及所述兴趣类目相对于该对应用户的总权重的乘积,作为所述兴趣类目对应用户的相关用户的相关权重;
将所述兴趣类目对应用户的相关用户按照其相关权重由大到小进行排序,获取排序靠前的设定数量的相关用户作为所述兴趣类目下的扩展用户;或者
将所述相关权重大于设定相关权重阈值的相关用户作为所述兴趣类目下的扩展用户。
对于所述扩展兴趣类目对应的用户数量,不限于上述方法,例如可以根据将每个用户的兴趣类目进行扩展,从而获取量级不够的兴趣类目对应的更多的用户,例如下述的方法:
选定权重在设定的第一权重阈值于设定的第二权重阈值之间的博文对应的兴趣类目作为用户的扩展一度兴趣,其中所述设定的第二权重阈值小于所述设定的第一权重阈值;
根据扩展一度兴趣,通过用户的相关用户获得对应的扩展二度兴趣;
根据扩展一度兴趣、扩展二度兴趣以及所述权重P1、P2获得用户的扩展兴趣类目。
此处兴趣的扩展,以设定的第二权重阈值获取扩展的兴趣类目作为扩展一度兴趣,可以根据一度兴趣确定二度兴趣的方法,来确定所述扩展二度兴趣;也不限于该方法。
如图2所示,是本发明实施例一种用户动态兴趣确定装置的结构示意图,所述装置包括:
一度兴趣确定单元21,用于根据用户的行为数据以及所述行为数据对应的博文的兴趣类目,确定用户的一度兴趣;
二度兴趣确定单元22,用于根据用户的网络社交数据确定用户的相关用户,根据所述相关用户确定用户的二度兴趣;
初级兴趣类目确定单元23,用于以设定权重融合用户的一度兴趣以及二度兴趣,获得用户的初级兴趣类目;
兴趣类目扩展单元24,用于根据广告主的历史投放数据预估每天每个兴趣类目的广告投放需求,根据所述广告投放需求确定每天每个兴趣类目对应的用户数量,若存在对应的用户数量低于预设用户数量阈值的兴趣类目,则扩展该兴趣类目对应的用户数量。
优选地,所述用户的行为数据包括用户对博文的转发、评论以及点赞;其中,如图3所示,所述一度兴趣确定单元包括:
博文处理模块211,用于针对任一用户k,获取用户k的行为数据对应的博文的兴趣类目;
权重确定模块212,用于根据用户k的行为数据确定博文相对于用户k的权重;
一度兴趣确定模块213,用于选定权重大于设定的第一权重阈值的博文对应的兴趣类目作为用户k的一度兴趣I1,I1表示为其中,
表示用户k的第m个兴趣类目,表示第m个兴趣类目对应的博文相对于用户k的权重,M为用户k的兴趣类目的数量,1≤m≤M。
优选地,如图4所示,所述二度兴趣确定单元22包括:
相关用户确定模块221,用于针对任一用户k,将用户k的网络社交数据以向量表示,将与用户k的向量的相关度大于设定的相关度阈值的向量所对应的用户确定为用户k的相关用户;
二度兴趣确定模块222,用于根据所述相关用户以及所述相关用户的博文的兴趣类目确定用户k的二度兴趣I2,I2表示为
其中,表示用户k的相关用户j的具有第m个兴趣类目的博文相对于用户j的权重,skj表示用户k与相关用户j的相关度,n表示用户k的相关用户的总数
优选地,所述初级兴趣类目确定单元23,具体用于:
通过下式获得所述用户k的初级兴趣类目I,I表示为:
其中,表示兴趣类目m相对于用户k的总权重,P1为用户k的一度兴趣的设定权重,P2为用户k的二度兴趣的设定权重,P1+P2=1。
优选地,所述兴趣类目扩展单元24具体用于:
确定所述兴趣类目对应用户的相关用户,将所述兴趣类目对应用户与其相关用户的相关度、以及所述兴趣类目相对于该对应用户的总权重的乘积,作为所述兴趣类目对应用户的相关用户的相关权重;
将所述兴趣类目对应用户的相关用户按照其相关权重由大到小进行排序,获取排序靠前的设定数量的相关用户作为所述兴趣类目下的扩展用户;或者
将所述相关权重大于设定相关权重阈值的相关用户作为所述兴趣类目下的扩展用户。
应该明白,公开的过程中的步骤的特定顺序或层次是示例性方法的实例。基于设计偏好,应该理解,过程中的步骤的特定顺序或层次可以在不脱离本公开的保护范围的情况下得到重新安排。所附的方法权利要求以示例性的顺序给出了各种步骤的要素,并且不是要限于所述的特定顺序或层次。
在上述的详细描述中,各种特征一起组合在单个的实施方案中,以简化本公开。不应该将这种公开方法解释为反映了这样的意图,即,所要求保护的主题的实施方案需要比清楚地在每个权利要求中所陈述的特征更多的特征。相反,如所附的权利要求书所反映的那样,本发明处于比所公开的单个实施方案的全部特征少的状态。因此,所附的权利要求书特此清楚地被并入详细描述中,其中每项权利要求独自作为本发明单独的优选实施方案。
为使本领域内的任何技术人员能够实现或者使用本发明,上面对所公开实施例进行了描述。对于本领域技术人员来说;这些实施例的各种修改方式都是显而易见的,并且本文定义的一般原理也可以在不脱离本公开的精神和保护范围的基础上适用于其它实施例。因此,本公开并不限于本文给出的实施例,而是与本申请公开的原理和新颖性特征的最广范围相一致。
上文的描述包括一个或多个实施例的举例。当然,为了描述上述实施例而描述部件或方法的所有可能的结合是不可能的,但是本领域普通技术人员应该认识到,各个实施例可以做进一步的组合和排列。因此,本文中描述的实施例旨在涵盖落入所附权利要求书的保护范围内的所有这样的改变、修改和变型。此外,就说明书或权利要求书中使用的术语“包含”,该词的涵盖方式类似于术语“包括”,就如同“包括,”在权利要求中用作衔接词所解释的那样。此外,使用在权利要求书的说明书中的任何一个术语“或者”是要表示“非排它性的或者”。
本领域技术人员还可以了解到本发明实施例列出的各种说明性逻辑块(illustrative logical block),单元,和步骤可以通过电子硬件、电脑软件,或两者的结合进行实现。为清楚展示硬件和软件的可替换性(interchangeability),上述的各种说明性部件(illustrative components),单元和步骤已经通用地描述了它们的功能。这样的功能是通过硬件还是软件来实现取决于特定的应用和整个系统的设计要求。本领域技术人员可以对于每种特定的应用,可以使用各种方法实现所述的功能,但这种实现不应被理解为超出本发明实施例保护的范围。
本发明实施例中所描述的各种说明性的逻辑块,或单元都可以通过通用处理器,数字信号处理器,专用集成电路(ASIC),现场可编程门阵列或其它可编程逻辑装置,离散门或晶体管逻辑,离散硬件部件,或上述任何组合的设计来实现或操作所描述的功能。通用处理器可以为微处理器,可选地,该通用处理器也可以为任何传统的处理器、控制器、微控制器或状态机。处理器也可以通过确定装置的组合来实现,例如数字信号处理器和微处理器,多个微处理器,一个或多个微处理器联合一个数字信号处理器核,或任何其它类似的配置来实现。
本发明实施例中所描述的方法或算法的步骤可以直接嵌入硬件、处理器执行的软件模块、或者这两者的结合。软件模块可以存储于RAM存储器、闪存、ROM存储器、EPROM存储器、EEPROM存储器、寄存器、硬盘、可移动磁盘、CD-ROM或本领域中其它任意形式的存储媒介中。示例性地,存储媒介可以与处理器连接,以使得处理器可以从存储媒介中读取信息,并可以向存储媒介存写信息。可选地,存储媒介还可以集成到处理器中。处理器和存储媒介可以设置于ASIC中,ASIC可以设置于用户终端中。可选地,处理器和存储媒介也可以设置于用户终端中的不同的部件中。
在一个或多个示例性的设计中,本发明实施例所描述的上述功能可以在硬件、软件、固件或这三者的任意组合来实现。如果在软件中实现,这些功能可以存储与电脑可读的媒介上,或以一个或多个指令或代码形式传输于电脑可读的媒介上。电脑可读媒介包括电脑存储媒介和便于使得让电脑程序从一个地方转移到其它地方的通信媒介。存储媒介可以是任何通用或特殊电脑可以接入访问的可用媒体。例如,这样的电脑可读媒体可以包括但不限于RAM、ROM、EEPROM、CD-ROM或其它光盘存储、磁盘存储或其它磁性存储装置,或其它任何可以用于承载或存储以指令或数据结构和其它可被通用或特殊电脑、或通用或特殊处理器读取形式的程序代码的媒介。此外,任何连接都可以被适当地定义为电脑可读媒介,例如,如果软件是从一个网站站点、服务器或其它远程资源通过一个同轴电缆、光纤电缆、双绞线、数字用户线(DSL)或以例如红外、无线和微波等无线方式传输的也被包含在所定义的电脑可读媒介中。所述的碟片(disk)和磁盘(disc)包括压缩磁盘、镭射盘、光盘、DVD、软盘和蓝光光盘,磁盘通常以磁性复制数据,而碟片通常以激光进行光学复制数据。上述的组合也可以包含在电脑可读媒介中。
以上所述的具体实施方式,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施方式而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (10)
1.一种用户动态兴趣确定方法,其特征在于,所述方法包括:
根据用户的行为数据以及所述行为数据对应的博文的兴趣类目,确定用户的一度兴趣;
根据用户的网络社交数据确定用户的相关用户,根据所述相关用户确定用户的二度兴趣;
以设定权重融合用户的一度兴趣以及二度兴趣,获得用户的初级兴趣类目;
根据广告主的历史投放数据预估每天每个兴趣类目的广告投放需求,根据所述广告投放需求确定每天每个兴趣类目对应的用户数量,若存在对应的用户数量低于预设用户数量阈值的兴趣类目,则扩展该兴趣类目对应的用户数量。
2.如权利要求1所述的用户动态兴趣确定方法,其特征在于,所述用户的行为数据包括用户对博文的转发、评论以及点赞;所述根据用户的行为数据以及所述行为数据对应的博文的兴趣类目,构建用户的一度兴趣,包括:
针对任一用户k,获取用户k的行为数据对应的博文的兴趣类目;
根据用户k的行为数据确定博文相对于用户k的权重;
选定权重大于设定的第一权重阈值的博文对应的兴趣类目作为用户k的一度兴趣I1,I1表示为其中,
表示用户k的第m个兴趣类目,表示第m个兴趣类目对应的博文相对于用户k的权重,M为用户k的兴趣类目的数量,1≤m≤M。
3.如权利要求2所述的用户动态兴趣确定方法,其特征在于,所述根据用户的网络社交数据确定用户的相关用户,根据所述相关用户确定用户的二度兴趣,包括:
针对任一用户k,将用户k的网络社交数据以向量表示,将与用户k的向量的相关度大于设定的相关度阈值的向量所对应的用户确定为用户k的相关用户;
根据所述相关用户以及所述相关用户的博文的兴趣类目确定用户k的二度兴趣I2,I2表示为
其中,表示用户k的相关用户j的具有第m个兴趣类目的博文相对于用户j的权重,skj表示用户k与相关用户j的相关度,n表示用户k的相关用户的总数,
4.如权利要求3所述的用户动态兴趣确定方法,其特征在于,所述以设定权重融合所述用户的一度兴趣以及二度兴趣,获得所述用户的初级兴趣类目,包括:
通过下式获得所述用户k的初级兴趣类目I,I表示为:
其中,表示兴趣类目m相对于用户k的总权重,P1为用户k的一度兴趣的设定权重,P2为用户k的二度兴趣的设定权重,P1+P2=1。
5.如权利要求4所述的用户动态兴趣确定方法,其特征在于,所述扩展该兴趣类目对应的用户数量,包括:
确定所述兴趣类目对应用户的相关用户,将所述兴趣类目对应用户与其相关用户的相关度、以及所述兴趣类目相对于该对应用户的总权重的乘积,作为所述兴趣类目对应用户的相关用户的相关权重;
将所述兴趣类目对应用户的相关用户按照其相关权重由大到小进行排序,获取排序靠前的设定数量的相关用户作为所述兴趣类目下的扩展用户;或者
将所述相关权重大于设定相关权重阈值的相关用户作为所述兴趣类目下的扩展用户。
6.一种用户动态兴趣确定装置,其特征在于,所述装置包括:
一度兴趣确定单元,用于根据用户的行为数据以及所述行为数据对应的博文的兴趣类目,确定用户的一度兴趣;
二度兴趣确定单元,用于根据用户的网络社交数据确定用户的相关用户,根据所述相关用户确定用户的二度兴趣;
初级兴趣类目确定单元,用于以设定权重融合用户的一度兴趣以及二度兴趣,获得用户的初级兴趣类目;
兴趣类目扩展单元,用于根据广告主的历史投放数据预估每天每个兴趣类目的广告投放需求,根据所述广告投放需求确定每天每个兴趣类目对应的用户数量,若存在对应的用户数量低于预设用户数量阈值的兴趣类目,则扩展该兴趣类目对应的用户数量。
7.如权利要求6所述的用户动态兴趣确定装置,其特征在于,所述用户的行为数据包括用户对博文的转发、评论以及点赞;所述一度兴趣确定单元包括:
博文处理模块,用于针对任一用户k,获取用户k的行为数据对应的博文的兴趣类目;
权重确定模块,用于根据用户k的行为数据确定博文相对于用户k的权重;
一度兴趣确定模块,用于选定权重大于设定的第一权重阈值的博文对应的兴趣类目作为用户k的一度兴趣I1,I1表示为其中,
表示用户k的第m个兴趣类目,表示第m个兴趣类目对应的博文相对于用户k的权重,M为用户k的兴趣类目的数量,1≤m≤M。
8.如权利要求7所述的用户动态兴趣确定装置,其特征在于,所述二度兴趣确定单元包括:
相关用户确定模块,用于针对任一用户k,将用户k的网络社交数据以向量表示,将与用户k的向量的相关度大于设定的相关度阈值的向量所对应的用户确定为用户k的相关用户;
二度兴趣确定模块,用于根据所述相关用户以及所述相关用户的博文的兴趣类目确定用户k的二度兴趣I2,I2表示为:
其中,表示用户k的相关用户j的具有第m个兴趣类目的博文相对于用户j的权重,skj表示用户k与相关用户j的相关度,n表示用户k的相关用户的总数,
9.如权利要求8所述的用户动态兴趣确定装置,其特征在于,所述初级兴趣类目确定单元,具体用于:
通过下式获得所述用户k的初级兴趣类目I,I表示为:
其中,表示兴趣类目m相对于用户k的总权重,P1为用户k的一度兴趣的设定权重,P2为用户k的二度兴趣的设定权重,P1+P2=1。
10.如权利要求9所述的用户动态兴趣确定装置,其特征在于,所述兴趣类目扩展单元具体用于:
确定所述兴趣类目对应用户的相关用户,将所述兴趣类目对应用户与其相关用户的相关度、以及所述兴趣类目相对于该对应用户的总权重的乘积,作为所述兴趣类目对应用户的相关用户的相关权重;
将所述兴趣类目对应用户的相关用户按照其相关权重由大到小进行排序,获取排序靠前的设定数量的相关用户作为所述兴趣类目下的扩展用户;或者
将所述相关权重大于设定相关权重阈值的相关用户作为所述兴趣类目下的扩展用户。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910631210.3A CN110472157A (zh) | 2019-07-12 | 2019-07-12 | 一种用户动态兴趣确定方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910631210.3A CN110472157A (zh) | 2019-07-12 | 2019-07-12 | 一种用户动态兴趣确定方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110472157A true CN110472157A (zh) | 2019-11-19 |
Family
ID=68508476
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910631210.3A Pending CN110472157A (zh) | 2019-07-12 | 2019-07-12 | 一种用户动态兴趣确定方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110472157A (zh) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103700004A (zh) * | 2013-12-10 | 2014-04-02 | 深圳先进技术研究院 | 一种微博广告服务信息推送方法及装置 |
CN104063476A (zh) * | 2014-06-30 | 2014-09-24 | 北京奇虎科技有限公司 | 基于社交网络的内容推荐方法和系统 |
CN104516915A (zh) * | 2013-09-30 | 2015-04-15 | 腾讯科技(北京)有限公司 | 一种基于微博timeline的媒体数据发布方法和装置 |
CN104636940A (zh) * | 2013-11-07 | 2015-05-20 | 深圳市腾讯计算机系统有限公司 | 广告投放方法及系统、广告筛选方法及装置、服务器 |
CN105740366A (zh) * | 2016-01-26 | 2016-07-06 | 哈尔滨工业大学深圳研究生院 | 微博用户兴趣推理方法及装置 |
CN106874392A (zh) * | 2017-01-13 | 2017-06-20 | 微梦创科网络科技(中国)有限公司 | 受众用户信息的索引存储及广告信息投放的方法和装置 |
-
2019
- 2019-07-12 CN CN201910631210.3A patent/CN110472157A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104516915A (zh) * | 2013-09-30 | 2015-04-15 | 腾讯科技(北京)有限公司 | 一种基于微博timeline的媒体数据发布方法和装置 |
CN104636940A (zh) * | 2013-11-07 | 2015-05-20 | 深圳市腾讯计算机系统有限公司 | 广告投放方法及系统、广告筛选方法及装置、服务器 |
CN103700004A (zh) * | 2013-12-10 | 2014-04-02 | 深圳先进技术研究院 | 一种微博广告服务信息推送方法及装置 |
CN104063476A (zh) * | 2014-06-30 | 2014-09-24 | 北京奇虎科技有限公司 | 基于社交网络的内容推荐方法和系统 |
CN105740366A (zh) * | 2016-01-26 | 2016-07-06 | 哈尔滨工业大学深圳研究生院 | 微博用户兴趣推理方法及装置 |
CN106874392A (zh) * | 2017-01-13 | 2017-06-20 | 微梦创科网络科技(中国)有限公司 | 受众用户信息的索引存储及广告信息投放的方法和装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106503014A (zh) | 一种实时信息的推荐方法、装置和系统 | |
CN102316166B (zh) | 网站推荐方法和系统以及网络服务器 | |
WO2014165186A2 (en) | Tailoring user experience for unrecognized and new users | |
CN106294830A (zh) | 多媒体资源的推荐方法及装置 | |
CN109993583B (zh) | 信息推送方法和装置、存储介质及电子装置 | |
CN103390194A (zh) | 用户意图预测及推荐建议的方法、设备和系统 | |
CN107122377A (zh) | 自动匹配数据集与存储组件 | |
CN104156366A (zh) | 一种向移动终端推荐网络应用的方法和网络服务器 | |
CN110209931B (zh) | 媒体内容的推送方法和装置、存储介质、电子装置 | |
CN110032684B (zh) | 基于共享账户的信息跨域并行序列推荐方法、介质及设备 | |
CN110503506A (zh) | 基于评分数据的物品推荐方法、装置及介质 | |
CN102769818A (zh) | 一种移动互联网中的信息推送方法及装置 | |
CN109767267A (zh) | 一种用于广告投放的目标用户推荐方法及装置 | |
CN110363580A (zh) | 信息推荐方法、装置、计算机设备及存储介质 | |
CN110135463A (zh) | 一种商品推送方法及装置 | |
CN107239680B (zh) | 一种对用户登录进行风险评估的方法及装置 | |
CN109815421A (zh) | 一种信息的生成方法、系统和装置 | |
US20180121552A1 (en) | System and Method for Web Search Obfuscation Using Emulated User Profiles | |
CN112581185A (zh) | 广告用户性别年龄预估方法、系统、计算机和存储介质 | |
CN109635192A (zh) | 面向微服务的海量资讯热度排行更新方法及平台 | |
Meiss et al. | Agents, bookmarks and clicks: a topical model of web navigation | |
CN106156113A (zh) | 一种视频推荐的方法、系统及电子设备 | |
CN105205128B (zh) | 基于评分特征的时序推荐方法及推荐装置 | |
Guo et al. | IIDQN: an incentive improved DQN algorithm in EBSN recommender system | |
Papadakis et al. | Methods for web revisitation prediction: survey and experimentation |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20191119 |
|
RJ01 | Rejection of invention patent application after publication |