CN106960033B - 一种给信息流标注标签的方法和装置 - Google Patents

一种给信息流标注标签的方法和装置 Download PDF

Info

Publication number
CN106960033B
CN106960033B CN201710172953.XA CN201710172953A CN106960033B CN 106960033 B CN106960033 B CN 106960033B CN 201710172953 A CN201710172953 A CN 201710172953A CN 106960033 B CN106960033 B CN 106960033B
Authority
CN
China
Prior art keywords
user
label
preset
matching degree
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710172953.XA
Other languages
English (en)
Other versions
CN106960033A (zh
Inventor
潘岸腾
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba China Co Ltd
Original Assignee
Alibaba China Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba China Co Ltd filed Critical Alibaba China Co Ltd
Priority to CN201710172953.XA priority Critical patent/CN106960033B/zh
Publication of CN106960033A publication Critical patent/CN106960033A/zh
Priority to PCT/CN2017/120182 priority patent/WO2018171288A1/zh
Application granted granted Critical
Publication of CN106960033B publication Critical patent/CN106960033B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/955Retrieval from the web using information identifiers, e.g. uniform resource locators [URL]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Transfer Between Computers (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提供了一种给信息流标注标签的方法和装置。所述方法包括:基于用户在终端上安装的第三方应用确定该用户对于不同标签的兴趣度;基于所述兴趣度和用户对信息流的点击情况确定信息流对标签的匹配度;基于所述匹配度按预设方式选取对应的一定数量标签给所述信息流标注。

Description

一种给信息流标注标签的方法和装置
技术领域
本发明涉及信息处理技术领域,具体而言涉及一种给信息流标注标签的方法和装置。
背景技术
随着互联网技术和智能移动终端技术的快速发展,很多在计算机终端上实现的功能(例如购物、阅读)也都可以在智能移动终端上实现,例如使用智能手机或平板电脑等。另外,这些功能的实现需要在智能移动终端上安装相应的应用程序。例如,网上购物,需要安装例如淘宝客户端,听音乐需要安装音乐播放器客户端等。由此,很多软件公司提供了应用商店或应用市场,例如豌豆荚或者PP助手等。用户可以打开应用商店或者应用市场,从而能够快速搜索和下载所需要的各种应用程序,包括影音播放类、系统工具类、通讯社交类、网上购物类、阅读类等,当然还可以下载游戏等休闲娱乐类应用程序(APP)。
为了不断提升用户使用应用商店或者应用市场的良好体验感,目前的应用商店或应用市场除了能够将应用直接展示给用户之外,如图1A所示,还提供了一种新的应用发行方式:在应用商店增加信息流,通过有趣的文章、短视频或头条新闻等对应用进行介绍和推销,打开信息流能看到文章内容、视频或新闻等,并且页面底部会有提供该信息流的可供下载的应用,如图1A和图1B所示,当点击图1A所示的信息流展示页面中的新闻“知道这些才算会玩UC浏览器”时,进入图1B所示的页面,上面除了介绍这篇新闻的详细内容时,页面底部还提供了该新闻的提供者-第三方应用“UC浏览器”及更新(或下载)按钮。然而,“信息流”的信息来源渠道很多,许多渠道提供的信息流缺乏对信息的描述,另外各渠道对信息描述的规范不统一,而且信息流的使用方-应用商店或应用市场目前没有一个好的方法 来统一描述来自各种渠道的带有不规范描述的信息,由此给信息流标注标签的工作无法借助工具自动完成,而依赖人工实现标注标签,则费时费力、不容易做。
在信息流没有标注标签的情况下,会导致开展与信息本身相关的个性化推荐信息流的业务会遇到很多困难。
发明内容
本发明的目的在于提供一种给信息流标注标签的方法和装置,以改善上述问题。
本发明的第一实施例提供了一种给信息流标注标签的方法,其包括:
基于用户在终端上安装的第三方应用确定该用户对于不同标签的兴趣度;
基于所述兴趣度和用户对信息流的点击情况确定信息流对标签的匹配度;
基于所述匹配度按预设方式选取对应的一定数量标签给所述信息流标注。
本发明的第二实施例提供了一种给信息流标注标签的装置,其包括:
兴趣度确定单元,用于基于用户在终端上安装的第三方应用确定该用户对于不同标签的兴趣度;
匹配度确定单元,用于基于所述兴趣度和用户对信息流的点击情况确定信息流对标签的匹配度;
标注单元,用于基于所述匹配度按预设方式选取对应的一定数量标签给所述信息流标注。
其中通过统计在一段天数内用户安装的预置应用库里的第三方应用具有的每个标签占该应用具有的所有标签的权重随时间衰减而得出该用户因安装了该第三方应用而对于标签集合里的不同标签的兴趣度,将该用户因在终端上安装的所有第三方应用而对于相同标签的兴趣度值进行累加,从 而得出该用户对于不同标签的兴趣度。
其中通过对不同用户对于不同标签的兴趣度随着用户点击信息流的时间而衰减进行统计,得到信息流对标签的匹配度。
根据本发明的给信息流标注标签的方法和装置,通过统计用户在其使用的终端上安装的第三方应用和用户点击信息流的情况,能够分析出用户对标签的兴趣度,进而分析出用户点击过的信息流与标签的匹配度,从而可以选取匹配度最高的标签作为该信息流的标签,对其进行标注,由此可以实现对应用商店或应用市场中提供的信息流自动标注标签,解决了人工标注标签的费时费力、不容易完成的问题,而且通过为信息流自动标注标签,有利于后续开展的与信息流本身相关的个性化推荐信息流的业务。
附图说明
图1A是现有的应用商店采用信息流方式推荐应用的一个实例截图;
图1B是信息流的一个信息的详情页的一个实例截图;
图2是本发明实施例提供的给信息流标注标签的方法的流程图;
图3是本发实施例提供的给信息流标注标签的装置的示意性框图。
具体实施方式
下面将结合本发明实施例和附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本发明一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
发明人提供的本方案的主要思路是:通过用户在终端上安装的第三方应用确定该用户对于不同标签的兴趣度;基于用户对于不同标签的兴趣度 以及该用户点击信息流的情况来确定信息流对标签的匹配度;在得到了信息流对标签的匹配度后,基于所述匹配度按预设方式选取一定数量的标签作为所述信息流的标签,给所述信息流标注上。
图2是本发明的给信息流标注标签的方法的流程图。如图2所示,本发明的给信息流标注标签的方法包括以下步骤:
S1:基于用户在终端上安装的第三方应用确定该用户对于不同标签的兴趣度。
基于上述思路,需要统计一个用户在其使用的终端上到目前为止都安装了哪些第三方应用。通过统计在一段天数内用户安装的预置应用库里的第三方应用具有的每个标签占该应用具有的所有标签的权重随时间衰减而得出该用户因安装了该第三方应用而对于标签集合里的不同标签的兴趣度,将该用户因在终端上安装的所有第三方应用而对于相同标签的兴趣度值进行累加,从而得出该用户对于不同标签的兴趣度。这样,基于这些安装的第三方应用来确定该用户对于不同标签的兴趣度。
首先计算所述用户在终端上安装的每个第三方应用对于标签集合里的不同标签的兴趣度,计算方法如下:
Figure BDA0001251603360000041
其中:cintp,i,j表示某个用户p在终端上安装的预置应用库里的第三方应用i对于标签集合里的标签j的兴趣度;
ct1p,i表示用户p在终端上在N天内安装了预置应用库里的第三方应用i并保持到今天的天数,其中用户p在N天内没有安装第三方应用i时ct1p,i为N;
tagi,j表示第三方应用i是否具有预置标签集合里的标签j,其中当有标签j时tagi,j为1,否则为0;
Figure BDA0001251603360000042
表示第三方应用i具有的预置标签集合里的标签数量的累加 之和;
n表示预置应用库里的第三方应用的数量;
m表示预置标签集合里的标签数量;
N为大于0的整数。
N可以根据实践需要自行设定天数,例如60天、90天、180天等。
本领域技术人员都知道开发应用商店或应用市场的目的和作用,应用商店或应用市场里预置了应用库,该应用库里放置了由不同第三方应用程序开发商开发的大量的各种应用。另外,应用商店或应用市场提供的第三方应用都具有1个或多个标签,这些标签也都来自于在开发应用商店或应用市场时预置的标签集合,这里不对这些常规技术做过多介绍了。
通过以上运算就可以统计在一段天数内用户安装的预置应用库里的第三方应用具有的每个标签占该应用具有的所有标签的权重随时间衰减而得出该用户因安装了该第三方应用而对于标签集合里的不同标签的兴趣度。
另外,一个用户通常会在其使用的终端上安装的多个第三方应用,所以需要将在终端上安装的所有第三方应用对于相同标签的兴趣度值进行累加,从而得出该用户对于不同标签的兴趣度,方法如下:
Figure BDA0001251603360000051
其中:intp,j表示某个用户p对于预置标签集合里的标签j的兴趣度;
D表示用户p在其使用的终端上安装的预置应用库里的第三方应用的数量;
cintp,i,j表示某个用户p在终端上安装的预置应用库里的第三方应用i对于标签集合里的标签j的兴趣度。
这样,将该用户因在终端上安装的所有第三方应用而对于相同标签的兴趣度值进行累加,从而得出该用户对于不同标签的兴趣度。
S2:基于所述兴趣度和所述用户对信息流的点击情况确定用户点击过的信息流对标签的匹配度;
上面确定了一个用户对于不同标签的兴趣度后,在这里需要统计该用户对信息流的点击情况,然后结合所述用户对于不同标签的兴趣度和该用户对信息流的点击情况来确定用户点击过的信息流对标签的匹配度。
即,通过对不同用户对于不同标签的兴趣度随着用户点击信息流的时间而衰减进行统计,得到信息流对标签的匹配度。
具体的,统计用户对信息流的点击数据,再结合所述用户对于不同标签的兴趣度,计算所述用户所点击的信息流对于标签集合里的不同标签的匹配度,计算方法如下:
Figure BDA0001251603360000061
j=1,2,…,m l=1,2…,U p=1,2…,F
其中:Sl,j表示用户所点击的信息流l对于预置标签集合里的标签j的匹配度;
ct2p,l表示用户p最后一次点击信息流l距离今天的天数,其中用户p在N天内没有点击信息流l时ct2p,l为N;
intp,j表示用户p对于预置标签集合里的标签j的兴趣度;
m表示预置标签集合里的标签数量;
U表示预置信息流库里的信息流数量;
F表示点击过信息流l的用户数量;
N为大于0的整数;
N可以根据实践需要自行设定天数,例如60天、90天、180天等。
本领域技术人员都知道,统计用户点击信息流的数据时,需要限定一 个时间段才能有统计结果,这里优选设定统计用户点击信息流的数据的天数与上面介绍的统计用户在使用的终端上安装第三方应用的天数相同,例如选取60天、90天、180天等。另外,应用商店或应用市场也可以预置一个信息流库,需要展示的信息流都放置在该预置信息流库里。
S3:基于所述匹配度按预设方式选取对应的一定数量标签给所述信息流标注。
优选的,基于所述匹配度从大到小顺序选取对应的一定数量标签给所述信息流标注,例如可以选取3-5个标签作为所述信息流的标签来进行标注,即从大到小排序在前3-5名的匹配度所分别对应的3-5个标签。或者,也可以从大于或等于预设阈值的所述匹配度对应的多个标签中随机选取一定数量标签给所述信息流标注,当然也可以按匹配度从大到小顺序选取,例如可以选取3-5个标签作为所述信息流的标签来进行标注。
本文里涉及到的信息流优选指没有标注标签的信息流。当然即便通过人工方式给一部分信息流标注了标签,也可以使用本发明的方法重新给这些信息流标注标签。
另外,在上述的计算用户点击过的信息流对标签的匹配度时,当遇到的标签是热门的标签,例如:“社交”,基于该标签计算出来的匹配度比较大;当遇到的标签是冷门的标签,例如:“中国象棋”,基于该标签计算出来的匹配度比较小。为了得到较为客观的匹配度,避免受到标签自身今天为冷门明天为热门的社会情绪影响,例如当中国象棋变成为世界性比赛而被社会大众广为关注时标签“中国象棋”会成为热门标签,很有必要对所述匹配度进行标准化处理,从而得出信息流对标签的最终的匹配度。
在一个优选实施例中,首先和上述步骤S2讲述的类似,统计用户对信息流的点击数据,再结合所述用户对于不同标签的兴趣度,计算所述用户所点击的信息流对于标签集合里的不同标签的第一匹配度,计算方法如下:
Figure BDA0001251603360000081
j=1,2,…,m l=1,2…,U p=1,2…,F
其中:Sl,j表示用户所点击的信息流l对于预置标签集合里的标签j的第一匹配度;
ct2p,l表示用户p最后一次点击信息流l距离今天的天数,其中用户p在N天内没有点击信息流l时ct2p,l为N;
intp,j表示用户p对于预置标签集合里的标签j的兴趣度;
m表示预置标签集合里的标签数量;
U表示预置信息流库里的信息流数量;
F表示点击过信息流l的用户数量;
N为大于0的整数;
N可以根据实践需要自行设定天数,例如60天、90天、180天等。
本领域技术人员都知道,统计用户点击信息流的数据时,需要限定一个时间段才能有统计结果,这里优选设定统计用户点击信息流的数据的天数与上面介绍的统计用户在使用的终端上安装第三方应用的天数相同,例如选取60天、90天、180天等。另外,应用商店或应用市场也可以预置一个信息流库,需要展示的信息流都放置在该预置信息流库里。
然后,对所述第一匹配度进行标准化处理,得出用户所点击的信息流对标签的最终匹配度,方法如下:
Figure BDA0001251603360000082
其中:ptagl,j表示用户所点击的信息流l与预置标签集合里的标签j之间的匹配度;
Sl,j表示用户所点击的信息流l对于预置标签集合里的标签j的第一匹配度;
Figure BDA0001251603360000091
U表示预置信息流库里的信息流数量;
m表示预置标签集合里的标签数量。
执行标准化处理的实际意义是:将用户所点击的信息流l对于标签j的匹配度转换为对所有信息流对于标签j的平均匹配度的倍数,用这个倍数来衡量信息流l与标签j之间的匹配程度,倍数越高表示信息流l对标签j的匹配度越高,倍数越低表示信息流l对标签j的匹配度越低。例如:用户所点击的信息流a对标签b的匹配度为0.3,所有信息流对标签的b的平均匹配度为0.1,则信息流a对标签b的最终匹配度是3。
根据本发明的给信息流标注标签的方法,通过统计用户在其使用的终端上安装的第三方应用和用户点击信息流的情况,能够判断出用户对标签的兴趣度,进而得出用户点击过的信息流与标签的匹配度,从而可以选取匹配度最高的标签作为该信息流的标签,对其进行标注,由此可以实现对应用商店或应用市场中预置的信息流自动标注标签,解决了人工标注标签的费时费力、不容易完成的问题,而且通过为信息流自动标注标签,有利于后续开展的与信息流本身相关的个性化推荐信息流的业务。
图3是本发明另一个实施例提供的给信息流标注标签的装置的示意性框图。如图3所示,本发明的给信息流标注标签的装置包括:
兴趣度确定单元,用于基于用户在终端上安装的第三方应用确定该用户对于不同标签的兴趣度;
匹配度确定单元,用于基于所述兴趣度和用户对信息流的点击情况确定信息流对标签的匹配度;
标注单元,用于基于所述匹配度按预设方式选取对应的一定数量标签给所述信息流标注。
优选的,所述兴趣度确定单元用于通过统计在一段天数内用户安装的预置应用库里的第三方应用具有的每个标签占该应用具有的所有标签的权重随时间衰减而得出该用户因安装了该第三方应用而对于标签集合里的不同标签的兴趣度,将该用户因在终端上安装的所有第三方应用而对于相同标签的兴趣度值进行累加,从而得出该用户对于不同标签的兴趣度。
其中,所述兴趣度确定单元首先用于计算所述用户在终端上安装的每个第三方应用对于标签集合里的不同标签的兴趣度,计算方法如下:
Figure BDA0001251603360000101
其中:cintp,i,j表示某个用户p在终端上安装的预置应用库里的第三方应用i对于标签集合里的标签j的兴趣度;
ct1p,i表示用户p在终端上在N天内安装了预置应用库里的第三方应用i并保持到今天的天数,其中用户p在N天内无安装时ct1p,i为N;
tagi,j表示第三方应用i是否具有预置标签集合里的标签j,其中当有标签j时tagi,j为1,否则为0;
Figure BDA0001251603360000102
表示第三方应用i具有的预置标签集合里的标签数量的累加之和;
n表示预置应用库里的第三方应用的数量;
m表示预置标签集合里的标签数量;
N为大于0的整数;
然后用于将在终端上安装的所有第三方应用对于相同标签的兴趣度值进行累加,从而得出该用户对于不同标签的兴趣度,方法如下:
Figure BDA0001251603360000103
其中:intp,j表示某个用户p对于预置标签集合里的标签j的兴趣度;
D表示用户p在终端上安装的预置应用库里的第三方应用的数量。
优选的,所述匹配度确定单元用于通过对不同用户对于不同标签的兴趣度随着用户点击信息流的时间而衰减进行统计,得到信息流对标签的匹配度。
其中所述匹配度确定单元用于获得信息流对标签的匹配度的计算方法如下:
Figure BDA0001251603360000111
j=1,2,…,m l=1,2…,U p=1,2…,F
其中:Sl,j表示用户所点击的信息流l对于预置标签集合里的标签j的匹配度;
ct2p,l表示用户p最后一次点击信息流l距离今天的天数,其中用户p在N天内没有点击信息流l时ct2p,l为N;
intp,j表示用户p对于预置标签集合里的标签j的兴趣度;
m表示预置标签集合里的标签数量;
U表示预置信息流库里的信息流数量;
F表示点击过信息流l的用户数量;
N为大于0的整数。
正如上面在方法的优选实施例里介绍的,有必要对所述匹配度进行标准化处理,因此这里也可以对所述匹配度做同样的处理。
在一个优选实施例中,首先和上述步骤S2讲述的类似,统计用户对信息流的点击数据,再结合所述用户对于不同标签的兴趣度,计算所述用户所点击的信息流对于标签集合里的不同标签的第一匹配度,计算方法如下:
Figure BDA0001251603360000121
j=1,2,…,m l=1,2…,U p=1,2…,F
其中:Sl,j表示用户所点击的信息流l对于预置标签集合里的标签j的第一匹配度;
ct2p,l表示用户p最后一次点击信息流l距离今天的天数,其中用户p在N天内没有点击信息流l时ct2p,l为N;
intp,j表示用户p对于预置标签集合里的标签j的兴趣度;
m表示预置标签集合里的标签数量;
U表示预置信息流库里的信息流数量;
F表示点击过信息流l的用户数量;
N为大于0的整数;
N可以根据实践需要自行设定天数,例如60天、90天、180天等。
本领域技术人员都知道,统计用户点击信息流的数据时,需要限定一个时间段才能有统计结果,这里优选设定统计用户点击信息流的数据的天数与上面介绍的统计用户在使用的终端上安装第三方应用的天数相同,例如选取60天、90天、180天等。另外,应用商店或应用市场也可以预置一个信息流库,需要展示的信息流都放置在该预置信息流库里。
然后,对所述第一匹配度进行标准化处理,得出用户所点击的信息流对标签的最终匹配度,方法如下:
Figure BDA0001251603360000122
其中:ptagl,j表示用户所点击的信息流l与预置标签集合里的标签j之间的匹配度;
Sl,j表示用户所点击的信息流l对于预置标签集合里的标签j的第一匹配度;
Figure BDA0001251603360000131
U表示预置信息流库里的信息流数量;
m表示预置标签集合里的标签数量。
优选的,所述标注单元基于所述匹配度从大到小顺序选取对应的一定数量标签给所述信息流标注,例如可以选取3-5个标签作为所述信息流的标签来进行标注,即从大到小排序在前3-5名的匹配度所分别对应的3-5个标签。或者,也可以从大于或等于预设阈值的所述匹配度对应的多个标签中随机选取一定数量标签给所述信息流标注,当然也可以再按匹配度从大到小顺序选取,例如可以选取3-5个标签作为所述信息流的标签来进行标注。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上面结合图3描述的装置的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再重复描述。
根据本发明的给信息流标注标签的装置,通过统计用户在其使用的终端上安装的第三方应用和用户点击信息流的情况,能够判断出用户对标签的兴趣度,进而得出用户点击过的信息流与标签的匹配度,从而可以选取匹配度最高的标签作为该信息流的标签,对其进行标注,由此可以实现对应用商店或应用市场中预置的信息流自动标注标签,解决了人工标注标签的费时费力、不容易完成的问题,而且通过为信息流自动标注标签,有利于后续开展的与信息流本身相关的个性化推荐信息流的业务。
本发明实施例所提供的给信息流标注标签的方法的计算机程序产品,包括存储了程序代码的计算机可读存储介质,所述程序代码包括的指令可用于执行前面方法实施例中所述的方法,具体实现可参见方法实施例,在此不再赘述。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使 用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,平板电脑,智能手机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM)、随机存取存储器(RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。

Claims (12)

1.一种给信息流标注标签的方法,其包括:
基于用户在终端上安装的第三方应用确定该用户对于不同标签的兴趣度;
基于该用户对于不同标签的所述兴趣度和该用户对信息流的点击情况确定所述信息流对标签的匹配度;
基于所述匹配度按预设方式选取对应的一定数量标签给所述信息流标注,
其中,所述基于用户在终端上安装的第三方应用确定该用户对于不同标签的兴趣度的步骤包括:
计算所述用户在终端上安装的每个第三方应用对于标签集合里的不同标签的兴趣度;以及
将在终端上安装的所有第三方应用对于相同标签的兴趣度值进行累加,从而得出该用户对于不同标签的兴趣度。
2.根据权利要求1所述的方法,其特征在于在基于用户在终端上安装的第三方应用确定该用户对于不同标签的兴趣度的步骤中,通过统计在一段天数内用户安装的预置应用库里的第三方应用具有的每个标签占该应用具有的所有标签的权重随时间衰减而得出该用户因安装了该第三方应用而对于标签集合里的不同标签的兴趣度,将该用户因在终端上安装的所有第三方应用而对于相同标签的兴趣度值进行累加,从而得出该用户对于不同标签的兴趣度。
3.根据权利要求1或2所述的方法,其特征在于在基于用户在终端上安装的第三方应用确定该用户对于不同标签的兴趣度的步骤中,
其中,计算所述用户在终端上安装的每个第三方应用对于标签集合里的不同标签的兴趣度的计算方法如下:
Figure FDA0002995533050000011
其中:cintp,i,j表示某个用户p在终端上安装的预置应用库里的第三方应用i对于标签集合里的标签j的兴趣度;
ct1p,i表示用户p在终端上在N天内安装了预置应用库里的第三方应用i并保持到今天的天数,其中用户p在N天内无安装时ct1p,i为N;
tagi,j表示第三方应用i是否具有预置标签集合里的标签j,其中当有标签j时tagi,j为1,否则为0;
Figure FDA0002995533050000021
表示第三方应用i具有的预置标签集合里的标签数量的累加之和;
n表示预置应用库里的第三方应用的数量;
m表示预置标签集合里的标签数量;
N为大于0的整数;
并且其中,将在终端上安装的所有第三方应用对于相同标签的兴趣度值进行累加从而得出该用户对于不同标签的兴趣度的计算方法如下:
Figure FDA0002995533050000022
其中:intp,j表示某个用户p对于预置标签集合里的标签j的兴趣度;
D表示用户p在终端上安装的预置应用库里的第三方应用的数量。
4.根据权利要求1所述的方法,其特征在于在基于该用户对于不同标签的所述兴趣度和该用户对信息流的点击情况确定信息流对标签的匹配度的步骤中,通过对不同用户对于不同标签的兴趣度随着用户点击信息流的时间而衰减进行统计,得到信息流对标签的匹配度。
5.根据权利要求1或4所述的方法,其特征在于获得信息流对标签的匹配度的方法如下:
Figure FDA0002995533050000023
j=1,2,...,m l=1,2...,U p=1,2...,F
其中:Sl,j表示用户所点击的信息流l对于预置标签集合里的标签j的匹配度;
ct2p,l表示用户p最后一次点击信息流l距离今天的天数,其中用户p在N天内没有点击信息流l时ct2p,l为N;
intp,j表示用户p对于预置标签集合里的标签j的兴趣度;
M表示预置标签集合里的标签数量;
U表示预置信息流库里的信息流数量;
F表示点击过信息流l的用户数量;
N为大于0的整数。
6.根据权利要求1或4所述的方法,其特征在于获得信息流对标签的匹配度的方法如下:
首先通过统计用户对信息流的点击情况和所述用户对于不同标签的兴趣度,计算所述用户所点击的信息流对于标签集合里的不同标签的第一匹配度,计算方法如下:
Figure FDA0002995533050000031
j=1,2,...,m l=1,2...,U p=1,2...,F
其中:Sl,j表示用户所点击的信息流l对于预置标签集合里的标签j的第一匹配度;
ct2p,l表示用户p最后一次点击信息流l距离今天的天数,其中用户p在N天内没有点击信息流l时ct2p,l为N;
intp,j表示用户p对于预置标签集合里的标签j的兴趣度;
m表示预置标签集合里的标签数量;
U表示预置信息流库里的信息流数量;
F表示点击过信息流l的用户数量;
N为大于0的整数;
然后,对所述第一匹配度进行标准化处理,得出信息流对标签的最终匹配度,方法如下:
Figure FDA0002995533050000041
其中:ptagl,j表示用户所点击的信息流l与预置标签集合里的标签j之间的匹配度;
Sl,j表示用户所点击的信息流l对于预置标签集合里的标签j的第一匹配度;
Figure FDA0002995533050000042
U表示预置信息流库里的信息流数量;
m表示预置标签集合里的标签数量。
7.一种给信息流标注标签的装置,其包括:
兴趣度确定单元,用于基于用户在终端上安装的第三方应用确定该用户对于不同标签的兴趣度;
匹配度确定单元,用于基于该用户对于不同标签的所述兴趣度和该用户对信息流的点击情况确定所述信息流对标签的匹配度;
标注单元,用于基于所述匹配度按预设方式选取对应的一定数量标签给所述信息流标注,
其中,所述兴趣度确定单元计算所述用户在终端上安装的每个第三方应用对于标签集合里的不同标签的兴趣度,并将在终端上安装的所有第三方应用对于相同标签的兴趣度值进行累加,从而得出该用户对于不同标签的兴趣度。
8.根据权利要求7所述的装置,其特征在于所述兴趣度确定单元用于通过统计在一段天数内用户安装的预置应用库里的第三方应用具有的每个标签占该应用具有的所有标签的权重随时间衰减而得出该用户因安装了该第三方应用而对于标签集合里的不同标签的兴趣度,将该用户因在终端上安装的所有第三方应用而对于相同标签的兴趣度值进行累加,从而得出该用户对于不同标签的兴趣度。
9.根据权利要求7或8所述的装置,其特征在于所述兴趣度确定单元计算所述用户在终端上安装的每个第三方应用对于标签集合里的不同标签的兴趣度的计算方法如下:
Figure FDA0002995533050000051
其中:cintp,i,j表示某个用户p在终端上安装的预置应用库里的第三方应用i对于标签集合里的标签j的兴趣度;
ct1p,i表示用户p在终端上在N天内安装了预置应用库里的第三方应用i并保持到今天的天数,其中用户p在N天内无安装时ct1p,i为N;
tagi,j表示第三方应用i是否具有预置标签集合里的标签j,其中当有标签j时tagi,j为1,否则为0;
Figure FDA0002995533050000052
表示第三方应用i具有的预置标签集合里的标签数量的累加之和;
n表示预置应用库里的第三方应用的数量;
m表示预置标签集合里的标签数量;
N为大于0的整数;
并且,所述兴趣度确定单元将在终端上安装的所有第三方应用对于相同标签的兴趣度值进行累加从而得出该用户对于不同标签的兴趣度的计算方法如下:
Figure FDA0002995533050000053
其中:intp,j表示某个用户p对于预置标签集合里的标签j的兴趣度;
D表示用户p在终端上安装的预置应用库里的第三方应用的数量。
10.根据权利要求7所述的装置,其特征在于所述匹配度确定单元用于通过对不同用户对于不同标签的兴趣度随着用户点击信息流的时间而衰减进行统计,得到信息流对标签的匹配度。
11.根据权利要求7或10所述的装置,其特征在于所述匹配度确定单元用于获得信息流对标签的匹配度的方法如下:
Figure FDA0002995533050000061
j=1,2,...,m l=1,2...,U p=1,2...,F
其中:Sl,j表示用户所点击的信息流1对于预置标签集合里的标签j的匹配度;
ct2p,l表示用户p最后一次点击信息流l距离今天的天数,其中用户p在N天内没有点击信息流1时ct2p,l为N;
intp,j表示用户p对于预置标签集合里的标签j的兴趣度;
m表示预置标签集合里的标签数量;
U表示预置信息流库里的信息流数量;
F表示点击过信息流1的用户数量;
N为大于0的整数。
12.根据权利要求7或10所述的装置,其特征在于所述匹配度用于获得信息流对标签的匹配度的方法如下:
Figure FDA0002995533050000062
j=1,2,...,m l=1,2...,U p=1,2...,F
其中:Sl,j表示用户所点击的信息流1对于预置标签集合里的标签j的第一匹配度;
ct2p,l表示用户p最后一次点击信息流1距离今天的天数,其中用户p在N天内没有点击信息流l时ct2p,l为N;
intp,j表示用户p对于预置标签集合里的标签j的兴趣度;
m表示预置标签集合里的标签数量;
U表示预置信息流库里的信息流数量;
F表示点击过信息流l的用户数量;
N为大于0的整数;
然后,对所述第一匹配度进行标准化处理,得出信息流对标签的最终匹配度,方法如下:
Figure FDA0002995533050000071
其中:ptagl,j表示用户所点击的信息流l与预置标签集合里的标签j之间的匹配度;
Sl,j表示用户所点击的信息流l对于预置标签集合里的标签j的第一匹配度;
Figure FDA0002995533050000072
U表示预置信息流库里的信息流数量;
m表示预置标签集合里的标签数量。
CN201710172953.XA 2017-03-22 2017-03-22 一种给信息流标注标签的方法和装置 Active CN106960033B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201710172953.XA CN106960033B (zh) 2017-03-22 2017-03-22 一种给信息流标注标签的方法和装置
PCT/CN2017/120182 WO2018171288A1 (zh) 2017-03-22 2017-12-29 给信息流标注标签的方法、装置、终端设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710172953.XA CN106960033B (zh) 2017-03-22 2017-03-22 一种给信息流标注标签的方法和装置

Publications (2)

Publication Number Publication Date
CN106960033A CN106960033A (zh) 2017-07-18
CN106960033B true CN106960033B (zh) 2021-09-14

Family

ID=59470859

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710172953.XA Active CN106960033B (zh) 2017-03-22 2017-03-22 一种给信息流标注标签的方法和装置

Country Status (2)

Country Link
CN (1) CN106960033B (zh)
WO (1) WO2018171288A1 (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106960033B (zh) * 2017-03-22 2021-09-14 阿里巴巴(中国)有限公司 一种给信息流标注标签的方法和装置
CN108900922B (zh) * 2018-07-20 2021-03-19 广州方硅信息技术有限公司 设置直播组件的标签的方法和装置
CN112784151B (zh) * 2019-11-08 2024-02-06 北京搜狗科技发展有限公司 一种确定推荐信息的方法及相关装置
CN111522854B (zh) * 2020-03-18 2023-08-01 大箴(杭州)科技有限公司 一种数据标注方法、装置、存储介质及计算机设备

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8275771B1 (en) * 2010-02-26 2012-09-25 Google Inc. Non-text content item search
CN102867016A (zh) * 2012-07-18 2013-01-09 北京开心人信息技术有限公司 一种基于标签的社交网络用户兴趣挖掘方法与装置
CN105893478A (zh) * 2016-03-29 2016-08-24 广州华多网络科技有限公司 一种标签提取方法及设备

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103389971B (zh) * 2013-07-04 2017-03-29 北京卓易讯畅科技有限公司 一种确定应用对应的评论内容的优质等级的方法与设备
CN103942326B (zh) * 2014-04-29 2018-05-04 百度在线网络技术(北京)有限公司 信息的提供方法和装置、搜索结果的提供方法和装置
CN104239571B (zh) * 2014-09-30 2018-04-24 北京奇虎科技有限公司 一种进行应用推荐的方法和装置
CN104750789B (zh) * 2015-03-12 2018-10-16 百度在线网络技术(北京)有限公司 标签的推荐方法及装置
CN105824961B (zh) * 2016-03-31 2019-06-14 北京奇艺世纪科技有限公司 一种标签确定方法及装置
CN106960033B (zh) * 2017-03-22 2021-09-14 阿里巴巴(中国)有限公司 一种给信息流标注标签的方法和装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8275771B1 (en) * 2010-02-26 2012-09-25 Google Inc. Non-text content item search
CN102867016A (zh) * 2012-07-18 2013-01-09 北京开心人信息技术有限公司 一种基于标签的社交网络用户兴趣挖掘方法与装置
CN105893478A (zh) * 2016-03-29 2016-08-24 广州华多网络科技有限公司 一种标签提取方法及设备

Also Published As

Publication number Publication date
CN106960033A (zh) 2017-07-18
WO2018171288A1 (zh) 2018-09-27

Similar Documents

Publication Publication Date Title
CN109819284B (zh) 一种短视频推荐方法、装置、计算机设备及存储介质
CN111178970B (zh) 广告投放的方法及装置、电子设备和计算机可读存储介质
CN108733706B (zh) 热度信息的生成方法和装置
CN106960033B (zh) 一种给信息流标注标签的方法和装置
CN107426328B (zh) 信息推送方法和装置
WO2018121700A1 (zh) 基于已安装应用来推荐应用信息的方法、装置、终端设备及存储介质
CN106951571B (zh) 一种给应用标注标签的方法和装置
CN111414532B (zh) 一种信息推荐方法、设备及机器可读存储介质
CN109325179A (zh) 一种内容推广的方法及装置
CN106991108A (zh) 一种信息的推送方法及装置
CN106909688B (zh) 一种基于输入搜索词来推荐搜索词的方法和装置
CN112465594B (zh) 直播交互方法、装置、设备及存储介质
CN113327146B (zh) 一种信息追踪方法和装置
CN104967690A (zh) 一种信息推送方法及装置
CN106919692B (zh) 一种推送消息的方法和装置
CN111815375A (zh) 广告投放中的用户画像方法及装置
CN111178983A (zh) 用户性别预测方法、装置、设备及存储介质
CN113315988A (zh) 直播视频推荐方法及装置
CN115757952A (zh) 内容信息推荐方法、装置、设备及存储介质
CN108710656B (zh) 一种内容推送方法和装置
US10068006B1 (en) Generating trend-based item recommendations
CN110717788A (zh) 一种目标用户的筛选方法及装置
CN106919693B (zh) 一种提高热词曝光覆盖率的方法和装置
CN113627983A (zh) 一种基于视频创意的网络广告推广方法及系统
CN106844504B (zh) 一种发送歌单标识的方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20200902

Address after: 310052 room 508, floor 5, building 4, No. 699, Wangshang Road, Changhe street, Binjiang District, Hangzhou City, Zhejiang Province

Applicant after: Alibaba (China) Co.,Ltd.

Address before: 510627 Guangdong city of Guangzhou province Whampoa Tianhe District Road No. 163 Xiping Yun Lu Yun Ping square B radio tower 15 layer self unit 02

Applicant before: GUANGZHOU UC NETWORK TECHNOLOGY Co.,Ltd.

GR01 Patent grant
GR01 Patent grant