CN111522993B - 标签有效性管理方法、装置、网络设备及存储介质 - Google Patents

标签有效性管理方法、装置、网络设备及存储介质 Download PDF

Info

Publication number
CN111522993B
CN111522993B CN202010267572.1A CN202010267572A CN111522993B CN 111522993 B CN111522993 B CN 111522993B CN 202010267572 A CN202010267572 A CN 202010267572A CN 111522993 B CN111522993 B CN 111522993B
Authority
CN
China
Prior art keywords
label
verified
value
user behavior
validity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010267572.1A
Other languages
English (en)
Other versions
CN111522993A (zh
Inventor
王晓炜
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Migu Cultural Technology Co Ltd
Original Assignee
Migu Cultural Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Migu Cultural Technology Co Ltd filed Critical Migu Cultural Technology Co Ltd
Priority to CN202010267572.1A priority Critical patent/CN111522993B/zh
Publication of CN111522993A publication Critical patent/CN111522993A/zh
Application granted granted Critical
Publication of CN111522993B publication Critical patent/CN111522993B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/73Querying
    • G06F16/735Filtering based on additional data, e.g. user or group profiles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/78Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/7867Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using information manually generated, e.g. tags, keywords, comments, title and artist information, manually generated time, location and usage information, user ratings

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Library & Information Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明实施方式涉及通信技术领域,公开了一种标签有效性管理方法,包括:获取在预设时间段内具有待验证标签的被推荐媒体资源的用户行为数据和推荐数据;根据所述用户行为数据和所述推荐数据计算所述待验证标签的有效值;根据所述有效值验证所述待验证标签的有效性。本发明实施方式还提供了一种标签有效性管理装置、网络设备及存储介质。本发明实施方式提供的标签有效性管理方法、装置、网络设备及存储介质,可以实现对媒体资源的标签有效性的评估,提高媒体资源的推荐效果。

Description

标签有效性管理方法、装置、网络设备及存储介质
技术领域
本发明涉及通信技术领域,特别涉及一种标签有效性管理方法、装置、网络设备及存储介质。
背景技术
目前互联网的媒体资源,一般会使用标签标注的方法为各类媒体资源加上标签,然后投入推荐系统使用;推荐系统根据标签向用户推荐各类媒体资源,使用户可以根据需要观看具有相同标签的媒体资源。例如,在用户浏览A视频的预览界面时,推荐系统会同时根据A视频的标签向用户推荐B、C等视频,用户可根据个人兴趣点击推荐的B、C等视频进行观看。
然而,发明人发现现有技术至少存在以下问题:目前的方法均是如何对媒体资源的标签进行标注,却未有方法可以评估标注的标签是否有效,即依据标签推荐的视频是否能够有效地带来客户的点击、收藏等实际效果,会造成实际效果较低或者无效的标签继续留存在媒体资源标签字段上,降低了媒体资源的推荐效果。
发明内容
本发明实施方式的目的在于提供一种标签有效性管理方法、装置、网络设备及存储介质,可以实现对媒体资源的标签有效性的评估,提高媒体资源的推荐效果。
为解决上述技术问题,本发明的实施方式提供了一种标签有效性管理方法,包括:获取在预设时间段内具有待验证标签的被推荐媒体资源的用户行为数据和推荐数据;根据用户行为数据和推荐数据计算待验证标签的有效值;根据有效值验证待验证标签的有效性。
本发明的实施方式还提供了一种标签有效性管理装置,包括:获取模块,用于获取在预设时间段内具有待验证标签的被推荐媒体资源的用户行为数据和推荐数据;计算模块,用于根据用户行为数据和推荐数据计算待验证标签的有效值;验证模块,用于根据有效值验证待验证标签的有效性。
本发明的实施方式还提供了一种网络设备,包括:至少一个处理器;以及,与至少一个处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行上述的标签有效性管理方法。
本发明的实施方式还提供了一种计算机可读存储介质,存储有计算机程序,计算机程序被处理器执行时实现上述的标签有效性管理方法。
本发明实施方式相对于现有技术而言,通过获取在预设时间段内具有待验证标签的被推荐媒体资源的用户行为数据和推荐数据;根据用户行为数据和推荐数据计算待验证标签的有效值;根据有效值验证待验证标签的有效性。由于用户行为数据能够真实地体现出被推荐媒体资源符合用户需求的程度,而根据推荐数据和用户行为数据来计算被推荐媒体资源的有效值,则可以真实地反映在推荐数据的条件下被推荐媒体资源符合用户需求的程度,从而可以根据计算的有效值实现对待验证标签的有效性的评估;在验证待验证标签的有效性之后,可以根据验证的结果对实际效果较低或者无效的标签进行优化,从而提高被推荐媒体资源上标注的标签的有效性和被推荐媒体资源的推荐效果。
另外,在根据有效值验证待验证标签的有效性之后,还包括:若待验证标签为无效标签,则将待验证标签从被推荐媒体资源上去除,并对被推荐媒体资源重新标注标签。在待验证标签判定为无效标签时,将待验证标签从被推荐媒体资源上去除并重新标注标签,可以对被推荐媒体资源上的标签进行优化,提高被推荐媒体资源上的标签的有效性。
另外,用户行为数据包括点击量、收藏量、评论量和分享量,推荐数据为被推荐次数。将用户行为数据细化为点击量、收藏量、评论量和分享量,推荐数据细化为被推荐次数,可以使有效值的计算得到多种维度数据的支撑。
另外,根据用户行为数据和推荐数据计算待验证标签的有效值,包括:根据用户行为数据和被推荐次数、采用以下计算公式计算待验证标签的有效值:
其中,V为待验证标签的有效值,t为预设时间段包含的天数,i为距离预设时间段的时间起点的具体天数且1≤i≤t,Ct为被推荐次数,H为点击量,score为点击量的权重系数,C为收藏量,Cscore为收藏量的权重系数,Cm为评论量,Cmscore为评论量的权重系数,S为分享量,Sscore为分享量的权重系数,N为用户行为数据对应的用户数量。
另外,score、Cscore、Cmscore和Sscore依次增大。通过将点击量、收藏量、评论量和分享量对应的权重系数设置为依次增大,可以准确地反映各个用户行为数据的重要程度,从而使计算的有效值更加符合实际情况。
另外,预设时间段为多个;根据有效值验证待验证标签的有效性,包括:构建二维坐标系,二维坐标系中X轴对应多个不同的预设时间段的t值,Y轴对应依照多个t值计算得到的V值;若V值处于二维坐标系的第一象限内的概率大于或等于第一预设值,则判定待验证标签有效。通过多个有效值在第一象限的概率来判断待验证标签的有效性,可以使待验证标签的有效性的判断得到更多数据的支撑,判断更加准确,提高验证待验证标签有效性的准确度。
另外,预设时间段为多个;根据有效值验证待验证标签的有效性,包括:构建二维坐标系,二维坐标系中X轴对应多个不同的预设时间段的t值,Y轴对应依照多个t值计算得到的V值;若V值处于二维坐标系的第四象限内的概率大于或等于第二预设值,则判定待验证标签无效。
附图说明
一个或多个实施例通过与之对应的附图中的图片进行示例性说明,这些示例性说明并不构成对实施例的限定。
图1是本发明第一实施方式提供的标签有效性管理方法的流程示意图;
图2是本发明第二实施方式提供的标签有效性管理方法的流程示意图;
图3是本发明第二实施方式提供的标签有效性管理方法中二维坐标系的一示例图;
图4是本发明第二实施方式提供的标签有效性管理方法中二维坐标系的另一示例图;
图5是本发明第二实施方式提供的标签有效性管理方法中二维坐标系的又一示例图;
图6是本发明第二实施方式提供的标签有效性管理方法中二维坐标系的再一示例图;
图7是本发明第三实施方式提供的标签有效性管理装置的模块结构示意图;
图8是本发明第四实施方式提供的网络设备的结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明的各实施方式进行详细的阐述。然而,本领域的普通技术人员可以理解,在本发明各实施方式中,为了使读者更好地理解本申请而提出了许多技术细节。但是,即使没有这些技术细节和基于以下各实施方式的种种变化和修改,也可以实现本申请所要求保护的技术方案。
本发明的第一实施方式涉及一种标签有效性管理方法,通过获取在预设时间段内具有待验证标签的被推荐媒体资源的用户行为数据和推荐数据;根据用户行为数据和推荐数据计算待验证标签的有效值;根据计算的有效值验证待验证标签的有效性。由于用户行为数据(如点击量、收藏量或评论量)能够真实地体现出被推荐媒体资源符合用户需求的程度,而根据推荐数据(如被推荐次数)和用户行为数据计算待验证标签的有效值,则可以反映在推荐数据的条件下被推荐媒体资源符合用户需求的程度,因此可以根据计算的有效值实现对待验证标签的有效性的评估。
应当说明的是,本发明实施方式提供的标签有效性管理方法的执行主体可以为服务端,其中,服务端可以用独立的服务器或者多个服务器组成的服务器集群来实现。以下以服务端为例进行说明。
本发明实施方式提供的标签有效性管理方法的具体流程如图1所示,具体包括以下步骤:
S101:获取在预设时间段内具有待验证标签的被推荐媒体资源的用户行为数据和推荐数据。
其中,预设时间段可以根据实际需要进行设置,例如为1天、10天或1个月等,此处不做具体限制。为了使待验证标签的有效值计算更能反映实际的效果,预设时间段不宜设置过短。优选地,预设时间段为大于30天的值,即统计大于30天的用户行为数据和推荐数据,使用户行为数据和推荐数据的样本较多,从而较能反映被推荐媒体资源符合用户需求的程度。
被推荐媒体资源是指作为被推荐的媒体资源,包括音频、视频等多媒体资源,例如为音乐、电视剧或电影等,可以为推荐系统推荐的媒体资源。可选地,被推荐媒体资源位于推荐列表中,其中,推荐列表是由推荐系统根据标签推荐给用户的媒体资源列表。例如,用户在观看某个具有“谍战”标签(待验证标签)的电影时,推荐系统获取多个具有“谍战”标签的电影(被推荐媒体资源)形成一个推荐列表给用户,用户根据自身的需求点击列表中的电影进行观看;或者,用户在根据标签分类选择“谍战”标签时,推荐系统获取所有具有“谍战”标签的电影形成一个推荐列表给用户。可以理解的是,具有待验证标签的被推荐媒体资源的个数一般为多个,即由多个均具有待验证标签的被推荐媒体资源来验证待验证标签的有效性。
用户行为数据为用户根据待验证标签对具有被推荐媒体资源进行操作的行为数据,具体可以为被推荐媒体资源的点击量、收藏量或评论量等,具体可以根据实际需要选取上述中的一个或以上作为用户行为数据,这里不做具体限制。推荐数据为推荐系统根据待验证标签对被推荐媒体资源进行推荐的数据,例如为推荐次数、推荐时间等。
S102:根据用户行为数据和推荐数据计算待验证标签的有效值。
具体地,服务端可以预先设置用户行为数据和推荐数据的权重系数或评分值,根据权重系数或评分值计算出待验证标签的有效值。
可以理解的是,推荐数据主要用于反映被推荐媒体资源被推荐的程度,若待验证标签为有效标签,则被推荐媒体资源被推荐的程度越高(例如被推荐次数多),用户行为数据越多;若待验证标签为无效标签,则用户行为数据不会因被推荐媒体资源推荐的程度而发生太大的变化。因此应在有效值的计算中体现出上述关系,从而可以根据计算的有效值验证待验证标签的有效性。实际应用中可以以用户行为数据除以推荐数据、或者以用户行为数据与推荐数据做差值等方式来体现,具体可以根据实际需要进行设置,这里不做具体限制。
S103:根据上述有效值验证待验证标签的有效性。
具体地,服务端可以根据有效值的计算方式设置一个预设值来判断待验证标签的有效性,当有效值大于或等于预设值时,判定待验证标签为有效标签;当有效值小于预设值时,判定待验证标签为无效标签。其中,预设值可以根据实际情况进行设置,此处不做具体限制。可以理解的是,无效标签是指实际效果较低或者无效的标签。
在一个具体的例子中,在根据有效值验证待验证标签的有效性之后,还包括:若待验证标签为无效标签,则将待验证标签从被推荐媒体资源上去除,并对被推荐媒体资源重新标注标签。
可选地,对被推荐媒体资源进行重新标注标签可以通过人工批注或自动批注的方式。可以理解的是,在通过自动批注的方式重新标注标签时,若标注标签的依据与原来相同,则会得到的是与原来相同的标签(即待验证标签),因此,服务端在判定待验证标签为无效标签时,可以将待验证标签为无效标签的信息反馈给用于标注标签的模块,使标注标签的模块对标注标签的方法进行优化后再进行标注。
而在对被推荐媒体资源重新标注标签后,服务端将重新标注的标签作为新的待验证标签,重新评估新的待验证标签的有效性。若新的待验证标签被评估为有效标签,则予以保留;若新的待验证标签被评估为无效标签,则进行重新标注,直至重新标注的标签被评估为有效标签。
在待验证标签判定为无效标签时,将待验证标签从被推荐媒体资源上去除并重新标注标签,可以对被推荐媒体资源上的标签进行优化,提高被推荐媒体资源上的标签的有效性;同时,若采用自动的方式重新标注标签,则还可以对标注标签的模块进行优化,提高标注标签的模块标注标签的质量。
与现有技术相比,本发明实施方式提供的标签有效性管理方法,通过获取在预设时间段内具有待验证标签的被推荐媒体资源的用户行为数据和推荐数据;根据用户行为数据和推荐数据计算待验证标签的有效值;根据有效值验证待验证标签的有效性。由于用户行为数据能够真实地体现出被推荐媒体资源符合用户需求的程度,而根据推荐数据和用户行为数据来计算被推荐媒体资源的有效值,则可以真实地反映在推荐数据的条件下被推荐媒体资源符合用户需求的程度,从而可以根据有效值实现对待验证标签的有效性的评估;在验证待验证标签的有效性之后,可以根据验证的结果对实际效果较低或者无效的标签进行优化,从而提高被推荐媒体资源上标注的标签的有效性和被推荐媒体资源的推荐效果。
本发明的第二实施方式涉及一种标签有效性管理方法。第二实施方式与第一实施方式大致相同,主要区别之处在于:用户行为数据具体包括点击量、收藏量、评论量和分享量,推荐数据为被推荐次数,预设时间段为多个,并采用预设的公式计算待验证标签的有效值。同时,构建二维坐标系,通过有效值在第一象限的概率来验证待验证标签的有效性。
本发明实施方式提供的标签有效性管理方法的具体流程如图2所示,具体包括以下步骤:
S201:获取在预设时间段内具有待验证标签的被推荐媒体资源的用户行为数据和推荐数据,其中,预设时间段为多个,用户行为数据包括点击量、收藏量、评论量和分享量,推荐数据为被推荐次数。
可以理解的是,预设时间段包括一个时间起点和一个时间终点,当预设时间段为多个时,多个预设时间段中每个预设时间段的时间起点或时间终点应至少有一个与其它预设时间段不同,即每个预设时间段具体统计的时间中至少有部分与其它的预设时间段不同。可选地,多个预设时间段可以为连续的多个预设时间段,也可以为不连续的多个预设时间段。多个预设时间段的示例如下表1所示:
表1
预设时间段 时间起点 时间终点
A 2020/1/10 2020/1/20
B 2020/1/10 2020/1/30
C 2020/1/20 2020/1/30
可选地,每个预设时间段对应的时长值可以相同也可以不同。例如在表1中,A预设时间段的时长值为10天,B预设时间段的时长值为20天,C预设时间段的时长值为10天,A预设时间段的时长值与C预设时间段相同,与B预设时间段不同。
在获取点击量、收藏量、评论量和分享量时,可选地,可以根据相应的用户数量进行统计,此时若一个用户对应多次点击、多次收藏、多次评论或多次分享时,则只计算一次点击、一次收藏、一次评论或一次分享,而不将其余的数量计算入内;也可以直接根据点击量、收藏量、评论量和分享量的实际数量进行统计,具体可以根据实际需要进行设置,此处不做具体限制。
S202:根据用户行为数据和被推荐次数、采用以下计算公式计算待验证标签的有效值:
其中,V为待验证标签的有效值,t为预设时间段包含的天数,i为距离预设时间段的时间起点的具体天数且1≤i≤t,Ct为被推荐次数,H为点击量,score为点击量的权重系数,C为收藏量,Cscore为收藏量的权重系数,Cm为评论量,Cmscore为评论量的权重系数,S为分享量,Sscore为分享量的权重系数,N为用户行为数据对应的用户数量。
具体地,在上述公式中,i是指从预设时间段的时间起点开始算起的第几天,score、Cscore、Cmscore和Sscore可以根据实际需要进行设置。可以理解的是,一般情况下,当用户比较喜欢被推荐媒体资源时,才会在点击的基础上对被推荐媒体资源进行收藏、评论和分享,因此可以将收藏量、评论量和分享量各自的权重系数设置比点击量的权重系数大。为了更真实地反映各种用户行为数据符合用户需求的程度,在一个具体的例子中,score、Cscore、Cmscore和Sscore依次增大,即各权重系数的从小到大的顺序为:score、Cscore、Cmscore和Sscore,例如,score、Cscore、Cmscore和Sscore具体可以为1、2、4和5;或者为-1、2、3和4等等。可选地,score、Cscore、Cmscore和Sscore依次等差递增,即各权重系数依次相差相同的数值,满足等差数列,例如为1、2、3、4;或者为1、3、5、7等等。
可选地,N大于或等于1千,即至少统计1千以上的用户的用户行为数据。
S203:构建二维坐标系,二维坐标系中X轴对应多个不同的预设时间段的t值,Y轴对应依照多个t值计算得到的V值。
S204:若V值处于上述二维坐标系的第一象限内的概率大于或等于第一预设值,则判定待验证标签有效。
对于S203-S204,具体地,服务端构建二维坐标系,其中,X轴对应t值,Y轴对应V值,根据多个预设时间段的t值和相应的V值在构建的二维坐标系中形成多个坐标点(t,V)。可以理解的是,由于多个预设时间段中每个预设时间的时长值可以相同,因此,当多个预设时间段中存在相同时长的两个或以上的预设时间段时,而相同时长的两个或以上的预设时间段的t值相同,则在二维坐标系上相同的t值可能对应有两个或以上的V值,其原因是即使两个预设时间段的时长相同,但统计的具体日期至少有部分不同,就可能会使V值不同。例如,在表1中A预设时间段为2020-1-10至2020-1-20,而C预设时间段为2020-1-20至2020-1-30,虽然对应的t值均为10,但由于两个预设时间段统计的具体日期不同,对应统计的用户行为数据和推荐数据不同,因此计算的V值也就可能不同。
由于t>0,因此坐标点可能出现在二维坐标系的第一象限或第四象限中。当坐标点出现在第一象限中时,此时V值大于0,表明待验证标签的有效性是较好的;当坐标点出现在第四象限中时,此时V值小于0,表明待验证标签的有效性是较差的。因此,可以统计V值处于二维坐标系的第一象限内的概率,即坐标点位于第一象限内的概率,若V值处于第一象限内的概率大于或等于第一预设值时,判定待验证标签有效。其中,第一预设值可以根据实际需要进行设置,这里不做具体限定。
例如,若预设时间段为5个,V值处于第一象限的个数为3个,处于第四象限的个数为2个,第一预设值为50%,由于V值处于第一象限的概率为3/5=60%,大于50%,因此服务端可以判定待验证标签有效。
在一个具体的例子中,根据有效值验证待验证标签的有效性,还可以包括:构建二维坐标系,二维坐标系中X轴对应多个不同的预设时间段的t值,Y轴对应依照多个t值计算得到的V值;若V值处于上述二维坐标系的第四象限内的概率大于或等于第二预设值,则判定待验证标签无效。
其中,第二预设值与第一预设值可以相同也可以不同,例如均为60%、70%等,也可以为第一预设值为50%,第二预设值为60%。由于V值只会存在于第一象限或第四象限,因此V值处于第一象限和第四象限的总和为100%,当同时使用第一预设值判断待验证标签有效和使用第二预设值判断待验证标签无效时,为了使在判断待验证标签的有效性时,不会出现既判定待验证标签为有效又判定待验证标签为无效的情况,第一预设值与第二预设值的总和应大于100%。例如,若第一预设值为60%,则第二预设值应大于40%。可以理解的是,当同时使用第一预设值判断待验证标签有效和使用第二预设值判断待验证标签无效时,可能存在待验证标签既不会被判定为有效又不会被判定为无效的情况,例如,若第一预设值为70%,第二预设值为40%,而待验证标签对应的V值处于第一象限的概率为65%,相应地V值处于第四象限的概率35%,此时待验证标签既不会被判定为有效又不会被判定为无效;此时可以增加预设时间段的个数对待验证标签作进一步评估,直至待验证标签被判定为有效或被判定为无效。
可选地,可以单独使用第一预设值判断待验证有效的方法同时进行有效与无效的判断,即当V值处于第一象限的概率大于或等于第一预设值时,判定待验证标签有效;当V值处于第一象限的概率小于第一预设值时,判定待验证标签无效。同理,也可以单独使用第二预设值判断待验证无效的方法同时进行有效与无效的判断。
请参考图3至图6,在图3至图6中,多个预设时间段具有相同的时间起点和不同的时长值,若将每个预设时间段从小到大进行排列,则相邻的两个预设时间段的时长值相差为1天,亦即从坐标原点开始的每一天均统计V值。如图3所示,若第一预设值为50%,而V值处于第一象限中的概率大于50%,则可以判定待验证标签有效。可选地,可以在V值均处于第一象限中时判定待验证标签有效,即第一预设值为100%,如图4所示,由于V值一直处于第一象限,因此可以判定待验证标签有效。
如图5所示,若第二预设值为60%,而V值处于第四象限中的概率大于60%,则可以判定待验证标签无效。可选地,可以在V值均处于第四象限时判定待验证标签无效,即第二预设值为100%,如图6所示,由于V值一直处于第四象限,因此可以判定待验证标签无效。
与现有技术相比,本发明实施方式提供的标签有效性管理方法,通过被推荐媒体资源的点击量、收藏量、评论量和分享量和被推荐次数、计算待验证标签的有效值,可以使有效值的计算得到多种维度数据的支撑;通过预设计算公式计算待验证标签,并构建二维坐标系,根据有效值处于二维坐标系的第一象限的概率来判断待验证标签的有效性,可以使待验证标签有效性的判断得到更多数据的支撑,判断更加准确,提高验证待验证标签有效性的准确度。
上面各种方法的步骤划分,只是为了描述清楚,实现时可以合并为一个步骤或者对某些步骤进行拆分,分解为多个步骤,只要包含相同的逻辑关系,都在本专利的保护范围内;对算法中或者流程中添加无关紧要的修改或者引入无关紧要的设计,但不改变其算法和流程的核心设计都在该专利的保护范围内。
本发明第三实施方式涉及一种标签有效性管理装置300,如图7所示,包含:获取模块301、计算模块302和验证模块303。各模块功能详细说明如下:
获取模块301,用于获取在预设时间段内具有待验证标签的被推荐媒体资源的用户行为数据和推荐数据;
计算模块302,用于根据用户行为数据和推荐数据计算待验证标签的有效值;
验证模块303,用于根据有效值验证待验证标签的有效性。
进一步地,本发明实施方式提供的标签有效性管理装置300还包括标注模块,其中,标注模块用于:
若待验证标签为无效标签,则将待验证标签从被推荐媒体资源上去除,并对被推荐媒体资源重新标注标签。
进一步地,用户行为数据包括点击量、收藏量、评论量和分享量,推荐数据为被推荐次数;计算模块302还用于:
根据用户行为数据和被推荐次数、采用以下计算公式计算待验证标签的有效值:
其中,V为待验证标签的有效值,t为预设时间段包含的天数,i为距离预设时间段的时间起点的具体天数且1≤i≤t,Ct为被推荐次数,H为点击量,score为点击量的权重系数,C为收藏量,Cscore为收藏量的权重系数,Cm为评论量,Cmscore为评论量的权重系数,S为分享量,Sscore为分享量的权重系数,N为用户行为数据对应的用户数量。
进一步地,score、Cscore、Cmscore和Sscore依次增大。
进一步地,预设时间段为多个;验证模块303还用于:
构建二维坐标系,二维坐标系中X轴对应多个不同的预设时间段的t值,Y轴对应依照多个t值计算得到的V值;
若V值处于二维坐标系的第一象限内的概率大于或等于第一预设值,则判定待验证标签有效。
进一步地,预设时间段为多个;验证模块303还用于:
构建二维坐标系,二维坐标系中X轴对应多个不同的预设时间段的t值,Y轴对应依照多个t值计算得到的V值;
若V值处于二维坐标系的第四象限内的概率大于或等于第二预设值,则判定待验证标签无效。
不难发现,本实施方式为与第一实施方式及第二实施方式相对应的装置实施例,本实施方式可与第一实施方式及第二实施方式互相配合实施。第一实施方式及第二实施方式中提到的相关技术细节在本实施方式中依然有效,为了减少重复,这里不再赘述。相应地,本实施方式中提到的相关技术细节也可应用在第一实施方式及第二实施方式中。
值得一提的是,本实施方式中所涉及到的各模块均为逻辑模块,在实际应用中,一个逻辑单元可以是一个物理单元,也可以是一个物理单元的一部分,还可以以多个物理单元的组合实现。此外,为了突出本发明的创新部分,本实施方式中并没有将与解决本发明所提出的技术问题关系不太密切的单元引入,但这并不表明本实施方式中不存在其它的单元。
本发明第四实施方式涉及一种网络设备,如图8所示,包括至少一个处理器401;以及,与至少一个处理器401通信连接的存储器402;其中,存储器402存储有可被至少一个处理器401执行的指令,指令被至少一个处理器401执行,以使至少一个处理器401能够执行上述的标签有效性管理方法。
其中,存储器402和处理器401采用总线方式连接,总线可以包括任意数量的互联的总线和桥,总线将一个或多个处理器401和存储器402的各种电路连接在一起。总线还可以将诸如外围设备、稳压器和功率管理电路等之类的各种其他电路连接在一起,这些都是本领域所公知的,因此,本文不再对其进行进一步描述。总线接口在总线和收发机之间提供接口。收发机可以是一个元件,也可以是多个元件,比如多个接收器和发送器,提供用于在传输介质上与各种其他装置通信的单元。经处理器401处理的数据通过天线在无线介质上进行传输,进一步,天线还接收数据并将数据传送给处理器401。
处理器401负责管理总线和通常的处理,还可以提供各种功能,包括定时,外围接口,电压调节、电源管理以及其他控制功能。而存储器402可以被用于存储处理器401在执行操作时所使用的数据。
本发明第五实施方式涉及一种计算机可读存储介质,存储有计算机程序。计算机程序被处理器执行时实现上述方法实施例。
即,本领域技术人员可以理解实现上述实施例方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序存储在一个存储介质中,包括若干指令用以使得一个设备(可以是单片机,芯片等)或处理器(processor)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-OnlyMemory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
本领域的普通技术人员可以理解,上述各实施方式是实现本发明的具体实施例,而在实际应用中,可以在形式上和细节上对其作各种改变,而不偏离本发明的精神和范围。

Claims (8)

1.一种标签有效性管理方法,其特征在于,包括:
获取在预设时间段内具有待验证标签的被推荐媒体资源的用户行为数据和推荐数据;
根据所述用户行为数据和所述推荐数据计算所述待验证标签的有效值;
根据所述有效值验证所述待验证标签的有效性;
其中,所述用户行为数据包括点击量、收藏量、评论量和分享量,所述推荐数据为被推荐次数;
所述根据所述用户行为数据和所述推荐数据计算所述待验证标签的有效值,包括:
根据所述用户行为数据和所述被推荐次数、采用以下计算公式计算所述待验证标签的有效值:
其中,V为所述待验证标签的有效值,t为所述预设时间段包含的天数,i为距离所述预设时间段的时间起点的具体天数且1≤i≤t,Ct为所述被推荐次数,H为所述点击量,score为所述点击量的权重系数,C为所述收藏量,Cscore为所述收藏量的权重系数,Cm为所述评论量,Cmscore为所述评论量的权重系数,S为所述分享量,Sscore为所述分享量的权重系数,N为所述用户行为数据对应的用户数量。
2.根据权利要求1所述的标签有效性管理方法,其特征在于,在所述根据所述有效值验证所述待验证标签的有效性之后,还包括:
若所述待验证标签为无效标签,则将所述待验证标签从所述被推荐媒体资源上去除,并对所述被推荐媒体资源重新标注标签。
3.根据权利要求1所述的标签有效性管理方法,其特征在于,所述score、所述Cscore、所述Cmscore和所述Sscore依次增大。
4.根据权利要求1所述的标签有效性管理方法,其特征在于,所述预设时间段为多个;
所述根据所述有效值验证所述待验证标签的有效性,包括:
构建二维坐标系,所述二维坐标系中X轴对应所述多个预设时间段的t值,Y轴对应依照所述多个t值计算得到的所述V值;
若所述V值处于所述二维坐标系的第一象限内的概率大于或等于第一预设值,则判定所述待验证标签有效。
5.根据权利要求1所述的标签有效性管理方法,其特征在于,所述预设时间段为多个;
所述根据所述有效值验证所述待验证标签的有效性,包括:
构建二维坐标系,所述二维坐标系中X轴对应所述多个预设时间段的t值,Y轴对应依照所述多个t值计算得到的所述V值;
若所述V值处于所述二维坐标系的第四象限内的概率大于或等于第二预设值,则判定所述待验证标签无效。
6.一种标签有效性管理装置,其特征在于,包括:
获取模块,用于获取在预设时间段内具有待验证标签的被推荐媒体资源的用户行为数据和推荐数据;
计算模块,用于根据所述用户行为数据和所述推荐数据计算所述待验证标签的有效值;
验证模块,用于根据所述有效值验证所述待验证标签的有效性;
其中,所述用户行为数据包括点击量、收藏量、评论量和分享量,所述推荐数据为被推荐次数;
所述根据所述用户行为数据和所述推荐数据计算所述待验证标签的有效值,包括:
根据所述用户行为数据和所述被推荐次数、采用以下计算公式计算所述待验证标签的有效值:
其中,V为所述待验证标签的有效值,t为所述预设时间段包含的天数,i为距离所述预设时间段的时间起点的具体天数且1≤i≤t,Ct为所述被推荐次数,H为所述点击量,score为所述点击量的权重系数,C为所述收藏量,Cscore为所述收藏量的权重系数,Cm为所述评论量,Cmscore为所述评论量的权重系数,S为所述分享量,Sscore为所述分享量的权重系数,N为所述用户行为数据对应的用户数量。
7.一种网络设备,其特征在于,包括:
至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如权利要求1-5任一项所述的标签有效性管理方法。
8.一种计算机可读存储介质,存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1-5任一项所述的标签有效性管理方法。
CN202010267572.1A 2020-04-08 2020-04-08 标签有效性管理方法、装置、网络设备及存储介质 Active CN111522993B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010267572.1A CN111522993B (zh) 2020-04-08 2020-04-08 标签有效性管理方法、装置、网络设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010267572.1A CN111522993B (zh) 2020-04-08 2020-04-08 标签有效性管理方法、装置、网络设备及存储介质

Publications (2)

Publication Number Publication Date
CN111522993A CN111522993A (zh) 2020-08-11
CN111522993B true CN111522993B (zh) 2023-08-15

Family

ID=71901363

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010267572.1A Active CN111522993B (zh) 2020-04-08 2020-04-08 标签有效性管理方法、装置、网络设备及存储介质

Country Status (1)

Country Link
CN (1) CN111522993B (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106407241A (zh) * 2016-03-21 2017-02-15 传线网络科技(上海)有限公司 视频推荐方法及系统
CN107766467A (zh) * 2017-09-29 2018-03-06 北京金山安全软件有限公司 一种信息检测方法、装置、电子设备及存储介质
CN109670892A (zh) * 2017-10-17 2019-04-23 Tcl集团股份有限公司 一种协同过滤推荐方法及系统、终端设备
CN110287372A (zh) * 2019-06-26 2019-09-27 广州市百果园信息技术有限公司 用于负反馈的标签确定方法、视频推荐方法及其装置
CN110413881A (zh) * 2019-07-11 2019-11-05 腾讯科技(深圳)有限公司 一种识别标签准确性的方法、装置、网络设备和存储介质

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10762136B2 (en) * 2017-09-15 2020-09-01 Telefonaktiebolaget Lm Ericsson (Publ) Tag-based, user directed media recommendations

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106407241A (zh) * 2016-03-21 2017-02-15 传线网络科技(上海)有限公司 视频推荐方法及系统
CN107766467A (zh) * 2017-09-29 2018-03-06 北京金山安全软件有限公司 一种信息检测方法、装置、电子设备及存储介质
CN109670892A (zh) * 2017-10-17 2019-04-23 Tcl集团股份有限公司 一种协同过滤推荐方法及系统、终端设备
CN110287372A (zh) * 2019-06-26 2019-09-27 广州市百果园信息技术有限公司 用于负反馈的标签确定方法、视频推荐方法及其装置
CN110413881A (zh) * 2019-07-11 2019-11-05 腾讯科技(深圳)有限公司 一种识别标签准确性的方法、装置、网络设备和存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
谌颃 ; .使用分类改进标签推荐系统准确度的研究.微电子学与计算机.2011,(05),93-96. *

Also Published As

Publication number Publication date
CN111522993A (zh) 2020-08-11

Similar Documents

Publication Publication Date Title
CN110929052B (zh) 多媒体资源推荐方法、装置、电子设备及存储介质
US11481657B2 (en) Content recommendation method, apparatus and system
US10725628B2 (en) Federated commenting for digital content
US20070219994A1 (en) Methods and systems for displaying media utilizing user-generated data
CN104081392A (zh) 社会媒体配置文件的影响评分
CN103546517B (zh) 网络信息推送系统和方法
CN108140041A (zh) 针对视频搜索的观看时间聚类
CN108540508B (zh) 用于推送信息的方法、装置和设备
WO2008048993A2 (en) Method for estimating real life relationships and popularities among people based on personal visual data
RU2622850C2 (ru) Метод и сервер для обработки идентификаторов продукта и машиночитаемый носитель данных
CN105100886A (zh) 网络媒介信息的发布控制方法、及装置、服务器和系统
CN106537437A (zh) 识别具有被一个或多个用户多次消费的高可能性的媒体信道
CN114461920A (zh) 榜单信息推荐的数据处理方法、装置、介质及设备
CN111522993B (zh) 标签有效性管理方法、装置、网络设备及存储介质
CN109086813A (zh) 主播相似度的确定方法、装置、设备及存储介质
JP4278603B2 (ja) 配信スケジュール生成方法、配信スケジュール生成装置及び配信スケジュール生成方法のプログラムを記録した記録媒体
CN107341172B (zh) 视频收益计算建模装置与方法及视频推荐装置与方法
CN107483595B (zh) 信息推送方法和装置
CN112491939B (zh) 多媒体资源调度方法及系统
CN112367540B (zh) 在线直播推流数监控的方法、装置
CN111881353B (zh) 一种展示资源的推送方法、装置、电子设备和存储介质
US20160119664A1 (en) Method for selecting from a plurality of candidate video frame sets, a candidate video frame set to be inserted in a video frame slot of a given video content, corresponding device, arrangement and computer program product
US20140324602A1 (en) Managing distribution parameter utilization
CN113609176B (zh) 一种信息生成方法、装置、设备及存储介质
US20150372891A1 (en) System and method for facilitating the exchange of user traffic between web sites

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant