CN115774816B - 基于用户价值的内容淘汰方法、系统、设备及存储介质 - Google Patents

基于用户价值的内容淘汰方法、系统、设备及存储介质 Download PDF

Info

Publication number
CN115774816B
CN115774816B CN202310094594.6A CN202310094594A CN115774816B CN 115774816 B CN115774816 B CN 115774816B CN 202310094594 A CN202310094594 A CN 202310094594A CN 115774816 B CN115774816 B CN 115774816B
Authority
CN
China
Prior art keywords
user
executed
behavior
content
executing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202310094594.6A
Other languages
English (en)
Other versions
CN115774816A (zh
Inventor
李培真
罗新旺
曾舒煜
陈爱民
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chengdu Mengxiang Technology Co ltd
Original Assignee
Chengdu Mengxiang Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chengdu Mengxiang Technology Co ltd filed Critical Chengdu Mengxiang Technology Co ltd
Priority to CN202310094594.6A priority Critical patent/CN115774816B/zh
Publication of CN115774816A publication Critical patent/CN115774816A/zh
Application granted granted Critical
Publication of CN115774816B publication Critical patent/CN115774816B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本发明公开了基于用户价值的内容淘汰方法、系统、设备及存储介质,通过采集目标发布内容相关执行用户的历史行为数据来计算各执行用户的活跃熵和行为评分,再基于活跃熵和行为评分确定各执行用户的价值评分,然后根据目标发布内容各被执行行为的被执行次数、执行用户的价值评分以及执行用户的评分权重,计算各被执行行为的分项得分,再确定目标发布内容的内容评分,就可以依据内容评分对目标发布内容进行有效的淘汰判定。本发明充分考虑了内容执行用户的价值,用活跃熵和行为评分表征内容执行用户的价值,使得用户的价值评估更加合理,最终通过执行用户价值评分的加权,使得基于用户价值的内容评分更加高效、合理。

Description

基于用户价值的内容淘汰方法、系统、设备及存储介质
技术领域
本发明属于信息筛选技术领域,具体涉及基于用户价值的内容淘汰方法、系统、设备及存储介质。
背景技术
随着计算机网络技术和信息技术的发展,用户每日接收到的信息也爆发式的增加。如何在前端淘汰掉一些劣质的内容,让更多的用户接收到优质的内容,是当前行业亟待解决的问题。目前,内容的淘汰主要有三种方式,一种是人工审核的方式,通过对内容的人工审核过滤掉劣质的内容;一种是基于规则的过滤,包括内容关键词、内容长度、发布内容的作者信息等,基于设定的规则,过滤掉劣质内容;一种是基于内容的统计指标,如内容的浏览次数,浏览时长等,淘汰掉指标较低的内容。基于人工审核的方法需要大量的人力,成本较高;基于规则的过滤方法相对比较死板,容易误杀,将优质内容淘汰,或者将劣质内容当作优质内容,误差难以控制;基于内容统计指标的淘汰方法相对合理,但没有充分考虑到用户行为价值的重要程度,即没有考虑受众用户的行为价值对内容的决定性影响,不同价值用户的行为,对内容优劣评定的影响是不同的。
发明内容
本发明的目的是提供基于用户价值的内容淘汰方法、系统、设备及存储介质,用以解决现有技术中存在的上述问题。
为了实现上述目的,本发明采用以下技术方案:
第一方面,提供基于用户价值的内容淘汰方法,包括:
采集目标发布内容的被执行数据,所述被执行数据包括各被执行行为的被执行次数以及各被执行行为的执行用户;
获取各执行用户在应用端上的历史行为数据,组成历史行为数据集;
根据历史行为数据集确定各执行用户在各时段内发生的行为数、所有执行用户在各时段内发生的行为总数、各执行用户的日活跃次数、各执行用户的日活跃时长、各执行用户的发布内容数量、各执行用户发布内容的浏览时长、各执行用户发布内容的曝光/点击转换率以及各执行用户发布内容的点击/互动转换率;
根据各执行用户在各时段内发生的行为数以及所有执行用户在各时段内发生的行为总数,采用预置的活跃熵计算模型计算得到各执行用户的活跃熵;
根据各执行用户的日活跃次数、各执行用户的日活跃时长、各执行用户的发布内容数量、各执行用户发布内容的浏览时长、各执行用户发布内容的曝光/点击转换率以及各执行用户发布内容的点击/互动转换率,采用预置的行为评分计算模型计算得到各执行用户的行为评分;
根据各执行用户的活跃熵和行为评分计算得到各执行用户的价值评分;
根据相应被执行行为对应各执行用户的价值评分确定该被执行行为对应各执行用户的评分权重,根据各被执行行为的被执行次数、各被执行行为对应执行用户的价值评分以及各被执行行为对应执行用户的评分权重,计算得到各被执行行为的分项得分,根据各被执行行为的分项得分确定目标发布内容的内容评分;
根据目标发布内容的内容评分判定目标发布内容是否被淘汰,得到判定结果。
在一个可能的设计中,所述各被执行行为包括被查看、被收藏、被点赞以及被回复,所述根据各被执行行为的分项得分确定目标发布内容的内容评分,包括:将被查看、被收藏、被点赞以及被回复分别对应的分项得分相加,得到目标发布内容的内容评分。
在一个可能的设计中,所述根据各被执行行为的被执行次数、各被执行行为对应执行用户的价值评分以及各被执行行为对应执行用户的评分权重,计算得到各被执行行为的分项得分,包括:将相应被执行行为的被执行次数分别与对应各执行用户的价值评分相乘,再分别乘以对应各执行用户的评分权重,最后将各项相乘得到的结果相加,得到该被执行行为的分项得分。
在一个可能的设计中,所述活跃熵计算模型为
Figure SMS_1
其中,S表征活跃熵,
Figure SMS_2
表征执行用户在设定时段内发生的行为数,
Figure SMS_3
表征所有执行用户在设定时段内发生的行为总数,
Figure SMS_4
表征设定时段内的行为数参量,E表征所有执行用户的行为集合,t表征时段参量;
所述行为评分计算模型为
Figure SMS_5
其中,P表征行为评分,n表征执行用户的发布内容数量,u表征执行用户发布内容的编号,B表征执行用户发布内容的浏览时长,R表征执行用户发布内容的曝光/点击转换率,I表征执行用户发布内容的点击/互动转换率,T表征执行用户的日活跃时长,a表征执行用户的日活跃次数。
在一个可能的设计中,所述根据各执行用户的活跃熵和行为评分计算得到各执行用户的价值评分,包括:将对应执行用户的活跃熵与行为评分相乘,得到该执行用户的价值评分。
在一个可能的设计中,所述根据目标发布内容的内容评分判定目标发布内容是否被淘汰,包括:在目标发布内容的内容评分低于设定淘汰阈值时,判定目标发布内容被淘汰。
在一个可能的设计中,所述根据目标发布内容的内容评分判定目标发布内容是否被淘汰,包括:获取多个目标发布内容的内容评分,判定内容评分最低的若干个目标发布内容被淘汰。
第二方面,提供基于用户价值的内容淘汰系统,包括采集单元、获取单元、确定单元、第一计算单元、第二计算单元、第三计算单元、第四计算单元和判定单元,其中:
采集单元,用于采集目标发布内容的被执行数据,所述被执行数据包括各被执行行为的被执行次数以及各被执行行为的执行用户;
获取单元,用于获取各执行用户在应用端上的历史行为数据,组成历史行为数据集;
确定单元,用于根据历史行为数据集确定各执行用户在各时段内发生的行为数、所有执行用户在各时段内发生的行为总数、各执行用户的日活跃次数、各执行用户的日活跃时长、各执行用户的发布内容数量、各执行用户发布内容的浏览时长、各执行用户发布内容的曝光/点击转换率以及各执行用户发布内容的点击/互动转换率;
第一计算单元,用于根据各执行用户在各时段内发生的行为数以及所有执行用户在各时段内发生的行为总数,采用预置的活跃熵计算模型计算得到各执行用户的活跃熵;
第二计算单元,用于根据各执行用户的日活跃次数、各执行用户的日活跃时长、各执行用户的发布内容数量、各执行用户发布内容的浏览时长、各执行用户发布内容的曝光/点击转换率以及各执行用户发布内容的点击/互动转换率,采用预置的行为评分计算模型计算得到各执行用户的行为评分;
第三计算单元,用于根据各执行用户的活跃熵和行为评分计算得到各执行用户的价值评分;
第四计算单元,用于根据相应被执行行为对应各执行用户的价值评分确定该被执行行为对应各执行用户的评分权重,根据各被执行行为的被执行次数、各被执行行为对应执行用户的价值评分以及各被执行行为对应执行用户的评分权重,计算得到各被执行行为的分项得分,根据各被执行行为的分项得分确定目标发布内容的内容评分;
判定单元,用于根据目标发布内容的内容评分判定目标发布内容是否被淘汰,得到判定结果。
第三方面,提供基于用户价值的内容淘汰设备,包括:
存储器,用于存储指令;
处理器,用于读取所述存储器中存储的指令,并根据指令执行上述第一方面中任意一种所述的方法。
第四方面,提供一种计算机可读存储介质,所述计算机可读存储介质上存储有指令,当所述指令在计算机上运行时,使得所述计算机执行第一方面中任意一种所述的方法。同时,还提供一种包含指令的计算机程序产品,当所述指令在计算机上运行时,使所述计算机执行第一方面中任意一种所述的方法。
有益效果:本发明通过采集目标发布内容相关执行用户的历史行为数据来计算各执行用户的活跃熵和行为评分,再基于活跃熵和行为评分确定各执行用户的价值评分,然后根据目标发布内容各被执行行为的被执行次数、各被执行行为对应执行用户的价值评分以及各被执行行为对应执行用户的评分权重,计算各被执行行为的分项得分,再根据各分项得分确定目标发布内容的内容评分,就可以依据内容评分对目标发布内容进行有效的淘汰判定。本发明充分考虑了内容执行用户的价值,用活跃熵和行为评分表征内容执行用户的价值,使得用户的价值评估更加合理,最终通过执行用户价值评分的加权,使得基于用户价值的内容评分更加高效、合理,以准确淘汰劣质内容,保留优质内容。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例中方法的步骤示意图;
图2为本发明实施例中系统的构成示意图;
图3为本发明实施例中设备的构成示意图。
具体实施方式
在此需要说明的是,对于这些实施例方式的说明用于帮助理解本发明,但并不构成对本发明的限定。本文公开的特定结构和功能细节仅用于描述本发明的示例实施例。然而,可用很多备选的形式来体现本发明,并且不应当理解为本发明限制在本文阐述的实施例中。
应当理解,除非另有明确的规定和限定,术语“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在实施例中的具体含义。
在下面的描述中提供了特定的细节,以便于对示例实施例的完全理解。然而,本领域普通技术人员应当理解可以在没有这些特定细节的情况下实现示例实施例。例如可以在框图中示出系统,以避免用不必要的细节来使得示例不清楚。在其他实施例中,可以不以非必要的细节来示出众所周知的过程、结构和技术,以避免使得实施例不清楚。
实施例1:
本实施例提供基于用户价值的内容淘汰方法,可应用于相应的内容传播平台,如图1所示,方法包括以下步骤:
S1.采集目标发布内容的被执行数据,所述被执行数据包括各被执行行为的被执行次数以及各被执行行为的执行用户。
具体实施时,先确定要进行淘汰判定的目标发布内容,然后采集目标发布内容的被执行数据,所述被执行数据包括各被执行行为的被执行次数以及各被执行行为的执行用户,各被执行行为包括被查看、被收藏、被点赞以及被回复,各被执行行为的执行用户包括查看用户、收藏用户、点赞用户以及回复用户。
S2.获取各执行用户在应用端上的历史行为数据,组成历史行为数据集。
具体实施时,在确定各被执行行为的执行用户后,获取各执行用户在应用端上的历史行为数据,组成历史行为数据集。
S3.根据历史行为数据集确定各执行用户在各时段内发生的行为数、所有执行用户在各时段内发生的行为总数、各执行用户的日活跃次数、各执行用户的日活跃时长、各执行用户的发布内容数量、各执行用户发布内容的浏览时长、各执行用户发布内容的曝光/点击转换率以及各执行用户发布内容的点击/互动转换率。
具体实施时,可根据历史行为数据集确定各执行用户在各时段内发生的行为数(包括查看、收藏、点赞和回复各内容的次数)、所有执行用户在各时段内发生的行为总数(包括查看、收藏、点赞和回复各内容的次数)、各执行用户的日活跃次数(可以为平均日活跃次数或者指定日期的日活跃次数)、各执行用户的日活跃时长(可以为平均日活跃时长或者指定日期的日活跃时长)、各执行用户的发布内容数量、各执行用户发布内容的浏览时长、各执行用户发布内容的曝光/点击转换率以及各执行用户发布内容的点击/互动转换率。
S4.根据各执行用户在各时段内发生的行为数以及所有执行用户在各时段内发生的行为总数,采用预置的活跃熵计算模型计算得到各执行用户的活跃熵。
具体实施时,熵是随机变量不确定性的度量,活跃熵是把用户一天中各个时间段对应的熵值聚合累加起来而得到的体现用户一整天用户行为不确定性的度量。把用户在应用端一天的行为数据以一个离散时间序列来建模,用户在某一个时间段内的行为就是序列中对应时间点的随机变量。所述活跃熵计算模型为:
Figure SMS_6
其中,S表征活跃熵,
Figure SMS_7
表征执行用户在设定时段内发生的行为数,
Figure SMS_8
表征所有执行用户在设定时段内发生的行为总数,
Figure SMS_9
表征设定时段内的行为数参量,t表征时段参量,E表征所有执行用户的行为集合,执行用户发生行为的概率为。将各执行用户在各时段内发生的行为数以及所有执行用户在各时段内发生的行为总数代入活跃熵计算模型进行计算,就可以得到各执行用户的活跃熵,活跃熵较大的执行用户在应用端上的行为比较混乱多样,活跃熵较小的执行用户在应用端上的行为比较规律和固定,可认为行为多样的用户要比行为单一的用户更优质。
S5.根据各执行用户的日活跃次数、各执行用户的日活跃时长、各执行用户的发布内容数量、各执行用户发布内容的浏览时长、各执行用户发布内容的曝光/点击转换率以及各执行用户发布内容的点击/互动转换率,采用预置的行为评分计算模型计算得到各执行用户的行为评分。
具体实施时,行为评分是统计用户对于各内容的行为指标,所述行为评分计算模型为:
Figure SMS_10
其中,P表征行为评分,n表征执行用户的发布内容数量,u表征执行用户发布内容的编号,B表征执行用户发布内容的浏览时长,R表征执行用户发布内容的曝光/点击转换率,I表征执行用户发布内容的点击/互动转换率,T表征执行用户的日活跃时长,a表征执行用户的日活跃次数。将各执行用户的日活跃次数、各执行用户的日活跃时长、各执行用户的发布内容数量、各执行用户发布内容的浏览时长、各执行用户发布内容的曝光/点击转换率以及各执行用户发布内容的点击/互动转换率代入行为评分计算模型进行计算,就可以得到各执行用户的行为评分。
S6.根据各执行用户的活跃熵和行为评分计算得到各执行用户的价值评分。
具体实施时,在得到各执行用户的活跃熵和行为评分后,将对应执行用户的活跃熵与行为评分相乘,即可得到该执行用户的价值评分,执行用户的价值评分即反映该执行用户对于目标发布内容的淘汰评定价值。
S7.根据相应被执行行为对应各执行用户的价值评分确定该被执行行为对应各执行用户的评分权重,根据各被执行行为的被执行次数、各被执行行为对应执行用户的价值评分以及各被执行行为对应执行用户的评分权重,计算得到各被执行行为的分项得分,根据各被执行行为的分项得分确定目标发布内容的内容评分。
具体实施时,在得到各执行用户的价值评分后,先根据相应被执行行为对应各执行用户的价值评分确定该被执行行为对应各执行用户的评分权重,价值评分越高的执行用户其评分权重越大,具体权值可根据对应执行用户的价值评分在相应被执行行为所有执行用户价值评分总和中所占比例确定。然后根据各被执行行为的被执行次数、各被执行行为对应执行用户的价值评分以及各被执行行为对应执行用户的评分权重,计算得到各被执行行为的分项得分,具体包括:将相应被执行行为的被执行次数分别与对应各执行用户的价值评分相乘,再分别乘以对应各执行用户的评分权重,然后将各项相乘得到的结果相加,得到该被执行行为的分项得分。最后将各被执行行为的分项得分相加,即可得到目标发布内容的内容评分。
S8.根据目标发布内容的内容评分判定目标发布内容是否被淘汰,得到判定结果。
具体实施时,可采用阈值淘汰或者末尾淘汰的方式来根据目标发布内容的内容评分判定目标发布内容是否被淘汰。其中,阈值淘汰方式具体包括:在目标发布内容的内容评分低于设定淘汰阈值时,判定目标发布内容被淘汰,否则保留。末尾淘汰方式具体包括:获取多个目标发布内容的内容评分,判定内容评分最低的N个目标发布内容被淘汰,其余保留。两种方式可以切换应用,当内容的整体质量较高时可选择阈值淘汰方式,否则可选择末尾淘汰方式。
本实施例方法在进行内容淘汰判定的时候,不是直接计算目标发布内容的质量,而是通过相应用户的价值加权来确定内容评分;并且,统计用户价值评分时,提出了活跃熵和行为评分的概念,用活跃熵和行为评分来表征用户的价值,使得用户的价值评估更加合理,进而使内容的评分更加准确,内容的淘汰更加合理。
实施例2:
本实施例提供基于用户价值的内容淘汰系统,如图2所示,包括采集单元、获取单元、确定单元、第一计算单元、第二计算单元、第三计算单元、第四计算单元和判定单元,其中:
采集单元,用于采集目标发布内容的被执行数据,所述被执行数据包括各被执行行为的被执行次数以及各被执行行为的执行用户;
获取单元,用于获取各执行用户在应用端上的历史行为数据,组成历史行为数据集;
确定单元,用于根据历史行为数据集确定各执行用户在各时段内发生的行为数、所有执行用户在各时段内发生的行为总数、各执行用户的日活跃次数、各执行用户的日活跃时长、各执行用户的发布内容数量、各执行用户发布内容的浏览时长、各执行用户发布内容的曝光/点击转换率以及各执行用户发布内容的点击/互动转换率;
第一计算单元,用于根据各执行用户在各时段内发生的行为数以及所有执行用户在各时段内发生的行为总数,采用预置的活跃熵计算模型计算得到各执行用户的活跃熵;
第二计算单元,用于根据各执行用户的日活跃次数、各执行用户的日活跃时长、各执行用户的发布内容数量、各执行用户发布内容的浏览时长、各执行用户发布内容的曝光/点击转换率以及各执行用户发布内容的点击/互动转换率,采用预置的行为评分计算模型计算得到各执行用户的行为评分;
第三计算单元,用于根据各执行用户的活跃熵和行为评分计算得到各执行用户的价值评分;
第四计算单元,用于根据相应被执行行为对应各执行用户的价值评分确定该被执行行为对应各执行用户的评分权重,根据各被执行行为的被执行次数、各被执行行为对应执行用户的价值评分以及各被执行行为对应执行用户的评分权重,计算得到各被执行行为的分项得分,根据各被执行行为的分项得分确定目标发布内容的内容评分;
判定单元,用于根据目标发布内容的内容评分判定目标发布内容是否被淘汰,得到判定结果。
实施例3:
本实施例提供基于用户价值的内容淘汰设备,如图3所示,在硬件层面,包括:
数据接口,用于建立处理器与数据采集组件的数据对接,以采集目标发布内容的被执行数据,获取各执行用户在应用端上的历史行为数据;
存储器,用于存储指令;
处理器,用于读取所述存储器中存储的指令,并根据指令执行实施例1中基于用户价值的内容淘汰方法。
可选地,该设备还包括内部总线。处理器与存储器和数据接口可以通过内部总线相互连接,该内部总线可以是ISA(Industry Standard Architecture,工业标准体系结构)总线、PCI(Peripheral Component Interconnect,外设部件互连标准)总线或EISA(Extended IndustryStandard Architecture,扩展工业标准结构)总线等。所述总线可以分为地址总线、数据总线、控制总线等。
所述存储器可以但不限于包括随机存取存储器(Random Access Memory,RAM)、只读存储器(Read Only Memory,ROM)、闪存(FlashMemory)、先进先出存储器(FirstInputFirst Output,FIFO)和/或先进后出存储器(First In Last Out,FILO)等。所述处理器可以是通用处理器,包括中央处理器(CentralProcessing Unit,CPU)、网络处理器(NetworkProcessor,NP)等;还可以是数字信号处理器(Digital SignalProcessor,DSP)、专用集成电路(Application SpecificIntegrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
实施例4:
本实施例提供一种计算机可读存储介质,所述计算机可读存储介质上存储有指令,当所述指令在计算机上运行时,使得所述计算机执行实施例1中基于用户价值的内容淘汰方法。其中,所述计算机可读存储介质是指存储数据的载体,可以但不限于包括软盘、光盘、硬盘、闪存、优盘和/或记忆棒(MemoryStick)等,所述计算机可以是通用计算机、专用计算机、计算机网络或者其他可编程系统。
本实施例还提供一种包含指令的计算机程序产品,当所述指令在计算机上运行时,使所述计算机执行实施例1中的基于用户价值的内容淘汰方法。其中,所述计算机可以是通用计算机、专用计算机、计算机网络或者其他可编程系统。
最后应说明的是:以上所述仅为本发明的优选实施例而已,并不用于限制本发明的保护范围。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.基于用户价值的内容淘汰方法,其特征在于,包括:
采集目标发布内容的被执行数据,所述被执行数据包括各被执行行为的被执行次数以及各被执行行为的执行用户;
获取各执行用户在应用端上的历史行为数据,组成历史行为数据集;
根据历史行为数据集确定各执行用户在各时段内发生的行为数、所有执行用户在各时段内发生的行为总数、各执行用户的日活跃次数、各执行用户的日活跃时长、各执行用户的发布内容数量、各执行用户发布内容的浏览时长、各执行用户发布内容的曝光/点击转换率以及各执行用户发布内容的点击/互动转换率;
根据各执行用户在各时段内发生的行为数以及所有执行用户在各时段内发生的行为总数,采用预置的活跃熵计算模型计算得到各执行用户的活跃熵;
根据各执行用户的日活跃次数、各执行用户的日活跃时长、各执行用户的发布内容数量、各执行用户发布内容的浏览时长、各执行用户发布内容的曝光/点击转换率以及各执行用户发布内容的点击/互动转换率,采用预置的行为评分计算模型计算得到各执行用户的行为评分;
根据各执行用户的活跃熵和行为评分计算得到各执行用户的价值评分;
根据相应被执行行为对应各执行用户的价值评分确定该被执行行为对应各执行用户的评分权重,根据各被执行行为的被执行次数、各被执行行为对应执行用户的价值评分以及各被执行行为对应执行用户的评分权重,计算得到各被执行行为的分项得分,根据各被执行行为的分项得分确定目标发布内容的内容评分;
根据目标发布内容的内容评分判定目标发布内容是否被淘汰,得到判定结果。
2.根据权利要求1所述的基于用户价值的内容淘汰方法,其特征在于,所述各被执行行为包括被查看、被收藏、被点赞以及被回复,所述根据各被执行行为的分项得分确定目标发布内容的内容评分,包括:将被查看、被收藏、被点赞以及被回复分别对应的分项得分相加,得到目标发布内容的内容评分。
3.根据权利要求1所述的基于用户价值的内容淘汰方法,其特征在于,所述根据各被执行行为的被执行次数、各被执行行为对应执行用户的价值评分以及各被执行行为对应执行用户的评分权重,计算得到各被执行行为的分项得分,包括:将相应被执行行为的被执行次数分别与对应各执行用户的价值评分相乘,再分别乘以对应各执行用户的评分权重,最后将各项相乘得到的结果相加,得到该被执行行为的分项得分。
4.根据权利要求1所述的基于用户价值的内容淘汰方法,其特征在于,所述活跃熵计算模型为
Figure QLYQS_1
其中,S表征活跃熵,
Figure QLYQS_2
表征执行用户在设定时段内发生的行为数,
Figure QLYQS_3
表征所有执行用户在设定时段内发生的行为总数,
Figure QLYQS_4
表征设定时段内的行为数参量,E表征所有执行用户的行为集合,t表征时段参量;
所述行为评分计算模型为
Figure QLYQS_5
其中,P表征行为评分,n表征执行用户的发布内容数量,u表征执行用户发布内容的编号,B表征执行用户发布内容的浏览时长,R表征执行用户发布内容的曝光/点击转换率,I表征执行用户发布内容的点击/互动转换率,T表征执行用户的日活跃时长,a表征执行用户的日活跃次数。
5.根据权利要求1所述的基于用户价值的内容淘汰方法,其特征在于,所述根据各执行用户的活跃熵和行为评分计算得到各执行用户的价值评分,包括:将对应执行用户的活跃熵与行为评分相乘,得到该执行用户的价值评分。
6.根据权利要求1所述的基于用户价值的内容淘汰方法,其特征在于,所述根据目标发布内容的内容评分判定目标发布内容是否被淘汰,包括:在目标发布内容的内容评分低于设定淘汰阈值时,判定目标发布内容被淘汰。
7.根据权利要求1所述的基于用户价值的内容淘汰方法,其特征在于,所述根据目标发布内容的内容评分判定目标发布内容是否被淘汰,包括:获取多个目标发布内容的内容评分,判定内容评分最低的若干个目标发布内容被淘汰。
8.基于用户价值的内容淘汰系统,其特征在于,包括采集单元、获取单元、确定单元、第一计算单元、第二计算单元、第三计算单元、第四计算单元和判定单元,其中:
采集单元,用于采集目标发布内容的被执行数据,所述被执行数据包括各被执行行为的被执行次数以及各被执行行为的执行用户;
获取单元,用于获取各执行用户在应用端上的历史行为数据,组成历史行为数据集;
确定单元,用于根据历史行为数据集确定各执行用户在各时段内发生的行为数、所有执行用户在各时段内发生的行为总数、各执行用户的日活跃次数、各执行用户的日活跃时长、各执行用户的发布内容数量、各执行用户发布内容的浏览时长、各执行用户发布内容的曝光/点击转换率以及各执行用户发布内容的点击/互动转换率;
第一计算单元,用于根据各执行用户在各时段内发生的行为数以及所有执行用户在各时段内发生的行为总数,采用预置的活跃熵计算模型计算得到各执行用户的活跃熵;
第二计算单元,用于根据各执行用户的日活跃次数、各执行用户的日活跃时长、各执行用户的发布内容数量、各执行用户发布内容的浏览时长、各执行用户发布内容的曝光/点击转换率以及各执行用户发布内容的点击/互动转换率,采用预置的行为评分计算模型计算得到各执行用户的行为评分;
第三计算单元,用于根据各执行用户的活跃熵和行为评分计算得到各执行用户的价值评分;
第四计算单元,用于根据相应被执行行为对应各执行用户的价值评分确定该被执行行为对应各执行用户的评分权重,根据各被执行行为的被执行次数、各被执行行为对应执行用户的价值评分以及各被执行行为对应执行用户的评分权重,计算得到各被执行行为的分项得分,根据各被执行行为的分项得分确定目标发布内容的内容评分;
判定单元,用于根据目标发布内容的内容评分判定目标发布内容是否被淘汰,得到判定结果。
9.基于用户价值的内容淘汰设备,其特征在于,包括:
存储器,用于存储指令;
处理器,用于读取所述存储器中存储的指令,并根据指令执行权利要求1-7任意一项所述的方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有指令,当所述指令在计算机上运行时,使得所述计算机执行权利要求1-7任意一项所述的方法。
CN202310094594.6A 2023-02-10 2023-02-10 基于用户价值的内容淘汰方法、系统、设备及存储介质 Active CN115774816B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310094594.6A CN115774816B (zh) 2023-02-10 2023-02-10 基于用户价值的内容淘汰方法、系统、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310094594.6A CN115774816B (zh) 2023-02-10 2023-02-10 基于用户价值的内容淘汰方法、系统、设备及存储介质

Publications (2)

Publication Number Publication Date
CN115774816A CN115774816A (zh) 2023-03-10
CN115774816B true CN115774816B (zh) 2023-04-11

Family

ID=85393505

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310094594.6A Active CN115774816B (zh) 2023-02-10 2023-02-10 基于用户价值的内容淘汰方法、系统、设备及存储介质

Country Status (1)

Country Link
CN (1) CN115774816B (zh)

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103544212A (zh) * 2013-09-09 2014-01-29 Tcl集团股份有限公司 一种内容推荐方法及系统
CN106251172A (zh) * 2016-07-20 2016-12-21 武汉斗鱼网络科技有限公司 一种基于熵值法的用户价值评分计算方法及系统
CN107391680A (zh) * 2017-07-24 2017-11-24 北京京东尚科信息技术有限公司 内容推荐方法、装置和设备
CN112184046A (zh) * 2020-10-12 2021-01-05 上海移卓网络科技有限公司 广告业务用户价值评估方法、装置、设备及存储介质
CN112819566A (zh) * 2021-01-20 2021-05-18 符丁 一种基于价值的推荐方法
CN113342626A (zh) * 2021-05-28 2021-09-03 深圳市前海房极客网络科技有限公司 内容处理方法、装置、电子设备及存储介质
CN115203568A (zh) * 2022-07-21 2022-10-18 腾讯科技(深圳)有限公司 一种基于深度学习模型的内容推荐方法、相关装置及设备
CN115375177A (zh) * 2022-09-14 2022-11-22 康键信息技术(深圳)有限公司 用户价值评估方法、装置、电子设备及存储介质

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11347752B2 (en) * 2018-07-23 2022-05-31 Apple Inc. Personalized user feed based on monitored activities
US11669431B2 (en) * 2019-01-11 2023-06-06 Google Llc Analytics personalization framework

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103544212A (zh) * 2013-09-09 2014-01-29 Tcl集团股份有限公司 一种内容推荐方法及系统
CN106251172A (zh) * 2016-07-20 2016-12-21 武汉斗鱼网络科技有限公司 一种基于熵值法的用户价值评分计算方法及系统
CN107391680A (zh) * 2017-07-24 2017-11-24 北京京东尚科信息技术有限公司 内容推荐方法、装置和设备
CN112184046A (zh) * 2020-10-12 2021-01-05 上海移卓网络科技有限公司 广告业务用户价值评估方法、装置、设备及存储介质
CN112819566A (zh) * 2021-01-20 2021-05-18 符丁 一种基于价值的推荐方法
CN113342626A (zh) * 2021-05-28 2021-09-03 深圳市前海房极客网络科技有限公司 内容处理方法、装置、电子设备及存储介质
CN115203568A (zh) * 2022-07-21 2022-10-18 腾讯科技(深圳)有限公司 一种基于深度学习模型的内容推荐方法、相关装置及设备
CN115375177A (zh) * 2022-09-14 2022-11-22 康键信息技术(深圳)有限公司 用户价值评估方法、装置、电子设备及存储介质

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
R. Latha 等.Analysing exposure diversity in collaborative recommender systems—Entropy fusion approach.《Physica A: Statistical Mechanics and its Applications》.2019,第533卷1-17. *
刘莉莉.基于推荐理论的P2P用户价值研究.《中国优秀硕士学位论文全文数据库 经济与管理科学辑》.2022,(第06期),J152-1262. *

Also Published As

Publication number Publication date
CN115774816A (zh) 2023-03-10

Similar Documents

Publication Publication Date Title
CN110210508B (zh) 模型生成方法、异常流量检测方法、装置、电子设备、计算机可读存储介质
CN108170692A (zh) 一种热点事件信息处理方法和装置
CN108960314B (zh) 基于难样本的训练方法、装置及电子设备
CN107463904A (zh) 一种确定事件周期值的方法及装置
CN105869022B (zh) 一种应用流行度预测方法和装置
CN111784173B (zh) Ab实验数据处理方法、装置、服务器及介质
CN111681102A (zh) 信贷预测方法、装置、设备和存储介质
CN111159481B (zh) 图数据的边预测方法、装置及终端设备
CN116362823A (zh) 用于行为稀疏场景的推荐模型训练方法、推荐方法及装置
CN114662772A (zh) 交通噪音预警方法、模型训练方法、装置、设备及介质
CN115774816B (zh) 基于用户价值的内容淘汰方法、系统、设备及存储介质
CN115203496A (zh) 基于大数据的项目智能预测及评估方法、系统及可读存储介质
CN113554350A (zh) 活跃度评估方法、装置、电子设备及计算机可读存储介质
CN114650239B (zh) 一种数据的刷量识别方法、存储介质和电子设备
CN112434717B (zh) 一种模型训练方法及装置
CN112883267A (zh) 基于深度学习的数据热度统计方法及装置
CN111783883A (zh) 一种异常数据的检测方法及装置
CN116739172A (zh) 一种基于爬坡识别的海上风电功率超短期预测方法及装置
CN114493250A (zh) 一种异常行为检测方法、计算设备及可读存储介质
CN110362831B (zh) 目标用户识别方法、装置、电子设备及存储介质
CN112149833B (zh) 基于机器学习的预测方法、装置、设备和存储介质
CN109086207B (zh) 页面响应故障分析方法、计算机可读存储介质及终端设备
CN109670976B (zh) 特征因子确定方法及设备
CN110399399B (zh) 用户分析的方法、装置、电子设备和存储介质
CN112148764B (zh) 特征的筛选方法、装置、设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant