CN114756698A - 一种播放行为检测方法、设备及存储介质 - Google Patents

一种播放行为检测方法、设备及存储介质 Download PDF

Info

Publication number
CN114756698A
CN114756698A CN202210405740.8A CN202210405740A CN114756698A CN 114756698 A CN114756698 A CN 114756698A CN 202210405740 A CN202210405740 A CN 202210405740A CN 114756698 A CN114756698 A CN 114756698A
Authority
CN
China
Prior art keywords
abnormal
user
media resource
media
bipartite graph
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210405740.8A
Other languages
English (en)
Inventor
李永建
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Music Entertainment Technology Shenzhen Co Ltd
Original Assignee
Tencent Music Entertainment Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Music Entertainment Technology Shenzhen Co Ltd filed Critical Tencent Music Entertainment Technology Shenzhen Co Ltd
Priority to CN202210405740.8A priority Critical patent/CN114756698A/zh
Publication of CN114756698A publication Critical patent/CN114756698A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/40Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
    • G06F16/48Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/489Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using time information
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/2433Single-class perspective, e.g. one-against-all classification; Novelty detection; Outlier detection

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Library & Information Science (AREA)
  • Multimedia (AREA)
  • Databases & Information Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请公开了计算机技术领域内的一种播放行为检测方法、设备及存储介质,本申请将不同时长的媒体资源的实际播放量量化至同一维度进行比较,使得原本没有可比性的数据具备可比性,适用于对不同时长的媒体资源进行检测;同时不单单检测用户特征,而是检测所有用户的异常嫌疑度和所有媒体资源的异常嫌疑度,因此检测比较全面,漏检率较低,可以准确判别刷量行为,检测出存在刷量行为的用户和媒体资源。相应地,本申请提供的播放行为检测设备及存储介质,也同样具有上述技术效果。

Description

一种播放行为检测方法、设备及存储介质
技术领域
本申请涉及计算机技术领域,特别涉及一种播放行为检测方法、设备及存储介质。
背景技术
目前,不仅电商平台存在刷单行为,媒体展示平台上也存在刷量行为,导致平台出现异常播放数据。例如:歌曲A时长20秒,那么单用户一天播放1000次属于正常现象,因为歌曲A单曲循环一天可以播放4320次。若歌曲B时长5分钟,单用户一天播放500次大概率就是刷量了,因为歌曲B单曲循环一天只能播放288次。
当前一般通过用户特征来判别用户是否存在刷量行为,但该方式容易被绕过和对抗,漏检率较高。并且,现有的检测算法不适用于对不同时长的媒体资源进行检测。
发明内容
有鉴于此,本申请的目的在于提供一种播放行为检测方法、设备及存储介质,以检测存在刷量行为的用户和媒体资源。其具体方案如下:
为实现上述目的,一方面,本申请提供了一种播放行为检测方法,包括:
获取预设时间段内,目标媒体平台中各用户针对各媒体资源的实际播放量;
基于各媒体资源的总时长和预设基准时长,将各个实际播放量分别量化为能够在同一维度比较的标准播放量,得到各用户针对各媒体资源的标准播放量;
根据各用户针对各媒体资源的标准播放量确定各用户的异常嫌疑度和各媒体资源的异常嫌疑度;
基于各用户的异常嫌疑度和各媒体资源的异常嫌疑度筛查存在异常播放行为的异常媒体资源和异常用户。
可选地,所述基于各媒体资源的总时长和预设基准时长,将各个实际播放量分别量化为能够在同一维度比较的标准播放量,包括:
针对每个媒体资源,计算任一媒体资源的总时长和所述预设基准时长的比值,将任一用户针对该媒体资源的实际播放量与所述比值的乘积作为该用户针对该媒体资源的标准播放量。
可选地,所述根据各用户针对各媒体资源的标准播放量确定各用户的异常嫌疑度和各媒体资源的异常嫌疑度,包括:
以各用户和各媒体资源作为二部图节点,以各用户针对各媒体资源的标准播放量确定二部图边,构建目标二部图;
基于所述目标二部图计算各用户的异常嫌疑度和各媒体资源的异常嫌疑度。
可选地,所述目标二部图中通过所述二部图边互联的任一用户针对任一媒体资源的任一次播放行为的异常嫌疑度h的计算公式为:h=1/log(x+5);其中,x为该用户针对该媒体资源的标准播放量。
可选地,所述基于各用户的异常嫌疑度和各媒体资源的异常嫌疑度筛查存在异常播放行为的异常媒体资源和异常用户,包括:
判断当前目标二部图中的节点数是否为0;
若当前目标二部图中的节点数不为0,则计算各个异常嫌疑度的均值,并从当前目标二部图中删除异常嫌疑度最小的二部图节点,以更新所述目标二部图,针对更新后的目标二部图迭代执行所述判断当前目标二部图中的节点数是否为0的步骤;
若当前目标二部图中的节点数为0,则从所有均值中选择最大均值,并将所述最大均值之后被删除的各个二部图节点确定为存在异常播放行为的异常媒体资源和异常用户。
可选地,所述计算各个异常嫌疑度的均值,包括:
按照目标公式计算各个异常嫌疑度的均值;所述目标公式为:F(G)=[f(U)+f(S)]/(U+S);其中,F(G)为所述均值,f(U)为各用户的异常嫌疑度总和,f(S)为各媒体资源的异常嫌疑度总和,U为用户数,S为媒体资源数。
可选地,所述根据各用户针对各媒体资源的标准播放量确定各用户的异常嫌疑度和各媒体资源的异常嫌疑度之前,还包括:
任一用户针对任一媒体资源的标准播放量小于预设阈值,则删除该用户、该媒体资源以及该用户针对该媒体资源的标准播放量。
可选地,所述基于各用户的异常嫌疑度和各媒体资源的异常嫌疑度筛查存在异常播放行为的异常媒体资源和异常用户之后,还包括:
对所述异常媒体资源和所述异常用户进行标记;
根据所述标记调整异常播放行为的检测规则、媒体资源热度排行榜和/或媒体资源推荐榜。
又一方面,本申请还提供了一种电子设备,所述电子设备包括处理器和存储器;其中,所述存储器用于存储计算机程序,所述计算机程序由所述处理器加载并执行以实现前述播放行为检测方法。
又一方面,本申请还提供了一种存储介质,所述存储介质中存储有计算机可执行指令,所述计算机可执行指令被处理器加载并执行时,实现前述播放行为检测方法。
本申请在获取到预设时间段内,目标媒体平台中各用户针对各媒体资源的实际播放量后,首先基于各媒体资源的总时长和预设基准时长将各个实际播放量分别量化为能够在同一维度比较的标准播放量,从而得到各用户针对各媒体资源的标准播放量,使得不同时长的媒体资源能够在同一维度比较其播放量;之后根据各用户针对各媒体资源的标准播放量确定各用户的异常嫌疑度和各媒体资源的异常嫌疑度;基于各用户的异常嫌疑度和各媒体资源的异常嫌疑度筛查存在异常播放行为的异常媒体资源和异常用户,从而筛查出存在刷量播放行为的异常媒体资源和异常用户。该方案能够将不同时长的媒体资源的实际播放量量化至同一维度进行比较,使得原本没有可比性的数据具备可比性,适用于对不同时长的媒体资源进行检测;同时不单单检测用户特征,而是检测所有用户的异常嫌疑度和所有媒体资源的异常嫌疑度,因此检测比较全面,漏检率较低,可以准确判别刷量行为,检测出存在刷量行为的用户和媒体资源。
相应地,本申请提供的播放行为检测设备及存储介质,也同样具有上述技术效果。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本申请提供的一种本申请适用的物理架构示意图;
图2为本申请提供的一种播放行为检测方法流程图;
图3为本申请提供的一种二部图示意图;
图4为本申请提供的一种异常嫌疑度均值的变化曲线图;
图5为本申请提供的一种二部图迭代过程示意图;
图6为本申请提供的另一种播放行为检测方法流程图;
图7为本申请提供的一种服务器结构图;
图8为本申请提供的一种终端结构图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述。显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。另外,在本申请实施例中,“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。
现有技术一般通过用户特征来判别用户是否存在刷量行为,但该方式容易被绕过和对抗,漏检率较高。并且,现有的检测算法不适用于对不同时长的媒体资源进行检测。
鉴于目前所存在的上述问题,本申请提出了播放行为检测方案,该方案适用于对不同时长的媒体资源进行刷量检测,漏检率较低。
为了便于理解,先对本申请所适用的物理框架进行介绍。
应理解,本申请提供的播放行为检测方法可以应用于具有播放行为检测功能的系统或程序中。具体的,具有播放行为检测功能的系统或程序可以运行于服务器、个人计算机等设备中。
如图1所示,图1为本申请适用的物理架构示意图。在图1中,具有播放行为检测功能的系统或程序可以运行于服务器,该服务器通过网络从其他终端设备中获取预设时间段内,目标媒体平台中各用户针对各媒体资源的实际播放量;基于各媒体资源的总时长和预设基准时长,将各个实际播放量分别量化为能够在同一维度比较的标准播放量,得到各用户针对各媒体资源的标准播放量;根据各用户针对各媒体资源的标准播放量确定各用户的异常嫌疑度和各媒体资源的异常嫌疑度;基于各用户的异常嫌疑度和各媒体资源的异常嫌疑度筛查存在异常播放行为的异常媒体资源和异常用户。
由图1可知,该服务器可以与多个设备建立通信连接,服务器从这些设备中获取预设时间段内,目标媒体平台中各用户针对各媒体资源的实际播放量,而后按照本申请筛查存在异常播放行为的异常媒体资源和异常用户。
图1中示出了多种终端设备,在实际场景中可以有更多或更少种类的终端设备参与到播放行为检测的过程中,具体数量和种类因实际场景而定,此处不做限定,另外,图1中示出了一个服务器,但在实际场景中,也可以有多个服务器的参与,具体服务器数量因实际场景而定。
应当注意的是,本实施例提供的播放行为检测方法可以离线进行,即服务器本地存储有预设时间段内,目标媒体平台中各用户针对各媒体资源的实际播放量,其可以直接利用本申请提供的方案确定存在异常播放行为的异常媒体资源和异常用户。
可以理解的是,上述具有播放行为检测功能的系统、程序,可以作为云端服务程序的一种,具体运作模式因实际场景而定,此处不做限定。
具体的,在播放行为检测完成后,可以基于存在异常播放行为的异常媒体资源和异常用户调整平台中的热度榜单、推荐榜单等内容,以从热度榜单、推荐榜单中剔除异常媒体资源或异常用户。
结合以上共性,请参见图2,图2为本申请实施例提供的第一种播放行为检测方法流程图。如图2所示,该播放行为检测方法可以包括以下步骤:
S201、获取预设时间段内,目标媒体平台中各用户针对各媒体资源的实际播放量。
其中,目标媒体平台可以为短视频平台、音乐平台、影视平台等,相应地,媒体资源可以为短视频、歌曲、戏曲、影视剧等,那么实际播放量可以是播放次数。为了去除无效播放次数(如:因用户误操作产生的播放次数),可以设定有效播放次数的判断条件。例如:当某一用户针对某一媒体资源的播放时间与媒体资源总时长的比值大于某一阈值(如0.9)时,认为当前播放次数有效,那么该用户针对该媒体资源的播放次数累计增一;反之,当该用户针对该媒体资源的播放时间与媒体资源总时长的比值不大于该阈值时,认为当前播放次数无效,那么该用户针对该媒体资源的播放次数保持不变。当然,也可以不去除无效播放次数,只要某一媒体资源被播放,则相应的播放次数累计增一。
为了便于进行数据处理,本实施例设定了一个预设时间段,针对这一段时间内各用户针对各媒体资源的实际播放量进行处理。其中,预设时间段可以基于实际需求灵活设定,如24小时、半个月或一个月等。
在本实施例中,更细粒度地记录任一用户针对任一媒体资源的实际播放量。例如:某一用户在24小时内播放了某一歌曲10次。其中,不同用户可以使用设备IP、用户账号和/或设备ID等信息进行标记。
S202、基于各媒体资源的总时长和预设基准时长,将各个实际播放量分别量化为能够在同一维度比较的标准播放量,得到各用户针对各媒体资源的标准播放量。
其中,媒体资源的总时长如:一首歌的总时长、一部电影的总时长等。预设基准时长可以基于媒体资源的类型进行设定。媒体资源的类型如:短视频、歌曲、戏曲、影视剧等。假设媒体资源为歌曲,那么预设基准时长可以取3分钟,因为一首歌的总时长一般为3-5分钟,也即:预设基准时长可以取媒体资源通用时长的一半。
基于S202,可以将S201获取的各个实际播放量量化为能够在同一维度比较的标准播放量,也就得到了各个标准播放量。在一种具体实施方式中,基于各媒体资源的总时长和预设基准时长,将各个实际播放量分别量化为能够在同一维度比较的标准播放量,包括:针对每个媒体资源,计算任一媒体资源的总时长和预设基准时长的比值,将任一用户针对该媒体资源的实际播放量与比值的乘积作为该用户针对该媒体资源的标准播放量。可见,对于任一用户针对任一媒体资源的实际播放量,量化公式可以为:标准播放量=实际播放量×(媒体资源总时长/预设基准时长),据此公式可使原本没有可比性的各实际播放量转化为具备可比性的各标准播放量。
S203、根据各用户针对各媒体资源的标准播放量确定各用户的异常嫌疑度和各媒体资源的异常嫌疑度。
本实施例可以借助Fraudar算法确定各用户的异常嫌疑度和各媒体资源的异常嫌疑度。借助Fraudar算法原理可以将各用户和各媒体资源作为二部图节点,并以各用户针对各媒体资源的标准播放量确定二部图边,从而构建目标二部图,后续基于此目标二部图可计算各用户的异常嫌疑度和各媒体资源的异常嫌疑度。目标二部图可参照图3,图3示例了各用户(图3中的各个圆圈)与各歌曲(图3中的“青花瓷”、“忘情水”、“拥抱”、“最近”)构建的二部图,某一用户与某一歌曲间的连线表示该用户对该歌曲的标准播放量,连线越粗表示异常嫌疑度越大。如图3所示,一个节点所连线条越多,该节点的刷量风险就越大,也即:聚集性越高,刷量风险就越高。
其中,二部图中的用户节点,可以使用设备IP、用户账号和/或设备ID进行表示,若基于设备IP、用户账号或设备ID表示的用户节点针对同一批歌曲进行筛查,那么可以得到3个相同的筛查结果。
在一种具体实施方式中,根据各用户针对各媒体资源的标准播放量确定各用户的异常嫌疑度和各媒体资源的异常嫌疑度,包括:以各用户和各媒体资源作为二部图节点,以各用户针对各媒体资源的标准播放量确定二部图边,构建目标二部图;基于目标二部图计算各用户的异常嫌疑度和各媒体资源的异常嫌疑度。其中,目标二部图中通过二部图边互联的任一用户针对任一媒体资源的任一次播放行为的异常嫌疑度h的计算公式为:h=1/log(x+5);其中,x为该用户针对该媒体资源的标准播放量。据此可知,任一用户针对任一媒体资源的100次播放行为的异常嫌疑度总和为:100×h,所以任一用户针对任一媒体资源的异常嫌疑度=该用户针对该媒体资源的标准播放量×该用户针对该媒体资源的任一次播放行为的异常嫌疑度h。可见,h为任一用户针对任一媒体资源的单次播放嫌疑度。
S204、基于各用户的异常嫌疑度和各媒体资源的异常嫌疑度筛查存在异常播放行为的异常媒体资源和异常用户。
需要说明的是,基于Fraudar算法构建得到二部图后,迭代计算各节点的异常嫌疑度并删除一个异常嫌疑度最小的节点,直至二部图中的节点被删除完。具体的,任一次迭代需要执行如下步骤:判断当前节点数是否为0;若否,则计算各节点的异常嫌疑度,计算各个异常嫌疑度的均值,从当前二部图中删除异常嫌疑度最小的二部图节点;若是,则迭代结束。迭代结束后,找出最大均值,那么在最大均值之后删除的各节点即为异常节点。迭代过程中均值F(G)的变化曲线如图4所示。图4中的目标留存节点即:各异常节点。
在一种具体实施方式中,基于各用户的异常嫌疑度和各媒体资源的异常嫌疑度筛查存在异常播放行为的异常媒体资源和异常用户,包括:判断当前目标二部图中的节点数是否为0;若当前目标二部图中的节点数不为0,则计算各个异常嫌疑度的均值,并从当前目标二部图中删除异常嫌疑度最小的二部图节点,以更新目标二部图,针对更新后的目标二部图迭代执行判断当前目标二部图中的节点数是否为0的步骤;若当前目标二部图中的节点数为0,则从所有均值中选择最大均值,并将最大均值之后被删除的各个二部图节点确定为存在异常播放行为的异常媒体资源和异常用户。
在一种具体实施方式中,计算各个异常嫌疑度的均值,包括:按照目标公式计算各个异常嫌疑度的均值;目标公式为:F(G)=[f(U)+f(S)]/(U+S);其中,F(G)为均值,f(U)为各用户的异常嫌疑度总和,f(S)为各媒体资源的异常嫌疑度总和,U为用户数,S为媒体资源数。
本实施例在获取到预设时间段内,目标媒体平台中各用户针对各媒体资源的实际播放量后,首先基于各媒体资源的总时长和预设基准时长将各个实际播放量分别量化为能够在同一维度比较的标准播放量,从而得到各用户针对各媒体资源的标准播放量,使得不同时长的媒体资源能够在同一维度比较其播放量;之后根据各用户针对各媒体资源的标准播放量确定各用户的异常嫌疑度和各媒体资源的异常嫌疑度;基于各用户的异常嫌疑度和各媒体资源的异常嫌疑度筛查存在异常播放行为的异常媒体资源和异常用户,从而筛查出存在刷量播放行为的异常媒体资源和异常用户。
可见,本实施例能够将不同时长的媒体资源的实际播放量量化至同一维度进行比较,使得原本没有可比性的数据具备可比性,适用于对不同时长的媒体资源进行检测;同时不单单检测用户特征,而是检测所有用户的异常嫌疑度和所有媒体资源的异常嫌疑度,因此检测比较全面,漏检率较低,可以准确判别刷量行为,检测出存在刷量行为的用户和媒体资源。
基于上述实施例,需要说明的是,为了降低计算复杂度,可以先剔除明显不存在嫌疑的用户或媒体资源。因此在一种具体实施方式中,根据各用户针对各媒体资源的标准播放量确定各用户的异常嫌疑度和各媒体资源的异常嫌疑度之前,还包括:任一用户针对任一媒体资源的标准播放量小于预设阈值,则删除该用户、该媒体资源以及该用户针对该媒体资源的标准播放量。由于标准播放量是播放次数的量化值,因此在某一用户针对某一媒体资源的标准播放量较小时,说明该用户并未恶意增加针对该媒体资源的播放次数,也就是说:该用户是正常浏览该媒体资源,基本可以排除刷量嫌疑,因此可以删除符合此条件的用户、媒体资源以及相应标准播放量。如此一来,二部图节点将会更少,更便于找出异常节点。
若筛查出的异常媒体资源、异常用户已在平台的热度榜单、推荐榜单中,那么就需要从热度榜单、推荐榜单中删除异常媒体资源、异常用户,以免刷量行为影响热度榜单、推荐榜单的评估。因此在一种具体实施方式中,基于各用户的异常嫌疑度和各媒体资源的异常嫌疑度筛查存在异常播放行为的异常媒体资源和异常用户之后,还包括:对异常媒体资源和异常用户进行标记;根据标记调整异常播放行为的检测规则、媒体资源热度排行榜和/或媒体资源推荐榜。其中,异常播放行为的检测规则也可以检测出平台中的异常媒体资源、异常用户,但不如本申请筛查出的异常媒体资源、异常用户更全面,因此可以基于本申请筛查出的异常媒体资源、异常用户进一步调整检测规则,以提升检测规则的检测准确率。基于本申请筛查出的异常媒体资源、异常用户调整检测规则,包括:在检测规则中增加针对异常媒体资源、异常用户的检测特征。检测特征如:异常媒体资源的名称、ID、关键词等,异常用户的设备IP、设备ID、账号等。
基于上述实施例,需要说明的是,原有的Fraudar算法针对不同时长的媒体资源筛查异常时,Fraudar“偏爱”时长较短的媒体资源,但时长较短的媒体资源的播放次数更容易比时长较长的媒体资源的播放次数多,因此若基于实际播放次数从不同时长的媒体资源中筛查异常,Fraudar能错误地将时长较短的媒体资源判定为异常资源。为此,本申请将实际播放次数统一量化为标准播放次数,这样媒体资源的时长就不会影响Fraudar的判定,因此Fraudar可输出相对准确的判定结果。
因此在将实际播放次数统一量化为标准播放次数后,可以使用Fraudar算法确定异常用户和异常媒体资源,在基于Fraudar算法构建二部图后,可以按照上述实施例所述的异常嫌疑度h的计算公式h=1/log(x+5),计算各节点的异常嫌疑度。之后,基于Fraudar算法并运用贪心思想,迭代删除嫌疑度最低的用户节点或者歌曲节点,并实时计算二部图的异常嫌疑度平均值F(G),直至找出二部图中的异常节点。算法迭代过程如图5所示,每一次迭代删除一个节点及该节点的连线。如图4所示,F(G)会随着迭代呈现先上涨后下跌的变化趋势,回溯F(G)最大值,即可得到异常用户和异常歌曲。
假设某一用户针对《青花瓷》这首歌的标准播放量为200000,那么该用户针对该歌曲的任一次播放行为的异常嫌疑度h=1/log(200000+5)≈0.08,那么该用户针对该歌曲的200000次播放行为的异常嫌疑度为:200000×0.08=16000,那么任一歌曲节点的异常嫌疑度为各用户对该歌曲的异常嫌疑度总和。如图5所示,《青花瓷》这首歌的异常嫌疑度为:3个用户对《青花瓷》的异常嫌疑度总和。针对某一用户节点而言,其异常嫌疑度为:该用户节点针对其所连接的各歌曲的异常嫌疑度总和。如图5所示,同时连接《青花瓷》和《最近》的用户节点的异常嫌疑度为:16000+A。其中,A为该用户节点针对《最近》的异常嫌疑度。
可见,本申请能够借助Fraudar团伙挖掘算法,针对不同时长的媒体资源进行检测,可准确判别刷量行为。
下面通过具体的应用场景实例描述,来介绍本申请提供的播放行为检测方案。
本实施例以音乐播放平台为例进行介绍。请参见图6,方案具体实现流程包括:
S601、终端请求服务器。
S602、服务器向终端反馈响应消息。
S603、终端收到响应消息后,向服务器传输预设时间段内音乐播放平台中各用户针对各歌曲的实际播放次数。
S604、服务器基于各歌曲的总时长和预设基准时长将各个实际播放次数量化为标准播放次数,根据各用户针对各歌曲的标准播放次数确定各用户的异常嫌疑度和各歌曲的异常嫌疑度,从而筛查存在异常播放行为的异常歌曲和异常用户。
S605、服务器发送异常歌曲和异常用户的相关信息给终端。
S606、终端基于接收到的信息调整音乐播放平台中的歌曲热度排行榜、推荐排行榜。
其中,终端可以为智能手机、电视、平板电脑、笔记本电脑或台式电脑等设备,其可以为音乐播放平台的管理端。
本实施例可以筛查出音乐播放平台中的异常歌曲和异常用户,也就是存在刷量行为的歌曲和用户,从而据此调整热度排行榜、推荐排行榜等平台内容,从而为平台日常运营提供帮助。例如:假设平台给大于30秒的播放量给歌曲版权方结算报酬,那么刷量行为将会影响此报酬结算。当然,刷量行为也会影响歌曲排行榜、歌曲热度、歌曲的推荐和曝光等。
而本实施例从团伙挖掘的角度出发,改进了Fraudar算法,既稳定免疫了刷量主体伪装正常用户的对抗行为,又可以防止有组织的大规模刷量绕过检测规则而被漏检,有效弥补了检测规则的不足,与之形成了互补。
下面对本申请实施例提供的一种电子设备进行介绍,下文描述的一种电子设备与上述实施例的相关实现步骤可以相互参照。
进一步的,本申请实施例还提供了一种电子设备。其中,上述电子设备既可以是如图7所示的服务器50,也可以是如图8所示的终端60。图7和图8均是根据一示例性实施例示出的电子设备结构图,图中的内容不能被认为是对本申请的使用范围的任何限制。
图7为本申请实施例提供的一种服务器的结构示意图。该服务器50,具体可以包括:至少一个处理器51、至少一个存储器52、电源53、通信接口54、输入输出接口55和通信总线56。其中,所述存储器52用于存储计算机程序,所述计算机程序由所述处理器51加载并执行,以实现前述任一实施例公开的播放行为检测中的相关步骤。
本实施例中,电源53用于为服务器50上的各硬件设备提供工作电压;通信接口54能够为服务器50创建与外界设备之间的数据传输通道,其所遵循的通信协议是能够适用于本申请技术方案的任意通信协议,在此不对其进行具体限定;输入输出接口55,用于获取外界输入数据或向外界输出数据,其具体的接口类型可以根据具体应用需要进行选取,在此不进行具体限定。
另外,存储器52作为资源存储的载体,可以是只读存储器、随机存储器、磁盘或者光盘等,其上所存储的资源包括操作系统521、计算机程序522及数据523等,存储方式可以是短暂存储或者永久存储。
其中,操作系统521用于管理与控制服务器50上的各硬件设备以及计算机程序522,以实现处理器51对存储器52中数据523的运算与处理,其可以是Windows Server、Netware、Unix、Linux等。计算机程序522除了包括能够用于完成前述任一实施例公开的播放行为检测方法的计算机程序之外,还可以进一步包括能够用于完成其他特定工作的计算机程序。数据523除了可以包括应用程序的更新信息等数据外,还可以包括应用程序的开发商信息等数据。
图8为本申请实施例提供的一种终端的结构示意图,该终端60具体可以包括但不限于智能手机、平板电脑、笔记本电脑或台式电脑等。
通常,本实施例中的终端60包括有:处理器61和存储器62。
其中,处理器61可以包括一个或多个处理核心,比如4核心处理器、8核心处理器等。处理器61可以采用DSP(Digital Signal Processing,数字信号处理)、FPGA(Field-Programmable Gate Array,现场可编程门阵列)、PLA(Programmable Logic Array,可编程逻辑阵列)中的至少一种硬件形式来实现。处理器61也可以包括主处理器和协处理器,主处理器是用于对在唤醒状态下的数据进行处理的处理器,也称CPU(Central ProcessingUnit,中央处理器);协处理器是用于对在待机状态下的数据进行处理的低功耗处理器。在一些实施例中,处理器61可以在集成有GPU(Graphics Processing Unit,图像处理器),GPU用于负责显示屏所需要显示的内容的渲染和绘制。一些实施例中,处理器61还可以包括AI(Artificial Intelligence,人工智能)处理器,该AI处理器用于处理有关机器学习的计算操作。
存储器62可以包括一个或多个计算机可读存储介质,该计算机可读存储介质可以是非暂态的。存储器62还可包括高速随机存取存储器,以及非易失性存储器,比如一个或多个磁盘存储设备、闪存存储设备。本实施例中,存储器62至少用于存储以下计算机程序621,其中,该计算机程序被处理器61加载并执行之后,能够实现前述任一实施例公开的由终端侧执行的播放行为检测方法中的相关步骤。另外,存储器62所存储的资源还可以包括操作系统622和数据623等,存储方式可以是短暂存储或者永久存储。其中,操作系统622可以包括Windows、Unix、Linux等。数据623可以包括但不限于应用程序的更新信息。
在一些实施例中,终端60还可包括有显示屏63、输入输出接口64、通信接口65、传感器66、电源67以及通信总线68。
本领域技术人员可以理解,图8中示出的结构并不构成对终端60的限定,可以包括比图示更多或更少的组件。
下面对本申请实施例提供的一种存储介质进行介绍,下文描述的一种存储介质与上述实施例的相关实现步骤可以相互参照。
进一步的,本申请实施例还公开了一种存储介质,所述存储介质中存储有计算机可执行指令,所述计算机可执行指令被处理器加载并执行时,实现前述任一实施例公开的播放行为检测方法。关于该方法的具体步骤可以参考前述实施例中公开的相应内容,在此不再进行赘述。
需要指出的是,上述仅为本申请的较佳实施例,并不用以限制本申请,凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其它实施例的不同之处,各个实施例之间相同或相似部分互相参见即可。
本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。

Claims (10)

1.一种播放行为检测方法,其特征在于,包括:
获取预设时间段内,目标媒体平台中各用户针对各媒体资源的实际播放量;
基于各媒体资源的总时长和预设基准时长,将各个实际播放量分别量化为能够在同一维度比较的标准播放量,得到各用户针对各媒体资源的标准播放量;
根据各用户针对各媒体资源的标准播放量确定各用户的异常嫌疑度和各媒体资源的异常嫌疑度;
基于各用户的异常嫌疑度和各媒体资源的异常嫌疑度筛查存在异常播放行为的异常媒体资源和异常用户。
2.根据权利要求1所述的方法,其特征在于,所述基于各媒体资源的总时长和预设基准时长,将各个实际播放量分别量化为能够在同一维度比较的标准播放量,包括:
针对每个媒体资源,计算任一媒体资源的总时长和所述预设基准时长的比值,将任一用户针对该媒体资源的实际播放量与所述比值的乘积作为该用户针对该媒体资源的标准播放量。
3.根据权利要求1所述的方法,其特征在于,所述根据各用户针对各媒体资源的标准播放量确定各用户的异常嫌疑度和各媒体资源的异常嫌疑度,包括:
以各用户和各媒体资源作为二部图节点,以各用户针对各媒体资源的标准播放量确定二部图边,构建目标二部图;
基于所述目标二部图计算各用户的异常嫌疑度和各媒体资源的异常嫌疑度。
4.根据权利要求3所述的方法,其特征在于,所述目标二部图中通过所述二部图边互联的任一用户针对任一媒体资源的任一次播放行为的异常嫌疑度h的计算公式为:h=1/log(x+5);其中,x为该用户针对该媒体资源的标准播放量。
5.根据权利要求3所述的方法,其特征在于,所述基于各用户的异常嫌疑度和各媒体资源的异常嫌疑度筛查存在异常播放行为的异常媒体资源和异常用户,包括:
判断当前目标二部图中的节点数是否为0;
若当前目标二部图中的节点数不为0,则计算各个异常嫌疑度的均值,并从当前目标二部图中删除异常嫌疑度最小的二部图节点,以更新所述目标二部图,针对更新后的目标二部图迭代执行所述判断当前目标二部图中的节点数是否为0的步骤;
若当前目标二部图中的节点数为0,则从所有均值中选择最大均值,并将所述最大均值之后被删除的各个二部图节点确定为存在异常播放行为的异常媒体资源和异常用户。
6.根据权利要求5所述的方法,其特征在于,所述计算各个异常嫌疑度的均值,包括:
按照目标公式计算各个异常嫌疑度的均值;所述目标公式为:F(G)=[f(U)+f(S)]/(U+S);其中,F(G)为所述均值,f(U)为各用户的异常嫌疑度总和,f(S)为各媒体资源的异常嫌疑度总和,U为用户数,S为媒体资源数。
7.根据权利要求1至6任一项所述的方法,其特征在于,所述根据各用户针对各媒体资源的标准播放量确定各用户的异常嫌疑度和各媒体资源的异常嫌疑度之前,还包括:
任一用户针对任一媒体资源的标准播放量小于预设阈值,则删除该用户、该媒体资源以及该用户针对该媒体资源的标准播放量。
8.根据权利要求1至6任一项所述的方法,其特征在于,所述基于各用户的异常嫌疑度和各媒体资源的异常嫌疑度筛查存在异常播放行为的异常媒体资源和异常用户之后,还包括:
对所述异常媒体资源和所述异常用户进行标记;
根据所述标记调整异常播放行为的检测规则、媒体资源热度排行榜和/或媒体资源推荐榜。
9.一种电子设备,其特征在于,所述电子设备包括处理器和存储器;其中,所述存储器用于存储计算机程序,所述计算机程序由所述处理器加载并执行以实现如权利要求1至8任一项所述的方法。
10.一种存储介质,其特征在于,所述存储介质中存储有计算机可执行指令,所述计算机可执行指令被处理器加载并执行时,实现如权利要求1至8任一项所述的方法。
CN202210405740.8A 2022-04-18 2022-04-18 一种播放行为检测方法、设备及存储介质 Pending CN114756698A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210405740.8A CN114756698A (zh) 2022-04-18 2022-04-18 一种播放行为检测方法、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210405740.8A CN114756698A (zh) 2022-04-18 2022-04-18 一种播放行为检测方法、设备及存储介质

Publications (1)

Publication Number Publication Date
CN114756698A true CN114756698A (zh) 2022-07-15

Family

ID=82331653

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210405740.8A Pending CN114756698A (zh) 2022-04-18 2022-04-18 一种播放行为检测方法、设备及存储介质

Country Status (1)

Country Link
CN (1) CN114756698A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117041233A (zh) * 2023-10-08 2023-11-10 联通沃音乐文化有限公司 一种分布式云计算的方法及系统

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117041233A (zh) * 2023-10-08 2023-11-10 联通沃音乐文化有限公司 一种分布式云计算的方法及系统
CN117041233B (zh) * 2023-10-08 2024-04-09 联通沃音乐文化有限公司 一种分布式云计算的方法及系统

Similar Documents

Publication Publication Date Title
US9836346B2 (en) Error troubleshooting using a correlated knowledge base
US9659066B2 (en) Dynamic interest-based notifications
CN101794359B (zh) 用于启用用于遗留应用的经群体测试的安全特征的方法和系统
US11171845B2 (en) QoS-optimized selection of a cloud microservices provider
KR101871383B1 (ko) 계층적 데이터 구조의 노드 상에서 재귀적 이벤트 리스너를 사용하기 위한 방법 및 시스템
Aghajani et al. The PDE method for the analysis of randomized load balancing networks
CN113591068B (zh) 一种在线登录设备管理方法、装置及电子设备
JP5264813B2 (ja) 評価装置、評価方法及び評価プログラム
CN111309485A (zh) 服务调用方法、装置、电子设备和计算机可读存储介质
CN114827280B (zh) 请求处理方法、装置、设备、介质
CN114756698A (zh) 一种播放行为检测方法、设备及存储介质
US20140317237A1 (en) Selective Content Delivery in a Real-Time Streaming Environment
US20180249017A1 (en) Data Usage Based Data Transfer Determination
CN113010786B (zh) 信息推送的方法、装置、设备以及存储介质
CN111079061B (zh) 一种数据处理方法及电子设备
CN114064445A (zh) 一种测试方法、装置、设备及计算机可读存储介质
CN110738509A (zh) 量化用户之间关联程度的方法和装置
CN113778780B (zh) 应用稳定性的确定方法、装置、电子设备和存储介质
US10241882B2 (en) System and method for dynamic adjustment of logging
CN115080412A (zh) 软件更新质量评估方法、装置、设备及计算机存储介质
CN111400327B (zh) 一种数据同步方法、装置、电子设备及存储介质
CN110413800B (zh) 一种提供小说信息的方法与设备
CN114926234A (zh) 物品信息推送方法、装置、电子设备和计算机可读介质
CN111143526B (zh) 一种咨询服务控件配置信息的生成、控制方法及装置
CN110691143B (zh) 一种文件推送方法、装置、电子设备及介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination