CN113347497B - 目标用户识别方法、装置、电子设备以及存储介质 - Google Patents

目标用户识别方法、装置、电子设备以及存储介质 Download PDF

Info

Publication number
CN113347497B
CN113347497B CN202110878442.6A CN202110878442A CN113347497B CN 113347497 B CN113347497 B CN 113347497B CN 202110878442 A CN202110878442 A CN 202110878442A CN 113347497 B CN113347497 B CN 113347497B
Authority
CN
China
Prior art keywords
brushing
live broadcast
strategy
broadcast room
identification
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110878442.6A
Other languages
English (en)
Other versions
CN113347497A (zh
Inventor
王璐
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wuhan Douyu Network Technology Co Ltd
Original Assignee
Wuhan Douyu Network Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wuhan Douyu Network Technology Co Ltd filed Critical Wuhan Douyu Network Technology Co Ltd
Priority to CN202110878442.6A priority Critical patent/CN113347497B/zh
Publication of CN113347497A publication Critical patent/CN113347497A/zh
Application granted granted Critical
Publication of CN113347497B publication Critical patent/CN113347497B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/442Monitoring of processes or resources, e.g. detecting the failure of a recording device, monitoring the downstream bandwidth, the number of times a movie has been viewed, the storage space available from the internal hard disk
    • H04N21/44204Monitoring of content usage, e.g. the number of times a movie has been viewed, copied or the amount which has been watched
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/442Monitoring of processes or resources, e.g. detecting the failure of a recording device, monitoring the downstream bandwidth, the number of times a movie has been viewed, the storage space available from the internal hard disk
    • H04N21/44213Monitoring of end-user related data
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/45Management operations performed by the client for facilitating the reception of or the interaction with the content or administrating data related to the end-user or to the client device itself, e.g. learning user preferences for recommending movies, resolving scheduling conflicts
    • H04N21/466Learning process for intelligent management, e.g. learning user preferences for recommending movies
    • H04N21/4667Processing of monitored end-user data, e.g. trend analysis based on the log file of viewer selections

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Social Psychology (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

本发明实施例公开了一种目标识别方法、装置、电子设备及存储介质。该方法包括:确定当前刷量直播间所对应的目标刷量策略以及目标识别策略,并确定所述当前刷量直播间的第一热度影响预测值;确定当前刷量策略在当前刷量直播间的第二热度影响预测值,基于所述当前刷量直播间的第一热度影响预测值、所述各刷量直播间的第二热度影响预测值确定所述当前刷量直播间的归一化热度影响值;确定所述当前直播间所在直播平台的效益影响值;基于所述归一化热度影响值更新迭代所述待更新的刷量策略集合,并基于所述效益影响值更新迭代所述待更新的识别策略集合,得到目标刷量策略集合和目标识别策略集合,实现提高对直播间中目标用户的识别精度。

Description

目标用户识别方法、装置、电子设备以及存储介质
技术领域
本发明实施例涉及大数据风控技术领域,尤其涉及一种目标识别方法、装置、电子设备及存储介质。
背景技术
在直播平台上经常会受到黑产的攻击,在直播平台上黑产主要刷的是观看数据,观看数据和主播薪酬、主播人气、主播热度等重要指标有关,因此我们需要有高效快速的方法识别黑产的刷量行为。常见的识别观看刷量的方法是采用离线或者实时规则,通过数据分析黑产刷量的模式来制定识别规则。
传统识别方案的问题主要在于黑产是专门从事刷量工作的,他们的手段是不断在变化,规则容易在短时间攻破,制定规则很难跟上黑产的脚步。
发明内容
本发明提供一种目标用户识别方法、装置、电子设备以及存储介质,以实现提高对直播间中目标用户的识别精度。
第一方面,本发明实施例提供了一种目标用户识别方法,该方法包括:
从待更新的刷量策略集合确定当前刷量直播间所对应的目标刷量策略以及从待更新的识别策略集合中确定目标识别策略,基于所述目标刷量策略以及目标识别策略确定所述当前刷量直播间的第一热度影响预测值;
确定当前刷量策略在当前刷量直播间的第二热度影响预测值,基于当前刷量策略在各刷量直播间的第二热度影响预测值确定各刷量直播间的平均热度影响预测值,并基于所述当前刷量直播间的第一热度影响预测值、所述各刷量直播间的第二热度影响预测值以及所述各刷量直播间的平均热度影响预测值,确定所述当前刷量直播间的归一化热度影响值;
根据所述当前刷量直播间所对应的用户数量和预设函数,确定所述当前直播间所在直播平台的效益影响值;
当检测到待更新的识别策略集合和所述待更新的刷量策略集合不满足预设条件时,基于所述归一化热度影响值更新迭代所述待更新的刷量策略集合,并基于所述效益影响值更新迭代所述待更新的识别策略集合,直至所述待更新的识别策略集合和所述待更新的刷量策略集合满足预设条件,得到目标刷量策略集合和目标识别策略集合;
基于所述目标识别策略集合对所述目标刷量策略集合进行刷量用户识别,确定所述刷量直播间的目标刷量用户。
可选的,所述从待更新的刷量策略集合确定当前刷量直播间所对应的目标刷量策略以及从待更新的识别策略集合中确定目标识别策略,包括:
获取待更新的刷量策略集合中的各刷量策略分别对应的刷量概率,基于各所述刷量概率确定当前刷量直播间所对应的目标刷量策略;
获取待更新的识别策略集合中的各识别策略分别对应的识别概率,基于各所述识别概率确定当前刷量直播间所对应的目标识别策略。
可选的,所述基于所述目标刷量策略以及目标识别策略确定所述当前直播间的第一热度影响预测值,包括:
基于下述公式确定所述第一热度影响预测值:
Figure DEST_PATH_IMAGE001
其中,R是全体用户集合;
Figure 481695DEST_PATH_IMAGE002
表示直播间v的热度影响预测值;
Figure DEST_PATH_IMAGE003
表示的是全体用户R对直播间v的热度预测值;
Figure 643686DEST_PATH_IMAGE004
表示的是直播间采用刷量策略 p、平台采用识别策略q时全体用户R对直播间v的热度预测值。
可选的,所述全体用户R对直播间v的热度预测值的确定方法包括:
基于下述公式确定所述热度预测值:
Figure DEST_PATH_IMAGE005
Figure 157713DEST_PATH_IMAGE006
Figure DEST_PATH_IMAGE007
其中:
Figure 379747DEST_PATH_IMAGE003
是对直播间v热度的预测函数;
Figure 995536DEST_PATH_IMAGE008
是直播间v的观看时长增 量;g(S)表示给定用户集合S,其观看时长的平均值;R(v)表示观看直播间v的用户集合;RE (v)表示观看直播间v的白用户集合;
Figure DEST_PATH_IMAGE009
表示偏置量;
Figure DEST_PATH_IMAGE011
表示全体用户观看时长增量的权 重;
Figure 944906DEST_PATH_IMAGE012
表示白用户观看时长增量的权重。
可选的,所述基于当前刷量策略在各刷量直播间的第二热度影响预测值确定各刷量直播间的平均热度影响预测值,包括:
基于下述公式确定所述平均热度影响预测值:
Figure DEST_PATH_IMAGE013
其中,AVG(PE)表示当前刷量策略对当前直播间的平均热度影响预测值;Vk表示当前刷量策略对应的刷量各直播间;
相应的,所述基于所述当前刷量直播间的第一热度影响预测值、所述各刷量直播间的第二热度影响预测值以及所述各刷量直播间的平均热度影响预测值,确定所述各刷量直播间的归一化热度影响值,包括:
基于下述公式确定归一化热度影响值:
Figure 329751DEST_PATH_IMAGE014
其中,ak表示待更新的刷量策略集合中的当前刷量策略k;
Figure DEST_PATH_IMAGE015
表示当 前刷量策略在当前刷量直播间的第一热度影响预测值,
Figure 237533DEST_PATH_IMAGE016
表示当前策 略对应的各刷量直播间中的最大热度影响预测值;
Figure DEST_PATH_IMAGE017
表示当前策略对应 的各刷量直播间中的最大热度影响预测值。
可选的,所述根据所述当前刷量直播间所对应的用户数量和预设函数,确定所述当前直播间所在直播平台的效益影响值,包括:
基于下述公式确定所述效益影响值:
Figure 75039DEST_PATH_IMAGE018
其中:
Figure DEST_PATH_IMAGE019
是当前刷量直播间所对应的用户r对直播间v刷量而给平台带来 的损失;
Figure 562521DEST_PATH_IMAGE020
是采用刷量策略p进行刷量但是没有被平台识别刷量策略q识别的白用户 集合;
Figure DEST_PATH_IMAGE021
是示性函数,表示的是用户v是否在上述白用户集合;Z1是非白用户 的数量;Z2是白用户的数量;
Figure 801873DEST_PATH_IMAGE022
表示全体用户观看时长增量的权重;
Figure DEST_PATH_IMAGE023
表示白用户观看时 长增量的权重。
可选的,所述基于所述归一化热度影响值更新迭代所述待更新的刷量策略集合,并基于所述效益影响值更新迭代所述待更新的识别策略集合,包括:
基于下述公式更新所述待更新的刷量策略集合:
Figure 896868DEST_PATH_IMAGE024
其中,
Figure DEST_PATH_IMAGE025
表示刷量直播间的数量;
Figure 470938DEST_PATH_IMAGE026
是学习率;
Figure DEST_PATH_IMAGE027
是第t+1轮刷量策略k的选择 概率;
Figure 44001DEST_PATH_IMAGE028
表示归一化热度影响值;
基于下述公式更新所述待更新的识别策略集合:
Figure DEST_PATH_IMAGE029
其中,
Figure 652706DEST_PATH_IMAGE030
是第t+1轮识别策略k的选择概率;y表示通过识别策略q识别的账号r是 否是刷量用户的结果,y=1表示的是识别是正常用户集合;
Figure DEST_PATH_IMAGE031
表示识别的是正常 用户的概率;
Figure 387444DEST_PATH_IMAGE032
表示是采用第t+1轮刷量策略p进行刷量但是没有被平台第t轮识别 刷量策略q识别的用户集合。
第二方面,本发明实施例还提供了一种目标用户识别装置,该装置包括:
第一热度影响预测值确定模块,用于从待更新的刷量策略集合确定当前刷量直播间所对应的目标刷量策略以及从待更新的识别策略集合中确定目标识别策略,基于所述目标刷量策略以及目标识别策略确定所述当前刷量直播间的第一热度影响预测值;
归一化热度影响值确定模块,用于确定当前刷量策略在当前刷量直播间的第二热度影响预测值,基于当前刷量策略在各刷量直播间的第二热度影响预测值确定各刷量直播间的平均热度影响预测值,并基于所述当前刷量直播间的第一热度影响预测值、所述各刷量直播间的第二热度影响预测值以及所述各刷量直播间的平均热度影响预测值,确定所述当前刷量直播间的归一化热度影响值;
效益影响值确定模块,用于根据所述当前刷量直播间所对应的用户数量和预设函数,确定所述当前直播间所在直播平台的效益影响值;
目标刷量策略集合和目标识别策略集合确定模块,用于当检测到待更新的识别策略集合和所述待更新的刷量策略集合不满足预设条件时,基于所述归一化热度影响值更新迭代所述待更新的刷量策略集合,并基于所述效益影响值更新迭代所述待更新的识别策略集合,直至所述待更新的识别策略集合和所述待更新的刷量策略集合满足预设条件,得到目标刷量策略集合和目标识别策略集合;
目标刷量用户确定模块,用于基于所述目标识别策略集合对所述目标刷量策略集合进行刷量用户识别,确定所述刷量直播间的目标刷量用户。
第三方面,本发明实施例还提供了一种电子设备,所述电子设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如本发明任意实施例提供的目标用户识别方法。
第四方面,本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现本发明任意实施例提供的目标用户识别方法。
本发明实施例的技术方案通过确定当前刷量直播间所对应的目标刷量策略以及目标识别策略,并确定所述当前刷量直播间的第一热度影响预测值;确定当前刷量策略在当前刷量直播间的第二热度影响预测值,基于所述当前刷量直播间的第一热度影响预测值、所述各刷量直播间的第二热度影响预测值确定所述当前刷量直播间的归一化热度影响值;进一步的,确定所述当前直播间所在直播平台的效益影响值;基于所述归一化热度影响值更新迭代所述待更新的刷量策略集合,并基于所述效益影响值更新迭代所述待更新的识别策略集合,得到目标刷量策略集合和目标识别策略集合,基于所述目标识别策略集合对所述目标刷量策略集合进行刷量用户识别,确定所述刷量直播间的目标刷量用户,以解决了现阶段直播间中不断变化的黑产刷量策略无法识别的问题,实现了基于不断变化的识别策略对不断变化的刷量策略进行识别,提高对直播间中目标用户的识别精度。
附图说明
为了更加清楚地说明本发明示例性实施例的技术方案,下面对描述实施例中所需要用到的附图做一简单介绍。显然,所介绍的附图只是本发明所要描述的一部分实施例的附图,而不是全部的附图,对于本领域普通技术人员,在不付出创造性劳动的前提下,还可以根据这些附图得到其他的附图。
图1是本发明实施例一提供的目标用户识别方法的流程示意图;
图2是本发明实施例二提供的目标用户识别装置的结构示意图;
图3为本发明实施例三提供的电子设备的结构示意图。
具体实施方式
下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。
实施例一
图1为本发明实施例一提供的一种目标用户识别方法的流程图,本实施例可适用于识别直播间里的刷量用户的情况,具体的,适用于基于自动演化的目标识别策略集合识别采用不断变化的刷量策略集合进行刷量的直播间中的各刷量用户的情况。该方法可以由目标用户识别装置来执行,该装置可以由软件和/或硬件的方式来实现。
在对本实施例的技术方案进行介绍之前,先对本实施例的应用场景进行示例性的介绍,当然下述应用场景只是作为本实施例的技术方案的可选应用场景,本实施例的技术方案还可以应用于其他场景,本实施例对本技术方案的应用场景不加以限制。具体的,本实施例中技术方案的应用场景包括:
在直播平台上经常会受到黑产刷量的攻击,在直播平台上黑产主要刷的是观看数据,观看数据和主播薪酬、主播人气、主播热度等重要指标有关,因此需要有高效快速的方法识别黑产的刷量行为。
常见的识别观看刷量的方法是采用离线或者实时规则,通过数据分析黑产刷量的模式来制定识别规则。
但是传统识别方案的问题主要在于黑产是专门从事刷量工作的,所以刷量手段是不断在变化,规则容易在短时间攻破,制定规则很难跟上黑产改变刷量手段的脚步。
为了解决传统识别方案的问题,本发明实施例的技术方案采用了一种基于博弈的对抗方法识别刷量用户,即当黑产的刷量手段发生变化时我们可以自动演化识别策略;具体的,本发明实施例的技术方案通过确定当前刷量直播间所对应的目标刷量策略以及目标识别策略,并确定当前刷量直播间的第一热度影响预测值;确定当前刷量策略在当前刷量直播间的第二热度影响预测值,基于当前刷量直播间的第一热度影响预测值、各刷量直播间的第二热度影响预测值确定当前刷量直播间的归一化热度影响值;进一步的,确定当前直播间所在直播平台的效益影响值;基于归一化热度影响值更新迭代待更新的刷量策略集合,并基于效益影响值更新迭代待更新的识别策略集合,得到目标刷量策略集合和目标识别策略集合,基于目标识别策略集合对目标刷量策略集合进行刷量用户识别,确定刷量直播间的目标刷量用户,以解决了现阶段直播间中不断变化的黑产刷量策略无法识别的问题,实现了基于不断变化的识别策略对不断变化的刷量策略进行识别,提高对直播间中目标用户的识别精度。
如图1所示,本发明实施例的技术方案具体包括以下步骤:
S110、从待更新的刷量策略集合确定当前刷量直播间所对应的目标刷量策略以及从待更新的识别策略集合中确定目标识别策略,基于目标刷量策略以及目标识别策略确定当前刷量直播间的第一热度影响预测值。
在本发明实施例中,待更新的刷量策略集合可以理解为各历史刷量策略的集合,各刷量策略的获取方式包括但不限于从历史刷量行为中抽取的刷量策略。目标识别待更新的识别策略集合可以理解为各历史识别策略的集合,各识别策略的获取方式可以包括但不限于从各刷量直播间所在平台在对各直播间采用刷量策略的用户进行识别时采用的识别策略,例如识别策略可以是当前用户的使用设备数高于预设阈值。
可选的,从待更新的刷量策略集合确定当前刷量直播间所对应的目标刷量策略的方法包括:获取待更新的刷量策略集合中的各刷量策略分别对应的刷量概率,基于各刷量概率确定当前刷量直播间所对应的目标刷量策略。
具体的,在获取到待更新的刷量策略集合后,对该刷量策略集合中的各刷量策略对应的刷量概率进行初始化,在本实施例中采用随机初始化的方法对各刷量概率进行初始化,即各刷量策略分别对应一个刷量概率,各刷量概率的值相加为1。确定待更新的刷量策略集合中的各刷量策略对应的刷量概率,进一步的,获取随机数值,并根据随机数值与各刷量概率的比对结果确定待更新的刷量策略集合中的目标刷量策略;示例性的比对方法可以是,将随机数值与各刷量概率数值进行差值计算,得到最小计算结果的刷量策略所对应的刷量概率作为目标刷量策略。
可选的,从待更新的识别策略集合确定当前刷量直播间所对应的目标识别策略的方法包括:获取待更新的识别策略集合中的各识别策略分别对应的识别概率,基于各识别概率确定当前刷量直播间所对应的目标识别策略。
具体的,在获取到待更新的识别策略集合后,采用随机初始化的方法确定该识别策略集合中各识别策略的识别概率,并基于各识别概率确定待更新的识别策略集合中的目标识别策略。可选的,识别策略可以是该识别策略集合中的任一个识别策略,也可以是该识别策略中的至少两个识别策略的组合。
在本实施例中,热度影响预测值可以理解为采用刷量策略进行刷量后给当前刷量直播间带来的热度变化值,在本实施例中还包括在当前刷量直播间所在平台对各刷量直播间采用刷量策略的刷量用户进行识别的情况下给当前刷量直播间带来的热度变化值。第一热度影像预测值可以是本实施例中基于目标刷量策略对当前直播间进行刷量以及基于目标识别策略进行识别情况下的热度影像预测值。
具体的,采用目标刷量策略对当前直播间进行刷量,并采用目标识别策略对当前刷量直播间进行识别,并将识别出的刷量用户进行剔除;需要说明的是,当前刷量直播间中的用户既包括拜用户还包括未被识别的刷量用户。在本实施例中,白用户是平台中质量较高的用户,采用一些规则进行识别,比如每日观看时长较长且稳定,有实名认证和手机号、邮箱绑定等。
可选的,基于目标刷量策略以及目标识别策略确定当前刷量直播间的第一热度影 响预测值的方法可以是基于预设的第一热度影响预测值计算公式确定。具体的,计算公式 包括:
Figure DEST_PATH_IMAGE033
;其中,其中,R是全体用户集合;
Figure 199542DEST_PATH_IMAGE034
表 示直播间v的热度影响预测值;
Figure 91144DEST_PATH_IMAGE003
表示的是全体用户R对直播间v的热度预测值;
Figure DEST_PATH_IMAGE035
表示的是直播间采用刷量策略p、平台采用识别策略q时全体用户R对直播间v 的热度预测值。
Figure 305087DEST_PATH_IMAGE036
Figure 741885DEST_PATH_IMAGE003
之间的差值表示的是采用刷量策略给当前刷量直播 间带来的热度影响预测值,即采用上述公式可以确定在考虑平台防御的情况下采用刷量策 略给当前刷量直播间的效益。
可选的,上述公式中确定全体用户R对直播间v的热度预测值的方法可以是:
Figure 572438DEST_PATH_IMAGE005
Figure 18462DEST_PATH_IMAGE006
Figure 867339DEST_PATH_IMAGE007
其中:
Figure 740617DEST_PATH_IMAGE003
是对直播间v热度的预测函数;
Figure 527307DEST_PATH_IMAGE008
是直播间v的观看时长增 量;g(S)表示给定用户集合S,其观看时长的平均值;R(v)表示观看直播间v的用户集合;RE (v)表示观看直播间v的白用户集合;
Figure 511444DEST_PATH_IMAGE009
表示偏置量;
Figure 214826DEST_PATH_IMAGE011
表示全体用户观看时长增量的权 重;
Figure 259006DEST_PATH_IMAGE012
表示白用户观看时长增量的权重。预设的偏执量、全体用户观看时长增量的权重以 及白用户观看时长增量的权重的取值范围均在0到1之间,各时长增量的权重由历史观看时 长进行确定,可以设置为固定数值。
上述公式的原理是:
Figure 267413DEST_PATH_IMAGE008
表示当前直播间v的全体用户平均观看时长
Figure DEST_PATH_IMAGE037
较全站平均观看平均时长的增量,该指标越大说明该直播间观看时长相对于该直 播间所在平台的平均水平越高,而观看时长是直接影响热度的,因此将该因素作为计算热 度预测值的一项指标。
Figure 524082DEST_PATH_IMAGE038
表示白用户观看直播间v的平均时长,白用户平台高 质量活跃用户,因此该部分用户平均观看时长越大,说明房间的质量越高、用户忠实度越 高,因此将该因素作为计算热度预测值的的另一项指标,在本实施例中将上述两个因素进 行相加计算,得到全体用户R对直播间v的热度预测值。当然,如若只将前直播间v的全体用 户平均观看时长
Figure 347550DEST_PATH_IMAGE037
较全站平均观看平均时长的增量作为全体用户R对直播间v的热 度预测值,则得到偏小的热度预测值;如若只将白用户观看直播间v的平均时长作为全体用 户R对直播间v的热度预测值,则得到偏大的热度预测值。
可选的,上述公式中确定采用刷量策略p、平台采用识别策略q时全体用户R对直播间v的热度预测值的方法可以是:
Figure DEST_PATH_IMAGE039
Figure 31473DEST_PATH_IMAGE040
Figure 323914DEST_PATH_IMAGE041
其中:其中:
Figure 649853DEST_PATH_IMAGE042
是黑产采用刷量策略p、而没有被平台识别刷量策略q识别的 用户集合;
Figure DEST_PATH_IMAGE043
是对采用刷量策略p、而没有被平台识别刷量策略q识别时直播间v 热度的预测函数;
Figure 62248DEST_PATH_IMAGE044
是直播间v的观看时长增量;
Figure DEST_PATH_IMAGE045
表示给定用户集合S,其 观看时长的平均值;
Figure 917072DEST_PATH_IMAGE046
表示观看直播间v的采用刷量策略p、而没有被平台识别刷量 策略q识别的用户集合;
Figure DEST_PATH_IMAGE047
表示观看直播间v的采用刷量策略p、而没有被平台识别 刷量策略q识别的白用户集合;
Figure 900071DEST_PATH_IMAGE009
表示偏置量;
Figure 13390DEST_PATH_IMAGE011
表示采用刷量策略p、而没有被平台识别 刷量策略q识别的全体用户观看时长增量的权重;
Figure 562183DEST_PATH_IMAGE012
表示采用刷量策略p、而没有被平台识 别刷量策略q识别的白用户观看时长增量的权重。预设的偏执量、全体用户观看时长增量的 权重以及白用户观看时长增量的权重的取值范围均在0到1之间,各时长增量的权重由历史 观看时长进行确定,可以设置为固定数值。
具体的,获取采用目标刷量策略进行刷量,但是没有被目标识别策略进行识别的用户数量,并基于上述确定全体用户对当前直播间的热度影响值确定公式确定直播间采用刷量策略p、平台采用识别策略q时全体用户R对直播间v的热度预测值,并基于上述全体用户对当前刷量直播间的热度影响预测值以及采用刷量策略p、平台采用识别策略q时全体用户R对直播间v的热度预测值,代入至上述确定第一热度影响预测值计算公式,得到:
Figure 119066DEST_PATH_IMAGE048
Figure DEST_PATH_IMAGE049
Figure 589362DEST_PATH_IMAGE050
其中:
Figure DEST_PATH_IMAGE051
是黑产采用刷量策略p、而没有被平台识别刷量策略q识别的用户集 合。
在本实施例中,对于采用刷量策略对直播间进行刷量,其目标是最大化未被识别的刷量用户对热度影响预测值:
Figure 257103DEST_PATH_IMAGE052
在上述公式中,在保证上式最大的情况下,找到最优的策略p。
S120、确定当前刷量策略在当前刷量直播间的第二热度影响预测值,基于当前刷量策略在各刷量直播间的第二热度影响预测值确定各刷量直播间的平均热度影响预测值,并基于当前刷量直播间的第一热度影响预测值、各刷量直播间的第二热度影响预测值以及各刷量直播间的平均热度影响预测值,确定当前刷量直播间的归一化热度影响值。
在本实施例中,第二热度影响预测值可以是本实施例中基于区别于目标刷量策略的当前刷量策略对当前直播间进行刷量以及采用目标识别策略进行识别情况下的热度影像预测值。
具体的,确定第二热度影响预测值的方法可以是:获取当前刷量策略,以及采用当前刷量策略进行刷量的刷量直播间的数量,并基于当前刷量策略以及上述确定热度影响预测值计算公式确定当前刷量策略对应的当前刷量直播间的第二热度影响预测值。基于该第二热度影响预测值以及当前刷量策略进行刷量的各刷量直播间的热度影响预测值确定采用当前刷量策略进行刷量的各刷量直播间的平均热度影响预测值。具体的,可以采用下述计算公式确定平均热度影响预测值:
Figure 378512DEST_PATH_IMAGE013
其中,AVG(PE)表示当前刷量策略对当前直播间的平均热度影响预测值;Vk表示当前刷量策略对应的刷量各直播间;
相应的,基于当前刷量直播间的第一热度影响预测值、各刷量直播间的第二热度影响预测值以及各刷量直播间的平均热度影响预测值,确定各刷量直播间的归一化热度影响值,包括:
Figure 106297DEST_PATH_IMAGE014
其中,ak表示待更新的刷量策略集合中的当前刷量策略k;
Figure 329468DEST_PATH_IMAGE015
表示当 前刷量策略在当前刷量直播间的第一热度影响预测值,
Figure 800900DEST_PATH_IMAGE016
表示当前策 略对应的各刷量直播间中的最大热度影响预测值;
Figure 42395DEST_PATH_IMAGE017
表示当前策略对应 的各刷量直播间中的最大热度影响预测值。
S130、根据当前刷量直播间所对应的用户数量和预设函数,确定当前直播间所在直播平台的效益影响值。
在本实施例中,当前直播间所在直播平台的效益影响值可以理解为采用刷量策略对直播间进行刷量给当前平台带来的收益损失。具体的,确定收益影响至的方法可以是基于下述计算公式确定:
Figure 941080DEST_PATH_IMAGE018
其中:其中:
Figure 917127DEST_PATH_IMAGE019
是当前刷量直播间所对应的用户r对直播间v刷量而给平台 带来的损失;
Figure 192250DEST_PATH_IMAGE020
是采用刷量策略p进行刷量但是没有被平台识别刷量策略q识别的白 用户集合;
Figure 38984DEST_PATH_IMAGE021
是示性函数,表示的是用户v是否在上述白用户集合;Z1是非白 用户的数量;Z2是白用户的数量;
Figure 374150DEST_PATH_IMAGE022
表示全体用户观看时长增量的权重;
Figure 821181DEST_PATH_IMAGE023
表示白用户观 看时长增量的权重。
上述计算公式的原理是:基于没有识别的刷量用户给当前刷量直播间带来的额外热度影响确定上述刷量策略给当前刷量直播间所在平台带来的收益损失;其中,上述没有识别的刷量用户包括白用户以及非白用户;于是对于非白用户,其收益损失可以由RI的平均增量来衡量,而对于白用户还需要加上ERI部分的平均增量;所以上述刷量策略给当前刷量直播间所在平台带来的收益损失要基于没有识别的刷量的非白用户给当前刷量直播间带来的额外热度影响以及没有识别的刷量的白用户给当前刷量直播间带来的额外热度影响进行确定,以得到更加准确的收益损失。
S140、当检测到待更新的识别策略集合和待更新的刷量策略集合不满足预设条件时,基于归一化热度影响值更新迭代待更新的刷量策略集合,并基于效益影响值更新迭代待更新的识别策略集合,直至待更新的识别策略集合和待更新的刷量策略集合满足预设条件,得到目标刷量策略集合和目标识别策略集合。
在本发明实施例中,检测到待更新的识别策略集合和待更新的刷量策略集合不满足预设条件可以理解为采用待更新的识别策略集合中的目标识别策略没有将采用待更新的刷量策略集合中的目标刷量策略进行刷量的直播间中的刷量用户识别出来。当确定待更新的识别策略集合和待更新的刷量策略集合不满足预设条件不满足预设条件时,需要对待更新的识别策略集合和待更新的刷量策略集合进行更新,即是对待更新的识别策略集合和待更新的刷量策略集合分别对应的识别概率以及刷量概率进行更新。
可选的,基于上述刷量策略给当前刷量直播间所在平台带来的收益损失可以构造对于确定平台的收益损失的最优策略:
Figure DEST_PATH_IMAGE053
其中:FN表示的是漏识别用户集合;y是通过识别策略q识别的用户r是否是黑产数 量用户的结果,y=1表示的是识别是正常用户集合;
Figure 368837DEST_PATH_IMAGE054
是识别的是正常用户的概 率;
Figure DEST_PATH_IMAGE055
是黑产刷量策略p并且应用识别策略q的用户总数。
上述公式的含义是:
Figure 804497DEST_PATH_IMAGE056
表示的是漏识别用户给平台 带来损失的期望,除以相关用户总数得到的是漏识别账号从而可以得到平均的损失期望。 对于当前刷量直播间所在平台,其目标是最小化漏识别刷量用户给平台的损失,即找到最 优的策略q,使得上式最小。
可选的,基于效益影响值更新迭代待更新的识别策略集合的计算公式可以是:
Figure 310565DEST_PATH_IMAGE029
其中,
Figure DEST_PATH_IMAGE057
是第t+1轮识别策略k的选择概率。
可选的,基于归一化热度影响值更新迭代待更新的刷量策略集合的计算公式可以是:
Figure 713733DEST_PATH_IMAGE024
其中,
Figure 65080DEST_PATH_IMAGE025
表示刷量直播间的数量;
Figure 886406DEST_PATH_IMAGE026
是学习率;
Figure 563375DEST_PATH_IMAGE027
是第t+1轮刷量策略k的选择 概率。
在本实施例中,上述更新迭代的终止条件是识别概率和刷量概率不在发生明显变化,即各概率值较上轮迭代的对应的概率值相比变化率小于预设阈值,即得到满足预设条件的目标刷量策略集合和目标识别策略集合。
S150、基于目标识别策略集合对目标刷量策略集合进行刷量用户识别,确定刷量直播间的目标刷量用户。
在本实施例中,根据上述各实施例得到的识别概率作为确定目标识别策略各识别策略的权重。对于平台上的任意用户,根据其行为计算其满足的识别策略,将识别策略对应的权重进行相加,若求和的结果高于阈值,那么将这些用户视为识别的刷量用户,即该用户为采用目标刷量策略对该用户所在的直播间进行刷量的目标用户。
本发明实施例的技术方案通过确定采用识别策略识别当前刷量直播间的刷量策略,并基于不断更新的刷量策略更新所采用的识别策略,在动态博弈的过程中得到目标识别策略,即当刷量策略不断变化时,变化目标识别策略中的各策略的权重,以解决了现阶段直播间中不断变化的黑产刷量策略无法识别的问题,实现了基于不断变化的识别策略对不断变化的刷量策略进行识别,提高对直播间中目标用户的识别精度。
以下是本发明实施例提供的目标用户识别装置的实施例,该装置与上述各实施例的目标用户识别方法属于同一个发明构思,在目标用户识别装置的实施例中未详尽描述的细节内容,可以参考上述目标用户识别方法的实施例。
实施例二
图2为本发明实施例二提供的目标用户识别装置的结构示意图,本实施例可适用于识别直播间里的刷量用户的情况,具体的,适用于基于自动演化的目标识别策略集合识别采用不断变化的刷量策略集合进行刷量的直播间中的各刷量用户的情况。该目标用户识别装置的具体结构包括:第一热度影响预测值确定模块210、归一化热度影响值确定模块220、效益影响值确定模块230、目标刷量策略集合和目标识别策略集合确定模块240和目标刷量用户确定模块250;其中,
第一热度影响预测值确定模块210,用于从待更新的刷量策略集合确定当前刷量直播间所对应的目标刷量策略以及从待更新的识别策略集合中确定目标识别策略,基于所述目标刷量策略以及目标识别策略确定所述当前刷量直播间的第一热度影响预测值;
归一化热度影响值确定模块220,用于确定当前刷量策略在当前刷量直播间的第二热度影响预测值,基于当前刷量策略在各刷量直播间的第二热度影响预测值确定各刷量直播间的平均热度影响预测值,并基于所述当前刷量直播间的第一热度影响预测值、所述各刷量直播间的第二热度影响预测值以及所述各刷量直播间的平均热度影响预测值,确定所述当前刷量直播间的归一化热度影响值;
效益影响值确定模块230,用于根据所述当前刷量直播间所对应的用户数量和预设函数,确定所述当前直播间所在直播平台的效益影响值;
目标刷量策略集合和目标识别策略集合确定模块240,用于当检测到待更新的识别策略集合和所述待更新的刷量策略集合不满足预设条件时,基于所述归一化热度影响值更新迭代所述待更新的刷量策略集合,并基于所述效益影响值更新迭代所述待更新的识别策略集合,直至所述待更新的识别策略集合和所述待更新的刷量策略集合满足预设条件,得到目标刷量策略集合和目标识别策略集合;
目标刷量用户确定模块250,用于基于所述目标识别策略集合对所述目标刷量策略集合进行刷量用户识别,确定所述刷量直播间的目标刷量用户。
本发明实施例的技术方案通过确定当前刷量直播间所对应的目标刷量策略以及目标识别策略,并确定所述当前刷量直播间的第一热度影响预测值;确定当前刷量策略在当前刷量直播间的第二热度影响预测值,基于所述当前刷量直播间的第一热度影响预测值、所述各刷量直播间的第二热度影响预测值确定所述当前刷量直播间的归一化热度影响值;进一步的,确定所述当前直播间所在直播平台的效益影响值;基于所述归一化热度影响值更新迭代所述待更新的刷量策略集合,并基于所述效益影响值更新迭代所述待更新的识别策略集合,得到目标刷量策略集合和目标识别策略集合,基于所述目标识别策略集合对所述目标刷量策略集合进行刷量用户识别,确定所述刷量直播间的目标刷量用户,以解决了现阶段直播间中不断变化的黑产刷量策略无法识别的问题,实现了基于不断变化的识别策略对不断变化的刷量策略进行识别,提高对直播间中目标用户的识别精度。
在上述各实施例的基础上,第一热度影响预测值确定模块210,包括:
目标刷量策略确定单元,用于获取待更新的刷量策略集合中的各刷量策略分别对应的刷量概率,基于各所述刷量概率确定当前刷量直播间所对应的目标刷量策略;
目标识别策略确定单元,用于获取待更新的识别策略集合中的各识别策略分别对应的识别概率,基于各所述识别概率确定当前刷量直播间所对应的目标识别策略。
在上述各实施例的基础上,第一热度影响预测值确定模块210,包括:
基于下述公式确定所述第一热度影响预测值:
Figure 984998DEST_PATH_IMAGE001
其中,R是全体用户集合;
Figure 140035DEST_PATH_IMAGE002
表示直播间v的热度影响预测值;
Figure 81447DEST_PATH_IMAGE003
表示的是全体用户R对直播间v的热度预测值;
Figure 929317DEST_PATH_IMAGE058
表示的是直播间采用刷量策略 p、平台采用识别策略q时全体用户R对直播间v的热度预测值。
在上述各实施例的基础上,所述全体用户R对直播间v的热度预测值的确定方法包括:
基于下述公式确定所述热度预测值:
Figure 510340DEST_PATH_IMAGE005
Figure 469069DEST_PATH_IMAGE006
Figure 264986DEST_PATH_IMAGE007
其中:
Figure 18179DEST_PATH_IMAGE003
是对直播间v热度的预测函数;
Figure 165126DEST_PATH_IMAGE008
是直播间v的观看时长增 量;g(S)表示给定用户集合S,其观看时长的平均值;R(v)表示观看直播间v的用户集合;RE (v)表示观看直播间v的白用户集合;
Figure 911234DEST_PATH_IMAGE009
表示偏置量;
Figure 827238DEST_PATH_IMAGE011
表示全体用户观看时长增量的权 重;
Figure 16910DEST_PATH_IMAGE012
表示白用户观看时长增量的权重。
在上述各实施例的基础上,归一化热度影响值确定模块220,包括:
基于下述公式确定所述平均热度影响预测值:
Figure 119996DEST_PATH_IMAGE013
其中,AVG(PE)表示当前刷量策略对当前直播间的平均热度影响预测值;Vk表示当前刷量策略对应的刷量各直播间;
相应的,归一化热度影响值确定模块220,包括:
基于下述公式确定归一化热度影响值:
Figure 420527DEST_PATH_IMAGE014
其中,ak表示待更新的刷量策略集合中的当前刷量策略k;
Figure 456616DEST_PATH_IMAGE015
表示当 前刷量策略在当前刷量直播间的第一热度影响预测值,
Figure 800879DEST_PATH_IMAGE016
表示当前策 略对应的各刷量直播间中的最大热度影响预测值;
Figure 656839DEST_PATH_IMAGE017
表示当前策略对应 的各刷量直播间中的最大热度影响预测值。
在上述各实施例的基础上,效益影响值确定模块230,包括:
基于下述公式确定所述效益影响值:
Figure 761061DEST_PATH_IMAGE018
其中:
Figure 651657DEST_PATH_IMAGE019
是当前刷量直播间所对应的用户r对直播间v刷量而给平台带来 的损失;
Figure 917553DEST_PATH_IMAGE020
是采用刷量策略p进行刷量但是没有被平台识别刷量策略q识别的白用户 集合;
Figure 260810DEST_PATH_IMAGE021
是示性函数,表示的是用户v是否在上述白用户集合;Z1是非白用户 的数量;Z2是白用户的数量;
Figure DEST_PATH_IMAGE059
表示全体用户观看时长增量的权重;
Figure 621253DEST_PATH_IMAGE023
表示白用户观看时 长增量的权重。
在上述各实施例的基础上,目标刷量策略集合和目标识别策略集合确定模块240,包括:
基于下述公式更新所述待更新的刷量策略集合:
Figure 366355DEST_PATH_IMAGE024
其中,
Figure 803153DEST_PATH_IMAGE025
表示刷量直播间的数量;
Figure 633705DEST_PATH_IMAGE026
是学习率;
Figure 79730DEST_PATH_IMAGE027
是第t+1轮刷量策略k的选择 概率;
Figure 663027DEST_PATH_IMAGE028
表示归一化热度影响值;
基于下述公式更新所述待更新的识别策略集合:
Figure 536305DEST_PATH_IMAGE029
其中,
Figure 854154DEST_PATH_IMAGE030
是第t+1轮识别策略k的选择概率;y表示通过识别策略q识别的账号r是 否是刷量用户的结果,y=1表示的是识别是正常用户集合;
Figure 103870DEST_PATH_IMAGE031
表示识别的是正常 用户的概率;
Figure 292406DEST_PATH_IMAGE032
表示是采用第t+1轮刷量策略p进行刷量但是没有被平台第t轮识别 刷量策略q识别的用户集合。
本发明实施例所提供的目标用户识别装置可执行本发明任意实施例所提供的目标用户识别方法,具备执行方法相应的功能模块和有益效果。
值得注意的是,上述目标用户识别装置的实施例中,所包括的各个单元和模块只是按照功能逻辑进行划分的,但并不局限于上述的划分,只要能够实现相应的功能即可;另外,各功能单元的具体名称也只是为了便于相互区分,并不用于限制本发明的保护范围。
实施例三
图3为本发明实施例三提供的一种电子设备的结构示意图。图3示出了适于用来实现本发明实施方式的示例性电子设备12的框图。图3显示的电子设备12仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图3所示,电子设备12以通用计算电子设备的形式表现。电子设备12的组件可以包括但不限于:一个或者多个处理器或者处理单元16,系统存储器28,连接不同系统组件(包括系统存储器28和处理单元16)的总线18。
总线18表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器,外围总线,图形加速端口,处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构(ISA)总线,微通道体系结构(MAC)总线,增强型ISA总线、视频电子标准协会(VESA)局域总线以及外围组件互连(PCI)总线。
电子设备12典型地包括多种计算机系统可读介质。这些介质可以是任何能够被电子设备12访问的可用介质,包括易失性和非易失性介质,可移动的和不可移动的介质。
系统存储器28可以包括易失性存储器形式的计算机系统可读介质,例如随机存取存储器(RAM)30和/或高速缓存存储器32。电子设备12可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机系统存储介质。仅作为举例,存储系统34可以用于读写不可移动的、非易失性磁介质(图3未显示,通常称为“硬盘驱动器”)。尽管图3中未示出,可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘(例如CD-ROM, DVD-ROM或者其它光介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据介质接口与总线18相连。系统存储器28可以包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块,这些程序模块被配置以执行本发明各实施例的功能。
具有一组(至少一个)程序模块42的程序/实用工具40,可以存储在例如系统存储器28中,这样的程序模块42包括但不限于操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块42通常执行本发明所描述的实施例中的功能和/或方法。
电子设备12也可以与一个或多个外部设备14(例如键盘、指向设备、显示器24等)通信,还可与一个或者多个使得用户能与该电子设备12交互的设备通信,和/或与使得该电子设备12能与一个或多个其它计算设备进行通信的任何设备(例如网卡,调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口22进行。并且,电子设备12还可以通过网络适配器20与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图3所示,网络适配器20通过总线18与电子设备12的其它模块通信。应当明白,尽管图3中未示出,可以结合电子设备12使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
处理单元16通过运行存储在系统存储器28中的程序,从而执行各种功能应用以及样本数据获取,例如实现本发实施例所提供的一种目标用户识别方法步骤,目标用户识别方法包括:
从待更新的刷量策略集合确定当前刷量直播间所对应的目标刷量策略以及从待更新的识别策略集合中确定目标识别策略,基于所述目标刷量策略以及目标识别策略确定所述当前刷量直播间的第一热度影响预测值;
确定当前刷量策略在当前刷量直播间的第二热度影响预测值,基于当前刷量策略在各刷量直播间的第二热度影响预测值确定各刷量直播间的平均热度影响预测值,并基于所述当前刷量直播间的第一热度影响预测值、所述各刷量直播间的第二热度影响预测值以及所述各刷量直播间的平均热度影响预测值,确定所述当前刷量直播间的归一化热度影响值;
根据所述当前刷量直播间所对应的用户数量和预设函数,确定所述当前直播间所在直播平台的效益影响值;
当检测到待更新的识别策略集合和所述待更新的刷量策略集合不满足预设条件时,基于所述归一化热度影响值更新迭代所述待更新的刷量策略集合,并基于所述效益影响值更新迭代所述待更新的识别策略集合,直至所述待更新的识别策略集合和所述待更新的刷量策略集合满足预设条件,得到目标刷量策略集合和目标识别策略集合;
基于所述目标识别策略集合对所述目标刷量策略集合进行刷量用户识别,确定所述刷量直播间的目标刷量用户。
当然,本领域技术人员可以理解,处理器还可以实现本发明任意实施例所提供的样本数据获取方法的技术方案。
实施例四
本实施例四提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现例如实现本发实施例所提供的一种目标用户识别方法步骤,目标用户识别方法包括:
从待更新的刷量策略集合确定当前刷量直播间所对应的目标刷量策略以及从待更新的识别策略集合中确定目标识别策略,基于所述目标刷量策略以及目标识别策略确定所述当前刷量直播间的第一热度影响预测值;
确定当前刷量策略在当前刷量直播间的第二热度影响预测值,基于当前刷量策略在各刷量直播间的第二热度影响预测值确定各刷量直播间的平均热度影响预测值,并基于所述当前刷量直播间的第一热度影响预测值、所述各刷量直播间的第二热度影响预测值以及所述各刷量直播间的平均热度影响预测值,确定所述当前刷量直播间的归一化热度影响值;
根据所述当前刷量直播间所对应的用户数量和预设函数,确定所述当前直播间所在直播平台的效益影响值;
当检测到待更新的识别策略集合和所述待更新的刷量策略集合不满足预设条件时,基于所述归一化热度影响值更新迭代所述待更新的刷量策略集合,并基于所述效益影响值更新迭代所述待更新的识别策略集合,直至所述待更新的识别策略集合和所述待更新的刷量策略集合满足预设条件,得到目标刷量策略集合和目标识别策略集合;
基于所述目标识别策略集合对所述目标刷量策略集合进行刷量用户识别,确定所述刷量直播间的目标刷量用户。
本发明实施例的计算机存储介质,可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是但不限于:电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言或其组合来编写用于执行本发明操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言,诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络,包括局域网(LAN)或广域网(WAN),连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
本领域普通技术人员应该明白,上述的本发明的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个计算装置上,或者分布在多个计算装置所组成的网络上,可选地,他们可以用计算机装置可执行的程序代码来实现,从而可以将它们存储在存储装置中由计算装置来执行,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件的结合。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本 发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。

Claims (10)

1.一种目标用户识别方法,其特征在于,包括:
从待更新的刷量策略集合确定当前刷量直播间所对应的目标刷量策略以及从待更新的识别策略集合中确定目标识别策略,基于所述目标刷量策略以及目标识别策略确定所述当前刷量直播间的第一热度影响预测值;
确定当前刷量策略在当前刷量直播间的第二热度影响预测值,基于当前刷量策略在各刷量直播间的第二热度影响预测值确定各刷量直播间的平均热度影响预测值,并基于所述当前刷量直播间的第一热度影响预测值、所述各刷量直播间的第二热度影响预测值以及所述各刷量直播间的平均热度影响预测值,确定所述当前刷量直播间的归一化热度影响值;
根据所述当前刷量直播间所对应的用户数量和预设函数,确定所述当前直播间所在直播平台的效益影响值;
当检测到待更新的识别策略集合和所述待更新的刷量策略集合不满足预设条件时,基于所述归一化热度影响值更新迭代所述待更新的刷量策略集合,并基于所述效益影响值更新迭代所述待更新的识别策略集合,直至所述待更新的识别策略集合和所述待更新的刷量策略集合满足预设条件,得到目标刷量策略集合和目标识别策略集合;
基于所述目标识别策略集合对所述目标刷量策略集合进行刷量用户识别,确定所述刷量直播间的目标刷量用户。
2.根据权利要求1所述的方法,其特征在于,所述从待更新的刷量策略集合确定当前刷量直播间所对应的目标刷量策略以及从待更新的识别策略集合中确定目标识别策略,包括:
获取待更新的刷量策略集合中的各刷量策略分别对应的刷量概率,基于各所述刷量概率确定当前刷量直播间所对应的目标刷量策略;
获取待更新的识别策略集合中的各识别策略分别对应的识别概率,基于各所述识别概率确定当前刷量直播间所对应的目标识别策略。
3.根据权利要求1所述的方法,其特征在于,所述基于所述目标刷量策略以及目标识别策略确定所述当前直播间的第一热度影响预测值,包括:
基于下述公式确定所述第一热度影响预测值:
Figure DEST_PATH_IMAGE002
其中,R是全体用户集合;
Figure DEST_PATH_IMAGE004
表示直播间v的热度影响预测值;
Figure DEST_PATH_IMAGE006
表示的是全体用户R对直播间v的热度预测值;
Figure DEST_PATH_IMAGE008
表示的是直播间采用刷量策略p、平台采用识别策略q时全体用户R对直播间v的热度预测值。
4.根据权利要求3所述的方法,其特征在于,所述全体用户R对直播间v的热度预测值的确定方法包括:
基于下述公式确定所述热度预测值:
Figure DEST_PATH_IMAGE010
Figure DEST_PATH_IMAGE012
Figure DEST_PATH_IMAGE014
其中:
Figure 707318DEST_PATH_IMAGE006
是对直播间v热度的预测函数;
Figure DEST_PATH_IMAGE016
是直播间v的观看时长增量;g(S)表示给定用户集合S,其观看时长的平均值;R(v)表示观看直播间v的用户集合;RE(v)表示观看直播间v的白用户集合;
Figure DEST_PATH_IMAGE018
表示偏置量;
Figure DEST_PATH_IMAGE020
表示全体用户观看时长增量的权重;
Figure DEST_PATH_IMAGE022
表示白用户观看时长增量的权重。
5.根据权利要求1所述的方法,其特征在于,所述基于当前刷量策略在各刷量直播间的第二热度影响预测值确定各刷量直播间的平均热度影响预测值,包括:
基于下述公式确定所述平均热度影响预测值:
Figure DEST_PATH_IMAGE024
其中,AVG(PE)表示当前刷量策略对当前直播间的平均热度影响预测值;Vk表示当前刷量策略对应的刷量各直播间;
相应的,所述基于所述当前刷量直播间的第一热度影响预测值、所述各刷量直播间的第二热度影响预测值以及所述各刷量直播间的平均热度影响预测值,确定所述各刷量直播间的归一化热度影响值,包括:
基于下述公式确定归一化热度影响值:
Figure DEST_PATH_IMAGE026
其中,ak表示待更新的刷量策略集合中的当前刷量策略k;
Figure DEST_PATH_IMAGE028
表示当前刷量策略在当前刷量直播间的第一热度影响预测值,
Figure DEST_PATH_IMAGE030
表示当前策略对应的各刷量直播间中的最小热度影响预测值;
Figure DEST_PATH_IMAGE032
表示当前策略对应的各刷量直播间中的最大热度影响预测值。
6.根据权利要求4所述的方法,其特征在于,所述根据所述当前刷量直播间所对应的用户数量和预设函数,确定所述当前直播间所在直播平台的效益影响值,包括:
基于下述公式确定所述效益影响值:
Figure DEST_PATH_IMAGE034
其中:
Figure DEST_PATH_IMAGE036
是当前刷量直播间所对应的用户r对直播间v刷量而给平台带来的损失;
Figure DEST_PATH_IMAGE038
是采用刷量策略p进行刷量但是没有被平台识别刷量策略q识别的白用户集合;
Figure DEST_PATH_IMAGE040
是示性函数,表示的是用户v是否在上述白用户集合;Z1是非白用户的数量;Z2是白用户的数量;
Figure DEST_PATH_IMAGE041
表示全体用户观看时长增量的权重;
Figure DEST_PATH_IMAGE042
表示白用户观看时长增量的权重;是采用刷量策略p、而没有被平台识别刷量策略q识别的给定用户集合;是采用刷量策略p、而没有被平台识别刷量策略q识别的给定白用户集合。
7.根据权利要求1所述的方法,其特征在于,所述基于所述归一化热度影响值更新迭代所述待更新的刷量策略集合,并基于所述效益影响值更新迭代所述待更新的识别策略集合,包括:
基于下述公式更新所述待更新的刷量策略集合:
Figure DEST_PATH_IMAGE044
其中,
Figure DEST_PATH_IMAGE046
表示刷量直播间的数量;
Figure DEST_PATH_IMAGE048
是学习率;
Figure DEST_PATH_IMAGE050
是第t+1轮刷量策略k的选择概率;
Figure DEST_PATH_IMAGE052
表示归一化热度影响值;
基于下述公式更新所述待更新的识别策略集合:
Figure DEST_PATH_IMAGE054
其中,
Figure DEST_PATH_IMAGE056
是第t+1轮识别策略k的选择概率;y表示通过识别策略q识别的账号r是否是刷量用户的结果,y=1表示的是识别是正常用户集合;
Figure DEST_PATH_IMAGE058
表示识别的是正常用户的概率;
Figure DEST_PATH_IMAGE060
表示是采用第t+1轮刷量策略p进行刷量但是没有被平台第t轮识别刷量策略q识别的用户集合;min()函数表示最小值函数;表示识别策略q漏识别刷量用户给平台的最小损失;
Figure 404884DEST_PATH_IMAGE036
是当前刷量直播间所对应的用户r对直播间v刷量而给平台带来的损失;r=FN是漏识别的用户集合。
8.一种目标用户识别装置,其特征在于,包括:
第一热度影响预测值确定模块,用于从待更新的刷量策略集合确定当前刷量直播间所对应的目标刷量策略以及从待更新的识别策略集合中确定目标识别策略,基于所述目标刷量策略以及目标识别策略确定所述当前刷量直播间的第一热度影响预测值;
归一化热度影响值确定模块,用于确定当前刷量策略在当前刷量直播间的第二热度影响预测值,基于当前刷量策略在各刷量直播间的第二热度影响预测值确定各刷量直播间的平均热度影响预测值,并基于所述当前刷量直播间的第一热度影响预测值、所述各刷量直播间的第二热度影响预测值以及所述各刷量直播间的平均热度影响预测值,确定所述当前刷量直播间的归一化热度影响值;
效益影响值确定模块,用于根据所述当前刷量直播间所对应的用户数量和预设函数,确定所述当前直播间所在直播平台的效益影响值;
目标刷量策略集合和目标识别策略集合确定模块,用于当检测到待更新的识别策略集合和所述待更新的刷量策略集合不满足预设条件时,基于所述归一化热度影响值更新迭代所述待更新的刷量策略集合,并基于所述效益影响值更新迭代所述待更新的识别策略集合,直至所述待更新的识别策略集合和所述待更新的刷量策略集合满足预设条件,得到目标刷量策略集合和目标识别策略集合;
目标刷量用户确定模块,用于基于所述目标识别策略集合对所述目标刷量策略集合进行刷量用户识别,确定所述刷量直播间的目标刷量用户。
9.一种电子设备,其特征在于,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-7中任一所述的目标用户识别方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-7中任一所述的目标用户识别方法。
CN202110878442.6A 2021-08-02 2021-08-02 目标用户识别方法、装置、电子设备以及存储介质 Active CN113347497B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110878442.6A CN113347497B (zh) 2021-08-02 2021-08-02 目标用户识别方法、装置、电子设备以及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110878442.6A CN113347497B (zh) 2021-08-02 2021-08-02 目标用户识别方法、装置、电子设备以及存储介质

Publications (2)

Publication Number Publication Date
CN113347497A CN113347497A (zh) 2021-09-03
CN113347497B true CN113347497B (zh) 2021-11-26

Family

ID=77480481

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110878442.6A Active CN113347497B (zh) 2021-08-02 2021-08-02 目标用户识别方法、装置、电子设备以及存储介质

Country Status (1)

Country Link
CN (1) CN113347497B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114679600B (zh) * 2022-03-24 2024-09-03 上海哔哩哔哩科技有限公司 数据处理方法及装置

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106658096A (zh) * 2016-11-17 2017-05-10 百度在线网络技术(北京)有限公司 推送直播节目的方法和装置
CN108419126A (zh) * 2018-01-23 2018-08-17 广州虎牙信息科技有限公司 直播平台的异常主播识别方法、存储介质及终端
CN109086422A (zh) * 2018-08-08 2018-12-25 武汉斗鱼网络科技有限公司 一种机器弹幕用户的识别方法、装置、服务器和存储介质
WO2019052283A1 (zh) * 2017-09-13 2019-03-21 乐蜜有限公司 一种防盗刷方法、操作检测方法、装置及电子设备
CN110290400A (zh) * 2019-07-29 2019-09-27 北京奇艺世纪科技有限公司 可疑刷量视频的识别方法、真实播放量预估方法及装置
CN112860951A (zh) * 2019-11-28 2021-05-28 武汉斗鱼鱼乐网络科技有限公司 一种识别目标账号的方法及系统
CN112995689A (zh) * 2021-02-24 2021-06-18 上海哔哩哔哩科技有限公司 确定直播间刷量的方法及装置

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109714636B (zh) * 2018-12-21 2021-04-23 武汉瓯越网视有限公司 一种用户识别方法、装置、设备及介质
CN113068052B (zh) * 2021-03-15 2022-04-01 上海哔哩哔哩科技有限公司 确定直播间刷量的方法、直播方法以及数据处理方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106658096A (zh) * 2016-11-17 2017-05-10 百度在线网络技术(北京)有限公司 推送直播节目的方法和装置
WO2019052283A1 (zh) * 2017-09-13 2019-03-21 乐蜜有限公司 一种防盗刷方法、操作检测方法、装置及电子设备
CN108419126A (zh) * 2018-01-23 2018-08-17 广州虎牙信息科技有限公司 直播平台的异常主播识别方法、存储介质及终端
CN109086422A (zh) * 2018-08-08 2018-12-25 武汉斗鱼网络科技有限公司 一种机器弹幕用户的识别方法、装置、服务器和存储介质
CN110290400A (zh) * 2019-07-29 2019-09-27 北京奇艺世纪科技有限公司 可疑刷量视频的识别方法、真实播放量预估方法及装置
CN112860951A (zh) * 2019-11-28 2021-05-28 武汉斗鱼鱼乐网络科技有限公司 一种识别目标账号的方法及系统
CN112995689A (zh) * 2021-02-24 2021-06-18 上海哔哩哔哩科技有限公司 确定直播间刷量的方法及装置

Also Published As

Publication number Publication date
CN113347497A (zh) 2021-09-03

Similar Documents

Publication Publication Date Title
CN112633384B (zh) 基于图像识别模型的对象识别方法、装置和电子设备
US9852510B2 (en) Method and apparatus for dividing image area
CN109714636B (zh) 一种用户识别方法、装置、设备及介质
CN111526119B (zh) 异常流量检测方法、装置、电子设备和计算机可读介质
CN109086422B (zh) 一种机器弹幕用户的识别方法、装置、服务器和存储介质
CN112560996A (zh) 用户画像识别模型训练方法、设备、可读存储介质及产品
CN110688401B (zh) 动态缓存处理方法、装置、存储介质及电子设备
CN112990218A (zh) 图像语义分割模型的优化方法、装置和电子设备
CN114449343A (zh) 一种视频处理方法、装置、设备及存储介质
CN112149615A (zh) 人脸活体检测方法、装置、介质及电子设备
CN113347497B (zh) 目标用户识别方法、装置、电子设备以及存储介质
CN110826036A (zh) 用户操作行为安全性的识别方法、装置和电子设备
CN113627536A (zh) 模型训练、视频分类方法,装置,设备以及存储介质
CN113705362A (zh) 图像检测模型的训练方法、装置、电子设备及存储介质
CN115829058A (zh) 训练样本处理方法、跨模态匹配方法、装置、设备和介质
CN111090729A (zh) 欺诈团伙的识别方法、装置、服务器和存储介质
CN113360683A (zh) 训练跨模态检索模型的方法以及跨模态检索方法和装置
CN111815748B (zh) 一种动画处理方法、装置、存储介质及电子设备
CN112788351B (zh) 一种目标直播间的识别方法、装置、设备和存储介质
CN109637540B (zh) 智能语音设备的蓝牙评测方法、装置、设备及介质
CN113365113B (zh) 目标节点识别方法及装置
CN115376026A (zh) 关键区域定位方法、装置、设备及存储介质
CN115249281A (zh) 图像遮挡和模型训练方法、装置、设备以及存储介质
CN114630185B (zh) 一种目标用户识别方法、装置、电子设备和存储介质
CN113469057B (zh) 火眼视频自适应检测方法、装置、设备及介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
EE01 Entry into force of recordation of patent licensing contract

Application publication date: 20210903

Assignee: Yidu Lehuo Network Technology Co.,Ltd.

Assignor: WUHAN DOUYU YULE NETWORK TECHNOLOGY Co.,Ltd.

Contract record no.: X2023980041383

Denomination of invention: Target user identification methods, devices, electronic devices, and storage media

Granted publication date: 20211126

License type: Common License

Record date: 20230908

EE01 Entry into force of recordation of patent licensing contract