CN114071196A - 一种识别目标直播间的方法及系统、介质、设备 - Google Patents

一种识别目标直播间的方法及系统、介质、设备 Download PDF

Info

Publication number
CN114071196A
CN114071196A CN202010771066.6A CN202010771066A CN114071196A CN 114071196 A CN114071196 A CN 114071196A CN 202010771066 A CN202010771066 A CN 202010771066A CN 114071196 A CN114071196 A CN 114071196A
Authority
CN
China
Prior art keywords
user
live broadcast
broadcast room
parameter value
live
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010771066.6A
Other languages
English (en)
Inventor
王璐
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wuhan Douyu Network Technology Co Ltd
Original Assignee
Wuhan Douyu Network Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wuhan Douyu Network Technology Co Ltd filed Critical Wuhan Douyu Network Technology Co Ltd
Priority to CN202010771066.6A priority Critical patent/CN114071196A/zh
Publication of CN114071196A publication Critical patent/CN114071196A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/25Management operations performed by the server for facilitating the content distribution or administrating data related to end-users or client devices, e.g. end-user or client device authentication, learning user preferences for recommending movies
    • H04N21/258Client or end-user data management, e.g. managing client capabilities, user preferences or demographics, processing of multiple end-users preferences to derive collaborative data
    • H04N21/25866Management of end-user data
    • H04N21/25891Management of end-user data being end-user preferences
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/235Processing of additional data, e.g. scrambling of additional data or processing content descriptors

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computer Graphics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种识别目标直播间的方法,根据网络直播平台的日志数据,获得表征用户参与第一公会旗下直播间集合R互动时长占比的第一参量值;并基于用户集合V中每个用户的第一参量值,获得用户集合V中每个用户对直播间集合R是目标用户的概率;基于用户集合V中每个用户的第一参量值和用户集合V中每个用户对直播间集合R是目标用户的概率,获得表征直播间集合R中的直播间与目标直播间的特征接近程度的第四参量值;若所述第四参量值大于预设参量阈值,将直播间集合R中的直播间识别为目标直播间。提供了一种识别目标直播间的方法,在提高识别效率的同时,提高了识别的准确率。

Description

一种识别目标直播间的方法及系统、介质、设备
技术领域
本发明涉及网络直播技术领域,尤其涉及一种识别目标直播间的方法及系统、介质、设备。
背景技术
直播公会是管理运营主播的经纪公司,一个直播公会旗下一般包括多个主播。在网络直播平台上,为了获利,公会常常会采用机器账号对公会旗下的直播间进行虚假观看。这种虚假观看实质上是一种恶意刷量行为,会异常占用网络直播平台的网络资源。为了解决占用网络资源的问题,需要将这些目标直播间准确识别出来,以对目标直播间所对应的公会进行整顿。
发明内容
鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的识别目标直播间的方法及系统。
一方面,本申请通过本申请的一实施例提供如下技术方案:
一种识别目标直播间的方法,所述方法包括:
获取网络直播平台的日志数据;
基于所述日志数据,获得表征用户参与第一公会旗下直播间集合R互动时长占比的第一参量值,表征用户参与所有公会旗下直播间集合A互动时长占比的第二参量值,以及表征用户参与除所述第一公会外的所有公会旗下直播间集合B互动时长占比的第三参量值;
基于用户集合V中每个用户的第一参量值、用户集合V中每个用户的第二参量值和用户集合V中每个用户的第三参量值,获得用户集合V中每个用户对直播间集合R是目标用户的概率;其中,用户集合V中包括参与直播间集合R互动的所有用户;
基于用户集合V中每个用户的第一参量值和用户集合V中每个用户对直播间集合R是目标用户的概率,获得表征直播间集合R中的直播间与目标直播间的特征接近程度的第四参量值;
若所述第四参量值大于预设参量阈值,将直播间集合R中的直播间识别为目标直播间。
可选的,所述基于所述日志数据,获得表征用户参与第一公会旗下直播间集合R互动时长占比的第一参量值,具体包括:
按照如下公式获得所述第一参量值:
Figure BDA0002614618090000021
其中,r是R中的任意一个直播间;
e(r,u)表示用户u参与直播间r互动时长占比,
Figure BDA0002614618090000022
w(r,u)是用户u对直播间r的观看时长,
Figure BDA0002614618090000023
是用户u的总观看时长,t是A中的任意一个直播间;
s(r,u)表示用户u参与直播间r互动的异常因子,在用户u至少满足任一异常条件时取值为1,否则为0。
可选的,所述异常条件,具体包括:
在参与直播间互动所使用的直播APP为预设时间前的版本;
在参与直播间互动时从内容分发网络拉取流量;
参与直播间互动时在直播APP没有对应行为记录。
可选的,所述基于用户集合V中每个用户的第一参量值、用户集合V中每个用户的第二参量值和用户集合V中每个用户的第三参量值,获得用户集合V中每个用户对直播间集合R是目标用户的概率,具体包括:
按照如下公式获得用户集合V中每个用户对直播间集合R是目标用户的概率:
p(u|R)=bα(u)+β(u)-2
其中,p(u|R)是用户u对直播间集合R是目标用户的概率;
Figure BDA0002614618090000031
fR(u)表示用户u的第一参量值,fA(u)表示用户u的第二参量值;
Figure BDA0002614618090000032
fB(u)表示用户u的第三参量值;b为常数,取值为1.5-2.5。
可选的,所述基于用户集合V中每个用户的第一参量值和用户集合V中每个用户对直播间集合R是目标用户的概率,获得表征直播间集合R中的直播间与目标直播间的特征接近程度的第四参量值,具体包括:
按照如下公式获得第四参量值:
Figure BDA0002614618090000033
其中,d是第四参量值;|R|是直播间集合R中的直播间数量。
可选的,在若所述第四参量值大于预设参量阈值,将直播间集合R中的直播间识别为目标直播间之前,所述方法还包括:
对每个直播间集合,分别获得表征各自直播间集合中的直播间与目标直播间的特征接近程度的参量值;
基于每个直播间集合的表征各自直播间集合中的直播间与目标直播间的特征接近程度的参量值,获得预设参量阈值。
可选的,在将直播间集合R中的直播间识别为目标直播间之后,所述方法还包括:
对所述目标直播间进行限制。
另一方面,本申请通过本申请的另一实施例提供一种识别目标直播间的系统,所述系统包括:
数据获取模块,用于获取网络直播平台的日志数据;
第一获得模块,用于基于所述日志数据,获得表征用户参与第一公会旗下直播间集合R互动时长占比的第一参量值,表征用户参与所有公会旗下直播间集合A互动时长占比的第二参量值,以及表征用户参与除所述第一公会外的所有公会旗下直播间集合B互动时长占比的第三参量值;
第二获得模块,用于基于用户集合V中每个用户的第一参量值、用户集合V中每个用户的第二参量值和用户集合V中每个用户的第三参量值,获得用户集合V中每个用户对直播间集合R是目标用户的概率;其中,用户集合V中包括参与直播间集合R互动的所有用户;
第三获得模块,用于基于用户集合V中每个用户的第一参量值和用户集合V中每个用户对直播间集合R是目标用户的概率,获得表征直播间集合R中的直播间与目标直播间的特征接近程度的第四参量值;
目标识别模块,用于若所述第四参量值大于预设参量阈值,将直播间集合R中的直播间识别为目标直播间。
本发明公开了一种可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述方法的步骤。
本发明公开了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述方法的步骤。
本申请实施例中提供的一个或多个技术方案,至少具有如下技术效果或优点:
本申请的方法根据网络直播平台的日志数据,分别获得表征用户参与第一公会旗下直播间集合R互动时长占比的第一参量值,表征用户参与所有公会旗下直播间集合A互动时长占比的第二参量值,以及表征用户参与除所述第一公会外的所有公会旗下直播间集合B互动时长占比的第三参量值;并基于用户集合V中每个用户的第一参量值、用户集合V中每个用户的第二参量值和用户集合V中每个用户的第三参量值,获得用户集合V中每个用户对直播间集合R是目标用户的概率;基于用户集合V中每个用户的第一参量值和用户集合V中每个用户对直播间集合R是目标用户的概率,获得表征直播间集合R中的直播间与目标直播间的特征接近程度的第四参量值;若所述第四参量值大于预设参量阈值,将直播间集合R中的直播间识别为目标直播间。直接对以公会为单位的直播间集合进行整体识别,具体根据目标用户参与目标公会旗下的直播间的互动时间长,而参与非该目标公会旗下的直播间的时间很少的特征,进行识别,从而提供了一种识别目标直播间的方法,在提高识别效率的同时,提高了识别的准确率。从而可对目标直播间所对应的公会进行整顿,避免对网络资源的多余占用。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
图1是本发明一种实施例中的识别目标直播间的方法流程图;
图2是本发明一种实施例中的识别目标直播间的系统构架图。
具体实施方式
本申请实施例通过提供一种识别目标直播间的方法及系统、介质、设备,为解决占用网络资源的问题,提供一种能准确识别出目标直播间的方法。
本申请实施例的技术方案为解决上述技术问题,总体思路如下:
一种识别目标直播间的方法,根据网络直播平台的日志数据,分别获得表征用户参与第一公会旗下直播间集合R互动时长占比的第一参量值,表征用户参与所有公会旗下直播间集合A互动时长占比的第二参量值,以及表征用户参与除所述第一公会外的所有公会旗下直播间集合B互动时长占比的第三参量值;并基于用户集合V中每个用户的第一参量值、用户集合V中每个用户的第二参量值和用户集合V中每个用户的第三参量值,获得用户集合V中每个用户对直播间集合R是目标用户的概率;基于用户集合V中每个用户的第一参量值和用户集合V中每个用户对直播间集合R是目标用户的概率,获得表征直播间集合R中的直播间与目标直播间的特征接近程度的第四参量值;若所述第四参量值大于预设参量阈值,将直播间集合R中的直播间识别为目标直播间。直接对以公会为单位的直播间集合进行整体识别,具体根据目标用户参与目标公会旗下的直播间的互动时间长,而参与非该目标公会旗下的直播间的时间很少的特征,进行识别,从而提供了一种识别目标直播间的方法,在提高识别效率的同时,提高了识别的准确率。从而可对目标直播间所对应的公会进行整顿,避免对网络资源的多余占用。
为了更好的理解上述技术方案,下面将结合说明书附图以及具体的实施方式对上述技术方案进行详细的说明。
首先说明,本文中出现的术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。
在网络直播平台上,现有针对目标直播间的识别方法的局限在于:
针对公会行为的目标直播间,通过单个直播间的刷量行为进行识别,然后根据单个直播间的数量情况得到整体公会的刷量,不仅识别效率低,而且非公会行为的目标直播间的特征会影响对于公会行为的目标直播间的识别准确率。
而本说明书的实施例提供的识别目标直播间的方法,可以克服现有技术的局限,提高对公会行为的目标直播间的识别效率和准确率。
实施例一
本实施提供了一种识别目标直播间的方法,用于网络直播平台,参见图1,本实施例的方法包括如下步骤:
S102、获取网络直播平台的日志数据;
S104、基于所述日志数据,获得表征用户参与第一公会旗下直播间集合R互动时长占比的第一参量值,表征用户参与所有公会旗下直播间集合A互动时长占比的第二参量值,以及表征用户参与除所述第一公会外的所有公会旗下直播间集合B互动时长占比的第三参量值;
S106、基于用户集合V中每个用户的第一参量值、用户集合V中每个用户的第二参量值和用户集合V中每个用户的第三参量值,获得用户集合V中每个用户对直播间集合R是目标用户的概率;其中,用户集合V中包括参与直播间集合R互动的所有用户;
S108、基于用户集合V中每个用户的第一参量值和用户集合V中每个用户对直播间集合R是目标用户的概率,获得表征直播间集合R中的直播间与目标直播间的特征接近程度的第四参量值;
S110、若所述第四参量值大于预设参量阈值,将直播间集合R中的直播间识别为目标直播间。
需要说明的是,本实施例中的用户可以是参与直播的人,也可以是参与直播互动的电子设备,如智能机器人等。在本实施例中,网络直播平台通常会开设多个直播间,每个直播间有主播与众多的用户进行互动。互动可以包括观看直播、游戏互动等一切网络直播中用户与主播的互动。而每个公会管理着其中的部分多个直播间,因此,每个公会旗下会至少形成一个直播间集合。本实施例的方法正是以公会为单位,对其旗下的直播间集合进行整体识别。
本实施例提供的识别目标直播间的方法可适用于对以公会为单位利用非正常互动用户(例如利用机器),非正常的参与其旗下的直播间互动的行为进行识别的场景。这种以非正常的参与其旗下的直播间互动的行为,以增加旗下直播间人气的作弊行为,行业网络流行语称为“刷单”。该方法可以由识别目标直播间的装置来执行,该装置可以由软件和/或硬件的方式来实现,通常集成于终端,例如与直播平台对应的服务器。
参见图1,本实施例方法的执行过程如下:
首先,执行S102,获取网络直播平台的日志数据。
其中,可以理解的是,日志数据是指该网络直播平台上记录的待识别直播间的互动活动所产生的数据,可以根据需要设置需要记录的日志数据。为了后续准确识别目标直播间,本实施例中的日志数据至少包括:每个用户参与各直播间的互动时长。
具体的,为了后续通过第一参量值、第二参量值和第三参量值来识别目标直播间,本实施例中的日志数据至少包括用户参与第一公会旗下直播间集合R互动时长、用户参与所有公会旗下直播间集合A互动时长和用户参与除所述第一公会外的所有公会旗下直播间集合B互动时长三种客观存在的日志数据。
接下来,执行S104,基于所述日志数据,获得表征用户参与第一公会旗下直播间集合R互动时长占比的第一参量值,表征用户参与所有公会旗下直播间集合A互动时长占比的第二参量值,以及表征用户参与除所述第一公会外的所有公会旗下直播间集合B互动时长占比的第三参量值。
具体的,为了后续获得用户对直播间集合R是目标用户的概率,在获得用户参与第一公会旗下直播间集合R互动时长、用户参与所有公会旗下直播间集合A互动时长和用户参与除所述第一公会外的所有公会旗下直播间集合B互动时长数据后,可采用相同的方法获得表征用户参与第一公会旗下直播间集合R互动时长占比的第一参量值,表征用户参与所有公会旗下直播间集合A互动时长占比的第二参量值,以及表征用户参与除所述第一公会外的所有公会旗下直播间集合B互动时长占比的第三参量值。
本实施例提供一种获得第一参量值的实施例,第二参量值和第三参量值的获得方法可参照执行。
示例性的,按照如下公式获得所述第一参量值:
Figure BDA0002614618090000101
其中,r是R中的任意一个直播间;
e(r,u)表示用户u参与直播间r互动时长占比,
Figure BDA0002614618090000102
w(r,u)是用户u对直播间r的观看时长,
Figure BDA0002614618090000103
是用户u的总观看时长,t是A中的任意一个直播间;
s(r,u)表示用户u参与直播间r互动的异常因子,在用户u至少满足任一异常条件时取值为1,否则为0。
在本实施例中,异常条件,具体包括:
在参与直播间互动所使用的直播APP为预设时间前的版本;
在参与直播间互动时未从内容分发网络拉取流量;
参与直播间互动时在直播APP没有对应行为记录。
其中,参与直播间互动时在直播APP没有对应行为记录是指在代码(前端或后端)的关键部位植入统计代码,对用户的行为进行记录,正常情况下参与直播间互动时相关操作会向服务器发送一条行为日志,而异常的互动操作没有对应的行为日志。
需要说明的是,选取本实施例的三个异常条件的原因是:
异常条件1在参与直播间互动所使用的直播APP为预设时间前的版本影响取值的原理是正常用户一般是使用最新版本的直播APP,而一些风险用户会使用预设时间前的版本,利用这些版本的一些功能上的漏洞达到其刷量的目的。
异常条件2在参与直播间互动时未从内容分发网络拉取流量影响取值的原理是正常用户在与直播间互动时一定需要从内容分发网络拉流,而风险用户通过伪造流量或者直接刷接口的方式与直播间互动,从而未从指定的内容分发网络拉取流量。
异常条件3参与直播间互动时在直播APP没有对应行为记录影响取值的原理是正常情况下参与直播间互动时相关操作会向服务器发送一条行为日志,而异常的互动操作没有对应的行为日志,缺少相应互动行为的打点。
基于上述原因,上述公式的原理是:参与互动的互动时长占比可以理解为用户在该直播间中的观看时长占其总观看时长的比例,它是直接对第一参量值的衡量,可以表用户的参与强度。由于最终目的是为了找到具有“刷单”行为的目标直播间,因此,引入了异常因子,对观看时长占比进行修正。异常因子越大,说明该直播间的参与行为越异常,需要更加关注在该直播间的观看行为,因此,在该公式采用乘积的方式,若异常因子取值是1,那么第一参量值为用户u参与直播间r互动时长占比,其含义是用户与直播间的互动行为是可疑的,需要在风险识别中考虑这样的互动行为;若异常因子取值是0,那么第一参量值为0,用户u参与直播间r互动行为是正常的,不会参与后面的计算。
接下来,执行S106,基于用户集合V中每个用户的第一参量值、用户集合V中每个用户的第二参量值和用户集合V中每个用户的第三参量值,获得用户集合V中每个用户对直播间集合R是目标用户的概率;其中,用户集合V中包括参与直播间集合R互动的所有用户。
在具体实施过程中,为了后续获得表征直播间集合R中的直播间与目标直播间的特征接近程度的第四参量值,首先获得用户集合V中每个用户对直播间集合R是目标用户的概率。
示例性的,可以按照如下公式获得用户集合V中每个用户对直播间集合R是目标用户的概率:
p(u|R)=bα(u)+β(u)-2
其中,p(u|R)是用户u对直播间集合R是目标用户的概率;
Figure BDA0002614618090000121
可以表征用户u对R的重要性,fR(u)表示用户u的第一参量值,fA(u)表示用户u的第二参量值;
Figure BDA0002614618090000122
可以表征用户u对R的排他性,fB(u)表示用户u的第三参量值;b为常数,取值为1.5-2.5。
上述公式的原理是:用户u对集合R观看的重要性α(u)可以通过用户u对R的参与强度占比来衡量,即,使用用户u的第一参量值fR(u)除以用户u的第二参量值fA(u),观看强度占比越高说明对该集合的重要程度越高。另外,由于各公会的直播间在直播内容上没有直接的相关性,因此,用户u在公会直播间集合R上的观看重要性非常高则说明具有比较大的异常的。
用户u对R的排他性,表示的是用户对公会直播间异常参与的均衡程度,计算该指标的目的是为了增强识别一些同时在多个公会旗下的直播间进行“刷单”的目标用户,这些用户重要性不高,但具有明显的排他性,因此排他性指标比较高。具体的,采用用户u对R的参与强度比上用户u对R之外的直播间B的参与强度
Figure BDA0002614618090000131
以及用户u对B的参与强度比上用户u对R的参与强度
Figure BDA0002614618090000132
之间的最小值。
在上述公式中,显然0≤α(u)≤1,0≤β(u)≤1,为了获得用户u是一个目标用户的概率,综合考虑这两种情况的影响,α(u)+β(u)-2使其取值在-2和0之间。另外,在上述公式中,采用了幂函数可以凸显用户的特征,使得α(u)+β(u)-2的值较大和较小的用户有明显的区分性。显然,α(u)和β(u)越大,是目标用户的概率就越大。由此获得的用户对直播间集合R是目标用户的概率,作为后续识别目标直播间的基础数据。
接下来,执行S108,基于用户集合V中每个用户的第一参量值和用户集合V中每个用户对直播间集合R是目标用户的概率,获得表征直播间集合R中的直播间与目标直播间的特征接近程度的第四参量值。
在具体实施过程中,为了后续准确识别初目标直播间,首先需要获得表征直播间集合R中的直播间与目标直播间的特征接近程度的第四参量值。
示例性的,可以按照如下公式获得第四参量值:
Figure BDA0002614618090000141
其中,d是第四参量值;|R|是直播间集合R中的直播间数量。
上述公式的原理是:第四参量值是通过用户对直播间集合R是目标用户的概率,通过用户的第一参量值fR(u)进行加权获得。即
Figure BDA0002614618090000142
表示的是所有对直播间集合R中的直播间的用户是目标用户的概率加总。由于,为了让各公会之间具有可比性,不受公会旗下直播间个数的影响,在归一化的基础上除以公会旗下直播间的个数|R|。
接下来,执行S110,若所述第四参量值大于预设参量阈值,将直播间集合R中的直播间识别为目标直播间。
在具体实施过程中,可以通过第四参量值与预设参量阈值的大小关系,来判断直播间集合R是否为目标直播间集合(即直播间集合R所属的公会是否为目标公会)中的直播间识别为目标直播间。
因此,在本实施例中,在若所述第四参量值大于预设参量阈值,将直播间集合R中的直播间识别为目标直播间之前,所述方法还可以包括:
对每个直播间集合,分别获得表征各自直播间集合中的直播间与目标直播间的特征接近程度的参量值;
基于每个直播间集合的表征各自直播间集合中的直播间与目标直播间的特征接近程度的参量值,获得预设参量阈值。
具体的,可以将每个公会旗下直播间集合的第四参量值按照从小到大进行排序,并根据对识别准确率和覆盖率的要求,取排序中一个中位数的第四参量值作为阈值,例如,可以取95%中位数的第四参量值作为预设参量阈值。若识别的覆盖率要求高那么阈值会降低,若识别的准确率要求高则阈值会增加。
可以理解的是,本实施例所记载的方法是以公会为单位,对各公会下的直播间集合进行整体识别的过程,在具体实施过程中,可以对网络直播平台的所有的公会旗下的直播间集合按照本实施例的方法进行识别,以识别出所有目标直播间,提高识别效率。另外,由于从公会整体入手,从而排除那些非公会行为的目标直播间对公会行为的遮盖和影响,提高对公会行为识别的准确率。
此外,在执行完上述S102-S110的步骤后,所述方法还包括:
对所述目标直播间进行限制,例如,限制其活动行为。以减少网络资源的占用,保证网络直播平台上直播间的直播流畅。或是清洗目标直播间的非正常参与时长,保证网络直播平台的正常运行。
下面以一个实际的例子,说明本实施例方法的实现过程:
假设用户u对直播间a和b、c有观看,具体的观看信息是:
w(a,u)=60,s(a,u)=1
w(b,u)=120,s(b,u)=1
w(c,u)=120,s(c,u)=1
Figure BDA0002614618090000151
Figure BDA0002614618090000161
Figure BDA0002614618090000162
于是用户u对直播间集合R={A,C}的第一参量值是:
fR(u)=0.2*1+0.4*0=0.2
用户的第三参量值是:
fA(u)=0.2*1+0.4*1=0.6
用户对除了集合R之外的直播间观看强度是:
fA/R(u)=0.4*1=0.4
计算用户u对直播间集合R的重要性和排他性:
Figure BDA0002614618090000163
Figure BDA0002614618090000164
那么u是目标用户的概率:
p(u|R)=20.34+0.5-2=0.45
则,第四参量值为:
Figure BDA0002614618090000165
上述本申请实施例中的技术方案,至少具有如下的技术效果或优点:
本实施例的方法根据网络直播平台的日志数据,分别获得表征用户参与第一公会旗下直播间集合R互动时长占比的第一参量值,表征用户参与所有公会旗下直播间集合A互动时长占比的第二参量值,以及表征用户参与除所述第一公会外的所有公会旗下直播间集合B互动时长占比的第三参量值;并基于用户集合V中每个用户的第一参量值、用户集合V中每个用户的第二参量值和用户集合V中每个用户的第三参量值,获得用户集合V中每个用户对直播间集合R是目标用户的概率;基于用户集合V中每个用户的第一参量值和用户集合V中每个用户对直播间集合R是目标用户的概率,获得表征直播间集合R中的直播间与目标直播间的特征接近程度的第四参量值;若所述第四参量值大于预设参量阈值,将直播间集合R中的直播间识别为目标直播间。直接对以公会为单位的直播间集合进行整体识别,具体根据目标用户参与目标公会旗下的直播间的互动时间长,而参与非该目标公会旗下的直播间的时间很少的特征,进行识别,从而提供了一种识别目标直播间的方法,在提高识别效率的同时,提高了识别的准确率。从而可对目标直播间所对应的公会进行整顿,避免对网络资源的多余占用。
实施例二
基于与实施例一同样的发明构思,本实施例提供一种识别目标直播间的系统,参见图2,所述系统包括:
数据获取模块,用于获取网络直播平台的日志数据;
第一获得模块,用于基于所述日志数据,获得表征用户参与第一公会旗下直播间集合R互动时长占比的第一参量值,表征用户参与所有公会旗下直播间集合A互动时长占比的第二参量值,以及表征用户参与除所述第一公会外的所有公会旗下直播间集合B互动时长占比的第三参量值;
第二获得模块,用于基于用户集合V中每个用户的第一参量值、用户集合V中每个用户的第二参量值和用户集合V中每个用户的第三参量值,获得用户集合V中每个用户对直播间集合R是目标用户的概率;其中,用户集合V中包括参与直播间集合R互动的所有用户;
第三获得模块,用于基于用户集合V中每个用户的第一参量值和用户集合V中每个用户对直播间集合R是目标用户的概率,获得表征直播间集合R中的直播间与目标直播间的特征接近程度的第四参量值;
目标识别模块,用于若所述第四参量值大于预设参量阈值,将直播间集合R中的直播间识别为目标直播间。
由于本实施例所介绍的识别目标直播间的系统为实现本申请实施例一种识别目标直播间的方法所采用的系统,故而基于本申请实施例一中所介绍的识别目标直播间的方法,本领域所属技术人员能够了解本实施例的系统的具体实施方式以及其各种变化形式,所以在此对于如何利用本中的系统实现实施例一中的方法不再详细介绍。只要本领域所属技术人员用于实现本申请实施例中识别目标直播间的方法所采用的系统,都属于本申请所欲保护的范围
基于与前述实施例中同样的发明构思,本发明实施例还提供一种可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现实施例一所述方法的步骤。
基于与前述实施例中同样的发明构思,本发明实施例还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现实施例一所述方法的步骤。
尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (10)

1.一种识别目标直播间的方法,其特征在于,所述方法包括:
获取网络直播平台的日志数据;
基于所述日志数据,获得表征用户参与第一公会旗下直播间集合R互动时长占比的第一参量值,表征用户参与所有公会旗下直播间集合A互动时长占比的第二参量值,以及表征用户参与除所述第一公会外的所有公会旗下直播间集合B互动时长占比的第三参量值;
基于用户集合V中每个用户的第一参量值、用户集合V中每个用户的第二参量值和用户集合V中每个用户的第三参量值,获得用户集合V中每个用户对直播间集合R是目标用户的概率;其中,用户集合V中包括参与直播间集合R互动的所有用户;
基于用户集合V中每个用户的第一参量值和用户集合V中每个用户对直播间集合R是目标用户的概率,获得表征直播间集合R中的直播间与目标直播间的特征接近程度的第四参量值;
若所述第四参量值大于预设参量阈值,将直播间集合R中的直播间识别为目标直播间。
2.如权利要求1所述的方法,其特征在于,所述基于所述日志数据,获得表征用户参与第一公会旗下直播间集合R互动时长占比的第一参量值,具体包括:
按照如下公式获得所述第一参量值:
Figure FDA0002614618080000011
其中,r是R中的任意一个直播间;
e(r,u)表示用户u参与直播间r互动时长占比,
Figure FDA0002614618080000021
w(r,u)是用户u对直播间r的观看时长,
Figure FDA0002614618080000022
是用户u的总观看时长,t是A中的任意一个直播间;
s(r,u)表示用户u参与直播间r互动的异常因子,在用户u至少满足任一异常条件时取值为1,否则为0。
3.如权利要求2所述的方法,其特征在于,所述异常条件,具体包括:
在参与直播间互动所使用的直播APP为预设时间前的版本;
在参与直播间互动时未从内容分发网络拉取流量;
参与直播间互动时在直播APP没有对应行为记录。
4.如权利要求2所述的方法,其特征在于,所述基于用户集合V中每个用户的第一参量值、用户集合V中每个用户的第二参量值和用户集合V中每个用户的第三参量值,获得用户集合V中每个用户对直播间集合R是目标用户的概率,具体包括:
按照如下公式获得用户集合V中每个用户对直播间集合R是目标用户的概率:
p(u|R)=bα(u)+β(u)-2
其中,p(u|R)是用户u对直播间集合R是目标用户的概率;
Figure FDA0002614618080000023
fR(u)表示用户u的第一参量值,fA(u)表示用户u的第二参量值;
Figure FDA0002614618080000024
fB(u)表示用户u的第三参量值;b为常数,取值为1.5-2.5。
5.如权利要求4所述的方法,其特征在于,所述基于用户集合V中每个用户的第一参量值和用户集合V中每个用户对直播间集合R是目标用户的概率,获得表征直播间集合R中的直播间与目标直播间的特征接近程度的第四参量值,具体包括:
按照如下公式获得第四参量值:
Figure FDA0002614618080000031
其中,d是第四参量值;|R|是直播间集合R中的直播间数量。
6.如权利要求1所述的方法,其特征在于,在若所述第四参量值大于预设参量阈值,将直播间集合R中的直播间识别为目标直播间之前,所述方法还包括:
对每个直播间集合,分别获得表征各自直播间集合中的直播间与目标直播间的特征接近程度的参量值;
基于每个直播间集合的表征各自直播间集合中的直播间与目标直播间的特征接近程度的参量值,获得预设参量阈值。
7.如权利要求1所述的方法,其特征在于,在将直播间集合R中的直播间识别为目标直播间之后,所述方法还包括:
对所述目标直播间进行限制。
8.一种识别目标直播间的系统,其特征在于,所述系统包括:
数据获取模块,用于获取网络直播平台的日志数据;
第一获得模块,用于基于所述日志数据,获得表征用户参与第一公会旗下直播间集合R互动时长占比的第一参量值,表征用户参与所有公会旗下直播间集合A互动时长占比的第二参量值,以及表征用户参与除所述第一公会外的所有公会旗下直播间集合B互动时长占比的第三参量值;
第二获得模块,用于基于用户集合V中每个用户的第一参量值、用户集合V中每个用户的第二参量值和用户集合V中每个用户的第三参量值,获得用户集合V中每个用户对直播间集合R是目标用户的概率;其中,用户集合V中包括参与直播间集合R互动的所有用户;
第三获得模块,用于基于用户集合V中每个用户的第一参量值和用户集合V中每个用户对直播间集合R是目标用户的概率,获得表征直播间集合R中的直播间与目标直播间的特征接近程度的第四参量值;
目标识别模块,用于若所述第四参量值大于预设参量阈值,将直播间集合R中的直播间识别为目标直播间。
9.一种可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现权利要求1-7任一项所述方法的步骤。
10.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现权利要求1-7任一项所述方法的步骤。
CN202010771066.6A 2020-08-03 2020-08-03 一种识别目标直播间的方法及系统、介质、设备 Pending CN114071196A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010771066.6A CN114071196A (zh) 2020-08-03 2020-08-03 一种识别目标直播间的方法及系统、介质、设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010771066.6A CN114071196A (zh) 2020-08-03 2020-08-03 一种识别目标直播间的方法及系统、介质、设备

Publications (1)

Publication Number Publication Date
CN114071196A true CN114071196A (zh) 2022-02-18

Family

ID=80231762

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010771066.6A Pending CN114071196A (zh) 2020-08-03 2020-08-03 一种识别目标直播间的方法及系统、介质、设备

Country Status (1)

Country Link
CN (1) CN114071196A (zh)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106385601A (zh) * 2016-09-14 2017-02-08 武汉斗鱼网络科技有限公司 基于多协议验证的同时观看直播人数的统计方法及系统
CN107454441A (zh) * 2017-06-30 2017-12-08 武汉斗鱼网络科技有限公司 一种检测直播间刷人气行为的方法、及直播平台服务器
CN108900909A (zh) * 2018-06-06 2018-11-27 武汉斗鱼网络科技有限公司 作弊用户的判断方法、相关存储介质和电子设备
CN109255371A (zh) * 2018-08-23 2019-01-22 武汉斗鱼网络科技有限公司 一种确定直播平台虚假关注用户的方法以及相关设备
CN109714636A (zh) * 2018-12-21 2019-05-03 武汉瓯越网视有限公司 一种用户识别方法、装置、设备及介质
CN110177094A (zh) * 2019-05-22 2019-08-27 武汉斗鱼网络科技有限公司 一种用户团体识别方法、装置、电子设备及存储介质
CN111417021A (zh) * 2020-03-16 2020-07-14 广州虎牙科技有限公司 外挂识别方法、装置、计算机设备和可读存储介质

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106385601A (zh) * 2016-09-14 2017-02-08 武汉斗鱼网络科技有限公司 基于多协议验证的同时观看直播人数的统计方法及系统
CN107454441A (zh) * 2017-06-30 2017-12-08 武汉斗鱼网络科技有限公司 一种检测直播间刷人气行为的方法、及直播平台服务器
CN108900909A (zh) * 2018-06-06 2018-11-27 武汉斗鱼网络科技有限公司 作弊用户的判断方法、相关存储介质和电子设备
CN109255371A (zh) * 2018-08-23 2019-01-22 武汉斗鱼网络科技有限公司 一种确定直播平台虚假关注用户的方法以及相关设备
CN109714636A (zh) * 2018-12-21 2019-05-03 武汉瓯越网视有限公司 一种用户识别方法、装置、设备及介质
CN110177094A (zh) * 2019-05-22 2019-08-27 武汉斗鱼网络科技有限公司 一种用户团体识别方法、装置、电子设备及存储介质
CN111417021A (zh) * 2020-03-16 2020-07-14 广州虎牙科技有限公司 外挂识别方法、装置、计算机设备和可读存储介质

Similar Documents

Publication Publication Date Title
CN108235102B (zh) 业务处理方法、装置及存储介质
CN109168048B (zh) 主播等级的确定方法、装置、设备及存储介质
CN109756746A (zh) 视频审核方法、装置、服务器及存储介质
CN110248203B (zh) 一种互动业务的处理方法、装置、设备和存储介质
CN109120949B (zh) 视频集合的视频消息推送方法、装置、设备及存储介质
CN110418173A (zh) 确定异常账户的方法、装置、服务器及存储介质
CN112860951B (zh) 一种识别目标账号的方法及系统
CN112969079A (zh) 主播的资源分配方法、装置、计算机设备及存储介质
CN112546621A (zh) 游戏直播的投票方法及装置、计算机存储介质、电子设备
CN113643070A (zh) 一种基于大数据的智能信息推送方法及系统
CN111581521A (zh) 群组成员的推荐方法、装置、服务器、存储介质及系统
CN111586432B (zh) 空播直播间确定方法、装置、服务器及存储介质
CN109086813B (zh) 主播相似度的确定方法、装置、设备及存储介质
CN108900909B (zh) 作弊用户的判断方法、相关存储介质和电子设备
CN114071196A (zh) 一种识别目标直播间的方法及系统、介质、设备
CN112788351B (zh) 一种目标直播间的识别方法、装置、设备和存储介质
CN110351577B (zh) 直播信息处理方法及装置、存储介质、电子设备
CN113515336B (zh) 直播间加入方法、创建方法、装置、设备及存储介质
CN111488491B (zh) 一种识别目标主播的方法及系统、介质、设备
CN113741930A (zh) 应用升级方法、装置、电子设备及计算机可读存储介质
CN111130983B (zh) 信息发送、生成结果信息的方法和设备
CN113873278A (zh) 播放内容审核方法、装置及电子设备
CN112308660A (zh) 数据处理方法、装置及系统
CN113747189B (zh) 直播信息的显示控制方法、装置、电子设备及计算机介质
CN113810341B (zh) 一种识别目标网络团体的方法及系统、存储介质、设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination