CN112788351B - 一种目标直播间的识别方法、装置、设备和存储介质 - Google Patents

一种目标直播间的识别方法、装置、设备和存储介质 Download PDF

Info

Publication number
CN112788351B
CN112788351B CN201911061084.9A CN201911061084A CN112788351B CN 112788351 B CN112788351 B CN 112788351B CN 201911061084 A CN201911061084 A CN 201911061084A CN 112788351 B CN112788351 B CN 112788351B
Authority
CN
China
Prior art keywords
live broadcast
user
broadcast room
room
watching
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201911061084.9A
Other languages
English (en)
Other versions
CN112788351A (zh
Inventor
王璐
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wuhan Douyu Network Technology Co Ltd
Original Assignee
Wuhan Douyu Network Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wuhan Douyu Network Technology Co Ltd filed Critical Wuhan Douyu Network Technology Co Ltd
Priority to CN201911061084.9A priority Critical patent/CN112788351B/zh
Publication of CN112788351A publication Critical patent/CN112788351A/zh
Application granted granted Critical
Publication of CN112788351B publication Critical patent/CN112788351B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/21Server components or server architectures
    • H04N21/218Source of audio or video content, e.g. local disk arrays
    • H04N21/2187Live feed
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/25Management operations performed by the server for facilitating the content distribution or administrating data related to end-users or client devices, e.g. end-user or client device authentication, learning user preferences for recommending movies
    • H04N21/251Learning process for intelligent management, e.g. learning user preferences for recommending movies
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/442Monitoring of processes or resources, e.g. detecting the failure of a recording device, monitoring the downstream bandwidth, the number of times a movie has been viewed, the storage space available from the internal hard disk
    • H04N21/44213Monitoring of end-user related data
    • H04N21/44218Detecting physical presence or behaviour of the user, e.g. using sensors to detect if the user is leaving the room or changes his face expression during a TV program
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/442Monitoring of processes or resources, e.g. detecting the failure of a recording device, monitoring the downstream bandwidth, the number of times a movie has been viewed, the storage space available from the internal hard disk
    • H04N21/44213Monitoring of end-user related data
    • H04N21/44222Analytics of user selections, e.g. selection of programs or purchase activity
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/45Management operations performed by the client for facilitating the reception of or the interaction with the content or administrating data related to the end-user or to the client device itself, e.g. learning user preferences for recommending movies, resolving scheduling conflicts
    • H04N21/466Learning process for intelligent management, e.g. learning user preferences for recommending movies
    • H04N21/4667Processing of monitored end-user data, e.g. trend analysis based on the log file of viewer selections

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Social Psychology (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computing Systems (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

本发明实施例公开了一种目标直播间的识别方法、装置、设备和存储介质,该方法包括:确定在设定时间段内观看过目标直播间的用户;基于用户观看直播间的行为建立所述用户的观看网络;根据所述用户的观看网络确定其中的用户团体;基于用户团体中每个用户在所述设定时间段内观看直播间的行为,确定所述用户团体的行为相似度;根据所述行为相似度确定所述目标直播间是否为异常直播间。通过本发明实施例的技术方案,实现了对目标直播间的准确识别。

Description

一种目标直播间的识别方法、装置、设备和存储介质
技术领域
本发明实施例涉及互联网技术领域,尤其涉及一种目标直播间的识别方法、装置、设备和存储介质。
背景技术
人气是直播平台上一个重要的指标,与用户观看直播间的行为有关。
有些主播为了提高自己直播间的热度、获得更多的利益,往往采用黑产途径刷直播间的人气。这种提高直播间人气的方法有损其他主播的利益,严重影响了直播平台的生态,且所述行为会造成直播网络堵塞、直播平台服务器压力过大等问题。因此为了降低上述行为给直播平台带来的负面影响,需要采用合理的方法及时且准确地找到相关的目标对象,并对其采取一定的干预措施,以营造良好的直播生态环境,减缓直播网络堵塞、直播平台服务器压力过大等问题。
发明内容
本发明实施例提供了一种目标直播间的识别方法、装置、设备和存储介质,以实现对目标直播间的准确识别。
第一方面,本发明实施例提供了一种目标直播间的识别方法,所述方法包括:
确定在设定时间段内观看过目标直播间的用户;
基于用户观看直播间的行为建立所述用户的观看网络;
根据所述用户的观看网络确定其中的用户团体;
基于用户团体中每个用户在所述设定时间段内观看直播间的行为,确定所述用户团体的行为相似度;
根据所述行为相似度确定所述目标直播间是否为异常直播间。
进一步的,所述基于用户观看直播间的行为建立所述用户的观看网络,包括:
将每个所述用户作为一个独立的顶点;
若两个用户在所述设定时间段内观看过相同的直播间或者观看过相同分区的直播间,则在所述两个用户对应的顶点之间形成一条边;
将所述用户对应的顶点、以及顶点之间的边确定为所述用户的观看网络;
其中,所述相同的直播间不包括所述目标直播间,所述相同分区不包括所述目标直播间所属的分区。
进一步的,根据所述用户的观看网络确定其中的用户团体,包括:
将构成连通图的所有顶点确定为其中一个用户团体。
进一步的,基于用户团体中每个用户在所述设定时间段内观看直播间的行为,确定所述用户团体的行为相似度,包括:
按照如下公式计算所述用户团体的行为相似度:
Figure BDA0002257977130000021
其中,c(r)表示观看过目标直播间r的用户团体的行为相似度,|Gr|表示在设定时间段内观看过目标直播间r的用户个数,
Figure BDA0002257977130000031
表示第k个观看目标直播间r的用户团体的成员数,n(r)表示观看目标直播间r的用户团体的数量,
Figure BDA0002257977130000032
表示第i个观看目标直播间r的用户团体中的成员观看直播间s的时长占比,
Figure BDA0002257977130000033
表示第j个观看目标直播间r的用户团体中的成员观看直播间s的时长占比,S表示观看过目标直播间r的用户团体中的成员在设定时间段内所观看直播间的交集,α为设定常数。
进一步的,根据所述行为相似度确定所述目标直播间是否为异常直播间,包括:
若所述相似度低于设定阈值,则确定所述目标直播间为刷人气直播间;
其中,所述设定阈值基于先验知识获得。
进一步的,所述方法还包括:
若所述目标直播间为刷人气直播间,则对所述目标直播间的人气进行削减。
第二方面,本发明实施例还提供了一种目标直播间的识别装置,所述装置包括:
用户确定模块,用于确定在设定时间段内观看过目标直播间的用户;
建立模块,用于基于用户观看直播间的行为建立所述用户的观看网络;
团体确定模块,用于根据所述用户的观看网络确定其中的用户团体;
相似度确定模块,用于基于用户团体中每个用户在所述设定时间段内观看直播间的行为,确定所述用户团体的行为相似度;
异常直播间确定模块,用于根据所述行为相似度确定所述目标直播间是否为异常直播间。
第三方面,本发明实施例还提供了一种设备,所述设备包括:
一个或多个处理器;
存储器,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如本发明任意实施例所提供的目标直播间的识别方法步骤。
第四方面,本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本发明任意实施例所提供的目标直播间的识别方法步骤。
上述发明中的实施例具有如下优点或有益效果:
通过确定在设定时间段内观看过目标直播间的用户;基于用户观看直播间的行为建立所述用户的观看网络;根据所述用户的观看网络确定其中的用户团体;基于用户团体中每个用户在所述设定时间段内观看直播间的行为,确定所述用户团体的行为相似度;根据所述行为相似度确定所述目标直播间是否为异常直播间的技术手段,实现了对目标直播间的准确识别。
附图说明
图1是本发明实施例一提供的一种目标直播间的识别方法的流程图;
图2是本发明实施例一提供的一种目标直播间的用户观看网络的示意图;
图3是本发明实施例二提供的一种目标直播间的识别装置的结构示意图;
图4是本发明实施例四提供的一种设备的结构示意图。
具体实施方式
下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。
实施例一
图1为本发明实施例一提供的一种目标直播间的识别方法的流程图,本实施例提供的目标直播间的识别方法可适用于对以不正当方式提高直播间人气的直播间进行识别的场景。该方法可以由目标直播间的识别装置来执行,该装置可以由软件和/或硬件的方式来实现,通常集成于终端,例如与直播平台对应的服务器。
如图1所示,该方法具体包括以下步骤:
步骤110、确定在设定时间段内观看过目标直播间的用户。
其中,所述设定时间段具体可以是1个月、3个月或者6个月等。具体可通过用户行为日志或者直播间的相关日志确定在设定时间段内观看过目标直播间的用户。
步骤120、基于用户观看直播间的行为建立所述用户的观看网络。
其中,所述用户观看直播间的行为具体指用户在所述设定时间段内具体观看过哪些直播间。进一步的,所述行为还可以包括用户观看每个直播间的时长。
示例性的,所述基于用户观看直播间的行为建立所述用户的观看网络,包括:
将每个所述用户作为一个独立的顶点;
若两个用户在所述设定时间段内观看过相同的直播间或者观看过相同分区的直播间,则在所述两个用户对应的顶点之间形成一条边;
将所述用户对应的顶点、以及顶点之间的边确定为所述用户的观看网络;
其中,所述相同的直播间不包括所述目标直播间,所述相同分区不包括所述目标直播间所属的分区,不同的直播间可能对应相同的分区。在直播领域,通常主播与直播间具有一一对应的关系,即一个主播对应唯一一个直播间,一个直播间对应唯一一个主播。直播间所属的分区具体指直播间所直播内容的分类(例如游戏、电影等类别),为了规范直播环境,给广大观众提供更多精准、优质的直播内容,直播平台通常约束主播不能直播与其所选分区无关的内容。
举例说明上述建立所述用户的观看网络的具体过程,假设在设定时间段2019年3月-2019年6月三个月的时间内,观看目标直播间r的用户包括:用户a、用户b、用户c、用户d、用户e、用户f、用户g、用户h、用户j和用户k,假设用户a在所述设定时间段内还观看过直播间p和直播间q,用户b在所述设定时间段内也观看过直播间p和直播间q,用户c在所述设定时间段内也观看过直播间p和直播间q,则在用户a与用户b以及用户c所对应的顶点之间形成一条边,具体可参见图2所示的一种目标直播间r的用户观看网络的示意图。假设用户d、用户e、用户f和用户g在所述设定时间段内均观看过直播间p和直播间t,则在用户d、用户e、用户f和用户g所对应的顶点之间形成一条边。
步骤130、根据所述用户的观看网络确定其中的用户团体。
示例性的,根据所述用户的观看网络确定其中的用户团体,包括:
将构成连通图的所有顶点确定为其中一个用户团体。
以图2所示的一种目标直播间r的用户观看网络的示意图为例,可以看出图2中存在两个连通图,分别是由用户a、用户b和用户c组成的用户团体,和由用户d、用户e、用户f和用户g组成的用户团体。
其中,用户团体具体指观看直播间的行为具有一定趋同性的用户组成的团体。对于一个正常的直播间,观看该直播间的用户的历史观看直播间的行为通常具有一定的趋同性,即观看该直播间的用户通常具有一些相同的观看兴趣。本实施例的技术方案基于该特征,通过确定观看过目标直播间的用户之间观看行为的相似性,达到识别目标直播间是否为正常直播间的目的。
步骤140、基于用户团体中每个用户在所述设定时间段内观看直播间的行为,确定所述用户团体的行为相似度。
其中,所述观看直播间的行为具体指在所述设定时间段内观看过哪些直播间,以及观看每个直播间的时长,或者观看每个直播间的时长占总时长的占比。
示例性的,按照如下公式计算所述用户团体的行为相似度:
Figure BDA0002257977130000071
其中,c(r)表示观看过目标直播间r的用户团体的行为相似度,|Gr|表示在设定时间段内观看过目标直播间r的用户个数,
Figure BDA0002257977130000072
表示第k个观看目标直播间r的用户团体的成员数,n(r)表示观看目标直播间r的用户团体的数量,
Figure BDA0002257977130000073
表示第i个观看目标直播间r的用户团体中的成员观看直播间s的时长占比,
Figure BDA0002257977130000074
表示第j个观看目标直播间r的用户团体中的成员观看直播间s的时长占比,S表示观看过目标直播间r的用户团体中的成员在设定时间段内所观看直播间的交集,α为设定常数,其取值在-1到1之间。
上述公式中,第一数据项
Figure BDA0002257977130000075
表示的是能够形成用户团体的用户占目标直播间r的观看用户总数的比例,该比例越大,则说明观看目标直播间r的用户中有其他共同观看内容(所述其他共同观看内容具体指除目标直播间r之外的其他直播间)的人越多,观看目标直播间r的用户观看内容的趋同性越强,上述公式通过采用比例的形式能够最直观地表征上述特征。
上述公式中的第二数据项
Figure BDA0002257977130000081
对各个用户团体之间的紧密性进行了衡量,若两个用户团体中团体成员观看的直播间或者直播间所属分区相同的越多,那么该两个用户团体之间的紧密性越强。上述第二数据项中的
Figure BDA0002257977130000082
表示用户团体两两之间的距离之和。对于特定的用户团体i和j,其距离公式设计为
Figure BDA0002257977130000083
该距离公式设计的原理是信息论中的Renyi熵,根据统计学中参数估计的基本思想将观看特定直播间的时长占比看作观看分布的一种估计,并结合散度以及Renyi熵的基本定义可以设计得到上述距离公式,该距离公式的好处是采用了分布距离度量团体距离,这符合业务的物理意义(在业务中用户观看直播间的差异一般认为是时长占比的差异),并且该距离公式可以通过常数α对散度计算进行调节。通过调节α可以采用不同的熵度量方法。
最后,为了便于度量用户团体的行为相似度,需要把距离转化为相似度,上述公式采用了一种常见的相似度变化方法——指数变换,其好处是可将距离转换为0到1之间的数值,这种变换具有非线性,当用户团体之间的距离之和非常大时,通过变换得到的相似度可以快速趋向于0,从而能够暴露出目标直播间的异常。
常数α的取值取决于对当前已知专门进行直播间刷人气的用户团体(专门进行直播间刷人气的用户团体称为刷人气用户团体)行为的统计分析,具体是计算已知刷人气用户团体两两之间各直播间的观看时长占比之比,取最大值,并取所有最大值的平均值。这是因为,如果一个用户团体内成员的某个直播间观看时长占比越高,则说明该某个直播间是刷人气直播间的概率越大。为了确定常数α,我们需要计算各团体之间刷人气的直播间是否是类似的,越类似那么常数α越低,取值最大的一个最能凸显这样的类似性,若取最小值那么对应的直播间很可能并不是一个刷人气的直播间,这样的直播间在用户团体内的观看时长占比较低,对识别直播间是否刷人气没有意义。取平均值是因为用户团体之间两两计算,平均值能够代表整体水平,不会因为个别情况影响最终结果。
例如已知刷人气用户团体有三个,分别为第一刷人气用户团体、第二刷人气用户团体和第三刷人气用户团体,其中,第一刷人气用户团体中的成员在设定时间段内观看过直播间p和直播间q,直播间p的观看时长占比为0.2,直播间q的观看时长占比为0.8。第二刷人气用户团体中的成员在设定时间段内观看过直播间p和直播间q,直播间p的观看时长占比为0.5,直播间q的观看时长占比为0.5。第三刷人气用户团体中的成员在设定时间段内观看过直播间p和直播间q,直播间p的观看时长占比为0.4,直播间q的观看时长占比为0.6。则针对目标直播间p的常数α的取值参考下述数值:通过取其中(0.2/0.5、0.5/0.2)的最大值为0.5/0.2;以及(0.2/0.4、0.4/0.2)中的最大值0.4/0.2;以及(0.5/0.4、0.4/0.5)中的最大值0.5/0.4,最后取0.5/0.2、0.4/0.2和0.5/0.4的平均值作为最终的计算结果,依据该结果设定常数α的取值。
如果通过计算得到的结果很大,则说明从当前情况来看,刷人气用户团体的观看内容趋同性很低,这时候常数α可以取较大的值,以凸显上述特征,常数α的取值在-1到1之间。
上述公式中,第一数据项
Figure BDA0002257977130000101
表示观看目标直播间r的用户观看内容的趋同性,第二数据项
Figure BDA0002257977130000102
对各个用户团体之间的紧密度进行了衡量。若只考虑第一数据项所表示的用户观看内容的趋同性,而不考虑各个用户团体之间的紧密型,则会因为热门直播间和热门分区导致的用户观看内容的趋同性,从而可能造成异常直播间的误判。如果仅考虑各个用户团体之间的紧密度,那么如果用户团体数量较少紧密度较高时,也会造成异常直播间的误判,因为此时在用户团体中只有少部分具有较高的聚集性,整体的趋同性很弱。综上所述,将两部分的数据项相乘能够提高整体的异常直播间的识别准确度,降低误判的可能性。
下面举例说明上述公式的计算过程:
假设对于目标直播间r,近6个月其观看人数是10,|Gr|=10,基于该10个观看人数确定得到2个用户团体,分别是
Figure BDA0002257977130000103
针对用户团体
Figure BDA0002257977130000104
其团体成员数是3,即
Figure BDA0002257977130000105
经过统计该用户团体的成员近6个月在直播间r、p、q有观看行为,观看时长占比分别是0.5、0.2、0.3;
针对用户团体
Figure BDA0002257977130000111
其团体成员数是4,即
Figure BDA0002257977130000112
经过统计该用户团体的成员近6个月在直播间r、p、t有观看行为,观看时长占比分别是0.3、0.1、0.5;
观看过目标直播间r的用户团体
Figure BDA0002257977130000113
中的成员在近6个月内所观看直播间的交集S={r、p};
取α=0.5,按照上述公式可得到用户团体的行为相似度为:
Figure BDA0002257977130000114
若设定阈值为0.4,则由于目标直播间r的用户团体的行为相似度大于0.4,则该目标直播间r不具有刷人气嫌疑,其不是异常直播间。
步骤150、根据所述行为相似度确定所述目标直播间是否为异常直播间。
具体的,若所述相似度低于设定阈值,则确定所述目标直播间为刷人气直播间。对于一个正常的直播间,观看过该正常直播间的用户往往具有一些相同的观看兴趣,即所述用户的观看行为具有一定的趋同性,若观看过目标直播间的用户团体之间的相似度较低,则表明用户团体之间的观看行为趋同性较低,表明所述目标直播间很可能是异常直播间,所述目标直播间很大可能是通过该用户团体进行刷人气的异常直播间。本实施例通过对已知刷人气用户团体的历史观看行为进行统计,并合理设置上述公式中的常数α,使得团体的行为相似度的计算更加准确,进而提高目标直播间的识别准确度。
其中,所述设定阈值基于先验知识获得,具体是:对已知刷人气直播间的刷人气用户团体的历史观看行为进行统计,并按照上述公式计算各刷人气直播间的刷人气用户团体的行为相似度,并依据该行为相似度设置所述设定阈值。
进一步的,所述方法还包括:
若所述目标直播间为刷人气直播间,则对所述目标直播间的人气进行削减,以营造良好的直播生态环境。
本实施例的技术方案,通过确定在设定时间段内观看过目标直播间的用户;基于用户观看直播间的行为建立所述用户的观看网络;根据所述用户的观看网络确定其中的用户团体;基于用户团体中每个用户在所述设定时间段内观看直播间的行为,确定所述用户团体的行为相似度;根据所述行为相似度确定所述目标直播间是否为异常直播间的技术手段,实现了对目标直播间的准确识别。
以下是本发明实施例提供的目标直播间的识别装置的实施例,该装置与上述各实施例的目标直播间的识别方法属于同一个发明构思,在目标直播间的识别装置的实施例中未详尽描述的细节内容,可以参考上述目标直播间的识别方法的实施例。
实施例二
图3为本发明实施例二提供的一种目标直播间的识别装置的结构示意图,该装置具体包括:用户确定模块310、建立模块320、团体确定模块330、相似度确定模块340和异常直播间确定模块350;
其中,用户确定模块310,用于确定在设定时间段内观看过目标直播间的用户;建立模块320,用于基于用户观看直播间的行为建立所述用户的观看网络;团体确定模块330,用于根据所述用户的观看网络确定其中的用户团体;相似度确定模块340,用于基于用户团体中每个用户在所述设定时间段内观看直播间的行为,确定所述用户团体的行为相似度;异常直播间确定模块350,用于根据所述行为相似度确定所述目标直播间是否为异常直播间。
进一步的,建立模块320包括:
确定单元,用于将每个所述用户作为一个独立的顶点;
连线单元,用于若两个用户在所述设定时间段内观看过相同的直播间或者观看过相同分区的直播间,则在所述两个用户对应的顶点之间形成一条边;
其中,将所述用户对应的顶点、以及顶点之间的边确定为所述用户的观看网络;所述相同的直播间不包括所述目标直播间,所述相同分区不包括所述目标直播间所属的分区。
进一步的,团体确定模块330具体用于:将构成连通图的所有顶点确定为其中一个用户团体。
进一步的,相似度确定模块340具体用于:
按照如下公式计算所述用户团体的行为相似度:
Figure BDA0002257977130000131
其中,c(r)表示观看过目标直播间r的用户团体的行为相似度,|Gr|表示在设定时间段内观看过目标直播间r的用户个数,
Figure BDA0002257977130000132
表示第k个观看目标直播间r的用户团体的成员数,n(r)表示观看目标直播间r的用户团体的数量,
Figure BDA0002257977130000133
表示第i个观看目标直播间r的用户团体中的成员观看直播间s的时长占比,
Figure BDA0002257977130000134
表示第j个观看目标直播间r的用户团体中的成员观看直播间s的时长占比,S表示观看过目标直播间r的用户团体中的成员在设定时间段内所观看直播间的交集,α为设定常数。
进一步的,异常直播间确定模块350具体用于:
若所述相似度低于设定阈值,则确定所述目标直播间为刷人气直播间;
其中,所述设定阈值基于先验知识获得。
进一步的,所述装置还包括:
削减模块,用于若所述目标直播间为刷人气直播间,则对所述目标直播间的人气进行削减。
本实施例的技术方案,通过确定在设定时间段内观看过目标直播间的用户;基于用户观看直播间的行为建立所述用户的观看网络;根据所述用户的观看网络确定其中的用户团体;基于用户团体中每个用户在所述设定时间段内观看直播间的行为,确定所述用户团体的行为相似度;根据所述行为相似度确定所述目标直播间是否为异常直播间的技术手段,实现了对目标直播间的准确识别。
本发明实施例所提供的目标直播间的识别装置可执行本发明任意实施例所提供的目标直播间的识别方法,具备执行目标直播间的识别方法相应的功能模块和有益效果。
实施例三
图4为本发明实施例三提供的一种设备的结构示意图。图4示出了适于用来实现本发明实施方式的示例性设备12的框图。图4显示的设备12仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图4所示,设备12以通用计算设备的形式表现。设备12的组件可以包括但不限于:一个或者多个处理器或者处理单元16,系统存储器28,连接不同系统组件(包括系统存储器28和处理单元16)的总线18。
总线18表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器,外围总线,图形加速端口,处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构(ISA)总线,微通道体系结构(MAC)总线,增强型ISA总线、视频电子标准协会(VESA)局域总线以及外围组件互连(PCI)总线。
设备12典型地包括多种计算机系统可读介质。这些介质可以是任何能够被设备12访问的可用介质,包括易失性和非易失性介质,可移动的和不可移动的介质。
系统存储器28可以包括易失性存储器形式的计算机系统可读介质,例如随机存取存储器(RAM)30和/或高速缓存存储器32。设备12可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机系统存储介质。仅作为举例,存储系统34可以用于读写不可移动的、非易失性磁介质(图4未显示,通常称为“硬盘驱动器”)。尽管图4中未示出,可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘(例如CD-ROM,DVD-ROM或者其它光介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据介质接口与总线18相连。系统存储器28可以包括至少一个程序产品,该程序产品具有一组(例如目标直播间的识别装置的用户确定模块310、建立模块320、团体确定模块330、相似度确定模块340和异常直播间确定模块350)程序模块,这些程序模块被配置以执行本发明各实施例的功能。
具有一组(目标直播间的识别装置的用户确定模块310、建立模块320、团体确定模块330、相似度确定模块340和异常直播间确定模块350)程序模块42的程序/实用工具40,可以存储在例如系统存储器28中,这样的程序模块42包括但不限于操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块42通常执行本发明所描述的实施例中的功能和/或方法。
设备12也可以与一个或多个外部设备14(例如键盘、指向设备、显示器24等)通信,还可与一个或者多个使得用户能与该设备12交互的设备通信,和/或与使得该设备12能与一个或多个其它计算设备进行通信的任何设备(例如网卡,调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口22进行。并且,设备12还可以通过网络适配器20与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图所示,网络适配器20通过总线18与设备12的其它模块通信。应当明白,尽管图中未示出,可以结合设备12使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
处理单元16通过运行存储在系统存储器28中的程序,从而执行各种功能应用以及数据处理,例如实现本发实施例所提供的一种目标直播间的识别方法步骤,该方法包括:
确定在设定时间段内观看过目标直播间的用户;
基于用户观看直播间的行为建立所述用户的观看网络;
根据所述用户的观看网络确定其中的用户团体;
基于用户团体中每个用户在所述设定时间段内观看直播间的行为,确定所述用户团体的行为相似度;
根据所述行为相似度确定所述目标直播间是否为异常直播间。
当然,本领域技术人员可以理解,处理器还可以实现本发明任意实施例所提供的目标直播间的识别方法的技术方案。
实施例四
本实施例四提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本发明任意实施例所提供的目标直播间的识别方法步骤,该方法包括:
确定在设定时间段内观看过目标直播间的用户;
基于用户观看直播间的行为建立所述用户的观看网络;
根据所述用户的观看网络确定其中的用户团体;
基于用户团体中每个用户在所述设定时间段内观看直播间的行为,确定所述用户团体的行为相似度;
根据所述行为相似度确定所述目标直播间是否为异常直播间。
本发明实施例的计算机存储介质,可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是但不限于:电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言或其组合来编写用于执行本发明操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言,诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络,包括局域网(LAN)或广域网(WAN),连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
本领域普通技术人员应该明白,上述的本发明的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个计算装置上,或者分布在多个计算装置所组成的网络上,可选地,他们可以用计算机装置可执行的程序代码来实现,从而可以将它们存储在存储装置中由计算装置来执行,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件的结合。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。

Claims (7)

1.一种目标直播间的识别方法,其特征在于,包括:
确定在设定时间段内观看过目标直播间的用户;
基于用户观看直播间的行为建立所述用户的观看网络;
根据所述用户的观看网络确定其中的用户团体;
基于用户团体中每个用户在所述设定时间段内观看直播间的行为,确定所述用户团体的行为相似度;
根据所述行为相似度确定所述目标直播间是否为异常直播间;
所述基于用户观看直播间的行为建立所述用户的观看网络,包括:
将每个所述用户作为一个独立的顶点;
若两个用户在所述设定时间段内观看过相同的直播间或者观看过相同分区的直播间,则在所述两个用户对应的顶点之间形成一条边;
将所述用户对应的顶点、以及顶点之间的边确定为所述用户的观看网络;
其中,所述相同的直播间不包括所述目标直播间,所述相同分区不包括所述目标直播间所属的分区;
其中,所述基于用户团体中每个用户在所述设定时间段内观看直播间的行为,确定所述用户团体的行为相似度,包括:
按照如下公式计算所述用户团体的行为相似度:
Figure FDA0003694146150000011
其中,c(r)表示观看过目标直播间r的用户团体的行为相似度,|Gr|表示在设定时间段内观看过目标直播间r的用户个数,
Figure FDA0003694146150000012
表示第k个观看目标直播间r的用户团体的成员数,n(r)表示观看目标直播间r的用户团体的数量,
Figure FDA0003694146150000021
表示第i个观看目标直播间r的用户团体中的成员观看直播间s的时长占比,
Figure FDA0003694146150000022
表示第j个观看目标直播间r的用户团体中的成员观看直播间s的时长占比,S表示观看过目标直播间r的用户团体中的成员在设定时间段内所观看直播间的交集,α为设定常数。
2.根据权利要求1所述的方法,其特征在于,根据所述用户的观看网络确定其中的用户团体,包括:
将构成连通图的所有顶点确定为其中一个用户团体。
3.根据权利要求1-2任一项所述的方法,其特征在于,根据所述行为相似度确定所述目标直播间是否为异常直播间,包括:
若所述相似度低于设定阈值,则确定所述目标直播间为刷人气直播间;
其中,所述设定阈值基于先验知识获得。
4.根据权利要求1-2任一项所述的方法,其特征在于,所述方法还包括:
若所述目标直播间为刷人气直播间,则对所述目标直播间的人气进行削减。
5.一种目标直播间的识别装置,其特征在于,包括:
用户确定模块,用于确定在设定时间段内观看过目标直播间的用户;
建立模块,用于基于用户观看直播间的行为建立所述用户的观看网络;
团体确定模块,用于根据所述用户的观看网络确定其中的用户团体;
相似度确定模块,用于基于用户团体中每个用户在所述设定时间段内观看直播间的行为,确定所述用户团体的行为相似度;
异常直播间确定模块,用于根据所述行为相似度确定所述目标直播间是否为异常直播间;
所述建立模块包括:
确定单元,用于将每个所述用户作为一个独立的顶点;
连线单元,用于若两个用户在所述设定时间段内观看过相同的直播间或者观看过相同分区的直播间,则在所述两个用户对应的顶点之间形成一条边;
其中,将所述用户对应的顶点、以及顶点之间的边确定为所述用户的观看网络;所述相同的直播间不包括所述目标直播间,所述相同分区不包括所述目标直播间所属的分区;
其中,所述相似度确定模块具体用于:
按照如下公式计算所述用户团体的行为相似度:
Figure FDA0003694146150000031
其中,c(r)表示观看过目标直播间r的用户团体的行为相似度,|Gr|表示在设定时间段内观看过目标直播间r的用户个数,
Figure FDA0003694146150000032
表示第k个观看目标直播间r的用户团体的成员数,n(r)表示观看目标直播间r的用户团体的数量,
Figure FDA0003694146150000033
表示第i个观看目标直播间r的用户团体中的成员观看直播间s的时长占比,
Figure FDA0003694146150000034
表示第j个观看目标直播间r的用户团体中的成员观看直播间s的时长占比,S表示观看过目标直播间r的用户团体中的成员在设定时间段内所观看直播间的交集,α为设定常数。
6.一种设备,其特征在于,所述设备包括:
一个或多个处理器;
存储器,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-4中任一所述的目标直播间的识别方法步骤。
7.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-4中任一所述的目标直播间的识别方法步骤。
CN201911061084.9A 2019-11-01 2019-11-01 一种目标直播间的识别方法、装置、设备和存储介质 Active CN112788351B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911061084.9A CN112788351B (zh) 2019-11-01 2019-11-01 一种目标直播间的识别方法、装置、设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911061084.9A CN112788351B (zh) 2019-11-01 2019-11-01 一种目标直播间的识别方法、装置、设备和存储介质

Publications (2)

Publication Number Publication Date
CN112788351A CN112788351A (zh) 2021-05-11
CN112788351B true CN112788351B (zh) 2022-08-05

Family

ID=75747316

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911061084.9A Active CN112788351B (zh) 2019-11-01 2019-11-01 一种目标直播间的识别方法、装置、设备和存储介质

Country Status (1)

Country Link
CN (1) CN112788351B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114024737B (zh) * 2021-11-02 2023-10-17 上海哔哩哔哩科技有限公司 确定直播间刷量的方法、装置及计算机可读存储介质
CN114679600A (zh) * 2022-03-24 2022-06-28 上海哔哩哔哩科技有限公司 数据处理方法及装置

Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107027047A (zh) * 2017-05-16 2017-08-08 武汉斗鱼网络科技有限公司 视频直播监控方法、装置及电子设备
CN108829769A (zh) * 2018-05-29 2018-11-16 阿里巴巴集团控股有限公司 一种可疑群组发现方法和装置
CN108898505A (zh) * 2018-05-28 2018-11-27 武汉斗鱼网络科技有限公司 作弊团伙的识别方法、相关存储介质和电子设备
CN108989893A (zh) * 2018-08-21 2018-12-11 武汉斗鱼网络科技有限公司 一种直播间推荐方法、装置、终端和存储介质
CN109495770A (zh) * 2018-11-23 2019-03-19 武汉斗鱼网络科技有限公司 一种直播间推荐方法、装置、设备及介质
CN109714636A (zh) * 2018-12-21 2019-05-03 武汉瓯越网视有限公司 一种用户识别方法、装置、设备及介质
CN109873812A (zh) * 2019-01-28 2019-06-11 腾讯科技(深圳)有限公司 异常检测方法、装置及计算机设备
CN109902681A (zh) * 2019-03-04 2019-06-18 苏州达家迎信息技术有限公司 用户群体关系确定方法、装置、设备及存储介质
CN109977264A (zh) * 2019-02-19 2019-07-05 武汉斗鱼鱼乐网络科技有限公司 一种基于元路径相似度的用户推荐方法、系统、服务器及存储介质
CN110033170A (zh) * 2019-03-14 2019-07-19 阿里巴巴集团控股有限公司 识别风险商家的方法及装置
CN110177094A (zh) * 2019-05-22 2019-08-27 武汉斗鱼网络科技有限公司 一种用户团体识别方法、装置、电子设备及存储介质
CN110188262A (zh) * 2019-07-23 2019-08-30 武汉斗鱼网络科技有限公司 一种异常目标确定方法、装置、设备及介质

Patent Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107027047A (zh) * 2017-05-16 2017-08-08 武汉斗鱼网络科技有限公司 视频直播监控方法、装置及电子设备
CN108898505A (zh) * 2018-05-28 2018-11-27 武汉斗鱼网络科技有限公司 作弊团伙的识别方法、相关存储介质和电子设备
CN108829769A (zh) * 2018-05-29 2018-11-16 阿里巴巴集团控股有限公司 一种可疑群组发现方法和装置
CN108989893A (zh) * 2018-08-21 2018-12-11 武汉斗鱼网络科技有限公司 一种直播间推荐方法、装置、终端和存储介质
CN109495770A (zh) * 2018-11-23 2019-03-19 武汉斗鱼网络科技有限公司 一种直播间推荐方法、装置、设备及介质
CN109714636A (zh) * 2018-12-21 2019-05-03 武汉瓯越网视有限公司 一种用户识别方法、装置、设备及介质
CN109873812A (zh) * 2019-01-28 2019-06-11 腾讯科技(深圳)有限公司 异常检测方法、装置及计算机设备
CN109977264A (zh) * 2019-02-19 2019-07-05 武汉斗鱼鱼乐网络科技有限公司 一种基于元路径相似度的用户推荐方法、系统、服务器及存储介质
CN109902681A (zh) * 2019-03-04 2019-06-18 苏州达家迎信息技术有限公司 用户群体关系确定方法、装置、设备及存储介质
CN110033170A (zh) * 2019-03-14 2019-07-19 阿里巴巴集团控股有限公司 识别风险商家的方法及装置
CN110177094A (zh) * 2019-05-22 2019-08-27 武汉斗鱼网络科技有限公司 一种用户团体识别方法、装置、电子设备及存储介质
CN110188262A (zh) * 2019-07-23 2019-08-30 武汉斗鱼网络科技有限公司 一种异常目标确定方法、装置、设备及介质

Also Published As

Publication number Publication date
CN112788351A (zh) 2021-05-11

Similar Documents

Publication Publication Date Title
US20230273841A1 (en) Real-time synthetically generated video from still frames
CN107608964B (zh) 基于弹幕的直播内容的筛选方法、装置、设备及存储介质
US20230336637A1 (en) Method and apparatus for moderating abnormal users, electronic device, and storage medium
CN109086822B (zh) 一种主播用户分类方法、装置、设备及存储介质
CN109993627B (zh) 推荐方法、推荐模型的训练方法、装置和存储介质
CN109714636B (zh) 一种用户识别方法、装置、设备及介质
US20230171011A1 (en) Estimating volume of switching among television programs for an audience measurement panel
CN112788351B (zh) 一种目标直播间的识别方法、装置、设备和存储介质
CN110348715B (zh) 基于流量指标监测的渠道异常检测方法、装置和电子设备
CN112969079B (zh) 主播的资源分配方法、装置、计算机设备及存储介质
CN109246483B (zh) 一种直播间推荐方法、装置、设备及存储介质
CN114330752A (zh) 排序模型训练方法和排序方法
CN110502697B (zh) 一种目标用户识别方法、装置及电子设备
CN107729944B (zh) 一种低俗图片的识别方法、装置、服务器及存储介质
WO2023005421A1 (zh) 作品封面显示方法、装置、介质和电子设备
CN113347497B (zh) 目标用户识别方法、装置、电子设备以及存储介质
CN110719506B (zh) 用户对视频的兴趣度确定方法、装置、服务器及存储介质
CN112651764B (zh) 一种目标用户识别方法、装置、设备和存储介质
CN113365113A (zh) 目标节点识别方法及装置
CN110516024B (zh) 地图搜索结果展现方法、装置、设备和存储介质
CN114630185B (zh) 一种目标用户识别方法、装置、电子设备和存储介质
Wu et al. Application of Intelligent Analysis Technology of Football Video Based on Online Target Tracking Algorithm of Motion Characteristics in Football Training
CN112261484B (zh) 一种目标用户识别方法、装置、电子设备和存储介质
CN112184275B (zh) 人群细分方法、装置、设备及存储介质
CN114697711A (zh) 一种主播推荐方法、装置、电子设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant