CN107948742A - 一种活跃用户查找方法与装置 - Google Patents

一种活跃用户查找方法与装置 Download PDF

Info

Publication number
CN107948742A
CN107948742A CN201711105223.4A CN201711105223A CN107948742A CN 107948742 A CN107948742 A CN 107948742A CN 201711105223 A CN201711105223 A CN 201711105223A CN 107948742 A CN107948742 A CN 107948742A
Authority
CN
China
Prior art keywords
active ues
user
result set
interactive object
collection
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201711105223.4A
Other languages
English (en)
Inventor
庞斌
张晓鹏
张吉民
张菊元
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Panda Mutual Entertainment Technology Co Ltd
Original Assignee
Beijing Panda Mutual Entertainment Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Panda Mutual Entertainment Technology Co Ltd filed Critical Beijing Panda Mutual Entertainment Technology Co Ltd
Priority to CN201711105223.4A priority Critical patent/CN107948742A/zh
Publication of CN107948742A publication Critical patent/CN107948742A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/442Monitoring of processes or resources, e.g. detecting the failure of a recording device, monitoring the downstream bandwidth, the number of times a movie has been viewed, the storage space available from the internal hard disk
    • H04N21/44213Monitoring of end-user related data
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/50Network services
    • H04L67/535Tracking the activity of the user
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/478Supplemental services, e.g. displaying phone caller identification, shopping application
    • H04N21/4788Supplemental services, e.g. displaying phone caller identification, shopping application communicating with other users, e.g. chatting
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/488Data services, e.g. news ticker
    • H04N21/4884Data services, e.g. news ticker for displaying subtitles

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • General Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Social Psychology (AREA)
  • Databases & Information Systems (AREA)
  • Computer Hardware Design (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明实施例提供一种活跃用户查找方法与装置,涉及互联网直播领域。其中,所述方法包括:获取多个用户中各个用户在一预设周期内的交互数和交互对象数;分别针对交互数和交互对象数对所述多个用户进行降序排列;分别根据所述交互数和交互对象数的排序结果,得到第一活跃用户结果集和第二活跃用户结果集;基于所述第一活跃用户结果集和所述第二活跃用户结果集,确定最终活跃用户集。本发明实施例能够准确地确定出网络平台上的活跃用户。

Description

一种活跃用户查找方法与装置
技术领域
本发明涉及互联网直播技术领域,尤其涉及一种活跃用户查找方法与装置。
背景技术
网络直播系统是一种将主播用户的直播视频流广播至多个观众用户进行观看的互联网系统。
网络直播平台的后台需确定出平台上的活跃主播和活跃观众。这样,在平台的后续运营或进行平台业务扩展时,这些活跃主播和活跃观众相关的数据就会成为很重要的参考数据。现有技术中,是通过由直播间的参与人数折算得到的人气来确定活跃主播,而这种仅根据人气来确定活跃主播的方式确定出的活跃主播的准确度较低,这对后续网站运营不利。
发明内容
本发明提供一种活跃用户查找方法与装置,目的在于能够准确地确定出网络平台上的活跃用户。
为了解决上述技术问题,本发明提供一种活跃用户查找方法与装置,包括:
获取多个用户中各个用户在一预设周期内的交互数和交互对象数;
分别针对交互数和交互对象数对所述多个用户进行降序排列;
分别根据所述交互数和交互对象数的排序结果,得到第一活跃用户结果集和第二活跃用户结果集;
基于所述第一活跃用户结果集和所述第二活跃用户结果集,确定最终活跃用户集。
可选地,分别根据所述交互数和交互对象数的排序结果,得到第一活跃用户结果集和第二活跃用户结果集,包括:
基于所述交互数的排序结果中排名靠前的N名用户或排名靠前的百分之n的用户,得到所述第一活跃用户结果集;
以及,基于所述交互对象数的排序结果中排名靠前的M名用户或排名靠前的百分之m的用户,得到所述第二活跃用户结果集。
可选地,所述基于所述第一活跃用户结果集和所述第二活跃用户结果集,确定最终活跃用户集,包括:
将所述第一活跃用户结果集和所述第二活跃用户结果集的并集确定为所述最终活跃用户集。
可选地,所述方法,还包括:
分别根据所述最终活跃用户集中各个活跃用户的交互数和交互对象数,确定所述各个活跃用户的第一活跃度和第二活跃度;
基于所述各个活跃用户的所述第一活跃度和所述第二活跃度,衡量所述各个活跃用户的活跃度。
可选地,所述根据所述最终活跃度用户集中的一个活跃用户的交互数,确定所述活跃用户的第一活跃度,包括:
对全体用户在所述预设周期内的交互数进行正态分布;
基于第一分布统计结果,确定第一映射系数;
将所述活跃用户的交互数以及所述第一映射系数代入第一预设映射函数,计算得到所述第一活跃度;
以及,所述根据所述最终活跃度用户集中的一个活跃用户的交互对象数,确定所述活跃用户的第二活跃度,包括:
对全体用户在所述预设周期内的交互对象数进行正态分布;
基于第二分布统计结果,确定第二映射系数;
将所述活跃用户的交互对象数以及所述第二映射系数代入第二预设映射函数,计算得到所述第二活跃度。
可选地,所述用户为主播用户或观众用户;
相应地,所述方法,还包括:
当所述用户为观众用户时,将所述交互数的排序结果中排名靠前的X名或排名靠前的百分之x的用户作为第一不正常用户集,将所述交互对象数的排序结果中排名靠前的Y名或排名靠前的百分之y的用户作为第二不正常用户集;
将所述第一不正常用户集和第二不正常用户集的交集确定为最终不正常用户集。
可选地,所述基于所述第一活跃用户结果集和第二活跃用户结果集,确定最终活跃用户集,包括:
将所述第一活跃用户结果集和第二活跃用户结果集的并集作为初始活跃用户集;
将所述初始活跃用户集与所述最终不正常用户集的差集作为最终活跃用户集。
为了解决上述技术问题,本发明提供了一种活跃用户查找装置,包括:
获取模块,用于获取多个用户中各个用户在一预设周期内的交互数和交互对象数;
排序模块,用于分别针对交互数和交互对象数对所述多个用户进行降序排列;
提取模块,用于分别根据所述交互数和交互对象数的排序结果,得到第一活跃用户结果集和第二活跃用户结果集;
第一确定模块,用于基于所述第一活跃用户结果集和所述第二活跃用户结果集,确定最终活跃用户集。
本发明实施例中,通过分别对平台上的用户在一预设周期内的交互数和交互对象数进行降序排列,再综合两个降序排列的结果来确定最终活跃用户集,也即在确定活跃用户时,不仅考虑交互对象数,还考虑交互数。可见,与现有技术中,仅根据参与人数来确定活跃用户相比,本发明实施例能更加准确地确定出活跃用户。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明一实施例提供的活跃用户查找方法的流程示意图;
图2为本发明又一实施例提供的活跃用户查找方法的流程示意图;
图3为本发明一实施例提供的活跃用户查找装置的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
在本发明实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本发明。在本发明实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义,“多种”一般包含至少两种,但是不排除包含至少一种的情况。
应当理解,本文中使用的术语“和/或”仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。
应当理解,尽管在本发明实施例中可能采用术语第一、第二、第三等来描述XXX,但这些XXX不应限于这些术语。这些术语仅用来将XXX彼此区分开。例如,在不脱离本发明实施例范围的情况下,第一XXX也可以被称为第二XXX,类似地,第二XXX也可以被称为第一XXX。
取决于语境,如在此所使用的词语“如果”、“若”可以被解释成为“在……时”或“当……时”或“响应于确定”或“响应于监测”。类似地,取决于语境,短语“如果确定”或“如果监测(陈述的条件或事件)”可以被解释成为“当确定时”或“响应于确定”或“当监测(陈述的条件或事件)时”或“响应于监测(陈述的条件或事件)”。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的商品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种商品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的商品或者系统中还存在另外的相同要素。
图1为本发明一实施例提供的活跃用户查找方法的流程示意图。如图1所示,该方法包括:
101、获取多个用户中各个用户在一预设周期内的交互数和交互对象数。
102、分别针对交互数和交互对象数对所述多个用户进行降序排列。
103、分别根据所述交互数和交互对象数的排序结果,得到第一活跃用户结果集和第二活跃用户结果集。
104、基于所述第一活跃用户结果集和所述第二活跃用户结果集,确定最终活跃用户集。
在网络直播平台上存在主播用户和观众用户,观众用户可通过进入某一主播的直播间页面观看直播间视频,发送弹幕信息或赠送礼物与主播进行互动。网络直播平台的后台服务器可针对观众用户发送的弹幕信息或赠送的礼物进行记录形成交互记录信息,每一条弹幕信息中包括观众用户ID、主播用户ID、弹幕内容以及时间戳,每一条礼物信息中包括观众用户ID、主播用户ID、礼物名称、礼物数量以及时间戳。基于所述日志数据,即可统计出一预设周期内各个用户的交互数和交互对象数,其中,所述交互数为弹幕数或礼物数。所述用户为主播用户或观众用户。当交互数为弹幕数时,对于任一观众用户而言,可统计一预设周期内该观众用户的弹幕数和交互主播数,其中,所述弹幕数指的是该观众用户在所述预设周期内在网络直播平台上发出的弹幕总量,所述交互主播数指的是该观众用户在所述预设周期内在网络直播平台上发言房间数(即在多少个主播的房间发过言,需要说明的是,在网络直播平台上,一个主播对应一个房间);对于任一主播用户而言,可统计一预设周期内该主播用户的弹幕数和交互观众数,其中,所述弹幕数指的是在所述预设周期内该主播用户的房间中接收到的弹幕总量,所述交互观众数指的是在所述预设周期内该主播用户的房间中的参与发言的观众总数。当交互数为礼物数时,对应任一观众用户而言,可统计一预设周期内该观众用户的礼物数和交互主播数,其中,所述礼物数指的是该观众用户在所述预设周期内在网络直播平台上赠送出去的礼物总量,所述交互主播数指的是该观众用户在所述预设周期内在网络直播平台上赠送房间数(即在多少个主播的房间赠送过礼物,需要说明的是,在网络直播平台上,一个主播对应一个房间);对于任一主播用户而言,可统计一预设周期内该主播用户的礼物数和交互观众数,其中,所述礼物数指的是在所述预设周期内该主播用户的房间中接收到的礼物总量,所述交互观众数指的是在所述预设周期内该主播用户的房间中的参与礼物赠送的观众总数。其中,所述预设周期可以为最近一周、最近一月或最近一年。
上述步骤101中,所述多个用户可以是网络直播平台上的全部注册用户,也可以是除去网络直播平台黑名单中的注册用户所剩下的注册用户。可事先基于日志数据统计得到一预设周期内的多个用户中各个用户的交互数和交互对象数,并将各个用户的交互数和交互对象数保存在一数据库中,在后续需要这些数据时,可响应于一获取指令,直接从所述数据库中获取多个用户中各个用户在一预设周期内的交互数和交互对象数。当然,也可以响应于一获取指令,基于所述日志数据统计得到多个用户中各个用户在一预设周期内的交互数和交互对象数。所述获取指令可以是人为触发生成,也可定时自动触发生成。
上述步骤102中,在获取到多个用户中各个用户在一预设周期内的交互数和交互对象数之后,可分别针对交互数和交互对象数对多个用户进行降序排列。用户的交互数或交互对象数越大,该用户排名越靠前。根据观众用户的交互数对多个观众用户进行降序排列,得到观众用户交互数排序结果,根据观众用户的交互主播数对多个观众用户进行降序排列,得到观众用户交互主播数排序结果;根据主播用户的交互数对多个主播用户进行降序排列,得到主播用户交互数排序结果,根据主播用户的交互观众数对多个主播用户进行降序排列,得到主播用户交互观众数排序结果。
上述步骤103中,针对观众用户而言,根据观众用户交互数排序结果可确定出第一活跃观众用户结果集,根据观众用户交互主播数排序结果可确定出第二活跃观众用户结果集。针对主播用户而言,根据主播用户交互数排序结果可确定出第一活跃主播结果集,根据主播用户交互观众数排序结果可确定出第二活跃主播用户集。通常,在排序结果中排名靠前的用户可确定为活跃用户。
所述确定第一和第二活跃用户结果集的步骤,可采用如下方法中的一种方法来实现:
方法一、基于所述交互数的排序结果中排名靠前的N名用户,得到所述第一活跃用户结果集;以及,基于所述交互对象数的排序结果中排名靠前的M名用户,得到所述第二活跃用户结果集。
例如:N为10,交互数排序结果中包括1000名用户,将排名靠前的前十名用户作为第一活跃用户结果集;M为15,交互对象数的排序结果中包括1000名用户,将排名靠前的前十五名用户作为第二活跃用户结果集。
需要说明的是,当交互数排序结果中的总用户数不足N时,将排序结果中的所有用户作为第一活跃用户结果集;当交互对象数排序结果中的总用户数不足M时,将排序结果中的所有用户作为第二活跃用户结果集。
方法二、基于所述交互数的排序结果中排名靠前的百分之n的用户,得到所述第一活跃用户结果集;以及,基于所述交互对象数的排序结果中排名靠前的百分之m的用户,得到所述第二活跃用户结果集。
例如:n为2,交互数排序结果中包括1000名用户,将排名靠前的前二十名用户作为第一活跃用户结果集;M为1,交互对象数的排序结果中包括1000名用户,将排名靠前的前十名用户作为第二活跃用户结果集。
方法三、基于所述交互数的排序结果中排名靠前的N名用户,得到所述第一活跃用户结果集;以及,基于所述交互对象数的排序结果中排名靠前的百分之m的用户,得到所述第二活跃用户结果集。
方法四、基于所述交互数的排序结果中排名靠前的百分之n的用户,得到所述第一活跃用户结果集;以及,基于所述交互对象数的排序结果中排名靠前的M名用户,得到所述第二活跃用户结果集。
其中,N和M的值可以相等,也可以不相等,n和m的值可以相等,也可以不相等。N、M、n和m均大于0,且具体数值可根据实际情况进行设置,本发明对此不作具体限定。
上述步骤104中,根据所述第一活跃用户结果集和所述第二活跃用户结果集,确定最终活跃用户集。作为优选地,可将所述第一活跃用户结果集和所述第二活跃用户结果集的并集确定为所述最终活跃用户集。
例如,第一活跃主播用户结果集中包括:主播1、主播2和主播3,第二活跃主播用户结果集中包括:主播1、主播4和主播5。那么,取两者并集得到的最终活跃主播用户集包括:主播1、主播2、主播3、主播4和主播5。
又例如,第一活跃观众用户结果集中包括:观众1、观众2和观众3,第二活跃观众用户结果集中包括:观众1、观众3和观众4。那么,取两者并集得到的最终活跃观众用户集包括:观众1、观众2、观众3和观众4。
本发明实施例中,通过分别对平台上的用户在一预设周期内的交互数和交互对象数进行降序排列,再综合两个降序排列的结果来确定最终活跃用户集,也即在确定活跃用户时,不仅考虑交互对象数,还考虑交互数。可见,与现有技术中,仅根据参与人数来确定活跃用户相比,本发明实施例能更加准确地确定出活跃用户。
图2为本发明又一实施例提供的活跃用户查找方法的流程示意图。如图2所示,该方法包括:
201、获取多个用户中各个用户在一预设周期内的交互数和交互对象数。
202、分别针对交互数和交互对象数对所述多个用户进行降序排列。
203、分别根据所述交互数和交互对象数的排序结果,得到第一活跃用户结果集和第二活跃用户结果集。
204、基于所述第一活跃用户结果集和所述第二活跃用户结果集,确定最终活跃用户集。
205、分别根据所述最终活跃用户集中各个活跃用户的交互数和交互对象数,确定所述各个活跃用户的第一活跃度和第二活跃度。
206、基于所述各个活跃用户的所述第一活跃度和所述第二活跃度,衡量所述各个活跃用户的活跃度。
上述步骤201至204可参见上述实施例中相应内容,在此不再赘述。
上述步骤205中,根据所述最终活跃用户集中各个活跃用户的交互数,确定所述各个活跃用户的第一活跃度,根据所述最终活跃用户集中各个活跃用户的交互对象数,确定所述各个活跃用户的第二活跃度,通常,交互数越大,第一活跃度越大,交互对象数越大,第二活跃度越大。
在一种可实现的方案中,所述根据所述最终活跃度用户集中的一个活跃用户的交互数,确定所述活跃用户的第一活跃度,包括:对全体用户在所述预设周期内的交互数进行正态分布;基于第一分布统计结果,确定第一映射系数;将所述活跃用户的交互数以及所述第一映射系数代入第一预设映射函数,计算得到所述第一活跃度;以及,所述根据所述最终活跃度用户集中的一个活跃用户的交互对象数,确定所述活跃用户的第二活跃度,包括:对全体用户在所述预设周期内的交互对象数进行正态分布;基于第二分布统计结果,确定第二映射系数;将所述活跃用户的交互对象数以及所述第二映射系数代入第二预设映射函数,计算得到所述第二活跃度。
具体地,获取网站直播平台上的所有注册用户或除去黑名单中的用户所剩下的注册用户在所述预设周期内的交互数和交互对象数。
针对交互数进行正态分布,参与正态分布的每一个注册用户的交互数都是一个样本点,将正态分布图中的峰值对应的交互数作为第一映射系数(峰值对应的交互数是发生频率较高的样本点),将所述活跃用户的交互数以及所述第一映射系数代入下述第一预设映射函数,计算得到所述活跃用户的第一活跃度。所述第一预设映射函数为变形后的Sigmoid函数,第一预设映射函数的公式(1)为:
式中,x代表交互数,f(x)为第一活跃度,λ为可调节系数,x∈【0,+∞),f(x)∈【0,1】,A为第一映射系数。
针对交互对象数进行正态分布,参与正态分布的每一个注册用户的交互对象数都是一个样本点,将正态分布中的峰值对应的交互对象数作为第二映射系数(峰值对应的交互对象数是发生频率最高的样本点),将所述活跃用户的交互对象数以及所述第二映射系数代入下述第二预设映射函数,计算得到第二活跃度。所述第二预设映射函数为变形后的Sigmoid函数,第二预设映射函数的公式(2)为:
式中,y代表交互对象数,f(y)为第二活跃度,λ为可调节系数,x∈【0,+∞),f(x)∈【0,1】,B为第二映射系数。
将峰值对应的交互数和交互对象数分别作为第一映射系数和第二映射系数的目的在于将出现频率最高的交互数和交互对象数映射到一致的活跃度值。此外,可通过调节公式(1)和(2)中的λ值,将出现频率最高的交互数和交互对象数映射到0.7~0.8之间的一个值。优选的,所述λ值可为2.2。
上述步骤206中,根据所述各个活跃用户的所述第一活跃度和所述第二活跃度,衡量所述各个活跃用户的活跃度。具体地,将活跃用户的第一活跃度的值与第二活跃度的值的和作为所述活跃用户的活跃度。计算出最终活跃用户集中各个活跃用户的活跃度之后,可按照活跃度的值的大小来判断活跃用户在网站上的活跃程度。
本发明实施例中,通过分别对平台上的用户在一预设周期内的交互数和交互对象数进行降序排列,再综合两个降序排列的结果来确定最终活跃用户集,也即在确定活跃用户时,不仅考虑交互对象数,还考虑交互数。可见,与现有技术中,仅根据参与人数来确定活跃用户相比,本发明实施例能更加准确地确定出活跃用户。
在上述各实施例或下述各实施例中,所述方法还包括:当所述用户为观众用户时,将所述交互数的排序结果中排名靠前的X名或排名靠前的百分之x的用户作为第一不正常用户集,将所述交互对象数的排序结果中排名靠前的Y名或排名靠前的百分之y的用户作为第二不正常用户集;将所述第一不正常用户集和第二不正常用户集的交集确定为最终不正常用户集。其中,X、x、Y以及y均大于0,且具体数值可根据实际情况进行设定,本发明对此不作具体设置。例如:基于弹幕数排序结果得到的第一不正常用户集为:观众用户1(弹幕数为1000条),观众用户2(弹幕数为900条),基于交互对象数排序结果得到的第二不正常用户集为:观众用户2(交互对象数为800),按照上述方法最终确定出观众用户2为不正常用户。观众用户2发的总弹幕数为900条,在800个直播间发过弹幕,那么,在一个直播间中平均发言次数为1~2条,这可明显判断出观众用户2为刷弹幕机器人,非正常观众用户。作为可选的,根据上述方法确定出最终不正常用户集之后,可将所述最终不正常用户集中的各个用户的交互数除以交互对象数所得的计算结果与一预设阈值进行比较,小于所述预设阈值,则判定为不正常用户,大于或等于所述预设阈值,则判定为正常用户,在所述最终不正常用户集中删除所述正常用户。例如,预设阈值为10,即平均在一个直播间的发言次数在10以下,则为不正常用户,在10及以上则为正常用户。
作为可选的,在确定出最终不正常用户集之后,根据最终不正常用户集,在上述实施例中确认出的最终活跃用户集中去除不正常用户,以避免刷弹幕机器人的存在导致确定出的活跃用户不够准确等问题。具体实现方式如下:将所述第一活跃用户结果集和第二活跃用户结果集的并集作为初始活跃用户集;将所述初始活跃用户集与所述最终不正常用户集的差集作为最终活跃用户集。
本发明实施例中,通过分别对平台上的用户在一预设周期内的交互数和交互对象数进行降序排列,再综合两个降序排列的结果来确定最终活跃用户集,也即在确定活跃用户时,不仅考虑交互对象数,还考虑交互数。可见,与现有技术中,仅根据参与人数来确定活跃用户相比,本发明实施例能更加准确地确定出活跃用户。
在另一实施例中,当所述用户为主播用户时,获取所述用户在预设时间段内的交互记录信息;分别统计所述用户在每个预设时间间隔内的交互数;根据各个预设时间间隔内的交互数的分布情况,确定所述用户在所述预设时间内的交互数是否为正常数据。其中,所述交互记录信号可以为弹幕信息或礼物赠送信息。例如:预设时间段可以为1分钟(或10分钟),将所述预设时间段平分为10份,即预设时间间隔为6s(或1分钟)。本发明对预设时间段以及份数不作具体限制。
在一种可实现的方案中,根据各个预设时间间隔内的交互数的分布情况,确定所述用户在所述预设时间内的交互数是否为正常数据,包括:获取所述各个预设时间间隔内的交互数的第一均值;计算所述各个预设时间间隔内的交互数与所述第一均值的差值;统计差值大于第一预设阈值的所述预设时间间隔内的交互数的数量;若所述数量小于第二预设阈值,则判定所述用户在所述预设时间内的交互数为不正常数据。
在另一种可实现的方案中,根据各个预设时间间隔内的交互数的分布情况,确定所述用户在所述预设时间内的交互数是否为正常数据,包括:计算所述各个预设时间间隔内的交互频率,其中,所述各个预设时间间隔内的交互频率为所述各个预设时间间隔内的交互数与所述预设时间间隔的比值;获取所述各个预设时间间隔内的交互频率的第二均值;计算所述各个预设时间间隔内的交互频率与所述第二均值的差值;统计差值大于第二预设阈值的所述预设时间间隔内的交互频率的数量;若所述数量小于第三预设阈值,则判定所述用户在所述预设时间内的交互数为不正常数据。
由于在实际应用中,会存在一些主播通过一些非正规手段来提高其活跃度,例如:通过机器人在自己的直播间中发送弹幕或发送礼物等。而发明人在实际观察中发现:机器人的发送弹幕或发送礼物的频率是较为平稳的,而真实的观众用户发送弹幕或发送礼物的频率波动较大。因此,通过上述技术方案就可以将那些通过非正规手段提高活跃度的主播确定出来,以进行后续处理。
需要说明的是,目前很多网络直播平台上提供了各式各样的礼物,在本发明实施例中,可将网络直播平台上的礼物分为免费礼物和非免费礼物这两种类型的礼物,免费礼物指的是观众用户无需花费金钱即可在网络直播平台上领取到的礼物,非免费礼物指的是观众用户需花费金钱购买的礼物。由于向主播赠送非免费礼物的行为不太可能是机器人刷出来的,因此,在确定不正常观众用户和不正常主播用户的技术方案中,上述交互数指的是弹幕数或免费礼物数。
图3为本发明一实施例提供的活跃用户查找装置的流程示意图。如图3所示,该装置包括:获取模块301、排序模块302、提取模块303以及第一确定模块304:
获取模块301,用于获取多个用户中各个用户在一预设周期内的交互数和交互对象数。
排序模块302,用于分别针对交互数和交互对象数对所述多个用户进行降序排列。
提取模块303,用于分别根据所述交互数和交互对象数的排序结果,得到第一活跃用户结果集和第二活跃用户结果集。
第一确定模块304,用于基于所述第一活跃用户结果集和所述第二活跃用户结果集,确定最终活跃用户集。
可选地,所述提取模块303具体用于:基于所述交互数的排序结果中排名靠前的N名用户或排名靠前的百分之n的用户,得到所述第一活跃用户结果集;以及,基于所述交互对象数的排序结果中排名靠前的M名用户或排名靠前的百分之m的用户,得到所述第二活跃用户结果集。
可选地,所述第一确定模块,包括:
将所述第一活跃用户结果集和所述第二活跃用户结果集的并集确定为所述最终活跃用户集。
可选地,所述装置,还包括:
第二确定模块,用于分别根据所述最终活跃用户集中各个活跃用户的交互数和交互对象数,确定所述各个活跃用户的第一活跃度和第二活跃度。
衡量模块,用于基于所述各个活跃用户的所述第一活跃度和所述第二活跃度,衡量所述各个活跃用户的活跃度。
可选地,所述第二确定模块,包括:
统计单元,用于对全体用户在所述预设周期内的交互数进行正态分布。
确定单元,用于基于第一分布统计结果,确定第一映射系数。
计算单元,用于将所述活跃用户的交互数以及所述第一映射系数代入第一预设映射函数,计算得到所述第一活跃度。
以及,所述第二确定模块,包括:
所述统计单元,用于对全体用户在所述预设周期内的交互对象数进行正态分布。
所述确定单元,用于基于第二分布统计结果,确定第二映射系数。
所述计算单元,用于将所述活跃用户的交互对象数以及所述第二映射系数代入第二预设映射函数,计算得到所述第二活跃度。
可选地,所述用户为主播用户或观众用户;
相应地,所述方法,还包括:
第二提取模块,用于当所述用户为观众用户时,将所述交互数的排序结果中排名靠前的X名或排名靠前的百分之x的用户作为第一不正常用户集,将所述交互对象数的排序结果中排名靠前的Y名或排名靠前的百分之y的用户作为第二不正常用户集;
第三确定模块,用于将所述第一不正常用户集和第二不正常用户集的交集确定为最终不正常用户集。
可选地,所述第一确定模块304具体用于:
将所述第一活跃用户结果集和第二活跃用户结果集的并集作为初始活跃用户集;将所述初始活跃用户集与所述最终不正常用户集的差集作为最终活跃用户集。
所述装置与前述的方法流程描述对应,不足之处参考上述方法流程的叙述,不再一一赘述。
本发明实施例中,通过分别对平台上的用户在一预设周期内的交互数和交互对象数进行降序排列,再综合两个降序排列的结果来确定最终活跃用户集,也即在确定活跃用户时,不仅考虑交互对象数,还考虑交互数。可见,与现有技术中,仅根据参与人数来确定活跃用户相比,本发明实施例能更加准确地确定出活跃用户。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (10)

1.一种活跃用户查找方法,其特征在于,包括:
获取多个用户中各个用户在一预设周期内的交互数和交互对象数;
分别针对交互数和交互对象数对所述多个用户进行降序排列;
分别根据所述交互数和交互对象数的排序结果,得到第一活跃用户结果集和第二活跃用户结果集;
基于所述第一活跃用户结果集和所述第二活跃用户结果集,确定最终活跃用户集。
2.根据权利要求1所述的方法,其特征在于,分别根据所述交互数和交互对象数的排序结果,得到第一活跃用户结果集和第二活跃用户结果集,包括:
基于所述交互数的排序结果中排名靠前的N名用户或排名靠前的百分之n的用户,得到所述第一活跃用户结果集;
以及,基于所述交互对象数的排序结果中排名靠前的M名用户或排名靠前的百分之m的用户,得到所述第二活跃用户结果集。
3.根据权利要求1所述的方法,其特征在于,所述基于所述第一活跃用户结果集和所述第二活跃用户结果集,确定最终活跃用户集,包括:
将所述第一活跃用户结果集和所述第二活跃用户结果集的并集确定为所述最终活跃用户集。
4.根据权利要求1-3中任一项所述的方法,其特征在于,还包括:
分别根据所述最终活跃用户集中各个活跃用户的交互数和交互对象数,确定所述各个活跃用户的第一活跃度和第二活跃度;
基于所述各个活跃用户的所述第一活跃度和所述第二活跃度,衡量所述各个活跃用户的活跃度。
5.根据权利要求4所述的方法,其特征在于,所述根据所述最终活跃度用户集中的一个活跃用户的交互数,确定所述活跃用户的第一活跃度,包括:
对全体用户在所述预设周期内的交互数进行正态分布;
基于第一分布统计结果,确定第一映射系数;
将所述活跃用户的交互数以及所述第一映射系数代入第一预设映射函数,计算得到所述第一活跃度;
以及,所述根据所述最终活跃度用户集中的一个活跃用户的交互对象数,确定所述活跃用户的第二活跃度,包括:
对全体用户在所述预设周期内的交互对象数进行正态分布;
基于第二分布统计结果,确定第二映射系数;
将所述活跃用户的交互对象数以及所述第二映射系数代入第二预设映射函数,计算得到所述第二活跃度。
6.根据权利要求1-3中任一项所述的方法,其特征在于,所述用户为主播用户或观众用户;
相应地,所述方法,还包括:
当所述用户为观众用户时,将所述交互数的排序结果中排名靠前的X名或排名靠前的百分之x的用户作为第一不正常用户集,将所述交互对象数的排序结果中排名靠前的Y名或排名靠前的百分之y的用户作为第二不正常用户集;
将所述第一不正常用户集和第二不正常用户集的交集确定为最终不正常用户集。
7.根据权利要求6所述的方法,其特征在于,所述基于所述第一活跃用户结果集和第二活跃用户结果集,确定最终活跃用户集,包括:
将所述第一活跃用户结果集和第二活跃用户结果集的并集作为初始活跃用户集;
将所述初始活跃用户集与所述最终不正常用户集的差集作为最终活跃用户集。
8.一种活跃用户查找装置,其特征在于,包括:
获取模块,用于获取多个用户中各个用户在一预设周期内的交互数和交互对象数;
排序模块,用于分别针对交互数和交互对象数对所述多个用户进行降序排列;
提取模块,用于分别根据所述交互数和交互对象数的排序结果,得到第一活跃用户结果集和第二活跃用户结果集;
第一确定模块,用于基于所述第一活跃用户结果集和所述第二活跃用户结果集,确定最终活跃用户集。
9.根据权利要求8所述的装置,其特征在于,所述提取模块具体用于:
基于所述交互数的排序结果中排名靠前的N名用户或排名靠前的百分之n的用户,得到所述第一活跃用户结果集;
以及,基于所述交互对象数的排序结果中排名靠前的M名用户或排名靠前的百分之m的用户,得到所述第二活跃用户结果集。
10.根据权利要求8所述的装置,其特征在于,所述第一确定模块,包括:
将所述第一活跃用户结果集和所述第二活跃用户结果集的并集确定为所述最终活跃用户集。
CN201711105223.4A 2017-11-10 2017-11-10 一种活跃用户查找方法与装置 Pending CN107948742A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711105223.4A CN107948742A (zh) 2017-11-10 2017-11-10 一种活跃用户查找方法与装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711105223.4A CN107948742A (zh) 2017-11-10 2017-11-10 一种活跃用户查找方法与装置

Publications (1)

Publication Number Publication Date
CN107948742A true CN107948742A (zh) 2018-04-20

Family

ID=61934692

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711105223.4A Pending CN107948742A (zh) 2017-11-10 2017-11-10 一种活跃用户查找方法与装置

Country Status (1)

Country Link
CN (1) CN107948742A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111709732A (zh) * 2020-06-17 2020-09-25 北京字节跳动网络技术有限公司 展示方法、装置和电子设备
WO2022105282A1 (zh) * 2020-11-17 2022-05-27 北京达佳互联信息技术有限公司 一种游戏显示方法及装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080065507A1 (en) * 2006-09-12 2008-03-13 James Morrison Interactive digital media services
CN105872058A (zh) * 2016-04-01 2016-08-17 太仓日森信息技术有限公司 一种移动终端直播信息的推送方法及其推送装置
CN106204154A (zh) * 2016-07-20 2016-12-07 武汉斗鱼网络科技有限公司 基于层次分析法和熵值法的用户价值评分系统及其方法
CN106445929A (zh) * 2015-08-04 2017-02-22 广州华多网络科技有限公司 基于活跃度的用户排序方法及系统
CN107426621A (zh) * 2017-03-31 2017-12-01 武汉斗鱼网络科技有限公司 一种在移动端直播间展示活跃用户图像的方法及系统

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080065507A1 (en) * 2006-09-12 2008-03-13 James Morrison Interactive digital media services
CN106445929A (zh) * 2015-08-04 2017-02-22 广州华多网络科技有限公司 基于活跃度的用户排序方法及系统
CN105872058A (zh) * 2016-04-01 2016-08-17 太仓日森信息技术有限公司 一种移动终端直播信息的推送方法及其推送装置
CN106204154A (zh) * 2016-07-20 2016-12-07 武汉斗鱼网络科技有限公司 基于层次分析法和熵值法的用户价值评分系统及其方法
CN107426621A (zh) * 2017-03-31 2017-12-01 武汉斗鱼网络科技有限公司 一种在移动端直播间展示活跃用户图像的方法及系统

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111709732A (zh) * 2020-06-17 2020-09-25 北京字节跳动网络技术有限公司 展示方法、装置和电子设备
WO2022105282A1 (zh) * 2020-11-17 2022-05-27 北京达佳互联信息技术有限公司 一种游戏显示方法及装置

Similar Documents

Publication Publication Date Title
CN107483982A (zh) 一种主播推荐方法与装置
CN106407241A (zh) 视频推荐方法及系统
CN107277160A (zh) 一种内容分发网络节点切换方法与装置
CN105183731B (zh) 推荐信息生成方法、装置及系统
CN107172498A (zh) 直播房间展示方法及装置
CN102999507B (zh) 网络微博名人信息的推荐处理方法和装置
CN108235045B (zh) 一种直播间推荐方法、电子设备及可读存储介质
CN109040852A (zh) 一种弹幕筛选方法及装置
CN105721899B (zh) 一种视频质量评分的方法及系统
US9245035B2 (en) Information processing system, information processing method, program, and non-transitory information storage medium
CN103218366B (zh) 下载资源推荐方法及系统
CN104079995B (zh) 一种根据社交信息处理节目数据的方法与装置
CN105868256A (zh) 处理用户行为数据的方法和系统
CN109727052A (zh) 关键词确定方法及装置
CN110377521B (zh) 一种目标对象验证方法及装置
CN107645667A (zh) 视频推荐方法、系统及服务器设备
CN108595492A (zh) 内容的推送方法和装置、存储介质、电子装置
CN107948742A (zh) 一种活跃用户查找方法与装置
WO2018121335A1 (zh) 实时数据处理方法和装置
CN108471544A (zh) 一种构建视频用户画像方法及装置
Cheng et al. Video sharing propagation in social networks: Measurement, modeling, and analysis
CN108320168A (zh) 一种数据分析方法及装置
CN108109445A (zh) 教学课情监控方法
CN110598044A (zh) 一种基于用户点击和转化时长反馈的协同召回方法
CN110020152A (zh) 应用推荐方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20180420