CN108390883B - 刷人气用户的识别方法、装置及终端设备 - Google Patents

刷人气用户的识别方法、装置及终端设备 Download PDF

Info

Publication number
CN108390883B
CN108390883B CN201810169186.1A CN201810169186A CN108390883B CN 108390883 B CN108390883 B CN 108390883B CN 201810169186 A CN201810169186 A CN 201810169186A CN 108390883 B CN108390883 B CN 108390883B
Authority
CN
China
Prior art keywords
user
risk score
refreshing
users
people
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810169186.1A
Other languages
English (en)
Other versions
CN108390883A (zh
Inventor
王璐
陈少杰
张文明
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wuhan Douyu Network Technology Co Ltd
Original Assignee
Wuhan Douyu Network Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wuhan Douyu Network Technology Co Ltd filed Critical Wuhan Douyu Network Technology Co Ltd
Priority to CN201810169186.1A priority Critical patent/CN108390883B/zh
Priority to PCT/CN2018/084638 priority patent/WO2019165697A1/zh
Publication of CN108390883A publication Critical patent/CN108390883A/zh
Application granted granted Critical
Publication of CN108390883B publication Critical patent/CN108390883B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L63/00Network architectures or network communication protocols for network security
    • H04L63/14Network architectures or network communication protocols for network security for detecting or protecting against malicious traffic
    • H04L63/1433Vulnerability analysis
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L63/00Network architectures or network communication protocols for network security
    • H04L63/14Network architectures or network communication protocols for network security for detecting or protecting against malicious traffic
    • H04L63/1408Network architectures or network communication protocols for network security for detecting or protecting against malicious traffic by monitoring network traffic
    • H04L63/1425Traffic logging, e.g. anomaly detection
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L63/00Network architectures or network communication protocols for network security
    • H04L63/14Network architectures or network communication protocols for network security for detecting or protecting against malicious traffic
    • H04L63/1408Network architectures or network communication protocols for network security for detecting or protecting against malicious traffic by monitoring network traffic
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/14Network analysis or design
    • H04L41/142Network analysis or design using statistical or mathematical methods

Abstract

本发明涉及互联网技术领域,具体涉及一种刷人气用户的识别方法、装置及终端设备。该刷人气用户的识别方法包括获取所有用户的用户特征,根据每个用户对应的用户特征确定第一风险评分,进而识别所有用户中确定的刷人气用户为目标刷人气用户,识别所有用户中确定的非刷人气用户为目标正常用户,根据目标刷人气用户和目标正常用户确定每个用户的第二风险评分。最后根据第一风险评分和第二风险评分确定每个用户为刷人气用户的最终风险分数,并根据所述最终风险分数识别刷人气用户。通过本方案提高了识别用户为刷人气用户的准确度。

Description

刷人气用户的识别方法、装置及终端设备
技术领域
本发明涉及互联网技术领域,具体而言,涉及一种刷人气用户的识别方法、装置及终端设备。
背景技术
在很多互联网平台上,为了达到某些目的经常存在虚假的刷人气行为,如淘宝刷单或直播平台给主播刷人气等,这样的刷人气行为给互联网平台的生态环境造成极大的影响。目前的识别异常的刷人气行为的方法是采用一些强规则,这些强规则是通过一些较为明显的异常特征进行识别的,该手段可以识别出一些风险用户,但该手段的要求非常严格,因此只能找到具有明显特征的作弊用户,将遗漏特征不明显但存在作弊行为的用户。因此,提供一种具有较高准确度的刷人气用户的识别方法是十分必要的。
发明内容
本发明的目的在于提供一种刷人气用户的识别方法,以提高识别刷人气用户的准确度。
本发明的另一目的在于提供一种刷人气用户的识别装置,以提高识别刷人气用户的准确度。
本发明的另一目的在于提供一种终端设备,以提高识别刷人气用户的准确度。
为了实现上述目的,本发明实施例采用的技术方案如下:
第一方面,本发明实施例提供了一种刷人气用户的识别方法,所述方法包括:获取所有用户的用户特征;根据每个用户对应的用户特征确定第一风险评分;识别所有用户中确定的刷人气用户为目标刷人气用户;识别所有用户中确定的非刷人气用户为目标正常用户;根据所述目标刷人气用户和目标正常用户对应的用户特征确定每个用户的第二风险评分;根据所述第一风险评分和所述第二风险评分确定每个用户为刷人气用户的最终风险分数;根据所述最终风险分数识别其他刷人气用户。
第二方面,本发明实施例还提供了一种刷人气用户的识别装置,所述装置包括:获取模块,用于获取所有用户的用户特征;第一确定模块,用于根据每个用户对应的用户特征确定第一风险评分;第一识别模块,用于识别所有用户中确定的刷人气用户为目标刷人气用户;第二识别模块,用于识别所有用户中确定的非刷人气用户为目标正常用户;第二确定模块,用于根据所述目标刷人气用户和目标正常用户对应的用户特征确定每个用户的第二风险评分;分数确定模块,用于根据所述第一风险评分和所述第二风险评分确定每个用户为刷人气用户的最终风险分数;并根据所述最终风险分数识别其他刷人气用户。
第三方面,本发明实施例还提供了一种终端设备,所述终端设备包括存储器和处理器,所述存储器用于存储计算机程序代码,所述处理器用于执行存储于所述存储器中的计算机程序代码以实现所述的刷人气用户的识别方法。
本发明实施例提供的一种刷人气用户的识别方法、装置及终端设备,该刷人气用户的识别方法及装置应用于终端设备。该刷人气用户的识别方法包括获取所有用户的用户特征,根据每个用户对应的用户特征确定第一风险评分,进而识别所有用户中确定的刷人气用户为目标刷人气用户,识别所有用户中确定的非刷人气用户为目标正常用户,根据目标刷人气用户和目标正常用户确定每个用户的第二风险评分。最后根据第一风险评分和第二风险评分确定每个用户为刷人气用户的最终风险分数。在本方案中,通过两方面分别计算出当前用户的第一风险评分和第二风险评分,进而根据第一风险评分和第二风险评分计算出当前用户为刷人气用户的最终风险分数,其计算更加复杂,提高了识别用户为刷人气用户的准确度。
为使本发明的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1示出了本发明实施例提供的一种终端设备的结构示意图。
图2示出了本发明实施例提供的一种刷人气用户的识别方法的流程示意图。
图3示出了本发明实施例提供的一种刷人气用户的识别方法的子步骤的流程示意图。
图4示出了本发明实施例提供的一种刷人气用户的识别方法的另一子步骤的流程示意图。
图5示出了本发明实施例提供的一种刷人气用户的识别装置的功能模块示意图。
图示:100-终端设备;110-刷人气用户的识别装置;120-存储器;130-存储控制器;140-处理器;150-外设接口;160-输入输出单元;170-音频单元;180-显示单元;111-获取模块;112-第一确定模块;113-第一识别模块;114-第二识别模块;115-第二确定模块;116-分数确定模块。
具体实施方式
下面将结合本发明实施例中附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。同时,在本发明的描述中,术语“第一”、“第二”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
请参照图1,是本发明实施例提供的一种终端设备100的结构示意图,本发明实施例提供的一种刷人气用户的识别方法应用于终端设备100,该终端设备100可以是,但不限于,平板电脑、台式电脑等智能电子设备。该终端设备100包括刷人气用户的识别装置110、存储器120、存储控制器130、处理器140、外设接口150、输入输出单元160、音频单元170以及显示单元180。
所述存储器120、存储控制器130、处理器140、外设接口150、输入输出单元160、音频单元170、显示单元180各元件相互之间直接或间接地电性连接,以实现数据的传输或交互。例如,这些元件相互之间可通过一条或多条通讯总线或信号线实现电性连接。所述刷人气用户的识别装置110包括至少一个可以软件或固件(firmware)的形式存储于所述存储器120中或固化在所述终端设备100的操作系统(operating system,OS)中的软件功能模块。所述处理器140用于执行存储器120中存储的可执行模块,例如所述刷人气用户的识别装置110包括的软件功能模块或计算机程序。
其中,存储器120可以是,但不限于,随机存取存储器(Random Access Memory,RAM),只读存储器(Read Only Memory,ROM),可编程只读存储器(Programmable Read-OnlyMemory,PROM),可擦除只读存储器(Erasable Programmable Read-Only Memory,EPROM),电可擦除只读存储器(Electric Erasable Programmable Read-Only Memory,EEPROM)等。其中,存储器120用于存储程序,所述处理器140在接收到执行指令后,执行所述程序,前述本发明实施例任一实施例揭示的流过程定义的终端设备100所执行的方法可以应用于处理器140中,或者由处理器140实现。
处理器140可能是一种集成电路芯片,具有信号的处理能力。上述的处理器140可以是通用处理器,包括中央处理器(Central Processing Unit,简称CPU)、网络处理器(Network Processor,简称NP)等;还可以是数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器140也可以是任何常规的处理器140等。
所述外设接口150将各种输入/输出装置耦合至处理器140以及存储器120。在一些实施例中,外设接口150,处理器140以及存储控制器130可以在单个芯片中实现。在其他一些实例中,他们可以分别由独立的芯片实现。
输入输出单元160用于提供给用户输入数据实现用户与所述终端设备100的交互。所述输入输出单元160可以是,但不限于,鼠标和键盘等。
音频单元170向用户提供音频接口,其可包括一个或多个麦克风、一个或者多个扬声器以及音频电路。
显示单元180在终端设备100与用户之间提供一个交互界面(例如用户操作界面)或用于显示图像数据给用户参考。在本实施例中,所述显示单元180可以是液晶显示器或触控显示器。若为触控显示器,其可为支持单点和多点触控操作的电容式触控屏或电阻式触控屏等。支持单点和多点触控操作是指触控显示器能感应到来自该触控显示器上一个或多个位置处同时产生的触控操作,并将该感应到的触控操作交由处理器140进行计算和处理。
请参照图2,是本发明实施例提供的一种刷人气用户的识别方法的流程示意图,该刷人气用户的识别方法可用于识别在各大网站中存在刷单行为的用户,该各大网站可以为,但不限于,电子商务网站(如淘宝)、直播平台等。在本发明实施例中,以该刷人气用户的识别方法应用于直播平台为例进行说明。该方法包括:
步骤S110,获取所有用户的用户特征。
需要说明的是,该用户特征为与用户刷人气行为有关的用户特征。如在直播平台中,用户通常通过在短时间内观看多个直播间或短时间内在多个直播间发弹幕的方式为主播刷人气,则用户在预定时间内观看的直播间个数或用户在预定时间内在多个直播间发弹幕的个数即为需要获取的用户特征。容易理解的,每个用户对应的用户特征具有多个。
步骤S120,根据每个用户对应的用户特征确定第一风险评分。
即是说,根据获取的用户特征评判每个用户的第一风险评分,根据该第一风险评分判断该用户为刷人气用户的可能性大小。请参照图3,是本发明实施例提供的一种刷人气用户的识别方法的步骤S120的子步骤的流程示意图,该步骤S120包括:
步骤S121,依据所述用户特征采用预定算法对所有用户进行分类。
该预定算法为k-means算法,该k-means算法为一种聚类算法,通过中心点的不断迭代和距离计算实现分组的效果。进而,依据获取的用户特征根据该k-means算法将用户分成10类,容易理解的,该具体划分多少类可根据用户需要自定义设置。
步骤S122,选取每类用户对应的用户特征中的关键指标。
即是说,划分为一类的用户具有相似的用户特征,进而针对每一类用户对应的用户特征选取其中的关键指标,如该关键指标可以是用户对每个直播间的观看时长等,较优地,该关键指标为多个。
步骤S123,计算每类下的用户的关键指标的平均值。
步骤S124,根据所述平均值的大小确定每个用户的第一风险评分。
即是说,若选取的关键指标为用户对每个直播间的观看时长等之类的用户特征,其时长越短说明用户为主播刷人气的可能性越高,进而该多个关键指标的平均值越小,用户为刷人气用户的风险越高,进而将风险高的类别记为1分,将风险低的类别记为0.1分。进而所有类别的用户将根据所属的类别确定第一风险评分。
步骤S130,识别所有用户中确定的刷人气用户为目标刷人气用户。
即是说,刷选出用户特征符合预设强规则的用户为目标刷人气用户,该预设强规则要求用户符合预定的具有严格限制的特征,如该特征可以是,但不限于,某个用户在预定时间内更换了多个设备登录自己的账号,或是对于直播平台而言,针对该用户后台并没有发弹幕的日志,但是该用户却可以持续不断地发弹幕。该预设强规则表明该用户具有明显的刷人气特征,则若某个用户具有符合预设强规则的用户特征,则确定该用户为目标刷人气用户。可以确定的是,符合该预设强规则的用户一定为目标刷人气用户,但是并不能排除不符合该预设强规则的用户一定不是目标刷人气用户,因为该预设强规则只是能够筛选出具有明显刷人气行为的用户,但是并不能排除其他用户刷人气的嫌疑。
步骤S140,识别所有用户中确定的非刷人气用户为目标正常用户。
即是说,可以根据预定规则识别出所有用户中的正常用户,该预定规则包括多个用户特征,由该多个用户特征共同确定对应的用户为目标正常用户,其中,确定某一个用户为正常用户的最重要用户特征为付费行为,亦即是说,判断该用户是否有持续的为所享受的服务付费的行为。该正常用户指确定没有刷人气行为的用户。
步骤S150,根据所述目标刷人气用户和目标正常用户对应的用户特征确定每个用户的第二风险评分。
具体为,请参照图4,是本发明实施例提供的一种刷人气用户的识别方法的步骤S150的子步骤的流程示意图,该步骤S150包括:
步骤S151,构建所有用户间的网络结构。
容易理解的,每个用户在登录网站或直播平台时具有唯一的IP或某一台固定的设备地址,但是由于存在刷人气的用户,使得存在多个用户具有相同IP地址或设备地址的情况。由此,将具有相同IP地址或设备地址的用户通过直线连接起来,进而形成所有用户间的网络结构。
步骤S152,根据所述目标刷人气用户和目标正常用户的用户特征依次计算每两个用户之间的相似度权值。
由于事先已经确定了目标刷人气用户和目标正常用户,则描述用户为目标刷人气用户的用户特征已经确定,描述用户为目标正常用户的用户特征也已经确定。若在网络结构中,某一用户与目标刷人气用户和/或目标正常用户连接,则选取该用户与所述目标刷人气用户相同的用户特征,计算该用户与目标刷人气用户的相似度权值,同时选取该用户与所述目标正常用户相同的用户特征,计算该用户与目标刷人气用户的相似度权值。
如未确定是否存在刷人气嫌疑的用户A与用户B、用户C和用户D在网络结构中连接,其中,用户B和用户C都是确定的目标刷人气用户,用户D为确定的目标正常用户,则分别计算用户A和用户B、C、D之间的相似度,假设计算结果为W(AB)=0.7,W(AC)=0.5,W(AD)=0.3,即是说,用户A和用户B之间的相似度为0.7,用户A和用户C之前的相似度为0.5,用户A和用户D之间的相似度为0.3。该相似度的计算公式为:
Figure GDA0002453030130000081
其中,xui为用户u的第i个用户特征,xvi为用户v的第i个用户特征,wuv是用户u和用户v之间的相似度权值。
需要说明的是,由于只有目标刷人气用户和目标正常用户是确定的,则在最开始计算时,即便存在该未知是否存在刷人气用户与其他未知用户和目标刷人气用户、目标正常用户同时具有连接关系,也只计算该未知是否存在刷人气用户与目标刷人气用户、目标正常用户之间的相似度。进而通过该算法使得当前未知嫌疑的用户的相似度权值已知时,则可根据在网络结构中当前未知嫌疑的用户与其他用户的连接关系计算其他用户的相似度权值。
步骤S153,根据在所述网络结构中与当前用户连接的其他用户的相似度权值,以及所述目标刷人气用户和目标正常用户的初始评分计算所述当前用户的第二风险评分。
即是说,在知晓各个用户之间的相似度权值的情况下,可根据该相似度权值以及目标刷人气用户和目标正常用户之间的初始评分计算每个用户的第二风险评分。具体为,设定目标刷人气用户B和C的初始评分为S(B)_0=1,S(C)_0=1,目标正常用户D的初始评分为S(D)_0=0,则未知嫌疑A的分数的计算方式为:S(A)_0=(1*0.7+1*0.5)/(0.7+0.5+0.3)=0.75。需要说明的是,该用户A的分数仅仅是初始计算的得分,仅计算了用户A和目标刷人气用户和目标正常用户之间具有连接关系的情况,而排除了用户A同时与目标刷人气用户、目标正常用户、其他嫌疑用户连接的情况,则为了提高计算的准确度,需要对该算法进行多轮迭代,使得最后A的第二风险评分趋于一个稳定数值,继而将该稳定数值作为用户A的第二风险评分。
具体为,若A除了与用户B、C、D连接外,还与一个未知嫌疑的用户E连接,则首先计算用户A和用户E之间的相似度权值,假设为W(AE)=0.5,则该用户A的分数计算方式为:S(A)_1=0.8*S(A)_0+0.2*(1*0.7+1*0.5+S(E)_0)*0.5/(0.7+0.5+0.3+0.5)由此可见,在第二轮计算A的分数时,是把第一轮计算得到的用户A的分数S(A)_0作为基础分数参与第二轮的计算,进而通过算法对A进行迭代计算更加精确用户A的第二风险评分。较优地,在本发明实施例中,计算每个用户的第二风险评分时,迭代次数为15次,选取经过多次迭代而趋于稳定的分数为用户对应的第二风险评分。该第二风险评分的具体算法公式为:
Figure GDA0002453030130000091
其中,Sk(i)是用户i在第k轮迭代时的第二风险评分,α是权重系数,其取值在0到1之间,wji是用户j和用户i之间的相似度权重。
步骤S160,根据所述第一风险评分和所述第二风险评分确定每个用户为刷人气用户的最终风险分数,并根据所述最终风险分数识别其他刷人气用户。
之前通过对用户分类确定了用户的第一风险评分,进而通过对用户进行迭代计算确定了用户的第二风险评分,进而根据该第一风险评分和第二风险评分共同确定用户的最终风险分数。该最终风险分数的计算方式为:
Su=w1Su1+w2Su2
其中,wi(i=1,2)是权重系数,取值范围在0到1之间,并且满足
Figure GDA0002453030130000101
Su1为第一风险评分,Su2为第二风险评分。容易理解的,由于通过算法比通过分类对用户是否为刷人气用户评判更加精确,由此,权重系数W1通常小于W2
进一步地,将每个用户为刷人气用户的最终风险分数与预定阈值进行比较,若最终风险分数大于预定阈值,则判定该用户为恶意的刷人气用户,进而通过该手段判断用户是否为刷人气用户准确度更高,并且可根据每个用户当前的最终风险分数预估该用户是否可能成为恶意刷人气用户,以便于后续对该用户进行重点监控。
请参照图5,是本发明实施例提供的一种刷人气用户的识别装置110的功能模块示意图,该装置包括获取模块111、第一确定模块112、第一识别模块113、第二识别模块114、第二确定模块115以及分数确定模块116。
获取模块111,用于获取所有用户的用户特征。
在本发明实施例中,步骤S110可以由获取模块111执行。
第一确定模块112,用于根据每个用户对应的用户特征确定第一风险评分。
在本发明实施例中,步骤S120~S124可以由第一确定模块112执行。
第一识别模块113,用于识别所有用户中确定的刷人气用户为目标刷人气用户。
在本发明实施例中,步骤S130可以由第一识别模块113执行。
第二识别模块114,用于识别所有用户中确定的非刷人气用户为目标正常用户。
在本发明实施例中,步骤S140可以由第二识别模块114执行。
第二确定模块115,用于根据所述目标刷人气用户和目标正常用户确定每个用户的第二风险评分。
在本发明实施例中,步骤S150~S153可以由第二确定模块115执行。
分数确定模块116,用于根据所述第一风险评分和所述第二风险评分确定每个用户为刷人气用户的最终风险分数,并根据所述最终风险分数识别其他刷人气用户。
在本发明实施例中,步骤S160可以由分数确定模块116执行。
由于在刷人气用户的识别方法部分已经详细描述,在此不再赘述。
综上所述,本发明实施例提供的一种刷人气用户的识别方法、装置及终端设备,该刷人气用户的识别方法及装置应用于终端设备。该刷人气用户的识别方法包括获取所有用户的用户特征,根据每个用户对应的用户特征确定第一风险评分,进而识别所有用户中确定的刷人气用户为目标刷人气用户,识别所有用户中确定的非刷人气用户为目标正常用户,根据目标刷人气用户和目标正常用户确定每个用户的第二风险评分。最后根据第一风险评分和第二风险评分确定每个用户为刷人气用户的最终风险分数。在本方案中,通过两方面分别计算出当前用户的第一风险评分和第二风险评分,进而根据第一风险评分和第二风险评分计算出当前用户为刷人气用户的最终风险分数,其计算更加复杂,提高了识别用户为刷人气用户的准确度。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置和方法,也可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,附图中的流程图和框图显示了根据本发明的多个实施例的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现方式中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
另外,在本发明各个实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。
所述功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。

Claims (10)

1.一种刷人气用户的识别方法,其特征在于,所述方法包括:
获取所有用户的用户特征;
根据每个用户对应的用户特征确定第一风险评分;
识别所有用户中确定的刷人气用户为目标刷人气用户;
识别所有用户中确定的非刷人气用户为目标正常用户;
根据所述目标刷人气用户和目标正常用户对应的用户特征确定每个用户的第二风险评分;
根据所述第一风险评分和所述第二风险评分确定每个用户为刷人气用户的最终风险分数;
根据所述最终风险分数识别其他刷人气用户。
2.如权利要求1所述的方法,其特征在于,所述根据每个用户对应的用户特征确定第一风险评分的步骤包括:
依据所述用户特征采用预定算法对所有用户进行分类;
选取每类用户对应的用户特征中的关键指标;
计算每类下的用户的关键指标的平均值;
根据所述平均值的大小确定每个用户的第一风险评分。
3.如权利要求1所述的方法,其特征在于,所述根据所述目标刷人气用户和目标正常用户对应的用户特征确定每个用户的第二风险评分的步骤包括:
构建所有用户间的网络结构;
根据所述目标刷人气用户和目标正常用户的用户特征依次计算每两个用户之间的相似度权值;
根据在所述网络结构中与当前用户连接的其他用户的相似度权值,以及所述目标刷人气用户和目标正常用户的初始评分计算所述当前用户的第二风险评分。
4.如权利要求3所述的方法,其特征在于,所述计算每两个用户之间的相似度权值的计算方法为:
Figure FDA0002453030120000021
其中,xui为用户u的第i个用户特征,xvi为用户v的第i个用户特征,wuv是用户u和用户v之间的相似度权值。
5.如权利要求3所述的方法,其特征在于,所述计算当前用户的第二风险评分的计算方法为:
Figure FDA0002453030120000022
其中,Sk(i)是用户i在第k轮迭代时的第二风险评分,α是权重系数,其取值在0到1之间,wji是用户j和用户i之间的相似度权重。
6.如权利要求1所述的方法,其特征在于,所述根据所述最终风险分数识别其他刷人气用户的步骤包括:
将每个用户的最终风险分数与预定阈值进行比较,若所述最终风险分数大于预定阈值,则所述最终风险分数对应的用户为刷人气用户。
7.一种刷人气用户的识别装置,其特征在于,所述装置包括:
获取模块,用于获取所有用户的用户特征;
第一确定模块,用于根据每个用户对应的用户特征确定第一风险评分;
第一识别模块,用于识别所有用户中确定的刷人气用户为目标刷人气用户;
第二识别模块,用于识别所有用户中确定的非刷人气用户为目标正常用户;
第二确定模块,用于根据所述目标刷人气用户和目标正常用户对应的用户特征确定每个用户的第二风险评分;
分数确定模块,用于根据所述第一风险评分和所述第二风险评分确定每个用户为刷人气用户的最终风险分数;并根据所述最终风险分数识别其他刷人气用户。
8.如权利要求7所述的装置,其特征在于,所述第一确定模块还用于:
依据所述用户特征采用预定算法对所有用户进行分类;
选取每类用户对应的用户特征中的关键指标;
计算每类下的每个用户的关键指标的平均值;
根据所述平均值的大小确定每个用户的第一风险评分。
9.如权利要求7所述的装置,其特征在于,所述第二确定模块还用于:
构建所有用户间的网络结构;
根据所述目标刷人气用户和目标正常用户的用户特征依次计算每两个用户之间的相似度权值;
根据在所述网络结构中与当前用户连接的其他用户的相似度权值,以及所述目标刷人气用户和目标正常用户的初始评分计算所述当前用户的第二风险评分。
10.一种终端设备,其特征在于,所述终端设备包括存储器和处理器,所述存储器用于存储计算机程序代码,所述处理器用于执行存储于所述存储器中的计算机程序代码以实现如权利要求1-6任一项所述的刷人气用户的识别方法。
CN201810169186.1A 2018-02-28 2018-02-28 刷人气用户的识别方法、装置及终端设备 Active CN108390883B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201810169186.1A CN108390883B (zh) 2018-02-28 2018-02-28 刷人气用户的识别方法、装置及终端设备
PCT/CN2018/084638 WO2019165697A1 (zh) 2018-02-28 2018-04-26 刷人气用户的识别方法、装置、终端设备及储存介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810169186.1A CN108390883B (zh) 2018-02-28 2018-02-28 刷人气用户的识别方法、装置及终端设备

Publications (2)

Publication Number Publication Date
CN108390883A CN108390883A (zh) 2018-08-10
CN108390883B true CN108390883B (zh) 2020-08-04

Family

ID=63070177

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810169186.1A Active CN108390883B (zh) 2018-02-28 2018-02-28 刷人气用户的识别方法、装置及终端设备

Country Status (2)

Country Link
CN (1) CN108390883B (zh)
WO (1) WO2019165697A1 (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109905722B (zh) * 2019-02-21 2021-07-23 武汉瓯越网视有限公司 一种确定嫌疑节点的方法以及相关设备
CN110069923A (zh) * 2019-03-13 2019-07-30 咪咕文化科技有限公司 一种识别风险用户的方法及相关装置
CN109905411B (zh) * 2019-04-25 2021-11-16 北京腾云天下科技有限公司 一种异常用户识别方法、装置和计算设备
CN111125192B (zh) * 2019-12-20 2023-04-07 北京明略软件系统有限公司 一种确定对象之间相似度的方法和装置
CN111488491B (zh) * 2020-06-24 2020-10-16 武汉斗鱼鱼乐网络科技有限公司 一种识别目标主播的方法及系统、介质、设备
CN113067808B (zh) * 2021-03-15 2022-07-05 上海哔哩哔哩科技有限公司 数据处理方法、直播方法、鉴权服务器及直播数据服务器
CN114679600A (zh) * 2022-03-24 2022-06-28 上海哔哩哔哩科技有限公司 数据处理方法及装置

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105915960A (zh) * 2016-03-31 2016-08-31 广州华多网络科技有限公司 一种用户类型的确定方法及装置
CN106557955A (zh) * 2016-11-29 2017-04-05 流量海科技成都有限公司 网约车异常订单识别方法及系统
CN106777024A (zh) * 2016-12-08 2017-05-31 北京小米移动软件有限公司 识别恶意用户的方法及装置
CN106789844A (zh) * 2015-11-23 2017-05-31 阿里巴巴集团控股有限公司 一种恶意用户识别方法及装置
JP6211605B2 (ja) * 2012-06-18 2017-10-11 アリババ・グループ・ホールディング・リミテッドAlibaba Group Holding Limited クリックスルー率に基づく検索結果の順位付け
CN107423883A (zh) * 2017-06-15 2017-12-01 阿里巴巴集团控股有限公司 待处理业务的风险识别方法及装置、电子设备
CN107483500A (zh) * 2017-09-25 2017-12-15 咪咕文化科技有限公司 一种基于用户行为的风险识别方法、装置及存储介质
CN107506921A (zh) * 2017-08-14 2017-12-22 上海携程商务有限公司 订单风险识别方法、系统、存储介质和电子设备

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150235152A1 (en) * 2014-02-18 2015-08-20 Palo Alto Research Center Incorporated System and method for modeling behavior change and consistency to detect malicious insiders
US20170083937A1 (en) * 2015-09-18 2017-03-23 Mms Usa Holdings Inc. Micro-moment analysis
CN107093090A (zh) * 2016-10-25 2017-08-25 北京小度信息科技有限公司 异常用户识别方法及装置
CN107146089B (zh) * 2017-03-29 2020-11-13 北京三快在线科技有限公司 一种刷单识别方法及装置,电子设备
CN107454441B (zh) * 2017-06-30 2019-12-03 武汉斗鱼网络科技有限公司 一种检测直播间刷人气行为的方法、直播平台服务器及计算机可读存储介质
CN107516246B (zh) * 2017-08-25 2021-07-16 北京京东尚科信息技术有限公司 用户类型的确定方法、确定装置、介质及电子设备

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6211605B2 (ja) * 2012-06-18 2017-10-11 アリババ・グループ・ホールディング・リミテッドAlibaba Group Holding Limited クリックスルー率に基づく検索結果の順位付け
CN106789844A (zh) * 2015-11-23 2017-05-31 阿里巴巴集团控股有限公司 一种恶意用户识别方法及装置
CN105915960A (zh) * 2016-03-31 2016-08-31 广州华多网络科技有限公司 一种用户类型的确定方法及装置
CN106557955A (zh) * 2016-11-29 2017-04-05 流量海科技成都有限公司 网约车异常订单识别方法及系统
CN106777024A (zh) * 2016-12-08 2017-05-31 北京小米移动软件有限公司 识别恶意用户的方法及装置
CN107423883A (zh) * 2017-06-15 2017-12-01 阿里巴巴集团控股有限公司 待处理业务的风险识别方法及装置、电子设备
CN107506921A (zh) * 2017-08-14 2017-12-22 上海携程商务有限公司 订单风险识别方法、系统、存储介质和电子设备
CN107483500A (zh) * 2017-09-25 2017-12-15 咪咕文化科技有限公司 一种基于用户行为的风险识别方法、装置及存储介质

Also Published As

Publication number Publication date
CN108390883A (zh) 2018-08-10
WO2019165697A1 (zh) 2019-09-06

Similar Documents

Publication Publication Date Title
CN108390883B (zh) 刷人气用户的识别方法、装置及终端设备
CN107341716B (zh) 一种恶意订单识别的方法、装置及电子设备
TWI718422B (zh) 對模型預測值進行融合的方法、裝置和設備
US10169830B2 (en) Adjusting sentiment scoring for online content using baseline attitude of content author
US20160125432A1 (en) Identifying influential users of a social networking service
CN107451832B (zh) 推送信息的方法和装置
WO2019076173A1 (zh) 内容推送方法、装置及计算机设备
WO2019057048A1 (zh) 一种低频爬虫识别方法、装置、可读存储介质及设备
CN110807488B (zh) 一种基于用户对等组的异常检测方法及装置
CN109903086B (zh) 一种相似人群扩展方法、装置及电子设备
CN110706026A (zh) 一种异常用户的识别方法、识别装置及可读存储介质
CN105144224B (zh) 确定游戏技巧因子
JP2011257916A (ja) 情報提供システム及び情報提供方法
CN110764986B (zh) 页面流畅度检测方法及装置
WO2017048296A1 (en) Determining output presentation type
CN108062692B (zh) 一种录音推荐方法、装置、设备及计算机可读存储介质
CN111242709A (zh) 一种消息推送方法及其装置、设备、存储介质
CN108961019B (zh) 一种用户账户的检测方法和装置
CN105447005B (zh) 一种对象推送方法及装置
CN113076416A (zh) 信息热度评估方法、装置和电子设备
CN115455280A (zh) 一种推荐列表确定方法和服务器
CN108062415B (zh) 用户行为的统计方法、装置及终端设备
US9201967B1 (en) Rule based product classification
CN112995765B (zh) 一种网络资源显示方法及装置
JP2007172173A (ja) 情報提供方法及び装置及びプログラム及びコンピュータ読み取り可能な記録媒体

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant