CN111400678A - 一种用户检测方法及装置 - Google Patents

一种用户检测方法及装置 Download PDF

Info

Publication number
CN111400678A
CN111400678A CN202010154951.XA CN202010154951A CN111400678A CN 111400678 A CN111400678 A CN 111400678A CN 202010154951 A CN202010154951 A CN 202010154951A CN 111400678 A CN111400678 A CN 111400678A
Authority
CN
China
Prior art keywords
user
registered
detected
probability
graph
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010154951.XA
Other languages
English (en)
Inventor
罗晓天
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing QIYI Century Science and Technology Co Ltd
Original Assignee
Beijing QIYI Century Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing QIYI Century Science and Technology Co Ltd filed Critical Beijing QIYI Century Science and Technology Co Ltd
Priority to CN202010154951.XA priority Critical patent/CN111400678A/zh
Publication of CN111400678A publication Critical patent/CN111400678A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/30Authentication, i.e. establishing the identity or authorisation of security principals
    • G06F21/31User authentication
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/16Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2221/00Indexing scheme relating to security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F2221/21Indexing scheme relating to G06F21/00 and subgroups addressing additional information or applications relating to security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F2221/2117User registration

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Mathematical Physics (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Analysis (AREA)
  • Computer Security & Cryptography (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Optimization (AREA)
  • Computational Mathematics (AREA)
  • Software Systems (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Computer Hardware Design (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computing Systems (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Algebra (AREA)
  • Databases & Information Systems (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本发明实施例提供了一种用户检测方法及装置,涉及数据处理技术领域,其中,上述方法包括:获得已注册用户中待检测用户的特征;确定与上述待检测用户存在邀请关系的已注册用户,作为邀请用户;确定与上述待检测用户存在共用关系的已注册用户,作为共用用户,其中,上述共用关系表示:用户间具有相同的特征;根据上述邀请用户的特征、上述共用用户的特征和上述待检测用户的特征,检测上述待检测用户是否为非正常用户。应用本发明实施例提供的方案检测用户是否为非正常用户,可以提高用户检测的准确度。

Description

一种用户检测方法及装置
技术领域
本发明涉及数据处理技术领域,特别是涉及一种用户检测方法及装置。
背景技术
各种应用软件为增大用户量,通常会为已注册用户赠送礼物,以使得已注册用户邀请新用户进行用户注册,进而使用上述应用软件。这种情况下,一些已注册用户为了获得上述应用软件赠送的礼物,可能会邀请一些并非会真正使用上述应用软件的用户,这样导致应用软件虽然赠送出了礼物,但是实际并未收到用户量增加的回报。可以将邀请并非会真正使用应用软件的用户的已注册用户称为非正常用户。
为减少应用软件在赠送礼物方面的损失,需要对上述非正常用户进行检测。当前对非正常用户进行检测时,一般通过用户特征判断用户是否为非正常用户。例如,可以将预设时长内邀请新用户的数量作为一种用户特征,在此基础上,可以认为预设时长内邀请新用户的数量超过一定数量的用户为非正常用户。但正常用户也可能在一段时间内集中邀请新用户。因此,使用上述方法可能会将部分正常用户检测为非正常用户,导致检测非正常用户的准确度较低。
发明内容
本发明实施例的目的在于提供一种用户检测方法及装置,以提高检测非正常用户的准确度。具体技术方案如下:
第一方面,本发明实施例提供了一种用户检测方法,所述方法包括:
获得已注册用户中待检测用户的特征;
确定与所述待检测用户存在邀请关系的已注册用户,作为邀请用户;
确定与所述待检测用户存在共用关系的已注册用户,作为共用用户,其中,所述共用关系表示:用户间具有相同的特征;
根据所述邀请用户的特征、所述共用用户的特征和所述待检测用户的特征,检测所述待检测用户是否为非正常用户。
本发明的一个实施例中,所述根据所述邀请用户的特征、所述共用用户的特征和所述待检测用户的特征,检测所述待检测用户是否为非正常用户,包括:
获得根据关系用户的特征预测得到的表示所述关系用户为非正常用户的第一概率,其中,所述关系用户包括:所述邀请用户和共用用户;
根据所述待检测用户的特征预测所述待检测用户为非正常用户的第二概率,根据所获得的第一概率调整所述第二概率,并根据调整后的第二概率检测所述待检测用户是否为非正常用户。
本发明的一个实施例中,所述根据所获得的第一概率调整所述第二概率,包括:
针对每一第一概率,若所述第二概率高于所述第一概率,则降低所述第二概率,若所述第二概率低于所述第一概率,则提高所述第二概率。
本发明的一个实施例中,所述根据所述邀请用户的特征、所述共用用户的特征和所述待检测用户的特征,检测所述待检测用户是否为非正常用户,包括:
获得第一无向图,其中,所述第一无向图中包括与每一已注册用户分别一一对应的节点,具有邀请关系的已注册用户对应的节点之间具有无向连接关系;
获得第二无向图,其中,所述第二无向图中包括与每一已注册用户分别一一对应的节点,具有共用关系的已注册用户对应的节点之间具有无向连接关系;
将所述待预测用户的特征更新至包括每一已注册用户的特征的特征集合;
将所述第一无向图、第二无向图和所述特征集合输入用户检测图卷积模型,以所述特征集合中各个已注册用户的特征为所述第一无向图、第二无向图中每一已注册用户所对应节点的节点值,通过所述用户检测图卷积模型对所述第一无向图和第二无向图进行图卷积运算,检测所述待检测用户是否为非正常用户。
本发明的一个实施例中,在所述将所述第一无向图、第二无向图和所述特征集合输入用户检测图卷积模型,以所述特征集合中各个已注册用户的特征为所述第一无向图、第二无向图中每一已注册用户所对应节点的节点值,通过所述用户检测图卷积模型对所述第一无向图和第二无向图进行图卷积运算,检测所述待检测用户是否为非正常用户之前,还包括:
针对每一已注册用户,获得与该已注册用户存在邀请关系的其他用户的数量,作为邀请数量;
针对每一已注册用户,获得与该已注册用户存在共用关系的其他用户的数量,作为共用数量;
所述将所述第一无向图、第二无向图和所述特征集合输入用户检测图卷积模型,以所述特征集合中各个已注册用户的特征为所述第一无向图、第二无向图中每一已注册用户所对应节点的节点值,通过所述用户检测图卷积模型对所述第一无向图和第二无向图进行图卷积运算,检测所述待检测用户是否为非正常用户,包括:
将所述第一无向图、各个已注册用户的邀请数量、第二无向图、各个已注册用户的共用数量、所述特征集合输入用户检测图卷积模型,以所述特征集合中各个已注册用户的特征为所述第一无向图、第二无向图中每一已注册用户所对应节点的节点值,通过所述用户检测图卷积模型对所述第一无向图和第二无向图进行图卷积运算,在图卷积运算的过程中使用各个已注册用户的邀请数量、各个已注册用户的共用数量在每一次卷积的过程中对卷积处理结果进行归一化处理,检测所述待检测用户是否为非正常用户。
本发明的一个实施例中,所述用户检测图卷积模型的输出结果中包括:表示每一已注册用户是否为非正常用户的检测身份;
所述方法还包括:
将已确定身份用户的检测身份与所述已确定身份用户的真实身份进行比较,其中,所述已确定身份用户为:已注册用户中已确定是否为非正常用户的用户;
根据比较结果调整所述用户检测图卷积模型的模型参数;
若调整模型参数后的所述用户检测图卷积模型收敛,将各个已注册用户的检测身份确定为各个已注册用户的真实身份。
本发明的一个实施例中,用户的特征包括以下特征中的至少一种:
用户使用所注册应用软件而产生的信息;
用户注册所述应用软件而产生的信息;
所述用户使用所述应用软件时应用软件所在的设备的信息;
所述设备所使用网络的信息。
本发明的一个实施例中,所述用户注册所述应用软件而产生的信息,包括:
所述用户注册所述应用软件的时间段和/或所述用户注册所述应用软件时的所在地。
本发明的一个实施例中,所述设备所使用网络的信息,包括:
IP地址和/或WiFi名称。
第二方面,本发明实施例提供了一种用户检测装置,所述装置包括:
特征获得模块,用于获得已注册用户中待检测用户的特征;
邀请用户确定模块,用于确定与所述待检测用户存在邀请关系的已注册用户,作为邀请用户;
共用用户确定模块,用于确定与所述待检测用户存在共用关系的已注册用户,作为共用用户,其中,所述共用关系表示:用户间具有相同的特征;
用户检测模块,用于根据所述邀请用户的特征、所述共用用户的特征和所述待检测用户的特征,检测所述待检测用户是否为非正常用户。
本发明的一个实施例中,所述用户检测模块,包括:
概率获得子模块,用于获得根据关系用户的特征预测得到的表示所述关系用户为非正常用户的第一概率,其中,所述关系用户包括:所述邀请用户和共用用户;
第一用户检测子模块,用于根据所述待检测用户的特征预测所述待检测用户为非正常用户的第二概率,根据所获得的第一概率调整所述第二概率,并根据调整后的第二概率检测所述待检测用户是否为非正常用户。
本发明的一个实施例中,所述第一用户检测子模块,具体用于:
根据所述待检测用户的特征预测所述待检测用户为非正常用户的第二概率,针对每一第一概率,若所述第二概率高于所述第一概率,则降低所述第二概率,若所述第二概率低于所述第一概率,则提高所述第二概率。
本发明的一个实施例中,所述用户检测模块,包括:
第一无向图获得子模块,用于获得第一无向图,其中,所述第一无向图中包括与每一已注册用户分别一一对应的节点,具有邀请关系的已注册用户对应的节点之间具有无向连接关系;
第二无向图获得子模块,用于获得第二无向图,其中,所述第二无向图中包括与每一已注册用户分别一一对应的节点,具有共用关系的已注册用户对应的节点之间具有无向连接关系;
集合更新子模块,用于将所述待预测用户的特征更新至包括每一已注册用户的特征的特征集合;
第二用户检测子模块,用于将所述第一无向图、第二无向图和所述特征集合输入用户检测图卷积模型,以所述特征集合中各个已注册用户的特征为所述第一无向图、第二无向图中每一已注册用户所对应节点的节点值,通过所述用户检测图卷积模型对所述第一无向图和第二无向图进行图卷积运算,检测所述待检测用户是否为非正常用户。
本发明的一个实施例中,所述用户检测模块,还包括:
邀请数量获得子模块,用于针对每一已注册用户,获得与该已注册用户存在邀请关系的其他用户的数量,作为邀请数量;
共用数量获得子模块,用于针对每一已注册用户,获得与该已注册用户存在共用关系的其他用户的数量,作为共用数量;
所述第二用户检测子模块,具体用于:
将所述第一无向图、各个已注册用户的邀请数量、第二无向图、各个已注册用户的共用数量、所述特征集合输入用户检测图卷积模型,以所述特征集合中各个已注册用户的特征为所述第一无向图、第二无向图中每一已注册用户所对应节点的节点值,通过所述用户检测图卷积模型对所述第一无向图和第二无向图进行图卷积运算,在图卷积运算的过程中使用各个已注册用户的邀请数量、各个已注册用户的共用数量在每一次卷积的过程中对卷积处理结果进行归一化处理,检测所述待检测用户是否为非正常用户。
本发明的一个实施例中,所述用户检测图卷积模型的输出结果中包括:表示每一已注册用户是否为非正常用户的检测身份;
所述用户检测模块还包括:
身份比较子模块,用于将已确定身份用户的检测身份与所述已确定身份用户的真实身份进行比较,其中,所述已确定身份用户为:已注册用户中已确定是否为非正常用户的用户;
参数调整子模块,用于根据比较结果调整所述用户检测图卷积模型的模型参数;
身份确定子模块,用于若调整模型参数后的所述用户检测图卷积模型收敛,将各个已注册用户的检测身份确定为各个已注册用户的真实身份。
本发明的一个实施例中,用户的特征包括以下特征中的至少一种:
用户使用所注册应用软件而产生的信息;
用户注册所述应用软件而产生的信息;
所述用户使用所述应用软件时应用软件所在的设备的信息;
所述设备所使用网络的信息。
本发明的一个实施例中,所述用户注册所述应用软件而产生的信息,包括:
所述用户注册所述应用软件的时间段和/或所述用户注册所述应用软件时的所在地。
本发明的一个实施例中,所述设备所使用网络的信息,包括:
IP地址和/或WiFi名称。
第三方面,本发明实施例提供了一种电子设备,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的程序时,实现第一方面任一所述的方法步骤。
第四方面,本发明实施例提供了一种计算机可读存储介质,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现第一方面任一所述的方法步骤。
第五方面,本发明实施例还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述第一方面任一所述的方法步骤。
本发明实施例有益效果:
应用本发明实施例提供的方案进行用户检测时,获得已注册用户中待检测用户的特征;确定与上述待检测用户存在邀请关系的已注册用户,作为邀请用户;确定与上述待检测用户存在共用关系的已注册用户,作为共用用户,其中,上述共用关系表示:用户间具有相同的特征;根据上述邀请用户的特征、上述共用用户的特征和上述待检测用户的特征,检测上述待检测用户是否为非正常用户。由于邀请用户与待检测用户存在邀请关系,因此当邀请用户为非正常用户时,邀请用户邀请其他非正常用户共同在上述应用软件中获取应用软件赠送的礼物的概率较高,因此可以认为邀请用户为非正常用户时,待检测用户为非正常用户的概率也较高。另外,由于非正常用户具有与正常用户不同的特征,可以根据用户的特征判断用户是否为非正常用户,由于共用用户与待检测用户之间存在共用关系,说明上述共用用户与待检测用户之间具有相似的特征,因此共用用户为非正常用户时,待检测用户为非正常用户的概率也较高。上述方法使用了待检测用户与其他已注册用户之间的邀请关系、共用关系作为用户检测的检测依据,该方案中待检测用户为非正常用户的概率受到邀请用户与共用用户的影响,增加了检测待检测用户是否为非正常用户的检测依据,从而提高用户检测的准确度。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的第一种用户检测方法的流程示意图;
图2为本发明实施例提供的第二种用户检测方法的流程示意图;
图3为本发明实施例提供的一种第一无向图的示意图;
图4为本发明实施例提供的一种第二无向图的示意图;
图5为本发明实施例提供的一种用户检测图卷积模型的结构示意图;
图6为本发明实施例提供的第三种用户检测方法的流程示意图;
图7为本发明实施例提供的第四种用户检测方法的流程示意图;
图8为本发明实施例提供的第一种用户检测装置的结构示意图;
图9为本发明实施例提供的第二种用户检测装置的结构示意图;
图10为本发明实施例提供的第三种用户检测装置的结构示意图;
图11为本发明实施例提供的第四种用户检测装置的结构示意图;
图12为本发明实施例提供的第五种用户检测装置的结构示意图;
图13为本发明实施例提供的一种电子设备的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
由于现有技术中对用户是否为非正常用户进行检测时,检测结果的准确度较低,为解决这一问题,本发明实施例提供了一种用户检测方法及装置。
本发明的一个实施例中,提供了一种用户检测方法,上述方法包括:
获得已注册用户中待检测用户的特征;
确定与上述待检测用户存在邀请关系的已注册用户,作为邀请用户;
确定与上述待检测用户存在共用关系的已注册用户,作为共用用户,其中,上述共用关系表示:用户间具有相同的特征;
根据上述邀请用户的特征、上述共用用户的特征和上述待检测用户的特征,检测上述待检测用户是否为非正常用户。
由以上可见,由于邀请用户与待检测用户存在邀请关系,因此当邀请用户为非正常用户时,邀请用户邀请其他非正常用户共同在上述应用软件中获取应用软件赠送的礼物的概率较高,因此可以认为邀请用户为非正常用户时,待检测用户为非正常用户的概率也较高。另外,由于非正常用户具有与正常用户不同的特征,可以根据用户的特征判断用户是否为非正常用户,由于共用用户与待检测用户之间存在共用关系,说明上述共用用户与待检测用户之间具有相似的特征,因此共用用户为非正常用户时,待检测用户为非正常用户的概率也较高。上述方法使用了待检测用户与其他已注册用户之间的邀请关系、共用关系作为用户检测的检测依据,该方案中待检测用户为非正常用户的概率受到邀请用户与共用用户的影响,增加了检测待检测用户是否为非正常用户的检测依据,从而提高用户检测的准确度。
下面通过具体实施例对本发明实施例提供的用户检测方法及装置进行说明。
参见图1,本发明实施例提供了第一种用户检测方法的流程示意图,具体的,上述方法包括以下步骤S101-S104。
S101:获得已注册用户中待检测用户的特征。
本发明的一个实施例中,可以设置有用户特征数据库。上述用户特征数据库中存储有所有已注册用户的特征。获得上述待检测用户的特征时,可以从用户特征数据库中获得待检测用户的特征。
用户的特征包括以下(一)至(四)所示特征中的至少一种:
(一)用户使用所注册应用软件而产生的信息。
其中,使用者注册应用软件时会在上述应用软件中生成用户,用户在使用上述应用软件时会产生大量操作信息。
具体的,上述用户使用所注册应用软件而产生的信息可以包括:用户每日使用上述应用软件的时间段、使用时长、使用上述应用软件的次数、使用不同功能的次数等信息。
例如,用户在一日内使用上述应用软件的时间为19:00-20:00,时长为1小时,使用应用软件的次数为2次,使用视频功能的次数为3次,使用社交功能的次数为1次等。
(二)用户注册上述应用软件而产生的信息。
其中,上述用户注册上述应用软件而产生的信息可以包括:用户注册上述应用软件的时间段和/或用户注册上述应用软件时的所在地等信息。
例如,上述注册应用软件的时间段可以以1小时为单位划分,如14:00-15:00等,用户注册上述应用软件时的所在地可以以城市为单位划分,如北京市、上海市等。
(三)上述用户使用上述应用软件时应用软件所在的设备的信息。
其中,上述应用软件所在的设备为上述用户使用上述应用软件时,应用软件所安装在的设备。上述设备可以为手机、平板电脑、电脑等。上述应用软件所在的设备的信息可以为设备的序列号等信息,不同设备的序列号各不相同。
(四)上述设备所使用网络的信息。
其中,上述设备所使用网络的信息可以为:上述网络的IP地址、WiFi名称等信息。
S102:确定与上述待检测用户存在邀请关系的已注册用户,作为邀请用户。
其中,待检测用户可以通过已注册用户的邀请注册上述应用软件,也可以邀请其他用户注册上述应用软件,则上述待检测用户与邀请上述待检测用户的已注册用户彼此之间存在邀请关系,上述待检测用户与自身邀请的其他用户彼此之间也存在邀请关系。这样上述邀请用户包括:邀请待检测用户注册上述应用软件的用户和/或上述待检测用户邀请的注册上述应用软件的用户。
由于当邀请用户为非正常用户时,邀请用户邀请其他非正常用户共同在上述应用软件中获取应用软件赠送的礼物的概率较高,所以,若邀请用户为非正常用户,则上述待检测用户为非正常用户的概率较高,相反的,若邀请用户为正常用户,则上述待检测用户为正常用户的概率较高。
S103:确定与上述待检测用户存在共用关系的已注册用户,作为共用用户。
其中,上述共用关系表示:用户间具有相同的特征。
用户间具有的相同的特征可以包括以下各项中的至少一种:用户使用上述应用软件产生的信息相同、用户注册上述应用软件而产生的信息相同、用户使用上述应用软件时应用软件所在的设备的信息相同、用户使用应用软件时应用软件所在的设备使用的网络的信息相同。
第一方面,用户使用上述应用软件产生的信息相同说明用户之间在使用上述应用软件时存在相同的使用习惯,若使用习惯相同的用户中存在一个非正常用户E,则其他用户由于与非正常用户E的使用习惯相同,因此其他用户也为非正常用户的概率较高。
第二方面,由于非正常用户可能在某一时间段内集中邀请同一所在地的用户注册上述应用软件,因此在同一时间段内在同一地区注册上述应用软件的用户中存在一个非正常用户E,则其他用户可能为非正常用户E邀请的用户,其他用户为非正常用户的概率较高。
第三方面,由于不同设备的序列号各不相同,因此上述应用软件所在设备的序列号相同表示上述用户使用同一台设备使用上述应用软件,说明上述用户可能为同一使用者注册的用户。因此若存在非正常用户E,则与非正常用户E通过同一设备使用上述应用软件的其他用户为非正常用户的概率较高。
第四方面,由于上述设备使用的IP地址相同、使用的WiFi的WiFi名称相同说明上述用户在使用上述应用软件时应用软件所在的设备使用的网络是相同的,说明上述用户可能为同一使用者注册的用户,因此若存在非正常用户E,则与非正常用户E通过使用相同网络的其他用户为非正常用户的概率较高。
综上,由于共用用户与待检测用户之间存在共用关系,则说明共用用户与上述待检测用户的特征相同,由于非正常用户具有与正常用户不同的特征,可以根据用户的特征判断用户是否为非正常用户,因此若共用用户为非正常用户,则待检测用户为非正常用户的概率较高。
S104:根据上述邀请用户的特征、上述共用用户的特征和上述待检测用户的特征,检测上述待检测用户是否为非正常用户。
具体的,由于邀请用户与共用用户为非正常用户时待检测用户为非正常用户的概率会提高,因此,除了根据上述待检测用户的特征预测上述待检测用户为非正常用户的概率外,还可以根据上述邀请用户的特征预测上述邀请用户为非正常用户的概率,根据上述共用用户的特征预测上述共用用户为非正常用户的概率,根据邀请用户与共用用户为非正常用户的概率调整待检测用户为非正常用户的概率,然后根据调整后的概率,检测待检测用户是否为非正常用户。
本发明的一个实施例中,可以通过步骤A-B检测待检测用户是否为非正常用户。
步骤A:获得根据关系用户的特征预测得到的表示上述关系用户为非正常用户的第一概率。
其中,上述关系用户包括:上述邀请用户和共用用户。
具体的,可以根据关系用户的各项特征预测得到上述第一概率。
(一)若用户使用上述应用软件的时长低于预设时长、使用上述应用软件的次数低于预设次数,表示上述用户在注册上述应用软件之后使用上述应用软件的频率较低,可以认为上述用户为非正常用户的概率较高,因此第一概率可以为第一预设概率值。
例如,上述第一预设概率值可以为60%或70%等,上述预设时长可以为10分钟,上述预设次数可以为2次等。
若用户E的使用时长为5分钟,使用次数为1次,则用户E的第一概率可以为60%。
(二)若用户注册上述应用软件的时间段在预设时间段范围内,可以认为上述用户为非正常用户的概率较高,第一概率可以为第二预设概率值。
例如,上述第二预设概率值可以为60%或70%等,上述预设时间段可以为2:00-6:00,若用户E注册上述应用软件的时间段为3:00-4:00,说明用户E在应用软件使用量较低的时间段注册上述应用软件,用户E的第一概率可以为60%。
另外,还可以根据上述(一)、(二)两方面共同预测上述第一概率。若用户的特征同时满足使用上述应用软件的时长低于预设时长、使用上述应用软件的次数低于预设次数、注册上述应用软件的时间段在预设时间段范围内的条件,则第一概率可以为第三预设概率值。
其中,由于用户同时满足上述(一)、(二)两方面的条件,说明用户具有更多非正常用户的特征,因此第三预设概率值大于上述第一预设概率值与第二预设概率值。
例如,上述第三预设概率值可以为80%、90%等。
步骤B:根据上述待检测用户的特征预测上述待检测用户为非正常用户的第二概率,根据所获得的第一概率调整上述第二概率,并根据调整后的第二概率检测上述待检测用户是否为非正常用户。
具体的,可以使用与上述步骤A相同的方法根据待检测用户的特征预测上述待检测用户为非正常用户的第二概率。
若第二概率高于第一概率,则说明关系用户为非正常用户的概率高于待检测用户为非正常用户的概率,因此可以提高待检测用户为非正常用户的概率,也就是,提高上述第二概率。
若第二概率低于第一概率,则说明关系用户为非正常用户的概率低于待检测用户为非正常用户的概率,因此可以降低待检测用户为非正常用户的概率,也就是,降低上述第二概率。
具体的,上述关系用户可以既是邀请用户又是共用用户、仅为邀请用户或仅为共用用户。与关系用户仅为邀请用户或仅为共用用户相比,关系用户既是邀请用户又是共用用户的情况下,关系用户与待检测用户的关系更加密切。因此在关系用户既是邀请用户又是共用用户的情况下,根据第一概率调整第二概率时调整的数值较大。在关系用户仅为邀请用户或仅为共用用户的情况下,根据第一概率调整第二概率时调整的数值较小,上述调整的数值可以为第四预设概率值。
例如,第四预设概率值可以为30%。
本发明的一个实施例中,针对每一第一概率,若上述第二概率高于上述第一概率,则上述第二概率降低第四预设概率值。若上述第二概率低于上述第一概率,则上述第二概率提高第四预设概率值。
若待检测用户的第二概率高于预设概率,则认为上述待检测用户为非正常用户,例如上述预设概率可以为70%、80%等。
本发明的另一个实施例中,可以通过步骤S104A-S104D检测待检测用户是否为非正常用户,这里暂不详述。
由以上可见,由于邀请用户与待检测用户存在邀请关系,因此当邀请用户为非正常用户时,邀请用户邀请其他非正常用户共同在上述应用软件中获取应用软件赠送的礼物的概率较高,因此可以认为邀请用户为非正常用户时,待检测用户为非正常用户的概率也较高。另外,由于非正常用户具有与正常用户不同的特征,可以根据用户的特征判断用户是否为非正常用户,由于共用用户与待检测用户之间存在共用关系,说明上述共用用户与待检测用户之间具有相似的特征,因此共用用户为非正常用户时,待检测用户为非正常用户的概率也较高。上述方法使用了待检测用户与其他已注册用户之间的邀请关系、共用关系作为用户检测的检测依据,该方案中待检测用户为非正常用户的概率受到邀请用户与共用用户的影响,增加了检测待检测用户是否为非正常用户的检测依据,从而提高用户检测的准确度。
本发明的一个实施例中,参见图2,提供了第二种用户检测方法的流程示意图,与前述图1所示实施例相比,本实施例中上述步骤S104可以通过步骤S104A-S104D实现。
S104A:获得第一无向图。
其中,上述第一无向图中包括与每一已注册用户分别一一对应的节点,具有邀请关系的已注册用户对应的节点之间具有无向连接关系。
参见图3,本发明实施例提供了一种第一无向图的示意图。其中,图中各个圆形分别表示第一无向图中的各个节点,节点E-节点I分别对应已注册用户E-已注册用户I。图中各个圆形之间的直线表示无向连接关系,即表示直线两端的圆形对应的已注册用户之间存在邀请关系。
具体的,上述第一无向图中各个节点之间的无向连接关系可以通过第一矩阵表示,其中,第一矩阵中的每一行分别表示第一无向图中的各个节点,记为行向节点,第一矩阵中的每一列分别表示第一无向图中的各个节点,记为列向节点。第一矩阵中元素的元素值为1表示该元素的行向节点与列向节点之间具有无向连接关系,元素值为0表示该元素的行向节点与列向节点之间不存在无向连接关系。其中,第一矩阵中主对角线上的元素的元素值均为1,主对角线上的元素的行向节点与列向节点在第一无向图中为同一节点,以使得后续计算的过程中可以保留第一无向图中各个节点自身对应的信息。
例如,参见下方矩阵K,与图3相对应,矩阵K中的第1行-第5行分别表示第一无向图中的节点E-节点I,则第1行-第5行的行向节点分别为节点E-节点I,矩阵K中的第1列-第5列分别表示第一无向图中的节点E-节点I,则第1行-第5行的列向节点分别为节点E-节点I。以节点E与节点G为例,节点E为矩阵K中第1行的行向节点、第1列的列向节点,节点G为矩阵K中第3行的行向节点、第3列的列向节点。假设,节点E与节点G之间的关系为无向连接关系,因此在矩阵K中,元素K1,3与K3,1的元素值均为1,以此类推,对于第一无向图中的每两个存在无向连接关系的节点,以上述两个节点分别作为行向节点与列向节点的元素和以上述两个节点分别作为列向节点与行向节点的元素的元素值均为1,因此矩阵K为对称矩阵。
Figure BDA0002402379360000151
S104B:获得第二无向图。
其中,上述第二无向图中包括与每一已注册用户分别一一对应的节点,具有共用关系的已注册用户对应的节点之间具有无向连接关系。
参见图4,本发明实施例提供了一种第二无向图的示意图。其中,图中各个圆形表示第二无向图中的各个节点,节点E-节点1分别对应已注册用户E-已注册用户I。图中各个圆形之间的直线表示无向连接关系,即表示直线两端的圆形对应的已注册用户之间存在共用关系。
具体的,上述第二无向图中各个节点之间的无向连接关系可以通过第二矩阵表示,其中,第二矩阵中的每一行分别表示第二无向图中的各个节点,记为行向节点,第二矩阵中的每一列分别表示第二无向图中的各个节点,记为列向节点。第二矩阵中元素的元素值为1表示该元素的行向节点与列向节点之间具有无向连接关系,元素值为0表示该元素的行向节点与列向节点之间不存在无向连接关系。其中,第二矩阵中主对角线上的元素的元素值均为1,主对角线上的元素的行向节点与列向节点在第二无向图中为同一节点,以使得后续计算的过程中可以保留第二无向图中各个节点自身对应的信息。
例如,参见下方矩阵L与图4相对应,矩阵L中的第1行-第5行分别表示第二无向图中的节点E-节点I,则第1行-第5行的行向节点分别为节点E-节点I,矩阵L中的第1列-第5列分别表示第一无向图中的节点E-节点I,则第1行-第5行的列向节点分别为节点E-节点I。以节点F与节点H为例,节点F为矩阵L中第2行的行向节点、第2列的列向节点,节点H为矩阵L中第4行的行向节点、第4列的列向节点。假设,节点F与节点H之间的关系为无向连接关系,因此在矩阵L中,元素L2,4与L4,2的元素值均为1,以此类推,对于第二无向图中的每两个存在无向连接关系的节点,以上述两个节点分别作为行向节点与列向节点的元素和以上述两个节点分别作为列向节点与行向节点的元素的元素值均为1,因此矩阵L为对称矩阵。
Figure BDA0002402379360000161
S104C:将上述待预测用户的特征更新至包括每一已注册用户的特征的特征集合。
其中,上述特征集合可以存储在用户特征数据库中。
上述特征集合也可以通过特征矩阵的形式表示,特征矩阵的各行对应各个已注册用户,特征矩阵的各列对应各种特征,因此当存在n个已注册用户,每个已注册用户对应m种特征时,上述特征矩阵为n行、m列矩阵。
具体的,在将上述待检测用户的各项特征更新至特征集合中时,可以在特征矩阵中添加初始元素值为0的元素,并将添加的元素的元素值更改为待检测用户的各项特征。当在特征矩阵中更新p个已注册用户的特征时,每个已注册用户对应m种特征,因此在特征矩阵中增加p×m个初始元素值为0的元素,使得原本大小为n行、m列的矩阵扩大到n+p行、m列。
S104D:将上述第一无向图、第二无向图和上述特征集合输入用户检测图卷积模型,以上述特征集合中各个已注册用户的特征为上述第一无向图、第二无向图中每一已注册用户所对应节点的节点值,通过上述用户检测图卷积模型对上述第一无向图和第二无向图进行图卷积运算,检测上述待检测用户是否为非正常用户。
其中,上述用户检测图卷积模型的初始模型为图卷积模型。
本发明的一个实施例中,上述用户检测图卷积模型可以包括多个卷积层、softmax(归一化指数函数)。
其中,上述卷积层用于进行特征提取,上述soffmax用于输出分类结果。上述多个卷积层依次连接,最后一个卷积层与softmax连接。另外,在激励函数得到每一卷积层的输出结果后,可以先对每一卷积层的输出结果进行激励处理,然后再输入下一卷积层或softmax。
具体的,上述卷积层可以为GCN(Graph Convolutional Network,图卷积网络)层,上述激励函数可以为ReLU(Rectified Linear Unit,线性整流)函数或linear(线性激活)函数。
参见图5,本发明实施例提供了一种用户检测图卷积模型的结构示意图。
图中GcN表示单个GCN层,同时进行数据处理的2个GCN层分别对应第一无向图与第二无向图。分别将第一无向图、第二无向图与特征集合输入GCN中,SUM表示把2个GCN的输出结果与权重参数相乘后相加,将相加得到的结果输入ReLU函数进行激励处理。将激励处理后的结果输入下一GCN层,将GCN层的输出结果进行相加处理,将相加处理得到的结果输入linear函数进行激励处理。将激励处理后的结果输入softmax,将结果进行分类并输出,获得待检测用户是否为非正常用户的检测结果,其中,输出结果可以为待检测用户为正常用户或待检测用户为非正常用户。
本发明的一个实施例中,参见图6,提供了第三种用户检测方法的流程示意图,与前述图2所示实施例相比,本实施例中上述步骤S104C之后还包括:
S104E:针对每一已注册用户,获得与该已注册用户存在邀请关系的其他用户的数量,作为邀请数量。
具体的,上述邀请数量可以存储在邀请数量集合中,可以在邀请数量集合中获得各个已注册用户的邀请数量,也可以统计第一无向图中与各个已注册用户对应的节点存在无向连接关系的节点的数量,获得各个已注册用户的邀请数量。
另外,上述邀请数量也可以通过第一对角矩阵的形式表示,其中,第一对角矩阵的主对角线上的各个元素分别与已注册用户一一对应,各个主对角线上元素的元素值为对应已注册用户的邀请数量。
S104F:针对每一已注册用户,获得与该已注册用户存在共用关系的其他用户的数量,作为共用数量。
具体的,上述共用数量可以存储在共用数量集合中,可以在上述共用数量集合中获得各个已注册用户的共用数量,也可以统计第二无向图中与各个已注册用户对应的节点存在无向连接关系的节点的数量,获得各个已注册用户的共用数量。
另外,上述共用数量也可以通过第二对角矩阵的形式表示,其中,第二对角矩阵的主对角线上的各个元素分别与已注册用户一一对应,各个主对角线上的元素的元素值为对应已注册用户的共用数量。
上述步骤S104D可以通过步骤S104G实现。
S104G:将上述第一无向图、各个已注册用户的邀请数量、第二无向图、各个已注册用户的共用数量、上述特征集合输入用户检测图卷积模型,以上述特征集合中各个已注册用户的特征为上述第一无向图、第二无向图中每一已注册用户所对应节点的节点值,通过上述用户检测图卷积模型对上述第一无向图和第二无向图进行图卷积运算,在图卷积运算的过程中使用各个已注册用户的邀请数量、各个已注册用户的共用数量在每一次卷积的过程中对卷积处理结果进行归一化处理,检测上述待检测用户是否为非正常用户。
具体的,上述第一无向图可以通过第一矩阵表示,各个已注册用户的邀请数量可以通过第一对角矩阵表示,第二无向图可以通过第二矩阵表示,各个已注册用户的共用数量可以通过第二对角矩阵表示。GCN层中进行的计算如下列公式所示:
Figure BDA0002402379360000191
其中,σ()表示激活函数,1表示当前GCN层的层数,H(l)为特征矩阵,H(l+1)为第1个GCN层计算能得到的、第1+1个GCN层对应的特征矩阵。m可以取值0与1,当m为0时,该公式为基于第一无向图进行的计算,则Dm为D0,表示第一对角矩阵;Am为A0,表示第一矩阵;
Figure BDA0002402379360000192
Figure BDA0002402379360000193
表示与第一无向图对应的权重矩阵;wm为w0,表示第一无向图的权重参数。m为1时,该公式为基于第二无向图进行的计算,则Dm为D1,表示第二对角矩阵;Am为A1,表示第二矩阵;
Figure BDA0002402379360000194
Figure BDA0002402379360000195
表示与第二无向图对应的权重矩阵;wm为w1,表示第二无向图的权重参数。
本实施例提供的方案中,上述邀请关系与共用关系分别是使用第一无向图与第二无向图表示的,上述用户检测图卷积模型是用于对图进行处理的模型,因此对无向图具有较好的处理效果。又由于上述用户检测图卷积模型是采用机器学习方式对大量的样本进行学习得到的模型,所以上述模型能够学习到大量样本中的节点特征,从而应用上述用户检测图卷积模型能够实现对待检测用户是否为非正常用户的检测。
本发明的一个实施例中,参见图7,提供了第四种用户检测方法的流程示意图,与前述图2所示实施例相比,本实施例中还包括:
其中,上述用户检测图卷积模型的输出结果中包括:表示每一已注册用户是否为非正常用户的检测身份。
S104H:将已确定身份用户的检测身份与上述已确定身份用户的真实身份进行比较。
其中,上述已确定身份用户为:已注册用户中已确定是否为非正常用户的用户。
具体的,可以通过人工标记的各个已确定身份用户的真实身份标签确定已确定身份用户是否为非正常用户。也可以根据用户检测图卷积模型上一次对已注册用户进行检测时的检测结果确定已确定身份用户是否为非正常用户。
用户检测图卷积模型的输出结果中包括已确认身份用户的检测身份与待检测用户的检测身份。已确认身份用户已确定过是否为非正常用户因此具有确认的真实身份。通过比较已确认身份用户的检测身份与真实身份可以计算得到上述用户检测图卷积模型的损失。
S104I:根据比较结果调整上述用户检测图卷积模型的模型参数。
具体的,可以根据上述计算得到的用户检测图卷积模型的损失调整上述用户检测图卷积模型的模型参数。
S104J:若调整模型参数后的上述用户检测图卷积模型收敛,将各个已注册用户的检测身份确定为各个已注册用户的真实身份。
具体的,当上述用户检测图卷积模型收敛时,认为上述用户检测图卷积模型输出的各个已注册用户的检测身份是可信的,因此可以将上述已注册用户的检测身份确定为各个已注册用户的真实身份。
另外,由于本实施例中,上述用户检测图卷积模型是在检测已注册用户的检测身份的同时进行训练的,并且上述用户检测图卷积模型将检测身份作为真实身份用于下一次训练。因此,为了保证上述用户检测图卷积模型输出结果的可靠性,在对上述用户检测图卷积模型进行初始训练时使用的已注册用户的真实身份与现实中的真实情况相符合,以此保证在此基础上进行后续训练得到的用户检测图卷积模型的可靠性。
由以上可见,本发明实施例提供的方案中,每当使用上述用户检测图卷积模型对待检测用户进行检测时,都会对上述用户检测图卷积模型重新进行训练。由于已注册用户的数量不断增加,因此对上述用户检测图卷积模型进行训练时使用的作为样本的已确认身份用户的数量也不断增加,由于样本的数量越多用户检测图卷积模型学习到的样本的特征越多,获得的用户检测图卷积模型的检测效果越好。因此使用上述方式训练上述用户检测图卷积模型,可以提高上述用户检测图卷积模型的输出结果的准确性。
与上述用户检测方法相对应,本发明实施例还提供了一种用户检测装置。
参见图8,本发明实施例提供了第一种用户检测装置的结构示意图,具体的,上述装置包括:
特征获得模块801,用于获得已注册用户中待检测用户的特征;
邀请用户确定模块802,用于确定与所述待检测用户存在邀请关系的已注册用户,作为邀请用户;
共用用户确定模块803,用于确定与所述待检测用户存在共用关系的已注册用户,作为共用用户,其中,所述共用关系表示:用户间具有相同的特征;
用户检测模块804,用于根据所述邀请用户的特征、所述共用用户的特征和所述待检测用户的特征,检测所述待检测用户是否为非正常用户。
参见图9,本发明实施例提供了第二种用户检测装置的结构示意图,与前述图8所示实施例相比,本实施例中上述用户检测模块804,包括:
概率获得子模块804A,用于获得根据关系用户的特征预测得到的表示所述关系用户为非正常用户的第一概率,其中,所述关系用户包括:所述邀请用户和共用用户;
第一用户检测子模块804B,用于根据所述待检测用户的特征预测所述待检测用户为非正常用户的第二概率,根据所获得的第一概率调整所述第二概率,并根据调整后的第二概率检测所述待检测用户是否为非正常用户。
本发明的一个实施例中,上述第一用户检测子模块804B,具体用于:
根据所述待检测用户的特征预测所述待检测用户为非正常用户的第二概率,针对每一第一概率,若所述第二概率高于所述第一概率,则降低所述第二概率,若所述第二概率低于所述第一概率,则提高所述第二概率。
由以上可见,由于邀请用户与待检测用户存在邀请关系,因此当邀请用户为非正常用户时,邀请用户邀请其他非正常用户共同在上述应用软件中获取应用软件赠送的礼物的概率较高,因此可以认为邀请用户为非正常用户时,待检测用户为非正常用户的概率也较高。另外,由于非正常用户具有与正常用户不同的特征,可以根据用户的特征判断用户是否为非正常用户,由于共用用户与待检测用户之间存在共用关系,说明上述共用用户与待检测用户之间具有相似的特征,因此共用用户为非正常用户时,待检测用户为非正常用户的概率也较高。上述方法使用了待检测用户与其他已注册用户之间的邀请关系、共用关系作为用户检测的检测依据,该方案中待检测用户为非正常用户的概率受到邀请用户与共用用户的影响,增加了检测待检测用户是否为非正常用户的检测依据,从而提高用户检测的准确度。
参见图10,本发明实施例提供了第三种用户检测装置的结构示意图,与前述图8所示实施例相比,本实施例中上述用户检测模块804,包括:
第一无向图获得子模块804C,用于获得第一无向图,其中,所述第一无向图中包括与每一已注册用户分别一一对应的节点,具有邀请关系的已注册用户对应的节点之间具有无向连接关系;
第二无向图获得子模块804D,用于获得第二无向图,其中,所述第二无向图中包括与每一已注册用户分别一一对应的节点,具有共用关系的已注册用户对应的节点之间具有无向连接关系;
集合更新子模块804E,用于将所述待预测用户的特征更新至包括每一已注册用户的特征的特征集合;
第二用户检测子模块804F,用于将所述第一无向图、第二无向图和所述特征集合输入用户检测图卷积模型,以所述特征集合中各个已注册用户的特征为所述第一无向图、第二无向图中每一已注册用户所对应节点的节点值,通过所述用户检测图卷积模型对所述第一无向图和第二无向图进行图卷积运算,检测所述待检测用户是否为非正常用户。
参见图11,本发明实施例提供了第四种用户检测装置的结构示意图,与前述图10所示实施例相比,本实施例中上述用户检测模块804,还包括:
邀请数量获得子模块804G,用于针对每一已注册用户,获得与该已注册用户存在邀请关系的其他用户的数量,作为邀请数量;
共用数量获得子模块804H,用于针对每一已注册用户,获得与该已注册用户存在共用关系的其他用户的数量,作为共用数量;
所述第二用户检测子模块804F,具体用于:
将所述第一无向图、各个已注册用户的邀请数量、第二无向图、各个已注册用户的共用数量、所述特征集合输入用户检测图卷积模型,以所述特征集合中各个已注册用户的特征为所述第一无向图、第二无向图中每一已注册用户所对应节点的节点值,通过所述用户检测图卷积模型对所述第一无向图和第二无向图进行图卷积运算,在图卷积运算的过程中使用各个已注册用户的邀请数量、各个已注册用户的共用数量在每一次卷积的过程中对卷积处理结果进行归一化处理,检测所述待检测用户是否为非正常用户。
本实施例提供的方案中,上述邀请关系与共用关系分别是使用第一无向图与第二无向图表示的,上述用户检测图卷积模型是用于对图进行处理的模型,因此对无向图具有较好的处理效果。又由于上述用户检测图卷积模型是采用机器学习方式对大量的样本进行学习得到的模型,所以上述模型能够学习到大量样本中的节点特征,从而应用上述用户检测图卷积模型能够实现对待检测用户是否为非正常用户的检测。
本发明的一个实施例中,所述用户检测图卷积模型的输出结果中包括:表示每一已注册用户是否为非正常用户的检测身份;
参见图12,提供了第五种用户检测装置的结构示意图,与前述图10所示实施例相比,本实施例中上述用户检测模块804,还包括:
身份比较子模块804I,用于将已确定身份用户的检测身份与所述已确定身份用户的真实身份进行比较,其中,所述已确定身份用户为:已注册用户中已确定是否为非正常用户的用户;
参数调整子模块804J,用于根据比较结果调整所述用户检测图卷积模型的模型参数;
身份确定子模块804K,用于若调整模型参数后的所述用户检测图卷积模型收敛,将各个已注册用户的检测身份确定为各个已注册用户的真实身份。
由以上可见,本发明实施例提供的方案中,每当使用上述用户检测图卷积模型对待检测用户进行检测时,都会对上述用户检测图卷积模型重新进行训练。由于已注册用户的数量不断增加,因此对上述用户检测图卷积模型进行训练时使用的作为样本的已确认身份用户的数量也不断增加,由于样本的数量越多用户检测图卷积模型学习到的样本的特征越多,获得的用户检测图卷积模型的检测效果越好。因此使用上述方式训练上述用户检测图卷积模型,可以提高上述用户检测图卷积模型的输出结果的准确性。
本发明的一个实施例中,用户的特征包括以下特征中的至少一种:
用户使用所注册应用软件而产生信息;
用户注册所述应用软件而产生的信息;
所述用户使用所述应用软件时应用软件所在的设备的信息;
所述设备所使用网络的信息。
本发明的一个实施例中,所述用户注册所述应用软件而产生的信息,包括:
所述用户注册所述应用软件的时间段和/或所述用户注册所述应用软件时的所在地。
本发明的一个实施例中,所述设备所使用网络的信息,包括:
IP地址和/或WiFi名称。
本发明实施例还提供了一种电子设备,如图13所示,包括处理器1301、通信接口1302、存储器1303和通信总线1304,其中,处理器1301,通信接口1302,存储器1303通过通信总线1304完成相互间的通信,
存储器1303,用于存放计算机程序;
处理器1301,用于执行存储器1303上所存放的程序时,实现上述任一用户检测方法实施例所述的方法步骤。
应用本实施例提供的电子设备检测用户是否为非正常用户时,获得已注册用户中待检测用户的特征;确定与上述待检测用户存在邀请关系的已注册用户,作为邀请用户;确定与上述待检测用户存在共用关系的已注册用户,作为共用用户,其中,上述共用关系表示:用户间具有相同的特征;根据上述邀请用户的特征、上述共用用户的特征和上述待检测用户的特征,检测上述待检测用户是否为非正常用户。由于邀请用户与待检测用户存在邀请关系,因此当邀请用户为非正常用户时,邀请用户邀请其他非正常用户共同在上述应用软件中获取应用软件赠送的礼物的概率较高,因此可以认为邀请用户为非正常用户时,待检测用户为非正常用户的概率也较高。另外,由于非正常用户具有与正常用户不同的特征,可以根据用户的特征判断用户是否为非正常用户,由于共用用户与待检测用户之间存在共用关系,说明上述共用用户与待检测用户之间具有相似的特征,因此共用用户为非正常用户时,待检测用户为非正常用户的概率也较高。上述方法使用了待检测用户与其他已注册用户之间的邀请关系、共用关系作为用户检测的检测依据,该方案中待检测用户为非正常用户的概率受到邀请用户与共用用户的影响,增加了检测待检测用户是否为非正常用户的检测依据,从而提高用户检测的准确度。
上述电子设备提到的通信总线可以是外设部件互连标准(Peripheral ComponentInterconnect,PCI)总线或扩展工业标准结构(Extended IndustryStandardArchitecture,EISA)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示,图中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
通信接口用于上述电子设备与其他设备之间的通信。
存储器可以包括随机存取存储器(RandomAccess Memory,RAM),也可以包括非易失性存储器(Non-Volatile Memory,NVM),例如至少一个磁盘存储器。可选的,存储器还可以是至少一个位于远离前述处理器的存储装置。
上述的处理器可以是通用处理器,包括中央处理器(Central Processing Unit,cPU)、网络处理器(Network Processor,NP)等;还可以是数字信号处理器(Digital SignalProcessing,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
在本发明提供的又一实施例中,还提供了一种计算机可读存储介质,该计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现上述任一用户检测方法实施例所述的方法步骤。
执行应用本实施例提供的计算机可读存储介质中存储的计算机程序检测用户是否为非正常用户时,获得已注册用户中待检测用户的特征;确定与上述待检测用户存在邀请关系的已注册用户,作为邀请用户;确定与上述待检测用户存在共用关系的已注册用户,作为共用用户,其中,上述共用关系表示:用户间具有相同的特征;根据上述邀请用户的特征、上述共用用户的特征和上述待检测用户的特征,检测上述待检测用户是否为非正常用户。由于邀请用户与待检测用户存在邀请关系,因此当邀请用户为非正常用户时,邀请用户邀请其他非正常用户共同在上述应用软件中获取应用软件赠送的礼物的概率较高,因此可以认为邀请用户为非正常用户时,待检测用户为非正常用户的概率也较高。另外,由于非正常用户具有与正常用户不同的特征,可以根据用户的特征判断用户是否为非正常用户,由于共用用户与待检测用户之间存在共用关系,说明上述共用用户与待检测用户之间具有相似的特征,因此共用用户为非正常用户时,待检测用户为非正常用户的概率也较高。上述方法使用了待检测用户与其他已注册用户之间的邀请关系、共用关系作为用户检测的检测依据,该方案中待检测用户为非正常用户的概率受到邀请用户与共用用户的影响,增加了检测待检测用户是否为非正常用户的检测依据,从而提高用户检测的准确度。
在本发明提供的又一实施例中,还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述任一用户检测方法实施例所述的方法步骤。
执行本实施例提供的计算机程序产品检测用户是否为非正常用户时,获得已注册用户中待检测用户的特征;确定与上述待检测用户存在邀请关系的已注册用户,作为邀请用户;确定与上述待检测用户存在共用关系的已注册用户,作为共用用户,其中,上述共用关系表示:用户间具有相同的特征;根据上述邀请用户的特征、上述共用用户的特征和上述待检测用户的特征,检测上述待检测用户是否为非正常用户。由于邀请用户与待检测用户存在邀请关系,因此当邀请用户为非正常用户时,邀请用户邀请其他非正常用户共同在上述应用软件中获取应用软件赠送的礼物的概率较高,因此可以认为邀请用户为非正常用户时,待检测用户为非正常用户的概率也较高。另外,由于非正常用户具有与正常用户不同的特征,可以根据用户的特征判断用户是否为非正常用户,由于共用用户与待检测用户之间存在共用关系,说明上述共用用户与待检测用户之间具有相似的特征,因此共用用户为非正常用户时,待检测用户为非正常用户的概率也较高。上述方法使用了待检测用户与其他已注册用户之间的邀请关系、共用关系作为用户检测的检测依据,该方案中待检测用户为非正常用户的概率受到邀请用户与共用用户的影响,增加了检测待检测用户是否为非正常用户的检测依据,从而提高用户检测的准确度。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本发明实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质(例如固态硬盘Solid State Disk(SSD))等。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本说明书中的各个实施例均采用相关的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置、电子设备、计算机可读存储介质和计算机程序产品而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本发明的保护范围内。

Claims (20)

1.一种用户检测方法,其特征在于,所述方法包括:
获得已注册用户中待检测用户的特征;
确定与所述待检测用户存在邀请关系的已注册用户,作为邀请用户;
确定与所述待检测用户存在共用关系的已注册用户,作为共用用户,其中,所述共用关系表示:用户间具有相同的特征;
根据所述邀请用户的特征、所述共用用户的特征和所述待检测用户的特征,检测所述待检测用户是否为非正常用户。
2.根据权利要求1所述的方法,其特征在于,所述根据所述邀请用户的特征、所述共用用户的特征和所述待检测用户的特征,检测所述待检测用户是否为非正常用户,包括:
获得根据关系用户的特征预测得到的表示所述关系用户为非正常用户的第一概率,其中,所述关系用户包括:所述邀请用户和共用用户;
根据所述待检测用户的特征预测所述待检测用户为非正常用户的第二概率,根据所获得的第一概率调整所述第二概率,并根据调整后的第二概率检测所述待检测用户是否为非正常用户。
3.根据权利要求2所述的方法,其特征在于,所述根据所获得的第一概率调整所述第二概率,包括:
针对每一第一概率,若所述第二概率高于所述第一概率,则降低所述第二概率,若所述第二概率低于所述第一概率,则提高所述第二概率。
4.根据权利要求1所述的方法,其特征在于,所述根据所述邀请用户的特征、所述共用用户的特征和所述待检测用户的特征,检测所述待检测用户是否为非正常用户,包括:
获得第一无向图,其中,所述第一无向图中包括与每一已注册用户分别一一对应的节点,具有邀请关系的已注册用户对应的节点之间具有无向连接关系;
获得第二无向图,其中,所述第二无向图中包括与每一已注册用户分别一一对应的节点,具有共用关系的已注册用户对应的节点之间具有无向连接关系;
将所述待预测用户的特征更新至包括每一已注册用户的特征的特征集合;
将所述第一无向图、第二无向图和所述特征集合输入用户检测图卷积模型,以所述特征集合中各个已注册用户的特征为所述第一无向图、第二无向图中每一已注册用户所对应节点的节点值,通过所述用户检测图卷积模型对所述第一无向图和第二无向图进行图卷积运算,检测所述待检测用户是否为非正常用户。
5.根据权利要求4所述的方法,其特征在于,在所述将所述第一无向图、第二无向图和所述特征集合输入用户检测图卷积模型,以所述特征集合中各个已注册用户的特征为所述第一无向图、第二无向图中每一已注册用户所对应节点的节点值,通过所述用户检测图卷积模型对所述第一无向图和第二无向图进行图卷积运算,检测所述待检测用户是否为非正常用户之前,还包括:
针对每一已注册用户,获得与该已注册用户存在邀请关系的其他用户的数量,作为邀请数量;
针对每一已注册用户,获得与该已注册用户存在共用关系的其他用户的数量,作为共用数量;
所述将所述第一无向图、第二无向图和所述特征集合输入用户检测图卷积模型,以所述特征集合中各个已注册用户的特征为所述第一无向图、第二无向图中每一已注册用户所对应节点的节点值,通过所述用户检测图卷积模型对所述第一无向图和第二无向图进行图卷积运算,检测所述待检测用户是否为非正常用户,包括:
将所述第一无向图、各个已注册用户的邀请数量、第二无向图、各个已注册用户的共用数量、所述特征集合输入用户检测图卷积模型,以所述特征集合中各个已注册用户的特征为所述第一无向图、第二无向图中每一已注册用户所对应节点的节点值,通过所述用户检测图卷积模型对所述第一无向图和第二无向图进行图卷积运算,在图卷积运算的过程中使用各个已注册用户的邀请数量、各个已注册用户的共用数量在每一次卷积的过程中对卷积处理结果进行归一化处理,检测所述待检测用户是否为非正常用户。
6.根据权利要求4所述的方法,其特征在于,所述用户检测图卷积模型的输出结果中包括:表示每一已注册用户是否为非正常用户的检测身份;
所述方法还包括:
将已确定身份用户的检测身份与所述已确定身份用户的真实身份进行比较,其中,所述已确定身份用户为:已注册用户中已确定是否为非正常用户的用户;
根据比较结果调整所述用户检测图卷积模型的模型参数;
若调整模型参数后的所述用户检测图卷积模型收敛,将各个已注册用户的检测身份确定为各个已注册用户的真实身份。
7.根据权利要求1-6中任一项所述的方法,其特征在于,用户的特征包括以下特征中的至少一种:
用户使用所注册应用软件而产生的信息;
用户注册所述应用软件而产生的信息;
所述用户使用所述应用软件时应用软件所在的设备的信息;
所述设备所使用网络的信息。
8.根据权利要求7所述的方法,其特征在于,所述用户注册所述应用软件而产生的信息,包括:
所述用户注册所述应用软件的时间段和/或所述用户注册所述应用软件时的所在地。
9.根据权利要求7所述的方法,其特征在于,所述设备所使用网络的信息,包括:
IP地址和/或WiFi名称。
10.一种用户检测装置,其特征在于,所述装置包括:
特征获得模块,用于获得已注册用户中待检测用户的特征;
邀请用户确定模块,用于确定与所述待检测用户存在邀请关系的已注册用户,作为邀请用户;
共用用户确定模块,用于确定与所述待检测用户存在共用关系的已注册用户,作为共用用户,其中,所述共用关系表示:用户间具有相同的特征;
用户检测模块,用于根据所述邀请用户的特征、所述共用用户的特征和所述待检测用户的特征,检测所述待检测用户是否为非正常用户。
11.根据权利要求10所述的装置,其特征在于,所述用户检测模块,包括:
概率获得子模块,用于获得根据关系用户的特征预测得到的表示所述关系用户为非正常用户的第一概率,其中,所述关系用户包括:所述邀请用户和共用用户;
第一用户检测子模块,用于根据所述待检测用户的特征预测所述待检测用户为非正常用户的第二概率,根据所获得的第一概率调整所述第二概率,并根据调整后的第二概率检测所述待检测用户是否为非正常用户。
12.根据权利要求11所述的装置,其特征在于,所述第一用户检测子模块,具体用于:
根据所述待检测用户的特征预测所述待检测用户为非正常用户的第二概率,针对每一第一概率,若所述第二概率高于所述第一概率,则降低所述第二概率,若所述第二概率低于所述第一概率,则提高所述第二概率。
13.根据权利要求10所述的装置,其特征在于,所述用户检测模块,包括:
第一无向图获得子模块,用于获得第一无向图,其中,所述第一无向图中包括与每一已注册用户分别一一对应的节点,具有邀请关系的已注册用户对应的节点之间具有无向连接关系;
第二无向图获得子模块,用于获得第二无向图,其中,所述第二无向图中包括与每一已注册用户分别一一对应的节点,具有共用关系的已注册用户对应的节点之间具有无向连接关系;
集合更新子模块,用于将所述待预测用户的特征更新至包括每一已注册用户的特征的特征集合;
第二用户检测子模块,用于将所述第一无向图、第二无向图和所述特征集合输入用户检测图卷积模型,以所述特征集合中各个已注册用户的特征为所述第一无向图、第二无向图中每一已注册用户所对应节点的节点值,通过所述用户检测图卷积模型对所述第一无向图和第二无向图进行图卷积运算,检测所述待检测用户是否为非正常用户。
14.根据权利要求13所述的装置,其特征在于,所述用户检测模块,还包括:
邀请数量获得子模块,用于针对每一已注册用户,获得与该已注册用户存在邀请关系的其他用户的数量,作为邀请数量;
共用数量获得子模块,用于针对每一已注册用户,获得与该已注册用户存在共用关系的其他用户的数量,作为共用数量;
所述第二用户检测子模块,具体用于:
将所述第一无向图、各个已注册用户的邀请数量、第二无向图、各个已注册用户的共用数量、所述特征集合输入用户检测图卷积模型,以所述特征集合中各个已注册用户的特征为所述第一无向图、第二无向图中每一已注册用户所对应节点的节点值,通过所述用户检测图卷积模型对所述第一无向图和第二无向图进行图卷积运算,在图卷积运算的过程中使用各个已注册用户的邀请数量、各个已注册用户的共用数量在每一次卷积的过程中对卷积处理结果进行归一化处理,检测所述待检测用户是否为非正常用户。
15.根据权利要求13所述的装置,其特征在于,所述用户检测图卷积模型的输出结果中包括:表示每一已注册用户是否为非正常用户的检测身份;
所述用户检测模块还包括:
身份比较子模块,用于将已确定身份用户的检测身份与所述已确定身份用户的真实身份进行比较,其中,所述已确定身份用户为:已注册用户中已确定是否为非正常用户的用户;
参数调整子模块,用于根据比较结果调整所述用户检测图卷积模型的模型参数;
身份确定子模块,用于若调整模型参数后的所述用户检测图卷积模型收敛,将各个已注册用户的检测身份确定为各个已注册用户的真实身份。
16.根据权利要求10-15中任一项所述的装置,其特征在于,用户的特征包括以下特征中的至少一种:
用户使用所注册应用软件而产生的信息;
用户注册所述应用软件而产生的信息;
所述用户使用所述应用软件时应用软件所在的设备的信息;
所述设备所使用网络的信息。
17.根据权利要求16所述的装置,其特征在于,所述用户注册所述应用软件而产生的信息,包括:
所述用户注册所述应用软件的时间段和/或所述用户注册所述应用软件时的所在地。
18.根据权利要求16所述的装置,其特征在于,所述设备所使用网络的信息,包括:
IP地址和/或WiFi名称。
19.一种电子设备,其特征在于,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的程序时,实现权利要求1-9任一所述的方法步骤。
20.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现权利要求1-9任一所述的方法步骤。
CN202010154951.XA 2020-03-06 2020-03-06 一种用户检测方法及装置 Pending CN111400678A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010154951.XA CN111400678A (zh) 2020-03-06 2020-03-06 一种用户检测方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010154951.XA CN111400678A (zh) 2020-03-06 2020-03-06 一种用户检测方法及装置

Publications (1)

Publication Number Publication Date
CN111400678A true CN111400678A (zh) 2020-07-10

Family

ID=71428581

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010154951.XA Pending CN111400678A (zh) 2020-03-06 2020-03-06 一种用户检测方法及装置

Country Status (1)

Country Link
CN (1) CN111400678A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113596806A (zh) * 2021-07-09 2021-11-02 北京达佳互联信息技术有限公司 终端来源的确定方法、装置、电子设备和存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8639629B1 (en) * 2005-02-02 2014-01-28 Nexus Payments, LLC System and method for accessing an online user account registry via a thin-client unique user code
CN107135195A (zh) * 2017-02-20 2017-09-05 平安科技(深圳)有限公司 异常用户账号的检测方法和装置
CN109409918A (zh) * 2018-08-24 2019-03-01 深圳壹账通智能科技有限公司 基于用户行为的羊毛党识别方法、装置、设备及存储介质
CN109558951A (zh) * 2018-11-23 2019-04-02 北京知道创宇信息技术有限公司 一种欺诈账号检测方法、装置及其存储介质
CN110135681A (zh) * 2019-04-03 2019-08-16 平安科技(深圳)有限公司 风险用户识别方法、装置、可读存储介质及终端设备

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8639629B1 (en) * 2005-02-02 2014-01-28 Nexus Payments, LLC System and method for accessing an online user account registry via a thin-client unique user code
CN107135195A (zh) * 2017-02-20 2017-09-05 平安科技(深圳)有限公司 异常用户账号的检测方法和装置
CN109409918A (zh) * 2018-08-24 2019-03-01 深圳壹账通智能科技有限公司 基于用户行为的羊毛党识别方法、装置、设备及存储介质
CN109558951A (zh) * 2018-11-23 2019-04-02 北京知道创宇信息技术有限公司 一种欺诈账号检测方法、装置及其存储介质
CN110135681A (zh) * 2019-04-03 2019-08-16 平安科技(深圳)有限公司 风险用户识别方法、装置、可读存储介质及终端设备

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113596806A (zh) * 2021-07-09 2021-11-02 北京达佳互联信息技术有限公司 终端来源的确定方法、装置、电子设备和存储介质
CN113596806B (zh) * 2021-07-09 2022-10-28 北京达佳互联信息技术有限公司 终端来源的确定方法、装置、电子设备和存储介质

Similar Documents

Publication Publication Date Title
US11531867B2 (en) User behavior prediction method and apparatus, and behavior prediction model training method and apparatus
CN108921206B (zh) 一种图像分类方法、装置、电子设备及存储介质
WO2020239015A1 (zh) 一种图像识别、分类方法、装置、电子设备及存储介质
CN109413175B (zh) 一种信息处理方法、装置及电子设备
WO2014193399A1 (en) Influence score of a brand
CN108989889B (zh) 一种视频播放量预测方法、装置及电子设备
CN107305611B (zh) 恶意账号对应的模型建立方法和装置、恶意账号识别的方法和装置
CN111080360B (zh) 行为预测方法、模型训练方法、装置、服务器及存储介质
CN109165691B (zh) 用于识别作弊用户的模型的训练方法、装置及电子设备
CN111797320B (zh) 数据处理方法、装置、设备及存储介质
US11334758B2 (en) Method and apparatus of data processing using multiple types of non-linear combination processing
CN110162692B (zh) 用户标签确定方法、装置、计算机设备和存储介质
CN111324764A (zh) 一种图像检测方法、装置、电子设备及存储介质
CN112669078A (zh) 一种行为预测模型训练方法、装置、设备及存储介质
CN112365007B (zh) 模型参数确定方法、装置、设备及存储介质
CN108764348B (zh) 基于多个数据源的数据采集方法及系统
CN111159481B (zh) 图数据的边预测方法、装置及终端设备
CN107784511A (zh) 一种用户流失预测方法及装置
CN108768743A (zh) 一种用户识别方法、装置及服务器
CN111400678A (zh) 一种用户检测方法及装置
CN111400677A (zh) 一种用户检测方法及装置
CN111565065B (zh) 一种无人机基站部署方法、装置及电子设备
CN111404835A (zh) 流量控制方法、装置、设备及存储介质
CN113434436B (zh) 测试用例的生成方法、装置、电子设备及存储介质
CN111814051B (zh) 一种资源类型确定方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination