CN112329811A - 异常账号识别方法、装置、计算机设备和存储介质 - Google Patents

异常账号识别方法、装置、计算机设备和存储介质 Download PDF

Info

Publication number
CN112329811A
CN112329811A CN202011047455.0A CN202011047455A CN112329811A CN 112329811 A CN112329811 A CN 112329811A CN 202011047455 A CN202011047455 A CN 202011047455A CN 112329811 A CN112329811 A CN 112329811A
Authority
CN
China
Prior art keywords
user
user account
account
determining
preset rule
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011047455.0A
Other languages
English (en)
Inventor
陶学诚
彭佳铭
李志梁
左伟健
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou Sanqi Network Technology Co ltd
Original Assignee
Guangzhou Sanqi Network Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou Sanqi Network Technology Co ltd filed Critical Guangzhou Sanqi Network Technology Co ltd
Publication of CN112329811A publication Critical patent/CN112329811A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • AHUMAN NECESSITIES
    • A63SPORTS; GAMES; AMUSEMENTS
    • A63FCARD, BOARD, OR ROULETTE GAMES; INDOOR GAMES USING SMALL MOVING PLAYING BODIES; VIDEO GAMES; GAMES NOT OTHERWISE PROVIDED FOR
    • A63F13/00Video games, i.e. games using an electronically generated display having two or more dimensions
    • A63F13/70Game security or game management aspects
    • A63F13/79Game security or game management aspects involving player-related data, e.g. identities, accounts, preferences or play histories
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/25Integrating or interfacing systems involving database management systems
    • G06F16/252Integrating or interfacing systems involving database management systems between a Database Management System and a front-end application
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Computation (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Multimedia (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Business, Economics & Management (AREA)
  • Computer Security & Cryptography (AREA)
  • General Business, Economics & Management (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请涉及计算机技术领域,具体涉及一种异常账号识别方法、装置、计算机设备和存储介质。所述方法包括:获取满足第一预设规则的第一用户账号的用户画像数据;根据用户画像数据和训练好的聚类模型从第一用户账号中确定出满足第二预设规则的第二用户账号;获取第二用户账号的用户设备数据;根据用户设备数据和训练好的分类模型从第二用户账号中确定出满足第三预设规则的第三用户账号,将第三用户账号确定为异常账号。本发明实施例能够及时、准确地识别出游戏中可能存在批量刷号行为的异常用户。

Description

异常账号识别方法、装置、计算机设备和存储介质
技术领域
本申请涉及计算机技术领域,特别是涉及一种异常账号识别方法、装置、计算机设备和存储介质。
背景技术
随着游戏行业的不断发展,一些不法的黑产为了获利逐步产生。黑产团伙一种不法获利手段是批量刷号,即使用模拟器或者群控系统等手段批量注册游戏账号,通过批量注册的游戏账号囤积游戏道具或者游戏货币等,再通过交易囤积的游戏道具或者游戏货币进行获利。
传统的识别黑产的游戏账号的方式主要是监控游戏账号的行为,当监控到游戏账号有出现异常行为时,监控系统就将其识别为异常账号并采取相应措施。然而,黑产的游戏账号刚开始可能会一直潜伏,在一段时间内的行为可能没有表现出很明显的异常特征,当出现获利机会时才会迅速作案并在获利后消失,对于这类黑产作案模式传统的方法存在滞后性,无法及时准确地识别出可能会进行异常行为的异常账号以阻止其作案,这会给游戏厂商和正常的游戏玩家带来损失。
发明内容
本发明针对现有技术的缺点,提供了一种异常账号识别方法、装置、计算机设备和存储介质,本发明实施例能够及时、准确地识别出游戏中可能存在批量刷号行为的异常用户。
本发明根据第一方面提供了一种异常账号识别方法,在一个实施例中,该方法包括:
获取满足第一预设规则的第一用户账号的用户画像数据;
根据用户画像数据和训练好的聚类模型从第一用户账号中确定出满足第二预设规则的第二用户账号;
获取第二用户账号的用户设备数据;
根据用户设备数据和训练好的分类模型从第二用户账号中确定出满足第三预设规则的第三用户账号,将第三用户账号确定为异常账号。
在一个实施例中,第一用户账号包括满足第一预设规则的多个用户账号;第二用户账号包括第一用户账号中满足第二预设规则的多个用户账号;第三用户账号包括第二用户账号中满足第三预设规则的多个用户账号。
在一个实施例中,获取满足第一预设规则的第一用户账号的用户画像数据的步骤,包括:
确定满足第一预设规则的第一用户账号;
获取第一用户账号的用户画像数据。
在一个实施例中,确定满足第一预设规则的第一用户账号的步骤,包括:
将目标游戏的所有用户账号中,在预设时间区间内对应有游戏登录记录的用户账号确定为第一用户账号;
或,将目标游戏的任一渠道的所有用户账号中,在预设时间区间内对应有游戏登录记录的用户账号确定为第一用户账号。
在一个实施例中,根据用户画像数据和训练好的聚类模型从第一用户账号中确定出满足第二预设规则的第二用户账号的步骤,包括:
根据用户画像数据和训练好的聚类模型将第一用户账号包括的多个用户账号划分为多个类别;
确定各个类别对应的类内成员数量,将对应的类内成员数量大于第一预设阈值的类别确定为目标类别;
将目标类别对应的用户账号确定为第二用户账号。
在一个实施例中,根据用户设备数据和训练好的分类模型从第二用户账号中确定出满足第三预设规则的第三用户账号的步骤,包括:
对用户设备数据进行特征化处理,得到用户设备特征;
根据用户设备特征和训练好的分类模型确定第二用户账号包括的各个用户账号对应的预测概率值;
将第二用户账号包括的多个用户账号中,预测概率值大于第二预设阈值的用户账号确定为第三用户账号。
在一个实施例中,用户设备数据指第二用户账号包括的多个用户账号各自对应的设备数据。获取第二用户账号的用户设备数据的步骤,包括:
确定第二用户账号包括的多个用户账号各自对应的距离当前时间最近的游戏登录记录;
根据第二用户账号包括的多个用户账号各自对应的游戏登录记录,获取第二用户账号包括的多个用户账号各自对应的设备数据。
本发明根据第二方面提供了一种异常账号识别装置,在一个实施例中,该装置包括:
用户画像数据获取模块,用于获取满足第一预设规则的第一用户账号的用户画像数据;
第二用户账号确定模块,用于根据用户画像数据和训练好的聚类模型从第一用户账号中确定出满足第二预设规则的第二用户账号;
用户设备数据获取模块,用于获取第二用户账号的用户设备数据;
异常账号确定模块,用于根据用户设备数据和训练好的分类模型从第二用户账号中确定出满足第三预设规则的第三用户账号,将第三用户账号确定为异常账号。
本发明根据第三方面提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现上述任一方法的实施例的步骤。
本发明根据第四方面提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述任一方法的实施例的步骤。
在本发明实施例中,通过获取游戏中满足第一预设规则的第一用户账号的用户画像数据,先根据用户画像数据和训练好的聚类模型从第一用户账号中确定出满足第二预设规则的第二用户账号,再获取第二用户账号的用户设备数据,并根据获取的用户设备数据和训练好的分类模型从第二用户账号中确定出满足第三预设规则的第三用户账号,确定出的第三用户账号即为异常账号,能够实现及时、准确地识别出游戏中可能存在批量刷号行为的异常用户。
附图说明
图1为一个实施例中一种异常账号识别方法的流程示意图;
图2为一个实施例中确定出第二用户账号的流程示意图;
图3为一个实施例中确定出第三用户账号的流程示意图;
图4为一个实施例中获取用户设备数据的流程示意图;
图5为一个实施例中一种异常账号识别装置的结构框图;
图6为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅用以解释本申请,并不用于限定本申请。
本发明提供了一种异常账号识别方法。在一个实施例中,如图1所示,该方法包括以下步骤:
S110:获取满足第一预设规则的第一用户账号的用户画像数据。
在本实施例中,可以通过监控服务器来实现该异常账号识别方法,其中,监控服务器可以由单独服务器来实现,也可以由多个服务器构成的服务器集群来实现。在一个场景中,监控服务器可以每天都对游戏的所有游戏玩家(即所有的用户账号)进行识别,当然,识别频率可以根据具体场景的需要进行设置,比如,一天一次、一天两次、几天一次等。
监控服务器开始识别游戏内的异常账号时,获取满足第一预设规则的第一用户账号的用户画像数据。其中,第一用户账号是指满足第一预设规则的所有用户账号,具体包括多个用户账号(用户账号可以是游戏账号ID)。用户画像数据是指第一用户账户包括的多个用户账号各自对应的用户画像信息。用户账号对应的用户画像信息包括用户的属性数据(比如,用户的充值记录、支付偏好、来源的渠道ID、注册时间、游戏道具信息(如道具种类/数量)等)、行为数据(比如,游戏登录数据(如登录频率、登录时间、登录地点等)、关联的游戏账号数量(具有相同注册手机号或邮箱的游戏账号数量,游戏账号可以包括注册于本游戏的账号以及注册于其他游戏的账号)、游戏时长等)、设备数据(比如,设备机型、操作系统版本、设备识别码等)等。
S120:根据用户画像数据和训练好的聚类模型从第一用户账号中确定出满足第二预设规则的第二用户账号。
在本实施例中,第二用户账号是指第一用户账号包括的多个用户账号中满足第二预设规则的所有用户账号,具体包括多个用户账号。
本实施例选用聚类模型主要是考虑到批量刷号行为所存在的行为特点,即黑产在进行批量刷号行为时,会集中地批量地生产用户账号,由于这些用户账号是集中生产的,所以这些用户账号之间具备相似性以及高趋同性,这特点符合聚类算法的特性。
进一步地,聚类模型可以选用无监督的聚类算法来实现,比如选用K-Means(指K均值聚类算法,k-means clustering algorithm)、Mean-Shift(均值偏移)或DBSCAN(Density-Based Spatial Clustering ofApplications with Noise,具有噪声的基于密度的聚类方法)等聚类算法来实现。具体地,选用无监督的聚类算法的原因在于,考虑到判断一个用户账号是否属于异常账号,通常而言是一个典型的二分类问题,而分类模型属于有监督学习,这需要提前拥有具有正常的或异常的用户标签的样本数据集,而样本数据的标签往往需要预先让大量人工对样本数据进行判断并基于判断结果为样本数据进行标注(即为样本数据添加标签),人工标注的方式需要耗费大量人工成本,而采用无监督学习算法可以从一堆没有标注的数据中找到样本之间的共性进行聚类,这能够大大减少人工成本的花费。
S130:获取第二用户账号的用户设备数据。
在本实施例中,用户设备数据是指第二用户账号包括的多个用户账号各自对应的设备数据,即第二用户账号包括的各个用户账号对应的设备数据。
S140:根据用户设备数据和训练好的分类模型从第二用户账号中确定出满足第三预设规则的第三用户账号,将第三用户账号确定为异常账号。
在本实施例中,监控服务器在获得第二用户账号的用户设备数据之后,根据该用户设备数据和预先训练好的分类模型从第二用户账号包括的多个用户账号中确定出满足第三预设规则的第三用户账号,并将该第三用户账号识别为异常账号。其中,第三用户账号是指第二用户账号包括的多个用户账号中满足第三预设规则的所有用户账号,具体包括多个用户账号。分类模型可以采用LightGBM(英文全称为Light Gradient BoostingMachine,一款基于决策树算法的分布式梯度提升框架)来实现。
本实施例首先从用户属性和用户行为出发,基于第一用户账号的用户画像数据进行聚类,基于聚类结果从第一用户账号包括的多个用户账号中过滤得到第二用户账号,接着获取第二用户账号的用户设备数据,最后根据第二用户账号的用户设备数据对第二用户账号进行分类,从第二用户账号包括的多个用户账号中分类得到第三用户账号,即最终识别出的异常账号,本实施例先基于用户画像数据对相关用户账号(即第一用户账号)进行聚类以确定出可能存在批量刷号行为的可疑用户账号(即第二用户账号),再基于用户设备数据对确定出来的可疑用户账号进行分类以确定出异常账号(即第三用户账号),以此实现及时准确地识别出游戏中可能存在批量刷号行为的用户账号。
在一个实施例中,获取满足第一预设规则的第一用户账号的用户画像数据的步骤,包括:
确定满足第一预设规则的第一用户账号;
获取第一用户账号的用户画像数据。
在本实施例中,监控服务器获取第一用户账号的用户画像数据时,具体是先确定满足第一预设规则的第一用户账号,再获取第一用户账号的用户画像数据。具体地,用户画像数据是指第一用户账户包括的多个用户账号各自对应的用户画像信息,因此监控服务器在获取第一用户账号的用户画像数据时,获取第一用户账号所包括的各个用户账号对应的用户画像信息,可以通过各个用户账号从相关数据库或Hive(即基于Hadoop的一个数据仓库工具)中提取对应的用户画像信息。
进一步地,在一个实施例中,确定满足第一预设规则的第一用户账号的步骤,包括:
将目标游戏的所有用户账号中,在预设时间区间内对应有游戏登录记录的用户账号确定为第一用户账号;
或,将目标游戏的任一渠道的所有用户账号中,在预设时间区间内对应有游戏登录记录的用户账号确定为第一用户账号。
在本实施例中,目标游戏是指要进行识别的游戏,比如现在想要识别游戏A的用户账号中是否存在异常账号,那么游戏A就是目标游戏。
在一个实施方式中,如果目标游戏的用户账号的数量不多,那么在识别时可以将目标游戏的所有用户账号中,在预设时间区间内登录过游戏的用户账号都确定为第一用户账号,并进行后续的处理。
在另一实施方式中,如果目标游戏的用户账号的数量很多,一次性对所有用户账号进行识别会为监控服务器带来很大计算负荷。进一步地,考虑到游戏厂商在发行游戏时会与多个联运商(如小米公司、OPPO公司、华为公司等)进行合作(不同联运商以不同的渠道ID进行区分),而不同的渠道下的用户本身已经具备了不同的属性(比如支付习惯不同、游戏活跃度不同等),因此本实施方式中,监控服务器对目标游戏进行识别时分别对每个渠道下的用户账号进行识别,即将目标游戏的任一渠道的所有用户账号中,在预设时间区间内对应有游戏登录记录的用户账号确定为第一用户账号,这样处理一方面可以减少进行聚类时的计算复杂度,减少给监控服务器带来的计算负荷,一方面可以提高聚类的准确性。
进一步地,上述的预设时间区间可以用于确定目标游戏或者目标游戏的任一渠道的用户账号中哪些是要进行识别的对象,其可根据监控服务器进行识别的时间(比如可以是进行识别的日期、时间点等)和预设规则来确定出来。其中,预设规则可以根据具体场景的需要进行配置,示例性地,可以配置为:将监控服务器进行识别的日期(或时间点)之前的一段时间确定为预设时间区间,比如将监控服务器进行识别的日期之前的一天(也可以是两天、三天或一周等)确定为预设时间区间,将监控服务器进行识别的时间点之前24小时确定为预设时间区间。在一个实施方式中,可以将监控服务器的识别频率设置为一天一次,将该预设规则配置为将监控服务器进行识别的日期之前的一天确定为预设时间区间,即监控服务器每天都对目标游戏中所有前一天登录过游戏的用户账号或者任一渠道中所有前一天登录过游戏的用户账号进行识别,监控服务器每天都进行一次识别可以实现对游戏中的用户账号进行高度监控,保证能够及时识别出异常账号,最大化降低异常账号会造成的影响,而在识别时将前一天没有登录过游戏的用户账号过滤掉,不将其作为进行识别的对象,可以减少监控服务器的计算负荷,由于不登录游戏的用户账户不会对游戏生态造成影响,因此不将其作为进行识别的对象并不会影响到识别结果。
在一个实施例中,如图2所示,步骤S120,即根据用户画像数据和训练好的聚类模型从第一用户账号中确定出满足第二预设规则的第二用户账号,包括:
S121:根据用户画像数据和训练好的聚类模型将第一用户账号包括的多个用户账号划分为多个类别。
S122:确定各个类别对应的类内成员数量,将对应的类内成员数量大于第一预设阈值的类别确定为目标类别。
S123:将目标类别对应的用户账号确定为第二用户账号。
在本实施例中,监控服务器进行聚类处理以确定出第一用户账号中的第二用户账号时,首先需要根据用户画像数据和训练好的聚类模型将第一用户账号包括的多个用户账号划分为多个类别。具体地,在一个实施方式中,监控服务器在获得用户画像数据之后,对其进行数据清洗和预处理(比如,包括数据格式的转换、缺失值的处理等处理);完成数据清洗和预处理之后,将处理后的用户画像数据进行分析以提取相关特征,具体可以是对数据进行可视化分析、查看分布、判断是否有离群点以及为类别进行编码等分析处理以提取到特征,示例性地,以支付偏好为例进行说明,在对相关支付数据经过one-hot(一种文本特征特征提取的方法)编码后可能会得到诸如“微信支付”、“支付宝支付”和“第三方支付”等几个二值化特征(取值为0或1);在经过上述分析处理提取到特征后,再将获得的特征进行稀疏数据标准化处理后输入到聚类模型中以通过聚类模型进行聚类,即根据游戏玩家(即用户账号)之间的相似性将其划分为若干个类别,每个类别下都会有一定数量的成员(即用户账号)。
接着,监控服务器确定出各个类别对应的类内成员数量(类别对应的类内成员数量是指类别中的用户账号的数量),然后将各个类别对应的类内成员数量与第一预设阈值(第一预设阈值可以基于具体场景的需要进行配置)进行对比,假如类别对应的类内成员数量不大于第一预设阈值,那么将该类别以及该类别下的所有用户账号去除。保留下来的类别即为目标类别,目标类别的数量可能是一个或多个,所有目标类别对应的所有用户账号即为第二用户账号。这么处理主要也是考虑到批量刷号行为的行为特点,因为批量注册的用户账号的数量很多,这些用户账号一旦被聚成若干类别,这些类别下的成员数量应该是比较多的,基于此即认为类内成员数量较少的类别是属于正常的类别,可以将其过滤掉,不继续对其进行后续的分类处理,这样一方面可以减少后续执行分类处理时监控服务器的计算负荷,另一方面有利于降低识别的误封禁率(说明一:实际测试的误封禁率可以为0.008%;说明二:假如用户账号被识别为异常账号,通常会将该用户账号进行封禁处理,因而误封禁是指将正常的用户账号识别为异常账号),既能够打击黑产刷号行为、维护游戏内生态平衡,又能够保护游戏内的正常用户,为其提供良好的游戏环境。
在一个实施例中,如图3所示,步骤S140,即根据用户设备数据和训练好的分类模型从第二用户账号中确定出满足第三预设规则的第三用户账号,包括:
S141:对用户设备数据进行特征化处理,得到用户设备特征。
S142:根据用户设备特征和训练好的分类模型确定第二用户账号包括的各个用户账号对应的预测概率值。
S143:将第二用户账号包括的多个用户账号中,预测概率值大于第二预设阈值的用户账号确定为第三用户账号。
在本实施例中,监控服务器在执行完上述实施例所述聚类处理之后,对经聚类处理所确定出来的可疑用户账号即第二用户账号进行分类处理,即监控服务器获取第二用户账号的用户设备数据,并根据该用户设备数据和训练好的分类模型从第二用户账号中确定出满足第三预设规则的第三用户账号。
具体地,监控服务器会对获取的用户设备数据进行特征化处理,特征化处理的过程就是对原始的用户设备数据进行数据清洗、分析和提取相关特征的过程,特征化处理后得到的是特征,即用户设备特征,用户设备特征是第二用户账号包括的各个用户账号对应的设备特征,设备特征包括多个特征。将特征化处理后得到的用户设备特征输入到预先训练好的基于设备的分类模型中,进而得到各个用户账号对应的预测概率值(指预设区间时间内最近登录了用户账号的登录设备所对应的预设概率值)。在一个实施方式中,分类模型可以是SVM(Support Vector Machine,支持向量机)、Random Forest(随机森林)和Adaboost(英文全称Adaptive Boosting,一种迭代算法)中一种或多种的模型融合,分类模型会对每个用户账户对应的登录设备进行识别,并给出预测的概率值(即用户账号对应的预测概率值)作为其对应的设备风险度,预测得到的概率值越大表征这个登录设备的风险程度越高。
接着,监控服务器将第二用户账号包括的各个用户账号对应的预测概率值与第二预设阈值进行对比,并在对比之后将第二用户账号中对应的预测概率值大于第二预设阈值的用户账号打上相应标签以识别为异常账号。其中,第二预设阈值可以基于具体场景的需要进行配置,比如,一些场景中为了进一步保证较低的误封禁率可以适当提高第二预设阈值,而一些场景中为了加大对异常账号的打击力度可以适当降低第二预设阈值。
进一步地,提高第二预设阈值可能会遗漏掉一些异常账号。因此,对于第二用户账号中对应的预测概率值不大于第二预设阈值的用户账号(以下称这类用户账号为疑似账号),可以进一步对其应用业务策略。示例性地,可以获取各个疑似账号关联的游戏账号数量,假如游戏账号数量超过第三预设阈值(可以根据具体场景进行配置,比如配置为10个),则将其也作为异常账号。
在一个实施例中,如图4所示,步骤S130,即获取第二用户账号的用户设备数据,包括:
S131:确定第二用户账号包括的多个用户账号各自对应的距离当前时间最近的游戏登录记录。
S132:根据第二用户账号包括的多个用户账号各自对应的游戏登录记录,获取第二用户账号包括的多个用户账号各自对应的设备数据。
在本实施例中,游戏系统在游戏玩家每次登录用户账号时都会记录其游戏登录记录,其中,游戏登录记录是指用户账号的登录信息,比如包括有用户账号的登录时间、登录设备等信息。游戏玩家可能会在不同的设备上登录用户账号,甚至有可能在预设时间区间内,比如一天内在不同设备上登录了用户账号,此时监控服务器会获取该用户账号对应的距离当前时间最近的游戏登录记录,以确定其最近一次登录所使用的登录设备,进而通过确定出的该登录设备的设备ID来提取对应的设备数据。
基于相同的发明构思,本发明还提供了一种异常账号识别装置。在一个实施例中,如图5所示,该异常账号识别装置包括以下模块:
用户画像数据获取模块110,用于获取满足第一预设规则的第一用户账号的用户画像数据;
第二用户账号确定模块120,用于根据用户画像数据和训练好的聚类模型从第一用户账号中确定出满足第二预设规则的第二用户账号;
用户设备数据获取模块130,用于获取第二用户账号的用户设备数据;
异常账号确定模块140,用于根据用户设备数据和训练好的分类模型从第二用户账号中确定出满足第三预设规则的第三用户账号,将第三用户账号确定为异常账号。
在一个实施例中,第一用户账号包括满足第一预设规则的多个用户账号;第二用户账号包括第一用户账号中满足第二预设规则的多个用户账号;第三用户账号包括第二用户账号中满足第三预设规则的多个用户账号。
在一个实施例中,用户画像数据获取模块,包括:
第一用户账号确定子模块,用于确定满足第一预设规则的第一用户账号;
用户画像数据获取子模块,用于获取第一用户账号的用户画像数据。
在一个实施例中,第一用户账号确定子模块,具体用于将目标游戏的所有用户账号中,在预设时间区间内对应有游戏登录记录的用户账号确定为第一用户账号。
在另一个实施例中,第一用户账号确定子模块,具体用于将目标游戏的任一渠道的所有用户账号中,在预设时间区间内对应有游戏登录记录的用户账号确定为第一用户账号。
在一个实施例中,第二用户账号确定模块,包括:
类别划分子模块,用于根据用户画像数据和训练好的聚类模型将第一用户账号包括的多个用户账号划分为多个类别;
目标类型确定子模块,用于确定各个类别对应的类内成员数量,将对应的类内成员数量大于第一预设阈值的类别确定为目标类别;
第二用户账号确定子模块,用于将目标类别对应的用户账号确定为第二用户账号。
在一个实施例中,异常账号确定模块,包括:
特征化处理子模块,用于对用户设备数据进行特征化处理,得到用户设备特征;
概率值确定子模块,用于根据用户设备特征和训练好的分类模型确定第二用户账号包括的各个用户账号对应的预测概率值;
第三用户账号确定子模块,用于将第二用户账号包括的多个用户账号中,预测概率值大于第二预设阈值的用户账号确定为第三用户账号。
在一个实施例中,用户设备数据指第二用户账号包括的多个用户账号各自对应的设备数据。用户设备数据获取模块,包括:
游戏登录记录确定子模块,用于确定第二用户账号包括的多个用户账号各自对应的距离当前时间最近的游戏登录记录;
用户设备数据获取子模块,用于根据第二用户账号包括的多个用户账号各自对应的游戏登录记录,获取第二用户账号包括的多个用户账号各自对应的设备数据。
关于异常账号识别装置的具体限定可以参见上文中对于异常账号识别方法的限定,在此不再赘述。上述异常账号识别装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,其内部结构图可以如图6所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储用户画像数据和用户设备数据等数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种异常账号识别方法。
本领域技术人员可以理解,图6中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现以下步骤:
获取满足第一预设规则的第一用户账号的用户画像数据;根据用户画像数据和训练好的聚类模型从第一用户账号中确定出满足第二预设规则的第二用户账号;获取第二用户账号的用户设备数据;根据用户设备数据和训练好的分类模型从第二用户账号中确定出满足第三预设规则的第三用户账号,将第三用户账号确定为异常账号。
在一个实施例中,第一用户账号包括满足第一预设规则的多个用户账号;第二用户账号包括第一用户账号中满足第二预设规则的多个用户账号;第三用户账号包括第二用户账号中满足第三预设规则的多个用户账号。
在一个实施例中,处理器执行计算机程序,实现获取满足第一预设规则的第一用户账号的用户画像数据时,还实现以下步骤:
确定满足第一预设规则的第一用户账号;获取第一用户账号的用户画像数据。
在一个实施例中,处理器执行计算机程序,实现确定满足第一预设规则的第一用户账号时,还实现以下步骤:
将目标游戏的所有用户账号中,在预设时间区间内对应有游戏登录记录的用户账号确定为第一用户账号;或,将目标游戏的任一渠道的所有用户账号中,在预设时间区间内对应有游戏登录记录的用户账号确定为第一用户账号。
在一个实施例中,处理器执行计算机程序,实现根据用户画像数据和训练好的聚类模型从第一用户账号中确定出满足第二预设规则的第二用户账号时,还实现以下步骤:
根据用户画像数据和训练好的聚类模型将第一用户账号包括的多个用户账号划分为多个类别;确定各个类别对应的类内成员数量,将对应的类内成员数量大于第一预设阈值的类别确定为目标类别;将目标类别对应的用户账号确定为第二用户账号。
在一个实施例中,处理器执行计算机程序,实现根据用户设备数据和训练好的分类模型从第二用户账号中确定出满足第三预设规则的第三用户账号时,还实现以下步骤:
对用户设备数据进行特征化处理,得到用户设备特征;根据用户设备特征和训练好的分类模型确定第二用户账号包括的各个用户账号对应的预测概率值;将第二用户账号包括的多个用户账号中,预测概率值大于第二预设阈值的用户账号确定为第三用户账号。
在一个实施例中,用户设备数据指第二用户账号包括的多个用户账号各自对应的设备数据。处理器执行计算机程序,实现获取第二用户账号的用户设备数据时,还实现以下步骤:
确定第二用户账号包括的多个用户账号各自对应的距离当前时间最近的游戏登录记录;根据第二用户账号包括的多个用户账号各自对应的游戏登录记录,获取第二用户账号包括的多个用户账号各自对应的设备数据。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:
获取满足第一预设规则的第一用户账号的用户画像数据;根据用户画像数据和训练好的聚类模型从第一用户账号中确定出满足第二预设规则的第二用户账号;获取第二用户账号的用户设备数据;根据用户设备数据和训练好的分类模型从第二用户账号中确定出满足第三预设规则的第三用户账号,将第三用户账号确定为异常账号。
在一个实施例中,第一用户账号包括满足第一预设规则的多个用户账号;第二用户账号包括第一用户账号中满足第二预设规则的多个用户账号;第三用户账号包括第二用户账号中满足第三预设规则的多个用户账号。
在一个实施例中,计算机程序被处理器执行,获取满足第一预设规则的第一用户账号的用户画像数据时,还实现以下步骤:
确定满足第一预设规则的第一用户账号;获取第一用户账号的用户画像数据。
在一个实施例中,计算机程序被处理器执行,确定满足第一预设规则的第一用户账号时,还实现以下步骤:
将目标游戏的所有用户账号中,在预设时间区间内对应有游戏登录记录的用户账号确定为第一用户账号;或,将目标游戏的任一渠道的所有用户账号中,在预设时间区间内对应有游戏登录记录的用户账号确定为第一用户账号。
在一个实施例中,计算机程序被处理器执行,根据用户画像数据和训练好的聚类模型从第一用户账号中确定出满足第二预设规则的第二用户账号时,还实现以下步骤:
根据用户画像数据和训练好的聚类模型将第一用户账号包括的多个用户账号划分为多个类别;确定各个类别对应的类内成员数量,将对应的类内成员数量大于第一预设阈值的类别确定为目标类别;将目标类别对应的用户账号确定为第二用户账号。
在一个实施例中,计算机程序被处理器执行,根据用户设备数据和训练好的分类模型从第二用户账号中确定出满足第三预设规则的第三用户账号时,还实现以下步骤:
对用户设备数据进行特征化处理,得到用户设备特征;根据用户设备特征和训练好的分类模型确定第二用户账号包括的各个用户账号对应的预测概率值;将第二用户账号包括的多个用户账号中,预测概率值大于第二预设阈值的用户账号确定为第三用户账号。
在一个实施例中,用户设备数据指第二用户账号包括的多个用户账号各自对应的设备数据。计算机程序被处理器执行,获取第二用户账号的用户设备数据时,还实现以下步骤:
确定第二用户账号包括的多个用户账号各自对应的距离当前时间最近的游戏登录记录;根据第二用户账号包括的多个用户账号各自对应的游戏登录记录,获取第二用户账号包括的多个用户账号各自对应的设备数据。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

Claims (10)

1.一种异常账号识别方法,其特征在于,包括:
获取满足第一预设规则的第一用户账号的用户画像数据;
根据所述用户画像数据和训练好的聚类模型从所述第一用户账号中确定出满足第二预设规则的第二用户账号;
获取所述第二用户账号的用户设备数据;
根据所述用户设备数据和训练好的分类模型从所述第二用户账号中确定出满足第三预设规则的第三用户账号,将所述第三用户账号确定为异常账号。
2.如权利要求1所述的异常账号识别方法,其特征在于,
所述第一用户账号包括满足第一预设规则的多个用户账号;
所述第二用户账号包括所述第一用户账号中满足第二预设规则的多个用户账号;
所述第三用户账号包括所述第二用户账号中满足第三预设规则的多个用户账号。
3.如权利要求1所述的异常账号识别方法,其特征在于,
所述获取满足第一预设规则的第一用户账号的用户画像数据的步骤,包括:
确定满足第一预设规则的第一用户账号;
获取所述第一用户账号的用户画像数据。
4.如权利要求3所述的异常账号识别方法,其特征在于,所述确定满足第一预设规则的第一用户账号的步骤,包括:
将目标游戏的所有用户账号中,在预设时间区间内对应有游戏登录记录的用户账号确定为第一用户账号;
或,将目标游戏的任一渠道的所有用户账号中,在预设时间区间内对应有游戏登录记录的用户账号确定为第一用户账号。
5.如权利要求2所述的异常账号识别方法,其特征在于,
所述根据所述用户画像数据和训练好的聚类模型从所述第一用户账号中确定出满足第二预设规则的第二用户账号的步骤,包括:
根据所述用户画像数据和训练好的聚类模型将所述第一用户账号包括的多个用户账号划分为多个类别;
确定各个类别对应的类内成员数量,将对应的类内成员数量大于第一预设阈值的类别确定为目标类别;
将所述目标类别对应的用户账号确定为第二用户账号。
6.如权利要求2所述的异常账号识别方法,其特征在于,
所述根据所述用户设备数据和训练好的分类模型从所述第二用户账号中确定出满足第三预设规则的第三用户账号的步骤,包括:
对所述用户设备数据进行特征化处理,得到用户设备特征;
根据所述用户设备特征和训练好的分类模型确定所述第二用户账号包括的各个用户账号对应的预测概率值;
将所述第二用户账号包括的多个用户账号中,预测概率值大于第二预设阈值的用户账号确定为第三用户账号。
7.如权利要求2所述的异常账号识别方法,其特征在于,
所述用户设备数据指所述第二用户账号包括的多个用户账号各自对应的设备数据;
所述获取所述第二用户账号的用户设备数据的步骤,包括:
确定所述第二用户账号包括的多个用户账号各自对应的距离当前时间最近的游戏登录记录;
根据所述第二用户账号包括的多个用户账号各自对应的所述游戏登录记录,获取所述第二用户账号包括的多个用户账号各自对应的设备数据。
8.一种异常账号识别装置,其特征在于,包括:
用户画像数据获取模块,用于获取满足第一预设规则的第一用户账号的用户画像数据;
第二用户账号确定模块,用于根据所述用户画像数据和训练好的聚类模型从所述第一用户账号中确定出满足第二预设规则的第二用户账号;
用户设备数据获取模块,用于获取所述第二用户账号的用户设备数据;
异常账号确定模块,用于根据所述用户设备数据和训练好的分类模型从所述第二用户账号中确定出满足第三预设规则的第三用户账号,将所述第三用户账号确定为异常账号。
9.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。
CN202011047455.0A 2020-09-18 2020-09-29 异常账号识别方法、装置、计算机设备和存储介质 Pending CN112329811A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN202010986238 2020-09-18
CN2020109862381 2020-09-18

Publications (1)

Publication Number Publication Date
CN112329811A true CN112329811A (zh) 2021-02-05

Family

ID=74313121

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011047455.0A Pending CN112329811A (zh) 2020-09-18 2020-09-29 异常账号识别方法、装置、计算机设备和存储介质

Country Status (1)

Country Link
CN (1) CN112329811A (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113069770A (zh) * 2021-03-29 2021-07-06 广州三七互娱科技有限公司 游戏角色显示方法、装置及电子设备
CN113262497A (zh) * 2021-05-14 2021-08-17 广州三七极耀网络科技有限公司 一种虚拟角色渲染方法、装置、设备及存储介质
CN113350786A (zh) * 2021-05-08 2021-09-07 广州三七极创网络科技有限公司 虚拟角色的皮肤渲染方法、装置及电子设备
CN113421136A (zh) * 2021-08-25 2021-09-21 深圳兆瑞优品科技有限公司 网络购物风控方法、装置及系统
CN113440856A (zh) * 2021-07-15 2021-09-28 网易(杭州)网络有限公司 游戏中异常账号的识别方法、装置、电子设备及存储介质
CN113609236A (zh) * 2021-08-05 2021-11-05 中国联合网络通信集团有限公司 数据处理方法、装置及设备
WO2023010715A1 (zh) * 2021-08-06 2023-02-09 完美世界(北京)软件科技发展有限公司 游戏账号的控制方法、装置及设备
CN115779445A (zh) * 2022-10-19 2023-03-14 广州易幻网络科技有限公司 一种游戏数据异常预警系统、方法、计算机设备及存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105791255A (zh) * 2014-12-23 2016-07-20 阿里巴巴集团控股有限公司 基于账户聚类的计算机风险识别方法及其系统
CN105808988A (zh) * 2014-12-31 2016-07-27 阿里巴巴集团控股有限公司 一种识别异常账户的方法及装置
CN105991620A (zh) * 2015-03-05 2016-10-05 阿里巴巴集团控股有限公司 恶意账户识别方法及装置
CN108462595A (zh) * 2017-02-21 2018-08-28 阿里巴巴集团控股有限公司 账号处理系统及处置窗口期的确定方法、服务器
CN108898418A (zh) * 2018-05-31 2018-11-27 康键信息技术(深圳)有限公司 用户账号检测方法、装置、计算机设备和存储介质

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105791255A (zh) * 2014-12-23 2016-07-20 阿里巴巴集团控股有限公司 基于账户聚类的计算机风险识别方法及其系统
CN105808988A (zh) * 2014-12-31 2016-07-27 阿里巴巴集团控股有限公司 一种识别异常账户的方法及装置
CN105991620A (zh) * 2015-03-05 2016-10-05 阿里巴巴集团控股有限公司 恶意账户识别方法及装置
CN108462595A (zh) * 2017-02-21 2018-08-28 阿里巴巴集团控股有限公司 账号处理系统及处置窗口期的确定方法、服务器
CN108898418A (zh) * 2018-05-31 2018-11-27 康键信息技术(深圳)有限公司 用户账号检测方法、装置、计算机设备和存储介质

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113069770A (zh) * 2021-03-29 2021-07-06 广州三七互娱科技有限公司 游戏角色显示方法、装置及电子设备
CN113350786A (zh) * 2021-05-08 2021-09-07 广州三七极创网络科技有限公司 虚拟角色的皮肤渲染方法、装置及电子设备
CN113262497A (zh) * 2021-05-14 2021-08-17 广州三七极耀网络科技有限公司 一种虚拟角色渲染方法、装置、设备及存储介质
CN113440856A (zh) * 2021-07-15 2021-09-28 网易(杭州)网络有限公司 游戏中异常账号的识别方法、装置、电子设备及存储介质
CN113440856B (zh) * 2021-07-15 2024-02-02 网易(杭州)网络有限公司 游戏中异常账号的识别方法、装置、电子设备及存储介质
CN113609236A (zh) * 2021-08-05 2021-11-05 中国联合网络通信集团有限公司 数据处理方法、装置及设备
CN113609236B (zh) * 2021-08-05 2023-07-18 中国联合网络通信集团有限公司 数据处理方法、装置及设备
WO2023010715A1 (zh) * 2021-08-06 2023-02-09 完美世界(北京)软件科技发展有限公司 游戏账号的控制方法、装置及设备
CN113421136A (zh) * 2021-08-25 2021-09-21 深圳兆瑞优品科技有限公司 网络购物风控方法、装置及系统
CN115779445A (zh) * 2022-10-19 2023-03-14 广州易幻网络科技有限公司 一种游戏数据异常预警系统、方法、计算机设备及存储介质
CN115779445B (zh) * 2022-10-19 2023-06-23 广州易幻网络科技有限公司 一种游戏数据异常预警系统、方法、计算机设备及存储介质

Similar Documents

Publication Publication Date Title
CN112329811A (zh) 异常账号识别方法、装置、计算机设备和存储介质
CN109729383B (zh) 双录视频质量检测方法、装置、计算机设备和存储介质
CN110399925B (zh) 账号的风险识别方法、装置及存储介质
CN108876133B (zh) 基于业务信息的风险评估处理方法、装置、服务器和介质
CN108629413B (zh) 神经网络模型训练、交易行为风险识别方法及装置
CN108366045B (zh) 一种风控评分卡的设置方法和装置
CN109816200B (zh) 任务推送方法、装置、计算机设备和存储介质
CN110008082B (zh) 异常任务智能监测方法、装置、设备及存储介质
CN112837069B (zh) 基于区块链与大数据的安全支付方法及云平台系统
CN109801151B (zh) 财务造假风险监控方法、装置、计算机设备和存储介质
US20170372069A1 (en) Information processing method and server, and computer storage medium
CN113011889B (zh) 账号异常识别方法、系统、装置、设备及介质
CN110674479B (zh) 异常行为数据实时处理方法、装置、设备及存储介质
CN111459922A (zh) 用户识别方法、装置、设备及存储介质
CN112418167A (zh) 图像的聚类方法、装置、设备和存储介质
CN112749973A (zh) 一种权限管理方法、装置和计算机可读存储介质
CN112487284A (zh) 银行客户画像生成方法、设备、存储介质及装置
CN112632609A (zh) 异常检测方法、装置、电子设备及存储介质
CN107871213B (zh) 一种交易行为评价方法、装置、服务器以及存储介质
CN113282421A (zh) 基于人工智能和云计算的业务分析方法及人工智能服务器
CN113065748A (zh) 业务风险评估方法、装置、设备及存储介质
CN114841705B (zh) 一种基于场景识别的反欺诈监测方法
CN114285596B (zh) 基于机器学习的变电站终端账号异常检测方法
CN114154556A (zh) 样本预测模型的训练方法、装置、电子设备及存储介质
CN115438747A (zh) 异常账户识别模型训练方法、装置、设备及介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination