CN113521750B - 异常账号检测模型训练方法和异常账号检测方法 - Google Patents

异常账号检测模型训练方法和异常账号检测方法 Download PDF

Info

Publication number
CN113521750B
CN113521750B CN202110803010.9A CN202110803010A CN113521750B CN 113521750 B CN113521750 B CN 113521750B CN 202110803010 A CN202110803010 A CN 202110803010A CN 113521750 B CN113521750 B CN 113521750B
Authority
CN
China
Prior art keywords
task
route
cluster
abnormal
account
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110803010.9A
Other languages
English (en)
Other versions
CN113521750A (zh
Inventor
黎寅
余赢超
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhuhai Kingsoft Digital Network Technology Co Ltd
Original Assignee
Zhuhai Kingsoft Digital Network Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhuhai Kingsoft Digital Network Technology Co Ltd filed Critical Zhuhai Kingsoft Digital Network Technology Co Ltd
Priority to CN202110803010.9A priority Critical patent/CN113521750B/zh
Publication of CN113521750A publication Critical patent/CN113521750A/zh
Application granted granted Critical
Publication of CN113521750B publication Critical patent/CN113521750B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • AHUMAN NECESSITIES
    • A63SPORTS; GAMES; AMUSEMENTS
    • A63FCARD, BOARD, OR ROULETTE GAMES; INDOOR GAMES USING SMALL MOVING PLAYING BODIES; VIDEO GAMES; GAMES NOT OTHERWISE PROVIDED FOR
    • A63F13/00Video games, i.e. games using an electronically generated display having two or more dimensions
    • A63F13/70Game security or game management aspects
    • A63F13/75Enforcing rules, e.g. detecting foul play or generating lists of cheating players
    • AHUMAN NECESSITIES
    • A63SPORTS; GAMES; AMUSEMENTS
    • A63FCARD, BOARD, OR ROULETTE GAMES; INDOOR GAMES USING SMALL MOVING PLAYING BODIES; VIDEO GAMES; GAMES NOT OTHERWISE PROVIDED FOR
    • A63F13/00Video games, i.e. games using an electronically generated display having two or more dimensions
    • A63F13/70Game security or game management aspects
    • A63F13/79Game security or game management aspects involving player-related data, e.g. identities, accounts, preferences or play histories
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • AHUMAN NECESSITIES
    • A63SPORTS; GAMES; AMUSEMENTS
    • A63FCARD, BOARD, OR ROULETTE GAMES; INDOOR GAMES USING SMALL MOVING PLAYING BODIES; VIDEO GAMES; GAMES NOT OTHERWISE PROVIDED FOR
    • A63F2300/00Features of games using an electronically generated display having two or more dimensions, e.g. on a television screen, showing representations related to the game
    • A63F2300/50Features of games using an electronically generated display having two or more dimensions, e.g. on a television screen, showing representations related to the game characterized by details of game servers
    • A63F2300/55Details of game data or player data management
    • A63F2300/5546Details of game data or player data management using player registration data, e.g. identification, account, preferences, game history
    • AHUMAN NECESSITIES
    • A63SPORTS; GAMES; AMUSEMENTS
    • A63FCARD, BOARD, OR ROULETTE GAMES; INDOOR GAMES USING SMALL MOVING PLAYING BODIES; VIDEO GAMES; GAMES NOT OTHERWISE PROVIDED FOR
    • A63F2300/00Features of games using an electronically generated display having two or more dimensions, e.g. on a television screen, showing representations related to the game
    • A63F2300/50Features of games using an electronically generated display having two or more dimensions, e.g. on a television screen, showing representations related to the game characterized by details of game servers
    • A63F2300/55Details of game data or player data management
    • A63F2300/5586Details of game data or player data management for enforcing rights or rules, e.g. to prevent foul play
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Abstract

本申请提供异常账号检测模型训练方法和异常账号检测方法,其中异常账号检测模型训练方法包括:接收训练样本,包括目标账号和任务路线;将各目标账号和各任务路线输入至异常账号检测模型,根据第一相似度阈值对各任务路线进行聚类,得到任务路线聚类簇;统计异常任务路线聚类簇中异常账号对应的任务路线的第一数量;识别异常任务路线聚类簇中未标注账号的账号状态,统计异常任务路线聚类簇中账号状态为异常的未标注账号的第二数量和账号状态为正常的未标注账号的第三数量;根据第一数量、第二数量、第三数量调整第一相似度阈值和异常阈值,返回执行聚类步骤,直至达到训练停止条件,保存异常任务路线聚类簇的簇心。可以提高检测异常账号的效率。

Description

异常账号检测模型训练方法和异常账号检测方法
技术领域
本申请涉及计算机技术领域,特别涉及一种异常账号检测模型训练方法和异常账号检测方法。
背景技术
随着计算机技术的快速发展,各种各样的游戏层出不穷。在游戏领域,大型多人在线角色扮演游戏最受欢迎,针对此类游戏出现了很多工作室,例如打金工作室、代练工作室。这些工作室由游戏高端玩家或爱好者使用大量高级配置电脑运行外挂脚本进行游戏,以收取现实货币来帮玩家赚游戏币和代练,这两个业务都会通过大量使用外挂脚本的目标账号做升级历程任务。这种行为会直接对其他正常玩家产生负面影响,破坏游戏环境和经济平衡。
现有技术中,一般使用账号登录设备或者游戏角色的一些数值特征来对使用外挂脚本的异常账号进行判断,例如登录IP、发言内容、发言频率、战斗力、在线时长、充值等。但是,上述方法人力成本较高,同时由于外挂脚本的变化,使用数值特征进行判断会经常性失效,导致检测异常账号的效率低、准确度低。因此,亟需提供一种检测效率高、准确度高的检测异常账号的方法。
发明内容
有鉴于此,本申请实施例提供了一种异常账号检测模型训练方法。本申请同时涉及一种异常账号检测模型训练装置,一种异常账号检测方法,一种异常账号检测装置,一种计算设备,以及一种计算机可读存储介质,以解决现有技术中存在的缺陷。
根据本申请实施例的第一方面,提供了一种异常账号检测模型训练方法,包括:
接收训练样本,其中,所述训练样本包括至少两个目标账号以及各目标账号在目标任务下的任务路线,至少一个所述目标账号被标注为异常账号;
将各目标账号和各任务路线输入至异常账号检测模型,根据第一相似度阈值对所述各任务路线进行聚类,得到至少一个任务路线聚类簇;
在异常任务路线聚类簇中任务路线的数量大于或者等于异常阈值的情况下,统计所述异常任务路线聚类簇中所述异常账号对应的任务路线的第一数量,所述异常任务路线聚类簇为所述至少一个任务路线聚类簇中的任意一个;
识别所述异常任务路线聚类簇中未标注账号的账号状态,统计所述异常任务路线聚类簇中账号状态为异常的未标注账号的第二数量和账号状态为正常的未标注账号的第三数量;
根据所述第一数量、第二数量以及第三数量调整所述第一相似度阈值和所述异常阈值,返回执行所述根据第一相似度阈值对所述各任务路线进行聚类,得到至少一个任务路线聚类簇步骤,直至达到训练停止条件,保存所述异常任务路线聚类簇的簇心。
根据本申请实施例的第二方面,提供了一种异常账号检测方法,包括:
获取待评估账号以及所述待评估账号在目标任务下的待评估任务路线;
获取至少一条参考路线,计算所述待评估任务路线与各参考路线的相似度;
在所述待评估任务路线与各参考路线的相似度中至少一个相似度小于第二相似度阈值的情况下,将所述待评估任务路线对应的待评估账号标记为异常账号。
根据本申请实施例的第三方面,提供了一种异常账号检测模型训练装置,包括:
接收模块,被配置为接收训练样本,其中,所述训练样本包括至少两个目标账号以及各目标账号在目标任务下的任务路线,至少一个所述目标账号被标注为异常账号;
聚类模块,被配置为将各目标账号和各任务路线输入至异常账号检测模型,根据第一相似度阈值对所述各任务路线进行聚类,得到至少一个任务路线聚类簇;
统计模块,被配置为在异常任务路线聚类簇中任务路线的数量大于或者等于异常阈值的情况下,统计所述异常任务路线聚类簇中所述异常账号对应的任务路线的第一数量,所述异常任务路线聚类簇为所述至少一个任务路线聚类簇中的任意一个;
识别模块,被配置为识别所述异常任务路线聚类簇中未标注账号的账号状态,统计所述异常任务路线聚类簇中账号状态为异常的未标注账号的第二数量和账号状态为正常的未标注账号的第三数量;
调整模块,被配置为根据所述第一数量、第二数量以及第三数量调整所述第一相似度阈值和所述异常阈值,返回执行所述根据第一相似度阈值对所述各任务路线进行聚类,得到至少一个任务路线聚类簇步骤,直至达到训练停止条件,保存所述异常任务路线聚类簇的簇心。
根据本申请实施例的第四方面,提供了一种异常账号检测装置,包括:
获取模块,被配置为获取待评估账号以及所述待评估账号在目标任务下的待评估任务路线;
计算模块,被配置为获取至少一条参考路线,计算所述待评估任务路线与各参考路线的相似度;
标记模块,被配置为在所述待评估任务路线与各参考路线的相似度中至少一个相似度小于第二相似度阈值的情况下,将所述待评估任务路线对应的待评估账号标记为异常账号。
根据本申请实施例的第五方面,提供了一种计算设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机指令,所述处理器执行所述计算机指令时实现所述异常账号检测模型训练方法或所述异常账号检测方法的步骤。
根据本申请实施例的第六方面,提供了一种计算机可读存储介质,其存储有计算机指令,该计算机指令被处理器执行时实现所述异常账号检测模型训练方法或所述异常账号检测方法的步骤。
本申请提供的异常账号检测模型训练方法,通过接收训练样本,将各目标账号和各任务路线输入至异常账号检测模型中,根据第一相似度阈值对各任务路线进行聚类,从而获得任务路线聚类簇,在异常任务路线聚类簇中任务路线的数量大于或者等于异常阈值的情况下,确定第一数量、第二数量、第三数量,进一步调整第一相似度阈值和异常阈值,继续训练,直至达到训练停止条件,此时保存异常任务路线聚类簇的簇心。可以提高对任务路线进行聚类的速度,减少计算量的同时,还可以提高样本确定异常任务路线聚类簇和簇心的准确性,提高检测异常账号的速度和准确度。此外,由于保存了任务路线聚类簇的簇心,可以实现对账号的实时检测,从而实现对异常账号的实时封禁。
附图说明
图1是本申请一实施例提供的一种异常账号检测模型训练方法的流程图;
图2A是本申请一实施例提供的一种对任务路线进行合并处理的示意图;
图2B是本申请一实施例提供的一种对任务路线进行聚类得到处理结果的示意图;
图3是本申请一实施例提供的一种异常账号检测方法的流程图;
图4是本申请一实施例提供的一种应用于闯关游戏的处理流程图;
图5是本申请一实施例提供的一种异常账号检测模型训练装置的结构示意图;
图6是本申请一实施例提供的一种异常账号检测装置的结构示意图;
图7是本申请一实施例提供的一种计算设备的结构框图。
具体实施方式
在下面的描述中阐述了很多具体细节以便于充分理解本申请。但是本申请能够以很多不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本申请内涵的情况下做类似推广,因此本申请不受下面公开的具体实施的限制。
在本申请一个或多个实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本申请一个或多个实施例。在本申请一个或多个实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本申请一个或多个实施例中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
应当理解,尽管在本申请一个或多个实施例中可能采用术语第一、第二等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本申请一个或多个实施例范围的情况下,第一也可以被称为第二,类似地,第二也可以被称为第一。取决于语境,如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”。
首先,对本申请一个或多个实施例涉及的名词术语进行解释。
打金工作室:专门的游戏工作室,通过不断的打怪或者做任务来获取虚拟道具和金币,通过游戏交易平台卖给需要的玩家换取现实货币。
代练工作室:是指游戏里为了赚取一定利润而为别人服务代为操作的游戏工作室,通过帮助雇主实现游戏中一定的级别经验和装备等而赚取现实货币。
Single-Pass算法又称单通道法或单遍法,是流式数据聚类的经典方法。对于依次到达的数据流,该方法按输入顺序每次处理一个数据,依据当前数据与已有类的匹配度大小,将该数据判为已有类或者创建一个新的数据类,实现流式数据的增量和动态聚类。
异常账号:是指未按照游戏运行规则做任务的游戏账号。
在本申请中,提供了一种异常账号检测模型训练方法和异常账号检测方法,本申请同时涉及一种异常账号检测模型训练方法和异常账号检测装置,一种计算设备,以及一种计算机可读存储介质,在下面的实施例中逐一进行详细说明。
图1示出了根据本申请一实施例提供的一种异常账号检测模型训练方法的流程图,具体包括以下步骤:
步骤102:接收训练样本,其中,所述训练样本包括至少两个目标账号以及各目标账号在目标任务下的任务路线,至少一个所述目标账号被标注为异常账号。
具体的,所述训练样本为用于训练异常账号检测模型的样本,训练样本包括至少两个目标账号以及所述至少两个目标账号中每个目标账号与所述目标任务对应的任务路线;所述目标任务是指按照预设条件从多个任务中选择的一个用于检测异常账号的任务,例如某个闯关任务,所述目标任务可以通过人工选择,也可以通过机器进行选择;所述目标账号是指完成目标任务的游戏角色对应的账号,也即是用于确定异常路线的账号;所述任务路线是指目标账号对应的游戏角色完成目标任务所行走的路线,也即是用于确定异常路线的路线样本;所述异常账号是指目标账号中使用外挂脚本的账号。需要说明的是目标账号与其对应的任务路线相关联,或者说目标账号是任务路线的一个属性标记。
实际应用中,为了对异常账号检测模型进行训练,会使用大量的训练样本对其进行训练,以达到一定的训练标准,也即接收到大量目标账号以及各目标账号在目标任务下的任务路线,其中,一个目标账号对应一条任务路线。需要说明的是在接收的目标账号中,有一部分是已知存在异常的目标账号,将这部分账号标注为异常账号。而接收的目标账号中除异常账号以外的其他目标账号是否异常是未知的,也即不确定其他目标账号是否异常,其他目标账号也可能是异常账号,也可能是正常账号。
例如,接收到500组样本,每组样本包括一个目标账号以及该目标账号对应的一条任务路线,也即有500个目标账号和500条任务路线。在这500个目标账号中,有20个目标账号为已知异常,则这20个目标账号被标注为异常账号,其余480个目标账号为未知的,其中有未知的异常账号和未知的正常账号。
为了保证训练的顺利进行,还需要在接收训练样本之前,确定目标账号和任务路线,也即在接收训练样本之前,确定完成目标任务的至少两个目标账号,获取所述至少两个目标账号中每个目标账号的与所述目标任务对应的任务路线,得到至少两条任务路线。
具体的,由于同一个目标账号可能多次完成目标任务,则该目标账号与目标任务对应的至少任务路线可能有多条,此时只需要选择其中一条任务路线(可以随机选择,也可以按照预设条件进行选择),以保证获取的任务路线与目标账号一一对应。
实际应用中,可以根据确定的目标任务进一步确定完成了目标任务的目标账号,其中,为了能够有效地检测出异常路线,样本的数量需要足够大,即目标账号的数量不能太少,因此目标账号可以有多个。多个目标账号确定了之后,需要根据目标账号确定与所述目标任务对应的多个任务路线。需要说明的是,目标账号与任务路线一一对应,即有几个目标账号,就有几个任务路线。
例如,在多个任务中选择搬运粮草任务为目标任务,进一步地,确定出完成搬运粮草任务的目标账号有哪些。根据服务器记载,确定目标账号有账号X、账号Y以及账号Z,从而获取账号X与搬运粮草任务对应的任务路线x、账号Y与搬运粮草任务对应的任务路线y以及账号Z与搬运粮草任务对应的任务路线z。
本申请中,先根据目标任务确定目标账号,再确定目标账号与目标任务对应的任务路线,在简化获取任务路线过程的同时,不仅可以提高获取任务路线的精确度,还一定程度上提高了获取任务路线的速度。
在本实施例的一个或多个实施方式中,所述获取所述至少两个目标账号中每个目标账号的与所述目标任务对应的任务路线,得到至少两组轨迹数据的具体实现过程可以如下:
获取所述至少两个目标账号中每个目标账号的与所述目标任务对应的轨迹数据,得到至少两组轨迹数据;
将所述至少两组轨迹数据中每一组轨迹数据按照时间顺序进行排序并去重,得到至少两条任务路线。
具体的,所述轨迹数据是指表征游戏角色在游戏中坐标位置的数据,例如轨迹数据可以是由P1,P2,…,Pn组成的数据,Pi为(xi,yi)表示,其中轨迹数据一般存储在服务器的数据库中;所述排序是指将一组无序轨迹数据按照时间的先后顺序按进行调整的过程;所述去重是指将排序后的轨迹数据中相邻且相同的数据,也即重复的数据进行去除,保留一个即可。
实际应用中,确定完成目标任务的至少两个目标账号之后,在服务器的数据库中查找并提取多个目标账号与所述目标任务对应的多组轨迹数据,一个目标账号对应一组轨迹数据。一般情况下轨迹数据(包含完成目标任务过程中所有的轨迹数据)的量是十分庞大的,这样服务器的计算压力会很大,因此可以获取游戏角色行进过程中的轨迹数据。由于获取的轨迹数据可能是无序的,无法生成有效的任务路线,为了避免这个问题,可以将每一组轨迹数据都按照时间先后顺序进行排序,也即是按照帧数顺序进行排序。游戏角色在接到目标任务后有可能出现站在原地不动等现象,这会导致轨迹数据中时间序列上出现多个相邻的重复数据,并且造成后续计算时数据量较大。因此,可以将重复的数据去除,即将排序后的时间序列上相邻并且相同的多个数据进行去重,仅保留其中一个数据。去重完成后,根据处理后的轨迹数据生成任务路线。
例如,账号为“123456”的目标账号,其对应的轨迹数据为“P1,P10,P10,P8,P8,P9,P5,P1,P4,P6,P7,P6,P2,P3”,先按照时间先后顺序对轨迹数据进行排序处理后为“P1,P1,P2,P3,P4,P5,P6,P6,P7,P8,P8,P9,P10,P10”,在对排序后的轨迹数据进行去重处理,得到“P1,P2,P3,P4,P5,P6,P7,P8,P9,P10”,最后,可以根据“P1,P2,P3,P4,P5,P6,P7,P8,P9,P10”生成“123456”这个目标账号对应的任务路线。
本申请中,通过对轨迹数据进行排序处理可以使后续生成的任务路线更精准,即提高了获取任务路线的准确性和有效性。此外,通过对排序后的轨迹数据进行去重处理,一定程度上减少了冗余的计算,从而降低了服务器的计算压力。
需要说明的是,为了避免由于目标任务选取错误而造成异常账号检测模型训练无法成功的问题,在接收训练样本之前,还需要检测目标任务是否可用,可以根据所述至少两条任务路线判断所述目标任务是否符合异常账号的检测条件;若否,更换目标任务,确定完成更换后的目标任务的至少两个目标账号,获取所述至少两个目标账号的与所述更换后的目标任务对应的至少两条任务路线;若是,则接收训练样本。
步骤104:将各目标账号和各任务路线输入至异常账号检测模型,根据第一相似度阈值对所述各任务路线进行聚类,得到至少一个任务路线聚类簇。
在接收到训练样本的基础上,进一步地,将接收到的样本输入至异常账号检测模型,开始训练,即对至少两条任务路线进行聚类处理。
具体的,所述聚类是指将多个任务路线分成由距离相近的任务路线组成的多个簇的过程;所述任务路线聚类簇是指对任务路线进行聚类后组成的多个簇的结果,所述任务路线聚类簇中的任务路线之间的距离都很相近。
实际应用中,聚类算法可以有多种,根据不同的聚类算法对所述至少两条任务路线进行聚类,其聚类结果也不同,即得到的至少一个任务路线聚类簇不同。本申请中,选择Single-pass算法对所述至少两条任务路线进行聚类,得到至少一个任务路线聚类簇,具体实现过程可以如下:
选取至少两条任务路线中的第i条任务路线,将所述第i条任务路线确定为第i任务路线聚类簇的簇心,其中,i为大于或者等于1的自然数;
计算所述至少两条任务路线中任意一条未聚类的任务路线与第j任务路线聚类簇的簇心的相似度,其中,j为小于或者等于i的正整数;
在所述相似度小于第一相似度阈值的情况下,将所述任务路线添加至所述第j任务路线聚类簇中,在所述相似度大于或等于第一相似度阈值的情况下,以所述任务路线为簇心生成第i+1任务路线聚类簇;
判断所述至少两条任务路线中的任务路线是否聚类完毕,若否,则i自增1并继续执行计算所述至少两条任务路线中任意一条未聚类的任务路线与第j任务路线聚类簇的簇心的相似度的步骤,若是,则输出聚类结果。
本过程聚类算法的实则是:按一定顺序依次对任务路线进行聚类,每次聚类的任务路线都分别和已有的任务路线聚类簇的簇心进行比较,如果该任务路线和某个簇心的相似度小于第一相似度阈值,则将该任务路线添加至这个簇心对应的任务路线聚类簇中,如果该任务路线和所有簇心的相似度均大于或者等于第一相似度阈值,则将该任务路线视为一个新的任务路线聚类簇,并以该任务路线作为这个新的任务路线聚类簇的簇心。以此类推,直到所有的任务路线都聚类完成,整个过程只对每个任务路线进行一次聚类。
具体的,首先,可以从所述至少两条任务路线中选取第一任务路线,以第一任务路线为簇心创建第一任务路线聚类簇。接着,从所述至少两条任务路线中选取第二任务路线,计算第二任务路线与第一任务路线聚类簇的簇心的相似度,即计算第二任务路线与第一任务路线的相似度:在第二任务路线与第一任务路线的相似度小于第一阈值的情况下,将第二任务路线添加至第一任务路线聚类簇;在第二任务路线与第一任务路线的相似度大于或者等于第一阈值的情况下,以第二任务路线为簇心创建第二任务路线聚类簇。然后,重复上述过程,直至将所有任务路线都添加至对应的任务路线聚类簇中。
需要说明的是,每一条未聚类的任务路线都要与每一个已创建的任务路线聚类簇的簇心进行相似度计算,在某条任务路线与多个任务路线聚类簇的簇心的相似度都小于第一相似度阈值的情况下,可以将这条任务路线添加至相似度最小的任务路线聚类簇中。且任务路线聚类簇中任务路线可以按照一定顺序排列,也可以为无序的。
例如,有三条任务路线,分别为任务路线一、任务路线二、任务路线三,为了确保聚类结果的自然性,在聚类之前将三条条任务路线的顺序随机打乱,此时三条任务路线的顺序为:任务路线二、任务路线三、任务路线一,第一相似度阈值为1。首先,以任务路线二作为簇心创建第一任务路线聚类簇,得到【任务路线二】;接着,选取任务路线三,计算任务路线三与任务路线二的相似度,计算结果如表1所示,相似度为1.3,1.3大于1,即相似度大于第一相似度阈值,则以任务路线三为簇心创建第二任务路线聚类簇,得到【任务路线三】;最后,选取任务路线一,计算得出任务路线一与第一任务路线聚类簇的簇心的相似度,计算结果如表1所示,相似度为0.9,任务路线一与第二任务路线聚类簇的簇心的相似度为0.8,0.9和0.8均小于第一相似度阈值1,由于0.9大于0.8,将任务路线一添加至第二任务路线聚类簇中,得到【任务路线三,任务路线一】。因此,对上述三条任务路线进行聚类,得到两个任务路线聚类簇,即【任务路线二】和【任务路线三,任务路线一】。
表1三条任务路线之间的相似度
本申请中,采用上述方法对所述至少两条任务路线进行聚类,可以快速地将大量的任务路线进行聚类,即可以提高聚类的速度,一定程度上提高了检测异常账号的速度。此外,本申请通过第一相似度阈值与相似度的关系进行聚类,可以有效地提高聚类结果的可靠性,也即可以提高检测异常账号结果的可靠性。
在本实施例的一个或多个实施方式中,当一个任务路线聚类簇中任务路线的增多时,为了使簇心更精准地体现该任务路线聚类簇的特征,需要对任务路线聚类簇的簇心进行调整,即在所述相似度小于第一相似度阈值的情况下,将所述任务路线添加至所述第j任务路线聚类簇中之后,还需要对所述任务路线聚类簇的簇心进行检测,具体实现过程可以如下:
比较所述任务路线的长度与所述第j任务路线聚类簇的簇心的长度,若所述任务路线的长度比所述簇心的长度短,将所述任务路线确定为所述第j任务路线聚类簇的簇心;若所述任务路线的长度比所述簇心的长度长,则不变更第j任务路线聚类簇的簇心。
实际应用中,在任务路线聚类簇中加入新的任务路线之后,为了减少后续在计算相似度时的计算量,提高计算速度,可以选择任务路线聚类簇中长度最短的任务路线作为簇心。由于在未添加新的任务路线时,任务路线聚类簇的簇心为任务路线聚类簇内长度最短的任务路线,因此,只需要将新添加的任务路线的长度与簇心的长度进行比较即可,如果新添加的任务路线比簇心长,则维持现状,即不变更该任务路线聚类簇的簇心;如果新添加的任务路线比簇心短,则将新添的任务路线作为该任务路线聚类簇的簇心,即变更任务路线聚类簇的簇心。
需要注意的是,从概率上来说,任务路线聚类簇中任务路线越多,越能够代表未聚类的任务路线的类型。好比10个人中8个打篮球、1个踢足球,那么剩下那个人大概率也是打篮球的。因此,为了进一步提高聚类的速度,可以根据任务路线聚类簇中任务路线的数量对任务路线聚类簇进行排序,根据排序结果计算所述至少两条任务路线中任意一条未聚类的任务路线与第j任务路线聚类簇的簇心的相似度,具体实现过程可以如下:
将i个任务路线聚类簇按照包含任务路线的数量从多到少进行排序;
按照排序顺序计算所述至少两条任务路线中任意一条未聚类的任务路线与第j任务路线聚类簇的簇心的相似度。
具体的,将已有的任务路线聚类簇按照簇内任务路线的数量,从多到少排序。例如有三个任务路线聚类簇:A、B、C,A中有3个任务路线聚类簇,B中有5任务路线聚类簇,C中有4个任务路线聚类簇,则排序结果为:B、C、A。进一步地,根据排序结果,计算未聚类的任务路线与各任务路线聚类簇的簇心的相似度。
例如,有五条任务路线,分别为任务路线一、任务路线二、任务路线三、任务路线四、任务路线五,其长度如表2所示。为了确保聚类结果的自然性,在聚类之前将五条任务路线的顺序进行调整或者随机打乱,此时五条任务路线的顺序为:任务路线三、任务路线一、任务路线四、任务路线五、任务路线二且第一相似度阈值为0.55。将任务路线三作为第一任务路线聚类簇的簇心,得到第一任务路线聚类簇【任务路线三】;计算任务路线一和第一任务路线聚类簇【任务路线三】的簇心的相似度,计算结果如表3所示,其相似度为0.7,由于0.7比第一相似度阈值0.55大,所以不会将任务路线一添加至第一任务路线聚类簇【任务路线三】中,而是以任务路线一为簇心创建新的任务路线聚类簇,得到第二任务路线聚类簇【任务路线一】。第一任务路线聚类簇【任务路线三】和第二任务路线聚类簇【任务路线一】各包含一个任务路线,无需排序。计算任务路线四和第一任务路线聚类簇【任务路线三】的簇心的相似度,计算结果如表3所示,其相似度为0.6且大于第一相似度阈值0.55;计算任务路线四和第二任务路线聚类簇【任务路线一】的簇心的相似度,计算结果如表3所示,其相似度为0.3且小于第一相似度阈值0.55,所以将任务路线四添加至第二任务路线聚类簇【任务路线一】中,此时已有的任务路线聚类簇有第一任务路线聚类簇【任务路线三】和第二任务路线聚类簇【任务路线一、任务路线四】。由于257小于270,即任务路线一的长度小于任务路线四的长度,因此第二任务路线聚类簇【任务路线一、任务路线四】的簇心依旧为任务路线一。对已有的任务路线聚类簇进行排序,将原本的第一任务路线聚类簇【任务路线三】、第二任务路线聚类簇【任务路线一、任务路线四】变成第二任务路线聚类簇【任务路线一、任务路线四】、第一任务路线聚类簇【任务路线三】。计算任务路线五和第二任务路线聚类簇【任务路线一、任务路线四】的簇心的相似度,计算结果如表3所示,其相似度为2.8且大于第一相似度阈值0.55;计算任务路线五和第一任务路线聚类簇【任务路线三】的簇心的相似度,其相似度为0.4且小于第一相似度阈值0.55,则得到第二任务路线聚类簇【任务路线一、任务路线四】、第一任务路线聚类簇【任务路线三、任务路线五】,由于219小于287,即任务路线五的长度小于任务路线三的长度,将第一任务路线聚类簇【任务路线三、任务路线五】的簇心变更为任务路线五。最后,计算任务路线二与第二任务路线聚类簇【任务路线一、任务路线四】的簇心的相似度,计算结果如表3所示,其相似度为0.6且大于第一相似度阈值0.55;计算任务路线二与第一任务路线聚类簇【任务路线三、任务路线五】的簇心的相似度,计算结果如表3所示,其相似度为0.8且大于第一相似度阈值0.55,则以任务路线二为簇心创建新的任务路线聚类簇,得到第三任务路线聚类簇【任务路线二】。即聚类结果为:第二任务路线聚类簇【任务路线一、任务路线四】、第一任务路线聚类簇【任务路线三、任务路线五】、第三任务路线聚类簇【任务路线二】。
表2五条任务路线的长度
表3五条任务路线之间的相似度
需要说明的是,实际应用中由于任务路线的数量大,任务路线聚类簇之间的差距也大,为了提高聚类效率,不会每聚类一条任务路线就对任务路线聚类簇排序一次。可以设定一个排序阈值,例如在排序阈值为200时,每聚类200条任务路线,才对已有的任务路线聚类簇进行一次排序。
本申请中,通过对任务路线聚类簇的簇心适当地进行更新,有利于减少聚类过程中的计算量,进一步提高了聚类的速度,从而有效地提高了异常账号检测模型的训练速度。此外,根据任务路线聚类簇中任务路线的数量对任务路线聚类簇的顺序进行调整,一定程度上也有效地提高了聚类的速度。
在本实施例的一个或多个实施方式中,所述计算所述至少两条任务路线中任意一条未聚类的任务路线与第j任务路线聚类簇的簇心的相似度的具体实现过程可以如下:
确定所述至少两条任务路线中每条未聚类的任务路线的长度和i个任务路线聚类簇的簇心的长度;
将所述至少两条任务路线中未聚类的第n任务路线与i个簇心中的第j簇心进行合并处理,生成所述第n任务路线与所述第j簇心最短轨迹的合并路线,其中,所述第n任务路线为所述至少两条任务路线中任意一条未聚类的任务路线,所述第j簇心为第j任务路线聚类簇的簇心,n为大于或者等于1的自然数;
根据所述合并路线的长度、所述第n任务路线的长度以及所述第j簇心的长度确定所述第n任务路线与所述第j簇心的相似度。
具体的,所述未聚类的任务路线是指还没有添加至对应的任务路线聚类簇中的任务路线;所述合并处理是指将未聚类的第n任务路线和第j簇心结合、归集到一起的过程;所述合并路线是指将第n任务路线和第j簇心结合、归集到一起形成的路线。
实际应用中,可以采用Merge Distance算法计算所述至少两条任务路线中任意一条未聚类的任务路线与第j任务路线聚类簇的簇心的相似度:首先需要确定所有还未聚类的任务路线的长度,为后续计算相似度进行准备。接着从未聚类的任务路线中选取任意一条任务路线,从已有的任务路线聚类簇中选取任意一个任务路线聚类簇的簇心,将两者进行合并处理。参见图2A,任务路线a为任意一条未聚类的任务路线,簇心b为任意一个任务路线聚类簇的簇心,其中任务线路a由轨迹数据a1、a2、a3、a4组成,簇心b由轨迹数据b1、b2、b3组成,将轨迹数据a1、a2、a3、a4和轨迹数据b1、b2、b3进行合并,生成合并路线。由于生成的合并路线可以有多条,这里只需要从多条合并路线中选择出轨迹最短的一条作为合并路线s。最后,根据合并路线的长度、未聚类的任务路线的长度、所述簇心的长度确定该未聚类的任务路线与所述簇心的相似度,即根据合并路线s的长度、任务线路a的长度、簇心b的长度确定任务线路a与簇心b的相似度,相似度的计算过程如式1所示。
MD(a,b)=2L(s)/[L(a)+L(b)]–1 (式1)
式1中,MD(a,b)是指任务线路a与任务路线b的相似度,L(s)是指合并路线s的长度,L(a)是指任务路线a的长度,L(b)是指任务路线b的长度。
例如,有一条未聚类的任务路线和两个任务路线聚类簇:任务路线X、任务路线聚类簇M和任务路线聚类簇N,其中任务路线聚类簇M的簇心为P,任务路线聚类簇N的簇心为Q。确定任务路线X、簇心P、簇心Q的长度,其中,L(X)为10、L(P)为15、L(Q)为20。接着,先计算任务路线X和簇心P的相似度:将任务路线X和簇心P进行合并处理得到最短轨迹的合并路线S1,其中合并路线S1的长度,即L(S1)为20,即将10、15、20带入式1中,得到2*20/(10+15)-1=0.6,即任务路线X与簇心P的相似度为0.6;再计算任务路线X和簇心Q的相似度:将任务路线X和簇心Q进行合并处理得到最短轨迹的合并路线S2,其中合并路线S2的长度,即L(S2)为36,即将10、20、36带入式1中,得到2*36/(10+20)-1=1.4,即任务路线X与簇心Q的相似度为1.4。
本申请中,通过对任意一条未聚类的任务路线和任意一个任务路线聚类簇的簇心进行合并处理确定最短轨迹的合并路线,并进一步确定该未聚类的任务路线与该任务路线聚类簇的簇心的相似度,提高了相似度的精确性,同时也为依据相似度对任务路线进行聚类提高了有效性。
步骤106:在异常任务路线聚类簇中任务路线的数量大于或者等于异常阈值的情况下,统计所述异常任务路线聚类簇中所述异常账号对应的任务路线的第一数量,所述异常任务路线聚类簇为所述至少一个任务路线聚类簇中的任意一个。
在将各目标账号和各任务路线输入至异常账号检测模型,根据第一相似度阈值对各任务路线进行聚类并得到至少一个任务路线聚类簇的情况下,进一步地,根据任务路线聚类簇中任务路线的数量确定异常路线,并确定异常路线中异常账号对应的任务路线的第一数量。
具体的,所述异常阈值是指用于评估异常任务路线聚类簇中任务路线数量的一个临界值,可以是评估异常任务路线聚类簇中的任务路线对应的目标账号是否为异常账号的一个临界值,异常阈值可以根据实际情况进行设定。
实际应用中,可以先确定任务路线聚类簇中任务路线的数量,将任务路线聚类簇中的数量分别与异常阈值进行比较,若某个任务路线聚类簇中任务路线的数量小于异常阈值,则默认该任务路线聚类簇为正常任务路线聚类簇;若某个任务路线聚类簇中任务路线的数量大于或者等于异常阈值,则将该任务路线聚类簇确定为异常任务路线聚类簇,确定异常任务路线聚类簇中与异常账号对应的任务路线的数量,即第一数量。
例如,对任务路线进行聚类之后得到两个任务路线聚类簇,其中,第一任务路线聚类簇中有190条任务路线,第二任务路线聚类簇中有210条任务路线。在异常阈值为200的情况下,只有第二任务路线聚类簇中的任务路线的数量大于异常阈值,因此,第一任务路线聚类簇为正常任务路线聚类簇,第二任务路线聚类簇为异常任务路线聚类簇。若第二任务路线聚类簇中有15条任务路线对应的目标账号标注为异常账号,则第一数量为15。
本申请中,通过对任务路线聚类簇中任务路线的数量进行检测,可以快速高效地检测到异常任务路线聚类簇,即提高了检测异常路线的速度。根据异常任务路线聚类簇中异常账号对应的任务路线确定第一数量,为后续调整第一相似度阈值和异常阈值奠定了基础,一定程度上还提高了训练速度。
步骤108:识别所述异常任务路线聚类簇中未标注账号的账号状态,统计所述异常任务路线聚类簇中账号状态为异常的未标注账号的第二数量和账号状态为正常的未标注账号的第三数量。
在确定异常任务路线聚类簇以及第一数量的情况下,进一步地,识别异常任务路线聚类簇中标注为异常账号对应的任务路线以外的其他任务路线的账号状态,即识别异常任务路线聚类簇中未标注账号对应的任务路线的账号状态,也即识别异常任务路线聚类簇中未标注账号是否为异常账号,将未标注账号中账号状态为异常的未标注账号的数量确定为第二数量,将未标注账号中账号状态为正常的未标注账号的数量确定为第三数量。
沿用上例,第二任务路线聚类簇(异常任务路线聚类簇)中有210条任务路线,其中有15条任务路线对应的目标账号标注为异常账号,则第一数量为15,未标注账号对应的任务路线的数量为195,进一步地,判断这195个未标注账号的账号状态。进行识别后,这195个未标注账号中有125个异常账号,70个正常账号,则第一数量为15、第二数量为125、第三数量为70。
需要说明的是,对未标注账号的账号状态进行识别时,可以根据未标注账号对应的登录设备或者游戏角色的一些数值特征来进行判断,其中所述数值特征包括登录IP、发言内容、发言频率、战力、在线时长、充值等,例如某个游戏角色不间断地在对战、每天对战十几个小时并持续数天,可以将该游戏角色对应的账号确定为异常账号。此外,在识别所述异常任务路线聚类簇中未标注账号的账号状态的基础上,可以将异常任务路线聚类簇中账号状态为异常的未标注账号标注为异常账号,如此可以减少后续训练过程中识别所述异常任务路线聚类簇中未标注账号的账号状态的数据处理量,进一步提高训练的速度。
本申请中,通过识别所述异常任务路线聚类簇中未标注账号的账号状态,进一步确定第二数量和第三数量,为调整第一相似度阈值和异常阈值做好了准备工作,有利于提高模型检测异常账号的准确度。
步骤110:根据所述第一数量、第二数量以及第三数量调整所述第一相似度阈值和所述异常阈值,返回执行所述根据第一相似度阈值对所述各任务路线进行聚类,得到至少一个任务路线聚类簇步骤,直至达到训练停止条件,保存所述异常任务路线聚类簇的簇心。
在确定了第一数量、第二数量以及第三数量的基础上,进一步地,可以根据第一数量、第二数量以及第三数量来调整模型中的参数,即第一相似度阈值和异常阈值,之后继续训练异常账号检测模型,直至达到训练停止条件,保存最终得到的异常任务路线聚类簇的簇心。
在本实施例的一个或多个实施方式中,根据所述第一数量、第二数量以及第三数量调整所述第一相似度阈值和所述异常阈值的具体实现过程可以如下:
确定第三数量与第一数量、第二数量以及第三数量之和的比值;或者确定第三数量与第一数量以及第二数量之和的比值;
在所述比值大于调整阈值的情况下,调整所述第一相似度阈值和异常阈值。
实际应用中,比较第三数量与第一数量、第二数量以及第三数量之和的比值或者所述第三数量与第一数量以及第二数量之和的比值与调整阈值的大小,当比值大于调整阈值时,调整第一相似度阈值和异常阈值。当比值小于等于调整阈值时,停止训练,此时,训练停止条件可以为第三数量与第一数量、第二数量以及第三数量之和的比值或者第三数量与第一数量以及第二数量之和的比值小于等于调整阈值,也可以为第一数量以及第二数量之和与第一数量、第二数量以及第三数量之和的比值或者第三数量与第一数量以及第二数量之和的比值停止下降。
在本实施例的一个或多个实施方式中,根据所述第一数量、第二数量以及第三数量调整所述第一相似度阈值和所述异常阈值的具体实现过程还可以如下:
确定第一数量以及第二数量之和与第一数量、第二数量以及第三数量之和的比值;
在所述比值小于调整阈值的情况下,调整所述第一相似度阈值和异常阈值。
实际应用中,比较所述比值与调整阈值的大小,当所述比值小于调整阈值时,调整第一相似度阈值和异常阈值。当所述比值大于等于调整阈值时,停止训练,此时,训练停止条件可以为第一数量以及第二数量之和与第一数量、第二数量以及第三数量之和的比值大于等于调整阈值,也可以为第一数量以及第二数量之和与第一数量、第二数量以及第三数量之和的比值停止上升。
在本实施例的一个或多个实施方式中,当所述异常账号检测模型的迭代次数达到目标迭代次数时,停止训练所述异常账号检测模型。
实际应用中,在对第一相似度阈值和异常阈值不断地调整后,最后达到训练停止条件时,需要对最后一次聚类得到任务路线聚类簇进行分析。参见图2B,图中204为正常任务路线聚类簇的集合,206为异常任务路线聚类簇,其中202为异常任务路线聚类簇206中的簇心。
由于簇心是任务路线聚类簇中最具有代表性的任务路线,在任务路线聚类簇中任务路线的数量不小于异常阈值的情况下,将该任务路线聚类簇的簇心进行保存,即保存异常任务路线聚类簇的簇心。异常任务路线聚类簇的簇心为最接近使用外挂脚本进行目标任务时的任务路线,将其作为后续检测异常账号的标准,可以提高检测异常路线的可靠性和可信度。
需要说明的是,当所述异常账号检测模型的迭代次数达到目标迭代次数时,若分组的结果依然不理想,也可以更换目标任务,并更换与目标任务对应的目标账号和任务路线,重新开始训练异常账号检测模型。且每隔一段时间可以对该异常账号检测模型进行训练,以便于更新异常任务路线聚类簇的簇心,保证能够自动识别使用外挂脚本的最新路线。同时之前保存异常任务路线聚类簇的簇心也会保留一段时间,可以避免使用有多种外挂脚本轮流进行目标任务,使后续异常账号检测无法使用适用。
本申请提供的异常账号检测模型训练方法,通过接收训练样本,将各目标账号和各任务路线输入至异常账号检测模型中,根据第一相似度阈值对各任务路线进行聚类,从而获得任务路线聚类簇,再在异常任务路线聚类簇中任务路线的数量大于或者等于异常阈值的情况下,确定第一数量、第二数量、第三数量,进一步调整第一相似度阈值和异常阈值,继续训练,直至达到训练停止条件,此时保存异常任务路线聚类簇的簇心。可以提高对任务路线进行聚类的速度,减少计算量的同时,还可以提高样本确定异常任务路线聚类簇和簇心的准确性,提高检测异常账号的速度和准确度。此外,由于保存了异常任务路线聚类簇的簇心,可以实现对账号的实时检测,从而实现对异常账号的实时封禁。
图3示出了根据本申请一实施例提供的一种异常账号检测方法的流程图,具体包括以下步骤:
步骤302:获取待评估账号以及所述待评估账号在目标任务下的待评估任务路线。
具体的,所述待评估任务路线是指需要进行检测的、确定是否为异常路线的路线;所述待评估任务路线是指所述待评估账号在目标任务下的任务路线。
本申请提供的实施例中,每次获取一个获取待评估账号以及所述待评估账号在目标任务下的一条待评估任务路线。
为了提高获取待评估账号和待评估任务路线的效率,可以先根据目标任务确定待评估账号,然后从数据库中获取待评估账号对应的完成目标任务的轨迹数据,进而确定待评估任务路线。即所述获取待评估账号以及所述待评估账号在目标任务下的待评估任务路线的具体实现过程可以如下:
确定完成目标任务的待评估账号;
获取所述待评估账号与所述目标任务对应的待评估轨迹数据;
将所述待评估轨迹数据按照时间顺序进行排序并去重,得到待评估任务路线。
具体的,待评估轨迹数据是指服务器所记载的待评估账号完成目标任务过程中的所有表示游戏角色位置的数据;排序是指将一组无序的待评估轨迹数据调整为有序的待评估轨迹数据;去重是指将有序的待评估轨迹数据中相邻时间相同的数据保留一个数据后删除其他相同的数据。
实际应用中,在明确了目标任务之后,需要确定完成该目标任务的待评估账号。然后从服务器的数据库中获取该待评估账号与目标任务对应的待评估轨迹数据。一般情况下待评估轨迹数据(包含完成目标任务过程中所有的轨迹数据)的量是十分庞大的,这样服务器的计算压力会很大,因此可以获取游戏角色行进过程中的待评估轨迹数据。由于待评估轨迹数据可能是无序的,无法生成有效的待评估任务路线,为了避免这个问题,可以将待评估轨迹数据按照时间先后顺序进行排序,也即是按照帧数顺序进行排序。游戏角色在接到目标任务后有可能出现站在原地不动等现象,这会导致待评估轨迹数据中在时间序列上出现多个相邻的重复数据,并且造成后续计算时数据量较大。因此,可以将重复的数据去除,即将排序后的时间序列上相邻并且相同的多个数据进行去重,仅保留其中一个数据。去重完成后,根据处理后的待评估轨迹数据生成待评估任务路线。
例如,账号为“112233”的目标账号,其对应的轨迹数据为“P1,P8,P8,P7,P7,P6,P1,P6,P5,P5,P7,P3,P3,P2”,先按照时间先后顺序对轨迹数据进行排序处理后为“P1,P1,P2,P3,P3,P5,P5,P6,P6,P7,P7,P7,P8,P8”,在对排序后的轨迹数据进行去重处理,得到“P1,P2,P3,P5,P6,P7,P8”,最后,可以根据“P1,P2,P3,P5,P6,P7,P8”生成“112233”这个目标账号对应的任务路线。
步骤304:获取至少一条参考路线,计算所述待评估任务路线与各参考路线的相似度。
在获取待评估账号以及所述待评估账号在目标任务下的待评估任务路线的基础上,进一步地,获取参考路线,并确定待评估任务路线与各参考路线的相似度。
具体的,参考路线是指用于衡量待评估任务路线是否异常的路线。实际应用中,可以通过计算相似度的一些算法计算待评估任务路线各参考路线之间的相似度。例如,欧式距离、Merge Distance算法等。
本申请提供的实施例中,获得两条参考路线:参考路线1和参考路线2。然后计算待评估任务路线与参考路线1的相似度,以及待评估任务路线与参考路线2的相似度。
实际应用中,可以采用Merge Distance算法计算待评估任务路线与各参考路线的相似度:首先需要确定待评估任务路线与各参考路线的长度,为后续计算相似度进行准备。接着从各参考路线选取任意一条参考路线,将该参考任务路线与待评估任务路线进行合并处理。参见图2A,a为参考路线,且参考路线a为任意一条参考路线,b为待评估任务路线。其中参考路线a由轨迹数据a1、a2、a3、a4组成,待评估任务路线b由轨迹数据b1、b2、b3组成,将轨迹数据a1、a2、a3、a4和轨迹数据b1、b2、b3进行合并,生成合并路线。由于生成的合并路线可以有多条,这里只需要从多条合并路线中选择出轨迹最短的一条作为合并路线s。最后,根据合并路线s的长度、参考路线a的长度、待评估任务路线b的长度确定参考线路a与待评估任务路线b的相似度,即先将参考线路a的长度与待评估任务路线b的长度相加,得到长度和,再计算两倍合并路线s的长度与长度和的比值,最后将得到的比值减一,得到参考路线a和待评估任务路线b的相似度。
需要说明的是,参考路线为异常路线,也即打金工作室或者代练工作室做任务时采用的路线。其中,所述获取至少一条参考路线的具体实现过程如下:
获取异常账号检测模型中保存的至少一个簇心,将所述至少一个簇心确定为至少一条参考路线,所述异常账号检测模型是通过上述异常账号检测模型训练方法训练得到的。
也即是说,本申请中的参考路线可以从异常账号检测模型中获取,异常账号检测模型中保存的异常任务路线聚类簇的簇心,即为参考路线。
步骤306:在所述待评估任务路线与各参考路线的相似度中至少一个相似度小于第二相似度阈值的情况下,将所述待评估任务路线对应的待评估账号标记为异常账号。
在确定了待评估任务路线与各参考路线的相似度的基础上,进一步地,将各相似度与第二相似度阈值进行比较,从而确定异常账号。
具体的,第二相似度阈值可以人为根据需求进行设置,也可以获取异常账号检测模型中的参数——第一相似度阈值,将该第一相似度阈值作为本步骤中的第二相似度阈值。
实际应用中,需要将待评估任务路线与各参考路线的相似度分别与第二相似度阈值进行比较,判断各相似度是否均大于或等于第二相似度阈值,若是,则说明该待评估任务路线正常,也即该待评估任务路线对应的账号为正常账号;若否,则说明该待评估任务路线异常,也即该待评估任务路线对应的账号为异常账号,将该待评估账号标注为异常账号。在此基础上,可以该评估账号封禁,以保证游戏环境平衡。
例如,第二相似度阈值为0.5,待评估任务路线与参考路线1的相似度为0.3,待评估任务路线与参考路线2的相似度为0.6,则该待评估任务路线对应的账号为异常账号,将该待评估账号标注为异常账号。
在本实施例的一个或多个实施方式中,每个参考路线对应一个第二相似度阈值,也即参考路线与第二相似度阈值一一对应。在此基础上,再将相似度与第二相似度阈值进行比较时,需要将该相似度与该相似度对应的参考路线对应的第二相似度进行对比。
例如,参考路线1对应的第二相似度阈值为0.55,参考路线2对应的第二相似度阈值为0.65,则需要将待评估任务路线与参考路线1的相似度与0.55进行比较,将待评估任务路线与参考路线2的相似度与0.65进行比较。若待评估任务路线与参考路线1的相似度为0.6,待评估任务路线与参考路线2的相似度为0.8,则该待评估任务路线正常,该待评估任务路线对应的账号为正常账号。
在本实施例的一个或多个实施方式中,在获取待评估账号以及所述待评估账号在目标任务下的待评估任务路线的基础上,还可以直接将所述待评估账号和所述待评估任务路线输入至异常账号检测模型,进行检测,具体实现过程如下:
将所述待评估账号和所述待评估任务路线输入至异常账号检测模型,根据第一相似度阈值对所述待评估任务路线和至少一个簇心进行聚类,得到至少一个任务路线聚类簇,所述异常账号检测模型是通过上述异常账号检测模型训练方法训练得到的;
在所述至少一个任务路线聚类簇的数量等于所述至少一个簇心的数量的情况下,将所述待评估任务路线对应的待评估账号标记为异常账号。
本申请提供的实施例中,将一个待评估账号和对应的一条待评估任务路线输入至训练好的异常账号检测模型之后,基于第二相似度阈值,将该待评估任务路线以及保存的至少一个簇心进行聚类,得到若干个任务路线聚类簇。进一步地。也即当有N个簇心时,得到N+1个任务路线聚类簇,说明该待评估任务路线与任何一个簇心都不相似,即该待评估任务路线对应的待评估账号为正常账号;当有N个簇心时,得到N个任务路线聚类簇,说明该待评估任务路线与某个簇心相似,即该待评估任务路线对应的待评估账号为异常账号,将该待评估账号标注为异常账号。在此基础上,可以该评估账号封禁,以保证游戏环境平衡。需要说明的是,当保存有N个簇心时,N为任意正整数,聚类之后可以得到的N个或者N+1个任务路线聚类簇;此时,第二相似度阈值即为异常账号检测模型的第一相似度阈值。
实际应用中,根据所述异常路线确定待评估任务路线是否为异常路线也是通过计算相似度进行确定的。可以先计算待评估任务路线与各簇心的相似度,相似度的计算可以采用Merge Distance算法。若待评估任务路线与各个簇心的相似度均大于或者等于第二相似度阈值,则表明所述待评估任务路线是正常路线,所述待评估任务路线对应的待评估账号为正常账号。若待评估任务路线与某个簇心的相似度小于第二相似度阈值,则表明所述待评估任务路线是异常路线,需要将所述待评估任务路线对应的待评估账号标记为异常账号。同时将检测出的异常账号进行实时封禁。
例如,如表4所示,在确定只有一个簇心的情况下,待评估任务路线有两条,分别为待评估任务路线一和待评估任务路线二。在第二相似度阈值为3的情况下,待评估任务路线一和簇心的相似度为3,等于第二相似度阈值,因此待评估任务路线一为正常路线,待评估任务路线一对应的待评估账号为正常账号;待评估任务路线二和异常路线的相似度为1,小于第二相似度阈值,因此待评估任务路线二为异常路线,将待评估任务路线二对应的待评估账号标记为异常账号。
表4待评估任务路线与异常路线的相似度
相似度 待评估任务路线一 待评估任务路线二
异常路线 3 1
需要说明的是,由于异常账号为使用外挂脚本的账号,且使用外挂脚本会破坏游戏环境平衡,可以对这些异常账号进行实时封禁。为了提高封禁的准确率,可以综合多个任务路线相似度的结果和一些辅助指标来判断该待评估账号是否为异常账号。
本申请提供的异常账号检测方法,通过获取待评估账号、待评估任务路线和参考路线,计算所述待评估任务路线与各参考路线的相似度,进一步在所述待评估任务路线与各参考路线的相似度中至少一个相似度小于第二相似度阈值时,将所述待评估任务路线对应的待评估账号标记为异常账号。保证了可以快速、准确的确定待评估账号是否为异常账号,在减少计算量的同时,提高异常账号检测的速度和准确度。此外,由于获取了参考路线,可以实现对账号的实时检测,从而实现对异常账号的实时封禁。
下述结合附图4,以本申请提供的方法在闯关游戏的应用为例,对所述异常账号检测模型训练方法和异常账号检测方法进行进一步说明。其中,图4示出了本申请一实施例提供的一种应用于闯关游戏的处理流程图,具体包括以下步骤:
步骤402:根据目标闯关任务确定至少两个目标账号。
步骤404:获取至少两个目标账号与目标闯关任务对应的至少两组轨迹数据。
获取至少两个目标账号中每个目标账号的与目标闯关任务对应的轨迹数据,得到至少两组轨迹数据。
步骤406:对至少两组轨迹数据进行排序和去重生成至少两条闯关任务路线。
步骤408:接收训练样本,所述训练样本包括至少两个目标账号以及各目标账号在目标闯关任务下的闯关任务路线,至少一个所述目标账号被标注为异常账号。
步骤410:将各目标账号和各闯关任务路线输入至异常账号检测模型,根据第一相似度阈值对各闯关任务路线进行聚类,得到至少一个闯关任务路线聚类簇。
步骤412:在异常任务路线聚类簇中闯关任务路线的数量大于或者等于异常阈值的情况下,统计所述异常任务路线聚类簇中所述异常账号对应的闯关任务路线的第一数量,所述异常任务路线聚类簇为所述至少一个任务路线聚类簇中的任意一个。
步骤414:识别所述异常任务路线聚类簇中未标注账号的账号状态,统计所述异常任务路线聚类簇中账号状态为异常的未标注账号的第二数量和账号状态为正常的未标注账号的第三数量。
步骤416:根据所述第一数量、第二数量以及第三数量调整所述第一相似度阈值和所述异常阈值,返回执行所述根据第一相似度阈值对所述各闯关任务路线进行聚类,得到至少一个任务路线聚类簇步骤,直至达到训练停止条件,保存所述异常任务路线聚类簇的簇心。
步骤418:获取待评估账号以及所述待评估账号在目标闯关任务下的待评估闯关路线。
步骤420:获取至少一条参考路线,计算所述待评估闯关路线与各参考路线的相似度。
获取异常账号检测模型中保存的至少一个簇心,将所述至少一个簇心确定为至少一条参考路线。
步骤422:在所述待评估闯关路线与各参考路线的相似度中至少一个相似度小于第二相似度阈值的情况下,将所述待评估闯关路线对应的待评估账号标记为异常账号。
可以对异常账号进行实时封禁。
本申请提供的应用于闯关游戏的异常账号检测模型训练方法,通过在对获取的数据轨迹进行排序和去重处理,极大程度上降低了服务器的计算压力,提高了计算速度;将各目标账号和各闯关任务路线输入至异常账号检测模型中,根据第一相似度阈值对各闯关任务路线进行聚类,从而获得任务路线聚类簇,在异常任务路线聚类簇中闯关任务路线的数量大于或者等于异常阈值的情况下,确定第一数量、第二数量、第三数量,进一步调整第一相似度阈值和异常阈值,继续训练,直至达到训练停止条件,此时保存异常任务路线聚类簇的簇心。可以提高对任务路线进行聚类的速度,减少计算量的同时,还可以提高样本确定异常任务路线聚类簇和簇心的准确性,提高检测异常账号的速度和准确度。此外,由于保存了异常任务路线聚类簇的簇心,可以实现对账号的实时检测,从而实现对异常账号的实时封禁。
本申请提供的应用于闯关游戏的异常账号检测方法,通过获取待评估账号和待评估闯关任务路线,计算待评估闯关路线和各参考路线的相似度,进一步在所述待评估闯关路线与各参考路线的相似度中至少一个相似度小于第二相似度阈值时,将所述待评估闯关任务路线对应的待评估账号标记为异常账号。保证了可以快速、准确的确定待评估账号是否为异常账号,在减少计算量的同时,提高异常账号检测的速度和准确度。此外,由于获取了参考路线,可以实现对账号的实时检测,从而实现对异常账号的实时封禁。
与上述异常账号检测模型训练方法实施例相对应,本申请还提供了异常账号检测模型训练装置实施例,图5示出了本申请一实施例提供的一种异常账号检测模型训练装置的结构示意图。如图5所示,该装置包括:
接收模块502,被配置为接收训练样本,其中,所述训练样本包括至少两个目标账号以及各目标账号在目标任务下的任务路线,至少一个所述目标账号被标注为异常账号;
聚类模块504,被配置为将各目标账号和各任务路线输入至异常账号检测模型,根据第一相似度阈值对所述各任务路线进行聚类,得到至少一个任务路线聚类簇;
统计模块506,被配置为在异常任务路线聚类簇中任务路线的数量大于或者等于异常阈值的情况下,统计所述异常任务路线聚类簇中所述异常账号对应的任务路线的第一数量,所述异常任务路线聚类簇为所述至少一个任务路线聚类簇中的任意一个;
识别模块508,被配置为识别所述异常任务路线聚类簇中未标注账号的账号状态,统计所述异常任务路线聚类簇中账号状态为异常的未标注账号的第二数量和账号状态为正常的未标注账号的第三数量;
调整模块510,被配置为根据所述第一数量、第二数量以及第三数量调整所述第一相似度阈值和所述异常阈值,返回执行所述根据第一相似度阈值对所述各任务路线进行聚类,得到至少一个任务路线聚类簇步骤,直至达到训练停止条件,保存所述异常任务路线聚类簇的簇心。
在本实施例的一个或多个实施方式中,所述聚类模块504,还被配置为:
选取至少两条任务路线中的第i条任务路线,将所述第i条任务路线确定为第i任务路线聚类簇的簇心,其中,i为大于或者等于1的自然数;
计算所述至少两条任务路线中任意一条未聚类的任务路线与第j任务路线聚类簇的簇心的相似度,其中,j为小于或者等于i的正整数;
在所述相似度小于第一相似度阈值的情况下,将所述任务路线添加至所述第j任务路线聚类簇中,在所述相似度大于或等于第一相似度阈值的情况下,以所述任务路线为簇心生成第i+1任务路线聚类簇;
判断所述至少两条任务路线中的任务路线是否聚类完毕,若否,则i自增1并继续执行计算所述至少两条任务路线中任意一条未聚类的任务路线与第j任务路线聚类簇的簇心的相似度的步骤,若是,则输出聚类结果。
在本实施例的一个或多个实施方式中,所述聚类模块404,还被配置为:
比较所述任务路线的长度与所述第j任务路线聚类簇的簇心的长度,若所述任务路线的长度比所述簇心的长度短,将所述任务路线确定为所述第j任务路线聚类簇的簇心。
在本实施例的一个或多个实施方式中,所述聚类模块404,还被配置为:
将i个任务路线聚类簇按照包含任务路线的数量从多到少进行排序;
按照排序顺序计算所述至少两条任务路线中任意一条未聚类的任务路线与第j任务路线聚类簇的簇心的相似度。
在本实施例的一个或多个实施方式中,所述聚类模块404,还被配置为:
确定所述至少两条任务路线中每条未聚类的任务路线的长度和i个任务路线聚类簇的簇心的长度;
将所述至少两条任务路线中未聚类的第n任务路线与i个簇心中的第j簇心进行合并处理,生成所述第n任务路线与所述第j簇心最短轨迹的合并路线,其中,所述第n任务路线为所述至少两条任务路线中任意一条未聚类的任务路线,所述第j簇心为第j任务路线聚类簇的簇心,n为大于或者等于1的自然数;
根据所述合并路线的长度、所述第n任务路线的长度以及所述第j簇心的长度确定所述第n任务路线与所述第j簇心的相似度。
在本实施例的一个或多个实施方式中,所述装置还包括确定模块,被配置为:
确定完成目标任务的至少两个目标账号,获取所述至少两个目标账号中每个目标账号的与所述目标任务对应的任务路线,得到至少两条任务路线。
在本实施例的一个或多个实施方式中,所述确定模块,还被配置为:
获取所述至少两个目标账号中每个目标账号的与所述目标任务对应的轨迹数据,得到至少两组轨迹数据;
将所述至少两组轨迹数据中每一组轨迹数据按照时间顺序进行排序并去重,得到至少两条任务路线。
本申请提供的异常账号检测模型训练装置,通过接收训练样本,将各目标账号和各任务路线输入至异常账号检测模型中,根据第一相似度阈值对各任务路线进行聚类,从而获得任务路线聚类簇,在异常任务路线聚类簇中任务路线的数量大于或者等于异常阈值的情况下,确定第一数量、第二数量、第三数量,进一步调整第一相似度阈值和异常阈值,继续训练,直至达到训练停止条件,此时保存异常任务路线聚类簇的簇心。可以提高对任务路线进行聚类的速度,减少计算量的同时,还可以提高样本确定异常任务路线聚类簇和簇心的准确性,提高检测异常账号的速度和准确度。此外,由于保存了异常任务路线聚类簇的簇心,可以实现对账号的实时检测,从而实现对异常账号的实时封禁。
上述为本实施例的一种异常账号检测模型训练装置的示意性方案。需要说明的是,该异常账号检测模型训练装置的技术方案与上述的异常账号检测模型训练方法的技术方案属于同一构思,异常账号检测模型训练装置的技术方案未详细描述的细节内容,均可以参见上述异常账号检测模型训练方法的技术方案的描述。
与上述异常账号检测方法实施例相对应,本申请还提供了异常账号检测装置实施例,图6示出了本申请一实施例提供的一种异常账号检测装置的结构示意图。如图6所示,该装置包括:
获取模块602,被配置为获取待评估账号以及所述待评估账号在目标任务下的待评估任务路线;
计算模块604,被配置为获取至少一条参考路线,计算所述待评估任务路线与各参考路线的相似度;
标记模块606,被配置为在所述待评估任务路线与各参考路线的相似度中至少一个相似度小于第二相似度阈值的情况下,将所述待评估任务路线对应的待评估账号标记为异常账号。
在本实施例的一个或多个实施方式中,所述获取模块602,还被配置为:
确定完成目标任务的待评估账号;
获取所述待评估账号与所述目标任务对应的待评估轨迹数据;
将所述待评估轨迹数据按照时间顺序进行排序并去重,得到待评估任务路线。
在本实施例的一个或多个实施方式中,所述计算模块604,还被配置为:
获取异常账号检测模型中保存的至少一个簇心,将所述至少一个簇心确定为至少一条参考路线,所述异常账号检测模型是通过上述异常账号检测模型训练方法训练得到的。
本申请提供的异常账号检测装置,通过获取待评估账号、待评估任务路线和参考路线,计算所述待评估任务路线与各参考路线的相似度,进一步在所述待评估任务路线与各参考路线的相似度中至少一个相似度小于第二相似度阈值时,将所述待评估任务路线对应的待评估账号标记为异常账号。保证了可以快速、准确的确定待评估账号是否为异常账号,在减少计算量的同时,提高异常账号检测的速度和准确度。此外,由于获取了参考路线,可以实现对账号的实时检测,从而实现对异常账号的实时封禁。
上述为本实施例的一种异常账号检测装置的示意性方案。需要说明的是,该异常账号检测装置的技术方案与上述的异常账号检测方法的技术方案属于同一构思,异常账号检测装置的技术方案未详细描述的细节内容,均可以参见上述异常账号检测方法的技术方案的描述。
图7示出了根据本说明书一个实施例提供的一种计算设备700的结构框图。该计算设备700的部件包括但不限于存储器710和处理器720。处理器720与存储器710通过总线730相连接,数据库750用于保存数据。
计算设备700还包括接入设备740,接入设备740使得计算设备700能够经由一个或多个网络760通信。这些网络的示例包括公用交换电话网(PSTN)、局域网(LAN)、广域网(WAN)、个域网(PAN)或诸如因特网的通信网络的组合。接入设备740可以包括有线或无线的任何类型的网络接口(例如,网络接口卡(NIC))中的一个或多个,诸如IEEE802.11无线局域网(WLAN)无线接口、全球微波互联接入(Wi-MAX)接口、以太网接口、通用串行总线(USB)接口、蜂窝网络接口、蓝牙接口、近场通信(NFC)接口,等等。
在本说明书的一个实施例中,计算设备700的上述部件以及图7中未示出的其他部件也可以彼此相连接,例如通过总线。应当理解,图7所示的计算设备结构框图仅仅是出于示例的目的,而不是对本说明书范围的限制。本领域技术人员可以根据需要,增添或替换其他部件。
计算设备700可以是任何类型的静止或移动计算设备,包括移动计算机或移动计算设备(例如,平板计算机、个人数字助理、膝上型计算机、笔记本计算机、上网本等)、移动电话(例如,智能手机)、可佩戴的计算设备(例如,智能手表、智能眼镜等)或其他类型的移动设备,或者诸如台式计算机或PC的静止计算设备。计算设备700还可以是移动式或静止式的服务器。
其中,处理器720执行所述计算机指令时实现所述的异常账号检测模型训练方法或异常账号检测方法的步骤。
上述为本实施例的一种计算设备的示意性方案。需要说明的是,该计算设备的技术方案与上述的异常账号检测模型训练方法或异常账号检测方法的技术方案属于同一构思,计算设备的技术方案未详细描述的细节内容,均可以参见上述异常账号检测模型训练方法或异常账号检测方法的技术方案的描述。
本申请一实施例还提供一种计算机可读存储介质,其存储有计算机指令,该计算机指令被处理器执行时实现如前所述异常账号检测模型训练方法或异常账号检测方法的步骤。
上述为本实施例的一种计算机可读存储介质的示意性方案。需要说明的是,该存储介质的技术方案与上述的异常账号检测模型训练方法或异常账号检测方法的技术方案属于同一构思,存储介质的技术方案未详细描述的细节内容,均可以参见上述异常账号检测模型训练方法或异常账号检测方法的技术方案的描述。
上述对本申请特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
所述计算机指令包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括电载波信号和电信信号。
需要说明的是,对于前述的各方法实施例,为了简便描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请并不受所描述的动作顺序的限制,因为依据本申请,某些步骤可以采用其它顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定都是本申请所必须的。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其它实施例的相关描述。
以上公开的本申请优选实施例只是用于帮助阐述本申请。可选实施例并没有详尽叙述所有的细节,也不限制该发明仅为所述的具体实施方式。显然,根据本申请的内容,可作很多的修改和变化。本申请选取并具体描述这些实施例,是为了更好地解释本申请的原理和实际应用,从而使所属技术领域技术人员能很好地理解和利用本申请。本申请仅受权利要求书及其全部范围和等效物的限制。

Claims (13)

1.一种异常账号检测模型训练方法,其特征在于,包括:
接收训练样本,其中,所述训练样本包括至少两个目标账号以及各目标账号在目标任务下的任务路线,至少一个所述目标账号被标注为异常账号;
将各目标账号和各任务路线输入至异常账号检测模型,根据第一相似度阈值对所述各任务路线进行聚类,得到至少一个任务路线聚类簇,其中,所述聚类是指将多个任务路线分成由距离相近的任务路线组成的多个簇的过程;所述任务路线聚类簇是指对任务路线进行聚类后组成的多个簇的结果,所述任务路线聚类簇中的任务路线之间的相似度小于所述第一相似度阈值;
在异常任务路线聚类簇中任务路线的数量大于或者等于异常阈值的情况下,统计所述异常任务路线聚类簇中所述异常账号对应的任务路线的第一数量,所述异常任务路线聚类簇为所述至少一个任务路线聚类簇中的任意一个;
识别所述异常任务路线聚类簇中未标注账号的账号状态,统计所述异常任务路线聚类簇中账号状态为异常的未标注账号的第二数量和账号状态为正常的未标注账号的第三数量;
根据所述第一数量、第二数量以及第三数量调整所述第一相似度阈值和所述异常阈值,返回执行所述根据第一相似度阈值对所述各任务路线进行聚类,得到至少一个任务路线聚类簇步骤,直至达到训练停止条件,保存所述异常任务路线聚类簇的簇心。
2.根据权利要求1所述的方法,其特征在于,所述根据第一相似度阈值对所述各任务路线进行聚类,得到至少一个任务路线聚类簇,包括:
选取至少两条任务路线中的第i条任务路线,将所述第i条任务路线确定为第i任务路线聚类簇的簇心,其中,i为大于或者等于1的自然数;
计算所述至少两条任务路线中任意一条未聚类的任务路线与第j任务路线聚类簇的簇心的相似度,其中,j为小于或者等于i的正整数;
在所述相似度小于第一相似度阈值的情况下,将所述任务路线添加至所述第j任务路线聚类簇中,在所述相似度大于或等于第一相似度阈值的情况下,以所述任务路线为簇心生成第i+1任务路线聚类簇;
判断所述至少两条任务路线中的任务路线是否聚类完毕,若否,则i自增1并继续执行计算所述至少两条任务路线中任意一条未聚类的任务路线与第j任务路线聚类簇的簇心的相似度的步骤,若是,则输出聚类结果。
3.根据权利要求2所述的方法,其特征在于,所述在所述相似度小于第一相似度阈值的情况下,将所述任务路线添加至所述第j任务路线聚类簇中之后,还包括:
比较所述任务路线的长度与所述第j任务路线聚类簇的簇心的长度,若所述任务路线的长度比所述簇心的长度短,将所述任务路线确定为所述第j任务路线聚类簇的簇心。
4.根据权利要求2所述的方法,其特征在于,所述计算所述至少两条任务路线中任意一条未聚类的任务路线与第j任务路线聚类簇的簇心的相似度,包括:
将i个任务路线聚类簇按照包含任务路线的数量从多到少进行排序;
按照排序顺序计算所述至少两条任务路线中任意一条未聚类的任务路线与第j任务路线聚类簇的簇心的相似度。
5.根据权利要求2所述的方法,其特征在于,所述计算所述至少两条任务路线中任意一条未聚类的任务路线与第j任务路线聚类簇的簇心的相似度,包括:
确定所述至少两条任务路线中每条未聚类的任务路线的长度和i个任务路线聚类簇的簇心的长度;
将所述至少两条任务路线中未聚类的第n任务路线与i个簇心中的第j簇心进行合并处理,生成所述第n任务路线与所述第j簇心最短轨迹的合并路线,其中,所述第n任务路线为所述至少两条任务路线中任意一条未聚类的任务路线,所述第j簇心为第j任务路线聚类簇的簇心,n为大于或者等于1的自然数;
根据所述合并路线的长度、所述第n任务路线的长度以及所述第j簇心的长度确定所述第n任务路线与所述第j簇心的相似度。
6.根据权利要求1所述的方法,其特征在于,所述接收训练样本之前,还包括:
确定完成目标任务的至少两个目标账号,获取所述至少两个目标账号中每个目标账号的与所述目标任务对应的任务路线,得到至少两条任务路线。
7.根据权利要求6所述的方法,其特征在于,所述获取所述至少两个目标账号中每个目标账号的与所述目标任务对应的任务路线,得到至少两条任务路线,包括:
获取所述至少两个目标账号中每个目标账号的与所述目标任务对应的轨迹数据,得到至少两组轨迹数据;
将所述至少两组轨迹数据中每一组轨迹数据按照时间顺序进行排序并去重,得到至少两条任务路线。
8.一种异常账号检测方法,其特征在于,包括:
获取待评估账号以及所述待评估账号在目标任务下的待评估任务路线;
获取异常账号检测模型中保存的至少一个簇心,将所述至少一个簇心确定为至少一条参考路线,所述异常账号检测模型是通过权利要求1-7任意一项训练方法训练得到的,计算所述待评估任务路线与各参考路线的相似度;
在所述待评估任务路线与各参考路线的相似度中至少一个相似度小于第二相似度阈值的情况下,将所述待评估任务路线对应的待评估账号标记为异常账号。
9.根据权利要求8所述的方法,其特征在于,所述获取待评估账号以及所述待评估账号在目标任务下的待评估任务路线,包括:
确定完成目标任务的待评估账号;
获取所述待评估账号与所述目标任务对应的待评估轨迹数据;
将所述待评估轨迹数据按照时间顺序进行排序并去重,得到待评估任务路线。
10.一种异常账号检测模型训练装置,其特征在于,包括:
接收模块,被配置为接收训练样本,其中,所述训练样本包括至少两个目标账号以及各目标账号在目标任务下的任务路线,至少一个所述目标账号被标注为异常账号;
聚类模块,被配置为将各目标账号和各任务路线输入至异常账号检测模型,根据第一相似度阈值对所述各任务路线进行聚类,得到至少一个任务路线聚类簇,其中,所述聚类是指将多个任务路线分成由距离相近的任务路线组成的多个簇的过程;所述任务路线聚类簇是指对任务路线进行聚类后组成的多个簇的结果,所述任务路线聚类簇中的任务路线之间的相似度小于所述第一相似度的阈值;
统计模块,被配置为在异常任务路线聚类簇中任务路线的数量大于或者等于异常阈值的情况下,统计所述异常任务路线聚类簇中所述异常账号对应的任务路线的第一数量,所述异常任务路线聚类簇为所述至少一个任务路线聚类簇中的任意一个;
识别模块,被配置为识别所述异常任务路线聚类簇中未标注账号的账号状态,统计所述异常任务路线聚类簇中账号状态为异常的未标注账号的第二数量和账号状态为正常的未标注账号的第三数量;
调整模块,被配置为根据所述第一数量、第二数量以及第三数量调整所述第一相似度阈值和所述异常阈值,返回执行所述根据第一相似度阈值对所述各任务路线进行聚类,得到至少一个任务路线聚类簇步骤,直至达到训练停止条件,保存所述异常任务路线聚类簇的簇心。
11.一种异常账号检测装置,其特征在于,包括:
获取模块,被配置为获取待评估账号以及所述待评估账号在目标任务下的待评估任务路线;
计算模块,被配置为获取至少一条参考路线,计算所述待评估任务路线与各参考路线的相似度,所述参考路线从权利要求1-7任意一项训练方法训练得到的异常账号检测模型中获取,所述参考路线为所述异常账号检测模型中保存的异常任务路线聚类簇的簇心;
标记模块,被配置为在所述待评估任务路线与各参考路线的相似度中至少一个相似度小于第二相似度阈值的情况下,将所述待评估任务路线对应的待评估账号标记为异常账号。
12.一种计算设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机指令,其特征在于,所述处理器执行所述计算机指令时实现权利要求1-7或者权利要求8-9任意一项所述方法的步骤。
13.一种计算机可读存储介质,其存储有计算机指令,其特征在于,该计算机指令被处理器执行时实现权利要求1-7或者权利要求8-9任意一项所述方法的步骤。
CN202110803010.9A 2021-07-15 2021-07-15 异常账号检测模型训练方法和异常账号检测方法 Active CN113521750B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110803010.9A CN113521750B (zh) 2021-07-15 2021-07-15 异常账号检测模型训练方法和异常账号检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110803010.9A CN113521750B (zh) 2021-07-15 2021-07-15 异常账号检测模型训练方法和异常账号检测方法

Publications (2)

Publication Number Publication Date
CN113521750A CN113521750A (zh) 2021-10-22
CN113521750B true CN113521750B (zh) 2023-10-24

Family

ID=78128173

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110803010.9A Active CN113521750B (zh) 2021-07-15 2021-07-15 异常账号检测模型训练方法和异常账号检测方法

Country Status (1)

Country Link
CN (1) CN113521750B (zh)

Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104917739A (zh) * 2014-03-14 2015-09-16 腾讯科技(北京)有限公司 虚假账号的识别方法及装置
CN105809502A (zh) * 2014-12-30 2016-07-27 阿里巴巴集团控股有限公司 交易风险检测方法和装置
CN105825242A (zh) * 2016-05-06 2016-08-03 南京大学 基于混合网格分层聚类的集群通信终端轨迹实时异常检测方法与系统
CN107158707A (zh) * 2017-04-27 2017-09-15 浙江大学 一种针对MMORPGs游戏的异常检测方法及装置
CN108073945A (zh) * 2017-11-13 2018-05-25 珠海金山网络游戏科技有限公司 一种基于设备登录密度预判游戏工作室的方法和装置
CN108692736A (zh) * 2018-05-28 2018-10-23 苏州格目软件技术有限公司 一种基于深度学习的智能学步方法及其系统
CN108898418A (zh) * 2018-05-31 2018-11-27 康键信息技术(深圳)有限公司 用户账号检测方法、装置、计算机设备和存储介质
CN110225036A (zh) * 2019-06-12 2019-09-10 北京奇艺世纪科技有限公司 一种账号检测方法、装置、服务器及存储介质
CN110427999A (zh) * 2019-07-26 2019-11-08 武汉斗鱼网络科技有限公司 一种账号相关性评估方法、装置、设备及介质
CN110717828A (zh) * 2019-09-09 2020-01-21 中国科学院计算技术研究所 一种基于频繁交易模式的异常账户检测方法及系统
WO2020038353A1 (zh) * 2018-08-21 2020-02-27 瀚思安信(北京)软件技术有限公司 异常行为检测方法及系统
WO2021007757A1 (zh) * 2019-07-15 2021-01-21 深圳市欢太科技有限公司 用户识别方法及相关产品
CN112717418A (zh) * 2021-01-19 2021-04-30 王怡 一种基于大数据的网络游戏登录系统及方法
CN112883359A (zh) * 2021-03-12 2021-06-01 河北亚迎科技有限公司 一种动态验证方法和系统

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10685355B2 (en) * 2016-12-04 2020-06-16 Biocatch Ltd. Method, device, and system of detecting mule accounts and accounts used for money laundering
CN107391569B (zh) * 2017-06-16 2020-09-15 阿里巴巴集团控股有限公司 数据类型的识别、模型训练、风险识别方法、装置及设备
KR102173592B1 (ko) * 2018-10-16 2020-11-03 주식회사 카카오게임즈 비정상 게임 플레이 감지 방법
US11010829B2 (en) * 2019-06-24 2021-05-18 Accenture Global Solutions Limited Liquidity management system

Patent Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104917739A (zh) * 2014-03-14 2015-09-16 腾讯科技(北京)有限公司 虚假账号的识别方法及装置
CN105809502A (zh) * 2014-12-30 2016-07-27 阿里巴巴集团控股有限公司 交易风险检测方法和装置
CN105825242A (zh) * 2016-05-06 2016-08-03 南京大学 基于混合网格分层聚类的集群通信终端轨迹实时异常检测方法与系统
CN107158707A (zh) * 2017-04-27 2017-09-15 浙江大学 一种针对MMORPGs游戏的异常检测方法及装置
CN108073945A (zh) * 2017-11-13 2018-05-25 珠海金山网络游戏科技有限公司 一种基于设备登录密度预判游戏工作室的方法和装置
CN108692736A (zh) * 2018-05-28 2018-10-23 苏州格目软件技术有限公司 一种基于深度学习的智能学步方法及其系统
CN108898418A (zh) * 2018-05-31 2018-11-27 康键信息技术(深圳)有限公司 用户账号检测方法、装置、计算机设备和存储介质
WO2020038353A1 (zh) * 2018-08-21 2020-02-27 瀚思安信(北京)软件技术有限公司 异常行为检测方法及系统
CN110225036A (zh) * 2019-06-12 2019-09-10 北京奇艺世纪科技有限公司 一种账号检测方法、装置、服务器及存储介质
WO2021007757A1 (zh) * 2019-07-15 2021-01-21 深圳市欢太科技有限公司 用户识别方法及相关产品
CN110427999A (zh) * 2019-07-26 2019-11-08 武汉斗鱼网络科技有限公司 一种账号相关性评估方法、装置、设备及介质
CN110717828A (zh) * 2019-09-09 2020-01-21 中国科学院计算技术研究所 一种基于频繁交易模式的异常账户检测方法及系统
CN112717418A (zh) * 2021-01-19 2021-04-30 王怡 一种基于大数据的网络游戏登录系统及方法
CN112883359A (zh) * 2021-03-12 2021-06-01 河北亚迎科技有限公司 一种动态验证方法和系统

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
基于轨迹相似度的伴随人员推荐;廖闻剑等;计算机系统应用;第27卷(第4期);第157-161页 *
无监督机器学习在游戏反欺诈领域的应用研究;徐瑜等;信息网络安全;第20卷(第9期);第32-36页 *

Also Published As

Publication number Publication date
CN113521750A (zh) 2021-10-22

Similar Documents

Publication Publication Date Title
CN113521749B (zh) 异常账号检测模型训练方法和异常账号检测方法
US20230191229A1 (en) Method and System for Interactive, Interpretable, and Improved Match and Player Performance Predictions in Team Sports
Lee et al. Game data mining competition on churn prediction and survival analysis using commercial game log data
CN111773732B (zh) 目标游戏用户的检测方法、装置及设备
CN105069534A (zh) 客户流失预测方法以及装置
CN107545245A (zh) 一种年龄估计方法及设备
CN112434742A (zh) 一种识别以太坊上庞氏骗局的方法、系统及设备
CN107335220B (zh) 一种消极用户的识别方法、装置及服务器
CN108304853B (zh) 游戏相关度的获取方法、装置、存储介质和电子装置
CN109784997B (zh) 一种基于大数据的短视频活跃用户预测方法
CN109011580B (zh) 残局牌面获取方法、装置、计算机设备及存储介质
CN110879856A (zh) 一种基于多特征融合的社交群体分类方法及系统
KR101881647B1 (ko) 온라인 게임에서의 위치 기반 그룹 분류를 통한 봇 탐지 방법, 장치, 및 컴퓨터 프로그램
CN112712383A (zh) 应用程序的潜在用户预测方法、装置、设备及存储介质
CN113521750B (zh) 异常账号检测模型训练方法和异常账号检测方法
AU2021240278A1 (en) Face identification methods and apparatuses
CN111389013B (zh) 游戏中的自动挂检测方法、装置、设备及存储介质
Sinha Application of machine learning in cricket and Predictive Analytics of IPL 2020
CN109285034B (zh) 一种向人群投放业务的方法和装置
Saranya et al. Ipl data analysis and visualization for team selection and profit strategy
CN115730831A (zh) 施工作业组织行为的安全指数评估方法、装置和电子设备
CN114676324A (zh) 一种数据处理方法、装置及设备
CN113127696A (zh) 一种提高基于行为的影响力度量准确性方法
CN112494952B (zh) 目标游戏用户的检测方法、装置及设备
CN110443374A (zh) 一种资源信息处理方法、装置及设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information
CB02 Change of applicant information

Address after: 519000 Room 102, 202, 302 and 402, No. 325, Qiandao Ring Road, Tangjiawan Town, high tech Zone, Zhuhai City, Guangdong Province, Room 102 and 202, No. 327 and Room 302, No. 329

Applicant after: Zhuhai Jinshan Digital Network Technology Co.,Ltd.

Address before: 519000 Room 102, 202, 302 and 402, No. 325, Qiandao Ring Road, Tangjiawan Town, high tech Zone, Zhuhai City, Guangdong Province, Room 102 and 202, No. 327 and Room 302, No. 329

Applicant before: ZHUHAI KINGSOFT ONLINE GAME TECHNOLOGY Co.,Ltd.

GR01 Patent grant
GR01 Patent grant