CN113521749A - 异常账号检测模型训练方法和异常账号检测方法 - Google Patents

异常账号检测模型训练方法和异常账号检测方法 Download PDF

Info

Publication number
CN113521749A
CN113521749A CN202110803006.2A CN202110803006A CN113521749A CN 113521749 A CN113521749 A CN 113521749A CN 202110803006 A CN202110803006 A CN 202110803006A CN 113521749 A CN113521749 A CN 113521749A
Authority
CN
China
Prior art keywords
task
route
abnormal
processed
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110803006.2A
Other languages
English (en)
Other versions
CN113521749B (zh
Inventor
余赢超
黎寅
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhuhai Kingsoft Online Game Technology Co Ltd
Original Assignee
Zhuhai Kingsoft Online Game Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhuhai Kingsoft Online Game Technology Co Ltd filed Critical Zhuhai Kingsoft Online Game Technology Co Ltd
Priority to CN202110803006.2A priority Critical patent/CN113521749B/zh
Publication of CN113521749A publication Critical patent/CN113521749A/zh
Application granted granted Critical
Publication of CN113521749B publication Critical patent/CN113521749B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • AHUMAN NECESSITIES
    • A63SPORTS; GAMES; AMUSEMENTS
    • A63FCARD, BOARD, OR ROULETTE GAMES; INDOOR GAMES USING SMALL MOVING PLAYING BODIES; VIDEO GAMES; GAMES NOT OTHERWISE PROVIDED FOR
    • A63F13/00Video games, i.e. games using an electronically generated display having two or more dimensions
    • A63F13/70Game security or game management aspects
    • A63F13/75Enforcing rules, e.g. detecting foul play or generating lists of cheating players
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Computation (AREA)
  • Evolutionary Biology (AREA)
  • Multimedia (AREA)
  • Business, Economics & Management (AREA)
  • General Business, Economics & Management (AREA)
  • Probability & Statistics with Applications (AREA)
  • Computer Security & Cryptography (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请提供异常账号检测模型训练方法和异常账号检测方法,其中所述异常账号检测模型训练方法包括:接收训练样本,包括至少两个目标账号和对应的任务路线;将各任务路线输入至异常账号检测模型,计算各任务路线之间的相似度;根据相似度以及相似度阈值,将各目标账号和任务路线划分为至少一个分组;统计异常分组中异常账号对应的任务路线的第一数量;识别异常分组中未标注账号的账号状态,统计异常分组中账号状态为异常的未标注账号的第二数量和账号状态为正常的未标注账号的第三数量;根据第一数量、第二数量以及第三数量调整相似度阈值和异常阈值,继续训练异常账号检测模型,直至达到训练停止条件。如此,可以提高检测异常账号的效率和准确度。

Description

异常账号检测模型训练方法和异常账号检测方法
技术领域
本申请涉及计算机技术领域,特别涉及一种异常账号检测模型训练方法和异常账号检测方法。
背景技术
随着计算机技术的快速发展,各种各样的游戏层出不穷。在游戏领域,大型多人在线角色扮演游戏最受欢迎,针对此类游戏出现了很多工作室,例如打金工作室、代练工作室。这些工作室由游戏高端玩家或爱好者使用大量高级配置电脑运行外挂脚本进行游戏,以收取现实货币来帮玩家赚游戏币和代练,这两个业务都会通过大量使用外挂脚本的目标账号做升级历程任务。这种行为会直接对其他正常玩家产生负面影响,破坏游戏环境和经济平衡。
现有技术中,一般使用账号登录设备或者游戏角色的一些数值特征来对使用外挂脚本的异常账号进行判断,例如登录IP、发言内容、发言频率、战斗力、在线时长、充值等。但是,上述方法人力成本较高,同时由于外挂脚本的变化,使用数值特征进行判断会经常性失效,导致检测异常账号的效率低、准确度低。因此,亟需提供一种检测效率高、准确度高的检测异常账号的方法。
发明内容
有鉴于此,本申请实施例提供了一种异常账号检测模型训练的方法。本申请同时涉及一种异常账号检测模型训练装置,一种异常账号检测方法,一种异常账号检测装置,一种计算设备,以及一种计算机可读存储介质,以解决现有技术中存在的缺陷。
根据本申请实施例的第一方面,提供了一种异常账号检测模型训练方法,包括:
接收训练样本,其中,所述训练样本包括至少两个目标账号以及各目标账号在目标任务下的任务路线,至少一个所述目标账号被标注为异常账号;
将各目标账号和各任务路线输入至异常账号检测模型,计算任意两条任务路线之间的相似度;根据所述任意两条任务路线之间的相似度以及相似度阈值,将所述各任务路线划分为至少一个分组;
在异常分组中的任务路线的数量大于或者等于异常阈值的情况下,统计所述异常分组中所述异常账号对应的任务路线的第一数量,所述异常分组为所述至少一个分组中的任意一个;
识别所述异常分组中未标注账号的账号状态,统计所述异常分组中账号状态为异常的未标注账号的第二数量和账号状态为正常的未标注账号的第三数量;
根据所述第一数量、第二数量以及第三数量调整所述相似度阈值和所述异常阈值,返回执行所述根据所述任意两条任务路线之间的相似度以及相似度阈值,将所述各任务路线划分为至少一个分组步骤,直至达到训练停止条件。
根据本申请实施例的第二方面,提供了一种异常账号检测方法,包括:
获取至少两个待处理账号以及各待处理账号在目标任务下的待处理任务路线;
计算任意两条待处理任务路线之间的相似度;根据所述任意两条待处理任务路线之间的相似度以及相似度阈值,将所述待处理任务路线划分为至少一个分组;
在异常分组中的待处理任务路线的数量大于或者等于异常阈值的情况下,将所述异常分组中待处理任务路线对应的待处理账号标记为异常账号,所述异常分组为所述至少一个分组中的任意一个。
根据本申请实施例的第三方面,提供了一种异常账号检测模型训练装置,包括:
接收模块,被配置为接收训练样本,其中,所述训练样本包括至少两个目标账号以及各目标账号在目标任务下的任务路线,至少一个所述目标账号被标注为异常账号;
第一计算模块,被配置为将各目标账号和各任务路线输入至异常账号检测模型,计算任意两条任务路线之间的相似度;根据所述任意两条任务路线之间的相似度以及相似度阈值,将所述各任务路线划分为至少一个分组;
统计模块,被配置为在异常分组中的任务路线的数量大于或者等于异常阈值的情况下,统计所述异常分组中所述异常账号对应的任务路线的第一数量,所述异常分组为所述至少一个分组中的任意一个;
识别模块,被配置为识别所述异常分组中未标注账号的账号状态,统计所述异常分组中账号状态为异常的未标注账号的第二数量和账号状态为正常的未标注账号的第三数量;
调整模块,被配置为根据所述第一数量、第二数量以及第三数量调整所述相似度阈值和所述异常阈值,返回执行所述根据所述任意两条任务路线之间的相似度以及相似度阈值,将所述各任务路线划分为至少一个分组步骤,直至达到训练停止条件。
根据本申请实施例的第四方面,提供了一种异常账号检测装置,包括:
获取模块,被配置为获取至少两个待处理账号以及各待处理账号在目标任务下的待处理任务路线;
第二计算模块,被配置为计算任意两条待处理任务路线之间的相似度;根据所述任意两条待处理任务路线之间的相似度以及相似度阈值,将所述待处理任务路线划分为至少一个分组;
标记模块,被配置为在异常分组中的待处理任务路线的数量大于或者等于异常阈值的情况下,将所述异常分组中待处理任务路线对应的待处理账号标记为异常账号,所述异常分组为所述至少一个分组中的任意一个。
根据本申请实施例的第五方面,提供了一种计算设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机指令,所述处理器执行所述计算机指令时实现所述异常账号检测模型训练方法或所述异常账号检测方法的步骤。
根据本申请实施例的第六方面,提供了一种计算机可读存储介质,其存储有计算机指令,该计算机指令被处理器执行时实现所述异常账号检测模型训练方法或所述异常账号检测方法的步骤。
本申请提供的异常账号检测模型训练方法,通过接收训练样本,将各目标账号和各任务路线输入至异常账号检测模型中,计算多条任务路线两两之间的相似度,并根据相似度阈值进行分组,在异常分组中的任务路线的数量大于或者等于异常阈值的情况下,确定第一数量、第二数量、第三数量,进一步调整相似度阈值和异常阈值,继续训练,直至达到训练停止条件。如此,不仅可以提高对任务路线进行分组的速度,还可以提高样本确定异常分组的准确性,在节省人力成本的同时,提高异常账号检测模型的效率和准确度,进一步提高了检测异常账号的效率和准确度。
附图说明
图1是本申请一实施例提供的一种异常账号检测模型训练方法的流程图;
图2是本申请一实施例提供的一种对任务路线进行合并处理的示意图;
图3A是本申请一实施例提供的一种异常账号检测方法的流程图;
图3B是本申请一实施例提供的一种对待处理任务路线进行分组处理结果的示意图;
图3C是本申请一实施例提供的第一种异常账号对应的目标路线的示意图;
图3D是本申请一实施例提供的第二种异常账号对应的目标路线的示意图;
图3E是本申请一实施例提供的第三种异常账号对应的目标路线的示意图;
图4是本申请一实施例提供的一种应用于骑行游戏的处理流程图;
图5是本申请一实施例提供的一种异常账号检测模型训练装置的结构示意图;
图6是本申请一实施例提供的一种异常账号检测装置的结构示意图;
图7是本申请一实施例提供的一种计算设备的结构框图。
具体实施方式
在下面的描述中阐述了很多具体细节以便于充分理解本申请。但是本申请能够以很多不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本申请内涵的情况下做类似推广,因此本申请不受下面公开的具体实施的限制。
在本申请一个或多个实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本申请一个或多个实施例。在本申请一个或多个实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本申请一个或多个实施例中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
应当理解,尽管在本申请一个或多个实施例中可能采用术语第一、第二等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本申请一个或多个实施例范围的情况下,第一也可以被称为第二,类似地,第二也可以被称为第一。取决于语境,如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”。
首先,对本申请一个或多个实施例涉及的名词术语进行解释。
打金工作室:专门的游戏工作室,通过不断地打怪或者做任务来获取虚拟道具和金币,通过游戏交易平台卖给需要的玩家换取现实货币。
代练工作室:是指游戏里为了赚取一定利润而为别人服务代为操作的游戏工作室,通过帮助雇主实现游戏中一定的级别经验和装备等而赚取现实货币。
异常账号:是指未按照游戏运行规则做任务的游戏账号。
Merge Distance算法:是一种应用在GPS轨迹上判断两个轨迹是否相似的高效算法,它利用动态规划的方式找到两条路线每个点连起来后的最小长度的轨迹,然后将获得的轨迹长度和原本的两条路线的长度进行比较,以此来判断原本的两条路线是否相似。
DBSCAN算法:Density-Based Spatial Clustering of Applications withNoise算法的简称,是一个比较有代表性的基于密度的聚类算法,它将簇定义为密度相连的点的最大集合,能够把具有足够高密度的区域划分为簇,并可在噪声的空间数据库中发现任意形状的聚类。
在本申请中,提供了一种异常账号检测模型训练方法和异常账号检测方法,本申请同时涉及一种异常账号检测模型训练装置和异常账号检测装置,一种计算设备,以及一种计算机可读存储介质,在下面的实施例中逐一进行详细说明。
图1示出了根据本申请一实施例提供的一种异常账号检测模型训练方法的流程图,具体包括以下步骤:
步骤102:接收训练样本,其中,所述训练样本包括至少两个目标账号以及各目标账号在目标任务下的任务路线,至少一个所述目标账号被标注为异常账号。
具体的,所述训练样本为用于训练异常账号检测模型的样本,训练样本包括至少两个目标账号以及所述至少两个目标账号中每个目标账号与所述目标任务对应的任务路线;所述目标任务是指人工或者机器按照一定条件进行选择的用于检测异常账号的任务,例如运送物品、谈话等任务;所述目标账号是指完成目标任务的游戏角色对应的账号;所述任务路线是指目标账号对应的游戏角色完成目标任务所行走的路线;所述异常账号是指目标账号中使用外挂脚本的账号。需要说明的是目标账号与其对应的任务路线相关联,或者说目标账号是任务路线的一个属性标记。
实际应用中,为了对异常账号检测模型进行训练,会使用大量的训练样本对其进行训练,以达到一定的训练标准,也即接收到大量目标账号以及各目标账号在目标任务下的任务路线,其中,一个目标账号对应一条任务路线。需要说明的是在接收的目标账号中,有一部分是已知存在异常的目标账号,将这部分账号标注为异常账号。而接收的目标账号中除异常账号以外的其他目标账号是否异常是未知的,也即不确定其他目标账号是否异常,其他目标账号也可能是异常账号,也可能是正常账号。
例如,接收到100个目标账号以及对应的100条任务路线,在这100个目标账号中,有5个目标账号为已知异常,则这5个目标账号被标注为异常账号,其余95个目标账号为未知的,其中有未知的异常账号和未知的正常账号。
为了保证训练的顺利进行,还需要在接收训练样本之前,确定目标账号和任务路线,也即在接收训练样本之前,确定完成目标任务的至少两个目标账号,获取所述至少两个目标账号中每个目标账号的与所述目标任务对应的任务路线,得到至少两条任务路线。
实际应用中,需要根据选定的目标任务确定完成所述目标任务对应的账号,即目标账号,由于目标账号只有一个时对检测异常账号来说是无效的,所以所述目标账号的数量可以是两个及两个以上。在确定了至少两个目标账号的基础上,进一步地确定所述至少两个目标账号完成目标任务所对应的任务路线。
例如,以任务T为目标任务,根据任务T确定完成了任务T的账号A、账号B、账号C,即账号A、账号B、账号C均为目标账号,进一步地,获取账号A、账号B、账号C完成任务T所对应路线a、路线b、路线c,即路线a、路线b、路线c为任务路线,其中账号A对应路线a、账号B对应路线b、账号C对应路线c。
本申请中,先根据目标任务确定目标账号,再确定目标账号与目标任务对应的任务路线,在简化获取任务路线过程的同时,不仅可以提高获取任务路线的精确度,还一定程度上提高了获取任务路线的速度。
实际应用中,所述确定完成目标任务的至少两个目标账号之前,还需要确定目标任务和轨迹数据记录的频率,具体实现过程可以如下:
确定至少一个目标路线和轨迹数据记录的频率,其中,所述至少一个目标路线为路线长度大于长度阈值且路线复杂度大于复杂度阈值的路线,所述路线复杂度包括弯道数量和/或障碍数量;
根据所述至少一个目标路线确定目标任务。
具体的,所述至少一个目标路线是指完成某个任务时游戏角色需要经过的路线;所述轨迹数据记录的频率是指游戏角色位置的频率;所述长度阈值与所述复杂度阈值均为预先设定的一些数值;所述路线复杂度是指根据路线中含有弯道以及障碍的数量确定的路线复杂程度的值。
由于异常账号对应的玩家为了提高做任务的效率以及外挂脚本运行的稳定性,在执行游戏中的任务时一般选择较为宽敞的路线,以避免网速延迟、电脑卡顿而导致游戏角色偏离预设的路线。为了确保异常账号与正常账号的区别,首先要确定完成目标任务和轨迹数据记录的频率。其中,确定目标任务需要先确定目标路线,目标路线可以是较为宽敞的路线。需要说明的是,为了有足够长的路线来区分游戏角色是由外挂脚本操作还是人工操作,需要选择较长的路线作为目标路线,即目标路线的路线长度需要大于长度阈值。在此基础上,进一步地,由于对于弯道、障碍较多的路线,人工操作的游戏角色一般会寻找近道,例如跳过障碍、使用技能越过弯道等,因此在路线较长的基础上选择弯道多、障碍多的路线作为目标路线,由于弯道和障碍的数量决定了路线复杂度,所以目标路线不仅需要满足路线长度大于长度阈值的条件,还需要满足路线复杂度大于复杂度阈值的条件。在确定目标路线的基础上,将目标路线对应的任务确定为目标任务。此外,轨迹数据记录的频率的确定,不仅要保证轨迹数据记录的完整性,还要需要避免数据冗余的问题,优选的,所述轨迹数据记录的频率每秒2次,即2次/秒。
例如,选取路线A,其中,路线A中有5个弯道和8个障碍,此时路线A的路线复杂度为13,在复杂度阈值为10的情况下,路线A的路线复杂度大于复杂度阈值;且路线A的路线长度为1300米,在长度阈值为1000米的情况下,路线A的路线长度大于长度阈值,此时就可以将路线A确定为目标路线。进一步地将通过路线A可以执行的任务B确定为目标任务。此外,还需要确定轨迹数据记录的频率,以2次/秒为最佳。
本申请中,从路线长度和路线复杂度两个方面共同确定目标路线,保证了有足够长、足够复杂的路线来区分异常账号和正常账号;根据目标路线确定目标任务一定程度上提高了目标任务的有效性,进一步提高了检测异常账号的准确度和速度。此外,确定轨迹数据记录的频率,在保证轨迹数据完整的同时,一定程度上可以减少轨迹数据的数据量,从而可以有效地提高后续的计算速度并提高检测异常账号的速度。
可选地,在确定完成目标任务的至少两个目标账号时,由于没有时间限制,可能会获取到数量巨大的目标账号,从而导致后续获取的任务路线数量过多,造成服务器的计算负担过重,因此,可以确定一段时间内的完成目标任务的至少两个目标账号来避免上述问题。具体实现过程可以为:根据所述目标任务的完成情况确定预设时间;确定所述预设时间内完成所述目标任务的至少两个目标账号。
具体的,所述目标任务的完成情况是指完成目标任务的次数;所述预设时间可以是提前设定好的一个时间段,例如2021年1月1日至2021年1月2日。可以预先查看完成目标任务的次数,即完成情况,根据目标任务的完成情况确定预设时间,以保证在预设时间内完成目标任务的目标账号数量适中,避免数量过少无法检测异常账号或者数量过多服务器计算负担过重的问题。在确定了预设时间的基础上,对应的确定所述预设时间内完成目标任务的至少两个目标账号。
例如,表1示出了1月1日至1月7日目标任务的完成情况,其中以1月4日目标任务的完成情况最为适中,因此以1月4日为预设时间,从而确定1月4日这一天内完成目标任务的所有目标账号。
表1目标任务的完成情况
日期 1.1 1.2 1.3 1.4 1.5 1.6 1.7
完成情况/次 100 200 300 400 500 600 700
在本实施例的一个或多个实施方式中,获取所述至少两个目标账号的与所述目标任务对应的至少两条任务路线的具体实现过程可以如下:
获取所述至少两个目标账号中每个目标账号的与所述目标任务对应的轨迹数据,得到至少两组轨迹数据;
将所述至少两组轨迹数据中每一组轨迹数据按照时间顺序进行排序并去重,得到至少两条任务路线。
具体的,所述轨迹数据是指服务器所记载的目标账号完成目标任务过程中的所有表示游戏角色位置的数据,例如轨迹数据可以由(X1,Y1)、(X2,Y2)等数据组成;所述排序是指将一组无序轨迹数据调整为有序的轨迹数据;所述去重是指将有序的轨迹数据中相邻时间相同的数据保留一个数据后删除其他相同的数据。
实际应用中,在确定了目标账号的基础上,进一步地,可以从数据库中获取目标账号与所述目标任务对应的轨迹数据。进一步地,为了减少计算量,获取的轨迹数据可以是游戏角色行进过程中的轨迹数据。由于轨迹数据是由多个数据组成的,为了使轨迹数据可能更加精准地表示游戏角色的任务路线,需要将每一组轨迹数据中的数据按照时间先后顺序进行排序。为了避免游戏角色在接到目标任务后站在原地不动,从而导致轨迹数据中时间序列上出现多个相邻的重复数据,需要对重复的数据进行去重处理,即将排序后的时间序列上相邻并且相同的多个数据进行去重,仅保留其中一个数据。去重完成后,根据处理后的轨迹数据生成任务路线。
例如,获取了目标账号A与目标任务对应的轨迹数据B,其中,轨迹数据B为“1,4,5,3,3,4,2,3,3,3,3,4,6”,对轨迹数据B按照时间顺序进行排序处理后,轨迹数据B变为“1,2,3,3,3,3,4,5,3,3,4,4,6”。在对排序后的轨迹数据B进行去重处理,为“1,2,3,4,5,3,4,6”,之后就可以根据去重后的轨迹数据B生成对应的任务路线。
本申请中,通过对轨迹数据进行排序处理可以使后续生成任务路线更精准,即提高了获取任务路线的准确性和有效性。此外,通过对排序后的轨迹数据进行去重处理,一定程度上减少了冗余的计算,从而降低了服务器的计算压力。
需要说明的是,为了避免由于目标任务选取错误而造成异常账号检测模型训练无法成功的情况,在接收训练样本之前,还需要检测目标任务是否可用,具体实现过程可以如下:
根据所述至少两条任务路线判断所述目标任务是否符合异常账号的检测条件;
若否,更换目标任务,确定完成更换后的目标任务的至少两个目标账号,获取所述至少两个目标账号的与所述更换后的目标任务对应的至少两条任务路线;
若是,则接收训练样本。
具体的,所述异常账号的检测条件是指为了更加准确、更加快速地检测异常账号而设置的一些条件。可以根据获取的任务路线对目标任务进行判断,判断所述目标任务是否符合异常账号的检测条件。如果目标任务符合异常账号的检测条件,则可以执行下一步操作,即计算所述至少两条任务路线中任意两条任务路线之间的相似度;如果目标任务不符合异常账号的检测条件,此时需要更换目标任务,并重新确定与更换后的目标任务对应的目标账号,进一步获取对应的任务路线,以便于对更换后的目标任务继续进行判断是否符合异常账号的检测条件。
例如,目标任务为任务A,与任务A对应的任务路线有任务路线a和任务路线b,根据任务路线a和任务路线b的长度、复杂度等,判断任务A是否符合异常账号的检测条件,在任务A符合异常账号的检测条件的情况下,进一步计算任务路线a和任务路线b的相似度;在任务A不符合异常账号的检测条件的情况下,将目标任务更换为任务B,根据任务B确定出目标账号一、目标账号二、目标账号三,并进一步获取到任务路线c、任务路线d和任务路线e,同样的根据任务路线c、任务路线d和任务路线e判断任务B是否符合异常账号的检测条件,依次循环,直至目标任务符合异常账号的检测条件。
本申请中,通过对目标任务进行判断,一定程度上保证了后续分组结果的有效性和准确性,间接地保证了检测异常账号的精准度。
在本实施例的一个或多个实施方式中,所述根据所述至少两条任务路线判断所述目标任务是否符合异常账号的检测条件,包括:
根据所述至少两条任务路线判断所述目标任务是否具有固定的任务起点以及固定的任务终点。
具体的,所述任务起点是指目标任务的出发点,例如做挑水任务时拿取水桶的地点,即为任务起点;所述任务终点是指完成目标任务的最终地点,例如做挑水任务时的水井所在的地点,即为任务终点。
通过将获取的所有任务路线绘制在一个二维坐标图上,根据绘制的二维坐标图观察任务路线是否具有固定的起点和固定的终点,从而确定对应的目标任务是否具有固定的任务起点、固定的任务终点。在具有固定的任务起点和固定的任务终点的情况下,所述目标任务符合异常账号的检测条件。
例如,目标任务A对应的任务路线有任务路线a、任务路线b和任务路线c,当任务路线a、任务路线b以及任务路线c的起点均为(x1,y1)、终点均为(x2,y2)时,说明目标任务A具有固定的任务起点(x1,y1)、固定的任务终点(x2,y2),则说明目标任务A符合异常账号的检测条件。需要说明的是,目标任务A缺少固定的任务起点、固定的任务终点中至少一个特征,即目标任务A不符合异常账号的检测条件。
此外,在本实施例的一个或多个实施方式中,异常账号的检测条件包括具有固定的任务起点、固定的任务终点以及固定的任务开始时间。也即判断在目标任务具有固定的任务起点、固定的任务终点的基础上,还需要进一步判断目标任务是否具有固定的任务开始时间。所述任务开始时间是指目标任务的开启时间,也即游戏角色可以开始做任务的时间。
本申请中,通过固定的任务起点以及固定的任务终点两个条件判断目标任务是否符合异常账号的检测条件,不仅提高了异常账号检测模型训练过程中目标任务的有效性,还间接提高了异常账号检测模型检测结果的准确性。
步骤104:将各目标账号和各任务路线输入至异常账号检测模型,计算任意两条任务路线之间的相似度;根据所述任意两条任务路线之间的相似度以及相似度阈值,将所述各任务路线划分为至少一个分组。
在接收到训练样本的基础上,进一步地,将接收到的样本输入至异常账号检测模型,开始训练,需要两两计算任务路线之间的相似度并将任务路线进行分组。
具体的,所述相似度是指获取的至少两条任务路线中任意两条任务路线相似的程度。所述相似度阈值可以是预先设定的用于衡量任务路线之间是否相似的临界值。
实际应用中,可以通过计算相似度的一些算法计算获取的至少任务路线中任意两条任务路线之间的相似度。例如,获取的任务路线有三条:任务路线A、任务路线B以及任务路线C,此时,需要计算任务路线A和任务路线B的相似度、任务路线A和任务路线C的相似度、任务路线C和任务路线B的相似度。如此,可以为后续根据相似度对任务路线进行分组做好了准备,还可以提高检测异常账号的效率。
在本实施例的一个或多个实施方式中,所述计算所述至少两条任务路线中任意两条任务路线之间的相似度的具体实现过程可以为:
确定至少两条任务路线中每条任务路线的长度;
选择所述至少两条任务路线中的任意一条第一任务路线和任意一条第二任务路线进行合并处理,确定所述第一任务路线和所述第二任务路线的最短轨迹的合并路线,其中,任意一条所述第一任务路线和任意一条所述第二任务路线分别为两条不相同的任务路线;
根据所述合并路线的长度、所述第一任务路线的长度以及所述第二任务路线的长度确定所述第一任务路线与所述第二任务路线的相似度。
具体的,所述合并处理是指将第一任务路线和第二任务路线结合、归集到一起的过程;所述合并路线是指将第一任务路线和第二任务路线结合、归集到一起形成的路线。
实际应用中,可以采用Merge Distance算法计算至少两条任务路线中任意两条任务路线之间的相似度:首先需要确定所有的任务路线的长度,为后续计算相似度进行准备。接着从至少两条任务路线中选择任意两条任务路线,进行合并处理,参见图2,任务路线a和任务路线b为至少两条任务路线中的任意两条不相同的任务路线,其中任务线路a由轨迹数据a1、a2、a3、a4组成,任务路线b由轨迹数据b1、b2、b3组成,将轨迹数据a1、a2、a3、a4和轨迹数据b1、b2、b3进行合并,生成合并路线。由于生成的合并路线可以有多条,这里只需要从多条合并路线中选择出轨迹最短的一条作为合并路线s。最后,根据合并路线的长度、第一任务路线的长度、所述第二任务路线的长度确定第一任务路线与第二任务路线的相似度,即根据合并路线s的长度、任务线路a的长度、任务路线b的长度确定任务线路a与任务路线b的相似度,相似度的计算过程如式1所示。
MD(a,b)=2L(s)/[L(a)+L(b)]–1 (式1)
式1中,MD(a,b)是指任务线路a与任务路线b的相似度,L(s)是指合并路线s的长度,L(a)是指任务路线a的长度,L(b)是指任务路线b的长度。
例如,获取了任务路线有三条:任务路线A、任务路线B和任务路线C,先确定这三条任务路线的长度,其中L(A)为10、L(B)为14、L(C)为15,先计算任务路线A和任务路线B的相似度:将任务路线A和任务路线B进行合并处理得到最短轨迹的合并路线D,其中合并路线D的长度,即L(D)为18,即将10、14、18带入式1中,得到2*18/(10+14)-1=0.5,即任务路线A与任务路线B的相似度为0.5。任务路线A和任务路线C相似度、任务路线B和任务路线C的相似度按照计算任务路线A和任务路线B的相似度的方式进行。需要说明的是,任务路线A和任务路线C相似度、任务路线B和任务路线C的相似度、任务路线A和任务路线B的相似度可以同时进行计算,也可以按照一定顺序逐一进行计算。
本申请中,通过对至少两条任务路线中的任意两条不相同的任务路线进行合并处理确定最短轨迹的合并路线,并进一步确定至少两条任务路线中任意两条不相同的任务路线的相似度,提高了相似度的精确性,同时也为后续依据相似度对任务路线进行分组提高了有效性。
在计算得出至少两条任务路线中任意两条任务路线之间的相似度之后,进一步地,需要根据相似度以及相似度阈值对任务路线进行分组。即在计算出所述至少两条任务路线中任意两条任务路线之间的相似度之后,根据所述至少两条任务路线中任意两条任务路线之间的相似度以及相似度阈值,将任务路线划分为至少一个分组,直至所有的分组之间的相似度都大于或等于相似度阈值。
实际应用中,在根据所述任意两条任务路线之间的相似度以及相似度阈值,将所述各任务路线划分为至少一个分组的过程中,可以通过如下方式实现:
针对所述各任务路线分别创建初始分组;
采用预设的聚合算法对所述初始分组进行处理,获得目标分组,所述目标分组中包含所述相似度小于所述相似度阈值的任务路线。
具体的,将获取的任务路线中每一条任务路线都作为一个初始分组,即有多少条任务路线就创建多少个初始分组,每个初始分组中有且只有一条任务路线。在此基础上,根据预先设定的聚合算法对已创建的初始分组进行聚类,根据聚类结果确定目标分组。需要说明的是,目标分组中可以有多条任务路线,也可以有一条任务路线,当目标分组中有多条任务路线时,这些任务路线之间的相似度小于相似度阈值;当目标分组中只有一条任务路线时,说明该目标分组为某个初始分组,也即是说这一条任务路线与其他任务路线的相似度大于或等于相似度阈值。
例如,有五条任务路线:任务路线A、任务路线B、任务路线C、任务路线D和任务路线E,其中,所述五条任务路线中任意两条的任务路线的相似度如表2所述。将任务路线A、任务路线B、任务路线C、任务路线D和任务路线E分别确定为分组一、分组二、分组三、分组四、分组五,即创建了五个初始分组。假设相似度阈值为0.6,可知任务路线A与任务路线B的相似度、任务路线A与任务路线C的相似度、任务路线B与任务路线D的相似度、任务路线B与任务路线E的相似度、任务路线C与任务路线E相似度均小于相似度阈值。由于任务路线B与任务路线E的相似度最小,将任务路线B与任务路线E划分至新的分组六中,同时分组二和分组五消失;剩余任务路线A、任务路线C、任务路线D为单独的分组,由于任务路线A与任务路线C的相似度也小于相似度阈值,将任务路线A与任务路线C划分至新的分组七中,同时分组一和分组三消失,仅剩余分组四。计算分组四与分组六、分组四和分组七的相似度:若分组四与分组六、分组四和分组七的相似度均小于0.6,将分组四对应的任务路线D划分至相似度较小的分组中,即生成两个目标分组:分组六和分组七;若分组四与分组六、分组四和分组七的相似度均大于或者等于0.6,则不对分组四进行划分,即目标分组为分组四、分组六和分组七;若分组四与分组六的相似度小于0.6且分组四和分组七的相似度均大于或者等于0.6,则将任务路线D划分至分组六,即生成两个目标分组:分组六和分组七;若分组四与分组七的相似度小于0.6且分组四和分组六的相似度均大于或者等于0.6,则将任务路线D划分至分组七,即生成两个目标分组:分组六和分组七。
表2五条任务路线之间的相似度
Figure BDA0003165338950000101
在本实施例的一个或多个实施方式中,根据所述任意两条任务路线之间的相似度以及相似度阈值,将所述各任务路线划分为至少一个分组的具体实现过程可以如下:
根据所述相似度阈值、预设的密度阈值和预设的密度聚类算法对各任务路线进行处理,获得至少一个分组,各分组中包含所述相似度小于所述相似度阈值的任务路线。
具体的,所述预设的密度聚类算法可以是DBSCAN聚类算法;所述密度阈值为DBSCAN聚类算法的最少数目,密度阈值越大,获得的分组中最小的分组(包含任务路线最少的分组)所包含的任务路线越多。采用DBSCAN聚类算法进行分组时,需要输入处理对象集合、半径、最少数目。本申请中,以所述至少两条任务路线为处理对象集合、以所述相似度阈值为半径、以所述密度阈值为最少数目对所述至少两条任务路线进行分组。
实际应用中,可以根据实际情况预先设置密度阈值,在此基础上,对所述至少两条任务路线进行处理。首先,可以将至少两条任务路线中的每条任务路线全部标记为未处理的状态,从所述至少两条任务路线中选取一个未处理的任务路线。然后,确定至少两条任务路线中与该任务路线的相似度小于相似度阈值的所有的其他任务路线。建立新的预分组,将该任务路线和与该任务路线的相似度小于相似度阈值的其他任务路线划分至新建的预分组中,并将该任务路线标记为已处理。以相同的方法处理该预分组内所有未标记为已处理的任务路线,从而对该预分组进行扩展。当该预分组充分地被扩展,即该预分组内的所有任务路线被标记为已处理后,用同样的算法去处理未处理的任务路线。当所有的任务路线都被标记为已处理之后,确定每一个预分组所包含的任务路线的数量N,N为任意自然数,将N大于或者等于密度阈值的预分组确定为分组。
例如,有十条任务路线,分别为a、b、c、d、e、f、g、h、i和j,其中,所述十条任务路线中任意两条的任务路线的相似度如表3所述。假设密度阈值为4、相似度阈值为2。首先选择未处理的a,根据表3可知,与a相似度小于相似度阈值(即2)的有f和g,建立第一预分组,将a、f和g添加至第一预分组中,并将a标记为已处理。对第一预分组中的f进行处理,根据表3可知,与f相似度小于相似度阈值(即2)的有a和e,将f标记为已处理,并将e划分至第一预分组中,此时第一预分组中包含a、e、f和g。对第一预分组中的e进行处理,根据表3可知,与e相似度小于相似度阈值(即2)的有b、f、h和i,将e标记为已处理,将b、h和i划分至第一预分组中,此时第一预分组中包含a、b、e、f、g、h和i。对第一预分组中的b进行处理,根据表3可知,与b相似度小于相似度阈值(即2)的有c、e、h和i,将b标记为已处理,并将c划分至第一预分组中,此时第一预分组中包含a、b、c、e、f、g、h和i。对第一预分组中的c进行处理,根据表3可知,与c相似度小于相似度阈值(即2)的有b和h,将c标记为已处理。对第一预分组中的g进行处理,根据表3可知,与g相似度小于相似度阈值(即2)的有a和d,将g标记为已处理,并将d划分至第一预分组中,此时第一预分组中包含a、b、c、d、e、f、g、h和i。对第一预分组中的d进行处理,根据表3可知,与g相似度小于相似度阈值(即2)的有g,将d标记为已处理。对第一预分组中的h进行处理,根据表3可知,与h相似度小于相似度阈值(即2)的有b、c和e,将h标记为已处理。对第一预分组中的i进行处理,根据表3可知,与i相似度小于相似度阈值(即2)的有b、c和e,由于b、c和e均在第一预分组中,只需将i标记为已处理。此时第一预分组中的所有任务路线均为已处理状态,即第一分组已确定完毕,十条任务路线中还有j。对j进行处理,没有与j相似度小于相似度阈值的任务路线,建立第二预分组,将j添加至第二预分组中,将j标记为已处理。此时得到两个预分组,第一预分组包含9条任务路线,大于密度阈值,将第一预分组确定为分组;第二预分组只包含1条任务路线,小于密度阈值,不做处理。
表3任务路线之间的相似度
Figure BDA0003165338950000111
本申请中,通过相似度和相似度阈值对任务路线进行划分分组,有利于后续根据分组情况对异常分组进行检测、识别,有利于提高异常账号检测模型的准确度,间接提高了检测异常账号的速度和有效性。
在本实施例的一个或多个实施方式中,根据所述任意两条任务路线之间的相似度以及相似度阈值,将所述各任务路线划分为至少一个分组之前,还需要确定相似度阈值,具体过程可以为:根据所述至少一个目标路线的路线长度、路线复杂度和历史异常账号中至少之一确定至少一个相似度阈值。
具体的,历史异常账号是指在此检测异常账号之前已知的异常账号。对于任意一个目标路线,都可以根据目标路线的路线长度、路线复杂度和相对所述目标路线的历史异常账号中的一个或多个确定所述目标路线的相似度阈值。需要说明的是每一条目标路线都有一个与之对应的相似度阈值,且路线越长、路线复杂度越高,相似度阈值越大,在设置相似度阈值时可以参考历史异常账号调整相似度阈值。此外,历史异常账号可以用于校验当前设置的相似度阈值是否偏离预期。
例如,存在四条目标路线:目标路线A、目标路线B、目标路线C和目标路线D,参见表4,表4展示了目标路线A、目标路线B、目标路线C和目标路线D的信息,即路线长度、路线复杂度和有无历史异常账号。由于目标路线A和目标路线B的路线长度一样,且都没有历史异常账号,在目标路线B比目标路线A的路线复杂度高的情况下,根据路线长度和路线复杂度分别确定目标路线A和目标路线B的相似度阈值,为0.5和0.7;目标路线C和目标路线A的路线长度、路线复杂度均相同,在根据路线长度、路线复杂度确定目标路线C的相似度阈值情况下,目标路线C的相似度阈值要比目标路线A的相似度阈值大,可以是0.4,由于目标路线C有历史异常账号,可以根据历史异常账号对目标路线C的相似度阈值进行调整;目标路线D比目标路线B的路线长度长、路线复杂度高,因此目标路线D的相似度阈值要比目标路线B的相似度阈值大,可以为0.9。
表4目标路线的信息
Figure BDA0003165338950000121
本申请中,通过根据目标路线的路线长度、路线复杂度和历史异常账号中至少之一确定该目标路线对应的相似度阈值,即具体情况具体分析,使确定的相似度阈值更加贴合,进一步提高了分组过程的精确度。
步骤106:在异常分组中的任务路线的数量大于或者等于异常阈值的情况下,统计所述异常分组中所述异常账号对应的任务路线的第一数量,所述异常分组为所述至少一个分组中的任意一个。
在将各目标账号和各任务路线输入至异常账号检测模型,计算任意两条任务路线之间的相似度,且根据所述任意两条任务路线之间的相似度以及相似度阈值,将所述各任务路线划分为至少一个分组的基础上,进一步地,判断各个分组中任务路线的数量,从而确定异常分组。
具体的,所述异常阈值是指用于评估分组中任务路线数量的一个临界值,可以是评估分组中的任务路线对应的目标账号是否为异常账号的一个临界值,异常阈值可以根据实际情况进行设定。
实际应用中,在获得了至少一个分组后,需要确定各个分组中所包含的任务路线的数量,将各个分组中任务路线的数量分别与异常阈值进行比较,若某个分组中任务路线的数量小于异常阈值,则该分组为正常分组,无需对正常分组进行任何操作;若某个分组中任务路线的数量大于或者等于异常阈值,则将该分组确定为异常分组,确定异常分组中与异常账号对应的任务路线的数量,即第一数量。
例如,有三个分组:X1、X2和X3,其中X1包含有200条任务路线,X2包含有300条任务路线,X3包含有500条任务路线。在异常阈值为400的情况下,X1和X2为正常分组,X3为异常分组。若X3中有5条任务路线对应的目标账号为异常账号,则第一数量为5。
本申请中,通过分组中包含任务路线的数量与相似度阈值可以确定异常分组,进一步根据异常分组中异常账号对应的任务路线确定第一数量,为后续调整相似度阈值和异常阈值奠定了基础,一定程度上还提高了训练速度。
步骤108:识别所述异常分组中未标注账号的账号状态,统计所述异常分组中账号状态为异常的未标注账号的第二数量和账号状态为正常的未标注账号的第三数量。
在确定异常分组以及第一数量的情况下,进一步地,识别异常分组中标注为异常账号对应的任务路线以外的其他任务路线的账号状态,即识别异常分组中未标注账号对应的任务路线的账号状态,也即识别异常分组中未标注账号是否为异常账号,将未标注账号中账号状态为异常的未标注账号的数量确定为第二数量,将未标注账号中账号状态为正常的未标注账号的数量确定为第三数量。
例如某个异常分组中有100条任务路线,其中标注为异常账号对应的任务路线的数量为10(第一数量),则未标注账号对应的任务路线的数量为90,进一步地,判断这90个未标注账号的账号状态。进行识别后,这90个未标注账号中有50个异常账号,40个正常账号,则第二数量为50、第三数量为40。
需要说明的是,对未标注账号的账号状态进行识别时,可以根据未标注账号对应的登录设备或者游戏角色的一些数值特征来进行判断,其中所述数值特征包括登录IP、发言内容、发言频率、战力、在线时长、充值等,例如某个游戏角色不间断地在对战、每天对战十几个小时并持续数天,可以将该游戏角色对应的账号确定为异常账号。此外,在识别所述异常分组中未标注账号的账号状态的基础上,可以将异常分组中账号状态为异常的未标注账号标注为异常账号,如此可以减少后续训练过程中识别所述异常分组中未标注账号的账号状态的数据处理量,进一步提高训练的速度。
本申请中,通过识别所述异常分组中未标注账号的账号状态,进一步确定第二数量和第三数量,为调整相似度阈值和异常阈值做好了准备工作,有利于提高模型检测异常账号的准确度。
步骤110:根据所述第一数量、第二数量以及第三数量调整所述相似度阈值和所述异常阈值,返回执行所述根据所述任意两条任务路线之间的相似度以及相似度阈值,将所述各任务路线划分为至少一个分组步骤,直至达到训练停止条件。
在确定了第一数量、第二数量以及第三数量的基础上,进一步地,可以根据第一数量、第二数量以及第三数量来调整模型中的参数,即相似度阈值和异常阈值,之后继续训练异常账号检测模型,直至达到训练停止条件。
在本实施例的一个或多个实施方式中,可以根据第三数量与第一数量、第二数量以及第三数量之和的比值,调整相似度阈值和异常阈值,具体实现过程如下:
确定第三数量与第一数量、第二数量以及第三数量之和的比值;
在所述比值大于调整阈值的情况下,调整所述相似度阈值和异常阈值。
实际应用中,所述调整阈值是指预先设置的、用于确定是否需要调整相似度阈值和异常阈值的数值。可以确定第三数量与第一数量、第二数量以及第三数量之和的比值,计算过程如式2所示。在此基础上,比较所述比值与调整阈值的大小,当所述比值大于调整阈值时,调整相似度阈值和异常阈值。当所述比值小于等于调整阈值时,停止训练,此时,训练停止条件可以为第三数量与第一数量、第二数量以及第三数量之和的比值小于等于调整阈值,也可以为第三数量与第一数量、第二数量以及第三数量之和的比值停止下降。
R1=z/(x+y+z) (式2)
式2中,R1是指第三数量与第一数量、第二数量以及第三数量之和的比值,x是指第一数量,y是指第二数量,z是指第三数量。
例如,第一数量、第二数量以及第三数量分别为10、190、50,调整阈值为0.01,则第三数量与第一数量、第二数量以及第三数量之和的比值为0.2,且大于调整阈值,此时可以调整相似度阈值和异常阈值,使相似度阈值和异常阈值相应地减小。之后根据调整后的相似度阈值和异常阈值返回执行所述根据所述任意两条任务路线之间的相似度及相似度阈值,将所述各任务路线划分为至少一个分组的步骤。
在本实施例的一个或多个实施方式中,可以根据第一数量以及第二数量之和与第一数量、第二数量以及第三数量之和的比值,调整相似度阈值和异常阈值,具体实现过程如下:
确定第一数量以及第二数量之和与第一数量、第二数量以及第三数量之和的比值;
在所述比值小于调整阈值的情况下,调整所述相似度阈值和异常阈值。
具体的,确定第一数量以及第二数量之和与第一数量、第二数量以及第三数量之和的比值的计算过程如式3所示。比较所述比值与调整阈值的大小,当所述比值小于调整阈值时,调整相似度阈值和异常阈值。当所述比值大于等于调整阈值时,停止训练,此时,训练停止条件可以为第一数量以及第二数量之和与第一数量、第二数量以及第三数量之和的比值大于等于调整阈值,也可以为第一数量以及第二数量之和与第一数量、第二数量以及第三数量之和的比值停止上升。
R2=(x+y)/(x+y+z) (式3)
式3中,R2是指第一数量以及第二数量之和与第一数量、第二数量以及第三数量之和的比值,x是指第一数量,y是指第二数量,z是指第三数量。
在本实施例的一个或多个实施方式中,可以第三数量与第一数量以及第二数量之和的比值,调整相似度阈值和异常阈值,具体实现过程如下:
确定第三数量与第一数量以及第二数量之和的比值;
在所述比值大于调整阈值的情况下,调整所述相似度阈值和异常阈值。
具体的,确定第三数量与第一数量以及第二数量之和的比值的计算过程如式4所示。比较所述比值与调整阈值的大小,当所述比值大于调整阈值时,调整相似度阈值和异常阈值。当所述比值小于等于调整阈值时,停止训练,此时,训练停止条件可以为第三数量与第一数量以及第二数量之和的比值小于等于调整阈值,也可以为第三数量与第一数量以及第二数量之和的比值停止下降。
R3=z/(x+y) (式4)
式4中,R3是指第三数量与第一数量以及第二数量之和的比值,x是指第一数量,y是指第二数量,z是指第三数量。
在本实施例的一个或多个实施方式中,当所述异常账号检测模型的迭代次数达到目标迭代次数时,停止训练所述异常账号检测模型。
需要说明的是,当所述异常账号检测模型的迭代次数达到目标迭代次数时,若分组的结果依然不理想,也可以更换目标任务,并更换与目标任务对应的目标账号和任务路线,重新开始训练异常账号检测模型。
本申请提供的异常账号检测模型训练方法,通过接收训练样本,将各目标账号和各任务路线输入至异常账号检测模型中,计算多条任务路线两两之间的相似度,并根据相似度阈值进行分组,在异常分组中的任务路线的数量大于或者等于异常阈值的情况下,确定第一数量、第二数量、第三数量,进一步调整相似度阈值和异常阈值,继续训练,直至达到训练停止条件。如此,不仅可以提高对任务路线进行分组的速度,还可以提高样本确定异常分组的准确性,在节省人力成本的同时,提高异常账号检测模型的效率和准确度,进一步提高了检测异常账号的效率和准确度。
图3A示出了根据本申请一实施例提供的一种异常账号检测方法的流程图,具体包括以下步骤:
步骤302:获取至少两个待处理账号以及各待处理账号在目标任务下的待处理任务路线。
实际应用中,为了检测异常账号,需要获取待检测的账号和待检测的账号完成目标任务的任务路线,也即获取待处理账号和待处理账号对应的待处理任务路线。
本申请提供的实施例中,获取到500个待处理账号和对应的500条待处理任务路线。其中待处理账号与待处理任务路线一一对应,且待处理任务路线为待处理账号完成目标任务时的行走路线。
为了提高获取待处理账号和待处理任务路线的效率,可以先根据目标任务确定待处理账号,然后从数据库中获取待处理账号的完成目标任务的轨迹数据,进而确定待处理任务路线。即所述获取至少两个待处理账号以及各待处理账号在目标任务下的待处理任务路线的具体实现过程可以如下:
确定完成目标任务的至少两个待处理账号;
获取所述至少两个待处理账号中每个待处理账号与所述目标任务对应的轨迹数据,得到至少两组待处理轨迹数据;
将所述至少两组待处理轨迹数据中每组待处理轨迹数据按照时间顺序进行排序并去重,得到至少两条待处理任务路线。
具体的,待处理轨迹数据是指服务器所记载的待处理账号完成目标任务过程中的所有表示游戏角色位置的数据;排序是指将一组无序待处理轨迹数据调整为有序的待处理轨迹数据;去重是指将有序的待处理轨迹数据中相邻时间相同的数据保留一个数据后删除其他相同的数据。
实际应用中,在明确了目标任务之后,确定完成该目标任务的至少两个账号,也即待处理账号。然后从数据库中获取待处理账号与目标任务对应的待处理轨迹数据。进一步地,为了减少计算量,获取的待处理轨迹数据可以是游戏角色行进过程中的轨迹数据。由于待处理轨迹数据是由多个数据组成的,为了使待处理轨迹数据可能更加精准地表示游戏角色的任务路线,需要将每一组待处理轨迹数据中的数据按照时间先后顺序进行排序。为了避免游戏角色在接到目标任务后站在原地不动,从而导致待处理轨迹数据中时间序列上出现多个相邻的重复数据,需要对重复的数据进行去重处理,即将排序后的时间序列上相邻并且相同的多个数据进行去重,仅保留其中一个数据。去重完成后,根据去重后的待处理轨迹数据生成待处理任务路线。
例如,获取了待处理账号m与目标任务对应的待处理轨迹数据n,其中,待处理轨迹数据n为“8,2,7,2,2,2,4,5,5,4,4,4,3”,对待处理轨迹数据n按照时间顺序进行排序处理后,待处理轨迹数据n变为“2,2,2,4,5,5,4,4,4,3,8,2,7”。在对排序后的待处理轨迹数据n进行去重处理,为“2,4,5,4,3,8,2,7”,之后就可以根据去重后的待处理轨迹数据n生成对应的待处理任务路线。
步骤304:计算任意两条待处理任务路线之间的相似度;根据所述任意两条待处理任务路线之间的相似度以及相似度阈值,将所述待处理任务路线划分为至少一个分组。
在获取到待处理账号和待处理任务路线的基础上,进一步地,需要两两计算待处理任务路线之间的相似度并将待处理任务路线进行分组。
实际应用中,可以通过计算相似度的一些算法计算获取的至少两条待处理任务路线中任意两条待处理任务路线之间的相似度。例如,欧式距离、Merge Distance算法等。然后再基于待处理任务路线之间的相似度以及相似度阈值,对待处理任务路线进行划分,得到至少一个分组。
本申请提供的实施例中,在获取到500个待处理账号和对应的500条待处理任务路线之后,开始计算500条待处理任务路线中任意两条待处理任务路线之间的相似度。并基于相似度阈值将500条待处理任务路线划分为若干个分组。
为了提高计算相似度的准确度和速度,可以采Merge Distance算法计算任意两条待处理任务路线之间的相似度,具体实现过程如下:
确定至少两条待处理任务路线中每条待处理任务路线的长度;
选择所述至少两条待处理任务路线中的任意一条第一待处理任务路线和任意一条第二待处理任务路线进行合并处理,确定所述第一待处理任务路线和所述第二待处理任务路线的最短轨迹的合并路线,其中,任意一条所述第一待处理任务路线和任意一条所述第二待处理任务路线分别为两条不相同的待处理任务路线;
根据所述合并路线的长度、所述第一待处理任务路线的长度以及所述第二待处理任务路线的长度确定所述第一待处理任务路线与所述第二待处理任务路线的相似度。
具体的,所述合并处理是指将第一待处理任务路线和第二待处理任务路线结合、归集到一起的过程;所述合并路线是指将第一待处理任务路线和第二待处理任务路线结合、归集到一起形成的路线。
实际应用中,当采用Merge Distance算法计算各待处理任务路线之间的相似度时:首先,需要确定各待处理任务路线的长度,为后续计算相似度进行准备。然后,从至少两条待处理任务路线中选择任意两条待处理任务路线,进行合并处理,参见图2,待处理任务路线a和待处理任务路线b为至少两条待处理任务路线中的任意两条不相同的待处理任务路线,其中待处理任务线路a由轨迹数据a1、a2、a3、a4组成,待处理任务路线b由轨迹数据b1、b2、b3组成,将轨迹数据a1、a2、a3、a4和轨迹数据b1、b2、b3进行合并,生成合并路线。由于生成的合并路线可以有多条,这里只需要从多条合并路线中选择出轨迹最短的一条作为合并路线s。最后,根据合并路线s的长度、待处理任务线路a的长度、待处理任务路线b的长度确定待处理任务线路a与待处理任务路线b的相似度,即先将待处理任务线路a的长度与待处理任务路线b的长度相加,得到长度和,再计算两倍合并路线s的长度与长度和的比值,最后将得到的比值减一,得到待处理任务路线a和待处理任务路线b的相似度。
例如,获取的待处理任务路线有:待处理任务路线P和待处理任务路线Q,计算待处理任务路线P和待处理任务路线Q的相似度时,先确定待处理任务路线P和待处理任务路线Q各自的长度,其中待处理任务路线P的长度为12、待处理任务路线Q的长度为13;然后将待处理任务路线P和待处理任务路线Q进行合并处理得到最短轨迹的合并路线Y,其中合并路线Y的长度为20;接着,将12与13相加,得到长度和25,将20乘2并除以25,得到比值1.6;最后,将1.6减1,得到0.6,即待处理任务路线P和待处理任务路线Q的相似度为0.6。
此外,在计算任意两条待处理任务路线之间的相似度之前,还可以将各待处理账号和各待处理任务路线输入至异常账号检测模型中,所述异常账号检测模型是通过上述异常账号检测模型训练方法训练得到的。也即是说,将各待处理账号和各待处理任务路线输入至异常账号检测模型,之后,在异常账号检测模型执行计算任意两条待处理任务路线之间的相似度,根据所述任意两条待处理任务路线之间的相似度以及相似度阈值,将所述待处理任务路线划分为多个分组的步骤以及该步骤之后的步骤。
步骤306:在异常分组中的待处理任务路线的数量大于或者等于异常阈值的情况下,将所述异常分组中待处理任务路线对应的待处理账号标记为异常账号,所述异常分组为所述至少一个分组中的任意一个。
本申请提供的实施例中,异常阈值为80,且获得了五个分组,其中只有三个分组中包含的待处理任务路线的数量大于80,即有三个异常分组。将这三个异常分组中的待处理任务路线对应的待处理账号标记为异常账号。
实际应用中,由于玩家个人习惯与偏好不同,由于正常账号对应的任务路线也不同,不会像使用外挂脚本的任务路线一样大量的集中在一起。所以通过大量的待处理任务路线来判断待处理账号是否运用脚本外挂时,异常账号对应的待处理任务路线重合度会很高。因此,需要先确定各个分组中待处理任务路线的数量,将各个分组中待处理任务路线的数量分别与异常阈值进行比较,若某个分组中待处理任务路线的数量小于异常阈值,则该分组为正常分组,默认正常分组中待处理任务路线对应的待处理账号均为正常账号,无需对正常分组进行任何操作;若某个分组中待处理任务路线的数量大于或者等于异常阈值,则将该分组确定为异常分组,需要将异常分组中待处理任务路线对应的待处理账号标记为异常账号。
参见图3B,图3B是针对于完成同一个目标任务的任务路线进行划分的结果。参见图3B至图3E,对图3B中的分组进行判断,其中有三个分组中任务路线的数量大于或者等于异常阈值,分别对应图3C、图3D、图3E。此外,图3C、图3D、图3E中的路线表示通过分组得到了三类不同使用外挂脚本完成目标任务的路线,需要说明的是,不同的外挂脚本可能选择的路线也不同。由于异常账号为使用外挂脚本的账号,且使用外挂脚本会破坏游戏环境平衡,可以根据检测异常账号的结果对这些账号封禁。
例如,有三个分组,分组A、分组B和分组C,其中,分组A中有25条任务路线,分组B中有30条任务路线,分组C中有45条任务路线。在异常阈值为35的情况下,只有分组C中的任务路线的数量大于异常阈值,因此将分组C中45条任务路线对应的45个目标账户全部标记为异常账户。
本申请提供的一种异常账号检测方法,通过获取待处理账号和待处理任务路线,计算待处理任务路线两两之间的相似度,并根据相似度阈值进行分组,进一步在异常分组中的待处理任务路线的数量大于或者等于异常阈值的情况下,将异常分组中待处理任务路线对应的待处理账号标记为异常账号。保证了可以快速、准确的确定待处理账号中的异常账号,在节省人力成本的同时,进一步提高了检测异常账号的效率和准确度。
下述结合附图4,以本申请提供的方法在地面骑行游戏的应用为例,对所述异常账号检测模型训练方法和异常账号检测方法进行进一步说明。其中,图4示出了本申请一实施例提供的一种应用于骑行游戏的处理流程图,具体包括以下步骤:
步骤402:确定目标骑行路线和目标骑行任务。
选取线长度大于长度阈值且路线复杂度大于复杂度阈值的路线为目标骑行路线,将所述目标骑行路线对应的任务确定为目标骑行任务。
步骤404:判断目标骑行任务是否符合异常账号的检测条件。
根据生成的两条骑行任务路线判断所述目标骑行任务是否具有固定的任务起点以及固定的任务终点,若否,则跳转步骤402,重新确定目标骑行路线和目标骑行任务;若是,则执行步骤406。
步骤406:根据目标骑行任务确定至少两个目标账号。
可以根据目标骑行任务的完成情况确定预设时间,从而获取预设时间内完成目标骑行任务的至少两个目标账号。
步骤408:获取至少两个目标账号的与目标骑行任务对应的至少两组轨迹数据。
步骤410:对至少两组轨迹数据进行排序和去重生成至少两条骑行任务路线。
步骤412:接收训练样本,所述训练样本包括至少两个目标账号以及各目标账号在目标骑行任务下的骑行任务路线,至少一个所述目标账号被标注为异常账号。
步骤414:将各目标账号和各骑行任务路线输入至异常账号检测模型,计算至少两条骑行任务路线中任意两条骑行任务路线之间的相似度。
首先确定所述至少两条骑行任务路线中每条骑行任务路线的长度,再将两条骑行任务路线中的任意两条不相同的骑行任务路线进行合并处理获得最短轨迹的合并路线,最后根据所述合并路线的长度和所述任意两条不相同的骑行任务路线的长度确定所述任意两条不相同的骑行任务路线的相似度。
步骤416:根据所述任意两条骑行任务路线之间的相似度以及相似度阈值,将所述各骑行任务路线划分为至少一个分组。
将距离接近的骑行任务路线划分至同一个分组中。
步骤418:在异常分组中的骑行任务路线的数量大于或者等于异常阈值的情况下,统计所述异常分组中所述异常账号对应的骑行任务路线的第一数量,所述异常分组为所述至少一个分组中的任意一个。
步骤420:识别所述异常分组中未标注账号的账号状态,统计所述异常分组中账号状态为异常的未标注账号的第二数量和账号状态为正常的未标注账号的第三数量。
步骤422:根据所述第一数量、第二数量以及第三数量调整所述相似度阈值和所述异常阈值,返回执行所述根据所述任意两条任务路线之间的相似度以及相似度阈值,将所述各任务路线划分为至少一个分组步骤,直至达到训练停止条件。
步骤424:获取至少两个待处理账号以及各待处理账号在目标骑行任务下的待处理骑行路线。
步骤426:将各待处理账号和各待处理骑行路线输入至异常账号检测模型。
步骤428:计算任意两条待处理骑行路线之间的相似度。
步骤430:根据所述任意两条待处理骑行路线之间的相似度以及相似度阈值,将所述待处理骑行路线划分为至少一个分组。
步骤432:在异常分组中的待处理骑行路线的数量大于或者等于异常阈值的情况下,将所述异常分组中待处理骑行路线对应的待处理账号记为异常账号,所述异常分组为所述至少一个分组中的任意一个。
可以根据实际情况对异常账号进行封禁。
本申请提供的一种应用于骑行游戏的异常账号检测模型训练方法,通过在确定目标骑行路线和目标骑行任务的基础上,进一步获取数据轨迹并排序去重,极大程度上降低了服务器的计算压力,提高了计算速度;通过对目标骑行任务进行检测,保证了目标骑行任务的有效性,有利于提高检测异常账号的可靠性;将各目标账号和各骑行任务路线输入至异常账号检测模型中,计算多条骑行任务路线两两之间的相似度,并根据相似度阈值进行分组,在异常分组中的任务路线的数量大于或者等于异常阈值的情况下,确定第一数量、第二数量、第三数量,进一步调整相似度阈值和异常阈值,继续训练,直至达到训练停止条件。如此,不仅可以提高对骑行任务路线进行分组的速度,还可以提高样本确定异常分组的准确性,在节省人力成本的同时,进一步提高了异常账号检测模型的效率和准确度。
本申请提供的一种应用于骑行游戏的异常账号检测方法,通过获取待处理账号和待处理骑行路线,并计算待处理骑行路线两两之间的相似度,并根据相似度阈值进行分组,进一步在异常分组中的待处理骑行任务路线的数量大于或者等于异常阈值的情况下,将异常分组中待处理骑行路线对应的待处理账号标记为异常账号。保证了可以快速、准确的确定待处理账号中的异常账号,在节省人力成本的同时,进一步提高了检测异常账号的效率和准确度。
与上述异常账号检测模型训练方法实施例相对应,本申请还提供了异常账号检测模型训练装置实施例,图5示出了本申请一实施例提供的一种异常账号检测模型训练装置的结构示意图。如图5所示,该装置包括:
接收模块502,被配置为接收训练样本,其中,所述训练样本包括至少两个目标账号以及各目标账号在目标任务下的任务路线,至少一个所述目标账号被标注为异常账号;
第一计算模块504,被配置为将各目标账号和各任务路线输入至异常账号检测模型,计算任意两条任务路线之间的相似度;根据所述任意两条任务路线之间的相似度以及相似度阈值,将所述各任务路线划分为至少一个分组;
统计模块506,被配置为在异常分组中的任务路线的数量大于或者等于异常阈值的情况下,统计所述异常分组中所述异常账号对应的任务路线的第一数量,所述异常分组为所述至少一个分组中的任意一个;
识别模块508,被配置为识别所述异常分组中未标注账号的账号状态,统计所述异常分组中账号状态为异常的未标注账号的第二数量和账号状态为正常的未标注账号的第三数量;
调整模块510,被配置为根据所述第一数量、第二数量以及第三数量调整所述相似度阈值和所述异常阈值,返回执行所述根据所述任意两条任务路线之间的相似度以及相似度阈值,将所述各任务路线划分为至少一个分组步骤,直至达到训练停止条件。
在本实施例的一个或多个实施方式中,所述装置还包括第一确定模块,被配置为:
确定完成目标任务的至少两个目标账号,获取所述至少两个目标账号中每个目标账号的与所述目标任务对应的任务路线,得到至少两条任务路线。
在本实施例的一个或多个实施方式中,所述第一确定模块,还被配置为:
获取所述至少两个目标账号中每个目标账号的与所述目标任务对应的轨迹数据,得到至少两组轨迹数据;
将所述至少两组轨迹数据中每一组轨迹数据按照时间顺序进行排序并去重,得到至少两条任务路线。
在本实施例的一个或多个实施方式中,所述装置还包括检测模块,被配置为:
根据所述至少两条任务路线判断所述目标任务是否符合异常账号的检测条件;
若否,更换目标任务,确定完成更换后的目标任务的至少两个目标账号,获取所述至少两个目标账号的与所述更换后的目标任务对应的至少两条任务路线。
在本实施例的一个或多个实施方式中,所述检测模块,还被配置为:
根据所述至少两条任务路线判断所述目标任务是否具有固定的任务起点以及固定的任务终点。
在本实施例的一个或多个实施方式中,所述第一计算模块504,还被配置为:
确定至少两条任务路线中每条任务路线的长度;
选择所述至少两条任务路线中的任意一条第一任务路线和任意一条第二任务路线进行合并处理,确定所述第一任务路线和所述第二任务路线的最短轨迹的合并路线,其中,任意一条所述第一任务路线和任意一条所述第二任务路线分别为两条不相同的任务路线;
根据所述合并路线的长度、所述第一任务路线的长度以及所述第二任务路线的长度确定所述第一任务路线与所述第二任务路线的相似度。
在本实施例的一个或多个实施方式中,所述装置还包括第二确定模块,被配置为:
确定至少一个目标路线和轨迹数据记录的频率,其中,所述至少一个目标路线为路线长度大于长度阈值且路线复杂度大于复杂度阈值的路线,所述路线复杂度包括弯道数量和/或障碍数量;
根据所述至少一个目标路线确定目标任务;
所述装置还包括第三确定模块,被配置为:
根据所述至少一个目标路线的路线长度、路线复杂度和历史异常账号中至少之一确定至少一个相似度阈值。
在本实施例的一个或多个实施方式中,所述第一确定模块,还被配置为:
根据所述目标任务的完成情况确定预设时间;
确定所述预设时间内完成所述目标任务的至少两个目标账号。
在本实施例的一个或多个实施方式中,所述第一计算模块504,还被配置为:
针对所述各任务路线分别创建初始分组;
采用预设的聚合算法对所述初始分组进行处理,获得目标分组,所述目标分组中包含所述相似度小于所述相似度阈值的任务路线。
在本实施例的一个或多个实施方式中,所述第一计算模块504,还被配置为:
根据所述相似度阈值、预设的密度阈值和预设的密度聚类算法对各任务路线进行处理,获得至少一个分组,各分组中包含所述相似度小于所述相似度阈值的任务路线。
本申请提供的异常账号检测模型训练装置,通过接收训练样本,将各目标账号和各任务路线输入至异常账号检测模型中,计算多条任务路线两两之间的相似度,并根据相似度阈值进行分组,在异常分组中的任务路线的数量大于或者等于异常阈值的情况下,确定第一数量、第二数量、第三数量,进一步调整相似度阈值和异常阈值,继续训练,直至达到训练停止条件。如此,不仅可以提高对任务路线进行分组的速度,还可以提高样本确定异常分组的准确性,在节省人力成本的同时,提高异常账号检测模型的效率和准确度,进一步提高了检测异常账号的效率和准确度。
上述为本实施例的一种异常账号检测模型训练装置的示意性方案。需要说明的是,该异常账号检测模型训练装置的技术方案与上述的异常账号检测模型训练方法的技术方案属于同一构思,异常账号检测模型训练装置的技术方案未详细描述的细节内容,均可以参见上述异常账号检测模型训练方法的技术方案的描述。
与上述异常账号检测方法实施例相对应,本申请还提供了异常账号检测装置实施例,图6示出了本申请一实施例提供的一种异常账号检测装置的结构示意图。如图6所示,该装置包括:
获取模块602,被配置为获取至少两个待处理账号以及各待处理账号在目标任务下的待处理任务路线;
第二计算模块604,被配置为计算任意两条待处理任务路线之间的相似度;根据所述任意两条待处理任务路线之间的相似度以及相似度阈值,将所述待处理任务路线划分为至少一个分组;
标记模块606,被配置为在异常分组中的待处理任务路线的数量大于或者等于异常阈值的情况下,将所述异常分组中待处理任务路线对应的待处理账号标记为异常账号,所述异常分组为所述至少一个分组中的任意一个。
在本实施例的一个或多个实施方式中,所述获取模块602,还被配置为:
确定完成目标任务的至少两个待处理账号;
获取所述至少两个待处理账号中每个待处理账号与所述目标任务对应的轨迹数据,得到至少两组待处理轨迹数据;
将所述至少两组待处理轨迹数据中每组待处理轨迹数据按照时间顺序进行排序并去重,得到至少两条待处理任务路线。
在本实施例的一个或多个实施方式中,所述计算模块604,还被配置为:
确定至少两条待处理任务路线中每条待处理任务路线的长度;
选择所述至少两条待处理任务路线中的任意一条第一待处理任务路线和任意一条第二待处理任务路线进行合并处理,确定所述第一待处理任务路线和所述第二待处理任务路线的最短轨迹的合并路线,其中,任意一条所述第一待处理任务路线和任意一条所述第二待处理任务路线分别为两条不相同的待处理任务路线;
根据所述合并路线的长度、所述第一待处理任务路线的长度以及所述第二待处理任务路线的长度确定所述第一待处理任务路线与所述第二待处理任务路线的相似度。
本申请提供的一种异常账号检测装置,通过获取待处理账号和待处理任务路线,计算待处理任务路线两两之间的相似度,并根据相似度阈值进行分组,进一步在异常分组中的待处理任务路线的数量大于或者等于异常阈值的情况下,将异常分组中待处理任务路线对应的待处理账号标记为异常账号。保证了可以快速、准确的确定待处理账号中的异常账号,在节省人力成本的同时,进一步提高了检测异常账号的效率和准确度。
上述为本实施例的一种异常账号检测装置的示意性方案。需要说明的是,该异常账号检测装置的技术方案与上述的异常账号检测方法的技术方案属于同一构思,异常账号检测装置的技术方案未详细描述的细节内容,均可以参见上述异常账号检测方法的技术方案的描述。
图7示出了根据本说明书一个实施例提供的一种计算设备700的结构框图。该计算设备700的部件包括但不限于存储器710和处理器720。处理器720与存储器710通过总线730相连接,数据库750用于保存数据。
计算设备700还包括接入设备740,接入设备740使得计算设备700能够经由一个或多个网络760通信。这些网络的示例包括公用交换电话网(PSTN)、局域网(LAN)、广域网(WAN)、个域网(PAN)或诸如因特网的通信网络的组合。接入设备740可以包括有线或无线的任何类型的网络接口(例如,网络接口卡(NIC))中的一个或多个,诸如IEEE802.11无线局域网(WLAN)无线接口、全球微波互联接入(Wi-MAX)接口、以太网接口、通用串行总线(USB)接口、蜂窝网络接口、蓝牙接口、近场通信(NFC)接口,等等。
在本说明书的一个实施例中,计算设备700的上述部件以及图7中未示出的其他部件也可以彼此相连接,例如通过总线。应当理解,图7所示的计算设备结构框图仅仅是出于示例的目的,而不是对本说明书范围的限制。本领域技术人员可以根据需要,增添或替换其他部件。
计算设备700可以是任何类型的静止或移动计算设备,包括移动计算机或移动计算设备(例如,平板计算机、个人数字助理、膝上型计算机、笔记本计算机、上网本等)、移动电话(例如,智能手机)、可佩戴的计算设备(例如,智能手表、智能眼镜等)或其他类型的移动设备,或者诸如台式计算机或PC的静止计算设备。计算设备700还可以是移动式或静止式的服务器。
其中,处理器720执行所述计算机指令时实现所述的异常账号检测模型训练方法或异常账号检测方法的步骤。
上述为本实施例的一种计算设备的示意性方案。需要说明的是,该计算设备的技术方案与上述的异常账号检测模型训练方法或异常账号检测方法的技术方案属于同一构思,计算设备的技术方案未详细描述的细节内容,均可以参见上述异常账号检测模型训练方法或异常账号检测方法的技术方案的描述。
本申请一实施例还提供一种计算机可读存储介质,其存储有计算机指令,该计算机指令被处理器执行时实现如前所述异常账号检测模型训练方法或异常账号检测方法的步骤。
上述为本实施例的一种计算机可读存储介质的示意性方案。需要说明的是,该存储介质的技术方案与上述的异常账号检测模型训练方法或异常账号检测方法的技术方案属于同一构思,存储介质的技术方案未详细描述的细节内容,均可以参见上述异常账号检测模型训练方法或异常账号检测方法的技术方案的描述。
上述对本申请特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
所述计算机指令包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括电载波信号和电信信号。
需要说明的是,对于前述的各方法实施例,为了简便描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请并不受所描述的动作顺序的限制,因为依据本申请,某些步骤可以采用其它顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定都是本申请所必须的。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其它实施例的相关描述。
以上公开的本申请优选实施例只是用于帮助阐述本申请。可选实施例并没有详尽叙述所有的细节,也不限制该发明仅为所述的具体实施方式。显然,根据本申请的内容,可作很多的修改和变化。本申请选取并具体描述这些实施例,是为了更好地解释本申请的原理和实际应用,从而使所属技术领域技术人员能很好地理解和利用本申请。本申请仅受权利要求书及其全部范围和等效物的限制。

Claims (15)

1.一种异常账号检测模型训练方法,其特征在于,包括:
接收训练样本,其中,所述训练样本包括至少两个目标账号以及各目标账号在目标任务下的任务路线,至少一个所述目标账号被标注为异常账号;
将各目标账号和各任务路线输入至异常账号检测模型,计算任意两条任务路线之间的相似度;根据所述任意两条任务路线之间的相似度以及相似度阈值,将所述各任务路线划分为至少一个分组;
在异常分组中的任务路线的数量大于或者等于异常阈值的情况下,统计所述异常分组中所述异常账号对应的任务路线的第一数量,所述异常分组为所述至少一个分组中的任意一个;
识别所述异常分组中未标注账号的账号状态,统计所述异常分组中账号状态为异常的未标注账号的第二数量和账号状态为正常的未标注账号的第三数量;
根据所述第一数量、第二数量以及第三数量调整所述相似度阈值和所述异常阈值,返回执行所述根据所述任意两条任务路线之间的相似度以及相似度阈值,将所述各任务路线划分为至少一个分组步骤,直至达到训练停止条件。
2.根据权利要求1所述的方法,其特征在于,所述接收训练样本之前,包括:
确定完成目标任务的至少两个目标账号;
获取所述至少两个目标账号中每个目标账号的与所述目标任务对应的轨迹数据,得到至少两组轨迹数据;
将所述至少两组轨迹数据中每一组轨迹数据按照时间顺序进行排序并去重,得到至少两条任务路线。
3.根据权利要求1或2所述的方法,其特征在于,所述接收训练样本之前,还包括:
根据所述至少两条任务路线判断所述目标任务是否具有固定的任务起点以及固定的任务终点;
若否,更换目标任务,确定完成更换后的目标任务的至少两个目标账号,获取所述至少两个目标账号的与所述更换后的目标任务对应的至少两条任务路线。
4.根据权利要求1所述的方法,其特征在于,所述计算任意两条任务路线之间的相似度,包括:
确定至少两条任务路线中每条任务路线的长度;
选择所述至少两条任务路线中的任意一条第一任务路线和任意一条第二任务路线进行合并处理,确定所述第一任务路线和所述第二任务路线的最短轨迹的合并路线,其中,任意一条所述第一任务路线和任意一条所述第二任务路线分别为两条不相同的任务路线;
根据所述合并路线的长度、所述第一任务路线的长度以及所述第二任务路线的长度确定所述第一任务路线与所述第二任务路线的相似度。
5.根据权利要求2所述的方法,其特征在于,所述确定完成目标任务的至少两个目标账号之前,还包括:
确定至少一个目标路线和轨迹数据记录的频率,其中,所述至少一个目标路线为路线长度大于长度阈值且路线复杂度大于复杂度阈值的路线,所述路线复杂度包括弯道数量和/或障碍数量;
根据所述至少一个目标路线确定目标任务;
所述根据所述任意两条任务路线之间的相似度以及相似度阈值,将所述各任务路线划分为至少一个分组之前,还包括:
根据所述至少一个目标路线的路线长度、路线复杂度和历史异常账号中至少之一确定至少一个相似度阈值。
6.根据权利要求2所述的方法,其特征在于,所述确定完成目标任务的至少两个目标账号,包括:
根据所述目标任务的完成情况确定预设时间;
确定所述预设时间内完成所述目标任务的至少两个目标账号。
7.根据权利要求1所述的方法,其特征在于,所述根据所述任意两条任务路线之间的相似度以及相似度阈值,将所述各任务路线划分为至少一个分组,包括:
针对所述各任务路线分别创建初始分组;
采用预设的聚合算法对所述初始分组进行处理,获得目标分组,所述目标分组中包含所述相似度小于所述相似度阈值的任务路线。
8.根据权利要求1所述的方法,其特征在于,所述根据所述任意两条任务路线之间的相似度以及相似度阈值,将所述各任务路线划分为至少一个分组,包括:
根据所述相似度阈值、预设的密度阈值和预设的密度聚类算法对各任务路线进行处理,获得至少一个分组,各分组中包含所述相似度小于所述相似度阈值的任务路线。
9.一种异常账号检测方法,其特征在于,包括:
获取至少两个待处理账号以及各待处理账号在目标任务下的待处理任务路线;
计算任意两条待处理任务路线之间的相似度;根据所述任意两条待处理任务路线之间的相似度以及相似度阈值,将所述待处理任务路线划分为至少一个分组;
在异常分组中的待处理任务路线的数量大于或者等于异常阈值的情况下,将所述异常分组中待处理任务路线对应的待处理账号标记为异常账号,所述异常分组为所述至少一个分组中的任意一个。
10.根据权利要求9所述的方法,其特征在于,所述获取至少两个待处理账号以及各待处理账号在目标任务下的待处理任务路线,包括:
确定完成目标任务的至少两个待处理账号;
获取所述至少两个待处理账号中每个待处理账号与所述目标任务对应的轨迹数据,得到至少两组待处理轨迹数据;
将所述至少两组待处理轨迹数据中每组待处理轨迹数据按照时间顺序进行排序并去重,得到至少两条待处理任务路线。
11.根据权利要求9所述的方法,其特征在于,所述计算任意两条待处理任务路线之间的相似度,包括:
确定至少两条待处理任务路线中每条待处理任务路线的长度;
选择所述至少两条待处理任务路线中的任意一条第一待处理任务路线和任意一条第二待处理任务路线进行合并处理,确定所述第一待处理任务路线和所述第二待处理任务路线的最短轨迹的合并路线,其中,任意一条所述第一待处理任务路线和任意一条所述第二待处理任务路线分别为两条不相同的待处理任务路线;
根据所述合并路线的长度、所述第一待处理任务路线的长度以及所述第二待处理任务路线的长度确定所述第一待处理任务路线与所述第二待处理任务路线的相似度。
12.一种异常账号检测模型训练装置,其特征在于,包括:
接收模块,被配置为接收训练样本,其中,所述训练样本包括至少两个目标账号以及各目标账号在目标任务下的任务路线,至少一个所述目标账号被标注为异常账号;
第一计算模块,被配置为将各目标账号和各任务路线输入至异常账号检测模型,计算任意两条任务路线之间的相似度;根据所述任意两条任务路线之间的相似度以及相似度阈值,将所述各任务路线划分为至少一个分组;
统计模块,被配置为在异常分组中的任务路线的数量大于或者等于异常阈值的情况下,统计所述异常分组中所述异常账号对应的任务路线的第一数量,所述异常分组为所述至少一个分组中的任意一个;
识别模块,被配置为识别所述异常分组中未标注账号的账号状态,统计所述异常分组中账号状态为异常的未标注账号的第二数量和账号状态为正常的未标注账号的第三数量;
调整模块,被配置为根据所述第一数量、第二数量以及第三数量调整所述相似度阈值和所述异常阈值,返回执行所述根据所述任意两条任务路线之间的相似度以及相似度阈值,将所述各任务路线划分为至少一个分组步骤,直至达到训练停止条件。
13.一种异常账号检测装置,其特征在于,包括:
获取模块,被配置为获取至少两个待处理账号以及各待处理账号在目标任务下的待处理任务路线;
第二计算模块,被配置为计算任意两条待处理任务路线之间的相似度;根据所述任意两条待处理任务路线之间的相似度以及相似度阈值,将所述待处理任务路线划分为至少一个分组;
标记模块,被配置为在异常分组中的待处理任务路线的数量大于或者等于异常阈值的情况下,将所述异常分组中待处理任务路线对应的待处理账号标记为异常账号,所述异常分组为所述至少一个分组中的任意一个。
14.一种计算设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机指令,其特征在于,所述处理器执行所述计算机指令时实现权利要求1-8或权利要求9-11任意一项所述方法的步骤。
15.一种计算机可读存储介质,其存储有计算机指令,其特征在于,该计算机指令被处理器执行时实现权利要求1-8或权利要求9-11任意一项所述方法的步骤。
CN202110803006.2A 2021-07-15 2021-07-15 异常账号检测模型训练方法和异常账号检测方法 Active CN113521749B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110803006.2A CN113521749B (zh) 2021-07-15 2021-07-15 异常账号检测模型训练方法和异常账号检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110803006.2A CN113521749B (zh) 2021-07-15 2021-07-15 异常账号检测模型训练方法和异常账号检测方法

Publications (2)

Publication Number Publication Date
CN113521749A true CN113521749A (zh) 2021-10-22
CN113521749B CN113521749B (zh) 2024-02-13

Family

ID=78099597

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110803006.2A Active CN113521749B (zh) 2021-07-15 2021-07-15 异常账号检测模型训练方法和异常账号检测方法

Country Status (1)

Country Link
CN (1) CN113521749B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114373186A (zh) * 2022-01-11 2022-04-19 北京新学堂网络科技有限公司 一种社交软件信息交互方法、装置和介质
CN114401160A (zh) * 2022-01-19 2022-04-26 腾讯科技(深圳)有限公司 数据处理方法、装置、服务器、终端及存储介质
CN115591229A (zh) * 2022-10-31 2023-01-13 北京京航计算通讯研究所(Cn) 一种分布式网络对战训练的校验方法和系统
CN115664739A (zh) * 2022-10-17 2023-01-31 山东大学 基于流量特征匹配的用户身份属性主动检测方法及系统

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107158707A (zh) * 2017-04-27 2017-09-15 浙江大学 一种针对MMORPGs游戏的异常检测方法及装置
CN108905209A (zh) * 2018-06-11 2018-11-30 网易(杭州)网络有限公司 游戏中的外挂检测方法及系统、电子设备和存储介质
CN110227268A (zh) * 2018-03-06 2019-09-13 腾讯科技(深圳)有限公司 一种检测违规游戏帐号的方法及装置
CN110309383A (zh) * 2019-06-17 2019-10-08 武汉科技大学 基于改进的dbscan算法的船舶轨迹聚类分析方法
US10463953B1 (en) * 2013-07-22 2019-11-05 Niantic, Inc. Detecting and preventing cheating in a location-based game
CN111375210A (zh) * 2020-03-19 2020-07-07 网易(杭州)网络有限公司 游戏中同步器的检测方法、装置、处理设备及存储介质
CN111586001A (zh) * 2020-04-28 2020-08-25 咪咕文化科技有限公司 异常用户识别方法、装置、电子设备及存储介质
CN111639687A (zh) * 2020-05-19 2020-09-08 北京三快在线科技有限公司 一种模型训练以及异常账号识别方法及装置
US10881964B1 (en) * 2018-09-13 2021-01-05 Electronic Arts Inc. Automated detection of emergent behaviors in interactive agents of an interactive environment

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10463953B1 (en) * 2013-07-22 2019-11-05 Niantic, Inc. Detecting and preventing cheating in a location-based game
CN107158707A (zh) * 2017-04-27 2017-09-15 浙江大学 一种针对MMORPGs游戏的异常检测方法及装置
CN110227268A (zh) * 2018-03-06 2019-09-13 腾讯科技(深圳)有限公司 一种检测违规游戏帐号的方法及装置
CN108905209A (zh) * 2018-06-11 2018-11-30 网易(杭州)网络有限公司 游戏中的外挂检测方法及系统、电子设备和存储介质
US10881964B1 (en) * 2018-09-13 2021-01-05 Electronic Arts Inc. Automated detection of emergent behaviors in interactive agents of an interactive environment
CN110309383A (zh) * 2019-06-17 2019-10-08 武汉科技大学 基于改进的dbscan算法的船舶轨迹聚类分析方法
CN111375210A (zh) * 2020-03-19 2020-07-07 网易(杭州)网络有限公司 游戏中同步器的检测方法、装置、处理设备及存储介质
CN111586001A (zh) * 2020-04-28 2020-08-25 咪咕文化科技有限公司 异常用户识别方法、装置、电子设备及存储介质
CN111639687A (zh) * 2020-05-19 2020-09-08 北京三快在线科技有限公司 一种模型训练以及异常账号识别方法及装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
徐瑜等: "无监督机器学习在游戏反欺诈领域的应用研究", 信息网络安全, vol. 20, no. 9, pages 32 - 36 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114373186A (zh) * 2022-01-11 2022-04-19 北京新学堂网络科技有限公司 一种社交软件信息交互方法、装置和介质
CN114401160A (zh) * 2022-01-19 2022-04-26 腾讯科技(深圳)有限公司 数据处理方法、装置、服务器、终端及存储介质
CN114401160B (zh) * 2022-01-19 2022-12-02 腾讯科技(深圳)有限公司 数据处理方法、装置、服务器、终端及存储介质
CN115664739A (zh) * 2022-10-17 2023-01-31 山东大学 基于流量特征匹配的用户身份属性主动检测方法及系统
CN115664739B (zh) * 2022-10-17 2024-05-07 山东大学 基于流量特征匹配的用户身份属性主动检测方法及系统
CN115591229A (zh) * 2022-10-31 2023-01-13 北京京航计算通讯研究所(Cn) 一种分布式网络对战训练的校验方法和系统

Also Published As

Publication number Publication date
CN113521749B (zh) 2024-02-13

Similar Documents

Publication Publication Date Title
CN113521749A (zh) 异常账号检测模型训练方法和异常账号检测方法
CN112494952B (zh) 目标游戏用户的检测方法、装置及设备
CN104778173B (zh) 目标用户确定方法、装置及设备
CN107423613B (zh) 依据相似度确定设备指纹的方法、装置及服务器
CN110879856B (zh) 一种基于多特征融合的社交群体分类方法及系统
CN108470354A (zh) 视频目标跟踪方法、装置和实现装置
CN112434742A (zh) 一种识别以太坊上庞氏骗局的方法、系统及设备
CN111144483A (zh) 一种图像特征点过滤方法以及终端
CN108304853B (zh) 游戏相关度的获取方法、装置、存储介质和电子装置
CN104462273B (zh) 提取轨迹的方法及系统
CN109104688A (zh) 使用聚集技术生成无线网络接入点模型
CN107335220B (zh) 一种消极用户的识别方法、装置及服务器
CN111860101A (zh) 一种人脸关键点检测模型的训练方法及装置
CN104881640A (zh) 一种获取向量的方法及装置
CN110292773A (zh) 一种角色运动跟随方法及装置、计算设备及存储介质
CN106204597A (zh) 一种基于自步式弱监督学习的视频物体分割方法
CN112381616A (zh) 物品推荐引导方法、装置及计算机设备
CN106776757B (zh) 用户完成网银操作的指示方法及装置
CN106156167A (zh) 数据收集/处理的方法、运动信息采集设备和系统
CN112257332B (zh) 一种仿真模型的评估方法及装置
CN112084876A (zh) 一种目标对象追踪方法、系统、装置及介质
CN108734366A (zh) 用户识别方法及其系统
CN111782904A (zh) 一种基于改进smote算法的非平衡数据集处理方法及系统
CN113521750B (zh) 异常账号检测模型训练方法和异常账号检测方法
CN111984842B (zh) 银行客户数据处理方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information

Address after: 519000 Room 102, 202, 302 and 402, No. 325, Qiandao Ring Road, Tangjiawan Town, high tech Zone, Zhuhai City, Guangdong Province, Room 102 and 202, No. 327 and Room 302, No. 329

Applicant after: Zhuhai Jinshan Digital Network Technology Co.,Ltd.

Address before: 519000 Room 102, 202, 302 and 402, No. 325, Qiandao Ring Road, Tangjiawan Town, high tech Zone, Zhuhai City, Guangdong Province, Room 102 and 202, No. 327 and Room 302, No. 329

Applicant before: ZHUHAI KINGSOFT ONLINE GAME TECHNOLOGY Co.,Ltd.

CB02 Change of applicant information
GR01 Patent grant
GR01 Patent grant