CN110659954A - 作弊识别方法、装置、电子设备及可读存储介质 - Google Patents

作弊识别方法、装置、电子设备及可读存储介质 Download PDF

Info

Publication number
CN110659954A
CN110659954A CN201910809845.8A CN201910809845A CN110659954A CN 110659954 A CN110659954 A CN 110659954A CN 201910809845 A CN201910809845 A CN 201910809845A CN 110659954 A CN110659954 A CN 110659954A
Authority
CN
China
Prior art keywords
user
real
cheating
time
behavior
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910809845.8A
Other languages
English (en)
Other versions
CN110659954B (zh
Inventor
蔡鸿
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Sankuai Online Technology Co Ltd
Original Assignee
Beijing Sankuai Online Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Sankuai Online Technology Co Ltd filed Critical Beijing Sankuai Online Technology Co Ltd
Priority to CN201910809845.8A priority Critical patent/CN110659954B/zh
Publication of CN110659954A publication Critical patent/CN110659954A/zh
Application granted granted Critical
Publication of CN110659954B publication Critical patent/CN110659954B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0609Buyer or seller confidence or verification

Landscapes

  • Business, Economics & Management (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

本公开的实施例提供了一种作弊识别方法、装置、电子设备及可读存储介质,所述方法包括:获取用户的实时行为,并根据所述实时行为生成实时用户特征;将所述实时用户特征、预先生成的历史用户特征输入至预先训练得到的机器模型中,预测得到所述实时行为对应的作弊概率,所述机器模型通过用户特征样本构成的用户特征样本集训练得到,所述用户特征样本包括一个或多个用户特征,所述用户特征样本集根据所述用户特征之间的相关性进行预处理;根据所述作弊概率确定所述实时行为是否为作弊行为。本公开实施例可以根据实时行为预测作弊行为,有助于解决冷启动问题。

Description

作弊识别方法、装置、电子设备及可读存储介质
技术领域
本公开的实施例涉及网络技术领域,尤其涉及一种作弊识别方法、装置、电子设备及可读存储介质。
背景技术
在网络技术的迅速发展下,同时也导致了网络作弊的频繁发生。网络作弊严重影响网络数据的质量和用户体验。
现有技术中,一种可以识别作弊订单的方案的主要步骤包括:首先,获取订单的属性信息和与订单相关的用户的行为信息;然后,根据订单的属性信息和行为信息,通过作弊预测模型获取订单的作弊概率,其中,用户的行为信息包括:乘客的历史作弊行为、乘客的注册时间、乘客的手机号/设备是否是黑名单用户、司机的历史作弊行为、司机的注册时间及司机的该天的订单数;最后,若作弊概率大于第一阈值,则确定该订单为作弊订单,否则为正常订单。
发明人对上述方案进行研究过程中发现,上述方案依赖于乘客、司机的历史作弊行为,存在冷启动问题,即当不存在历史作弊行为时,需要通过其他方法补充历史作弊行为,导致模型的识别准确度较低。
发明内容
本公开的实施例提供一种作弊识别方法、装置、电子设备及可读存储介质,可以解决现有技术中作弊识别的上述问题。
根据本公开的实施例的第一方面,提供了一种作弊识别方法,所述方法包括:
获取用户的实时行为,并根据所述实时行为生成实时用户特征;
将所述实时用户特征、预先生成的历史用户特征输入至预先训练得到的机器模型中,预测得到所述实时行为对应的作弊概率,所述机器模型通过用户特征样本构成的用户特征样本集训练得到,所述用户特征样本包括一个或多个用户特征,所述用户特征样本集根据所述用户特征之间的相关性进行预处理;
根据所述作弊概率确定所述实时行为是否为作弊行为。
根据本公开的实施例的第二方面,提供了一种作弊识别装置,所述装置包括:
实时用户特征生成模块,用于获取用户的实时行为,并根据所述实时行为生成实时用户特征;
作弊概率预测模块,用于将所述实时用户特征、预先生成的历史用户特征输入至预先训练得到的机器模型中,预测得到所述实时行为对应的作弊概率,所述机器模型通过用户特征样本构成的用户特征样本集训练得到,所述用户特征样本包括一个或多个用户特征,所述用户特征样本集根据所述用户特征之间的相关性进行预处理;
作弊行为判别模块,用于根据所述作弊概率确定所述实时行为是否为作弊行为。
根据本公开的实施例的第三方面,提供了一种电子设备,包括:
处理器、存储器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述程序时实现前述作弊识别方法。
根据本公开的实施例的第四方面,提供了一种可读存储介质,其特征在于,当所述存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行前述作弊识别方法。
本公开的实施例提供了一种作弊识别方法及装置,所述方法包括:获取用户的实时行为,并根据所述实时行为生成实时用户特征;将所述实时用户特征、预先生成的历史用户特征输入至预先训练得到的机器模型中,预测得到所述实时行为对应的作弊概率,所述机器模型通过用户特征样本构成的用户特征样本集训练得到,所述用户特征样本包括一个或多个用户特征,所述用户特征样本集根据所述用户特征之间的相关性进行预处理;根据所述作弊概率确定所述实时行为是否为作弊行为。本公开实施例可以根据实时行为预测作弊行为,有助于解决冷启动问题。
附图说明
为了更清楚地说明本公开的实施例的技术方案,下面将对本公开的实施例的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本公开的实施例的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1示出了本公开的一种实施例中的作弊识别方法步骤流程图;
图2示出了本公开的一种实施例中的作弊识别装置的结构图;
图3示出了本公开的一种实施例中的电子设备的结构图。
具体实施方式
下面将结合本公开的实施例中的附图,对本公开的实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本公开的实施例一部分实施例,而不是全部的实施例。基于本公开的实施例中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本公开的实施例保护的范围。
实施例一
参照图1,其示出了本公开的一种实施例中的作弊识别方法的步骤流程图,具体如下。
步骤101,获取用户的实时行为,并根据所述实时行为生成实时用户特征。
其中,实时行为包括但不限于:评论行为、浏览行为、下单行为、登录行为、搜索行为、定位行为等。
实时用户特征针对不同的实时行为而不同,例如,针对评论行为生成评论次数、评论频率、评论对象的信息等特征;针对浏览行为生成浏览次数、浏览频率、浏览对象的信息、点击率、浏览的时序时长等特征,针对下单行为生成下单次数、下单频率、下单率、订单类型等特征,针对登录行为生成登录成功次数、失败次数、登录的客户端信息、登录成功率、登录账号信息等特征,针对搜索行为生成搜索次数、搜索对象信息、搜索类型等特征,针对定位行为生成定位位置,在一定时间内定位位置形成的轨迹。
可以理解,不同的实时行为对应的统计特征例如,次数、频率、下单率、登录成功率等可以预先配置统计公式,并根据统计公式计算得到,其他特征直接从访问记录中提取即可。
在本公开的实施例中,可以从多种类型的行为中提取多个维度上的用户特征,以从多个维度分析实时行为是否为作弊行为,有助于提高作弊行为的识别准确度。
步骤102,将所述实时用户特征、预先生成的历史用户特征输入至预先训练得到的机器模型中,预测得到所述实时行为对应的作弊概率,所述机器模型通过用户特征样本构成的用户特征样本集训练得到,所述用户特征样本包括一个或多个用户特征,所述用户特征样本集根据所述用户特征之间的相关性进行预处理。
其中,历史用户特征可以随着时间的推移而更新,例如,在时刻t1,历史用户特征包括t2时刻生成的实时用户特征,以及t2时刻之前生成历史用户特征,以此类推。
机器模型可以为预选的深度学习模型,然后通过标注了是否为作弊的用户特征样本进行训练,在训练好之后可以用于预测作弊概率。
可以理解,用户特征样本与实时用户特征对应,也是多个维度上的用户特征。
在本公开的实施例中,在训练机器模型之前,可以将用户特征进行简化,以提高训练速度以及准确度。具体地,若两个用户特征之间的相关性大于一定阈值,则确定这两个用户特征之间相关性很大,则删除其中一个用户特征,仅用剩下的一个用户特征进行训练。
可选地,在本公开另一种实施例中,所述用户特征样本集根据所述用户特征之间的相关性进行预处理,包括子步骤A1至A2:
子步骤A1,计算所述用户特征样本中所述用户特征之间的相关性系数。
在本公开的实施例中,可以采用皮尔逊公式或互信息公式计算得到相关性系数。例如,对于其中两个用户特征,从大量用户特征样本中提取每个用户特征对应的不同取值,从而每个用户特征均可以作为一个变量,最后根据两个用户特征的不同取值计算两个用户特征之间的相关系系数。其中,每个用户特征样本可以包括多个用户特征,例如,一个典型的用户特征样本可以为[A,B,C,….,X,Y,Z],从而该用户特征样本包括了A至Z一共26个特征。
例如,皮尔逊相关系数可以通过如下公式计算得到:
Figure BDA0002184804320000051
其中,rX,Y为用户特征X和用户特征Y之间的皮尔逊相关系数,I为用户特征样本的数目,Xi为第i个用户特征样本中用户特征X对应的取值,Yi为第i个用户特征样本中用户特征Y对应的取值,X为所有用户特征样本中用户特征X的平均值,
Figure BDA0002184804320000053
为所有用户特征样本中用户特征Y的平均值。
此外,互信息还可以作为相关性系数的衡量,具体计算公式可以如下:
Figure BDA0002184804320000052
其中,p(x,y)为用户特征X和Y的联合概率,p(x)和p(y)分别为用户特征X和用户Y的边缘概率。
当然,本公开的实施例还可以采用其他方式计算两个变量之间的相关性系数,本公开的实施例对其不加以限制。在实际应用中,可以将多个相关性系数的公式叠加使用,从而进行多重删除。
子步骤A2,若其中两个所述用户特征之间的相关性系数大于预设相关阈值,则从所述用户特征样本集中每个用户特征样本中删除第一目标特征,所述第一目标特征为两个所述用户特征中的其中一个。
其中,预设相关阈值根据相关性系数的计算公式以及实际需求设定,本公开的实施例对其不加以限制。
本公开的实施例可以在训练时从用户特征样本中将相关性较大的用户特征删除,从而降低用户特征样本的冗余特征,提高训练速度。
在本公开另一种实施例中,在步骤102之前还包括步骤B1:
步骤B1,从所述实时用户特征、预先生成的历史用户特征中删除所述第一目标特征。
本公开的实施例可以在预测时从实时用户特征、历史用户特征中将相关性较大的用户特征删除,从而降低实时用户特征、历史用户特征中的冗余特征,提高预测的响应速度。
可选地,在本公开实施例中,所述用户特征样本集通过如下步骤A3至A4扩展得到新的用户特征样本:
子步骤A3,确定所述用户特征样本包含的所述用户特征所符合的分布函数。
具体地,可以将用户特征样本中用户特征的取值拟合已知的分布函数,例如,正态分布、伽马分布等,当用户特征与其中一个分布函数的拟合度大于一定阈值,则确定用户特征符合该分布函数,当然,当用户特征与多个分布函数的拟合度均大于一定阈值,则确定用户特征符合拟合度最高的分布函数。
在实际应用中,拟合度可以为用户特征的取值与对应的分布函数的取值之间的平均差值。现有技术中存在很多拟合算法,本公开的实施例对采用的拟合算法不加以限制。
子步骤A4,根据所述分布函数以及所述用户特征样本生成新的用户特征样本。
具体地,可以将分布函数对应的取值中不包含在用户特征的取值中的取值作为新的用户特征样本中用户特征的取值。
可选地,在本公开另一种实施例中,子步骤A4包括子步骤C1至C2:
子步骤C1,将所述用户特征样本包含的用户特征对应的取值作为参考取值。
子步骤C2,根据所述分布函数确定所述参考取值之外的其他取值,得到新的用户特征样本的用户特征对应的取值。
具体地,可以按照一定步长计算出分布函数所有的取值,然后将参考取值之外的其他取值作为新的用户特征的取值。
本公开的实施例可以拟合分布函数,并根据分布函数对用户特征样本进行扩展,提高样本的数量和多样性,有助于提高机器模型的准确度。
可选地,在本公开另一种实施例中,所述用户特征样本包括表示所述用户特征样本是否为作弊样本的标注信息,所述用户特征样本集通过如下步骤D1至D2进行预处理:
步骤D1,针对每个用户特征,根据所述用户特征的取值分布、所述标注信息,采用预设函数模型确定所述用户特征对识别作弊行为的贡献度。
具体地,首先统计所有用户特征样本中作弊样本的占比,以及非作弊样本的占比;然后,针对每个用户特征,在作弊样本中统计该用户特征的分布,以及,在非作弊样本中统计该用户特征的分布;最后,若在作弊样本中该用户特征的分布和在非作弊样本中的分布分别趋于两个极端,则该用户特征对识别作弊行为的贡献度越大;若在作弊样本中该用户特征的分布和在非作弊样本中的分布分别趋于类似,则确定该用户特征对识别作弊行为的贡献度越小。
例如,用户特征样本中有312个作弊样本和396个非作弊样本,作弊样本中5%的样本中单位时间内的搜索次数超过10次,搜索次数不超过10次的样本占95%,即作弊样本中大部分样本的搜索次数均不超过10次;而非作弊样本中90%的样本中单位时间内的搜索次数超过10次,而仅有10%的样本中单位时间内的搜索次数不超过10次,即非作弊样本中大部分样本的搜索次数均超过10次;从而作弊样本中搜索次数的分布和非作弊样本中搜索次数的分布趋于两个极端,从而搜索次数对识别作弊行为的贡献度较大。
又例如,用户特征样本中有312个作弊样本和396个非作弊样本,作弊样本中20%的样本中下单率在0.8以上,80%的样本中下单率在0.8以下;非作弊样本中22%的样本中下单率在0.8以上,78%的样本中下单率在0.8以下;可以看出,作弊样本和非作弊样本中下单率的分布趋于相同,从而下单率对识别作弊行为的贡献度较小。
在本公开的实施例中,贡献度可以为用户特征在取值区间内的作弊样本在所有样本中的占比,与在取值区间内的作弊样本在所有样本中的占比的函数,可以采用概率模型计算得到贡献度。具体如下:
Figure BDA0002184804320000071
其中,CON为贡献度,I为用户特征的取值区间的数目,FTPi为用户特征在第i个取值区间内的作弊样本在所有样本中的占比,FTNi为用户特征在第i个取值区间内的非作弊样本在所有样本中的占比,FTPi和FTNi可以理解为概率。
具体地,函数f(FTPi,FTNi)可以采用如下公式:
Figure BDA0002184804320000081
当然,函数f(FTPi,FTNi)还可以为
Figure BDA0002184804320000082
的进一步变形等,可以理解,只要是能表达FTPi和FTNi之间差距越大,代表用户特征的贡献度越大的公式均即可。
需要说明的是,取值区间可以按照用户特征的取值范围均匀划分。
步骤D2,从所述用户特征样本集中每个用户特征样本中删除第二目标特征,所述第二目标特征为所述贡献度不满足预设贡献度条件的用户特征。
本公开的实施例可以通过预设的函数模型准确计算每个用户特征的贡献度,从而在训练时从用户特征样本中将贡献度不符合预设贡献度条件的用户特征删除,从而降低用户特征样本的冗余特征,提高训练速度。
可选地,在本公开另一种实施例中,在所述步骤102之前,还包括步骤B2:
步骤B2,从所述实时用户特征、预先生成的历史用户特征中删除所述第二目标特征。
本公开的实施例可以计算用户特征对识别作弊行为的贡献度,并在预测时根据贡献度从实时用户特征、历史用户特征中删除无法识别作弊行为的用户特征,从而进一步降低实时用户特征、历史用户特征中的冗余特征,提高预测的响应速度。
步骤103,根据所述作弊概率确定所述实时行为是否为作弊行为。
可以理解,作弊概率越大,越有可能为作弊行为;作弊概率越小,越有可能为非作弊行为。
具体地,可以建立作弊概率与是否为作弊行为的函数关系,从而输入作弊概率预测是否为作弊行为。
可选地,在本公开另一种实施例中,步骤103包括子步骤E1至E2:
子步骤E1,若所述作弊概率大于预设作弊概率阈值,则确定所述实时行为为作弊行为。
其中,作弊概率阈值可以根据实际应用场景设定,本公开的实施例对其不加以限制。例如,设置作弊概率阈值为0.6,则作弊概率为0.6时,认定该实时行为为作弊行为;否则为非作弊行为。
子步骤E2,若所述作弊概率小于预设作弊概率阈值,则确定所述实时行为不为作弊行为。
本公开的实施例可以采用简单的作弊概率阈值确定作弊行为。作弊概率阈值可以在应用一段时间之后根据判断结果以及实际结果调整,以使得判断更准确。
综上所述,本公开的实施例提供了一种作弊识别方法,所述方法包括:获取用户的实时行为,并根据所述实时行为生成实时用户特征;将所述实时用户特征、预先生成的历史用户特征输入至预先训练得到的机器模型中,预测得到所述实时行为对应的作弊概率,所述机器模型通过用户特征样本构成的用户特征样本集训练得到,所述用户特征样本包括一个或多个用户特征,所述用户特征样本集根据所述用户特征之间的相关性进行预处理;根据所述作弊概率确定所述实时行为是否为作弊行为。本公开实施例可以根据实时行为预测作弊行为,有助于解决冷启动问题。
实施例二
参照图2,其示出了在本公开的另一种实施例中的作弊识别装置的结构图,具体如下。
实时用户特征生成模块201,用于获取用户的实时行为,并根据所述实时行为生成实时用户特征。
作弊概率预测模块202,用于将所述实时用户特征、预先生成的历史用户特征输入至预先训练得到的机器模型中,预测得到所述实时行为对应的作弊概率,所述机器模型通过用户特征样本构成的用户特征样本集训练得到,所述用户特征样本包括一个或多个用户特征,所述用户特征样本集根据所述用户特征之间的相关性进行预处理。
作弊行为判别模块203,用于根据所述作弊概率确定所述实时行为是否为作弊行为。
可选地,在本公开另一种实施例中,所述装置还包括:
相关性计算子模块,用于计算所述用户特征样本中所述用户特征之间的相关性系数。
第一删除子模块,用于若其中两个所述用户特征之间的相关性系数大于预设相关阈值,则从所述用户特征样本集中每个用户特征样本中删除第一目标特征,所述第一目标特征为两个所述用户特征中的其中一个。
在本公开另一种实施例中,所述装置还包括:
第二删除模块,用于从所述实时用户特征、预先生成的历史用户特征中删除所述第一目标特征。
可选地,在本公开实施例中,所述用户特征样本集通过如下模块扩展得到新的用户特征样本:
分布函数确定子模块,用于确定所述用户特征样本包含的所述用户特征所符合的分布函数。
用户特征样本扩展子模块,用于根据所述分布函数以及所述用户特征样本生成新的用户特征样本。
可选地,在本公开另一种实施例中,所述用户特征样本扩展子模块包括:
参考取值确定单元,用于将所述用户特征样本包含的用户特征对应的取值作为参考取值。
用户特征样本扩展单元,用于根据所述分布函数确定所述参考取值之外的其他取值,得到新的用户特征样本的用户特征对应的取值。
可选地,在本公开另一种实施例中,所述用户特征样本包括表示所述用户特征样本是否为作弊样本的标注信息,所述用户特征样本集通过如下模块进行预处理:
贡献度确定模块,用于针对每个用户特征,根据所述用户特征的取值分布、所述标注信息,采用预设函数模型确定所述用户特征对识别作弊行为的贡献度。
第三删除模块,用于从所述用户特征样本集中每个用户特征样本中删除第二目标特征,所述第二目标特征为所述贡献度不满足预设贡献度条件的用户特征。
可选地,在本公开另一种实施例中,所述装置还包括:
第四删除模块,用于从所述实时用户特征、预先生成的历史用户特征中删除所述第二目标特征。
可选地,在本公开另一种实施例中,所述作弊行为判别模块203包括:
第一作弊行为判别子模块,用于若所述作弊概率大于预设作弊概率阈值,则确定所述实时行为为作弊行为。
第二作弊行为判别子模块,用于若所述作弊概率小于预设作弊概率阈值,则确定所述实时行为不为作弊行为。
综上所述,本公开的实施例提供了一种作弊识别装置,所述装置包括:实时用户特征生成模块,用于获取用户的实时行为,并根据所述实时行为生成实时用户特征;作弊概率预测模块,用于将所述实时用户特征、预先生成的历史用户特征输入至预先训练得到的机器模型中,预测得到所述实时行为对应的作弊概率,所述机器模型通过用户特征样本构成的用户特征样本集训练得到,所述用户特征样本包括一个或多个用户特征,所述用户特征样本集根据所述用户特征之间的相关性进行预处理;作弊行为判别模块,用于根据所述作弊概率确定所述实时行为是否为作弊行为。本公开实施例可以根据实时行为预测作弊行为,有助于解决冷启动问题。
实施例二为实施例一对应的装置实施例,详细说明可以参照实施例一,在此不再赘述。
本公开的实施例还提供了一种电子设备,参照图3,包括:处理器501、存储器502以及存储在所述存储器502上并可在所述处理器上运行的计算机程序5021,所述处理器501执行所述程序时实现前述实施例的作弊识别方法。
本公开的实施例还提供了一种可读存储介质,当所述存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行前述实施例的作弊识别方法。
对于装置实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
在此提供的算法和显示不与任何特定计算机、虚拟系统或者其它设备固有相关。各种通用系统也可以与基于在此的示教一起使用。根据上面的描述,构造这类系统所要求的结构是显而易见的。此外,本公开的实施例也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本公开的实施例的内容,并且上面对特定语言所做的描述是为了披露本公开的实施例的最佳实施方式。
在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本公开的实施例的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
类似地,应当理解,为了精简本公开并帮助理解各个发明方面中的一个或多个,在上面对本公开的实施例的示例性实施例的描述中,本公开的实施例的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本公开的实施例要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本公开的实施例的单独实施例。
本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
本公开的实施例的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本公开的实施例的作弊识别设备中的一些或者全部部件的一些或者全部功能。本公开的实施例还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序。这样的实现本公开的实施例的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。
应该注意的是上述实施例对本公开的实施例进行说明而不是对本公开的实施例进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本公开的实施例可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
以上所述仅为本公开的实施例的较佳实施例而已,并不用以限制本公开的实施例,凡在本公开的实施例的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本公开的实施例的保护范围之内。
以上所述,仅为本公开的实施例的具体实施方式,但本公开的实施例的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本公开的实施例揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本公开的实施例的保护范围之内。因此,本公开的实施例的保护范围应以权利要求的保护范围为准。

Claims (9)

1.一种作弊识别方法,其特征在于,所述方法包括:
获取用户的实时行为,并根据所述实时行为生成实时用户特征;
将所述实时用户特征、预先生成的历史用户特征输入至预先训练得到的机器模型中,预测得到所述实时行为对应的作弊概率,所述机器模型通过用户特征样本构成的用户特征样本集训练得到,所述用户特征样本包括一个或多个用户特征,所述用户特征样本集根据所述用户特征之间的相关性进行预处理;
根据所述作弊概率确定所述实时行为是否为作弊行为。
2.根据权利要求1所述的方法,其特征在于,所述用户特征样本集根据所述用户特征之间的相关性进行预处理,包括:
计算所述用户特征样本中所述用户特征之间的相关性系数;
若其中两个所述用户特征之间的相关性系数大于预设相关阈值,则从所述用户特征样本集中每个用户特征样本中删除第一目标特征,所述第一目标特征为两个所述用户特征中的其中一个;
在所述将所述实时用户特征、预先生成的历史用户特征输入至预先训练得到的机器模型中,预测得到所述实时行为对应的作弊概率的步骤之前,所述方法还包括:
从所述实时用户特征、预先生成的历史用户特征中删除所述第一目标特征。
3.根据权利要求1或2所述的方法,其特征在于,所述用户特征样本集通过如下步骤扩展得到新的用户特征样本:
确定所述用户特征样本包含的所述用户特征所符合的分布函数;
根据所述分布函数以及所述用户特征样本生成新的用户特征样本。
4.根据权利要求3所述的方法,其特征在于,所述根据所述分布函数以及所述用户特征样本生成新的用户特征样本的步骤,包括:
将所述用户特征样本包含的用户特征对应的取值作为参考取值;
根据所述分布函数确定所述参考取值之外的其他取值,得到新的用户特征样本的用户特征对应的取值。
5.根据权利要求4所述的方法,其特征在于,所述用户特征样本包括表示所述用户特征样本是否为作弊样本的标注信息,所述用户特征样本集通过如下步骤进行预处理:
针对每个用户特征,根据所述用户特征的取值分布、所述标注信息,采用预设函数模型确定所述用户特征对识别作弊行为的贡献度;
从所述用户特征样本集中每个用户特征样本中删除第二目标特征,所述第二目标特征为所述贡献度不满足预设贡献度条件的用户特征;
在所述将所述实时用户特征、预先生成的历史用户特征输入至预先训练得到的机器模型中,预测得到所述实时行为对应的作弊概率的步骤之前,所述方法还包括:
从所述实时用户特征、预先生成的历史用户特征中删除所述第二目标特征。
6.根据权利要求5所述的方法,其特征在于,所述根据所述作弊概率确定所述实时行为是否为作弊行为的步骤,包括:
若所述作弊概率大于预设作弊概率阈值,则确定所述实时行为为作弊行为;
若所述作弊概率小于预设作弊概率阈值,则确定所述实时行为不为作弊行为。
7.一种作弊识别装置,其特征在于,所述装置包括:
实时用户特征生成模块,用于获取用户的实时行为,并根据所述实时行为生成实时用户特征;
作弊概率预测模块,用于将所述实时用户特征、预先生成的历史用户特征输入至预先训练得到的机器模型中,预测得到所述实时行为对应的作弊概率,所述机器模型通过用户特征样本构成的用户特征样本集训练得到,所述用户特征样本包括一个或多个用户特征,所述用户特征样本集根据所述用户特征之间的相关性进行预处理;
作弊行为判别模块,用于根据所述作弊概率确定所述实时行为是否为作弊行为。
8.一种电子设备,其特征在于,包括:
处理器、存储器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1-6中一个或多个所述的作弊识别方法。
9.一种可读存储介质,其特征在于,当所述存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行如方法权利要求1-6中一个或多个所述的作弊识别方法。
CN201910809845.8A 2019-08-29 2019-08-29 作弊识别方法、装置、电子设备及可读存储介质 Active CN110659954B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910809845.8A CN110659954B (zh) 2019-08-29 2019-08-29 作弊识别方法、装置、电子设备及可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910809845.8A CN110659954B (zh) 2019-08-29 2019-08-29 作弊识别方法、装置、电子设备及可读存储介质

Publications (2)

Publication Number Publication Date
CN110659954A true CN110659954A (zh) 2020-01-07
CN110659954B CN110659954B (zh) 2022-06-17

Family

ID=69036757

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910809845.8A Active CN110659954B (zh) 2019-08-29 2019-08-29 作弊识别方法、装置、电子设备及可读存储介质

Country Status (1)

Country Link
CN (1) CN110659954B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111262854A (zh) * 2020-01-15 2020-06-09 卓望数码技术(深圳)有限公司 互联网反作弊行为方法、装置、设备和可读存储介质
CN112598286A (zh) * 2020-12-23 2021-04-02 作业帮教育科技(北京)有限公司 一种众包用户作弊行为检测方法、装置及电子设备
CN113592036A (zh) * 2021-08-25 2021-11-02 北京沃东天骏信息技术有限公司 流量作弊行为识别方法、装置及存储介质和电子设备

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015034673A1 (en) * 2013-09-04 2015-03-12 Questionmark Computing Limited System and method for data anomaly detection process in assessments
CN108596632A (zh) * 2017-03-07 2018-09-28 北京嘀嘀无限科技发展有限公司 一种基于订单属性和用户行为的反作弊识别方法及系统

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015034673A1 (en) * 2013-09-04 2015-03-12 Questionmark Computing Limited System and method for data anomaly detection process in assessments
CN108596632A (zh) * 2017-03-07 2018-09-28 北京嘀嘀无限科技发展有限公司 一种基于订单属性和用户行为的反作弊识别方法及系统

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111262854A (zh) * 2020-01-15 2020-06-09 卓望数码技术(深圳)有限公司 互联网反作弊行为方法、装置、设备和可读存储介质
CN112598286A (zh) * 2020-12-23 2021-04-02 作业帮教育科技(北京)有限公司 一种众包用户作弊行为检测方法、装置及电子设备
CN113592036A (zh) * 2021-08-25 2021-11-02 北京沃东天骏信息技术有限公司 流量作弊行为识别方法、装置及存储介质和电子设备

Also Published As

Publication number Publication date
CN110659954B (zh) 2022-06-17

Similar Documents

Publication Publication Date Title
CN105678587B (zh) 一种推荐特征确定方法、信息推荐方法及装置
CN110659954B (zh) 作弊识别方法、装置、电子设备及可读存储介质
US10747771B2 (en) Method and apparatus for determining hot event
US20170103337A1 (en) System and method to discover meaningful paths from linked open data
CN108733756B (zh) 数据预加载方法、装置、电子设备及可读存储介质
CN109165691A (zh) 用于识别作弊用户的模型的训练方法、装置及电子设备
CN112613938B (zh) 模型训练方法、装置及计算机设备
CN112423134B (zh) 视频内容推荐方法、装置、计算机设备及存储介质
CN112784168B (zh) 信息推送模型训练方法以及装置、信息推送方法以及装置
CN112487283A (zh) 训练模型的方法、装置、电子设备及可读存储介质
CN112508638B (zh) 数据处理的方法、装置及计算机设备
CN110766184A (zh) 订单量预测方法和装置
CN110659807A (zh) 一种基于链路的风险用户识别方法及装置
CN111181757A (zh) 信息安全风险预测方法、装置以及计算设备、存储介质
CN113407854A (zh) 一种应用推荐方法、装置、设备及计算机可读存储介质
CN103034866B (zh) 一种目标识别方法、装置及系统
CN116684330A (zh) 基于人工智能的流量预测方法、装置、设备及存储介质
US20130030759A1 (en) Smoothing a time series data set while preserving peak and/or trough data points
JP5791555B2 (ja) 状態追跡装置、方法、及びプログラム
JP7015927B2 (ja) 学習モデル適用システム、学習モデル適用方法、及びプログラム
CN113204699B (zh) 信息推荐方法、装置、电子设备及存储介质
CN111428125B (zh) 排序方法、装置、电子设备及可读存储介质
CN111881007A (zh) 操作行为判断方法、装置、设备及计算机可读存储介质
CN110634006B (zh) 广告点击率的预测方法、装置、设备及可读存储介质
CN116310994A (zh) 一种视频片段提取方法、装置、电子设备及介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant