CN111047332B - 模型训练和风险识别方法、装置及设备 - Google Patents
模型训练和风险识别方法、装置及设备 Download PDFInfo
- Publication number
- CN111047332B CN111047332B CN201911108448.4A CN201911108448A CN111047332B CN 111047332 B CN111047332 B CN 111047332B CN 201911108448 A CN201911108448 A CN 201911108448A CN 111047332 B CN111047332 B CN 111047332B
- Authority
- CN
- China
- Prior art keywords
- event
- user
- sequence
- user event
- track
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000012549 training Methods 0.000 title claims abstract description 44
- 238000000034 method Methods 0.000 title claims abstract description 42
- 239000013598 vector Substances 0.000 claims description 60
- 230000015654 memory Effects 0.000 claims description 22
- 238000012545 processing Methods 0.000 claims description 9
- 238000004590 computer program Methods 0.000 claims description 8
- 238000000605 extraction Methods 0.000 claims description 5
- 230000008569 process Effects 0.000 description 12
- 238000004891 communication Methods 0.000 description 10
- 238000010586 diagram Methods 0.000 description 10
- 230000000694 effects Effects 0.000 description 10
- 230000006399 behavior Effects 0.000 description 6
- 238000013527 convolutional neural network Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 238000013528 artificial neural network Methods 0.000 description 2
- 238000013145 classification model Methods 0.000 description 2
- 238000005034 decoration Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 230000006403 short-term memory Effects 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/018—Certifying business or products
- G06Q30/0185—Product, service or business identity fraud
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Computational Biology (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Accounting & Taxation (AREA)
- Entrepreneurship & Innovation (AREA)
- Development Economics (AREA)
- Economics (AREA)
- Finance (AREA)
- Marketing (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
公开了模型训练和风险识别方法、装置及设备。通过本提取用户的事件序列,以及单事件上的屏幕轨迹信息,并且从屏幕轨迹信息和事件的序号中提取出对于该事件的单用户事件特征,进而生成对应于所述事件序列的事件序列特征,从而通过事件序列特征反映出用户行为的相关特征,实现根据事件序列特征进行模型的训练,得到可用的目标模型,以及采用训练得到的目标模型对于用户的屏幕轨迹进行风险识别。
Description
技术领域
本说明书实施例涉及信息技术领域,尤其涉及模型训练和风险识别方法、装置及设备。
背景技术
在营销活动中,经常有黑产用户控制机器批量注册垃圾小号,然后使用垃圾小号参与业务方发起的营销活动,骗取营销资金;甚至利用垃圾小号进行欺诈、套现等非法活动。例如,黑产使用事先编辑好的代码对注册过程进行控制,批量注册垃圾小号。常规方式或者人工方式难以实现批量的垃圾小号识别。
基于此,需要一种可以高效实现对于批量注册的垃圾小号的识别方案。
发明内容
本申请实施例的目的是提供一种可以高效实现对于批量注册的垃圾小号的识别方案。
为解决上述技术问题,本申请实施例是这样实现的:
一方面,本说明书实施例提供一种模型训练方法,包括:
获取包含多个用户事件的事件序列,其中,所述用户事件为同一用户在同一设备上所产生,每一个用户事件具有对应的顺序标识;
针对事件序列中的任一用户事件,获取该用户事件在所述设备上产生时所关联的屏幕轨迹坐标,从所述屏幕轨迹坐标中提取该用户事件的轨迹特征向量;
组合所述轨迹特征向量和该用户事件的顺序标识,生成对应于该用户事件的单用户事件特征;
依序拼接所得到的多个单用户事件特征,生成对应于所述事件序列的事件序列特征;
以所述事件序列特征作为分类特征进行模型训练,得到用于对所述事件序列进行分类的目标模型。
另一方面,本说明书实施例提供一种基于前述模型的风险识别方法,包括:
获取包含多个用户事件的事件序列,其中,所述用户事件为同一用户在同一设备上所产生,每一个用户事件具有对应的顺序标识;
针对事件序列中的任一用户事件,获取该用户事件在所述设备上产生时所关联的屏幕轨迹坐标,从所述屏幕轨迹坐标中提取该用户事件的轨迹特征向量;
组合所述轨迹特征向量和该用户事件的顺序标识,生成对应于该用户事件的单用户事件特征;
依序拼接所得到的多个单用户事件特征,生成对应于所述事件序列的事件序列特征;
采用所述目标模型对所述事件序列特征进行分类,识别所述所述事件序列的风险。
与一方面对应的,本说明书实施例还提供一种模型训练装置,包括:
获取模块,获取包含多个用户事件的事件序列,其中,所述用户事件为同一用户在同一设备上所产生,每一个用户事件具有对应的顺序标识;
轨迹特征向量生成模块,针对事件序列中的任一用户事件,获取该用户事件在所述设备上产生时所关联的屏幕轨迹坐标,从所述屏幕轨迹坐标中提取该用户事件的轨迹特征向量;
单用户事件特征生成模块,组合所述轨迹特征向量和该用户事件的顺序标识,生成对应于该用户事件的单用户事件特征;
事件序列特征生成模块,依序拼接所得到的多个单用户事件特征,生成对应于所述事件序列的事件序列特征;
模型训练模块,以所述事件序列特征作为分类特征进行模型训练,得到用于对所述事件序列进行分类的目标模型。
与另一方面对应的,本说明书实施例还提供一种前述目标模型的风险识别装置,包括:
获取模块,获取包含多个用户事件的事件序列,其中,所述用户事件为同一用户在同一设备上所产生,每一个用户事件具有对应的顺序标识;
轨迹特征向量生成模块,针对事件序列中的任一用户事件,获取该用户事件在所述设备上产生时所关联的屏幕轨迹坐标,从所述屏幕轨迹坐标中提取该用户事件的轨迹特征向量;
单用户事件特征生成模块,组合所述轨迹特征向量和该用户事件的顺序标识,生成对应于该用户事件的单用户事件特征;
事件序列特征生成模块,依序拼接所得到的多个单用户事件特征,生成对应于所述事件序列的事件序列特征;
风险识别模块,采用所述目标模型对所述事件序列特征进行分类,识别所述所述事件序列的风险。
通过本说明书实施例所提供的方案,提取用户的事件序列,以及单事件上的屏幕轨迹信息,并且从屏幕轨迹信息和事件的序号中提取出对于该事件的单用户事件特征,进而生成对应于所述事件序列的事件序列特征,从而通过事件序列特征反映出用户行为的相关特征,实现根据事件序列特征进行模型的训练,得到可用的目标模型,以及采用训练得到的目标模型对于用户的屏幕轨迹进行风险识别,有效的实现针对批量注册的垃圾小号的识别。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本说明书实施例。
此外,本说明书实施例中的任一实施例并不需要达到上述的全部效果。
附图说明
为了更清楚地说明本说明书实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本说明书实施例中记载的一些实施例,对于本领域普通技术人员来讲,还可以根据这些附图获得其他的附图。
图1是本说明书实施例提供的一种模型训练方法的流程示意图;
图2为本说明书实施例所提供的用户操作轨迹和屏幕轨迹坐标的示意图;
图3是本说明书实施例提供的风险识别方法的流程示意图;
图4是本说明书实施例提供的一种模型训练装置的结构示意图;
图5是本说明书实施例提供的一种风险识别装置的结构示意图;
图6是用于配置本说明书实施例方法的一种设备的结构示意图。
具体实施方式
为了使本领域技术人员更好地理解本说明书实施例中的技术方案,下面将结合本说明书实施例中的附图,对本说明书实施例中的技术方案进行详细地描述,显然,所描述的实施例仅仅是本说明书的一部分实施例,而不是全部的实施例。基于本说明书中的实施例,本领域普通技术人员所获得的所有其他实施例,都应当属于保护的范围。
垃圾小号识别是风控体系中重要的一个环节,黑产能够控制机器批量注册垃圾小号,然后使用垃圾小号参与营销活动,骗取营销资金;甚至利用垃圾小号进行欺诈、套现等非法活动。在垃圾小号注册的过程中,黑产通常都是使用事先编辑好的代码对注册过程进行批量的注册和控制。
现有的垃圾小号识别体系主要依赖传统的分类模型(例如,全梯度下降树模型),或者采用介质图等算法基于设备信息或者注册信息进行风险识别。然而,这种方式很容易被规避,例如,黑产利用一些技术手段伪造设备信息、模拟异地注册,对注册特征进行破坏后,模型性能严重下降。基于此,需要一种可以高效实现对于批量注册的垃圾小号的识别方案。
以下结合附图,详细说明本说明书各实施例提供的技术方案。具体而言,本说明书实施例所提供的方案分为两个方面,包括模型训练部分和模型使用部分。
一方面,模型训练。如图1所示,图1是本说明书实施例提供的一种模型训练方法的流程示意图,该流程具体包括如下步骤:
S101,获取包含多个用户事件的事件序列。
事件序列指的是包含一系列用户事件的序列,各用户事件之间具有明确的先后关系。同一个事件序列中的用户事件为同一用户在同一设备上所产生,对于每个用户事件,可以预先给定一个对应的顺序标识。
例如,对于一个用户(用户可以是正常用户,也可以是黑产注册的垃圾小号)而言,只要其参与了一个营销活动,并且得到了营销奖励,总体上总是可以将其划分若干个阶段:用户注册→用户登录→领取营销任务→完成任务→领取红包→核销红包(即获取奖励)。
对于各用户事件,可以依序给予顺序标识1至6,当然,也可以给定其它形式的顺序标识,例如字母A至F等等,只需顺序标识唯一的对应了该用户事件即可。
对于这个过程中的每一个阶段都可以视为一个用户事件。实际应用中,可以基于一定的触发条件判定用户的当前阶段是进入了哪一种阶段,即属于哪一种用户事件。例如,当用户点击了营销活动中的“领取任务”并成功时,即可以确定该用户当前的操作对应的是用户事件“领取营销任务”。
需要说明的是,前述的顺序标识是与用户事件的对应关系是预先就确定了的,用于描述各用户事件之间的顺序关系,换言之,针对任一用户而言,不论该用户事件实际发生顺序如何,一个用户事件的顺序标识仍是固定的。
S103,针对事件序列中的任一用户事件,获取该用户事件在所述设备上产生时所关联的屏幕轨迹坐标,从所述屏幕轨迹坐标中提取该用户事件的轨迹特征向量。
每当用户进入了一个业务阶段(即产生了一个用户事件),显然,用户就会在这个阶段中进行各种的操作,在当前的环境中,用户的操作一般都是基于各种可以感应用户手势的设备来进行的,例如,压感屏智能手机、平板电脑等等,在这个过程中用户的操作总是会与设备接触产生一定的触碰轨迹,因此就会产生与该用户事件相关的屏幕轨迹坐标,而这个屏幕轨迹坐标就可以被用户设备截取到。
具体而言,获取的方式可以是在确定进入了某个用户事件之后(例如,用户点击申请注册,即可以确定该用户进入了“用户注册”这个业务事件),即可以首先确定该用户事件的起始时间(例如,以进入该用户事件的时刻为起始时间),然后从起始时间开始,获取在指定时长内(例如,10S或者30S)该用户事件在所述设备上产生时所关联的屏幕轨迹坐标,从而得到包含有一系列的坐标数据的集合,如图2所示,图2为本说明书实施例所提供的在各种用户事件中的用户操作轨迹和屏幕轨迹坐标的示意图。
在本说明书实施例中,对于每一个用户事件而言,截取屏幕轨迹坐标的时间长度应当相同,从而对于每个用户事件所对应的屏幕轨迹坐标中包含有相同数量的坐标,从而有利于提取轨迹特征向量时的效率。
进一步地,在一种实施方式中,还可以设定获取屏幕轨迹坐标的时间间隔,例如,从起始时间开始,每隔0.5秒就获取一个屏幕轨迹坐标。
基于前述的坐标数据的集合,即可以对该集合中的坐标进行相应的维度转换或者模型特征提取,从而得到对应于该屏幕轨迹坐标的轨迹特征向量。
例如,根据屏幕轨迹坐标中的坐标序列进行曲线拟合,得到具有多个曲线参数的拟合曲线,从而可以将所述多个曲线参数作为所述屏幕轨迹坐标的轨迹特征向量。
又例如,采用长短期记忆(Long short-term memory,LSTM)神经网络层,以屏幕轨迹坐标中的坐标序列作为输入,并且将LSTM神经网络的输出信息拼接后输入卷积神经网络CNN中,并将CNN网络层的输出展开得到一维轨迹特征向量。
当然在实际应用中,得到的轨迹特征向量也可以是具有其它维度的向量,此处并不做限定。
LSTM在针对于较长的序列进行特征提取是当前常用的技术手段,此处不再赘述,在本说明书实施例中,即针对于屏幕轨迹坐标中的坐标序列进行特征提取,从而得到的一维轨迹特征向量中即包含了屏幕轨迹坐标中的相应的形状特征。
S105,组合所述轨迹特征向量和该用户事件的顺序标识,生成对应于该用户事件的单用户事件特征。
具体而言,对于一个确定的用户事件,其对应的顺序标识可以是一个具体的字符,因此,可以直接确定该顺序字符的对应值,并且将所述对应值和轨迹特征向量进行拼接,从而得到对应于该用户事件的单用户事件特征。
在一种实施方式中,还可以将用户事件序列中的顺序标识输入到模型的嵌入层得到对应事件的顺序特征向量,进而拼接轨迹特征向量和顺序特征向量,从而得到对应于该用户事件的单用户事件特征。
在本说明书实施例中,由于黑产用户经常使用事先编辑好的代码对注册过程进行控制,同一程序控制所产生的垃圾消小号在客户端上搜集到的事件(用户注册、登陆事件、等等的序列,以及每一个事件上的手势轨迹(屏幕上触摸轨迹)都保持着高度一致性。
例如,对于不同的垃圾小号,每个垃圾小号在用户注册时所在屏幕上所产生的的触摸轨迹是基本相同的轨迹一号,各小号的轨迹一号具有某种相同的共同特征;每个垃圾小号在核销红包时在屏幕上所产生的的触摸轨迹是基本相同的轨迹二号,各小号的轨迹二号具有另一种共同特征。
而对于正常的用户而言,在每个用户事件中的屏幕轨迹坐标则是千变万化,基本没有统一的特征。这样,正常用户和垃圾小号在每个单用户事件特征上已经有了一定的区分度。
通过前述的拼接,从而将用户事件和顺序标识对应的合并了起来,得到了与用户事件对应的包含有轨迹特征和顺序特征的单用户事件特征。
S107,依序拼接所得到的多个单用户事件特征,生成对应于所述事件序列的事件序列特征。
容易理解,对于一个正常用户而言,这个过程往往并不是严格依赖于某个特定顺序的,例如,用户很可能早就完成了注册,并且在登录之后,领取营销任务之后并不是立即完成任务,而是下线之后又进行了一次登录再去完成任务。
而对于垃圾小号则不然,而对于一个批量注册所产生的小号而言,由于在批量注册垃圾小号的过程中,黑产往往是使用事先编辑好的代码对注册过程进行控制,同一程序控制注册的垃圾帐户在客户端搜集到的用户事件(创建登陆事件、登陆事件、发起交易事件)的序列上往往都保持着高度的一致性。
例如,同一程序控制所产生的若干小号在整个事件序列中触发用户事件的顺序是一样,都是经过“用户注册→用户登录→领取营销任务→完成任务→领取红包→核销红包”,通过顺序标识反应出来,即可以认为在整体的事件序列中包含有“1-2-3-4-5-6”这样的特征。
同时,在每个用户事件上还往往具有相同的轨迹特征,因此,通过将各单用户事件特征进行依序拼接所得到的事件序列特征,可以完整的反应出在参与业务活动时一个用户在整个活动中的行为特征,其中包括用户事件的参与顺序,以及,在各用户事件中的触摸屏幕时的轨迹特征。
S109,以所述事件序列特征作为分类特征进行模型训练,得到用于对所述事件序列进行分类的目标模型。
具体而言,在训练模型时,可以采用有监督训练得到分类模型,也可以采用无监督训练得到聚类模型。
在有监督训练的过程中,可以事先采样一些已经被确定为垃圾小号的用户,进而获取这些垃圾小号的事件序列,以及各用户事件所对应的屏幕轨迹坐标,作为负样本,同时采样一些正常用户的事件序列和屏幕轨迹坐标作为正样本,进行有监督训练,从而得到对于正负样本具有较好分类效果(例如,准确率达到一定阈值)的目标模型。
在负样本数量不足时,也可以采用无监督模型的训练过程,在这个过程中,由于前述的事件序列特征是充分反映了垃圾小号的行为特征,因此聚类的结果将会是对于同一程序注册所产生的垃圾小号将会被聚类到一起,而一般用户的行为特征则很难被聚集到一起,从而可以得到对于垃圾小号具有较好聚类效果的目标模型。
另一方面,模型的使用。在得到了可用的目标模型之后,即可以将该模型部署在风控系统中,对用户数据进行风险识别,如图3所示,图3是本说明书实施例提供的基于前述目标模型的风险识别方法的流程示意图,该流程具体包括如下步骤:
S301,获取包含多个用户事件的事件序列,其中,所述用户事件为同一用户在同一设备上所产生,每一个用户事件具有对应的顺序标识。
S303,针对事件序列中的任一用户事件,获取该用户事件在所述设备上产生时所关联的屏幕轨迹坐标,从所述屏幕轨迹坐标中提取该用户事件的轨迹特征向量。
S305,组合所述轨迹特征向量和该用户事件的顺序标识,生成对应于该用户事件的单用户事件特征。
S307,依序拼接所得到的多个单用户事件特征,生成对应于所述事件序列的事件序列特征。
S309,采用所述目标模型对所述事件序列特征进行分类,识别所述所述事件序列的风险。具体的获取事件序列特征的方式在前文已经进行了说明,此处不再赘述。
通过本说明书实施例所提供的方案,提取用户的事件序列,以及单事件上的屏幕轨迹信息,并且从屏幕轨迹信息和事件的序号中提取出对于该事件的单用户事件特征,进而生成对应于所述事件序列的事件序列特征,从而通过事件序列特征反映出用户行为的相关特征,实现根据事件序列特征进行模型的训练,得到可用的目标模型,以及采用训练得到的目标模型对于用户的屏幕轨迹进行风险识别,有效的实现针对批量注册的垃圾小号的识别。
与一方面对应的,本说明书实施例还提供一种模型训练装置,如图4所示,图4是本说明书实施例提供的一种模型训练装置的结构示意图,包括:
获取模块401,获取包含多个用户事件的事件序列,其中,所述用户事件为同一用户在同一设备上所产生,每一个用户事件具有对应的顺序标识;
轨迹特征向量生成模块403,针对事件序列中的任一用户事件,获取该用户事件在所述设备上产生时所关联的屏幕轨迹坐标,从所述屏幕轨迹坐标中提取该用户事件的轨迹特征向量;
单用户事件特征生成模块405,组合所述轨迹特征向量和该用户事件的顺序标识,生成对应于该用户事件的单用户事件特征;
事件序列特征生成模块407,依序拼接所得到的多个单用户事件特征,生成对应于所述事件序列的事件序列特征;
模型训练模块409,以所述事件序列特征作为分类特征进行模型训练,得到用于对所述事件序列进行分类的目标模型。
进一步地,所述轨迹特征向量生成模块403,确定用户事件的起始时间,从所述起始时间开始,获取在指定时长内该用户事件在所述设备上产生时所关联的屏幕轨迹坐标,其中,所述指定时长对于每个用户事件均相同;采用预设的特征提取模型,根据所述屏幕轨迹坐标生成对应该用户事件的一维轨迹特征向量。
进一步地,所述单用户事件特征生成模块407,拼接所述轨迹特征向量和顺序标识,生成对应于该用户事件的单用户事件特征;或者,根据所述顺序标识生成对应的顺序特征向量,拼接所述轨迹特征向量和顺序特征向量,生成对应于该用户事件的单用户事件特征。
进一步地,所述模型训练模块409,确定所述事件序列特征所对应的事件序列的标签,根据所述分类特征和标签进行有监督训练,生成用于对所述事件序列进行分类的目标模型;或者,根据所述事件序列特征进行无监督训练,生成用于对所述事件序列进行分类的目标模型。
与另一方面对应的,本说明书实施例还提供一种基于前述目标模型的风险识别装置,如图5所示,图5是本说明书实施例提供的一种风险识别装置的结构示意图,包括:
获取模块501,获取包含多个用户事件的事件序列,其中,所述用户事件为同一用户在同一设备上所产生,每一个用户事件具有对应的顺序标识;
轨迹特征向量生成模块503,针对事件序列中的任一用户事件,获取该用户事件在所述设备上产生时所关联的屏幕轨迹坐标,从所述屏幕轨迹坐标中提取该用户事件的轨迹特征向量;
单用户事件特征生成模块503,组合所述轨迹特征向量和该用户事件的顺序标识,生成对应于该用户事件的单用户事件特征;
事件序列特征生成模块507,依序拼接所得到的多个单用户事件特征,生成对应于所述事件序列的事件序列特征;
风险识别模块509,采用所述目标模型对所述事件序列特征进行分类,识别所述所述事件序列的风险。
本说明书实施例还提供一种计算机设备,其至少包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其中,处理器执行所述程序时实现图1所示的模型训练方法。
本说明书实施例还提供一种计算机设备,其至少包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其中,处理器执行所述程序时实现图3所示的风险识别方法。
图6示出了本说明书实施例所提供的一种更为具体的计算设备硬件结构示意图,该设备可以包括:处理器1010、存储器1020、输入/输出接口1030、通信接口1040和总线1050。其中处理器1010、存储器1020、输入/输出接口1030和通信接口1040通过总线1050实现彼此之间在设备内部的通信连接。
处理器1010可以采用通用的CPU(Central Processing Unit,中央处理器)、微处理器、应用专用集成电路(Application Specific Integrated Circuit,ASIC)、或者一个或多个集成电路等方式实现,用于执行相关程序,以实现本说明书实施例所提供的技术方案。
存储器1020可以采用ROM(Read Only Memory,只读存储器)、RAM(Random AccessMemory,随机存取存储器)、静态存储设备,动态存储设备等形式实现。存储器1020可以存储操作系统和其他应用程序,在通过软件或者固件来实现本说明书实施例所提供的技术方案时,相关的程序代码保存在存储器1020中,并由处理器1010来调用执行。
输入/输出接口1030用于连接输入/输出模块,以实现信息输入及输出。输入输出/模块可以作为组件配置在设备中(图中未示出),也可以外接于设备以提供相应功能。其中输入设备可以包括键盘、鼠标、触摸屏、麦克风、各类传感器等,输出设备可以包括显示器、扬声器、振动器、指示灯等。
通信接口1040用于连接通信模块(图中未示出),以实现本设备与其他设备的通信交互。其中通信模块可以通过有线方式(例如USB、网线等)实现通信,也可以通过无线方式(例如移动网络、WIFI、蓝牙等)实现通信。
总线1050包括一通路,在设备的各个组件(例如处理器1010、存储器1020、输入/输出接口1030和通信接口1040)之间传输信息。
需要说明的是,尽管上述设备仅示出了处理器1010、存储器1020、输入/输出接口1030、通信接口1040以及总线1050,但是在具体实施过程中,该设备还可以包括实现正常运行所必需的其他组件。此外,本领域的技术人员可以理解的是,上述设备中也可以仅包含实现本说明书实施例方案所必需的组件,而不必包含图中所示的全部组件。
本说明书实施例还提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现图1所示的模型训练方法。
本说明书实施例还提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现图3所示的风险识别方法。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
通过以上的实施方式的描述可知,本领域的技术人员可以清楚地了解到本说明书实施例可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本说明书实施例的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本说明书实施例各个实施例或者实施例的某些部分所述的方法。
上述实施例阐明的系统、方法、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为计算机,计算机的具体形式可以是个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件收发设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任意几种设备的组合。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于方法实施例而言,由于其基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。以上所描述的方法实施例仅仅是示意性的,其中所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,在实施本说明书实施例方案时可以把各模块的功能在同一个或多个软件和/或硬件中实现。也可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
以上所述仅是本说明书实施例的具体实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本说明书实施例原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本说明书实施例的保护范围。
Claims (12)
1.一种模型训练方法,包括:
获取包含多个用户事件的事件序列,其中,所述用户事件为同一用户在同一设备上所产生,每一个用户事件具有对应的顺序标识;
针对事件序列中的任一用户事件,获取该用户事件在所述设备上产生时所关联的屏幕轨迹坐标,从所述屏幕轨迹坐标中提取该用户事件的轨迹特征向量;
组合所述轨迹特征向量和该用户事件的顺序标识,生成对应于该用户事件的单用户事件特征;
依序拼接所得到的多个单用户事件特征,生成对应于所述事件序列的事件序列特征;
以所述事件序列特征作为分类特征进行模型训练,得到用于对所述事件序列进行分类的目标模型。
2.如权利要求1所述的方法,获取该用户事件在所述设备上产生时所关联的屏幕轨迹坐标,包括:
确定用户事件的起始时间,从所述起始时间开始,获取在指定时长内该用户事件在所述设备上产生时所关联的屏幕轨迹坐标,其中,所述指定时长对于每个用户事件均相同;
相应的,从所述屏幕轨迹坐标中提取该用户事件的轨迹特征向量,包括:
采用预设的特征提取模型,根据所述屏幕轨迹坐标生成对应该用户事件的一维轨迹特征向量。
3.如权利要求1所述的方法,组合所述轨迹特征向量和该用户事件的顺序标识,生成对应于该用户事件的单用户事件特征,包括:
拼接所述轨迹特征向量和顺序标识,生成对应于该用户事件的单用户事件特征;或者,
根据所述顺序标识生成对应的顺序特征向量,拼接所述轨迹特征向量和顺序特征向量,生成对应于该用户事件的单用户事件特征。
4.如权利要求1所述的方法,以所述事件序列特征作为分类特征进行模型训练,得到用于对所述事件序列进行分类的目标模型,包括:
确定所述事件序列特征所对应的事件序列的标签,根据所述分类特征和标签进行有监督训练,生成用于对所述事件序列进行分类的目标模型;或者,
根据所述事件序列特征进行无监督训练,生成用于对所述事件序列进行分类的目标模型。
5.一种基于权利要求1至4任一所述目标模型的风险识别方法,包括:
获取包含多个用户事件的事件序列,其中,所述用户事件为同一用户在同一设备上所产生,每一个用户事件具有对应的顺序标识;
针对事件序列中的任一用户事件,获取该用户事件在所述设备上产生时所关联的屏幕轨迹坐标,从所述屏幕轨迹坐标中提取该用户事件的轨迹特征向量;
组合所述轨迹特征向量和该用户事件的顺序标识,生成对应于该用户事件的单用户事件特征;
依序拼接所得到的多个单用户事件特征,生成对应于所述事件序列的事件序列特征;
采用所述目标模型对所述事件序列特征进行分类,识别所述事件序列的风险。
6.一种模型训练装置,包括:
获取模块,获取包含多个用户事件的事件序列,其中,所述用户事件为同一用户在同一设备上所产生,每一个用户事件具有对应的顺序标识;
轨迹特征向量生成模块,针对事件序列中的任一用户事件,获取该用户事件在所述设备上产生时所关联的屏幕轨迹坐标,从所述屏幕轨迹坐标中提取该用户事件的轨迹特征向量;
单用户事件特征生成模块,组合所述轨迹特征向量和该用户事件的顺序标识,生成对应于该用户事件的单用户事件特征;
事件序列特征生成模块,依序拼接所得到的多个单用户事件特征,生成对应于所述事件序列的事件序列特征;
模型训练模块,以所述事件序列特征作为分类特征进行模型训练,得到用于对所述事件序列进行分类的目标模型。
7.如权利要求6所述的装置,所述轨迹特征向量生成模块,确定用户事件的起始时间,从所述起始时间开始,获取在指定时长内该用户事件在所述设备上产生时所关联的屏幕轨迹坐标,其中,所述指定时长对于每个用户事件均相同;采用预设的特征提取模型,根据所述屏幕轨迹坐标生成对应该用户事件的一维轨迹特征向量。
8.如权利要求6所述的装置,所述单用户事件特征生成模块,拼接所述轨迹特征向量和顺序标识,生成对应于该用户事件的单用户事件特征;或者,根据所述顺序标识生成对应的顺序特征向量,拼接所述轨迹特征向量和顺序特征向量,生成对应于该用户事件的单用户事件特征。
9.如权利要求6所述的装置,所述模型训练模块,确定所述事件序列特征所对应的事件序列的标签,根据所述分类特征和标签进行有监督训练,生成用于对所述事件序列进行分类的目标模型;或者,根据所述事件序列特征进行无监督训练,生成用于对所述事件序列进行分类的目标模型。
10.一种基于权利要求6至9任一所述目标模型的风险识别装置,包括:
获取模块,获取包含多个用户事件的事件序列,其中,所述用户事件为同一用户在同一设备上所产生,每一个用户事件具有对应的顺序标识;
轨迹特征向量生成模块,针对事件序列中的任一用户事件,获取该用户事件在所述设备上产生时所关联的屏幕轨迹坐标,从所述屏幕轨迹坐标中提取该用户事件的轨迹特征向量;
单用户事件特征生成模块,组合所述轨迹特征向量和该用户事件的顺序标识,生成对应于该用户事件的单用户事件特征;
事件序列特征生成模块,依序拼接所得到的多个单用户事件特征,生成对应于所述事件序列的事件序列特征;
风险识别模块,采用所述目标模型对所述事件序列特征进行分类,识别所述事件序列的风险。
11.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其中,所述处理器执行所述程序时实现如权利要求1至4任一项所述的方法。
12.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其中,所述处理器执行所述程序时实现如权利要求5所述的方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911108448.4A CN111047332B (zh) | 2019-11-13 | 2019-11-13 | 模型训练和风险识别方法、装置及设备 |
PCT/CN2020/103976 WO2021093367A1 (zh) | 2019-11-13 | 2020-07-24 | 模型训练和风险识别方法、装置及设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911108448.4A CN111047332B (zh) | 2019-11-13 | 2019-11-13 | 模型训练和风险识别方法、装置及设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111047332A CN111047332A (zh) | 2020-04-21 |
CN111047332B true CN111047332B (zh) | 2021-05-07 |
Family
ID=70232844
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911108448.4A Active CN111047332B (zh) | 2019-11-13 | 2019-11-13 | 模型训练和风险识别方法、装置及设备 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN111047332B (zh) |
WO (1) | WO2021093367A1 (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111047332B (zh) * | 2019-11-13 | 2021-05-07 | 支付宝(杭州)信息技术有限公司 | 模型训练和风险识别方法、装置及设备 |
CN113591547A (zh) * | 2021-06-15 | 2021-11-02 | 阿里云计算有限公司 | 图像处理方法、装置、电子设备及计算机可读存储介质 |
CN115935265B (zh) * | 2023-03-03 | 2023-05-26 | 支付宝(杭州)信息技术有限公司 | 训练风险识别模型的方法、风险识别方法及对应装置 |
CN118036997A (zh) * | 2024-03-15 | 2024-05-14 | 中关村科学城城市大脑股份有限公司 | 调度信息生成方法、装置、电子设备和可读介质 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109345260A (zh) * | 2018-10-09 | 2019-02-15 | 北京芯盾时代科技有限公司 | 一种欺诈检测模型训练方法和装置及欺诈检测方法和装置 |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103530540B (zh) * | 2013-09-27 | 2017-02-22 | 西安交通大学 | 基于人机交互行为特征的用户身份属性检测方法 |
CN105991609B (zh) * | 2015-03-02 | 2019-08-23 | 阿里巴巴集团控股有限公司 | 一种风险事件确定方法及装置 |
CN106155298B (zh) * | 2015-04-21 | 2019-11-08 | 阿里巴巴集团控股有限公司 | 人机识别方法及装置、行为特征数据的采集方法及装置 |
CN111629010B (zh) * | 2015-11-23 | 2023-03-10 | 创新先进技术有限公司 | 一种恶意用户识别方法及装置 |
US10586235B2 (en) * | 2016-06-22 | 2020-03-10 | Paypal, Inc. | Database optimization concepts in fast response environments |
CN108052543B (zh) * | 2017-11-23 | 2021-02-26 | 北京工业大学 | 一种基于图分析聚类的微博相似账号检测方法 |
CN109376050A (zh) * | 2018-09-03 | 2019-02-22 | 平安普惠企业管理有限公司 | 一种app监测方法、计算机可读存储介质及终端设备 |
CN109670665A (zh) * | 2018-09-26 | 2019-04-23 | 平安普惠企业管理有限公司 | 识别终端批量注册账号行为的方法、评估设备及存储介质 |
CN109213419B (zh) * | 2018-10-19 | 2020-10-16 | 北京小米移动软件有限公司 | 触摸操作处理方法、装置及存储介质 |
CN110210227B (zh) * | 2019-06-11 | 2021-05-14 | 百度在线网络技术(北京)有限公司 | 风险检测方法、装置、设备和存储介质 |
CN111047332B (zh) * | 2019-11-13 | 2021-05-07 | 支付宝(杭州)信息技术有限公司 | 模型训练和风险识别方法、装置及设备 |
-
2019
- 2019-11-13 CN CN201911108448.4A patent/CN111047332B/zh active Active
-
2020
- 2020-07-24 WO PCT/CN2020/103976 patent/WO2021093367A1/zh active Application Filing
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109345260A (zh) * | 2018-10-09 | 2019-02-15 | 北京芯盾时代科技有限公司 | 一种欺诈检测模型训练方法和装置及欺诈检测方法和装置 |
Also Published As
Publication number | Publication date |
---|---|
CN111047332A (zh) | 2020-04-21 |
WO2021093367A1 (zh) | 2021-05-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111047332B (zh) | 模型训练和风险识别方法、装置及设备 | |
CN110147823B (zh) | 一种风控模型训练方法、装置及设备 | |
CN107463331B (zh) | 手势轨迹模拟方法、装置及电子设备 | |
JP7394809B2 (ja) | ビデオを処理するための方法、装置、電子機器、媒体及びコンピュータプログラム | |
CN109194689B (zh) | 异常行为识别方法、装置、服务器及存储介质 | |
CN113903363B (zh) | 基于人工智能的违规行为检测方法、装置、设备及介质 | |
CN111126623B (zh) | 一种模型更新方法、装置及设备 | |
CN111240482A (zh) | 一种特效展示方法及装置 | |
CN109102324B (zh) | 模型训练方法、基于模型的红包物料铺设预测方法及装置 | |
CN110688319A (zh) | 应用保活能力测试方法及相关装置 | |
CN110059212A (zh) | 图像检索方法、装置、设备及计算机可读存储介质 | |
CN109829431B (zh) | 用于生成信息的方法和装置 | |
CN111062490A (zh) | 一种包含隐私数据的网络数据的处理方法及装置 | |
CN113033373B (zh) | 用于训练人脸识别模型及识别人脸的方法及相关装置 | |
CN109583910A (zh) | 一种商品授权鉴定方法、装置及设备 | |
CN110929285B (zh) | 一种隐私数据的处理方法及装置 | |
CN112966756A (zh) | 一种可视化的准入规则的生成方法、装置、机器可读介质及设备 | |
CN113780318B (zh) | 用于生成提示信息的方法、装置、服务器和介质 | |
CN114462502A (zh) | 一种核身推荐模型训练方法及装置 | |
CN110262856B (zh) | 一种应用程序数据采集方法、装置、终端及存储介质 | |
CN109726550A (zh) | 异常操作行为检测方法、装置及计算机可读存储介质 | |
CN110738396A (zh) | 一种针对设备的特征提取方法、装置及设备 | |
CN113920226A (zh) | 用户交互方法、装置、存储介质及电子设备 | |
CN109542531B (zh) | 一种文件布局调整方法及装置 | |
CN113378774A (zh) | 手势识别方法、装置、设备、存储介质以及程序产品 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |