WO2019091177A1

WO2019091177A1 - 风险识别模型构建和风险识别方法、装置及设备

Info

Publication number: WO2019091177A1
Application number: PCT/CN2018/100989
Authority: WO
Inventors: 程羽; 陆青; 傅欣艺; 陈弢
Original assignee: 阿里巴巴集团控股有限公司; 程羽; 陆青; 傅欣艺; 陈弢
Priority date: 2017-11-10
Filing date: 2018-08-17
Publication date: 2019-05-16
Also published as: US10977739B2; TW201923685A; SG11202000861PA; TWI688917B; EP3648023A4; CN107886243A; US20200202449A1; EP3648023A1

Abstract

公开了一种风险识别模型构建和风险识别方法、装置及设备。所述风险识别方法包括：获取目标用户在给定时长内的用户状态记录，所述用户状态记录包括：用户的操作行为和/或系统事件；按照发生时间对所述用户状态记录进行排序，根据排序结果生成用户状态序列；将所生成的用户状态序列转换为序列特征；将所述序列特征作为预先构建的风险识别模型的输入，输出风险识别结果。

Description

风险识别模型构建和风险识别方法、装置及设备

技术领域

本说明书涉及数据挖掘技术领域，尤其涉及一种风险识别模型构建和风险识别方法、装置及设备。

背景技术

在大数据时代，数据挖掘和机器学习技术逐渐被应用于各种领域以解决实际问题。例如根据大量的真实用户数据或事件数据建立模型，从而实现对新用户或新事件的各种未知情况的预测。

以金融行业的风控场景为例，通过对已定性风险事件的参与用户进行分析，可以挖掘各种用户特征与风险事件的潜在关系，形成用户特征与风险的关系模型，即预测“什么样的用户或用户行为更容易导致风险事件”，从而提前采取各种措施，以避免或减少风险事件的发生。

发明内容

针对上述技术问题，本说明书实施例提供一种风险识别模型构建和风险识别方法、装置及设备，技术方案如下：

根据本说明书实施例的第一方面，提供一种风险识别模型构建方法，包括：

从给定用户的数据中，提取特定事件发生前预设时长内的用户状态记录，所述用户状态记录包括：用户的操作行为和/或系统事件，所述特定事件为已确定风险类型的事件；

按照发生时间对所提取到的用户状态记录进行排序，根据排序结果生成针对所述特定事件的用户状态序列；

将所生成的用户状态序列转换为序列特征；

以所得到的序列特征作为特征值、所述事件风险类型作为标签值，构成风险识别样本数据，并利用至少一条样本数据构建风险识别模型。

根据本说明书实施例的第二方面，提供一种风险识别方法，包括：

从目标用户的数据中，提取该目标用户在给定时长内的用户状态记录，所述用户状态记录包括：用户的操作行为和/或系统事件；

按照发生时间对所述用户状态记录进行排序，根据排序结果生成用户状态序列；

将所生成的用户状态序列转换为序列特征；

将所述序列特征作为预先构建的风险识别模型的输入，输出风险识别结果。

根据本说明书实施例的第三方面，提供一种风险识别模型构建装置，包括：

提取单元，从给定用户的数据中，提取特定事件发生前预设时长内的用户状态记录，所述用户状态记录包括：用户的操作行为和/或系统事件，所述特定事件为已确定风险类型的事件；

序列生成单元，按照发生时间对所提取到的用户状态记录进行排序，根据排序结果生成针对所述特定事件的用户状态序列；

特征转换单元，将所生成的用户状态序列转换为序列特征；

模型构建单元，以所得到的序列特征作为特征值、所述事件风险类型作为标签值，构成风险识别样本数据，并利用至少一条样本数据构建风险识别模型。

根据本说明书实施例的第四方面，提供一种风险识别装置，包括：

获取单元，从目标用户的数据中，提取该目标用户在给定时长内的用户状态记录，所述用户状态记录包括：用户的操作行为和/或系统事件；

序列生成单元，按照发生时间对所述用户状态记录进行排序，根据排序结果生成用户状态序列；

特征转换单元，将所生成的用户状态序列转换为序列特征；

输出单元，将所述序列特征作为预先构建的风险识别模型的输入，输出风险识别结果。

根据本说明书实施例的第五方面，提供一种计算机设备，包括：

处理器；

用于存储处理器可执行指令的存储器；

所述处理器被配置为：

将所生成的用户状态序列转换为序列特征；

根据本说明书实施例的第六方面，提供一种计算机设备，包括：

处理器；

用于存储处理器可执行指令的存储器；

所述处理器被配置为：

将所生成的用户状态序列转换为序列特征；

本说明书实施例所提供的技术方案所产生的效果包括：

通过挖掘用户状态序列和风险事件之间的潜在关系，来构建风险识别模型，在风险识别阶段，则可基于所述风险识别模型和提取到的待识别用户的用户状态序列，来预测待识别用户所作的特定事件或该用户本身的风险，提高了风控体系对于风险的识别能力。

应当理解的是，以上的一般描述和后文的细节描述仅是示例性和解释性的，并不能限制本说明书实施例。

此外，本说明书实施例中的任一实施例并不需要达到上述的全部效果。

附图说明

为了更清楚地说明本说明书实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本说明书实施例中记载的一些实施例，对于本领域普通技术人员来讲，还可以根据这些附图获得其他的附图。

图1是本说明书实施例的风险模型构建方法的流程示意图；

图2是本说明书实施例的风险识别方法的流程示意图；

图3是本说明书实施例的风险模型构建装置的结构示意图；

图4是本说明书实施例的风险识别装置的结构示意图；

图5是用于配置本说明书实施例装置的一种设备的结构示意图。

具体实施方式

为了使本领域技术人员更好地理解本说明书实施例中的技术方案，下面将结合本说明书实施例中的附图，对本说明书实施例中的技术方案进行详细地描述，显然，所描述的实施例仅仅是本说明书的一部分实施例，而不是全部的实施例。基于本说明书中的实施例，本领域普通技术人员所获得的所有其他实施例，都应当属于保护的范围。

为了实现风险识别，可以利用大量的已定性事件作为样本，训练得到“用户特征-风险分值”的对应关系。常用的用户特征一般可以分为静态特征和行为特征两类，在金融领域，与风险相关的静态特征可以包括用户的资产信息、认证信息、社交关系信息等等，而行为特征则可以包括用户在平台上的各种行为，例如点击、浏览、转账、存取操作等等。

相对于静态特征而言，行为特征往往更适合进行风险预测。例如，一名普通用户和一名欺诈者，通过静态特征可能并不容易进行有效区别。但是，由于在欺诈行为之前，欺诈者往往会进行一些准备活动，因此在欺诈行为发生前经常会做哪些操作、操作的次数、频率等等，都能够在一定程度上刻画和表达出欺诈者的动机。

更进一步讲，用户的行为特征除了包含行为事件本身(即用户做过哪些事)之外，还可以包含与这些事件相关联的时间信息，例如，两名用户在过去1小时内的行为序列分别为：

用户1：A→B→C→D

用户2：B→C→A→D

可以看出，虽然两个序列中都包含了同样的行为事件，但因发生顺序不同而形成两种不同的行为模式，实际应用中，两种不同的行为模式所导致的后续结果也可能是完全不同的。因此，随着当今盗用和反盗用之间攻防的不断升级，对盗用行为特征的刻画能力提出了新要求，在风险预测时，可以将用户行为的时间特征纳入风险预测模型的训练，以进一步提升风控效果。

出于以上考虑，本说明书实施例提供一种风险识别方案，该方案包括两个阶段：风险识别模型的构建阶段和运用风险识别模型进行风险识别的阶段。首先介绍风险识别模型的构建阶段，参见图1所示，一种风险识别模型构建方法可以包括以下步骤101～104，其中：

步骤101，从给定用户的数据中，提取特定事件发生前预设时长内的用户状态记录。

模型的构建是基于样本数据所进行的机器学习过程，所以样本数据的收集是第一步。“给定用户”便是样本用户，通常样本数越大，构建出的模型效果越好。一般地，样本用户的选择可以基于用户所做出的特定事件来进行的。其中，特定事件可以是已确定风险类型的事件，例如，对于已经发生的一笔转账，若后续确定该笔转账是盗用者所为，可将该转账事件的类型被确定为“高风险”，若后续确定该笔转账是用户本人所为，则可将该转账事件的类型被确定为“低风险”。

在业务运营的过程中，可以将每一用户的历史数据沉淀下来(存储到数据库中)，也可以依赖于对线上数据的采集，这些数据可以包括静态数据和动态数据。在筛选出大量样本之后，针对每一样本，都可以从样本对应的数据中，提取在特定事件发生之前预设时长(如：1个小时)内的用户状态记录。其中，所述用户状态记录包括：用户的操作行为(如：点击、浏览、转账、存取操作等)和/或系统事件，所述系统事件可以包括：用户行为导致的事件、非用户行为导致的事件。也就是说，用户状态记录反映了用户在一段时长内做了哪些行为和/或发生了哪些系统事件，并且还记录了每一用户行为和/或系统事件的发生时刻。

步骤102，按照发生时间对所提取到的用户状态记录进行排序，根据排序结果生成针对所述特定事件的用户状态序列。

例如，对于用户1，所提取到的用户状态记录包含：A，B，C，D四个状态(即行为或系统事件)，由于记录了每个状态所发生的时间，故按照时间先后的顺序进行排序的结果例如为：

B→A→C→D

实际上，将排序结果直接作为最终的用户状态序列可能并不够合理。例如，对于用户1和用户2，可能排序后的结果完全一样，但是两个用户在任意两个相邻状态间的间隔时长是不一样的，在实际应用中，状态之间的间隔时长的不同所反映出来的用户动机也可能是完全不同的，例如，一名盗用者的显著特点便是B和A这两个状态之间的间隔时长较短，而普通用户则相反。

考虑到上述情况，在一实施例中，生成用户状态序列的过程可具体为：

在所述排序结果中，根据第i(i≥1)次用户状态与第i+1次用户状态的间隔时长，将第i次用户状态转化为携带所述间隔时长信息的用户状态。

沿用以上例子，假设i＝1，则第1次用户状态为B，第2次用户状态为A。如果B和A这两个用户状态之间的间隔时长为t1，则转化后的结果例如为：

B(t1)→A→C→D

以此类推，还可以按照同样方法对序列中的A和C进行转化。

又例如，可将时间间隔划分为“长”、“短”两类(可以按照一个设定时长阈值来划分)，则转化后所得的结果例如为：

B(长)→A(短)→C(长)→D

在另一个方面，为了使得最终生成的用户状态序列能够更好地表达用户的动机，生成用户状态序列的过程可具体为：

在所述排序结果中，根据预先对第i次用户状态的评估结果，将第i次用户状态转化为携带所述评估结果信息的用户状态。

对于任意一种用户状态，都可以对其进行评估，所得到的评估结果用来反映该用户状态的好坏，例如，评估结果为一个介于0到1之间的分值，分值越高，表明其导致欺诈事件的可能性越小。实际上，可以通过收集大量包含某特定用户状态的用户状态记录来进行评估，例如，收集了100条包含用户状态A的记录，这100条记录中，实际有10条记录最终导致了欺诈事件，故对该用户状态A的评估结果可为0.9。

继续沿用上述例子，最终转化后所得的用户状态序列可以例如为：

B(0.3)→A(0.9)→C(0.6)→D(0.99)

又例如，可将对用户状态的评估结果划分为“高风险”、“低风险”两类，则转化后所得的结果例如为：

B(低风险)→A(高风险)→C(低风险)→D(高风险)

在实际运用过程中发现，个别用户状态(例如：用户点击推送广告等)由于对风险识别本身来说没有实际意义，故并不需要在用户状态序列中有所体现。为此，生成用户状态序列的过程可具体为：

根据预设的过滤规则，对所述排序结果中的用户状态进行过滤。其中，过滤规则至少定义了哪些用户状态应该被过滤掉。

继续沿用以上例子，对于排序结果：B→A→C→D，若按照过滤规则确定出C属于应该过滤掉的状态，则最终获得的用户状态序列为：B→A→D。

当然，可行的序列转换方式并不限于以上所列举的例子，本文不作一一列举。

步骤103，将所生成的用户状态序列转换为序列特征。

该步骤103的目的是将用户状态序列采用数学化的特征表达，形成可用来识别的序列特征。

在一实施例中，步骤103具体包括：将所生成的用户状态序列编码为序列向量。更进一步地，所述将所生成的用户状态序列编码为序列向量可以包括：

步骤131：根据第一编码规则(如：word2vector)，将所述用户状态序列中的每一个状态分别编码为状态向量。例如，对于B→A→C→D，将B编码为：000101。

步骤132：利用神经网络将状态向量所构成的序列编码为序列向量。其中，所述神经网络包括但不限于：循环神经网络(Recurrent neural Network,RNN)、卷积神经网络(Convolutional Neural Network，CNN)。实际上，通过将多个状态向量输入到神经网络，以将神经网络最终输出的向量作为序列向量。

在另一实施例中，所述方法还可包括步骤10和步骤20，其中：

步骤10，从多条用户状态序列中挖掘频繁序列项集。

频繁序列项集是由若干频繁序列项所组成的集合，而频繁序列项是指出现次数较为频繁的序。在一个方面，可以通过收集若干条用户状态序列，并统计每一种用户状态序列的出现次数，最终按照出现次数从高到底进行排序，从而取一定数量的排位靠前的用户状态序列作为频繁序列项。在另一个方面，也可以从多条用户状态序列中挖掘出共同出现过的序列，作为频繁序列项。例如：

用户状态序列1：A→B→D→F→C→E

用户状态序列2：A→B→F→C

用户状态序列3：A→B→D→C→E

则通过上述3个用户状态序列，最终挖掘出的频繁序列项为：

A→B→C

步骤20，对于所述频繁序列项集中的每一频繁序列项，根据所述频繁序列项对应的黑白样本分布情况，确定所述频繁序列项对应的特征值。

例如，对于“A→B→C”这一频繁序列项，选取了100个包含该序列的样本(当某个样本在给定时长内出现了某序列，则确定该样本包含该序列)，其中，可以根据每一个样本最终是否导致风险事件(如盗用)，将每一样本定性为白样本(即未发生风险事件)或黑样本(即发生了风险事件)。比如：这100个样本中包括90个黑样本和10个白样本，则可以确定该频繁序列项“A→B→C”所对应的风险概率(即导致风险事件的概率)＝0.9。

本文中，可以根据频繁序列项对应的风险概率，确定该频繁序列项所对应的特征值。例如，将频繁序列项“A→B→C”对应的风险概率确定为其特征值。或者，对于任意的频繁序列项，可以通过softmax函数来得到特征值。其中，softmax函数的本质是将一个K维的任意实数向量压缩(映射)成另一个K维的实数向量，其中向量中的每个元素取值可以介于(0，1)之间，softmax函数用来解决多分类问题。

相应地，所述步骤103可以包括如下步骤133和步骤134，其中：

在步骤133中，基于所述频繁序列项集，确定生成的用户状态序列中包含的频繁序列项。

在步骤134中，根据所述用户状态序列中包含的频繁序列项和预先确定的各频繁序列项对应的特征值，确定与所述用户状态序列对应的序列特征。

举例来说，假设生成的一个用户状态序列为：

A→B→D→F→C→E

基于预先挖掘得到的所述频繁序列项集，确定该用户状态序列中包含的频繁序列项(即该用户状态序列命中了哪些预先挖掘到的频繁序列项)为：

A→B→D和D→F→C

其中，假设A→B→D所对应的特征值是x1，D→F→C所对应的特征值是x2，则最终可以根据所命中的频繁序列项的特征值x1、x2来计算出的用户状态序列：A→B→D→F→C→E所对应的序列特征。例如：将所命中的频繁序列项的特征值进行求和，将和值作为序列特征，等等。

步骤104，以所得到的序列特征作为特征值、所述事件风险类型作为标签值，构成风险识别样本数据，并利用至少一条样本数据构建风险识别模型。

其中，所述特征值是待训练的模型的输入，所述标签值(如：高风险对应的标签值为1，低风险对应的标签值为0)可以作为模型所期望的输出。当然，在实际模型训练过程中，除了上述序列特征之外，还可以引入其他特征变量，例如，非序列的常规模型变量。所有的变量一同训练模型并对线上风险进行识别。

参照图2所示，基于以上构建的模型，一种风险识别方法可以包括步骤201～步骤204，其中：

步骤201，从目标用户的数据中，提取该目标用户在给定时长内的用户状态记录，其中，所述用户状态记录包括：用户的操作行为和/或系统事件。

其中，关于步骤201何时应该提取用户状态记录，包括如下情况：

情况一，当识别到目标用户将要进行某个特定事件(如转账)时，开始提取该目标用户在该特定事件之前的给定时长内的用户状态记录。若最终识别出风险，则采取相应措施，如：不允许该转账。

情况二，当目标用户已经执行了某个特定事件之后，开始提取该目标用户在该特定事件之前的给定时长内的用户状态记录。若最终识别出风险，则可以冻结欺诈者所用的账号。

步骤202，按照发生时间对所述用户状态记录进行排序，根据排序结果生成用户状态序列。

步骤203，将所生成的用户状态序列转换为序列特征。

步骤204，将所述序列特征作为预先构建的风险识别模型的输入，输出风险识别结果。其中，模型的输出可以表示当前特定事件存在风险的可能性。

本说明书实施例所提供的方法所产生的效果包括：

通过挖掘用户状态序列和风险事件之间的潜在关系，来构建风险识别模型，在风险识别阶段，则可基于所述风险识别模型和提取到的待识别用户的用户状态序列，来预测待识别用户所作的特定事件或该用户本身的风险，提高了风控体系对于风险的识别能力，提升了风控系统的防御鲁棒性，使得策略和模型更难被盗用者绕过。另外，行为序列信息可以直观地反映了盗用者的作案手法，可辅助策略分析师方便地分析案件盗用行为手法，提高工作效率。

相应于上述方法实施例，本说明书实施例还提供一种风险识别模型构建装置和风险识别装置。

参见图3所示，一种风险识别模型构建装置300可以包括：

提取单元301，被配置为：从给定用户的数据中，提取特定事件发生前预设时长内的用户状态记录，所述用户状态记录包括：用户的操作行为和/或系统事件，所述特定事件为已确定风险类型的事件。

序列生成单元302，被配置为：按照发生时间对所提取到的用户状态记录进行排序，根据排序结果生成针对所述特定事件的用户状态序列。

特征转换单元303，被配置为：将所生成的用户状态序列转换为序列特征。

模型构建单元304，被配置为：以所得到的序列特征作为特征值、所述事件风险类型作为标签值，构成风险识别样本数据，并利用至少一条样本数据构建风险识别模型。

在一实施例中，所述序列生成单元302可以被配置为：

在所述排序结果中，根据第i次用户状态与第i+1次用户状态的间隔时长，将第i次用户状态转化为携带所述间隔时长信息的用户状态。

在一实施例中，所述序列生成单元302可以被配置为：

根据预设的过滤规则，对所述排序结果中的用户状态进行过滤。

参见图4所示，一种风险识别装置400可以包括：

获取单元401，被配置为：从目标用户的数据中，提取该目标用户在给定时长内的用户状态记录，所述用户状态记录包括：用户的操作行为和/或系统事件。

序列生成单元402，被配置为：按照发生时间对所述用户状态记录进行排序，根据排序结果生成用户状态序列。

特征转换单元403，被配置为：将所生成的用户状态序列转换为序列特征。

输出单元404，被配置为：将所述序列特征作为预先构建的风险识别模型的输入，输出风险识别结果。

在一实施例中，所述序列生成单元402可以被配置为：

上述装置中各个模块的功能和作用的实现过程具体详见上述方法中对应步骤的实现过程，在此不再赘述。

本说明书实施例还提供一种计算机设备，其至少包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，其中，处理器执行所述程序时实现前述的风险识别方法。在一实施例中，方法至少包括：

将所生成的用户状态序列转换为序列特征；

在另一实施例中，方法至少包括：

将所生成的用户状态序列转换为序列特征；

图5示出了本说明书实施例所提供的一种更为具体的计算设备硬件结构示意图，该设备可以包括：处理器1010、存储器1020、输入/输出接口1030、通信接口1040和总线1050。其中处理器1010、存储器1020、输入/输出接口1030和通信接口1040通过总线1050实现彼此之间在设备内部的通信连接。

处理器1010可以采用通用的CPU(Central Processing Unit，中央处理器)、微处理器、应用专用集成电路(Application Specific Integrated Circuit，ASIC)、或者一个或多个集成电路等方式实现，用于执行相关程序，以实现本说明书实施例所提供的技术方案。

存储器1020可以采用ROM(Read Only Memory，只读存储器)、RAM(Random Access Memory，随机存取存储器)、静态存储设备，动态存储设备等形式实现。存储器1020可以存储操作系统和其他应用程序，在通过软件或者固件来实现本说明书实施例所提供的技术方案时，相关的程序代码保存在存储器1020中，并由处理器1010来调用执行。

输入/输出接口1030用于连接输入/输出模块，以实现信息输入及输出。输入输出/模块可以作为组件配置在设备中(图中未示出)，也可以外接于设备以提供相应功能。其中输入设备可以包括键盘、鼠标、触摸屏、麦克风、各类传感器等，输出设备可以包括显示器、扬声器、振动器、指示灯等。

通信接口1040用于连接通信模块(图中未示出)，以实现本设备与其他设备的通信交互。其中通信模块可以通过有线方式(例如USB、网线等)实现通信，也可以通过无线方式(例如移动网络、WIFI、蓝牙等)实现通信。

总线1050包括一通路，在设备的各个组件(例如处理器1010、存储器1020、输入/输出接口1030和通信接口1040)之间传输信息。

需要说明的是，尽管上述设备仅示出了处理器1010、存储器1020、输入/输出接口1030、通信接口1040以及总线1050，但是在具体实施过程中，该设备还可以包括实现正常运行所必需的其他组件。此外，本领域的技术人员可以理解的是，上述设备中也可以仅包含实现本说明书实施例方案所必需的组件，而不必包含图中所示的全部组件。

通过以上的实施方式的描述可知，本领域的技术人员可以清楚地了解到本说明书实施例可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解，本说明书实施例的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品可以存储在存储介质中，如ROM/RAM、磁碟、光盘等，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本说明书实施例各个实施例或者实施例的某些部分所述的方法。

上述实施例阐明的系统、装置、模块或单元，具体可以由计算机芯片或实体实现，或者由具有某种功能的产品来实现。一种典型的实现设备为计算机，计算机的具体形式可以是个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件收发设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任意几种设备的组合。

本说明书中的各个实施例均采用递进的方式描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。尤其，对于装置实施例而言，由于其基本相似于方法实施例，所以描述得比较简单，相关之处参见方法实施例的部分说明即可。以上所描述的装置实施例仅仅是示意性的，其中所述作为分离部件说明的模块可以是或者也可以不是物理上分开的，在实施本说明书实施例方案时可以把各模块的功能在同一个或多个软件和/或硬件中实现。也可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下，即可以理解并实施。

以上所述仅是本说明书实施例的具体实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本说明书实施例原理的前提下，还可以做出若干改进和润饰，这些改进和润饰也应视为本说明书实施例的保护范围。

Claims

一种风险识别模型构建方法，包括：

从给定用户的数据中，提取特定事件发生前预设时长内的用户状态记录，所述用户状态记录包括：用户的操作行为和/或系统事件，所述特定事件为已确定风险类型的事件；

按照发生时间对所提取到的用户状态记录进行排序，根据排序结果生成针对所述特定事件的用户状态序列；

将所生成的用户状态序列转换为序列特征；

以所得到的序列特征作为特征值、所述事件风险类型作为标签值，构成风险识别样本数据，并利用至少一条样本数据构建风险识别模型。
根据权利要求1所述的方法，所述根据排序结果生成针对所述特定事件的用户状态序列，包括：

在所述排序结果中，根据第i次用户状态与第i+1次用户状态的间隔时长，将第i次用户状态转化为携带所述间隔时长信息的用户状态。
根据权利要求1所述的方法，所述根据排序结果生成针对所述特定事件的用户状态序列，包括：

在所述排序结果中，根据预先对第i次用户状态的评估结果，将第i次用户状态转化为携带所述评估结果信息的用户状态。
根据权利要求1所述的方法，所述根据排序结果生成针对所述特定事件的用户状态序列，包括：

根据预设的过滤规则，对所述排序结果中的用户状态进行过滤。
根据权利要求1所述的方法，所述将所生成的用户状态序列转换为序列特征，包括：

将所生成的用户状态序列编码为序列向量。
根据权利要求5所述的方法，所述将所生成的用户状态序列编码为序列向量，包括：

根据第一编码规则，将所述用户状态序列中的每一个状态分别编码为状态向量；

利用神经网络将状态向量所构成的序列编码为序列向量。
根据权利要求5所述的方法，在将所生成的用户状态序列转换为序列特征之前，还包括：

从多条用户状态序列中挖掘频繁序列项集；

对于所述频繁序列项集中的每一频繁序列项，根据所述频繁序列项对应的黑白样本分布情况，确定所述频繁序列项对应的特征值；

所述将所生成的用户状态序列转换为序列特征，包括：

基于所述频繁序列项集，确定生成的用户状态序列中包含的频繁序列项；

根据所述用户状态序列中包含的频繁序列项和预先确定的各频繁序列项对应的特征值，确定与所述用户状态序列对应的序列特征。
一种风险识别方法，包括：

从目标用户的数据中，提取该目标用户在给定时长内的用户状态记录，所述用户状态记录包括：用户的操作行为和/或系统事件；

按照发生时间对所述用户状态记录进行排序，根据排序结果生成用户状态序列；

将所生成的用户状态序列转换为序列特征；

将所述序列特征作为预先构建的风险识别模型的输入，输出风险识别结果。
根据权利要求8所述的方法，所述根据排序结果生成用户状态序列，包括：

在所述排序结果中，根据第i次用户状态与第i+1次用户状态的间隔时长，将第i次用户状态转化为携带所述间隔时长信息的用户状态。
根据权利要求8所述的方法，所述根据排序结果生成用户状态序列，包括：

在所述排序结果中，根据预先对第i次用户状态的评估结果，将第i次用户状态转化为携带所述评估结果信息的用户状态。
根据权利要求8所述的方法，所述根据排序结果生成用户状态序列，包括：

根据预设的过滤规则，对所述排序结果中的用户状态进行过滤。
一种风险识别模型构建装置，包括：

提取单元，从给定用户的数据中，提取特定事件发生前预设时长内的用户状态记录，所述用户状态记录包括：用户的操作行为和/或系统事件，所述特定事件为已确定风险类型的事件；

序列生成单元，按照发生时间对所提取到的用户状态记录进行排序，根据排序结果生成针对所述特定事件的用户状态序列；

特征转换单元，将所生成的用户状态序列转换为序列特征；

模型构建单元，以所得到的序列特征作为特征值、所述事件风险类型作为标签值，构成风险识别样本数据，并利用至少一条样本数据构建风险识别模型。
根据权利要求12所述的装置，所述序列生成单元被配置为：

在所述排序结果中，根据第i次用户状态与第i+1次用户状态的间隔时长，将第i次用户状态转化为携带所述间隔时长信息的用户状态。
根据权利要求12所述的装置，所述序列生成单元被配置为：

在所述排序结果中，根据预先对第i次用户状态的评估结果，将第i次用户状态转化为携带所述评估结果信息的用户状态。
根据权利要求12所述的装置，所述序列生成单元被配置为：

根据预设的过滤规则，对所述排序结果中的用户状态进行过滤。
一种风险识别装置，包括：

获取单元，从目标用户的数据中，提取该目标用户在给定时长内的用户状态记录，所述用户状态记录包括：用户的操作行为和/或系统事件；

序列生成单元，按照发生时间对所述用户状态记录进行排序，根据排序结果生成用户状态序列；

特征转换单元，将所生成的用户状态序列转换为序列特征；

输出单元，将所述序列特征作为预先构建的风险识别模型的输入，输出风险识别结果。
根据权利要求16所述的装置，所述序列生成单元被配置为：

在所述排序结果中，根据第i次用户状态与第i+1次用户状态的间隔时长，将第i次用户状态转化为携带所述间隔时长信息的用户状态。
根据权利要求16所述的装置，所述序列生成单元被配置为：

在所述排序结果中，根据预先对第i次用户状态的评估结果，将第i次用户状态转化为携带所述评估结果信息的用户状态。
根据权利要求16所述的装置，所述序列生成单元被配置为：

根据预设的过滤规则，对所述排序结果中的用户状态进行过滤。
一种计算机设备，包括：

处理器；

用于存储处理器可执行指令的存储器；

所述处理器被配置为：

从给定用户的数据中，提取特定事件发生前预设时长内的用户状态记录，所述用户状态记录包括：用户的操作行为和/或系统事件，所述特定事件为已确定风险类型的事件；

按照发生时间对所提取到的用户状态记录进行排序，根据排序结果生成针对所述特定事件的用户状态序列；

将所生成的用户状态序列转换为序列特征；

以所得到的序列特征作为特征值、所述事件风险类型作为标签值，构成风险识别样本数据，并利用至少一条样本数据构建风险识别模型。
一种计算机设备，包括：

处理器；

用于存储处理器可执行指令的存储器；

所述处理器被配置为：

从目标用户的数据中，提取该目标用户在给定时长内的用户状态记录，所述用户状态记录包括：用户的操作行为和/或系统事件；

按照发生时间对所述用户状态记录进行排序，根据排序结果生成用户状态序列；

将所生成的用户状态序列转换为序列特征；

将所述序列特征作为预先构建的风险识别模型的输入，输出风险识别结果。