CN111582722B

CN111582722B - 风险识别方法、装置、电子设备及可读存储介质

Info

Publication number: CN111582722B
Application number: CN202010387275.0A
Authority: CN
Inventors: 孙佩; 陆青
Original assignee: Rajax Network Technology Co Ltd
Current assignee: Rajax Network Technology Co Ltd
Priority date: 2020-05-09
Filing date: 2020-05-09
Publication date: 2022-06-07
Anticipated expiration: 2040-05-09
Also published as: CN111582722A

Abstract

本公开实施例公开了一种风险识别方法、装置、电子设备及可读存储介质，该风险识别方法包括：获取样本数据以及待识别事件，其中，所述样本数据包括多个事件，每个所述事件与一个或多个特征相关联，所述待识别事件与一个或多个目标特征相关联；至少基于所述样本数据中与所述目标特征相关联的风险事件的数量和非风险事件的数量，确定所述目标特征的风险关联参数；基于所述目标特征的风险关联参数，确定所述待识别事件的风险。根据本公开实施例，通过至少基于所述样本数据中与所述目标特征相关联的风险事件的数量和非风险事件的数量，确定所述目标特征的风险关联参数，能够较为准确地识别待识别事件的风险。

Description

风险识别方法、装置、电子设备及可读存储介质

技术领域

本公开涉及互联网技术领域，具体涉及一种风险识别方法、装置、电子设备及可读存储介质。

背景技术

目前，在响应用户的业务处理请求的过程中主要通过对数字类信息的匹配核实来进行风险识别，比如通过验证信用卡卡号、有效期、手机号码、证件号码等来判断当前的待识别事件是否存在风险。然而，本发明人发现，现有技术中存在风险识别不准确的问题。

发明内容

为了解决相关技术中的问题，本公开实施例提供一种风险识别方法、装置、电子设备及可读存储介质。

第一方面，本公开实施例中提供了一种风险识别方法。

具体地，所述风险识别方法，包括：

获取样本数据以及待识别事件，其中，所述样本数据包括多个事件，每个所述事件与一个或多个特征相关联，所述待识别事件与一个或多个目标特征相关联；

至少基于所述样本数据中与所述目标特征相关联的风险事件的数量和非风险事件的数量，确定所述目标特征的风险关联参数；

基于所述目标特征的风险关联参数，确定所述待识别事件的风险。

结合第一方面，本公开在第一方面的第一种实现方式中，所述获取样本数据，包括：

获取原始数据，所述原始数据包括多个事件以及所述事件是否为风险事件的标识，每个所述事件与一个或多个原始特征相关联；

基于所述原始特征获取新增特征；

将所述新增特征与相应事件相关联，并将所述新增特征加入所述原始数据，以获取所述样本数据。

结合第一方面的第一种实现方式，本公开在第一方面的第二种实现方式中，所述基于所述原始特征以获取新增特征，包括：

将多个原始特征组合为新增特征；以及/或者

通过模糊化的方式处理所述原始特征以获取新增特征。

结合第一方面，本公开在第一方面的第三种实现方式中，所述风险关联参数包括第一风险关联参数，所述至少基于所述样本数据中与所述目标特征相关联的风险事件的数量和非风险事件的数量，确定所述目标特征的风险关联参数，包括：

基于所述样本数据中与所述目标特征相关联的风险事件的数量和非风险事件的数量，确定所述目标特征的第一风险关联参数。

结合第一方面的第三种实现方式，本公开在第一方面的第四种实现方式中，该方法还包括：

基于所述样本数据中与所述目标特征相关联的风险事件的数量和非风险事件的数量，确定所述目标特征的第一风险关联参数的第一置信度，

其中，所述基于所述目标特征的风险关联参数，确定所述待识别事件的风险，包括：基于所述目标特征的第一风险关联参数和所述第一置信度，确定所述待识别事件的风险。

结合第一方面，本公开在第一方面的第五种实现方式中，所述风险关联参数包括第二风险关联参数，所述至少基于所述样本数据中与所述目标特征相关联的风险事件的数量和非风险事件的数量，确定所述目标特征的风险关联参数，包括：

基于与所述目标特征相关联的风险事件的数量和非风险事件的数量确定筛选条件；

基于所述样本数据中满足所述筛选条件的特征数量，确定所述目标特征的第二风险关联参数。

结合第一方面的第五种实现方式，本公开在第一方面的第六种实现方式中：

所述筛选条件包括第一筛选条件和第二筛选条件，所述第一筛选条件包括风险事件的数量与所述目标特征的风险事件数量的差值为第一预设值且非风险事件的数量与所述目标特征的非风险事件数量的差值为第二预设值，所述第二筛选条件包括风险事件的数量与所述目标特征的风险事件数量的差值为第二预设值且非风险事件的数量与所述目标特征的非风险事件数量的差值为第一预设值；

基于所述样本数据中满足所述筛选条件的特征数量，确定所述目标特征的第二风险关联参数，包括基于所述样本数据中满足所述第一筛选条件的特征数量和满足所述第二筛选条件的特征数量，确定所述目标特征的第二风险关联参数。

结合第一方面的第五种实现方式，本公开在第一方面的第七种实现方式中，该方法还包括：

基于所述样本数据中满足所述筛选条件的特征数量，确定所述目标特征的第二风险关联参数的第二置信度，

其中，所述基于所述目标特征的风险关联参数，确定所述待识别事件的风险，包括：基于所述目标特征的第二风险关联参数和所述第二置信度，确定所述待识别事件的风险。

结合第一方面，本公开在第一方面的第八种实现方式中，所述风险关联参数包括第一风险关联参数和第二风险关联参数，所述基于所述目标特征的风险关联参数，确定所述待识别事件的风险，包括：

基于所述第一风险关联参数、所述第二风险关联参数、所述第一风险关联参数的第一置信度以及所述第二风险关联参数的第二置信度确定所述目标特征的第一风险概率；

基于与所述待识别事件相关联的多个目标特征各自的第一风险概率确定所述待识别事件的第二风险概率；

基于所述待识别事件的第二风险概率，确定所述待识别事件的风险。

结合第一方面，本公开在第一方面的第九种实现方式中，所述基于所述目标特征的风险关联参数，确定所述待识别事件的风险，包括：

基于所述目标特征的风险关联参数和至少一个与所述待识别事件的场景相关的预设特征，使用训练好的第一模型，确定所述待识别事件的风险，所述第一模型是使用样本数据的风险关联参数和预设特征训练得到的。

结合第一方面，本公开在第一方面的第十种实现方式中，该方法还包括：

根据所述待识别事件的实际业务处理结果，将所述待识别事件分类为风险事件或非风险事件；

将所述待识别事件加入所述样本数据。

结合第一方面，本公开在第一方面的第十一种实现方式中，该方法还包括：

在确定所述待识别事件为高风险事件的情况下，基于所述目标特征输出按照预设维度组织与所述事件相关的描述信息而得到的解释信息。

结合第一方面，本公开在第一方面的第十二种实现方式中，该方法还包括：

基于所述待识别事件的风险识别结果，使用训练好的第二模型，确定针对所述待识别事件的业务决策，所述第二模型是使用样本事件的风险识别结果、针对所述样本事件的样本业务决策和针对所述样本事件采取所述样本业务决策后得到的结果训练得到的。

第二方面，本公开实施例中提供了一种风险识别装置。

具体地，所述风险识别装置，包括：

获取模块，被配置为获取样本数据以及待识别事件，其中，所述样本数据包括多个事件，每个所述事件与一个或多个特征相关联，所述待识别事件与一个或多个目标特征相关联；

第一确定模块，被配置为至少基于所述样本数据中与所述目标特征相关联的风险事件的数量和非风险事件的数量，确定所述目标特征的风险关联参数；

第二确定模块，被配置为基于所述目标特征的风险关联参数，确定所述待识别事件的风险。

结合第二方面，本公开在第二方面的第一种实现方式中，所述获取模块包括：

第一获取子模块，被配置为获取原始数据，所述原始数据包括多个事件以及所述事件是否为风险事件的标识，每个所述事件与一个或多个原始特征相关联；

第二获取子模块，被配置为基于所述原始特征获取新增特征；

第三获取子模块，被配置为将所述新增特征与相应事件相关联，并将所述新增特征加入所述原始数据，以获取所述样本数据。

结合第二方面的第一种实现方式，本公开在第二方面的第二种实现方式中，所述第二获取子模块被配置为：

将多个原始特征组合为新增特征；以及/或者

通过模糊化的方式处理所述原始特征以获取新增特征。

结合第二方面，本公开在第二方面的第三种实现方式中，所述风险关联参数包括第一风险关联参数，所述第一确定模块包括：

第一确定子模块，被配置为基于所述样本数据中与所述目标特征相关联的风险事件的数量和非风险事件的数量，确定所述目标特征的第一风险关联参数。

结合第二方面的第三种实现方式，本公开在第二方面的第四种实现方式中，该装置还包括：

第三确定模块，被配置为基于所述样本数据中与所述目标特征相关联的风险事件的数量和非风险事件的数量，确定所述目标特征的第一风险关联参数的第一置信度，

其中，所述第二确定模块被配置为基于所述目标特征的第一风险关联参数和所述第一置信度，确定所述待识别事件的风险。

结合第二方面，本公开在第二方面的第五种实现方式中，所述风险关联参数包括第二风险关联参数，所述第一确定模块包括：

第二确定子模块，被配置为基于与所述目标特征相关联的风险事件的数量和非风险事件的数量确定筛选条件；

第三确定子模块，被配置为基于所述样本数据中满足所述筛选条件的特征数量，确定所述目标特征的第二风险关联参数。

结合第二方面的第五种实现方式，本公开在第二方面的第六种实现方式中：

所述第三确定子模块被配置为基于所述样本数据中满足所述第一筛选条件的特征数量和满足所述第二筛选条件的特征数量，确定所述目标特征的第二风险关联参数。

结合第二方面的第五种实现方式，本公开在第二方面的第七种实现方式中，该装置还包括：

第四确定模块，被配置为基于所述样本数据中满足所述筛选条件的特征数量，确定所述目标特征的第二风险关联参数的第二置信度，

其中，所述第二确定模块被配置为基于所述目标特征的第二风险关联参数和所述第二置信度，确定所述待识别事件的风险。

结合第二方面，本公开在第二方面的第八种实现方式中，所述风险关联参数包括第一风险关联参数和第二风险关联参数，所述第二确定模块包括：

第四确定子模块，被配置为基于所述第一风险关联参数、所述第二风险关联参数、所述第一风险关联参数的第一置信度以及所述第二风险关联参数的第二置信度确定所述目标特征的第一风险概率；

第五确定子模块，被配置为基于与所述待识别事件相关联的多个目标特征各自的第一风险概率确定所述待识别事件的第二风险概率；

第六确定子模块，被配置为基于所述待识别事件的第二风险概率，确定所述待识别事件的风险。

结合第二方面，本公开在第二方面的第九种实现方式中，所述第二确定模块包括：

第七确定子模块，被配置为基于所述目标特征的风险关联参数和至少一个与所述待识别事件的场景相关的预设特征，使用训练好的第一模型，确定所述待识别事件的风险，所述第一模型是使用样本数据的风险关联参数和预设特征训练得到的。

结合第二方面，本公开在第二方面的第十种实现方式中，该装置还包括：

分类模块，被配置为根据所述待识别事件的实际业务处理结果，将所述待识别事件分类为风险事件或非风险事件；

更新模块，被配置为将所述待识别事件加入所述样本数据。

结合第二方面，本公开在第二方面的第十一种实现方式中，该装置还包括：

输出模块，被配置为在确定所述待识别事件为高风险事件的情况下，基于所述目标特征输出按照预设维度组织与所述事件相关的描述信息而得到的解释信息。

结合第二方面，本公开在第二方面的第十二种实现方式中，该装置还包括：

决策模块，被配置为基于所述待识别事件的风险识别结果，使用训练好的第二模型，确定针对所述待识别事件的业务决策，所述第二模型是使用样本事件的风险识别结果、针对所述样本事件的样本业务决策和针对所述样本事件采取所述样本业务决策后得到的结果训练得到的。

第三方面，本公开实施例提供了一种电子设备，包括存储器和处理器，其中，所述存储器用于存储一条或多条计算机指令，其中，所述一条或多条计算机指令被所述处理器执行以实现如第一方面、第一方面的第一种实现方式至第十二种实现方式中任一项所述的方法。

第四方面，本公开实施例中提供了一种计算机可读存储介质，其上存储有计算机指令，该计算机指令被处理器执行时实现如第一方面、第一方面的第一种实现方式至第十二种实现方式中任一项所述的方法。

根据本公开实施例提供的技术方案，通过获取样本数据以及待识别事件，其中，所述样本数据包括多个事件，每个所述事件与一个或多个特征相关联，所述待识别事件与一个或多个目标特征相关联；至少基于所述样本数据中与所述目标特征相关联的风险事件的数量和非风险事件的数量，确定所述目标特征的风险关联参数；基于所述目标特征的风险关联参数，确定所述待识别事件的风险，能够较为准确地识别待识别事件的风险。

应当理解的是，以上的一般描述和后文的细节描述仅是示例性和解释性的，并不能限制本公开。

附图说明

结合附图，通过以下非限制性实施方式的详细描述，本公开的其它特征、目的和优点将变得更加明显。在附图中：

图1示出根据本公开实施例的风险识别方法的流程图；

图2示出根据本公开实施例的获取样本数据的流程图；

图3示出根据本公开实施例的确定待识别事件的风险的流程图；

图4示出根据本公开另一实施例的风险识别方法的流程图；

图5示出根据本公开实施例的风险识别装置的结构框图；

图6示出根据本公开实施例的获取模块的结构框图；

图7示出根据本公开实施例的第二确定模块的结构框图；

图8示出根据本公开实施例的电子设备的结构框图；以及

图9示出根据本公开实施例的适于实现风险识别方法的计算机系统的结构示意图。

具体实施方式

下文中，将参考附图详细描述本公开的示例性实施例，以使本领域技术人员可容易地实现它们。此外，为了清楚起见，在附图中省略了与描述示例性实施例无关的部分。

在本公开中，应理解，诸如“包括”或“具有”等的术语旨在指示本说明书中所公开的特征、数字、步骤、行为、部件、部分或其组合的存在，并且不欲排除一个或多个其他特征、数字、步骤、行为、部件、部分或其组合存在或被添加的可能性。

另外还需要说明的是，在不冲突的情况下，本公开中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本公开。

本公开实施例提供了一种风险识别方法，通过获取样本数据以及待识别事件，其中，所述样本数据包括多个事件，每个所述事件与一个或多个特征相关联，所述待识别事件与一个或多个目标特征相关联；至少基于所述样本数据中与所述目标特征相关联的风险事件的数量和非风险事件的数量，确定所述目标特征的风险关联参数；基于所述目标特征的风险关联参数，确定所述待识别事件的风险，能够较为准确地识别待识别事件的风险。

图1示出根据本公开的实施例的风险识别方法的流程图。如图1所示，所述风险识别方法包括以下步骤S110～S130：

在步骤S110中，获取样本数据以及待识别事件，其中，所述样本数据包括多个事件，每个所述事件与一个或多个特征相关联，所述待识别事件与一个或多个目标特征相关联；

在步骤S120中，至少基于所述样本数据中与所述目标特征相关联的风险事件的数量和非风险事件的数量，确定所述目标特征的风险关联参数；

在步骤S130中，基于所述目标特征的风险关联参数，确定所述待识别事件的风险。

根据本公开实施例，可以获取自然人信息、账户信息、交易记录、非动账记录以及社交关系等。其中，自然人信息指操作人使用的这个账户的服务器端存储的关于这个自然人的基本信息，包括操作人注册和使用这个账户时主动提交的和通过第三方数据源查询获取的；账户信息指操作人使用的这个账户的服务器端存储的关于这个账户的信息；交易记录指操作人使用的这个账户发生的交易行为的记录，包括消费、转账、还款等行为的记录，例如交易时间、交易对手、金额、渠道、类型、pos机、ip、设备、地理位置等；非动账记录指操作人使用的这个账户发生的非交易类事件的记录，包括登录、改密、调额、浏览、点击、评论、领优惠券等行为的记录，例如事件时间、类型、受理人id、ip、设备、地理位置等；社交关系指操作人的社交关系类信息的集合，例如手机通讯录、通话记录、常用联系人、家庭关系、校友关系、各类社交软件的社交关系等。

以上各种数据的获取或展示经用户授权、确认、或由用户主动选择。

以上数据可以通过数据清洗整理为结构化的样本数据。样本数据包括多个事件。事件例如可以为某个账户中发生的事件，例如登录该账户的事件、修改密码的事件、发出交易请求的事件等。在该些事件中，例如涉及的自然人信息或账户信息关联的各种识别标识(例如手机号等)，交易记录或非交易记录中记载的ip地址、设备、地理位置等，均可以作为该事件关联的特征。

样本数据可以按照时间分表存储或全量表的形式存储。样本数据中的每个事件可以与一个或多个特征相关联，并且每个事件例如可以通过标注的方式被确定为风险事件或非风险事件。其中，特征可以包括介质，也可以是根据应用场景选择的其他特征，例如账户名、身份证号、等等。介质是指通过某个维度产生两个或两个以上账户之间关联载体的统称，例如，手机号、设备号、mac地址、ip地址、imei(International Mobile EquipmentIdentity，国际移动设备识别码)号、操作系统、app版本号、浏览器信息、开户行、收货地址等。若某个特征上发生了风险事件，则其他使用该特征的账户与该风险事件存在风险关联。举例而言，例如某一ip地址发生过风险事件，那么其他与该ip地址相关的事件也可能存在风险。标注过程可以根据多种渠道收集已知风险事件，例如，客户反馈、黑名单数据、处罚规则、模型识别或人工审核发现的风险事件；对于一段预定时间内未发生以上情况的事件可以标记为非风险事件。

图2示出根据本公开实施例的获取样本数据的流程图。如图2所示，步骤S110可以包括以下步骤S210～S230：

在步骤S210中，获取原始数据，所述原始数据包括多个事件以及所述事件是否为风险事件的标识，每个所述事件与一个或多个原始特征相关联；

在步骤S220中，基于所述原始特征获取新增特征；

在步骤S230中，将所述新增特征与相应事件相关联，并将所述新增特征加入所述原始数据，以获取所述样本数据。

根据本公开实施例提供的技术方案，通过所述获取样本数据包括：获取原始数据，所述原始数据包括多个事件以及所述事件是否为风险事件的标识，每个所述事件与一个或多个原始特征相关联；基于所述原始特征获取新增特征；将所述新增特征与相应事件相关联，并将所述新增特征加入所述原始数据，以获取所述样本数据，能够基于原始特征挖掘更多的新增特征，可以提升识别风险的准确率。

根据本公开实施例，可以通过多种方式处理所述原始特征以获取新增特征。例如，可以将多个原始特征组合为新增特征，例如，可以将ip地址与日期组合、渠道与浏览器版本组合等，形成新增特征，这种组合可以提高关联特征的针对性，多个弱特征通过组合会变成一个强特征。这种操作可以更好的发现比较特殊的关联模式。

又如，可以通过模糊化的方式处理所述原始特征以获取新增特征。例如，可以对ipv4地址分别取前一段、前两段、前三段，可以使得虽然不完全相同，但号段相似的ip产生关联。同理，可以对手机号分别取前3位、前4位、前5位、前6位等。除此之外，银行卡号、地址、位置信息、邮箱等特征都可以定义其对应的模糊化处理方式。这种操作将增强关联发现的能力，对信息做过完备表达，从而可以更好的发现关联模式。例如，ip地址这一特征类型的某一个客体12.34.56.78可以通过模糊化的方式处理为以下多种特征：

原始特征-ip：12.34.56.78；

新增特征1：12.34.56；

新增特征2：12.34；

新增特征3：12。

根据本公开实施例提供的技术方案，通过述基于所述原始特征以获取新增特征，包括将多个原始特征组合为新增特征，以及/或者，通过模糊化的方式处理所述原始特征以获取新增特征，能够基于原始特征挖掘更多的新增特征，可以提升识别风险的准确率。

返回参考图1。根据本公开实施例，所述风险关联参数包括第一风险关联参数，所述至少基于所述样本数据中与所述目标特征相关联的风险事件的数量和非风险事件的数量，确定所述目标特征的风险关联参数，包括：

根据本公开实施例提供的技术方案，通过所述风险关联参数包括第一风险关联参数，所述至少基于所述样本数据中与所述目标特征相关联的风险事件的数量和非风险事件的数量，确定所述目标特征的风险关联参数，包括，基于所述样本数据中与所述目标特征相关联的风险事件的数量和非风险事件的数量，确定所述目标特征的第一风险关联参数，能够较为准确地识别待识别事件的风险。

根据本公开实施例，可以通过假设第M类特征的第i个特征客体上使用过给定粒度的风险事件个数为P_M,i，非风险事件的个数为N_M,i，则对应的第一类风险关联参数的计算方式为：

例如，第M类特征为“手机号前6位”，第i个特征客体是“138100”，表示手机号前6位为“138100”。统计与该特征客体关联的风险事件的数量和非风险事件的数量，即可确定出该特征的第一类风险关联参数。如果第一类风险特征接近0，即大量的以138100开头的手机号的事件未发现风险，则该特征的风险程度较低。如果该第一类风险特征较大，即以138100开头的手机号相关联的事件中风险事件占有一定的比例，则该特征的风险程度较高。

根据本公开实施例，该方法还可以包括：

根据本公开实施例，第一风险关联参数在统计意义上的标准差为：

可以反映第一风险关联参数的置信度，标准差σ_M,i,1越高，则第一风险关联参数的可信程度越低；反之，标准差σ_M,i,1越低，则第一风险关联参数的可信程度越高，可对该标准差进行排序，从而确定某一特征的第一风险关联参数是否可信。其中，σ_std是单次事件的风险伯努利分布的标准差。根据本公开实施例，σ_std从实践上可以随意取值，如取1，因为σ_std的取值不影响样本的排序。

根据本公开实施例提供的技术方案，通过基于所述样本数据中与所述目标特征相关联的风险事件的数量和非风险事件的数量，确定所述目标特征的第一风险关联参数的第一置信度，所述基于所述目标特征的风险关联参数，确定所述待识别事件的风险，包括：基于所述目标特征的第一风险关联参数和所述第一置信度，确定所述待识别事件的风险，能够较为准确地识别待识别事件的风险。

根据本公开实施例，所述风险关联参数包括第二风险关联参数，所述至少基于所述样本数据中与所述目标特征相关联的风险事件的数量和非风险事件的数量，确定所述目标特征的风险关联参数，包括：

根据本公开实施例，该筛选条件例如可以是风险事件的数量与所述目标特征的风险事件数量的差值为第一预设值，并且/或者，非风险事件的数量与所述目标特征的非风险事件数量的差值为第二预设值。目标特征的风险事件的数量为35，非风险事件的数量为786，假定第一预设值为0，则可以确定风险事件的数量为35作为筛选条件，筛选出风险事件的数量为35的特征的数量。由此，可以筛选出与目标特征具有相似性的其他特征的样本数据作为补充，弥补样本量不足的问题。

根据本公开实施例提供的技术方案，通过所述风险关联参数包括第二风险关联参数，所述至少基于所述样本数据中与所述目标特征相关联的风险事件的数量和非风险事件的数量，确定所述目标特征的风险关联参数，包括：基于与所述目标特征相关联的风险事件的数量和非风险事件的数量确定筛选条件；基于所述样本数据中满足所述筛选条件的特征数量，确定所述目标特征的第二风险关联参数，能够弥补数据量小而统计方差过大的问题，从而较为准确地识别待识别事件的风险。

根据本公开实施例，所述筛选条件包括第一筛选条件和第二筛选条件，所述第一筛选条件包括风险事件的数量与所述目标特征的风险事件数量的差值为第一预设值且非风险事件的数量与所述目标特征的非风险事件数量的差值为第二预设值，所述第二筛选条件包括风险事件的数量与所述目标特征的风险事件数量的差值为第二预设值且非风险事件的数量与所述目标特征的非风险事件数量的差值为第一预设值；

根据本公开实施例，可以通过假设第M类特征的第i个客体上使用过给定粒度的风险事件个数为P_M,i,非风险事件的个数为N_M,i。历史上出现过的满足风险事件个数为P_M,i,非风险事件的个数为N_M,i的M类特征的个数记为C(P_M,i，N_M,i)。例如，取第一预设值为1，第二预设值为0，则第一筛选条件为C(P_M,i+1，N_M,i)，第二筛选条件为C(P_M,i，N_M,i+1)，对应的第二类风险关联参数的计算方式例如可以是：

根据本公开实施例提供的技术方案，通过所述筛选条件包括第一筛选条件和第二筛选条件，所述第一筛选条件包括风险事件的数量与所述目标特征的风险事件数量的差值为第一预设值且非风险事件的数量与所述目标特征的非风险事件数量的差值为第二预设值，所述第二筛选条件包括风险事件的数量与所述目标特征的风险事件数量的差值为第二预设值且非风险事件的数量与所述目标特征的非风险事件数量的差值为第一预设值；基于所述样本数据中满足所述筛选条件的特征数量，确定所述目标特征的第二风险关联参数，包括基于所述样本数据中满足所述第一筛选条件的特征数量和满足所述第二筛选条件的特征数量，确定所述目标特征的第二风险关联参数，能够弥补数据量小而统计方差过大的问题，从而较为准确地识别待识别事件的风险。

根据本公开实施例，该方法还可以包括：

根据本公开实施例，第二风险关联参数在统计意义上的标准差为：

可以反映第二风险关联参数的置信度，标准差σ_M,i,2越高，则第二风险关联参数的可信程度越低；反之，标准差σ_M,i,2越低，则第二风险关联参数的可信程度越高，可对该标准差进行排序，从而确定某一特征的第二风险关联参数是否可信。其中，σ_std是单次事件的风险伯努利分布的标准差。根据本公开实施例，σ_std从实践上可以随意取值，如取1，因为σ_std的取值不影响样本的排序。

根据本公开实施例提供的技术方案，通过基于所述样本数据中满足所述筛选条件的特征数量，确定所述目标特征的第二风险关联参数的第二置信度，其中，所述基于所述目标特征的风险关联参数，确定所述待识别事件的风险，包括：基于所述目标特征的第二风险关联参数和所述第二置信度，确定所述待识别事件的风险，能够较为准确地识别待识别事件的风险。

根据本公开实施例，在步骤S130，可以首先依据过去一段时间的事件，确定涉及的所有特征，每个特征计算其风险关联参数，之后在出现新的待识别事件时，调用计算结果进行使用。

根据本公开实施例，在识别风险特征时可以采用多种方式，例如，可以根据每个特征的风险关联参数确定风险特征的黑名单，对触碰黑名单特征的事件直接标记为风险事件。例如，可以根据上述第一风险关联参数、所述第二风险关联参数、所述第一风险关联参数的第一置信度以及所述第二风险关联参数的第二置信度确定特征是否为风险特征，并根据确定出的风险特征制作黑名单。

图3示出根据本公开实施例的确定待识别事件的风险的流程图。

图3示出了识别风险特征的另一种方式。根据本公开实施例，所述风险关联参数包括第一风险关联参数和第二风险关联参数，如图3所示，步骤S130可以包括以下步骤S310～S330：

在步骤S310中，基于所述第一风险关联参数、所述第二风险关联参数、所述第一风险关联参数的第一置信度以及所述第二风险关联参数的第二置信度确定所述目标特征的第一风险概率；

在步骤S320中，基于与所述待识别事件相关联的多个目标特征各自的第一风险概率确定所述待识别事件的第二风险概率；

在步骤S330中，基于所述待识别事件的第二风险概率，确定所述待识别事件的风险。

例如，在步骤S310，目标特征M的第一风险概率P_M可以通过下式确定：

该P_M由第一风险关联参数和第二风险关联参数加权求和得到，其权重与标准差σ_M,i,1或σ_M,i,2负相关，在标准差较大时表明精度较低，给予较小的权重，在标准差较小时表明精度较高，给予较大的权重。

在步骤S320，待识别事件无风险的第二风险概率P例如可以通过下式确定：

其中，C为与待识别事件相关的特征的数量。

在步骤S330，可以根据第二风险概率确定待识别事件为高风险事件或低风险事件，例如可以通过预定的阈值比较得出。

根据本公开实施例提供的技术方案，通过所述风险关联参数包括第一风险关联参数和第二风险关联参数，所述基于所述目标特征的风险关联参数，确定所述待识别事件的风险，包括：基于所述第一风险关联参数、所述第二风险关联参数、所述第一风险关联参数的第一置信度以及所述第二风险关联参数的第二置信度确定所述目标特征的第一风险概率；基于与所述待识别事件相关联的多个目标特征各自的第一风险概率确定所述待识别事件的第二风险概率；基于所述待识别事件的第二风险概率，确定所述待识别事件的风险，能够较为准确地识别待识别事件的风险。

根据本公开实施例，所述基于所述目标特征的风险关联参数，确定所述待识别事件的风险，包括：

根据本公开实施例，可以使用有监督机器学习算法，如逻辑回归、随机森林、梯度增强树或神经网络训练一个有监督模型，使用这个有监督模型的预测结果作为最终决策引擎的输入判断风险。该有监督模型的输入例如可以包括以上两类风险关联参数及其置信度，也可以包括与所述待识别事件的场景相关的预设特征；输出例如可以是表示高风险或低风险的判别结果，也可以是存在风险的概率表示。其中，与所述待识别事件的场景相关的预设特征是按照场景维度预先设定的特征，例如在垃圾注册场景，该预设特征例如可以包括“是否为虚拟手机号”、“手机号归属城市与ip城市是否一致”、“手机号是否已实名”等。

根据本公开实施例提供的技术方案，通过所述基于所述目标特征的风险关联参数，确定所述待识别事件的风险，包括：基于所述目标特征的风险关联参数和至少一个与所述待识别事件的场景相关的预设特征，使用训练好的第一模型，确定所述待识别事件的风险，所述第一模型是使用样本数据的风险关联参数和预设特征训练得到的，不依赖业务经验和专家规则，能够对海量数据进行深度挖掘和定量分析，较为准确地识别待识别事件的风险。

根据本公开实施例，以上多种确定识别事件风险的方法可以单独或结合使用。例如，可以采用以上多种方法，在任一识别结果表明事件为高风险时将该待识别事件确定为高风险，或者，可以在多种识别方法产生的结果均为高风险时将该待识别事件确定为高风险。

根据本公开实施例，该方法还可以包括：

将所述待识别事件加入所述样本数据。

根据本公开实施例提供的技术方案，通过根据所述待识别事件的实际业务处理结果，将所述待识别事件分类为风险事件或非风险事件；将所述待识别事件加入所述样本数据，能够在完成实际业务决策操作后收集反馈结果，这部分数据通过特征工程后作为样本数据用于风险关联参数计算可以进一步提升识别效果。自学习可以使识别效果不会随时间而衰减，反而随时间推移数据不断积累而优化识别效果。

根据本公开实施例，该方法还可以包括：

例如，可以按照不同的时间窗口-特征类型或按照数据来源等预设维度，将特征分为多个类别，获得与所述事件相关的描述信息，基于该些预设维度组织描述信息可以得到解释信息，例如：

根据本公开实施例提供的技术方案，通过在确定所述待识别事件为高风险事件的情况下，基于所述目标特征输出按照预设维度组织与所述事件相关的描述信息而得到的解释信息，能够帮助业务分析人员快速定位案件线索。

根据本公开实施例，该方法还可以包括：

根据本公开实施例，可以将风险识别结果作为强化学习的状态输入；业务上的手段(如：拒绝登陆，要求验证手机号，要求验证人脸等)作为操作列表：将用户体验作为奖励(例如，打投诉电话给予较大惩罚，因安全验证导致用户等待时间较长给予较大惩罚，放过的账户最终发生了风险事件给予较大成大，其余情况给予奖励)。使用这三要素可以训练一个强化学习模型作为决策引擎，在不同状态下判断应该如何做出业务决策。

根据本公开实施例提供的技术方案，通过基于所述待识别事件的风险识别结果，使用训练好的第二模型，确定针对所述待识别事件的业务决策，所述第二模型是使用样本事件的风险识别结果、针对所述样本事件的样本业务决策和针对所述样本事件采取所述样本业务决策后得到的结果训练得到的，能够自动产生决策，避免依赖业务经验并可以减少人工成本。

图4示出根据本公开另一实施例的风险识别方法的流程图。

如图4所示，该风险识别方法可以包括步骤S410～S480。

在步骤S410中，执行数据采集。

在步骤S420中，执行数据清洗与存储。

在步骤S430中，执行样本打标。

步骤S410～S430可以参考上文描述的步骤S110，此处不再展开。

在步骤S440中，执行风险关联参数计算，参考上文描述的步骤S120，例如可以计算参考上文描述的第一风险关联参数及其第一置信度和第二风险关联参数及其第二置信度。

在步骤S450中，执行线上报文风险预测，参考上文描述的步骤S130，对待识别事件进行风险预测。

在步骤S460中，可以根据风险预测结果输出案件线索，以便业务分析人员查找风险原因。

在步骤S470中，可以根据风险预测结果进行决策，例如可以采用强化学习的方式自动输出决策信息。

在步骤S480中，可以等待被预测的事件的反馈数据产生，例如因出现投诉等风险类事件而将其标注为风险事件，或到达指定时间未出现风险类事件而将其标注为非风险事件。反馈数据可以用于更新特征的风险关联参数数据。

根据本公开实施例提供的技术方案，无需大量刻画用户习惯和风险模式的时序特征，即可实现有效的风险识别能力，可使用事件触发的累加器计算指标，通过增量计算方式实现，避免全量扫描，计算复杂度和存储复杂度较低，容易部署，且延时和每秒查询数性能都较好。并且，本公开实施例提供的方法对各维度特征的处理方式是一致的，和业务经验解耦，提高了方法的通用性，具备大规模推广或迁移使用的能力。

图5示出根据本公开的实施例的风险识别装置500的结构框图。其中，该装置可以通过软件、硬件或者两者的结合实现成为电子设备的部分或者全部。

如图5所示，所述风险识别装置500包括获取模块510、第一确定模块520和第二确定模块530。

获取模块510，被配置为获取样本数据以及待识别事件，其中，所述样本数据包括多个事件，每个所述事件与一个或多个特征相关联，所述待识别事件与一个或多个目标特征相关联；

第一确定模块520，被配置为至少基于所述样本数据中与所述目标特征相关联的风险事件的数量和非风险事件的数量，确定所述目标特征的风险关联参数；

第二确定模块530，被配置为基于所述目标特征的风险关联参数，确定所述待识别事件的风险。

根据本公开实施例提供的技术方案，通过获取模块，被配置为获取样本数据以及待识别事件，其中，所述样本数据包括多个事件，每个所述事件与一个或多个特征相关联，所述待识别事件与一个或多个目标特征相关联；第一确定模块，被配置为至少基于所述样本数据中与所述目标特征相关联的风险事件的数量和非风险事件的数量，确定所述目标特征的风险关联参数；第二确定模块，被配置为基于所述目标特征的风险关联参数，确定所述待识别事件的风险，能够较为准确地识别待识别事件的风险。

图6示出根据本公开实施例的获取模块600的结构框图。

如图6所示，所述获取模块600包括第一获取子模块610、第二获取子模块620和第三获取子模块630。

第一获取子模块610，被配置为获取原始数据，所述原始数据包括多个事件以及所述事件是否为风险事件的标识，每个所述事件与一个或多个原始特征相关联；

第二获取子模块620，被配置为基于所述原始特征获取新增特征；

第三获取子模块630，被配置为将所述新增特征与相应事件相关联，并将所述新增特征加入所述原始数据，以获取所述样本数据。

根据本公开实施例提供的技术方案，通过所述获取模块包括：第一获取子模块，被配置为获取原始数据，所述原始数据包括多个事件以及所述事件是否为风险事件的标识，每个所述事件与一个或多个原始特征相关联；第二获取子模块，被配置为基于所述原始特征获取新增特征；第三获取子模块，被配置为将所述新增特征与相应事件相关联，并将所述新增特征加入所述原始数据，以获取所述样本数据，能够基于原始特征挖掘更多的新增特征，可以提升识别风险的准确率。

根据本公开实施例，所述第二获取子模块620可以被配置为：

将多个原始特征组合为新增特征；以及/或者

通过模糊化的方式处理所述原始特征以获取新增特征。

根据本公开实施例提供的技术方案，通过所述第二获取子模块被配置为：将多个原始特征组合为新增特征，以及/或者，通过模糊化的方式处理所述原始特征以获取新增特征，能够基于原始特征挖掘更多的新增特征，可以提升识别风险的准确率。

根据本公开实施例，所述风险关联参数包括第一风险关联参数，所述第一确定模块520可以包括：

根据本公开实施例提供的技术方案，通过所述风险关联参数包括第一风险关联参数，所述第一确定模块包括：第一确定子模块，被配置为基于所述样本数据中与所述目标特征相关联的风险事件的数量和非风险事件的数量，确定所述目标特征的第一风险关联参数，能够较为准确地识别待识别事件的风险。

根据本公开实施例，该装置还可以包括：

根据本公开实施例提供的技术方案，通过第三确定模块，被配置为基于所述样本数据中与所述目标特征相关联的风险事件的数量和非风险事件的数量，确定所述目标特征的第一风险关联参数的第一置信度，其中，所述第二确定模块被配置为基于所述目标特征的第一风险关联参数和所述第一置信度，确定所述待识别事件的风险，能够较为准确地识别待识别事件的风险。

根据本公开实施例，所述风险关联参数包括第二风险关联参数，所述第一确定模块520可以包括：

根据本公开实施例提供的技术方案，通过所述风险关联参数包括第二风险关联参数，所述第一确定模块包括：第二确定子模块，被配置为基于与所述目标特征相关联的风险事件的数量和非风险事件的数量确定筛选条件；第三确定子模块，被配置为基于所述样本数据中满足所述筛选条件的特征数量，确定所述目标特征的第二风险关联参数，能够弥补数据量小而统计方差过大的问题，从而较为准确地识别待识别事件的风险。

根据本公开实施例提供的技术方案，通过所述筛选条件包括第一筛选条件和第二筛选条件，所述第一筛选条件包括风险事件的数量与所述目标特征的风险事件数量的差值为第一预设值且非风险事件的数量与所述目标特征的非风险事件数量的差值为第二预设值，所述第二筛选条件包括风险事件的数量与所述目标特征的风险事件数量的差值为第二预设值且非风险事件的数量与所述目标特征的非风险事件数量的差值为第一预设值；所述第三确定子模块被配置为基于所述样本数据中满足所述第一筛选条件的特征数量和满足所述第二筛选条件的特征数量，确定所述目标特征的第二风险关联参数，能够弥补数据量小而统计方差过大的问题，从而较为准确地识别待识别事件的风险。

根据本公开实施例，该装置500还可以包括：

根据本公开实施例提供的技术方案，通过第四确定模块，被配置为基于所述样本数据中满足所述筛选条件的特征数量，确定所述目标特征的第二风险关联参数的第二置信度，其中，所述第二确定模块被配置为基于所述目标特征的第二风险关联参数和所述第二置信度，确定所述待识别事件的风险，能够较为准确地识别待识别事件的风险。

图7示出根据本公开实施例的第二确定模块700的结构框图。

根据本公开实施例，所述风险关联参数包括第一风险关联参数和第二风险关联参数，如图7所示，所述第二确定模块700包括第四确定子模块710、第五确定子模块720和第六确定子模块730。

第四确定子模块710，被配置为基于所述第一风险关联参数、所述第二风险关联参数、所述第一风险关联参数的第一置信度以及所述第二风险关联参数的第二置信度确定所述目标特征的第一风险概率；

第五确定子模块720，被配置为基于与所述待识别事件相关联的多个目标特征各自的第一风险概率确定所述待识别事件的第二风险概率；

第六确定子模块730，被配置为基于所述待识别事件的第二风险概率，确定所述待识别事件的风险。

根据本公开实施例提供的技术方案，通过所述风险关联参数包括第一风险关联参数和第二风险关联参数，所述第二确定模块包括：第四确定子模块，被配置为基于所述第一风险关联参数、所述第二风险关联参数、所述第一风险关联参数的第一置信度以及所述第二风险关联参数的第二置信度确定所述目标特征的第一风险概率；第五确定子模块，被配置为基于与所述待识别事件相关联的多个目标特征各自的第一风险概率确定所述待识别事件的第二风险概率；第六确定子模块，被配置为基于所述待识别事件的第二风险概率，确定所述待识别事件的风险，能够较为准确地识别待识别事件的风险。

根据本公开实施例，所述第二确定模块530可以包括：

根据本公开实施例提供的技术方案，通过所述第二确定模块包括：第七确定子模块，被配置为基于所述目标特征的风险关联参数和至少一个与所述待识别事件的场景相关的预设特征，使用训练好的第一模型，确定所述待识别事件的风险，所述第一模型是使用样本数据的风险关联参数和预设特征训练得到的，不依赖业务经验和专家规则，能够对海量数据进行深度挖掘和定量分析，较为准确地识别待识别事件的风险。

根据本公开实施例，该装置500还可以包括：

更新模块，被配置为将所述待识别事件加入所述样本数据。

根据本公开实施例提供的技术方案，通过分类模块，被配置为根据所述待识别事件的实际业务处理结果，将所述待识别事件分类为风险事件或非风险事件；更新模块，被配置为将所述待识别事件加入所述样本数据，能够在完成实际业务决策操作后收集反馈结果，这部分数据通过特征工程后作为样本数据用于风险关联参数计算可以进一步提升识别效果。自学习可以使识别效果不会随时间而衰减，反而随时间推移数据不断积累而优化识别效果。

根据本公开实施例，该装置500还可以包括：

根据本公开实施例提供的技术方案，通过输出模块，被配置为在确定所述待识别事件为高风险事件的情况下，基于所述目标特征输出按照预设维度组织与所述事件相关的描述信息而得到的解释信息，能够帮助业务分析人员快速定位案件线索。

根据本公开实施例，该装置500还可以包括：

根据本公开实施例提供的技术方案，通过决策模块，被配置为基于所述待识别事件的风险识别结果，使用训练好的第二模型，确定针对所述待识别事件的业务决策，所述第二模型是使用样本事件的风险识别结果、针对所述样本事件的样本业务决策和针对所述样本事件采取所述样本业务决策后得到的结果训练得到的，能够自动产生决策，避免依赖业务经验并可以减少人工成本。

本公开还公开了一种电子设备，图8示出根据本公开的实施例的电子设备的结构框图。

如图8所示，所述电子设备800包括存储器801和处理器802，其中，所述存储器801用于存储支持电子设备执行上述任一实施例中的信息处理方法或代码生成方法的程序，所述处理器802被配置为用于执行所述存储器801中存储的程序。

根据本公开实施例，所述存储器801用于存储一条或多条计算机指令，其中，所述一条或多条计算机指令被所述处理器802执行以实现以下步骤：

根据本公开实施例，所述获取样本数据，包括：

基于所述原始特征获取新增特征；

根据本公开实施例，所述基于所述原始特征以获取新增特征，包括：

将多个原始特征组合为新增特征；以及/或者

通过模糊化的方式处理所述原始特征以获取新增特征。

根据本公开实施例，所述风险关联参数包括第一风险关联参数，所述至少基于所述样本数据中与所述目标特征相关联的风险事件的数量和非风险事件的数量，确定所述目标特征的风险关联参数，包括：

根据本公开实施例，所述一条或多条计算机指令被所述处理器802执行还用以实现：

根据本公开实施例，所述风险关联参数包括第一风险关联参数和第二风险关联参数，所述基于所述目标特征的风险关联参数，确定所述待识别事件的风险，包括：

将所述待识别事件加入所述样本数据。

如图9所示，计算机系统900包括处理单元901，其可以根据存储在只读存储器(ROM)902中的程序或者从存储部分908加载到随机访问存储器(RAM)903中的程序而执行上述实施例中的各种处理。在RAM 903中，还存储有系统900操作所需的各种程序和数据。处理单元901、ROM902以及RAM 903通过总线904彼此相连。输入/输出(I/O)接口905也连接至总线904。

以下部件连接至I/O接口905：包括键盘、鼠标等的输入部分906；包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分907；包括硬盘等的存储部分908；以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分909。通信部分909经由诸如因特网的网络执行通信处理。驱动器910也根据需要连接至I/O接口905。可拆卸介质911，诸如磁盘、光盘、磁光盘、半导体存储器等等，根据需要安装在驱动器910上，以便于从其上读出的计算机程序根据需要被安装入存储部分908。其中，所述处理单元901可实现为CPU、GPU、TPU、FPGA、NPU等处理单元。

特别地，根据本公开的实施例，上文描述的方法可以被实现为计算机软件程序。例如，本公开的实施例包括一种计算机程序产品，其包括有形地包含在及其可读介质上的计算机程序，所述计算机程序包含用于执行上述方法的程序代码。在这样的实施例中，该计算机程序可以通过通信部分909从网络上被下载和安装，和/或从可拆卸介质911被安装。

附图中的流程图和框图，图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上，流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分，所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意，在有些作为替换的实现中，方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如，两个接连地表示的方框实际上可以基本并行地执行，它们有时也可以按相反的顺序执行，这依所涉及的功能而定。也要注意的是，框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合，可以用执行规定的功能或操作的专用的基于硬件的系统来实现，或者可以用专用硬件与计算机指令的组合来实现。

描述于本公开实施例中所涉及到的单元或模块可以通过软件的方式实现，也可以通过可编程硬件的方式来实现。所描述的单元或模块也可以设置在处理器中，这些单元或模块的名称在某种情况下并不构成对该单元或模块本身的限定。

作为另一方面，本公开还提供了一种计算机可读存储介质，该计算机可读存储介质可以是上述实施例中电子设备或计算机系统中所包含的计算机可读存储介质；也可以是单独存在，未装配入设备中的计算机可读存储介质。计算机可读存储介质存储有一个或者一个以上程序，所述程序被一个或者一个以上的处理器用来执行描述于本公开的方法。

以上描述仅为本公开的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解，本公开中所涉及的发明范围，并不限于上述技术特征的特定组合而成的技术方案，同时也应涵盖在不脱离所述发明构思的情况下，由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本公开中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。

Claims

1.一种风险识别方法，包括：

基于所述目标特征的风险关联参数，确定所述待识别事件的风险，

其中，所述风险关联参数包括第二风险关联参数，所述至少基于所述样本数据中与所述目标特征相关联的风险事件的数量和非风险事件的数量，确定所述目标特征的风险关联参数，包括：

基于所述样本数据中满足所述筛选条件的特征数量，确定所述目标特征的第二风险关联参数；

所述基于所述样本数据中满足所述筛选条件的特征数量，确定所述目标特征的第二风险关联参数，包括基于所述样本数据中满足所述第一筛选条件的特征数量和满足所述第二筛选条件的特征数量，确定所述目标特征的第二风险关联参数。

2.根据权利要求1所述的方法，其特征在于，所述获取样本数据，包括：

基于所述原始特征获取新增特征；

3.根据权利要求2所述的方法，其特征在于，所述基于所述原始特征以获取新增特征，包括：

将多个原始特征组合为新增特征；以及/或者

通过模糊化的方式处理所述原始特征以获取新增特征。

4.根据权利要求1所述的方法，其中，所述风险关联参数包括第一风险关联参数，所述至少基于所述样本数据中与所述目标特征相关联的风险事件的数量和非风险事件的数量，确定所述目标特征的风险关联参数，包括：

5.根据权利要求4所述的方法，还包括：

6.根据权利要求1所述的方法，还包括：

7.根据权利要求4所述的方法，其中，所述基于所述目标特征的风险关联参数，确定所述待识别事件的风险，包括：

基于所述样本数据中与所述目标特征相关联的风险事件的数量和非风险事件的数量，确定所述目标特征的第一风险关联参数的第一置信度；

8.根据权利要求1所述的方法，其中，所述基于所述目标特征的风险关联参数，确定所述待识别事件的风险，包括：

9.根据权利要求1所述的方法，还包括：

将所述待识别事件加入所述样本数据。

10.根据权利要求1所述的方法，还包括：

11.一种风险识别装置，其特征在于，包括：

第二确定模块，被配置为基于所述目标特征的风险关联参数，确定所述待识别事件的风险；

所述风险关联参数包括第二风险关联参数，所述第一确定模块包括：

第三确定子模块，被配置为基于所述样本数据中满足所述筛选条件的特征数量，确定所述目标特征的第二风险关联参数；

12.根据权利要求11所述的装置，其特征在于，所述获取模块包括：

13.根据权利要求12所述的装置，其特征在于，所述第二获取子模块被配置为：

将多个原始特征组合为新增特征；以及/或者

通过模糊化的方式处理所述原始特征以获取新增特征。

14.根据权利要求11所述的装置，其中，所述风险关联参数包括第一风险关联参数，所述第一确定模块包括：

15.根据权利要求14所述的装置，还包括：

16.根据权利要求11所述的装置，还包括：

17.根据权利要求14所述的装置，其中，所述第二确定模块包括：

基于所述样本数据中满足所述筛选条件的特征数量，确定所述目标特征的第二风险关联参数的第二置信度；

18.根据权利要求11所述的装置，其中，所述第二确定模块包括：

19.根据权利要求11所述的装置，还包括：

更新模块，被配置为将所述待识别事件加入所述样本数据。

20.根据权利要求11所述的装置，还包括：

21.一种电子设备，其特征在于，包括存储器和处理器；其中，所述存储器用于存储一条或多条计算机指令，其中，所述一条或多条计算机指令被所述处理器执行以实现权利要求1～10任一项所述的方法步骤。

22.一种可读存储介质，其上存储有计算机指令，其特征在于，该计算机指令被处理器执行时实现权利要求1～10任一项所述的方法步骤。