CN105590055B

CN105590055B - 用于在网络交互系统中识别用户可信行为的方法及装置

Info

Publication number: CN105590055B
Application number: CN201410571967.5A
Authority: CN
Inventors: 黄海; 潘寒冰; 雷鑫
Original assignee: Advanced New Technologies Co Ltd
Current assignee: Advanced New Technologies Co Ltd; Advantageous New Technologies Co Ltd
Priority date: 2014-10-23
Filing date: 2014-10-23
Publication date: 2020-10-20
Anticipated expiration: 2034-10-23
Also published as: HK1224043A1; CN105590055A

Abstract

本申请公开了一种用于在网络交互系统中识别用户可信行为的方法，包括：获取所述网络交互系统中的用户行为数据；采用下述方式中的任意一种识别所述用户行为是否可信：通过判断预先生成的可信数据与所述用户行为数据的比对结果是否符合预先设定的规则，识别所述用户行为是否可信；或者，采用预先生成的可信行为识别模型计算表征所述用户行为可信程度的指标值，通过判断所述指标值是否满足预先设定的可信阈值，识别所述用户行为是否可信。本申请同时提供一种用于在网络交互系统中识别用户可信行为的装置。本申请的技术方案，提供了一种识别用户行为的新思路，仅依赖可信数据和原始行为数据就可以准确、高效地从海量用户行为中识别出大部分可信行为。

Description

用于在网络交互系统中识别用户可信行为的方法及装置

技术领域

本申请涉及用户行为识别领域，具体涉及一种用于在网络交互系统中识别用户可信行为的方法。本申请同时提供一种用于在网络交互系统中识别用户可信行为的装置。

背景技术

随着网络技术和网络应用的飞速发展，互联网逐步渗透到人们生活中的每一个角落，网上购物、网上阅读、网络视频、网络社交等已经成为了人们生活中不可或缺的组成部分。互联网给人带来方便的同时，也给人们增添了信息安全上的困扰，网络安全问题成为人们长期以来关注的焦点问题。

采用传统的身份认证等技术手段虽然可以基本解决网络用户的身份信任问题，但是却无法解决用户网络操作行为的安全问题，例如在网络交易系统中，大部分用户的操作行为都是正常的(通常也称为可信行为)，然而也存在少量黑客或者恶意用户盗用他人账户、盗用他人银行卡等欺诈行为，因此有必要对用户在网络环境中的操作行为进行识别。通过识别，一方面可以通过对可疑行为(通常也称为风险行为)的提前识别避免欺诈行为的发生，另一方面可以对识别出的欺诈行为做出及时的处理，避免合法用户遭受损失、或者尽可能减少损失。

现有技术对网络环境下用户行为的识别通常采用风险识别方式，即：获取与用户行为相关的数据后，基于大量的原始历史行为数据、交易数据、财务数据、账户信息、登录数据、银行卡信息、用户身份信息、历史风险数据、黑名单等数据，对所述用户行为进行全规则覆盖分析和/或采用设定的模型进行打分评估，并根据分析结果和/或打分结果，辨识当前的用户行为是否存在风险。对于在网络交互环境下随机发起的每个用户行为都采用上述方式进行识别，从而从大量用户行为中识别出可能的风险行为。

通过上面的描述可以看出，传统的用户行为识别模式采用的是类似大海捞针式的风险防控模式：从大量的用户行为中识别出少量的、个别的风险行为。由于需要对大量用户行为逐一地进行风险规则分析与模型算法计算，处理过程耗时、处理效率低下，在用户行为规模达到海量级别的一些网络交互系统中(例如：支付宝网络交互平台)，上述用户行为识别方式已经难以满足线上的实时应用需求；此外，由于上述识别方式需要依赖大量的额外数据，增加了整个系统的硬件存储成本；而且这种大海捞针的识别方式识别准确率低下，可能将部分正常操作行为识别为风险行为，一方面会造成对用户的无为打扰，影响用户体验，另一方面为了提高准确率需要人工介入核查，增加人力成本。

发明内容

本申请提供一种用于在网络交互系统中识别用户可信行为的方法，针对对用户行为进行风险识别的传统方式，提出一种用户行为识别的新思路：从可信的角度进行行为识别，从而为高效、准确地进行用户风险行为的监控与识别提供便利。本申请另外提供一种用于在网络交互系统中识别用户可信行为的装置。

本申请提供一种用于在网络交互系统中识别用户可信行为的方法，包括：

获取所述网络交互系统中的用户行为数据；

根据所述用户行为数据，采用下述方式中的任意一种识别所述用户行为是否可信：

通过判断预先生成的可信数据与所述用户行为数据的比对结果是否符合预先设定的规则，识别所述用户行为是否可信；所述可信数据是指，从网络交互系统的用户历史行为数据中提取的能够反映用户常规行为规律的数据；

或者，

采用预先生成的可信行为识别模型计算表征所述用户行为可信程度的指标值，通过判断所述指标值是否满足预先设定的可信阈值，识别所述用户行为是否可信。

可选的，在所述通过判断预先生成的可信数据与所述用户行为数据的比对结果是否符合预先设定的规则，识别所述用户行为是否可信的步骤之前或者之后，执行所述采用预先生成的可信行为识别模型识别所述用户行为是否可信的步骤；

相应的，采用上述两种方式分别识别所述用户行为是否可信后，执行下述操作：

采用预先设置的策略，根据上述两种识别方式的识别结果，综合判断所述用户行为是否可信。

可选的，采用以下两种方式获取所述网络交互系统中的用户行为数据：

通过同步事件触发的方式，获取所述网络交互系统中的用户行为数据；

或者，

通过接收异步事件通知的方式，获取所述网络交互系统中的用户行为数据。

可选的，当所述网络交互系统为在线交易系统时，所述网络交互系统中的用户行为数据包括：账户信息、发起所述用户行为的客户端IP地址、发起所述用户行为的客户端MAC地址、发起所述用户行为的移动终端号码、所述用户行为涉及的银行卡号、交易金额、和/或交易类别。

可选的，采用判断预先生成的可信数据与所述用户行为数据的比对结果是否符合预先设定的规则来识别所述用户行为是否可信时，在完成所述识别操作后，将所述用户行为数据存储到数据仓库中。

可选的，采用如下方式预先生成所述可信数据：

对所述数据仓库中存储的用户行为数据，进行分类、筛选、统计；

将经过上述处理得到的用户行为数据与预先设置的可信条件进行比对，如果满足所述可信条件的要求，则生成与所述用户行为数据涉及的主体相关联的可信数据；

所述可信数据包括：主体类型、主体值、可信数据项类型、可信数据项值、有效时间、可信等级、以及对应的规则标识；

当所述网络交互系统为在线交易系统时，所述主体类型为账户或者银行卡，所述主体值为对应的账户号码或者银行卡号。

可选的，所述预先生成所述可信数据的步骤还包括：

将已有的可信数据、采用上述步骤生成的可信数据、以及人工维护生成的可信数据合并；

从合并后的可信数据中，剔除过期的以及被确认为不可信的数据，得到可用于可信行为识别的可信数据。

可选的，将采用上述方式预先生成的可信数据存储在采用MySQL数据库技术构建的数据中心，该数据中心依据以可信数据的主体类型和主体值为输入执行高可靠哈希操作得到的哈希值，对所述可信数据采用分库分表的形式存储。

可选的，所述通过判断预先生成的可信数据与所述用户行为数据的比对结果是否符合预先设定的规则，识别所述用户行为是否可信，包括：

根据所述用户行为数据涉及的主体类型和主体值，从所述数据中心提取与所述主体相关联的可信数据；

将已提取的可信数据中的可信数据项值，与所述用户行为数据中的相应数据进行比对，获取所述用户行为的可信级别；

根据所述已提取的可信数据中的规则标识，获取预先设定的可信规则；

判断所述可信级别是否符合所述可信规则的要求；若符合，则判定所述用户行为可信。

可选的，所述可信规则是通过Java动态编译的方式注入的；所述判断所述可信级别是否符合所述可信规则的要求，是通过groovy技术进行动态构建以及比较来实现的。

可选的，当采用预先生成的可信行为识别模型计算表征所述用户行为可信程度的指标值，通过判断所述指标值是否满足预先设定的可信阈值来识别所述用户行为是否可信时，所述可信行为识别模型是指朴素贝叶斯模型，所述表征所述用户行为可信程度的指标值是指，所述用户行为是可信行为的概率值；

相应的，所述模型通过如下步骤训练生成：

选择与识别用户行为相关的属性特征；

针对每个属性特征的取值范围进行划分，并为每个范围设定一个特征值；

从所述网络交互系统的历史行为数据中获取可信行为数据和不可信行为数据组成训练样本集合；

计算可信行为和不可信行为在训练样本集合中出现的概率、以及每个属性特征划分对应的特征值在可信行为样本和不可信行为样本中出现的条件概率，所述朴素贝叶斯模型训练完毕。

可选的，所述采用预先生成的可信行为识别模型计算表征所述用户行为可信程度的指标值，通过判断所述指标值是否满足预先设定的可信阈值，识别所述用户行为是否可信，包括：

根据所述用户行为数据中的相应属性特征值，采用预先训练好的朴素贝叶斯模型，计算所述用户行为是可信行为的概率值；

判断所述概率值是否大于所述预先设定的可信阈值，若是，则判定所述用户行为可信。

根据所述用户行为数据中的相应属性特征值，采用基于所述朴素贝叶斯模型的改进算法robinson-fisher算法，计算所述用户行为是可信行为的概率值；

可选的，当所述网络交互系统为在线交易系统时，所述属性特征包括：交易金额、时间、键盘行为特征、和/或商品名称；所述键盘行为特征是指执行所述用户行为时键盘按键从被按下到被松开的平均时间。

可选的，当对所述用户行为的最终识别结果为“不可信”时，执行下述操作：

识别所述用户行为是否为风险行为。

可选的，所述识别所述用户行为是否为风险行为是指，采用预先生成的风险行为模型和/或预先设定的风险行为规则进行识别。

相应的，本申请还提供一种用于在网络交互系统中识别用户可信行为的装置，包括：

行为数据获取单元，用于获取所述网络交互系统中的用户行为数据；

识别方式触发单元，用于触发下述单元中的任意一个识别所述用户行为是否可信；

规则分析识别单元，用于通过判断预先生成的可信数据与所述用户行为数据的比对结果是否符合预先设定的规则，识别所述用户行为是否可信；

模型分析识别单元，用于根据所述用户行为数据，采用预先生成的可信行为识别模型计算表征所述用户行为可信程度的指标值，通过判断所述指标值是否满足预先设定的可信阈值，识别所述用户行为是否可信。

可选的，所述识别方式触发单元在触发所述规则分析识别单元工作之前或者之后，触发所述模型分析识别单元工作；

相应的，所述装置还包括：

识别结果合并单元，用于采用预先设置的策略，根据所述规则分析识别单元和所述模型分析识别单元输出的识别结果，综合判断所述用户行为是否可信。

可选的，所述行为数据获取单元具体用于通过同步事件触发的方式，获取所述网络交互系统中的用户行为数据；或者，通过接收异步事件通知的方式，获取所述网络交互系统中的用户行为数据。

可选的，如果所述识别方式触发单元触发所述规则分析识别单元工作，所述装置还包括：

数据存储单元，用于当所述规则分析识别单元完成所述识别操作后，将所述用户行为数据存储到数据仓库中。

可选的，所述装置包括：

可信数据生成单元，用于预先生成所述可信数据；

所述可信数据生成单元包括：

行为数据清洗子单元，用于对所述数据仓库中存储的用户行为数据，进行分类、筛选、统计；

数据生成执行子单元，用于将所述行为数据清洗子单元处理得到的用户行为数据与预先设置的可信条件进行比对，如果满足所述可信条件的要求，则生成与所述用户行为数据涉及的主体相关联的可信数据。

可选的，所述可信数据生成单元还包括：

可信数据合并子单元，用于将已有的可信数据、采用上述步骤生成的可信数据、以及人工维护生成的可信数据合并；

可信数据剔除子单元，用于从合并后的可信数据中，剔除过期的以及被确认为不可信的数据，得到可用于可信行为识别的可信数据。

可选的，可信数据生成单元还包括：

可信数据存储子单元，用于将已生成的可信数据存储在采用MySQL数据库技术构建的数据中心，该数据中心依据以可信数据的主体类型和主体值为输入执行高可靠哈希操作得到的哈希值，对所述可信数据采用分库分表的形式存储。

可选的，所述规则分析识别单元包括：

可信数据提取子单元，用于根据所述用户行为数据涉及的主体类型和主体值，从所述数据中心提取与所述主体相关联的可信数据；

可信数据比对子单元，用于将已提取的可信数据中的可信数据项值，与所述用户行为数据中的相应数据进行比对，获取所述用户行为的可信级别；

可信规则获取子单元，用于根据所述已提取的可信数据中的规则标识，获取预先设定的可信规则；

可信规则判断子单元，用于判断所述可信级别是否符合所述可信规则的要求；若符合，则判定所述用户行为可信。

可选的，所述规则分析识别单元中采用的可信规则是通过Java动态编译的方式注入的；所述可信规则判断子单元具体用于通过groovy技术进行动态构建以及比较来判断所述可信级别是否符合所述可信规则的要求。

可选的，如果所述识别方式触发单元触发所述模型分析识别单元工作，所述模型分析识别单元采用的可信行为识别模型是指朴素贝叶斯模型，所述表征所述用户行为可信程度的指标值是指，所述用户行为是可信行为的概率值；

相应的，所述装置包括：模型训练生成单元，用于训练所述朴素贝叶斯模型；所述模型训练生成单元包括：

属性特征选择子单元，用于选择与识别用户行为相关的属性特征；

特征值划分子单元，用于针对每个属性特征的取值范围进行划分，并为每个范围设定一个特征值；

训练样本获取子单元，用于从所述网络交互系统的历史行为数据中获取可信行为数据和不可信行为数据组成训练样本集合；

训练计算子单元，用于计算可信行为和不可信行为在训练样本集合中出现的概率、以及每个属性特征划分对应的特征值在可信行为样本和不可信行为样本中出现的条件概率。

可选的，所述模型分析识别单元包括：

第一概率值计算子单元，用于根据所述用户行为数据中的相应属性特征值，采用预先训练好的朴素贝叶斯模型，计算所述用户行为是可信行为的概率值；

概率值判断子单元，用于判断所述概率值是否大于所述预先设定的可信阈值，若是，则判定所述用户行为可信。

可选的，所述模型分析识别单元包括：

第二概率值计算子单元，用于根据所述用户行为数据中的相应属性特征值，采用基于所述朴素贝叶斯模型的改进算法robinson-fisher算法，计算所述用户行为是可信行为的概率值；

可选的，所述装置包括：

风险行为识别单元，用于当对所述用户行为的最终识别结果为“不可信”时，识别所述用户行为是否为风险行为。

可选的，所述风险行为识别单元具体用于，采用预先生成的风险行为模型和/或预先设定的风险行为规则识别所述用户行为是否为风险行为。

与现有技术相比，本申请具有以下优点:

本申请提供的用于在网络交互系统中识别用户可信行为的方法，在获取网络交互系统中的用户行为数据后，通过与可信数据和预先设定的规则比对、或者采用预先生成的可信行为识别模型，识别所述用户行为是否可信。本申请的技术方案，提供了一种识别用户行为的新思路，摒弃了在海量用户行为中识别风险行为的传统做法，仅依赖可信数据和原始行为数据就可以准确、高效地从海量用户行为中识别出大部分可信行为。特别是在本方法的基础上进行用户行为的风险监控和拦截，由于不可信用户行为(风险行为)的范围已经大幅减少，从而可以有效提高风险行为监控的执行效率和识别准确率，减少硬件存储和人工介入核查的成本。

附图说明

图1是本申请的一种用于在网络交互系统中识别用户可信行为的方法实施例的流程图。

图2是本实施例提供的生成可信数据的处理流程图；

图3是本实施例提供的可信数据模型示意图；

图4是本实施例提供的通过人工维护方式添加可信数据的图形化界面的示意图；

图5是本实施例提供的Hash散列测试结果示意图；

图6是本实施例提供的朴素贝叶斯模型的训练过程的流程图；

图7是本实施例提供的基于可信数据和规则识别用户行为是否可信的处理流程图；

图8是本申请的一种用于在网络交互系统中识别用户可信行为的装置实施例的示意图。

具体实施方式

在下面的描述中阐述了很多具体细节以便于充分理解本申请。但是本申请能够以很多不同于在此描述的其它方式来实施，本领域技术人员可以在不违背本申请内涵的情况下做类似推广，因此本申请不受下面公开的具体实施的限制。

在本申请中，分别提供了一种用于在网络交互系统中识别用户可信行为的方法，以及一种用于在网络交互系统中识别用户可信行为的装置，在下面的实施例中逐一进行详细说明。

请参考图1，其为本申请的一种用于在网络交互系统中识别用户可信行为的方法实施例的流程图。所述方法包括如下步骤：

步骤101：预先生成用于可信行为识别的可信数据。

本申请的技术方案根据获取的网络交互系统中的用户行为数据，通过与可信数据和规则比对、或者采用可信行为识别模型，识别所述用户行为是否可信，从而可以从海量用户行为中高效、准确地识别出大部分的可信行为。

本申请所述的网络交互系统是指，用户使用个人电脑或者移动终端等客户端设备安装的浏览器或者客户端软件，以网络介质为依托，通过登录、提交表单、点击链接等方式访问网络服务器提供的各种网页资源、或者完成特定事务操作(例如：下单、支付等)的系统。例如，淘宝在线交易平台就属于网络交互系统，该系统可以向用户推荐卖家的各种商品，用户则可以浏览、选择或者下单购买自己感兴趣的商品。

本申请所述的可信行为，通常是指用户在所述网络交互系统中执行的常规的、安全的行为，不会损害其他合法用户的利益、也不会对网络交互系统产生危害的行为。例如：支付宝账户在登录后，执行支付操作时使用的是该账户长期使用的某个固定的银行卡号，则该支付行为可以认为是可信的；如果使用了未曾使用过的银行卡号，则存在盗用银行卡的可能性，从而不能认定该支付行为是可信的，需要进行进一步的风险排查。

相应的，本申请所述的可信数据是指，通过对网络交互系统中的用户历史行为数据的分析、统计，按照一定的策略从中提取的能够反映用户常规行为规律的数据，通过将用户行为数据与这些数据比对，可以反映用户行为是否可信、以及可信程度。

为了能够准确地描述所述可信数据，本实施例构建了可信数据模型，该模型包括主体和围绕所述主体的关联客体。所述主体是指用户行为数据所涉及的核心属性特征，所述客体是指与特定主体相关联的、所述用户行为数据中的其他属性特征。为了便于在不同的应用场景下，对所述主体和客体进行扩展和维护，可以采用“类型+值”的方式定义所述主体和客体，其中类型用于区分主体或者客体的不同类别。

例如，如果将本申请的技术方案用于在线交易系统中(请参见附图3，其为在线交易系统中的可信数据模型示意图)，所述主体类型可以是账户或者银行卡，所述主体值为对应的账户号码或者银行卡号；所述客体类型(即：本申请所述的可信数据项类型)可以是IP地址(或IP地址前三段)、MAC地址、移动终端号码、或者TID标识(GPRS中用于隧道协议的隧道标识)等，所述客体值(即：本申请所述的可信数据项值)为与客体类型对应的具体数值。

基于上述可信数据模型，并兼顾考虑具体应用中的可扩展性等需求，本实施例定义可信数据包括以下内容：主体类型、主体值、可信数据项类型、可信数据项值、有效时间、可信等级、以及对应的规则标识。其中，有效时间为可信数据可用于识别用户行为的时间区间；可信等级表征可信数据的可信程度(例如：取值1-5，1代表的可信级别最高，5代表的可信级别最低)；规则标识用于表示与可信数据对应的可信规则，只有当用户行为数据与可信数据的比对结果满足该可信规则的要求时，才能判定所述用户行为可信。

本申请的技术方案提供了两种识别用户行为是否可信的方式，其中一种是通过判断预先生成的可信数据与所述用户行为数据的比对结果是否符合相应规则，识别所述用户行为是否可信。为了实现这一功能，需要预先生成所述可信数据，具体过程包括如下所述的步骤101-1至步骤101-4，下面结合附图2对该过程作详细说明。

步骤101-1：对数据仓库中存储的用户行为数据，进行分类、筛选、统计。

在网络交互系统中，每天都会生成大量的用户行为数据，其中的数据可以是通过在客户端埋设打点代码的方式获取的，也可能是通过提交表单的方式上报的，当然也可以是采用其他方式采集的，这些数据通常会在网络交互系统的服务器一端被存储下来。

本步骤对已存储的用户行为数据(也称为历史行为数据)，进行分类、筛选、统计等处理过程，生成符合要求的特定格式的用户行为数据，这个过程通常也可以称为“数据清洗”过程。例如在本实施例的一个具体例子中，本申请的技术方案应用于在线交易系统中，该系统中的用户历史行为数据存储在数据仓库中，在本步骤中采用预先设定的数据清洗模型，对数据仓库中存储的用户行为数据进行清洗，得到符合要求的特定格式的用户行为数据，例如：每个账户使用固定IP地址(或者IP地址前三段)在最近10天之内的交易总金额。

在上述具体例子中，用户历史行为数据存储在数据仓库中，在其他实施方式中，用户历史行为数据也可以以其它形式存储，例如，以日志文件的形式存储在日志服务器上，或者存储在用户行为数据库中，这些实施方式的变更，都不偏离本申请的核心，都在本申请的保护范围内。

步骤101-2：将经过上述处理得到的用户行为数据与预先设置的可信条件进行比对，如果满足所述可信条件的要求，则生成与所述用户行为数据涉及的主体相关联的可信数据。

通过步骤101-1的处理，已经生成了特定格式的用户行为数据，在本步骤将所述数据与预先设置的可信条件进行比对，然后根据比对结果决定是否生成可信数据、以及生成相应的可信数据。

在本实施例的上述具体例子中，预先设置的可信条件包括：某个账户使用固定IP地址(或IP地址前三段)在最近10天内的交易金额大于或者等于2万元，如果在上个步骤的数据清洗中获取的某特定账户用户使用某固定IP地址(或IP地址前三段)在最近10天内的交易总金额数为5万元，也就是说满足了预先设置的可信条件，则可以生成与该用户行为数据涉及的主体相关联的可信数据，即：生成与所述特定账户相关联的可信数据，具体说包括以下信息：

主体类型：账户

主体值：所述特定账户的号码

可信数据项类型：IP地址前三段

可信数据项值：所述固定IP地址前三段的具体值

有效时间：两年

可信等级：3级

规则标识：rules_001

上述具体例子中给出的可信数据的生成过程和可信数据包括的具体信息都是示意性的，在具体实施过程中，预先设置的可信条件可能更为复杂，与可信数据相关联的主体类型可以不是账户而是银行卡或者其它主体，生成的可信数据项类型也可以不是IP地址，而是MAC地址或者其他客体类型，所述可信等级和规则标识也可以根据可信条件的严格程度以及具体应用的需求，指定不同的数值或者对应不同的规则，这些都只是具体实施方式的变更，都不偏离本申请的核心。

步骤101-3：将已有的可信数据、采用上述步骤生成的可信数据、以及人工维护生成的可信数据合并。

由于每天在网络交互系统中都会有新的用户行为数据生成，因此可信数据的生成通常不是一次性完成的，而是一个不断补充、不断更新的过程。在本实施例的上述具体例子中，定期(例如每天)通过步骤101-1和101-2生成新的可信数据，并在本步骤将已有的可信数据与新生成的可信数据合并，得到全量可信数据。

虽然通过定期的数据清洗过程自动生成可信数据可以满足大部分的应用需求，但是作为一种完善的实施方式，本实施例还提供一种可信数据的生成方式：人工维护方式。在本实施例的上述例子中，对于某些特殊的账户(例如VIP账户)，其访问网络交互系统使用预先绑定的IP地址，在这种情况下，就可以通过图形化的可视界面，将包含该账户信息和相关联的IP地址信息的可信数据直接添加到全量可信数据中。请参见附图4，其为本实施例提供的通过人工维护方式添加可信数据的图形化界面的示意图。

步骤101-4：从合并后的可信数据中，剔除过期的以及被确认为不可信的数据，得到可用于可信行为识别的可信数据。

因为访问网络交互系统的用户行为并不是一成不变的，生成的可信数据可能仅在一段时间内是有意义的，为了节省不必要的可信数据对存储空间的占用，通常可以为生成的可信数据指定有效时间，对于超出有效时间的可信数据进行物理删除，从而节省对存储空间的占用。在本实施例的上述具体例子中，包含账户和与之关联的IP地址的可信数据的有效时间缺省设置为两年。

此外，对于某些通过其他方式确认的不可信的数据，也应该从步骤101-3生成的全量可信数据中剔出。在本实施例的上述具体例子中，在本步骤读取在线交易系统中最近发生的欺诈案件的相关数据，并对所述数据进行分析，如果通过该欺诈案件的相关数据能够判断出某些原本认为可信的数据不再可信，则将这部分可信数据剔除。

至此得到的可信数据可以存储在数据库(以下称为可信数据库)中，通过定期执行步骤101-1至步骤101-4，不断地将通过数据清洗自动生成的、以及人工维护生成的可信数据添加或者更新到可信数据库中，将过期的以及不再可信的数据从所述可信数据库中剔出，从而保证可信数据库中维护了相对准确的、最新的全量可信数据，供在线识别用户可信行为时使用(请参见步骤104中的相关说明)。

考虑到，在对海量用户行为进行识别时，需要频繁访问可信数据库，为了保证可信数据库在频繁访问中保持稳定的可用性，本实施例的上述具体例子中，采用了这样一种优选实施方式：以可信数据的“主体类型+主体值”为输入调用高可靠哈希函数(murmurhash2算法)，并将得到的Hash值作为ID键值前缀，利用TDDL(分库分表)存储技术将可信数据存储在采用MySQL数据库技术构建的数据中心，例如：分库规则为Hash值对100取余，分表规则为Hash值对1000取余。

采用高可靠哈希函数，可以尽量减少哈希碰撞的几率，避免对不同可信数据的访问涉及相同的数据库存储单元；利用根据“主体类型+主体值”得到的Hash值作为分库分表存储的键值前缀，不仅便于每次查询时快速定位到可信数据所在的库和表，而且通过测试表明，采用上述方式存储可信数据，可以尽量避免出现数据热点，使可信数据相对均匀地分布在数据库和表中，从而可以对本申请技术方案所需的海量数据查询与存储提供高效的支持。

请参看附图5，其为本实施例提供的Hash散列测试结果示意图，其中横坐标为Hash算法生成的ID键值前缀，纵坐标为对应的可信数据数量。从该图可以看出可信数据的分布是基本均匀的，只有少数偏离大于1％，最大偏离小于3％。

上面步骤101-1至101-4，描述了预先生成可信数据的基本过程。通过该过程，自动进行用户行为数据沉淀、定期进行数据清洗，从而实现了用户行为数据的自学习过程，并自动生成了可信数据，为步骤103在线进行用户可信行为的识别做好准备。

步骤102：预先生成可信行为识别模型。

本申请的技术方案还提供了另外一种识别用户行为是否可信的方式：采用预先生成的可信行为识别模型计算表征所述用户行为可信程度的指标值，通过判断所述指标值是否满足预先设定的可信阈值，识别所述用户行为是否可信。

为了实现上述方式，需要执行本步骤预先生成所述可信行为识别模型。本实施例采用朴素贝叶斯模型作为可信行为识别模型，表征所述用户行为可信程度的指标值是指，所述用户行为是可信行为的概率值。

所述朴素贝叶斯模型通过如下步骤102-1至102-4训练生成，下面结合附图6进行相关说明。

步骤102-1：选择与识别用户行为相关的属性特征。

每条用户行为数据中通常包括多种属性特征，本步骤通过对用户历史行为数据的分析，从中选取与识别用户行为相关的(或者关系比较密切的)属性特征。例如，在本实施例的上述具体例子中，所述网络交互系统为在线交易系统，在这种情况下可以选择的属性特征包括：交易金额、时间、键盘行为特征、和/或商品名称等，其中键盘行为特征是指执行所述用户行为时键盘按键从被按下到被松开的平均时间。

步骤102-2：针对每个属性特征的取值范围进行划分，并为每个范围设定一个特征值。

本步骤将属性特征的连续取值进行离散化，即：针对每个属性特征的取值范围进行划分，并为每个范围设定一个特征值(也称为token)，这样在线计算时，可以将用户行为数据中的具体属性特征的当前值映射为对应的token值。

例如，对于交易金额这一属性特征来说，可以将[0元-100元]映射token为1，[100元-500元]映射为2，…以此类推。采取这种映射方式，一方面便于利用模型进行计算，此外也可以大量减少线下训练和线上计算的数据存储成本和网络I/O流量。

步骤102-3：从所述网络交互系统的历史行为数据中获取可信行为数据和不可信行为数据组成训练样本集合。

朴素贝叶斯模型是用于对待分类项进行分类的传统方法，其基本思想是这样的：对于给出的待分类项，求解在此项出现的条件下各个目标类别出现的概率，并认为待分类项属于概率值最大的目标类别。为了在线阶段进行概率的计算，需要在训练阶段获取各个目标类别的数据组成训练样本集合。

具体到本实施例，就是从网络交互系统的历史行为数据中获取可信行为数据和不可信行为数据组成训练样本集合。

步骤102-4：计算可信行为和不可信行为在训练样本集合中出现的概率、以及每个属性特征划分对应的特征值在可信行为样本和不可信行为样本中出现的条件概率，所述朴素贝叶斯模型训练完毕。

在线计算过程中，需要用到上面所述的各种概率以及条件概率值(参见步骤105的相关说明)，因此在训练阶段预先计算出这部分数据，就完成了朴素贝叶斯模型的训练过程。由于朴素贝叶斯模型属于比较成熟的现有技术，因此不再对该过程做进一步的详细描述。

步骤103：获取所述网络交互系统中的用户行为数据。

用户在网络交互系统中执行的具体操作行为不同，对应的用户行为数据包含的信息也就不同。以在线交易系统为例，用户行为数据可以包括以下信息：账户信息、发起所述用户行为的客户端IP地址、发起所述用户行为的客户端MAC地址、发起所述用户行为的移动终端号码、所述用户行为涉及的银行卡号、交易金额、和/或交易类别。

为了对用户行为进行识别，需要先获取与用户行为相关的数据，即：用户行为数据。在不同的应用场景下，以及针对不同的用户行为，可以采取不同的方式获取所述用户行为数据，例如：可以采用同步事件触发的方式或者通过接收异步事件通知的方式。

所述同步事件触发方式是指，需要识别用户行为是否可信的请求方，将用户行为数据传递给负责进行用户行为识别的软件模块，所述软件模块完成识别操作及其他必要处理后将结果返回给所述请求方，所述请求方根据接收的结果决定是否允许用户继续执行后续的操作；所述异步事件通知是指，需要识别用户行为是否可信的请求方，将用户行为数据传递给负责进行用户行为识别的软件模块后，不等待识别结果的返回，而是允许用户继续执行后续的操作，所述软件模块完成可信识别操作后，根据识别结果决定是否需要对用户行为进行进一步的监控或处理。在具体实施过程中，通常采用函数调用或者类似方式实现所述同步事件触发，采用消息机制或者类似方式实现所述异步事件通知。

在本实施例的上述具体例子中，对于涉及资金流动的用户行为(例如：支付行为)采用同步事件触发方式获取用户行为数据并进行处理，可以有效避免不可信行为给合法用户带来经济上的损失，对于不涉及资金流动的用户行为(例如：用户登录行为)则采用异步事件通知方式。当然，在其他实施方式中，可以根据具体的应用需求，采用不同于上述的其他方式获取用户行为数据。

步骤104：通过判断预先生成的可信数据与所述用户行为数据的比对结果是否符合预先设定的规则，识别所述用户行为是否可信。

本步骤基于预先生成的可信数据和预先设定的规则识别所述用户行为是否可信，该处理过程包括步骤104-1至步骤104-4，下面结合附图7做详细说明。

步骤104-1：根据所述用户行为数据涉及的主体类型和主体值，从所述数据中心提取与所述主体相关联的可信数据。

在步骤101中已经预先生成了用于行为识别的可信数据，并存储在可信数据库中，本步骤根据所述用户行为数据涉及的主体类型和主体值，从中提取相关的可信数据，为后续步骤的比对操作做好准备。

在本实施例的上述具体例子中，通过自学习过程生成的可信数据存储在采用分库分表存储的MySQL数据中心，可以通过用户行为数据涉及的“主体类型+主体值”做高可靠哈希得到的Hash值作为ID键值前缀，按照分库分表规则，找到对应的数据库及具体的表，然后从所述表中查询与所述用户行为的主体相关联的可信数据。

由于在步骤101中预先生成了专门用于用户行为识别的可信数据，因此在本步骤中可以一次性获取与所述用户行为的主体相关联的所有可信数据，从而可以减少对数据库的操作，不仅可以提高执行效率，也可以避免数据库因为负载过大而无法提供正常的服务。

步骤104-2：将已提取的可信数据中的可信数据项值，与所述用户行为数据中的相应数据进行比对，获取所述用户行为的可信级别。

每一条可信数据包括以下内容：主体类型、主体值、可信数据项类型、可信数据项值、有效时间、可信等级、以及对应的规则标识。本步骤根据可信数据项类型从所述用户行为数据中提取相应数据，并将该数据与可信数据项值进行比对。

例如，已获取的某条可信数据项类型为“IP地址”，则从所述用户行为数据中提取具体的IP地址数据，比较可信数据项的值与所述IP地址数据是否一致，若一致，获取本条可信数据的可信等级。如果可信数据项类型为“IP地址前三段”，则只需要将可信数据项的值与用户行为数据中的IP地址前三段的具体数据进行比较即可。

步骤104-3：根据所述已提取的可信数据中的规则标识，获取预先设定的可信规则。

在步骤104-2中已经进行了用户行为数据与可信数据的比对，但是还不能直接根据比对结果判定用户行为是否可信，还需要依据预先设定的规则(也称为可信规则)进行进一步的匹配。本步骤根据已提取的可信数据中的规则标识，获取预先设定的可信规则。

所述可信规则定义了针对特定的可信数据项类型，其可信级别应该满足的要求。所述预先设定的可信规则可以存储在数据库中，也可以以数据文件、excel数据表格等其他形式存储。

步骤104-4：判断所述可信级别是否符合所述可信规则的要求；若符合，则判定所述用户行为可信。

判断步骤104-2中通过与可信数据比对获取的可信级别，与所述可信规则定义的相应可信数据项类型应该满足的级别要求，是否相符，若符合，则判定所述用户行为是可信的。

例如：预先设定可信等级为1的可信度最高，可信等级为5的可信度最低，在步骤104-2中根据IP地址前三段的比对获取的可信级别是4级，而可信规则定义IP地址前三段对应的可信级别应该为3级以上(即：3级、2级或者1级)，则不能判定所述用户行为可信；如果可信规则定义的IP地址前三段对应的可信级别应该为4级以上，则判定所述用户行为可信。

如果在步骤104-2中与可信数据的比对结果不一致，则不能判断用户行为是可信的。这种情况下可以跳过获取可信规则以及判断与可信规则是否相符的步骤。

如果所述用户行为数据涉及两种或者两种以上的主体，则可以从可信数据库中分别提取与每个主体相关联的可信数据，并采用步骤104-2至步骤104-4同样的方法进行比对判断；如果从可信数据库提取的与某个主体关联的可信数据有多条，同样针对每条可信数据按照步骤104-2至步骤104-4进行比对判断。如果上述进行的多次比对判断结果不同，可以采取自定义的策略进行处理，例如，只要其中有一次的结论为用户行为可信，则判定用户行为可信；或者依据每次比对得到的可信级别分别进行打分，并用简单求和或者加权求和的方式计算总分，当总分大于预先设定的阈值时判定所述用户行为可信。

如上面所述的识别过程，采用了两级判别模式，即：首先将用户行为数据与可信数据进行比对，然后还要判断比对得到的可信级别与可信规则的要求是否相符。采用这种方式比较灵活、易于扩展，采用同样的可信数据，在不同的应用场景下，通过调整或者修改可信规则，就可以达到采用相对宽松或者相对严格的方式识别用户可信行为的目的。在具体实施中，如果将可信规则的要求设置为最低等级，就可以实现仅通过可信数据的比对识别用户可信行为的技术方案，非常灵活方便。

上面介绍了基于可信数据和可信规则识别用户可信行为的主要处理流程，在具体实施中，可以自行编写代码实现上述基于规则匹配识别用户可信行为的功能，也可以采用规则引擎来实现。

所述规则引擎是由推理引擎发展而来，是一种嵌入在应用程序中的组件，实现了将业务决策从应用程序代码中分离出来，并使用预定义的语义模块编写业务决策。其基本处理流程是这样的：接受数据输入，解释业务规则，并根据业务规则做出业务决策。采用规则引擎可以减少软件开发的工作量。

在本实施例的上述具体例子中，采用规则引擎实现本步骤104的功能，其中可信规则是通过可视化的界面，采用java动态编译的方式注入到规则引擎的，采用这种方式，便于对可信规则的实时更新与维护，可以针对不同的业务场景配置不同的规则，例如，增加更加具有针对性的可信规则、或者使可信规则更细粒度化，有效提高在不同业务场景下的识别准确率。在规则引擎中判断可信级别是否与对应的可信规则相符时，采用了groovy技术动态构建比较左值(即：比对得到的可信级别)、比较运算符、以及与具体的可信规则的级别要求进行比较。

在其他实施方式中，可以采用不同于上述具体例子的其他实施方式，只要是基于可信数据和可信规则的比对进行用户可信行为的识别，就都不偏离本申请的核心，都在本申请的保护范围之内。

在完成本步骤的识别操作后，将所述用户行为数据存储到数据仓库中，以便所述用户行为数据能够参与到可信数据的自动学习与生成过程中。

步骤105：采用预先生成的可信行为识别模型计算表征所述用户行为可信程度的指标值，通过判断所述指标值是否满足预先设定的可信阈值，识别所述用户行为是否可信。

本实施例在步骤104的基础上，还要采用预先生成的可信行为识别模型，进行用户可信行为的识别，从而保证识别结果更为准确。本实施例采用朴素贝叶斯模型作为可信行为识别模型，表征所述用户行为可信程度的指标值是指，所述用户行为是可信行为的概率值。具体的识别过程，包括计算所述用户行为是可信行为的概率值，以及根据概率值进行判断这两个过程，下面分别说明。

首先，根据所述用户行为数据中的相应属性特征值，采用预先训练好的朴素贝叶斯模型，计算所述用户行为是可信行为的概率值。下面给出的公式1是朴素贝叶斯模型的计算公式，其中x是待分类项(即：用户行为数据中的各个具体的属性特征)，y_i是目标类别(即：用户行为是可信行为)，由于朴素贝叶斯模型假定各个属性特征是条件独立的，因此P(x|y_i)P(y_i)可以转换为下面公式2的形式，其中P(a_j|y_i)是x中的第j个属性特征划分对应的特征值出现在可信行为样本中的概率。

---------公式1

-----公式2

由于在所述可信行为识别模型的训练过程中已经计算出了可信行为在训练样本集合中出现的概率(P(y_i))、以及每个属性特征划分对应的特征值在可信行为样本中出现的条件概率(P(a_j|y_i))，因此在本步骤中可以根据所述用户行为数据中的相应属性特征划分对应的特征值(即：属性特征值)，将上述相应数值代入公式1和公式2，而P(x)通常也是固定值，因此可以计算出所述用户行为是可信行为的概率值。

然后，判断计算得到的概率值是否大于预先设定的可信阈值，若是，则判定所述用户行为可信。

上面介绍了采用朴素贝叶斯算法识别用户可信行为的基本过程，在具体实施过程中，为了提高计算的精度，也可以采用基于所述朴素贝叶斯模型的改进算法robinson-fisher算法，计算所述用户行为是可信行为的概率值，具体说包括以下4个过程：

1)将公式2中的P(a_j|y_i)记为p(w)，并计算

其中，s、x

2)计算S和H，其中，

3)优化S和H，其中，S＝1.0-chi2Q(-2.0*S,2*n)，H＝1.0-chi2Q(-2.0*H,2*n)，其中chi2Q为逆卡方运算；

4)计算可信概率值Prob＝(S-H+1.0)/2.0。

最后，判断计算得到的可信概率值Prob是否大于预先设定的可信阈值，若是，则判定所述用户行为可信。

不管用传统贝叶斯算法，还是改进后的robinson-fisher算法，所采用的可信阈值既可以根据经验设定，也可以根据具体业务数据的统计结果设定，而且可以根据具体应用场景的需求进行相应的调整，本申请提供的技术方案不对此作具体的限定。

由于朴素贝叶斯算法和改进后的robinson-fisher算法都属于成熟的现有技术，因此本实施例仅给出主要的计算过程，不再赘述具体细节。

在本实施例中，采用朴素贝叶斯模型识别用户可信行为，并且用可信概率值作为表征所述用户行为可信程度的指标值。在其他实施方式中，可以采用其他算法模型，例如：基于深度学习或者神经元网络的机器学习模型，在步骤102中进行相应的训练过程，并将采用所述模型计算得到的相应数值(例如：可信行为分值)作为表征所述用户行为可信程度的指标值。只要能够比较准确地识别出用户的可信行为，上述这些实施方式的变更，就都不偏离本申请的核心，都在本申请的保护范围内。

步骤106：采用预先设置的策略，根据上述两种识别方式的识别结果，综合判断所述用户行为是否可信。

在步骤104和步骤105分别通过两种方式对所述用户行为进行了可信识别，本步骤采用预先设置的策略，对上述两种方式的识别结果进行合并。

如果两种方式的识别结果都为：可信，则判定所述用户行为可信；

如果两种方式都没有将所述用户行为识别为可信行为，则判定所述用户行为不可信，即：不属于本方法能够识别出的可信行为；

如果两种方法的识别结果不同，则可以采用不同的策略进行判定，例如：可以采用类似“逻辑或”的方式，主要其中一种方式的识别结果为可信，就判定所述用户行为可信；或者采用加权打分的方式，根据与可信数据比对得到的安全级别评定一个分值，根据计算得到的可信概率值评定一个分值，然后按照设定的权重计算一个总分值，如果所述总分值大于预先设定的判定阈值，则判定所述用户行为可信。

上面给出了对两种识别结果进行合并、综合判断所述用户行为是否可信的示例，在具体实施过程中，可以采取上述策略，也可以采用其他策略，本申请对此不做具体的限定。

至此，完成了对所述用户行为的识别。在具体的实施中，可以依据识别的结果进行进一步的处理。特别是当上述过程没有得出所述用户行为可信的结论时，可以进一步识别所述用户行为是否为风险行为，例如：基于大量的原始历史行为数据、交易数据、财务数据、账户信息、登录数据、银行卡信息、用户身份信息、历史风险数据、黑名单等数据，对所述用户行为采用定义好的风险行为规则进行全规则覆盖分析，或者采用风险行为模型进行打分评估，最终判断出所述用户行为是否为风险行为，并及时采取必要的处理措施，例如：对用户身份进行核查、冻结可能被盗用的账户、限制用户权限等。

由于采用本申请的技术方案，已经准确、高效地将大量的可信用户行为排除，也就是说大幅度地缩小了需要进行风险识别的用户行为的数量，因此能够提高风险监控或者识别的效率，并能够提高识别的准确率。本申请技术方案在具体的在线交易系统实施时，将90％的用户操作行为识别为可信，因此只需要针对剩余的约10％的用户行为进行风险监控，将系统的分析耗时减少了50％，系统服务能力了提升了1倍，同时节约了30％左右的存储成本。

需要说明的是，上文中给出的实施例是本申请技术方案的优选实施方式，在具体应用中，上述步骤101-106并非都是必须的。其中，步骤101和步骤102属于线下准备阶段，预先生成所需的可信数据和可信识别模型(其中可信数据是定期生成的，可信识别模型可以一次性训练好，也可以定期进行训练)，每次获取用户行为数据后，可以直接执行步骤103-106利用已有的可信数据和可信识别模型进行识别，不用重复执行步骤101-步骤102。此外，本实施例给出了采用两种方式识别用户可信行为、并对识别结果进行合并的实施方式，在其他实施方式中，可以只采用其中一种方式进行识别也是可以的，例如：仅采用基于可信数据和规则进行识别的方式，那么就只需要执行步骤101、103和104；也可以仅采用基于可信行为识别模型的方式，那么就只需要执行步骤102、103和105，同样可以实现本申请的技术方案。

综上所述，本申请提供的用于在网络交互系统中识别用户可信行为的方法，在获取网络交互系统中的用户行为数据后，通过与可信数据和预先设定的规则比对、或者采用预先生成的可信行为识别模型，识别所述用户行为是否可信。本申请的技术方案，提供了一种识别用户行为的新思路，摒弃了在海量用户行为中识别风险行为的传统做法，仅依赖可信数据和原始行为数据就可以准确、高效地从海量用户行为中识别出大部分可信行为。特别是在本方法的基础上进行用户行为的风险监控和拦截，由于不可信用户行为(风险行为)的范围已经大幅减少，从而可以有效提高风险行为监控的执行效率和识别准确率，减少硬件存储和人工介入核查的成本。

在上述的实施例中，提供了一种用于在网络交互系统中识别用户可信行为的方法，与之相对应的，本申请还提供一种用于在网络交互系统中识别用户可信行为的装置。请参看图8，其为本申请的一种用于在网络交互系统中识别用户可信行为的装置实施例的示意图。由于装置实施例基本相似于方法实施例，所以描述得比较简单，相关之处参见方法实施例的部分说明即可。下述描述的装置实施例仅仅是示意性的。

本实施例的一种用于在网络交互系统中识别用户可信行为的装置，包括：可信数据生成单元801，用于预先生成用于可信行为识别的可信数据；模型训练生成单元802，用于预先训练生成可信行为识别模型；行为数据获取单元803，用于获取所述网络交互系统中的用户行为数据；规则分析识别单元804，用于通过判断预先生成的可信数据与所述用户行为数据的比对结果是否符合预先设定的规则，识别所述用户行为是否可信；模型分析识别单元805，用于根据所述用户行为数据，采用预先生成的可信行为识别模型计算表征所述用户行为可信程度的指标值，通过判断所述指标值是否满足预先设定的可信阈值，识别所述用户行为是否可信。识别结果合并单元806，用于采用预先设置的策略，根据所述规则分析识别单元和所述模型分析识别单元输出的识别结果，综合判断所述用户行为是否可信。

可选的，所述装置还包括：

可选的，所述可信数据生成单元包括：

可选的，所述可信数据生成单元还包括：

可选的，可信数据生成单元还包括：

可选的，所述规则分析识别单元包括：

可选的，所述模型训练生成单元包括：

可选的，所述模型分析识别单元包括：

可选的，所述装置包括：

本申请虽然以较佳实施例公开如上，但其并不是用来限定本申请，任何本领域技术人员在不脱离本申请的精神和范围内，都可以做出可能的变动和修改，因此本申请的保护范围应当以本申请权利要求所界定的范围为准。

在一个典型的配置中，计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。

内存可能包括计算机可读介质中的非永久性存储器，随机存取存储器(RAM)和/或非易失性内存等形式，如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。

1、计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括，但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带，磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质，可用于存储可以被计算设备访问的信息。按照本文中的界定，计算机可读介质不包括非暂存电脑可读媒体(transitory media)，如调制的数据信号和载波。

2、本领域技术人员应明白，本申请的实施例可提供为方法、系统或计算机程序产品。因此，本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且，本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

Claims

1.一种用于在网络交互系统中识别用户可信行为的方法，其特征在于，包括：

获取所述网络交互系统中的用户行为数据；

根据所述用户行为数据，采用下述方式识别所述用户行为是否可信：

通过判断预先生成的可信数据与所述用户行为数据的比对结果是否符合预先设定的规则，识别所述用户行为是否可信，包括：根据所述用户行为数据涉及的主体类型和主体值，从数据中心提取与所述主体相关联的可信数据；将已提取的可信数据中的可信数据项值，与所述用户行为数据中的相应数据进行比对，获取所述用户行为的可信级别；根据所述已提取的可信数据中的规则标识，获取预先设定的可信规则；判断所述可信级别是否符合所述可信规则的要求；若符合，则判定所述用户行为可信；所述可信数据是指，从网络交互系统的用户历史行为数据中提取的能够反映用户常规行为规律的数据；所述可信规则定义了针对特定的可信数据项类型，其可信级别应该满足的要求；当对所述用户行为的最终识别结果为“不可信”时，执行下述操作：

识别所述用户行为是否为风险行为。

2.根据权利要求1所述的用于在网络交互系统中识别用户可信行为的方法，其特征在于，根据所述用户行为数据，还可以采用下述方式识别所述用户行为是否可信：采用预先生成的可信行为识别模型计算表征所述用户行为可信程度的指标值，通过判断所述指标值是否满足预先设定的可信阈值，识别所述用户行为是否可信；

在所述通过判断预先生成的可信数据与所述用户行为数据的比对结果是否符合预先设定的规则，识别所述用户行为是否可信的步骤之前或者之后，执行所述采用预先生成的可信行为识别模型识别所述用户行为是否可信的步骤；

3.根据权利要求2所述的用于在网络交互系统中识别用户可信行为的方法，其特征在于，采用以下两种方式获取所述网络交互系统中的用户行为数据：

或者，

4.根据权利要求3所述的用于在网络交互系统中识别用户可信行为的方法，其特征在于，当所述网络交互系统为在线交易系统时，所述网络交互系统中的用户行为数据包括：账户信息、发起所述用户行为的客户端IP地址、发起所述用户行为的客户端MAC地址、发起所述用户行为的移动终端号码、所述用户行为涉及的银行卡号、交易金额、和/或交易类别。

5.根据权利要求1-4任一所述的用于在网络交互系统中识别用户可信行为的方法，其特征在于，采用判断预先生成的可信数据与所述用户行为数据的比对结果是否符合预先设定的规则来识别所述用户行为是否可信时，在完成所述识别操作后，将所述用户行为数据存储到数据仓库中。

6.根据权利要求5所述的用于在网络交互系统中识别用户可信行为的方法，其特征在于，采用如下方式预先生成所述可信数据：

7.根据权利要求6所述的用于在网络交互系统中识别用户可信行为的方法，其特征在于，所述预先生成所述可信数据的步骤还包括：

8.根据权利要求7所述的用于在网络交互系统中识别用户可信行为的方法，其特征在于，将采用上述方式预先生成的可信数据存储在采用MySQL数据库技术构建的数据中心，该数据中心依据以可信数据的主体类型和主体值为输入执行高可靠哈希操作得到的哈希值，对所述可信数据采用分库分表的形式存储。

9.根据权利要求1所述的用于在网络交互系统中识别用户可信行为的方法，其特征在于，所述可信规则是通过Java动态编译的方式注入的；所述判断所述可信级别是否符合所述可信规则的要求，是通过groovy技术进行动态构建以及比较来实现的。

10.根据权利要求2-4任一所述的用于在网络交互系统中识别用户可信行为的方法，其特征在于，当采用预先生成的可信行为识别模型计算表征所述用户行为可信程度的指标值，通过判断所述指标值是否满足预先设定的可信阈值来识别所述用户行为是否可信时，所述可信行为识别模型是指朴素贝叶斯模型，所述表征所述用户行为可信程度的指标值是指，所述用户行为是可信行为的概率值；

相应的，所述模型通过如下步骤训练生成：

选择与识别用户行为相关的属性特征；

11.根据权利要求10所述的用于在网络交互系统中识别用户可信行为的方法，其特征在于，所述采用预先生成的可信行为识别模型计算表征所述用户行为可信程度的指标值，通过判断所述指标值是否满足预先设定的可信阈值，识别所述用户行为是否可信，包括：

12.根据权利要求10所述的用于在网络交互系统中识别用户可信行为的方法，其特征在于，所述采用预先生成的可信行为识别模型计算表征所述用户行为可信程度的指标值，通过判断所述指标值是否满足预先设定的可信阈值，识别所述用户行为是否可信，包括：

13.根据权利要求10所述的用于在网络交互系统中识别用户可信行为的方法，其特征在于，当所述网络交互系统为在线交易系统时，所述属性特征包括：交易金额、时间、键盘行为特征、和/或商品名称；所述键盘行为特征是指执行所述用户行为时键盘按键从被按下到被松开的平均时间。

14.根据权利要求1所述的用于在网络交互系统中识别用户可信行为的方法，其特征在于，所述识别所述用户行为是否为风险行为是指，采用预先生成的风险行为模型和/或预先设定的风险行为规则进行识别。

15.一种用于在网络交互系统中识别用户可信行为的装置，其特征在于，包括：

识别方式触发单元，用于触发规则分析识别单元识别所述用户行为是否可信；

规则分析识别单元，用于通过判断预先生成的可信数据与所述用户行为数据的比对结果是否符合预先设定的规则，识别所述用户行为是否可信，包括：如果所述用户行为数据涉及两种或者两种以上的主体，则分别将与所涉及主体相关联的可信数据与所述用户行为数据进行比对，判断所述用户行为是否可信；

所述规则分析识别单元包括：可信数据提取子单元，用于根据所述用户行为数据涉及的主体类型和主体值，从数据中心提取与所述主体相关联的可信数据；可信数据比对子单元，用于将已提取的可信数据中的可信数据项值，与所述用户行为数据中的相应数据进行比对，获取所述用户行为的可信级别；可信规则获取子单元，用于根据所述已提取的可信数据中的规则标识，获取预先设定的可信规则；可信规则判断子单元，用于判断所述可信级别是否符合所述可信规则的要求；若符合，则判定所述用户行为可信；其中，所述可信规则定义了针对特定的可信数据项类型，其可信级别应该满足的要求；

16.根据权利要求15所述的用于在网络交互系统中识别用户可信行为的装置，其特征在于，还包括：模型分析识别单元，用于根据所述用户行为数据，采用预先生成的可信行为识别模型计算表征所述用户行为可信程度的指标值，通过判断所述指标值是否满足预先设定的可信阈值，识别所述用户行为是否可信；

所述识别方式触发单元在触发所述规则分析识别单元工作之前或者之后，触发所述模型分析识别单元工作；

相应的，所述装置还包括：

17.根据权利要求16所述的用于在网络交互系统中识别用户可信行为的装置，其特征在于，所述行为数据获取单元具体用于通过同步事件触发的方式，获取所述网络交互系统中的用户行为数据；或者，通过接收异步事件通知的方式，获取所述网络交互系统中的用户行为数据。

18.根据权利要求15-17任一所述的用于在网络交互系统中识别用户可信行为的装置，其特征在于，如果所述识别方式触发单元触发所述规则分析识别单元工作，所述装置还包括：

19.根据权利要求18所述的用于在网络交互系统中识别用户可信行为的装置，其特征在于，所述装置包括：

可信数据生成单元，用于预先生成所述可信数据；

所述可信数据生成单元包括：

20.根据权利要求19所述的用于在网络交互系统中识别用户可信行为的装置，其特征在于，所述可信数据生成单元还包括：

可信数据合并子单元，用于将已有的可信数据、采用所述可信数据生成单元生成的可信数据、以及人工维护生成的可信数据合并；

21.根据权利要求20所述的用于在网络交互系统中识别用户可信行为的装置，其特征在于，可信数据生成单元还包括：

22.根据权利要求15所述的用于在网络交互系统中识别用户可信行为的装置，其特征在于，所述规则分析识别单元中采用的可信规则是通过Java动态编译的方式注入的；所述可信规则判断子单元具体用于通过groovy技术进行动态构建以及比较来判断所述可信级别是否符合所述可信规则的要求。

23.根据权利要求16-17任一所述的用于在网络交互系统中识别用户可信行为的装置，其特征在于，如果所述识别方式触发单元触发所述模型分析识别单元工作，所述模型分析识别单元采用的可信行为识别模型是指朴素贝叶斯模型，所述表征所述用户行为可信程度的指标值是指，所述用户行为是可信行为的概率值；

24.根据权利要求23所述的用于在网络交互系统中识别用户可信行为的装置，其特征在于，所述模型分析识别单元包括：

25.根据权利要求23所述的用于在网络交互系统中识别用户可信行为的装置，其特征在于，所述模型分析识别单元包括：

26.根据权利要求15所述的用于在网络交互系统中识别用户可信行为的装置，其特征在于，所述风险行为识别单元具体用于，采用预先生成的风险行为模型和/或预先设定的风险行为规则识别所述用户行为是否为风险行为。