WO2019153604A1

WO2019153604A1 - 人机识别模型的建立装置、方法及计算机可读存储介质

Info

Publication number: WO2019153604A1
Application number: PCT/CN2018/089715
Authority: WO
Inventors: 韩伟; 邓坤; 王建明; 肖京
Original assignee: 平安科技（深圳）有限公司
Priority date: 2018-02-06
Filing date: 2018-06-03
Publication date: 2019-08-15
Also published as: CN108416198B; CN108416198A

Abstract

本申请公开了一种人机识别模型的建立装置，包括存储器和处理器，存储器上存储有可在处理器上运行的模型建立程序，该程序被处理器执行时实现如下步骤：收集滑动验证操作的用户行为数据构建样本库；对样本库中的浏览器信息和硬件信息进行统计分析并生成第一人机识别规则；根据页面轨迹信息和滑动轨迹信息生成第二人机识别规则；使用样本库中的数据训练BP神经网络模型和基于DBSCAN的分类模型；根据上述规则和模型构建融合人机识别模型，并训练该模型。本申请还提出一种人机识别模型的建立方法以及一种计算机可读存储介质。本申请解决了现有技术中无法准确识别机器操作的滑动验证码的技术问题。

Description

人机识别模型的建立装置、方法及计算机可读存储介质

本申请基于巴黎公约申明享有2018年02月06日递交的申请号为201810114634.8、名称为“人机识别模型的建立装置、方法及计算机可读存储介质”的中国专利申请的优先权，该中国专利申请的整体内容以参考的方式结合在本申请中。

技术领域

本申请涉及人机识别技术领域，尤其涉及一种人机识别模型的建立装置、方法及计算机可读存储介质。

背景技术

在验证码领域，区别于传统的图像识别验证码、文字识别验证码、算术计算验证码等方式，滑动验证码由于识别方式清晰直观，具有良好的用户体验，得到越来越多的企业的青睐。

而作为一种验证方式，为了保证信息的安全性，仍然需要进行人机识别，以判断滑动验证操作是恶意的机器操作，还是人为的正常登录操作。但是，目前在滑动验证码的人机识别上面并没有一个很好的解决方案，破解率非常高，因此，如何准确识别机器操作的滑动验证是各公司安全部门亟需解决的问题。

发明内容

本申请提供一种人机识别模型的建立装置、方法及计算机可读存储介质，其主要目的在于解决现有技术中无法准确识别机器操作的滑动验证码的技术问题。

为实现上述目的，本申请提供一种人机识别模型的建立装置，该装置包括存储器和处理器，所述存储器中存储有可在所述处理器上运行的模型建立程序，所述模型建立程序被所述处理器执行时实现如下步骤：

收集预设数量的滑动验证操作的用户行为数据构建样本库，所述滑动验证操作为基于浏览器触发，所述用户行为数据包括浏览器信息、硬件信息、页面轨迹信息和滑动轨迹信息；

对所述样本库中的浏览器信息和硬件信息进行统计分析，以确定有异常滑动操作的浏览器信息和硬件信息，并根据确定的浏览器信息和硬件信息生成第一人机识别规则；

对所述样本库中的页面轨迹信息和滑动轨迹信息进行统计分析，根据统计结果生成一个或者多个轨迹判断规则，根据所述一个或者多个轨迹判断规则生成第二人机识别规则；

使用所述样本库中的用户行为数据训练BP神经网络模型和基于DBSCAN的分类模型；

根据所述第一人机识别规则、所述第二人机识别规则，以及训练得到的BP神经网络人机识别模型和DBSCAN人机识别模型构建融合人机识别模型，并使用所述样本库中的用户行为数据训练所述融合人机识别模型。

此外，为实现上述目的，本申请还提供一种人机识别模型的建立方法，该方法包括：

此外，为实现上述目的，本申请还提供一种计算机可读存储介质，所述计算机可读存储介质上存储有模型建立程序，所述模型建立程序可被一个或者多个处理器执行，以实现如上所述的人机识别模型的建立方法的步骤。

本申请提出的人机识别模型的建立装置、方法及计算机可读存储介质，收集预设数量的滑动验证操作的用户行为数据并构建样本库，滑动验证操作为基于浏览器触发的，用户行为数据包括浏览器信息、硬件信息、页面轨迹信息和滑动轨迹信息，对样本库中的浏览器信息和硬件信息进行统计分析，以确定有异常滑动操作的浏览器信息和硬件信息，并根据确定的浏览器信息和硬件信息生成第一人机识别规则，对样本库中的页面轨迹信息和滑动轨迹信息进行统计分析，根据统计结果生成一个或者多个轨迹判断规则，根据一个或者多个轨迹判断规则生成第二人机识别规则，使用样本库中的用户行为数据训练BP神经网络模型和基于DBSCAN的分类模型，得到BP神经网络人机识别模型和DBSCAN人机识别模型，将上述得到的规则和模型构建为一个融合人机识别模型，并使用样本库中的用户行为数据训练该融合人机识别模型，训练得到的融合人机识别模型可以用来准确识别机器操作的滑动验证，本申请的方案根据收集的浏览器信息、硬件信息、页面轨迹信息以及滑动轨迹信息等用户行为数据生成规则并训练模型，并且用生成的多个规则或者模型构建一个融合人机识别模型，用来对机器操作的滑动操作进行识别，解决了现有技术中无法准确识别机器操作的滑动验证码的技术问题。

附图说明

图1为本申请人机识别模型的建立装置较佳实施例的示意图；

图2为本申请人机识别模型的建立装置一实施例中模型建立程序的程序模块示意图；

图3为本申请人机识别模型的建立方法较佳实施例的流程图。

本申请目的的实现、功能特点及优点将结合实施例，参照附图做进一步说明。

具体实施方式

应当理解，此处所描述的具体实施例仅仅用以解释本申请，并不用于限定本申请。

本申请提供一种人机识别模型的建立装置。参照图1所示，为本申请人机识别模型的建立装置较佳实施例的示意图。

在本实施例中，人机识别模型的建立装置可以是PC(Personal Computer，个人电脑)，也可以是智能手机、平板电脑、便携计算机等终端设备。

该人机识别模型的建立装置至少包括存储器11、处理器12，通信总线13，以及网络接口14。

其中，存储器11至少包括一种类型的可读存储介质，所述可读存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如，SD或DX存储器等)、磁性存储器、磁盘、光盘等。存储器11在一些实施例中可以是人机识别模型的建立装置的内部存储单元，例如该人机识别模型的建立装置的硬盘。存储器11在另一些实施例中也可以是人机识别模型的建立装置的外部存储设备，例如人机识别模型的建立装置上配备的插接式硬盘，智能存储卡(Smart Media Card,SMC)，安全数字(Secure Digital,SD)卡，闪存卡(Flash Card)等。进一步地，存储器11还可以既包括人机识别模型的建立装置的内部存储单元也包括外部存储设备。存储器11不仅可以用于存储安装于人机识别模型的建立装置的应用软件及各类数据，例如模型建立程序的代码等，还可以用于暂时地存储已经输出或者将要输出的数据。

处理器12在一些实施例中可以是一中央处理器(Central Processing Unit,CPU)、控制器、微控制器、微处理器或其他数据处理芯片，用于运行存储器11中存储的程序代码或处理数据，例如执行模型建立程序等。

通信总线13用于实现这些组件之间的连接通信。

网络接口14可选的可以包括标准的有线接口、无线接口(如WI-FI接口)，通常用于在该装置与其他电子设备之间建立通信连接。

图1仅示出了具有组件11-14以及模型建立程序的人机识别模型的建立装置，但是应理解的是，并不要求实施所有示出的组件，可以替代的实施更多或者更少的组件。

可选地，该装置还可以包括用户接口，用户接口可以包括显示器(Display)、输入单元比如键盘(Keyboard)，可选的用户接口还可以包括标准的有线接口、无线接口。可选地，在一些实施例中，显示器可以是LED显示器、液晶显示器、触控式液晶显示器以及OLED(Organic Light-Emitting Diode，有机发光二极管)触摸器等。其中，显示器也可以适当的称为显示屏或显示单元，用于显示在人机识别模型的建立装置中处理的信息以及用于显示可视化的用户界面。

在图1所示的装置实施例中，存储器11中存储有模型建立程序；处理器12执行存储器11中存储的模型建立程序时实现如下步骤：

收集预设数量的滑动验证操作的用户行为数据构建样本库，所述滑动验证操作为基于浏览器触发，所述用户行为数据包括浏览器信息、硬件信息、页面轨迹信息和滑动轨迹信息。

根据用户访问系统的历史记录收集历史滑动验证操作的用户行为数据，这些用户行为数据中包括能够确定是人为操作的用户行为数据，也包括不能够确定是人为操作还是机器操作的用户行为数据。此外，还可以通过自动化脚本模拟机器操作，并采集用户行为数据。通过上述两种方式收集用户行为数据，并将这些数据添加到样本库中。可以理解的是，收集的用户行为数据越多，后续使用这些数据训练模型得到的结果也越准确。因此，预设数量的值可以由用户根据对模型的精准度的要求进行设置。

具体地，上述用户行为数据包括浏览器信息、硬件信息、页面轨迹信息和滑动轨迹信息，其中，浏览器信息和硬件信息可以通过滑动操作产生的cookie信息获取，用户基于浏览器上的网页访问系统时，系统会发送一个滑动验证的页面在网页上显示，该滑动验证的页面上设置有滑动验证区域，其中包含有滑块，以及需要将滑块移动到的目标区域，用户需要通过鼠标操作或者触摸操作将滑块移动到要求的目标区域以完成滑动验证。在用户执行滑动验证时，获取滑动操作产生的页面轨迹信息、滑动轨迹信息；并且从浏览器的cookie信息中获取浏览器信息和硬件信息，其中，滑动轨迹信息为在滑动验证操作的过程中，滑块区域在滑动验证区域内移动的偏移量、移动速度和移动加速度；页面轨迹信息为滑动验证操作之前以及之后的预设时长内，鼠标指针在滑动验证区域所在的网页上移动的速度、位移和时间。硬件信息包括但不限于用户终端的显示器参数、内存参数、物理地址等，浏览器信息可以为浏览器的型号、版本等信息。需要说明的是，样本库中的根据用户访问系统的历史记录收集历史滑动验证操作的用户行为数据，每一条数据都有该滑动操作的执行时间信息。

对所述样本库中的浏览器信息和硬件信息进行统计分析，以确定有异常滑动操作的浏览器信息和硬件信息，并根据确定的浏览器信息和硬件信息生成第一人机识别规则。

对样本库中大量的浏览器信息和硬件信息进行统计分析，当有浏览器信息和/或硬件信息对应的滑动操作在单位时间内的操作总数量分别达到对应的预设阈值时，判定该浏览器信息和/或硬件信息出现异常操作；根据出现异常操作的硬件信息、浏览器信息生成第一人机识别规则。其中，单位时间、以及操作总数量的预设阈值，可以根据网站的具体访问情况进行设置，例如单位时间可以设置为10分钟，即若通过某台设备上的浏览器，在10分钟内连续进行滑动验证操作的数量达到预设阈值，则判定该设备上执行的是异常操作，将该设备的硬件信息以及使用的浏览器信息作为所述出现异常操作的浏览器信息和/或硬件信息。对应地，根据这些异常操作的浏览器信息和/或硬件信息生成的第一人机识别规则可以是：若滑动验证操作的对应的用户行为数据中的浏览器信息和硬件信息与所述提取的异常操作的浏览器信息和/或硬件信息一致，则判定对应的滑动验证操作为异常滑动验证操作。

对所述样本库中的页面轨迹信息和滑动轨迹信息进行统计分析，根据统计结果生成一个或者多个轨迹判断规则，根据所述一个或者多个轨迹判断规则生成第二人机识别规则。

由于人为执行滑动验证操作时，难以保证滑块区域在移动过程中的移动速度和加速度的恒定不变，而且滑块区域的移动轨迹也会有一定的波动。而机器执行滑动验证操作时，是通过执行自动化脚本来实现的，因此，由机器执行的滑动验证操作的页面轨迹信息和滑动轨迹信息会符合一定的规律，这些规律可以通过对样本库中的页面轨迹信息和滑动轨迹信息的统计分析得到，进而根据分析结果生成一个或者多个轨迹判断规则。例如，如果滑块区域上的点在页面上的移动轨迹为直线或者移动轨迹的变化幅度小于预设阈值，则判定该滑动操作是机器操作；如果滑块区域在移动过程中的加速度为零或者恒定不变，则判定该滑动操作为机器操作；或者，每次滑块区域的移动距离完全相同，则判定该滑动操作为机器操作。将上述规则中的一个或者多个结合起来，设置为第二人机识别规则。例如，如果滑块区域上的点在页面上的移动轨迹为直线且滑块区域在移动过程中的加速度为零，则该滑动操作判定为机器操作。

使用所述样本库中的用户行为数据训练BP神经网络模型和基于DBSCAN的分类模型。

根据样本库中的用户行为数据的来源信息，为能够获取到来源信息的用户行为数据添加类别标记，即为能够确定是人为操作的用户行为数据和能够确定是机器操作的用户行为数据分别添加对应的类别标记，以标识其来源信息，而获取不到来源信息的用户行为数据，则没有类别标记。

将样本库中有类别标记的用户行为数据输入到BP(back propagation，反向传播)神经网络模型中训练，以得到该BP神经网络模型的模型参数，将确定模型参数的BP神经网络模型作为BP神经网络人机识别模型。从上述样本库中的有类别标记的用户行为数据中提取特征，主要包括浏览器信息、硬件信息、滑块区域在滑动验证区域内移动的偏移量、移动速度和移动加速度，以及滑动验证操作之前以及之后的预设时长内，鼠标指针在滑动验证区域所在的网页上移动的速度、位移和时间，一共得到以上八个维度的特征，使用提取到的特征训练BP神经网络模型得到模型参数，将确定模型参数后BP神经网络模型作为BP神经网络人机识别模型。

将样本库中无类别标记的用户行为数据输入到DBSCAN(Density-Based Spatial Clustering of Applications with Noise，具有噪声的基于密度的聚类方法)模型中训练，以得到该基于DBSCAN的分类模型的模型参数，将确定模型参数的基于DBSCAN的分类模型作为DBSCAN人机识别模型。按照上一步骤中同样的方式提取没有类别标记的用户行为数据中的特征，使用提取的特征训练基于DBSCAN的分类模型，DBSCAN是一种基于密度的聚类算法，它能够把具有足够高密度的区域划分为簇。也就是说，该算法是一种无监督的分类算法，对于即使没有类别标记的大量用户行为数据，也能够通过聚类的方式对样本集中的数据进行分类。使用没有类别标记的用户行为数据训练该模型，能够将数据分为两类，作为一种实施方式，可以由用户根据聚类的结果确定属于机器操作的聚类，并为其添加类别标签。在该模型的实际应用中，获取滑动验证的用户行为数据输入到该模型中，输出该用户行为数据所属的聚类，根据该聚类的标签判断本次滑动操作是否为机器操作。

得到上述规则和模型之后，将其组合为一个融合人机识别模型，具体地，为第一人机识别规则A、第二人机识别规则B、BP神经网络人机识别模型C和DBSCAN人机识别模型D分别分配权重a1、a2、a3、a4，生成融合人机识别模型S，其中，S＝a1*A+a2*B+a3*C+a4*D；使用所述样本库中的用户行为数据训练所述融合人机识别模型S，获取权重a1、a2、a3、a4的数值。模型S的输出结果为一个0～1的数值，在训练模型时，设置机器操作的模型输出结果为1，人为操作的模型输出结果为0，识别结果越准确的模型或规则，其对应的权重也越大，反之，其对应的权重越小。

该融合人机识别模型在实际应用中的验证流程如下：获取用户基于浏览器的滑动验证操作产生的页面轨迹信息、滑动轨迹信息，以及浏览器信息和硬件信息，从中提取出需要的特征输入到模型中，得到输出结果，根据输出结果判断是否为机器操作。融合模型S在实际使用过程中，用户可以根据实际情况预先设置输出结果的判断阈值，例如设为0.8，即当输出结果大于或等于0.8时，则判断本次互动验证操作为机器操作，可以阻止本次登录或者访问。

本实施例提出的人机识别模型的建立装置，收集预设数量的滑动验证操作的用户行为数据并构建样本库，滑动验证操作为基于浏览器触发的，用户行为数据包括浏览器信息、硬件信息、页面轨迹信息和滑动轨迹信息，对样本库中的浏览器信息和硬件信息进行统计分析，以确定有异常滑动操作的浏览器信息和硬件信息，并根据确定的浏览器信息和硬件信息生成第一人机识别规则，对样本库中的页面轨迹信息和滑动轨迹信息进行统计分析，根据统计结果生成一个或者多个轨迹判断规则，根据一个或者多个轨迹判断规则生成第二人机识别规则，使用样本库中的用户行为数据训练BP神经网络模型和基于DBSCAN的分类模型，得到BP神经网络人机识别模型和DBSCAN人机识别模型，将上述得到的规则和模型构建为一个融合人机识别模型，并使用样本库中的用户行为数据训练该融合人机识别模型，训练得到的融合人机识别模型可以用来准确识别机器操作的滑动验证，本申请的方案根据收集的浏览器信息、硬件信息、页面轨迹信息以及滑动轨迹信息等用户行为数据生成规则并训练模型，并且用生成的多个规则或者模型构建一个融合人机识别模型，用来对机器操作的滑动操作进行识别，解决了现有技术中无法准确识别机器操作的滑动验证码的技术问题。

可选地，在其他的实施例中，模型建立程序还可以被分割为一个或者多个模块，一个或者多个模块被存储于存储器11中，并由一个或多个处理器(本实施例为处理器12)所执行以完成本申请，本申请所称的模块是指能够完成特定功能的一系列计算机程序指令段，用于描述模型建立程序在人机识别模型的建立装置中的执行过程。

例如，参照图2所示，为本申请人机识别模型的建立装置一实施例中的模型建立程序的程序模块示意图，该实施例中，模型建立程序可以被分割为样本收集模块10、规则生成模块20、模型训练模块30和模型融合模块40，示例性地：

样本收集模块10用于：收集预设数量的滑动验证操作的用户行为数据构建样本库，所述滑动验证操作为基于浏览器触发，所述用户行为数据包括浏览器信息、硬件信息、页面轨迹信息和滑动轨迹信息；

规则生成模块20用于：对所述样本库中的浏览器信息和硬件信息进行统计分析，以确定有异常滑动操作的浏览器信息和硬件信息，并根据确定的浏览器信息和硬件信息生成第一人机识别规则；

以及，对所述样本库中的页面轨迹信息和滑动轨迹信息进行统计分析，根据统计结果生成一个或者多个轨迹判断规则，根据所述一个或者多个轨迹判断规则生成第二人机识别规则；

模型训练模块30用于：使用所述样本库中的用户行为数据训练BP神经网络模型和基于DBSCAN的分类模型；

模型融合模块40用于：根据所述第一人机识别规则、所述第二人机识别规则，以及训练得到的BP神经网络人机识别模型和DBSCAN人机识别模型构建融合人机识别模型，并使用所述样本库中的用户行为数据训练所述融合人机识别模型。

上述样本收集模块10、规则生成模块20、模型训练模块30和模型融合模块4等程序模块被执行时所实现的功能或操作步骤与上述实施例大体相同，在此不再赘述。

此外，本申请还提供一种人机识别模型的建立方法。参照图3所示，为本申请人机识别模型的建立方法较佳实施例的流程图。该方法可以由一个装置执行，该装置可以由软件和/或硬件实现。

在本实施例中，人机识别模型的建立方法包括：

步骤S10，收集预设数量的滑动验证操作的用户行为数据构建样本库，所述滑动验证操作为基于浏览器触发，所述用户行为数据包括浏览器信息、硬件信息、页面轨迹信息和滑动轨迹信息。

根据用户访问系统的历史记录收集历史滑动验证操作的用户行为数据，这些用户行为数据中包括能够确定是人为操作的用户行为数据，也包括不能够确定是人为操作还是机器操作的用户行为数据。此外，还可以通过自动化脚本模拟机器操作采集用户行为数据。通过上述两种方式收集用户行为数据，并将这些数据添加到样本库中。可以理解的是，收集的用户行为数据越多，后续使用这些数据训练模型得到的结果也越准确。因此，预设数量的值可以由用户根据对模型的精准度的要求进行设置。

步骤S20，对所述样本库中的浏览器信息和硬件信息进行统计分析，以确定有异常滑动操作的浏览器信息和硬件信息，并根据确定的浏览器信息和硬件信息生成第一人机识别规则。

对样本库中大量的浏览器信息和硬件信息进行统计分析，提取出异常的用户行为数据出现较多的硬件信息和浏览器信息，例如，步骤S20可以包括如下细化步骤：

统计所述样本库中的浏览器信息和硬件信息，当有浏览器信息和/或硬件信息对应的滑动操作在单位时间内的操作总数量分别达到对应的预设阈值时，判定该浏览器信息和/或硬件信息出现异常操作；根据出现异常操作的硬件信息、浏览器信息生成所述第一人机识别规则。

单位时间、以及操作总数量的预设阈值，可以根据网站的具体访问情况进行设置，例如单位时间可以设置为10分钟，即若通过某台设备上的浏览器，在10分钟内连续进行滑动验证操作的数量达到预设阈值，则判定该设备上执行的是异常操作，将该设备的硬件信息以及使用的浏览器信息作为所述出现异常操作的浏览器信息和/或硬件信息。对应地，根据这些异常操作的浏览器信息和/或硬件信息生成的第一人机识别规则可以是：若滑动验证操作的对应的用户行为数据中的浏览器信息和硬件信息与所述提取的异常操作的浏览器信息和/或硬件信息一致，则判定对应的滑动验证操作为异常滑动验证操作。

步骤S30，对所述样本库中的页面轨迹信息和滑动轨迹信息进行统计分析，根据统计结果生成一个或者多个轨迹判断规则，根据所述一个或者多个轨迹判断规则生成第二人机识别规则。

由于人为执行滑动验证操作时，难以保证滑块区域在移动过程中的移动速度和加速度的恒定不变，而且滑块区域的移动轨迹也会有一定的波动。而机器执行滑动验证操作时，是通过执行自动化脚本来实现的，因此，由机器执行的滑动验证操作的页面轨迹信息和滑动轨迹信息会符合一定的规律，这些规律可以通过对样本库中的页面轨迹信息和滑动轨迹信息的统计分析得到，进而根据分析结果生成一个或者多个轨迹判断规则。例如，如果滑块区域的上的点在页面上的移动轨迹为直线或者移动轨迹的变化幅度小于预设阈值，则判定该滑动操作是机器操作；如果滑块区域在移动过程中的加速度为零或者恒定不变，则判定该滑动操作为机器操作；或者，每次滑块区域的移动距离完全相同，则判定该滑动操作为机器操作。将上述规则中的一个或者多个结合起来，设置为第二人机识别规则。例如，如果滑块区域上的点在页面上的移动轨迹为直线且滑块区域在移动过程中的加速度为零，则该滑动操作判定为机器操作。

步骤S40，使用所述样本库中的用户行为数据训练BP神经网络模型和基于DBSCAN的分类模型。

步骤S40可以包括如下细化步骤：

获取样本库中的用户行为数据的来源信息，为能够获取到来源信息的用户行为数据添加类别标记；将样本库中有类别标记的用户行为数据输入到BP神经网络模型中训练，以得到该BP神经网络模型的模型参数，将确定模型参数的BP神经网络模型作为BP神经网络人机识别模型；将样本库中无类别标记的用户行为数据输入到基于DBSCAN的分类模型中训练，以得到该基于DBSCAN的分类模型的模型参数，将确定模型参数的基于DBSCAN的分类模型作为DBSCAN人机识别模型。

将样本库中有类别标记的用户行为数据输入到BP神经网络模型中训练，以得到该BP神经网络模型的模型参数，将确定模型参数的BP神经网络模型作为BP神经网络人机识别模型。从上述样本库中的有类别标记的用户行为数据中提取特征，主要包括浏览器信息、硬件信息、滑块区域在滑动验证区域内移动的偏移量、移动速度和移动加速度，以及滑动验证操作之前以及之后的预设时长内，鼠标指针在滑动验证区域所在的网页上移动的速度、位移和时间，一共得到以上八个维度的特征，使用提取到的特征训练BP神经网络模型得到模型参数，将确定模型参数后BP神经网络模型作为BP神经网络人机识别模型。

步骤S50，根据所述第一人机识别规则、所述第二人机识别规则，以及训练得到的BP神经网络人机识别模型和DBSCAN人机识别模型构建融合人机识别模型，并使用所述样本库中的用户行为数据训练所述融合人机识别模型。

本实施例提出的人机识别模型的建立方法，收集预设数量的滑动验证操作的用户行为数据并构建样本库，滑动验证操作为基于浏览器触发的，用户行为数据包括浏览器信息、硬件信息、页面轨迹信息和滑动轨迹信息，对样本库中的浏览器信息和硬件信息进行统计分析，以确定有异常滑动操作的浏览器信息和硬件信息，并根据确定的浏览器信息和硬件信息生成第一人机识别规则，对样本库中的页面轨迹信息和滑动轨迹信息进行统计分析，根据统计结果生成一个或者多个轨迹判断规则，根据一个或者多个轨迹判断规则生成第二人机识别规则，使用样本库中的用户行为数据训练BP神经网络模型和基于DBSCAN的分类模型，得到BP神经网络人机识别模型和DBSCAN人机识别模型，将上述得到的规则和模型构建为一个融合人机识别模型，并使用样本库中的用户行为数据训练该融合人机识别模型，训练得到的融合人机识别模型可以用来准确识别机器操作的滑动验证，本申请的方案根据收集的浏览器信息、硬件信息、页面轨迹信息以及滑动轨迹信息等用户行为数据生成规则并训练模型，并且用生成的多个规则或者模型构建一个融合人机识别模型，用来对机器操作的滑动操作进行识别，解决了现有技术中无法准确识别机器操作的滑动验证码的技术问题。

此外，本申请还提出一种计算机可读存储介质，所述计算机可读存储介质上存储有模型建立程序，所述模型建立程序可被一个或多个处理器执行，以实现如下操作：

本申请计算机可读存储介质具体实施方式与上述人机识别模型的建立装置和方法各实施例基本相同，在此不作累述。

需要说明的是，上述本申请实施例序号仅仅为了描述，不代表实施例的优劣。并且本文中的术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、装置、物品或者方法不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、装置、物品或者方法所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括该要素的过程、装置、物品或者方法中还存在另外的相同要素。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在如上所述的一个存储介质(如ROM/RAM、磁碟、光盘)中，包括若干指令用以使得一台终端设备(可以是手机，计算机，服务器，或者网络设备等)执行本申请各个实施例所述的方法。

以上仅为本申请的优选实施例，并非因此限制本申请的专利范围，凡是利用本申请说明书及附图内容所作的等效结构或等效流程变换，或直接或间接运用在其他相关的技术领域，均同理包括在本申请的专利保护范围内。

Claims

一种人机识别模型的建立装置，其特征在于，所述装置包括存储器和处理器，所述存储器上存储有可在所述处理器上运行的模型建立程序，所述模型建立程序被所述处理器执行时实现如下步骤：

收集预设数量的滑动验证操作的用户行为数据构建样本库，所述滑动验证操作为基于浏览器触发，所述用户行为数据包括浏览器信息、硬件信息、页面轨迹信息和滑动轨迹信息；

对所述样本库中的浏览器信息和硬件信息进行统计分析，以确定有异常滑动操作的浏览器信息和硬件信息，并根据确定的浏览器信息和硬件信息生成第一人机识别规则；

对所述样本库中的页面轨迹信息和滑动轨迹信息进行统计分析，根据统计结果生成一个或者多个轨迹判断规则，根据所述一个或者多个轨迹判断规则生成第二人机识别规则；

使用所述样本库中的用户行为数据训练BP神经网络模型和基于DBSCAN的分类模型；

根据所述第一人机识别规则、所述第二人机识别规则，以及训练得到的BP神经网络人机识别模型和DBSCAN人机识别模型构建融合人机识别模型，并使用所述样本库中的用户行为数据训练所述融合人机识别模型。
如权利要求1所述的人机识别模型的建立装置，其特征在于，所述对所述样本库中的浏览器信息和硬件信息进行统计分析，以确定有异常滑动操作的浏览器信息和硬件信息，并根据确定的浏览器信息和硬件信息生成第一人机识别规则的步骤包括：

统计所述样本库中的浏览器信息和硬件信息，当有浏览器信息和/或硬件信息对应的滑动操作在单位时间内的操作总数量分别达到对应的预设阈值时，判定该浏览器信息和/或硬件信息出现异常操作；

根据出现异常操作的硬件信息、浏览器信息生成所述第一人机识别规则。
如权利要求1所述的人机识别模型的建立装置，其特征在于，所述使用所述样本库中的用户行为数据训练BP神经网络模型和基于DBSCAN的分类模型的步骤包括：

获取所述样本库中的用户行为数据的来源信息，为能够获取到来源信息的用户行为数据添加类别标记；

将所述样本库中有类别标记的用户行为数据输入到BP神经网络模型中训练，以得到该BP神经网络模型的模型参数，将确定模型参数的BP神经网络模型作为BP神经网络人机识别模型；

将所述样本库中无类别标记的用户行为数据输入到基于DBSCAN的分类模型中训练，以得到该基于DBSCAN的分类模型的模型参数，将确定模型参数的基于DBSCAN的分类模型作为DBSCAN人机识别模型。
如权利要求2所述的人机识别模型的建立装置，其特征在于，所述使用所述样本库中的用户行为数据训练BP神经网络模型和基于DBSCAN的分类模型的步骤包括：

获取所述样本库中的用户行为数据的来源信息，为能够获取到来源信息的用户行为数据添加类别标记；

将所述样本库中有类别标记的用户行为数据输入到BP神经网络模型中训练，以得到该BP神经网络模型的模型参数，将确定模型参数的BP神经网络模型作为BP神经网络人机识别模型；

将所述样本库中无类别标记的用户行为数据输入到基于DBSCAN的分类模型中训练，以得到该基于DBSCAN的分类模型的模型参数，将确定模型参数的基于DBSCAN的分类模型作为DBSCAN人机识别模型
如权利要求2所述的人机识别模型的建立装置，其特征在于，所述根据所述第一人机识别规则、所述第二人机识别规则，以及训练得到的BP神经网络人机识别模型和DBSCAN人机识别模型构建融合人机识别模型，并使用所述样本库中的用户行为数据训练所述融合人机识别模型的步骤包括：

为第一人机识别规则A、第二人机识别规则B、BP神经网络人机识别模型C和DBSCAN人机识别模型D分别分配权重a1、a2、a3、a4，生成融合人机识别模型S，其中，S＝a1*A+a2*B+a3*C+a4*D；

使用所述样本库中的用户行为数据训练所述融合人机识别模型S，获取权重a1、a2、a3、a4的值。
如权利要求3所述的人机识别模型的建立装置，其特征在于，所述根据所述第一人机识别规则、所述第二人机识别规则，以及训练得到的BP神经网络人机识别模型和DBSCAN人机识别模型构建融合人机识别模型，并使用所述样本库中的用户行为数据训练所述融合人机识别模型的步骤包括：

为第一人机识别规则A、第二人机识别规则B、BP神经网络人机识别模型C和DBSCAN人机识别模型D分别分配权重a1、a2、a3、a4，生成融合人机识别模型S，其中，S＝a1*A+a2*B+a3*C+a4*D；

使用所述样本库中的用户行为数据训练所述融合人机识别模型S，获取权重a1、a2、a3、a4的值。
如权利要求5所述的人机识别模型的建立装置，其特征在于，所述滑动轨迹信息为在滑动验证操作的过程中，滑块区域在滑动验证区域内移动的偏移量、移动速度和移动加速度；所述页面轨迹信息为鼠标指针在所述滑动验证区域所在的网页上移动的速度、位移和时间。
一种人机识别模型的建立方法，其特征在于，所述方法包括：

收集预设数量的滑动验证操作的用户行为数据构建样本库，所述滑动验证操作为基于浏览器触发，所述用户行为数据包括浏览器信息、硬件信息、页面轨迹信息和滑动轨迹信息；

对所述样本库中的浏览器信息和硬件信息进行统计分析，以确定有异常滑动操作的浏览器信息和硬件信息，并根据确定的浏览器信息和硬件信息生成第一人机识别规则；

对所述样本库中的页面轨迹信息和滑动轨迹信息进行统计分析，根据统计结果生成一个或者多个轨迹判断规则，根据所述一个或者多个轨迹判断规则生成第二人机识别规则；

使用所述样本库中的用户行为数据训练BP神经网络模型和基于DBSCAN的分类模型；

根据所述第一人机识别规则、所述第二人机识别规则，以及训练得到的BP神经网络人机识别模型和DBSCAN人机识别模型构建融合人机识别模型，并使用所述样本库中的用户行为数据训练所述融合人机识别模型。
如权利要求8所述的人机识别模型的建立方法，其特征在于，所述对所述样本库中的浏览器信息和硬件信息进行统计分析，以确定有异常滑动操作的浏览器信息和硬件信息，并根据确定的浏览器信息和硬件信息生成第一人机识别规则的步骤包括：

统计所述样本库中的浏览器信息和硬件信息，当有浏览器信息和/或硬件信息对应的滑动操作在单位时间内的操作总数量分别达到对应的预设阈值时，判定该浏览器信息和/或硬件信息出现异常操作；

根据出现异常操作的硬件信息、浏览器信息生成所述第一人机识别规则。
如权利要求8所述的人机识别模型的建立方法，其特征在于，所述使用所述样本库中的用户行为数据训练BP神经网络模型和基于DBSCAN的分类模型的步骤包括：

获取所述样本库中的用户行为数据的来源信息，为能够获取到来源信息的用户行为数据添加类别标记；

将所述样本库中有类别标记的用户行为数据输入到BP神经网络模型中训练，以得到该BP神经网络模型的模型参数，将确定模型参数的BP神经网络模型作为BP神经网络人机识别模型；

将所述样本库中无类别标记的用户行为数据输入到基于DBSCAN的分类模型中训练，以得到该基于DBSCAN的分类模型的模型参数，将确定模型参数的基于DBSCAN的分类模型作为DBSCAN人机识别模型。
如权利要求9所述的人机识别模型的建立方法，其特征在于，所述使用所述样本库中的用户行为数据训练BP神经网络模型和基于DBSCAN的分类模型的步骤包括：

获取所述样本库中的用户行为数据的来源信息，为能够获取到来源信息的用户行为数据添加类别标记；

将所述样本库中有类别标记的用户行为数据输入到BP神经网络模型中训练，以得到该BP神经网络模型的模型参数，将确定模型参数的BP神经网络模型作为BP神经网络人机识别模型；

将所述样本库中无类别标记的用户行为数据输入到基于DBSCAN的分类模型中训练，以得到该基于DBSCAN的分类模型的模型参数，将确定模型参数的基于DBSCAN的分类模型作为DBSCAN人机识别模型。
如权利要求9所述的人机识别模型的建立方法，其特征在于，所述根据所述第一人机识别规则、所述第二人机识别规则，以及训练得到的BP神经网络人机识别模型和DBSCAN人机识别模型构建融合人机识别模型，并使用所述样本库中的用户行为数据训练所述融合人机识别模型的步骤包括：

为第一人机识别规则A、第二人机识别规则B、BP神经网络人机识别模型C和DBSCAN人机识别模型D分别分配权重a1、a2、a3、a4，生成融合人机识别模型S，其中，S＝a1*A+a2*B+a3*C+a4*D；

使用所述样本库中的用户行为数据训练所述融合人机识别模型S，获取权重a1、a2、a3、a4的值。
如权利要10所述的人机识别模型的建立方法，其特征在于，所述根据所述第一人机识别规则、所述第二人机识别规则，以及训练得到的BP神经网络人机识别模型和DBSCAN人机识别模型构建融合人机识别模型，并使用所述样本库中的用户行为数据训练所述融合人机识别模型的步骤包括：

为第一人机识别规则A、第二人机识别规则B、BP神经网络人机识别模型C和DBSCAN人机识别模型D分别分配权重a1、a2、a3、a4，生成融合人机识别模型S，其中，S＝a1*A+a2*B+a3*C+a4*D；

使用所述样本库中的用户行为数据训练所述融合人机识别模型S，获取权重a1、a2、a3、a4的值。
如权利要12所述的人机识别模型的建立方法，其特征在于，所述滑动轨迹信息为在滑动验证操作的过程中，滑块区域在滑动验证区域内移动的偏移量、移动速度和移动加速度；所述页面轨迹信息为鼠标指针在所述滑动验证区域所在的网页上移动的速度、位移和时间。
一种计算机可读存储介质，其特征在于，所述计算机可读存储介质上存储有模型建立程序，所述模型建立程序可被一个或者多个处理器执行，以实现如下步骤：

收集预设数量的滑动验证操作的用户行为数据构建样本库，所述滑动验证操作为基于浏览器触发，所述用户行为数据包括浏览器信息、硬件信息、页面轨迹信息和滑动轨迹信息；

对所述样本库中的浏览器信息和硬件信息进行统计分析，以确定有异常滑动操作的浏览器信息和硬件信息，并根据确定的浏览器信息和硬件信息生成第一人机识别规则；

对所述样本库中的页面轨迹信息和滑动轨迹信息进行统计分析，根据统计结果生成一个或者多个轨迹判断规则，根据所述一个或者多个轨迹判断规则生成第二人机识别规则；

使用所述样本库中的用户行为数据训练BP神经网络模型和基于 DBSCAN的分类模型；

根据所述第一人机识别规则、所述第二人机识别规则，以及训练得到的BP神经网络人机识别模型和DBSCAN人机识别模型构建融合人机识别模型，并使用所述样本库中的用户行为数据训练所述融合人机识别模型。
如权利要15所述的计算机可读存储介质，其特征在于，所述对所述样本库中的浏览器信息和硬件信息进行统计分析，以确定有异常滑动操作的浏览器信息和硬件信息，并根据确定的浏览器信息和硬件信息生成第一人机识别规则的步骤包括：

统计所述样本库中的浏览器信息和硬件信息，当有浏览器信息和/或硬件信息对应的滑动操作在单位时间内的操作总数量分别达到对应的预设阈值时，判定该浏览器信息和/或硬件信息出现异常操作；

根据出现异常操作的硬件信息、浏览器信息生成所述第一人机识别规则。
如权利要15所述的计算机可读存储介质，其特征在于，所述使用所述样本库中的用户行为数据训练BP神经网络模型和基于DBSCAN的分类模型的步骤包括：

获取所述样本库中的用户行为数据的来源信息，为能够获取到来源信息的用户行为数据添加类别标记；

将所述样本库中有类别标记的用户行为数据输入到BP神经网络模型中训练，以得到该BP神经网络模型的模型参数，将确定模型参数的BP神经网络模型作为BP神经网络人机识别模型；

将所述样本库中无类别标记的用户行为数据输入到基于DBSCAN的分类模型中训练，以得到该基于DBSCAN的分类模型的模型参数，将确定模型参数的基于DBSCAN的分类模型作为DBSCAN人机识别模型。
如权利要16所述的计算机可读存储介质，其特征在于，所述使用所述样本库中的用户行为数据训练BP神经网络模型和基于DBSCAN的分类模型的步骤包括：

获取所述样本库中的用户行为数据的来源信息，为能够获取到来源信息的用户行为数据添加类别标记；

将所述样本库中有类别标记的用户行为数据输入到BP神经网络模型中训练，以得到该BP神经网络模型的模型参数，将确定模型参数的BP神经网络模型作为BP神经网络人机识别模型；

将所述样本库中无类别标记的用户行为数据输入到基于DBSCAN的分类模型中训练，以得到该基于DBSCAN的分类模型的模型参数，将确定模型参数的基于DBSCAN的分类模型作为DBSCAN人机识别模型
如权利要16所述的计算机可读存储介质，其特征在于，所述根据所述第一人机识别规则、所述第二人机识别规则，以及训练得到的BP神经网络人机识别模型和DBSCAN人机识别模型构建融合人机识别模型，并使用所述样本库中的用户行为数据训练所述融合人机识别模型的步骤包括：

为第一人机识别规则A、第二人机识别规则B、BP神经网络人机识别模型C和DBSCAN人机识别模型D分别分配权重a1、a2、a3、a4，生成融合人机识别模型S，其中，S＝a1*A+a2*B+a3*C+a4*D；

使用所述样本库中的用户行为数据训练所述融合人机识别模型S，获取权重a1、a2、a3、a4的值。
如权利要17所述的计算机可读存储介质，其特征在于，所述根据所述第一人机识别规则、所述第二人机识别规则，以及训练得到的BP神经网络人机识别模型和DBSCAN人机识别模型构建融合人机识别模型，并使用所述样本库中的用户行为数据训练所述融合人机识别模型的步骤包括：

为第一人机识别规则A、第二人机识别规则B、BP神经网络人机识别模型C和DBSCAN人机识别模型D分别分配权重a1、a2、a3、a4，生成融合人机识别模型S，其中，S＝a1*A+a2*B+a3*C+a4*D；

使用所述样本库中的用户行为数据训练所述融合人机识别模型S，获取权重a1、a2、a3、a4的值。