CN108416198A - 人机识别模型的建立装置、方法及计算机可读存储介质 - Google Patents

人机识别模型的建立装置、方法及计算机可读存储介质 Download PDF

Info

Publication number
CN108416198A
CN108416198A CN201810114634.8A CN201810114634A CN108416198A CN 108416198 A CN108416198 A CN 108416198A CN 201810114634 A CN201810114634 A CN 201810114634A CN 108416198 A CN108416198 A CN 108416198A
Authority
CN
China
Prior art keywords
man
model
information
machine
machine identification
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201810114634.8A
Other languages
English (en)
Other versions
CN108416198B (zh
Inventor
韩伟
邓坤
王建明
肖京
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Technology Shenzhen Co Ltd
Original Assignee
Ping An Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Technology Shenzhen Co Ltd filed Critical Ping An Technology Shenzhen Co Ltd
Priority to CN201810114634.8A priority Critical patent/CN108416198B/zh
Priority to PCT/CN2018/089715 priority patent/WO2019153604A1/zh
Publication of CN108416198A publication Critical patent/CN108416198A/zh
Application granted granted Critical
Publication of CN108416198B publication Critical patent/CN108416198B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/30Authentication, i.e. establishing the identity or authorisation of security principals
    • G06F21/31User authentication
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2413Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
    • G06F18/24133Distances to prototypes
    • G06F18/24143Distances to neighbourhood prototypes, e.g. restricted Coulomb energy networks [RCEN]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/82Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2221/00Indexing scheme relating to security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F2221/21Indexing scheme relating to G06F21/00 and subgroups addressing additional information or applications relating to security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F2221/2133Verifying human interaction, e.g., Captcha
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Data Mining & Analysis (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Databases & Information Systems (AREA)
  • Biomedical Technology (AREA)
  • Multimedia (AREA)
  • Computer Security & Cryptography (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Computer Hardware Design (AREA)
  • Image Analysis (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种人机识别模型的建立装置,包括存储器和处理器,存储器上存储有可在处理器上运行的模型建立程序,该程序被处理器执行时实现如下步骤:收集滑动验证操作的用户行为数据构建样本库;对样本库中的浏览器信息和硬件信息进行统计分析并生成第一人机识别规则;根据页面轨迹信息和滑动轨迹信息生成第二人机识别规则;使用样本库中的数据训练BP神经网络模型和基于DBSCAN的分类模型;根据上述规则和模型构建融合人机识别模型,并训练该模型。本发明还提出一种人机识别模型的建立方法以及一种计算机可读存储介质。本发明解决了现有技术中无法准确识别机器操作的滑动验证码的技术问题。

Description

人机识别模型的建立装置、方法及计算机可读存储介质
技术领域
本发明涉及人机识别技术领域,尤其涉及一种人机识别模型的建立装置、方法及计算机可读存储介质。
背景技术
在验证码领域,区别于传统的图像识别验证码、文字识别验证码、算术计算验证码等方式,滑动验证码由于识别方式清晰直观,具有良好的用户体验,得到越来越多的企业的青睐。
而作为一种验证方式,为了保证信息的安全性,仍然需要进行人机识别,以判断滑动验证操作是恶意的机器操作,还是人为的正常登录操作。但是,目前在滑动验证码的人机识别上面并没有一个很好的解决方案,破解率非常高,因此,如何准确识别机器操作的滑动验证是各公司安全部门亟需解决的问题。
发明内容
本发明提供一种人机识别模型的建立装置、方法及计算机可读存储介质,其主要目的在于解决现有技术中无法准确识别机器操作的滑动验证码的技术问题。
为实现上述目的,本发明提供一种人机识别模型的建立装置,该装置包括存储器和处理器,所述存储器中存储有可在所述处理器上运行的模型建立程序,所述模型建立程序被所述处理器执行时实现如下步骤:
收集预设数量的滑动验证操作的用户行为数据构建样本库,所述滑动验证操作为基于浏览器触发,所述用户行为数据包括浏览器信息、硬件信息、页面轨迹信息和滑动轨迹信息;
对所述样本库中的浏览器信息和硬件信息进行统计分析,以确定有异常滑动操作的浏览器信息和硬件信息,并根据确定的浏览器信息和硬件信息生成第一人机识别规则;
对所述样本库中的页面轨迹信息和滑动轨迹信息进行统计分析,根据统计结果生成一个或者多个轨迹判断规则,根据所述一个或者多个轨迹判断规则生成第二人机识别规则;
使用所述样本库中的用户行为数据训练BP神经网络模型和基于DBSCAN的分类模型;
根据所述第一人机识别规则、所述第二人机识别规则,以及训练得到的BP神经网络人机识别模型和DBSCAN人机识别模型构建融合人机识别模型,并使用所述样本库中的用户行为数据训练所述融合人机识别模型。
可选地,所述对所述样本库中的浏览器信息和硬件信息进行统计分析,以确定有异常滑动操作的浏览器信息和硬件信息,并根据确定的浏览器信息和硬件信息生成第一人机识别规则的步骤包括:
统计所述样本库中的浏览器信息和硬件信息,当有浏览器信息和/或硬件信息对应的滑动操作在单位时间内的操作总数量分别达到对应的预设阈值时,判定该浏览器信息和/或硬件信息出现异常操作;
根据出现异常操作的硬件信息、浏览器信息生成所述第一人机识别规则。
可选地,所述使用所述样本库中的用户行为数据训练BP神经网络模型和基于DBSCAN的分类模型的步骤包括:
获取所述样本库中的用户行为数据的来源信息,为能够获取到来源信息的用户行为数据添加类别标记;
将所述样本库中有类别标记的用户行为数据输入到BP神经网络模型中训练,以得到该BP神经网络模型的模型参数,将确定模型参数的BP神经网络模型作为BP神经网络人机识别模型;
将所述样本库中无类别标记的用户行为数据输入到基于DBSCAN的分类模型中训练,以得到该基于DBSCAN的分类模型的模型参数,将确定模型参数的基于DBSCAN的分类模型作为DBSCAN人机识别模型。
可选地,所述根据所述第一人机识别规则、所述第二人机识别规则,以及训练得到的BP神经网络人机识别模型和DBSCAN人机识别模型构建融合人机识别模型,并使用所述样本库中的用户行为数据训练所述融合人机识别模型的步骤包括:
为第一人机识别规则A、第二人机识别规则B、BP神经网络人机识别模型C和DBSCAN人机识别模型D分别分配权重a1、a2、a3、a4,生成融合人机识别模型S,其中,S=a1*A+a2*B+a3*C+a4*D;
使用所述样本库中的用户行为数据训练所述融合人机识别模型S,获取权重a1、a2、a3、a4的值。
可选地,所述滑动轨迹信息为在滑动验证操作的过程中,滑块区域在滑动验证区域内移动的偏移量、移动速度和移动加速度;所述页面轨迹信息为鼠标指针在所述滑动验证区域所在的网页上移动的速度、位移和时间。
此外,为实现上述目的,本发明还提供一种人机识别模型的建立方法,该方法包括:
收集预设数量的滑动验证操作的用户行为数据构建样本库,所述滑动验证操作为基于浏览器触发,所述用户行为数据包括浏览器信息、硬件信息、页面轨迹信息和滑动轨迹信息;
对所述样本库中的浏览器信息和硬件信息进行统计分析,以确定有异常滑动操作的浏览器信息和硬件信息,并根据确定的浏览器信息和硬件信息生成第一人机识别规则;
对所述样本库中的页面轨迹信息和滑动轨迹信息进行统计分析,根据统计结果生成一个或者多个轨迹判断规则,根据所述一个或者多个轨迹判断规则生成第二人机识别规则;
使用所述样本库中的用户行为数据训练BP神经网络模型和基于DBSCAN的分类模型;
根据所述第一人机识别规则、所述第二人机识别规则,以及训练得到的BP神经网络人机识别模型和DBSCAN人机识别模型构建融合人机识别模型,并使用所述样本库中的用户行为数据训练所述融合人机识别模型。
可选地,所述对所述样本库中的浏览器信息和硬件信息进行统计分析,以确定有异常滑动操作的浏览器信息和硬件信息,并根据确定的浏览器信息和硬件信息生成第一人机识别规则的步骤包括:
统计所述样本库中的浏览器信息和硬件信息,当有浏览器信息和/或硬件信息对应的滑动操作在单位时间内的操作总数量分别达到对应的预设阈值时,判定该浏览器信息和/或硬件信息出现异常操作;
根据出现异常操作的硬件信息、浏览器信息生成所述第一人机识别规则。
可选地,所述使用所述样本库中的用户行为数据训练BP神经网络模型和基于DBSCAN的分类模型的步骤包括:
获取所述样本库中的用户行为数据的来源信息,为能够获取到来源信息的用户行为数据添加类别标记;
将所述样本库中有类别标记的用户行为数据输入到BP神经网络模型中训练,以得到该BP神经网络模型的模型参数,将确定模型参数的BP神经网络模型作为BP神经网络人机识别模型;
将所述样本库中无类别标记的用户行为数据输入到基于DBSCAN的分类模型中训练,以得到该基于DBSCAN的分类模型的模型参数,将确定模型参数的基于DBSCAN的分类模型作为DBSCAN人机识别模型。
可选地,所述根据所述第一人机识别规则、所述第二人机识别规则,以及训练得到的BP神经网络人机识别模型和DBSCAN人机识别模型构建融合人机识别模型,并使用所述样本库中的用户行为数据训练所述融合人机识别模型的步骤包括:
为第一人机识别规则A、第二人机识别规则B、BP神经网络人机识别模型C和DBSCAN人机识别模型D分别分配权重a1、a2、a3、a4,生成融合人机识别模型S,其中,S=a1*A+a2*B+a3*C+a4*D;
使用所述样本库中的用户行为数据训练所述融合人机识别模型S,获取权重a1、a2、a3、a4的值。
此外,为实现上述目的,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有模型建立程序,所述模型建立程序可被一个或者多个处理器执行,以实现如上所述的人机识别模型的建立方法的步骤。
本发明提出的人机识别模型的建立装置、方法及计算机可读存储介质,收集预设数量的滑动验证操作的用户行为数据并构建样本库,滑动验证操作为基于浏览器触发的,用户行为数据包括浏览器信息、硬件信息、页面轨迹信息和滑动轨迹信息,对样本库中的浏览器信息和硬件信息进行统计分析,以确定有异常滑动操作的浏览器信息和硬件信息,并根据确定的浏览器信息和硬件信息生成第一人机识别规则,对样本库中的页面轨迹信息和滑动轨迹信息进行统计分析,根据统计结果生成一个或者多个轨迹判断规则,根据一个或者多个轨迹判断规则生成第二人机识别规则,使用样本库中的用户行为数据训练BP神经网络模型和基于DBSCAN的分类模型,得到BP神经网络人机识别模型和DBSCAN人机识别模型,将上述得到的规则和模型构建为一个融合人机识别模型,并使用样本库中的用户行为数据训练该融合人机识别模型,训练得到的融合人机识别模型可以用来准确识别机器操作的滑动验证,本发明的方案根据收集的浏览器信息、硬件信息、页面轨迹信息以及滑动轨迹信息等用户行为数据生成规则并训练模型,并且用生成的多个规则或者模型构建一个融合人机识别模型,用来对机器操作的滑动操作进行识别,解决了现有技术中无法准确识别机器操作的滑动验证码的技术问题。
附图说明
图1为本发明人机识别模型的建立装置较佳实施例的示意图;
图2为本发明人机识别模型的建立装置一实施例中模型建立程序的程序模块示意图;
图3为本发明人机识别模型的建立方法较佳实施例的流程图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本发明提供一种人机识别模型的建立装置。参照图1所示,为本发明人机识别模型的建立装置较佳实施例的示意图。
在本实施例中,人机识别模型的建立装置可以是PC(Personal Computer,个人电脑),也可以是智能手机、平板电脑、便携计算机等终端设备。
该人机识别模型的建立装置至少包括存储器11、处理器12,通信总线13,以及网络接口14。
其中,存储器11至少包括一种类型的可读存储介质,所述可读存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如,SD或DX存储器等)、磁性存储器、磁盘、光盘等。存储器11在一些实施例中可以是人机识别模型的建立装置的内部存储单元,例如该人机识别模型的建立装置的硬盘。存储器11在另一些实施例中也可以是人机识别模型的建立装置的外部存储设备,例如人机识别模型的建立装置上配备的插接式硬盘,智能存储卡(Smart MediaCard,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。进一步地,存储器11还可以既包括人机识别模型的建立装置的内部存储单元也包括外部存储设备。存储器11不仅可以用于存储安装于人机识别模型的建立装置的应用软件及各类数据,例如模型建立程序的代码等,还可以用于暂时地存储已经输出或者将要输出的数据。
处理器12在一些实施例中可以是一中央处理器(Central Processing Unit,CPU)、控制器、微控制器、微处理器或其他数据处理芯片,用于运行存储器11中存储的程序代码或处理数据,例如执行模型建立程序等。
通信总线13用于实现这些组件之间的连接通信。
网络接口14可选的可以包括标准的有线接口、无线接口(如WI-FI接口),通常用于在该装置与其他电子设备之间建立通信连接。
图1仅示出了具有组件11-14以及模型建立程序的人机识别模型的建立装置,但是应理解的是,并不要求实施所有示出的组件,可以替代的实施更多或者更少的组件。
可选地,该装置还可以包括用户接口,用户接口可以包括显示器(Display)、输入单元比如键盘(Keyboard),可选的用户接口还可以包括标准的有线接口、无线接口。可选地,在一些实施例中,显示器可以是LED显示器、液晶显示器、触控式液晶显示器以及OLED(Organic Light-Emitting Diode,有机发光二极管)触摸器等。其中,显示器也可以适当的称为显示屏或显示单元,用于显示在人机识别模型的建立装置中处理的信息以及用于显示可视化的用户界面。
在图1所示的装置实施例中,存储器11中存储有模型建立程序;处理器12执行存储器11中存储的模型建立程序时实现如下步骤:
收集预设数量的滑动验证操作的用户行为数据构建样本库,所述滑动验证操作为基于浏览器触发,所述用户行为数据包括浏览器信息、硬件信息、页面轨迹信息和滑动轨迹信息。
根据用户访问系统的历史记录收集历史滑动验证操作的用户行为数据,这些用户行为数据中包括能够确定是人为操作的用户行为数据,也包括不能够确定是人为操作还是机器操作的用户行为数据。此外,还可以通过自动化脚本模拟机器操作,并采集用户行为数据。通过上述两种方式收集用户行为数据,并将这些数据添加到样本库中。可以理解的是,收集的用户行为数据越多,后续使用这些数据训练模型得到的结果也越准确。因此,预设数量的值可以由用户根据对模型的精准度的要求进行设置。
具体地,上述用户行为数据包括浏览器信息、硬件信息、页面轨迹信息和滑动轨迹信息,其中,浏览器信息和硬件信息可以通过滑动操作产生的cookie信息获取,用户基于浏览器上的网页访问系统时,系统会发送一个滑动验证的页面在网页上显示,该滑动验证的页面上设置有滑动验证区域,其中包含有滑块,以及需要将滑块移动到的目标区域,用户需要通过鼠标操作或者触摸操作将滑块移动到要求的目标区域以完成滑动验证。在用户执行滑动验证时,获取滑动操作产生的页面轨迹信息、滑动轨迹信息;并且从浏览器的cookie信息中获取浏览器信息和硬件信息,其中,滑动轨迹信息为在滑动验证操作的过程中,滑块区域在滑动验证区域内移动的偏移量、移动速度和移动加速度;页面轨迹信息为滑动验证操作之前以及之后的预设时长内,鼠标指针在滑动验证区域所在的网页上移动的速度、位移和时间。硬件信息包括但不限于用户终端的显示器参数、内存参数、物理地址等,浏览器信息可以为浏览器的型号、版本等信息。需要说明的是,样本库中的根据用户访问系统的历史记录收集历史滑动验证操作的用户行为数据,每一条数据都有该滑动操作的执行时间信息。
对所述样本库中的浏览器信息和硬件信息进行统计分析,以确定有异常滑动操作的浏览器信息和硬件信息,并根据确定的浏览器信息和硬件信息生成第一人机识别规则。
对样本库中大量的浏览器信息和硬件信息进行统计分析,当有浏览器信息和/或硬件信息对应的滑动操作在单位时间内的操作总数量分别达到对应的预设阈值时,判定该浏览器信息和/或硬件信息出现异常操作;根据出现异常操作的硬件信息、浏览器信息生成第一人机识别规则。其中,单位时间、以及操作总数量的预设阈值,可以根据网站的具体访问情况进行设置,例如单位时间可以设置为10分钟,即若通过某台设备上的浏览器,在10分钟内连续进行滑动验证操作的数量达到预设阈值,则判定该设备上执行的是异常操作,将该设备的硬件信息以及使用的浏览器信息作为所述出现异常操作的浏览器信息和/或硬件信息。对应地,根据这些异常操作的浏览器信息和/或硬件信息生成的第一人机识别规则可以是:若滑动验证操作的对应的用户行为数据中的浏览器信息和硬件信息与所述提取的异常操作的浏览器信息和/或硬件信息一致,则判定对应的滑动验证操作为异常滑动验证操作。
对所述样本库中的页面轨迹信息和滑动轨迹信息进行统计分析,根据统计结果生成一个或者多个轨迹判断规则,根据所述一个或者多个轨迹判断规则生成第二人机识别规则。
由于人为执行滑动验证操作时,难以保证滑块区域在移动过程中的移动速度和加速度的恒定不变,而且滑块区域的移动轨迹也会有一定的波动。而机器执行滑动验证操作时,是通过执行自动化脚本来实现的,因此,由机器执行的滑动验证操作的页面轨迹信息和滑动轨迹信息会符合一定的规律,这些规律可以通过对样本库中的页面轨迹信息和滑动轨迹信息的统计分析得到,进而根据分析结果生成一个或者多个轨迹判断规则。例如,如果滑块区域上的点在页面上的移动轨迹为直线或者移动轨迹的变化幅度小于预设阈值,则判定该滑动操作是机器操作;如果滑块区域在移动过程中的加速度为零或者恒定不变,则判定该滑动操作为机器操作;或者,每次滑块区域的移动距离完全相同,则判定该滑动操作为机器操作。将上述规则中的一个或者多个结合起来,设置为第二人机识别规则。例如,如果滑块区域上的点在页面上的移动轨迹为直线且滑块区域在移动过程中的加速度为零,则该滑动操作判定为机器操作。
使用所述样本库中的用户行为数据训练BP神经网络模型和基于DBSCAN的分类模型。
根据样本库中的用户行为数据的来源信息,为能够获取到来源信息的用户行为数据添加类别标记,即为能够确定是人为操作的用户行为数据和能够确定是机器操作的用户行为数据分别添加对应的类别标记,以标识其来源信息,而获取不到来源信息的用户行为数据,则没有类别标记。
将样本库中有类别标记的用户行为数据输入到BP神经网络模型中训练,以得到该BP神经网络模型的模型参数,将确定模型参数的BP神经网络模型作为BP神经网络人机识别模型。从上述样本库中的有类别标记的用户行为数据中提取特征,主要包括浏览器信息、硬件信息、滑块区域在滑动验证区域内移动的偏移量、移动速度和移动加速度,以及滑动验证操作之前以及之后的预设时长内,鼠标指针在滑动验证区域所在的网页上移动的速度、位移和时间,一共得到以上八个维度的特征,使用提取到的特征训练BP神经网络模型得到模型参数,将确定模型参数后BP神经网络模型作为BP神经网络人机识别模型。
将样本库中无类别标记的用户行为数据输入到DBSCAN(Density-Based SpatialClustering of Applications with Noise,具有噪声的基于密度的聚类方法)模型中训练,以得到该基于DBSCAN的分类模型的模型参数,将确定模型参数的基于DBSCAN的分类模型作为DBSCAN人机识别模型。按照上一步骤中同样的方式提取没有类别标记的用户行为数据中的特征,使用提取的特征训练基于DBSCAN的分类模型,DBSCAN是一种基于密度的聚类算法,它能够把具有足够高密度的区域划分为簇。也就是说,该算法是一种无监督的分类算法,对于即使没有类别标记的大量用户行为数据,也能够通过聚类的方式对样本集中的数据进行分类。使用没有类别标记的用户行为数据训练该模型,能够将数据分为两类,作为一种实施方式,可以由用户根据聚类的结果确定属于机器操作的聚类,并为其添加类别标签。在该模型的实际应用中,获取滑动验证的用户行为数据输入到该模型中,输出该用户行为数据所属的聚类,根据该聚类的标签判断本次滑动操作是否为机器操作。
根据所述第一人机识别规则、所述第二人机识别规则,以及训练得到的BP神经网络人机识别模型和DBSCAN人机识别模型构建融合人机识别模型,并使用所述样本库中的用户行为数据训练所述融合人机识别模型。
得到上述规则和模型之后,将其组合为一个融合人机识别模型,具体地,为第一人机识别规则A、第二人机识别规则B、BP神经网络人机识别模型C和DBSCAN人机识别模型D分别分配权重a1、a2、a3、a4,生成融合人机识别模型S,其中,S=a1*A+a2*B+a3*C+a4*D;使用所述样本库中的用户行为数据训练所述融合人机识别模型S,获取权重a1、a2、a3、a4的数值。模型S的输出结果为一个0~1的数值,在训练模型时,设置机器操作的模型输出结果为1,人为操作的模型输出结果为0,识别结果越准确的模型或规则,其对应的权重也越大,反之,其对应的权重越小。
该融合人机识别模型在实际应用中的验证流程如下:获取用户基于浏览器的滑动验证操作产生的页面轨迹信息、滑动轨迹信息,以及浏览器信息和硬件信息,从中提取出需要的特征输入到模型中,得到输出结果,根据输出结果判断是否为机器操作。融合模型S在实际使用过程中,用户可以根据实际情况预先设置输出结果的判断阈值,例如设为0.8,即当输出结果大于或等于0.8时,则判断本次互动验证操作为机器操作,可以阻止本次登录或者访问。
本实施例提出的人机识别模型的建立装置,收集预设数量的滑动验证操作的用户行为数据并构建样本库,滑动验证操作为基于浏览器触发的,用户行为数据包括浏览器信息、硬件信息、页面轨迹信息和滑动轨迹信息,对样本库中的浏览器信息和硬件信息进行统计分析,以确定有异常滑动操作的浏览器信息和硬件信息,并根据确定的浏览器信息和硬件信息生成第一人机识别规则,对样本库中的页面轨迹信息和滑动轨迹信息进行统计分析,根据统计结果生成一个或者多个轨迹判断规则,根据一个或者多个轨迹判断规则生成第二人机识别规则,使用样本库中的用户行为数据训练BP神经网络模型和基于DBSCAN的分类模型,得到BP神经网络人机识别模型和DBSCAN人机识别模型,将上述得到的规则和模型构建为一个融合人机识别模型,并使用样本库中的用户行为数据训练该融合人机识别模型,训练得到的融合人机识别模型可以用来准确识别机器操作的滑动验证,本发明的方案根据收集的浏览器信息、硬件信息、页面轨迹信息以及滑动轨迹信息等用户行为数据生成规则并训练模型,并且用生成的多个规则或者模型构建一个融合人机识别模型,用来对机器操作的滑动操作进行识别,解决了现有技术中无法准确识别机器操作的滑动验证码的技术问题。
可选地,在其他的实施例中,模型建立程序还可以被分割为一个或者多个模块,一个或者多个模块被存储于存储器11中,并由一个或多个处理器(本实施例为处理器12)所执行以完成本发明,本发明所称的模块是指能够完成特定功能的一系列计算机程序指令段,用于描述模型建立程序在人机识别模型的建立装置中的执行过程。
例如,参照图2所示,为本发明人机识别模型的建立装置一实施例中的模型建立程序的程序模块示意图,该实施例中,模型建立程序可以被分割为样本收集模块10、规则生成模块20、模型训练模块30和模型融合模块40,示例性地:
样本收集模块10用于:收集预设数量的滑动验证操作的用户行为数据构建样本库,所述滑动验证操作为基于浏览器触发,所述用户行为数据包括浏览器信息、硬件信息、页面轨迹信息和滑动轨迹信息;
规则生成模块20用于:对所述样本库中的浏览器信息和硬件信息进行统计分析,以确定有异常滑动操作的浏览器信息和硬件信息,并根据确定的浏览器信息和硬件信息生成第一人机识别规则;
以及,对所述样本库中的页面轨迹信息和滑动轨迹信息进行统计分析,根据统计结果生成一个或者多个轨迹判断规则,根据所述一个或者多个轨迹判断规则生成第二人机识别规则;
模型训练模块30用于:使用所述样本库中的用户行为数据训练BP神经网络模型和基于DBSCAN的分类模型;
模型融合模块40用于:根据所述第一人机识别规则、所述第二人机识别规则,以及训练得到的BP神经网络人机识别模型和DBSCAN人机识别模型构建融合人机识别模型,并使用所述样本库中的用户行为数据训练所述融合人机识别模型。
上述样本收集模块10、规则生成模块20、模型训练模块30和模型融合模块4等程序模块被执行时所实现的功能或操作步骤与上述实施例大体相同,在此不再赘述。
此外,本发明还提供一种人机识别模型的建立方法。参照图3所示,为本发明人机识别模型的建立方法较佳实施例的流程图。该方法可以由一个装置执行,该装置可以由软件和/或硬件实现。
在本实施例中,人机识别模型的建立方法包括:
步骤S10,收集预设数量的滑动验证操作的用户行为数据构建样本库,所述滑动验证操作为基于浏览器触发,所述用户行为数据包括浏览器信息、硬件信息、页面轨迹信息和滑动轨迹信息。
根据用户访问系统的历史记录收集历史滑动验证操作的用户行为数据,这些用户行为数据中包括能够确定是人为操作的用户行为数据,也包括不能够确定是人为操作还是机器操作的用户行为数据。此外,还可以通过自动化脚本模拟机器操作采集用户行为数据。通过上述两种方式收集用户行为数据,并将这些数据添加到样本库中。可以理解的是,收集的用户行为数据越多,后续使用这些数据训练模型得到的结果也越准确。因此,预设数量的值可以由用户根据对模型的精准度的要求进行设置。
具体地,上述用户行为数据包括浏览器信息、硬件信息、页面轨迹信息和滑动轨迹信息,其中,浏览器信息和硬件信息可以通过滑动操作产生的cookie信息获取,用户基于浏览器上的网页访问系统时,系统会发送一个滑动验证的页面在网页上显示,该滑动验证的页面上设置有滑动验证区域,其中包含有滑块,以及需要将滑块移动到的目标区域,用户需要通过鼠标操作或者触摸操作将滑块移动到要求的目标区域以完成滑动验证。在用户执行滑动验证时,获取滑动操作产生的页面轨迹信息、滑动轨迹信息;并且从浏览器的cookie信息中获取浏览器信息和硬件信息,其中,滑动轨迹信息为在滑动验证操作的过程中,滑块区域在滑动验证区域内移动的偏移量、移动速度和移动加速度;页面轨迹信息为滑动验证操作之前以及之后的预设时长内,鼠标指针在滑动验证区域所在的网页上移动的速度、位移和时间。硬件信息包括但不限于用户终端的显示器参数、内存参数、物理地址等,浏览器信息可以为浏览器的型号、版本等信息。需要说明的是,样本库中的根据用户访问系统的历史记录收集历史滑动验证操作的用户行为数据,每一条数据都有该滑动操作的执行时间信息。
步骤S20,对所述样本库中的浏览器信息和硬件信息进行统计分析,以确定有异常滑动操作的浏览器信息和硬件信息,并根据确定的浏览器信息和硬件信息生成第一人机识别规则。
对样本库中大量的浏览器信息和硬件信息进行统计分析,提取出异常的用户行为数据出现较多的硬件信息和浏览器信息,例如,步骤S20可以包括如下细化步骤:
统计所述样本库中的浏览器信息和硬件信息,当有浏览器信息和/或硬件信息对应的滑动操作在单位时间内的操作总数量分别达到对应的预设阈值时,判定该浏览器信息和/或硬件信息出现异常操作;根据出现异常操作的硬件信息、浏览器信息生成所述第一人机识别规则。
单位时间、以及操作总数量的预设阈值,可以根据网站的具体访问情况进行设置,例如单位时间可以设置为10分钟,即若通过某台设备上的浏览器,在10分钟内连续进行滑动验证操作的数量达到预设阈值,则判定该设备上执行的是异常操作,将该设备的硬件信息以及使用的浏览器信息作为所述出现异常操作的浏览器信息和/或硬件信息。对应地,根据这些异常操作的浏览器信息和/或硬件信息生成的第一人机识别规则可以是:若滑动验证操作的对应的用户行为数据中的浏览器信息和硬件信息与所述提取的异常操作的浏览器信息和/或硬件信息一致,则判定对应的滑动验证操作为异常滑动验证操作。
步骤S30,对所述样本库中的页面轨迹信息和滑动轨迹信息进行统计分析,根据统计结果生成一个或者多个轨迹判断规则,根据所述一个或者多个轨迹判断规则生成第二人机识别规则。
由于人为执行滑动验证操作时,难以保证滑块区域在移动过程中的移动速度和加速度的恒定不变,而且滑块区域的移动轨迹也会有一定的波动。而机器执行滑动验证操作时,是通过执行自动化脚本来实现的,因此,由机器执行的滑动验证操作的页面轨迹信息和滑动轨迹信息会符合一定的规律,这些规律可以通过对样本库中的页面轨迹信息和滑动轨迹信息的统计分析得到,进而根据分析结果生成一个或者多个轨迹判断规则。例如,如果滑块区域的上的点在页面上的移动轨迹为直线或者移动轨迹的变化幅度小于预设阈值,则判定该滑动操作是机器操作;如果滑块区域在移动过程中的加速度为零或者恒定不变,则判定该滑动操作为机器操作;或者,每次滑块区域的移动距离完全相同,则判定该滑动操作为机器操作。将上述规则中的一个或者多个结合起来,设置为第二人机识别规则。例如,如果滑块区域上的点在页面上的移动轨迹为直线且滑块区域在移动过程中的加速度为零,则该滑动操作判定为机器操作。
步骤S40,使用所述样本库中的用户行为数据训练BP神经网络模型和基于DBSCAN的分类模型。
根据样本库中的用户行为数据的来源信息,为能够获取到来源信息的用户行为数据添加类别标记,即为能够确定是人为操作的用户行为数据和能够确定是机器操作的用户行为数据分别添加对应的类别标记,以标识其来源信息,而获取不到来源信息的用户行为数据,则没有类别标记。
步骤S40可以包括如下细化步骤:
获取样本库中的用户行为数据的来源信息,为能够获取到来源信息的用户行为数据添加类别标记;将样本库中有类别标记的用户行为数据输入到BP神经网络模型中训练,以得到该BP神经网络模型的模型参数,将确定模型参数的BP神经网络模型作为BP神经网络人机识别模型;将样本库中无类别标记的用户行为数据输入到基于DBSCAN的分类模型中训练,以得到该基于DBSCAN的分类模型的模型参数,将确定模型参数的基于DBSCAN的分类模型作为DBSCAN人机识别模型。
将样本库中有类别标记的用户行为数据输入到BP神经网络模型中训练,以得到该BP神经网络模型的模型参数,将确定模型参数的BP神经网络模型作为BP神经网络人机识别模型。从上述样本库中的有类别标记的用户行为数据中提取特征,主要包括浏览器信息、硬件信息、滑块区域在滑动验证区域内移动的偏移量、移动速度和移动加速度,以及滑动验证操作之前以及之后的预设时长内,鼠标指针在滑动验证区域所在的网页上移动的速度、位移和时间,一共得到以上八个维度的特征,使用提取到的特征训练BP神经网络模型得到模型参数,将确定模型参数后BP神经网络模型作为BP神经网络人机识别模型。
将样本库中无类别标记的用户行为数据输入到DBSCAN(Density-Based SpatialClustering of Applications with Noise,具有噪声的基于密度的聚类方法)模型中训练,以得到该基于DBSCAN的分类模型的模型参数,将确定模型参数的基于DBSCAN的分类模型作为DBSCAN人机识别模型。按照上一步骤中同样的方式提取没有类别标记的用户行为数据中的特征,使用提取的特征训练基于DBSCAN的分类模型,DBSCAN是一种基于密度的聚类算法,它能够把具有足够高密度的区域划分为簇。也就是说,该算法是一种无监督的分类算法,对于即使没有类别标记的大量用户行为数据,也能够通过聚类的方式对样本集中的数据进行分类。使用没有类别标记的用户行为数据训练该模型,能够将数据分为两类,作为一种实施方式,可以由用户根据聚类的结果确定属于机器操作的聚类,并为其添加类别标签。在该模型的实际应用中,获取滑动验证的用户行为数据输入到该模型中,输出该用户行为数据所属的聚类,根据该聚类的标签判断本次滑动操作是否为机器操作。
步骤S50,根据所述第一人机识别规则、所述第二人机识别规则,以及训练得到的BP神经网络人机识别模型和DBSCAN人机识别模型构建融合人机识别模型,并使用所述样本库中的用户行为数据训练所述融合人机识别模型。
得到上述规则和模型之后,将其组合为一个融合人机识别模型,具体地,为第一人机识别规则A、第二人机识别规则B、BP神经网络人机识别模型C和DBSCAN人机识别模型D分别分配权重a1、a2、a3、a4,生成融合人机识别模型S,其中,S=a1*A+a2*B+a3*C+a4*D;使用所述样本库中的用户行为数据训练所述融合人机识别模型S,获取权重a1、a2、a3、a4的数值。模型S的输出结果为一个0~1的数值,在训练模型时,设置机器操作的模型输出结果为1,人为操作的模型输出结果为0,识别结果越准确的模型或规则,其对应的权重也越大,反之,其对应的权重越小。
该融合人机识别模型在实际应用中的验证流程如下:获取用户基于浏览器的滑动验证操作产生的页面轨迹信息、滑动轨迹信息,以及浏览器信息和硬件信息,从中提取出需要的特征输入到模型中,得到输出结果,根据输出结果判断是否为机器操作。融合模型S在实际使用过程中,用户可以根据实际情况预先设置输出结果的判断阈值,例如设为0.8,即当输出结果大于或等于0.8时,则判断本次互动验证操作为机器操作,可以阻止本次登录或者访问。
本实施例提出的人机识别模型的建立方法,收集预设数量的滑动验证操作的用户行为数据并构建样本库,滑动验证操作为基于浏览器触发的,用户行为数据包括浏览器信息、硬件信息、页面轨迹信息和滑动轨迹信息,对样本库中的浏览器信息和硬件信息进行统计分析,以确定有异常滑动操作的浏览器信息和硬件信息,并根据确定的浏览器信息和硬件信息生成第一人机识别规则,对样本库中的页面轨迹信息和滑动轨迹信息进行统计分析,根据统计结果生成一个或者多个轨迹判断规则,根据一个或者多个轨迹判断规则生成第二人机识别规则,使用样本库中的用户行为数据训练BP神经网络模型和基于DBSCAN的分类模型,得到BP神经网络人机识别模型和DBSCAN人机识别模型,将上述得到的规则和模型构建为一个融合人机识别模型,并使用样本库中的用户行为数据训练该融合人机识别模型,训练得到的融合人机识别模型可以用来准确识别机器操作的滑动验证,本发明的方案根据收集的浏览器信息、硬件信息、页面轨迹信息以及滑动轨迹信息等用户行为数据生成规则并训练模型,并且用生成的多个规则或者模型构建一个融合人机识别模型,用来对机器操作的滑动操作进行识别,解决了现有技术中无法准确识别机器操作的滑动验证码的技术问题。
此外,本发明还提出一种计算机可读存储介质,所述计算机可读存储介质上存储有模型建立程序,所述模型建立程序可被一个或多个处理器执行,以实现如下操作:
收集预设数量的滑动验证操作的用户行为数据构建样本库,所述滑动验证操作为基于浏览器触发,所述用户行为数据包括浏览器信息、硬件信息、页面轨迹信息和滑动轨迹信息;
对所述样本库中的浏览器信息和硬件信息进行统计分析,以确定有异常滑动操作的浏览器信息和硬件信息,并根据确定的浏览器信息和硬件信息生成第一人机识别规则;
对所述样本库中的页面轨迹信息和滑动轨迹信息进行统计分析,根据统计结果生成一个或者多个轨迹判断规则,根据所述一个或者多个轨迹判断规则生成第二人机识别规则;
使用所述样本库中的用户行为数据训练BP神经网络模型和基于DBSCAN的分类模型;
根据所述第一人机识别规则、所述第二人机识别规则,以及训练得到的BP神经网络人机识别模型和DBSCAN人机识别模型构建融合人机识别模型,并使用所述样本库中的用户行为数据训练所述融合人机识别模型。
本发明计算机可读存储介质具体实施方式与上述人机识别模型的建立装置和方法各实施例基本相同,在此不作累述。
需要说明的是,上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。并且本文中的术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、装置、物品或者方法不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、装置、物品或者方法所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、装置、物品或者方法中还存在另外的相同要素。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在如上所述的一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (10)

1.一种人机识别模型的建立装置,其特征在于,所述装置包括存储器和处理器,所述存储器上存储有可在所述处理器上运行的模型建立程序,所述模型建立程序被所述处理器执行时实现如下步骤:
收集预设数量的滑动验证操作的用户行为数据构建样本库,所述滑动验证操作为基于浏览器触发,所述用户行为数据包括浏览器信息、硬件信息、页面轨迹信息和滑动轨迹信息;
对所述样本库中的浏览器信息和硬件信息进行统计分析,以确定有异常滑动操作的浏览器信息和硬件信息,并根据确定的浏览器信息和硬件信息生成第一人机识别规则;
对所述样本库中的页面轨迹信息和滑动轨迹信息进行统计分析,根据统计结果生成一个或者多个轨迹判断规则,根据所述一个或者多个轨迹判断规则生成第二人机识别规则;
使用所述样本库中的用户行为数据训练BP神经网络模型和基于DBSCAN的分类模型;
根据所述第一人机识别规则、所述第二人机识别规则,以及训练得到的BP神经网络人机识别模型和DBSCAN人机识别模型构建融合人机识别模型,并使用所述样本库中的用户行为数据训练所述融合人机识别模型。
2.如权利要求1所述的人机识别模型的建立装置,其特征在于,所述对所述样本库中的浏览器信息和硬件信息进行统计分析,以确定有异常滑动操作的浏览器信息和硬件信息,并根据确定的浏览器信息和硬件信息生成第一人机识别规则的步骤包括:
统计所述样本库中的浏览器信息和硬件信息,当有浏览器信息和/或硬件信息对应的滑动操作在单位时间内的操作总数量分别达到对应的预设阈值时,判定该浏览器信息和/或硬件信息出现异常操作;
根据出现异常操作的硬件信息、浏览器信息生成所述第一人机识别规则。
3.如权利要求1所述的人机识别模型的建立装置,其特征在于,所述使用所述样本库中的用户行为数据训练BP神经网络模型和基于DBSCAN的分类模型的步骤包括:
获取所述样本库中的用户行为数据的来源信息,为能够获取到来源信息的用户行为数据添加类别标记;
将所述样本库中有类别标记的用户行为数据输入到BP神经网络模型中训练,以得到该BP神经网络模型的模型参数,将确定模型参数的BP神经网络模型作为BP神经网络人机识别模型;
将所述样本库中无类别标记的用户行为数据输入到基于DBSCAN的分类模型中训练,以得到该基于DBSCAN的分类模型的模型参数,将确定模型参数的基于DBSCAN的分类模型作为DBSCAN人机识别模型。
4.如权利要求1至3中任一项所述的人机识别模型的建立装置,其特征在于,所述根据所述第一人机识别规则、所述第二人机识别规则,以及训练得到的BP神经网络人机识别模型和DBSCAN人机识别模型构建融合人机识别模型,并使用所述样本库中的用户行为数据训练所述融合人机识别模型的步骤包括:
为第一人机识别规则A、第二人机识别规则B、BP神经网络人机识别模型C和DBSCAN人机识别模型D分别分配权重a1、a2、a3、a4,生成融合人机识别模型S,其中,S=a1*A+a2*B+a3*C+a4*D;
使用所述样本库中的用户行为数据训练所述融合人机识别模型S,获取权重a1、a2、a3、a4的值。
5.如权利要求4所述的人机识别模型的建立装置,其特征在于,所述滑动轨迹信息为在滑动验证操作的过程中,滑块区域在滑动验证区域内移动的偏移量、移动速度和移动加速度;所述页面轨迹信息为鼠标指针在所述滑动验证区域所在的网页上移动的速度、位移和时间。
6.一种人机识别模型的建立方法,其特征在于,所述方法包括:
收集预设数量的滑动验证操作的用户行为数据构建样本库,所述滑动验证操作为基于浏览器触发,所述用户行为数据包括浏览器信息、硬件信息、页面轨迹信息和滑动轨迹信息;
对所述样本库中的浏览器信息和硬件信息进行统计分析,以确定有异常滑动操作的浏览器信息和硬件信息,并根据确定的浏览器信息和硬件信息生成第一人机识别规则;
对所述样本库中的页面轨迹信息和滑动轨迹信息进行统计分析,根据统计结果生成一个或者多个轨迹判断规则,根据所述一个或者多个轨迹判断规则生成第二人机识别规则;
使用所述样本库中的用户行为数据训练BP神经网络模型和基于DBSCAN的分类模型;
根据所述第一人机识别规则、所述第二人机识别规则,以及训练得到的BP神经网络人机识别模型和DBSCAN人机识别模型构建融合人机识别模型,并使用所述样本库中的用户行为数据训练所述融合人机识别模型。
7.如权利要求6所述的人机识别模型的建立方法,其特征在于,所述对所述样本库中的浏览器信息和硬件信息进行统计分析,以确定有异常滑动操作的浏览器信息和硬件信息,并根据确定的浏览器信息和硬件信息生成第一人机识别规则的步骤包括:
统计所述样本库中的浏览器信息和硬件信息,当有浏览器信息和/或硬件信息对应的滑动操作在单位时间内的操作总数量分别达到对应的预设阈值时,判定该浏览器信息和/或硬件信息出现异常操作;
根据出现异常操作的硬件信息、浏览器信息生成所述第一人机识别规则。
8.如权利要求6所述的人机识别模型的建立方法,其特征在于,所述使用所述样本库中的用户行为数据训练BP神经网络模型和基于DBSCAN的分类模型的步骤包括:
获取所述样本库中的用户行为数据的来源信息,为能够获取到来源信息的用户行为数据添加类别标记;
将所述样本库中有类别标记的用户行为数据输入到BP神经网络模型中训练,以得到该BP神经网络模型的模型参数,将确定模型参数的BP神经网络模型作为BP神经网络人机识别模型;
将所述样本库中无类别标记的用户行为数据输入到基于DBSCAN的分类模型中训练,以得到该基于DBSCAN的分类模型的模型参数,将确定模型参数的基于DBSCAN的分类模型作为DBSCAN人机识别模型。
9.如权利要求6至8中任一项所述的人机识别模型的建立方法,其特征在于,所述根据所述第一人机识别规则、所述第二人机识别规则,以及训练得到的BP神经网络人机识别模型和DBSCAN人机识别模型构建融合人机识别模型,并使用所述样本库中的用户行为数据训练所述融合人机识别模型的步骤包括:
为第一人机识别规则A、第二人机识别规则B、BP神经网络人机识别模型C和DBSCAN人机识别模型D分别分配权重a1、a2、a3、a4,生成融合人机识别模型S,其中,S=a1*A+a2*B+a3*C+a4*D;
使用所述样本库中的用户行为数据训练所述融合人机识别模型S,获取权重a1、a2、a3、a4的值。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有模型建立程序,所述模型建立程序可被一个或者多个处理器执行,以实现如权利要求6至9中任一项所述的人机识别模型的建立方法的步骤。
CN201810114634.8A 2018-02-06 2018-02-06 人机识别模型的建立装置、方法及计算机可读存储介质 Active CN108416198B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201810114634.8A CN108416198B (zh) 2018-02-06 2018-02-06 人机识别模型的建立装置、方法及计算机可读存储介质
PCT/CN2018/089715 WO2019153604A1 (zh) 2018-02-06 2018-06-03 人机识别模型的建立装置、方法及计算机可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810114634.8A CN108416198B (zh) 2018-02-06 2018-02-06 人机识别模型的建立装置、方法及计算机可读存储介质

Publications (2)

Publication Number Publication Date
CN108416198A true CN108416198A (zh) 2018-08-17
CN108416198B CN108416198B (zh) 2022-02-01

Family

ID=63127702

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810114634.8A Active CN108416198B (zh) 2018-02-06 2018-02-06 人机识别模型的建立装置、方法及计算机可读存储介质

Country Status (2)

Country Link
CN (1) CN108416198B (zh)
WO (1) WO2019153604A1 (zh)

Cited By (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109086594A (zh) * 2018-09-21 2018-12-25 郑州云海信息技术有限公司 一种实现滑动型验证码验证的方法、装置及系统
CN109124635A (zh) * 2018-09-25 2019-01-04 上海联影医疗科技有限公司 模型生成方法、磁共振成像扫描方法及系统
CN109299592A (zh) * 2018-09-29 2019-02-01 武汉极意网络科技有限公司 人机行为特征边界构建方法、系统、服务器及存储介质
CN109660556A (zh) * 2019-01-11 2019-04-19 平安科技(深圳)有限公司 基于信息安全的用户登陆方法、装置、设备和存储介质
CN109685104A (zh) * 2018-11-15 2019-04-26 同盾控股有限公司 一种识别模型的确定方法和装置
CN109766915A (zh) * 2018-12-14 2019-05-17 深圳壹账通智能科技有限公司 基于图像识别的测试方法、装置、计算机设备及存储介质
CN109784015A (zh) * 2018-12-27 2019-05-21 腾讯科技(深圳)有限公司 一种身份鉴别方法及装置
CN109858230A (zh) * 2019-01-08 2019-06-07 平安科技(深圳)有限公司 滑块验证方法、装置、计算机设备及存储介质
CN109902470A (zh) * 2019-01-08 2019-06-18 平安科技(深圳)有限公司 滑块验证方法、装置、计算机设备及存储介质
CN109977641A (zh) * 2019-03-25 2019-07-05 山东浪潮云信息技术有限公司 一种基于行为分析的验证处理方法及系统
CN110046647A (zh) * 2019-03-08 2019-07-23 同盾控股有限公司 一种验证码机器行为识别方法及装置
CN110162939A (zh) * 2018-10-25 2019-08-23 腾讯科技(深圳)有限公司 人机识别方法、设备和介质
CN110569906A (zh) * 2019-09-10 2019-12-13 京东数字科技控股有限公司 数据处理方法、数据处理装置及计算机可读存储介质
CN110768980A (zh) * 2019-10-22 2020-02-07 武汉极意网络科技有限公司 网络人机验证方法、装置、设备及存储介质
CN110807183A (zh) * 2019-10-12 2020-02-18 广州多益网络股份有限公司 一种多维度特征体系的滑动验证码人机行为识别方法
CN111147431A (zh) * 2018-11-06 2020-05-12 北京京东尚科信息技术有限公司 用于生成信息的方法和装置
CN111787009A (zh) * 2020-06-30 2020-10-16 北京明略昭辉科技有限公司 一种异常流量判断方法及装置
CN111782068A (zh) * 2019-04-04 2020-10-16 阿里巴巴集团控股有限公司 鼠标轨迹生成的方法、装置和系统以及数据处理的方法
WO2020252932A1 (zh) * 2019-06-20 2020-12-24 平安科技(深圳)有限公司 操作行为的人机识别方法、装置及计算机设备
CN113126794A (zh) * 2019-12-31 2021-07-16 京东数字科技控股有限公司 异常操作识别方法、装置和计算机可读存储介质
CN113900889A (zh) * 2021-09-18 2022-01-07 百融至信(北京)征信有限公司 一种智能识别app人为操作的方法及系统

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110516422B (zh) * 2019-08-30 2021-05-07 北京字节跳动网络技术有限公司 用户身份的识别方法、装置、电子设备及存储介质
CN113449297A (zh) * 2020-03-24 2021-09-28 中移动信息技术有限公司 恶意代码识别模型的训练方法、恶意代码识别方法及装置
CN111552457A (zh) * 2020-03-30 2020-08-18 深圳壹账通智能科技有限公司 基于语句识别的前端开发页面构建方法、装置及存储介质
CN111666968A (zh) * 2020-04-21 2020-09-15 北京奇艺世纪科技有限公司 人机识别方法及装置、电子设备、计算机可读存储介质
CN111598796B (zh) * 2020-04-27 2023-09-05 Oppo广东移动通信有限公司 图像处理方法及装置、电子设备、存储介质
CN111831991A (zh) * 2020-07-24 2020-10-27 中国工商银行股份有限公司 输入操作检测方法、装置、计算设备和介质
CN113554515A (zh) * 2021-06-26 2021-10-26 陈思佳 互联网金融控制方法、系统、设备及介质

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102737019A (zh) * 2011-03-31 2012-10-17 阿里巴巴集团控股有限公司 机器行为确定方法、网页浏览器及网页服务器
CN104239758A (zh) * 2013-06-13 2014-12-24 阿里巴巴集团控股有限公司 一种人机识别方法及相应的人机识别系统
CN105989268A (zh) * 2015-03-02 2016-10-05 苏宁云商集团股份有限公司 一种人机识别的安全访问方法和系统
CN106155298A (zh) * 2015-04-21 2016-11-23 阿里巴巴集团控股有限公司 人机识别方法及装置、行为特征数据的采集方法及装置
CN106815514A (zh) * 2015-11-27 2017-06-09 阿里巴巴集团控股有限公司 一种人机识别方法及装置
CN107153786A (zh) * 2017-05-26 2017-09-12 北京奇点数聚科技有限公司 一种人机识别方法、系统及终端设备、可读存储介质
CN107463878A (zh) * 2017-07-05 2017-12-12 成都数联铭品科技有限公司 基于深度学习的人体行为识别系统

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9471767B2 (en) * 2014-08-22 2016-10-18 Oracle International Corporation CAPTCHA techniques utilizing traceable images

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102737019A (zh) * 2011-03-31 2012-10-17 阿里巴巴集团控股有限公司 机器行为确定方法、网页浏览器及网页服务器
CN104239758A (zh) * 2013-06-13 2014-12-24 阿里巴巴集团控股有限公司 一种人机识别方法及相应的人机识别系统
CN105989268A (zh) * 2015-03-02 2016-10-05 苏宁云商集团股份有限公司 一种人机识别的安全访问方法和系统
CN106155298A (zh) * 2015-04-21 2016-11-23 阿里巴巴集团控股有限公司 人机识别方法及装置、行为特征数据的采集方法及装置
CN106815514A (zh) * 2015-11-27 2017-06-09 阿里巴巴集团控股有限公司 一种人机识别方法及装置
CN107153786A (zh) * 2017-05-26 2017-09-12 北京奇点数聚科技有限公司 一种人机识别方法、系统及终端设备、可读存储介质
CN107463878A (zh) * 2017-07-05 2017-12-12 成都数联铭品科技有限公司 基于深度学习的人体行为识别系统

Cited By (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109086594A (zh) * 2018-09-21 2018-12-25 郑州云海信息技术有限公司 一种实现滑动型验证码验证的方法、装置及系统
CN109124635A (zh) * 2018-09-25 2019-01-04 上海联影医疗科技有限公司 模型生成方法、磁共振成像扫描方法及系统
CN109299592A (zh) * 2018-09-29 2019-02-01 武汉极意网络科技有限公司 人机行为特征边界构建方法、系统、服务器及存储介质
CN110162939A (zh) * 2018-10-25 2019-08-23 腾讯科技(深圳)有限公司 人机识别方法、设备和介质
CN110162939B (zh) * 2018-10-25 2023-05-02 腾讯科技(深圳)有限公司 人机识别方法、设备和介质
CN111147431A (zh) * 2018-11-06 2020-05-12 北京京东尚科信息技术有限公司 用于生成信息的方法和装置
CN109685104A (zh) * 2018-11-15 2019-04-26 同盾控股有限公司 一种识别模型的确定方法和装置
CN109685104B (zh) * 2018-11-15 2022-05-13 同盾控股有限公司 一种识别模型的确定方法和装置
CN109766915A (zh) * 2018-12-14 2019-05-17 深圳壹账通智能科技有限公司 基于图像识别的测试方法、装置、计算机设备及存储介质
WO2020119419A1 (zh) * 2018-12-14 2020-06-18 深圳壹账通智能科技有限公司 基于图像识别的测试方法、装置、计算机设备及存储介质
CN109784015B (zh) * 2018-12-27 2023-05-12 腾讯科技(深圳)有限公司 一种身份鉴别方法及装置
CN109784015A (zh) * 2018-12-27 2019-05-21 腾讯科技(深圳)有限公司 一种身份鉴别方法及装置
CN109902470A (zh) * 2019-01-08 2019-06-18 平安科技(深圳)有限公司 滑块验证方法、装置、计算机设备及存储介质
CN109858230A (zh) * 2019-01-08 2019-06-07 平安科技(深圳)有限公司 滑块验证方法、装置、计算机设备及存储介质
CN109660556B (zh) * 2019-01-11 2022-11-29 平安科技(深圳)有限公司 基于信息安全的用户登陆方法、装置、设备和存储介质
CN109660556A (zh) * 2019-01-11 2019-04-19 平安科技(深圳)有限公司 基于信息安全的用户登陆方法、装置、设备和存储介质
CN110046647A (zh) * 2019-03-08 2019-07-23 同盾控股有限公司 一种验证码机器行为识别方法及装置
CN109977641A (zh) * 2019-03-25 2019-07-05 山东浪潮云信息技术有限公司 一种基于行为分析的验证处理方法及系统
CN111782068A (zh) * 2019-04-04 2020-10-16 阿里巴巴集团控股有限公司 鼠标轨迹生成的方法、装置和系统以及数据处理的方法
WO2020252932A1 (zh) * 2019-06-20 2020-12-24 平安科技(深圳)有限公司 操作行为的人机识别方法、装置及计算机设备
CN110569906A (zh) * 2019-09-10 2019-12-13 京东数字科技控股有限公司 数据处理方法、数据处理装置及计算机可读存储介质
CN110569906B (zh) * 2019-09-10 2022-08-09 京东科技控股股份有限公司 数据处理方法、数据处理装置及计算机可读存储介质
CN110807183A (zh) * 2019-10-12 2020-02-18 广州多益网络股份有限公司 一种多维度特征体系的滑动验证码人机行为识别方法
CN110768980B (zh) * 2019-10-22 2022-04-05 武汉极意网络科技有限公司 网络人机验证方法、装置、设备及存储介质
CN110768980A (zh) * 2019-10-22 2020-02-07 武汉极意网络科技有限公司 网络人机验证方法、装置、设备及存储介质
CN113126794A (zh) * 2019-12-31 2021-07-16 京东数字科技控股有限公司 异常操作识别方法、装置和计算机可读存储介质
CN111787009A (zh) * 2020-06-30 2020-10-16 北京明略昭辉科技有限公司 一种异常流量判断方法及装置
CN113900889A (zh) * 2021-09-18 2022-01-07 百融至信(北京)征信有限公司 一种智能识别app人为操作的方法及系统
CN113900889B (zh) * 2021-09-18 2023-10-24 百融至信(北京)科技有限公司 一种智能识别app人为操作的方法及系统

Also Published As

Publication number Publication date
CN108416198B (zh) 2022-02-01
WO2019153604A1 (zh) 2019-08-15

Similar Documents

Publication Publication Date Title
CN108416198A (zh) 人机识别模型的建立装置、方法及计算机可读存储介质
CN108629043A (zh) 网页目标信息的提取方法、装置及存储介质
CN103530540B (zh) 基于人机交互行为特征的用户身份属性检测方法
CN104318138B (zh) 一种验证用户身份的方法和装置
US9298912B2 (en) System and method for distinguishing human swipe input sequence behavior and using a confidence value on a score to detect fraudsters
CN109241709A (zh) 基于滑块验证码验证的用户行为识别方法及装置
CN107818344A (zh) 用户行为进行分类和预测的方法和系统
CN104993962B (zh) 获取终端使用状态的方法和系统
CN107958230A (zh) 人脸表情识别方法及装置
CN106650780A (zh) 数据处理方法及装置、分类器训练方法及系统
CN106446287A (zh) 面向众包场景问答系统答案聚合方法和系统
DE112016004922T5 (de) Konstruktions- und Analysesystem des Berührungsbildschirmnutzer-Schaltflächenverhaltenmodus und dessen Identitätserkennungsverfahren
CN107463878A (zh) 基于深度学习的人体行为识别系统
CN107437038A (zh) 一种网页篡改的检测方法及装置
CN112329816A (zh) 数据分类方法、装置、电子设备和可读存储介质
CN109509056A (zh) 基于对抗网络的商品推荐方法、电子装置及存储介质
CN109413023A (zh) 机器识别模型的训练及机器识别方法、装置、电子设备
CN107463879A (zh) 基于深度学习的人体行为识别方法
CN110909195A (zh) 基于区块链的图片标注方法、装置及存储介质、服务器
CN106230809A (zh) 一种基于url的移动互联网舆情监测方法及系统
Chudá et al. Usage of computer mouse characteristics for identification in web browsing
CN109413047A (zh) 行为模拟的判定方法、系统、服务器及存储介质
CN115391670A (zh) 一种基于知识图谱的互联网行为分析方法与系统
CN109299592A (zh) 人机行为特征边界构建方法、系统、服务器及存储介质
Charitopoulos et al. Educational data mining and data analysis for optimal learning content management: Applied in moodle for undergraduate engineering studies

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant