CN109977651A - 基于滑动轨迹的人机识别方法、装置及电子设备 - Google Patents
基于滑动轨迹的人机识别方法、装置及电子设备 Download PDFInfo
- Publication number
- CN109977651A CN109977651A CN201910201288.1A CN201910201288A CN109977651A CN 109977651 A CN109977651 A CN 109977651A CN 201910201288 A CN201910201288 A CN 201910201288A CN 109977651 A CN109977651 A CN 109977651A
- Authority
- CN
- China
- Prior art keywords
- characteristic information
- information
- man
- machine
- sliding trace
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2415—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
- G06F18/24155—Bayesian classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/30—Authentication, i.e. establishing the identity or authorisation of security principals
- G06F21/31—User authentication
- G06F21/36—User authentication by graphic or iconic representation
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computer Security & Cryptography (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Probability & Statistics with Applications (AREA)
- Software Systems (AREA)
- Computer Hardware Design (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于滑动轨迹的人机识别方法、装置及电子设备,其中,所述方法包括:采集当前滑动操作的滑动轨迹点,并判断所述当前滑动操作是否满足预设的验证规则;若所述当前滑动操作满足所述验证规则,则获取所述当前滑动操作的多维特征信息;根据预先建立的人机识别模型对所述多维特征信息进行处理,确定所述多维特征信息的分类结果;根据所述多维特征信息的分类结果,判断所述当前滑动操作是否为机器模拟操作。本发明能够提高了识别人类行为和机器行为的准确度。
Description
技术领域
本发明涉及计算机技术领域,尤其涉及一种基于滑动轨迹的人机识别方法、装置及电子设备。
背景技术
随着互联网技术的发展,网站或系统承载者越来越多用户或企业的信息,若网站或系统没有对黑客等不法分子的访问采取预防措施,将存在网络安全隐患,有可能直接导致用户或企业的经济损失。滑动验证码作为一种生物认证技术,被广泛运用在人机验证中,能够实现网络对访问者的身份认证,防止不法分子访问网站或系统。
目前,通过滑动验证码进行人机识别的技术方案,通过滑动轨迹的运动特征来对人类和机器的行为区分,例如滑动时的速度、加速度等运动特征。这些由滑动轨迹衍生出来的运动特征,已经很大程度上远离了原始数据的所反映的信息,不能准确的反映人类和机器移动的根本差别,对人类行为和机器行为区分的准确性较低,会影响网络安全的保障效果。
发明内容
本发明实施例所要解决的技术问题在于,提供一种基于滑动轨迹的人机识别方法、装置及电子设备,能够提高识别人类行为和机器行为的准确度。
第一方面,本发明实施例提供了一种基于滑动轨迹的人机识别方法,所述方法包括:
采集当前滑动操作的滑动轨迹点,并判断所述当前滑动操作是否满足预设的验证规则;
若所述当前滑动操作满足所述验证规则,则获取所述当前滑动操作的多维特征信息;其中,所述多维特征信息包括根据所述滑动轨迹点生成的滑动轨迹特征信息,所述滑动轨迹特征信息包括轨迹点数量特征信息和运动轨迹特征信息,所述轨迹点数量特征信息用于指示组成验证区域的若干个分割块中的每个分割块所包含的轨迹点数量;
根据预先建立的人机识别模型对所述多维特征信息进行处理,确定所述多维特征信息的分类结果;其中,所述人机识别模型根据至少一个多维特征信息样本以及每一所述多维特征信息样本对应的分类结果进行训练;
根据所述多维特征信息的分类结果,判断所述当前滑动操作是否为机器模拟操作。
进一步的,所述多维特征信息还包括设备信息和/或登陆信息;其中,所述设备信息包括进行滑动操作时的设备类型信息、浏览器信息和访问框架信息,所述登陆信息包括用户登陆IP信息和登陆地信息。
进一步的,所述运动轨迹特征信息包括根据所有的相邻两个所述滑动轨迹点之间位移确定的位移最大值、位移最小值、位移均值和位移方差值。
进一步的,所述人机识别模型通过以下步骤根据至少一个多维特征信息样本以及每一所述多维特征信息样本对应的分类结果进行训练:
根据预设的特征工程,将每个所述多维特征信息样本转化成相应的待分类特征信息;
根据预设的分类器对每个待分类特征信息进行分类处理,确定每个待分类特征信息对应的分类结果;
以每个待分类特征信息对应的分类结果作为类别标记,对每个所述待分类特征信息进行相应的标记;
根据每一个标记有类别标记的待分类特征信息进行训练,获得相应的训练结果,并将训练结果存储于所述人机识别模型。
进一步的,所述根据预设的分类器对每个待分类特征信息进行分类处理,确定每个待分类特征信息对应的分类结果具体包括:
对于任一所述待分类特征信息,根据预设的朴素贝叶斯分类器,计算朴素贝叶斯多项式P(y1|xi)和P(y2|xi);其中,xi为第i个多维特征信息样本对应的待分类特征信息,且xi={xi1,xi2,…xin},xin为xi的第n个特征属性,i≥1,n≥1;y1和y2分别对应分类集合Y={y1,y2}中自然人操作类别和机器模拟操作类别;
根据公式P(ypred|xi)=max{P(y1|xi),P(y2|xi)},确定待分类特征信息xi对应的分类结果ypred。
进一步的,所述轨迹点数量特征信息通过以下步骤获得:
统计验证区域中的每个分割块所包含的轨迹点的数量;
采用TF-IDF加权技术对每个分割块所包含的轨迹点的数量进行特征提取,获得所述轨迹点数量特征信息。
进一步的,所述预先建立的人机识别模型封装于预设的应用程序编程接口中。
进一步的,所述设备信息的所述访问框架信息采用布尔变量表示;所述登陆信息采用布尔变量表示。
第二方面,本发明实施例还提供了一种基于滑动轨迹的人机识别装置,所述装置包括:
采集模块,用于采集当前滑动操作的滑动轨迹点,并判断所述当前滑动操作是否满足预设的验证规则;
获取模块,用于若所述当前滑动操作满足所述验证规则,则获取所述当前滑动操作的多维特征信息;其中,所述多维特征信息包括根据所述滑动轨迹点生成的滑动轨迹特征信息,所述滑动轨迹特征信息包括轨迹点数量特征信息和运动轨迹特征信息,所述轨迹点数量特征信息用于指示组成验证区域的若干个分割块中的每个分割块所包含的轨迹点数量;
确定模块,用于根据预先建立的人机识别模型对所述多维特征信息进行处理,确定所述多维特征信息的分类结果;其中,所述人机识别模型根据至少一个多维特征信息样本以及每一所述多维特征信息样本对应的分类结果进行训练;
判断模块,用于根据所述多维特征信息的分类结果,判断所述当前滑动操作是否为机器模拟操作。
第三方面,本发明实施例还提供了一种电子设备,包括处理器、存储器以及存储在所述存储器中且被配置为由所述处理器执行的计算机程序,所述处理器执行所述计算机程序时实现如第一方面的任意一项所述的基于滑动轨迹的人机识别方法。
上述提供的一种基于滑动轨迹的人机识别方法、装置及电子设备,能够采集当前滑动操作的轨迹点数量特征信息,获取验证区域的不同分割块所包含的轨迹点的数量,直接获知当前滑动操作是否具有人类独特的生物停顿和停顿位置偏好,从生物与机器的本质区别上对当前滑动操作的操作者进行识别,提高了识别人类行为和机器行为的准确度。
附图说明
图1是本发明提供的一种基于滑动轨迹的人机识别方法的一个优选实施例的流程图;
图2是本发明提供的一种基于滑动轨迹的人机识别装置的一个优选实施例的示意图;
图3是本发明提供的一种电子设备的一个优选实施例的示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例提供了一种基于滑动轨迹的人机识别方法,请参阅图1,图1是本发明提供的一种基于滑动轨迹的人机识别方法的一个优选实施例的流程图,所述方法包括:
S100、采集当前滑动操作的滑动轨迹点,并判断所述当前滑动操作是否满足预设的验证规则;
S200、若所述当前滑动操作满足所述验证规则,则获取所述当前滑动操作的多维特征信息;其中,所述多维特征信息包括根据所述滑动轨迹点生成的滑动轨迹特征信息,所述滑动轨迹特征信息包括轨迹点数量特征信息和运动轨迹特征信息,所述轨迹点数量特征信息用于指示组成验证区域的若干个分割块中的每个分割块所包含的轨迹点数量;
S300、根据预先建立的人机识别模型对所述多维特征信息进行处理,确定所述多维特征信息的分类结果;其中,所述人机识别模型根据至少一个多维特征信息样本以及每一所述多维特征信息样本对应的分类结果进行训练;
S400、根据所述多维特征信息的分类结果,判断所述当前滑动操作是否为机器模拟操作。
其中,轨迹点数量特征信息用于指示组成验证区域的若干个分割块中的每个分割块所包含的轨迹点数量,可以根据实际应用情况设置为直接指示每个分割块所包含的轨迹点的真实数量,也可以是指示每个分割块所包含的轨迹点的相对数量。多维特征信息包括滑动轨迹特征信息,还可以根据实际应用需求,设置多维特征信息还包括当前滑动操作下的相关网页信息、设备信息、登陆信息、硬件信息等,以便获得多个维度的特征信息,利于准确识别当前滑动操作是否为机器模拟操作。人机识别模型根据至少一个多维特征信息样本以及每一多维特征信息样本对应的分类结果进行训练,本领域技术人员可知的,人机识别模型经过训练学习可获得用于预测相关特征信息的分类结果的训练结果,并可将训练结果应用于后续的识别过程中。
具体的,进行当前滑动操作的用户可能是自然人,可能是机器,用户在登陆系统或者使用相应的产品时,随机触发滑动验证码的验证,在触发验证后,会向用户显示验证窗口,用户进行当前滑动操作时,采集当前滑动操作的滑动轨迹点,并判断当前滑动操作是否满足预设的验证规则,例如验证规则为将目标对象拖动到规定位置,或者将目标对象滑动到导轨尽头等;若当前滑动操作不能满足预设的验证规则,则用户不能访问后续的内容;若当前滑动操作满足预设的验证规则,则获取当前滑动操作的多维特征信息,多维特征信息包括根据滑动轨迹点生成的滑动轨迹特征信息;根据预先建立的人机识别模型对多维特征信息进行处理,例如对多维特征信息进行特征工程的提取处理,再分析计算,确定多维特征信息的分类结果;根据多维特征信息的分类结果,判断当前滑动操作是否为机器模拟操作,完成人机识别。若当前滑动操作为机器模拟操作,则可按照预设的防御机制对当前系统或产品进行后续的防御措施,例如禁止该用户的对系统或产品的访问后,还发送相关的防御信息到管理者手机或邮箱等;若当前滑动操作不是机器模拟操作,判断为自然人操作,则允许用户进行下一步交互。
需要说明的是,多维特征信息样本和当前滑动操作的多维特征信息所包含的数据结构和数据类型均相同,只是具体的数据内容不同,即每一多维特征信息样本也包含有相应的滑动轨迹特征信息。轨迹点的采集频率、时间可以根据实际应用设置,优选地,检测到被操作的目标对象有移动就会采集滑动轨迹点,例如检测到被操作的图片的移动就采集滑动轨迹点,可以采集更多的滑动轨迹点
本发明实施例提供的基于滑动轨迹的人机识别方法,能够采集当前滑动操作的多维特征信息,且多维特征信息包括轨迹点数量特征信息,能够获取验证区域的不同分割块所包含的轨迹点的数量,轨迹点在不同位置的不同数量是滑动操作产生的原始数据,可直接反映当前滑动操作是否具有人类独特的生物停顿和停顿位置偏好,这些生物偏好是机器难以模拟的,能从生物与机器的本质区别上对进行当前滑动操作的用户进行识别,提高了识别人类行为和机器行为的准确度。
进一步的,所述多维特征信息还包括设备信息和/或登陆信息;其中,所述设备信息包括进行滑动操作时的设备类型信息、浏览器信息和访问框架信息,所述登陆信息包括用户登陆IP信息和登陆地信息。
其中,设备信息用于指示用户所使用的设备的相关信息,设备类型信息用于指示用户所使用的设备在预设的设备类型中所属的设备类型,例如预设的设备类型中将设备类型分为苹果系统设备和安卓系统设备,或者将设备类型分为PC端设备和移动端设备等,预设的设备类型可根据实际应用需要进行设置。浏览器信息用于指示浏览器的相关信息,例如浏览器版本、字体大小等。设备类型信息和浏览器信息主要是与用户常用的设备和浏览器进行对比,分析当前滑动操作的可疑程度,这两种信息可采用分类变量表示。访问框架信息用于指示用户在访问过程中是否注入有常见的爬虫框架的变量,例如Selenium框架;访问框架信息还可以用于指示是否有额外的插件对请求内容进行修改,访问框架信息可以采用布尔变量表示。登陆信息用于指示用户的基本信息,用户登陆IP信息是指用户登陆的IP地址,登陆地信息是指用户登陆时所在地点。登陆信息主要是与用户常用登陆信息进行对比,分析当前滑动操作的可疑程度。
本发明实施例提供的基于滑动轨迹的人机识别方法,能够增加用户的设备信息和登陆信息对当前滑动操作进行识别,增加了特征维度,进一步提高了人机识别的准确度。
进一步的,所述运动轨迹特征信息包括根据所有的相邻两个所述滑动轨迹点之间位移确定的位移最大值、位移最小值、位移均值和位移方差值。
具体的,采集完毕所有滑动轨迹点后,以每相邻两个轨迹点为一段,将整个滑动轨迹划分为若干段轨迹,例如总共有100个轨迹点,将整个滑动轨迹划分为99段轨迹,统计每一段轨迹的位移,进而计算获得所有位移中的位移最大值、位移最小值以及总位移的位移均值和位移方差值。
需要说明的是,若验证窗口的区域具有相应的坐标尺度,每一个滑动轨迹点对应相应的坐标,则统计相邻两个轨迹点的位移可以是相邻两个轨迹点在横坐标方向上的位移,则位移最大值、位移最小值、位移均值和位移方差值均是以横坐标方向的位移获得。
本发明实施例提供的基于滑动轨迹的人机识别方法,多维特征信息中包括运动轨迹特征信息,人类和机器在进行滑动操作时在运动特性上会有所区别,机器在滑动轨迹上运动比较均匀,而人类操作相邻两个轨迹点间位移很难维持稳定,而且越接近目标位置,相同时间内的位移越短,具有“远急近缓”的特点;这些区别可通过位移最大值、位移最小值以及总位移的位移均值和位移方差值反映出来,能够提高人机识别的准确度。
进一步的,所述人机识别模型通过以下步骤根据至少一个多维特征信息样本以及每一所述多维特征信息样本对应的分类结果进行训练:
根据预设的特征工程,将每个所述多维特征信息样本转化成相应的待分类特征信息;
根据预设的分类器对每个待分类特征信息进行分类处理,确定每个待分类特征信息对应的分类结果;
以每个待分类特征信息对应的分类结果作为类别标记,对每个所述待分类特征信息进行相应的标记;
根据每一个标记有类别标记的待分类特征信息进行训练,获得相应的训练结果,并将训练结果存储于所述人机识别模型。
其中,特征工程是指运用设定的处理技术从数据信息中筛选出更好的数据信息的过程,以便信息为后续利用;其可以对信息进行提取、转化等。由于本发明实施例提供的基于滑动轨迹的人机识别方法是判别当前滑动操作是否为机器模拟操作,以此判别用户是自然人还是机器,属于二分类问题,故分类器输出的分类结果只有两种情况。
具体的,多维特征信息样本的信息根据预设的特征工程进行转化,转化成人机识别模型所需的待分类特征信息,待分类特征信息输入预设的分类器,根据预设的分类器对每个待分类特征信息进行分类处理,经过分类器中的某些预设规则或者函数的分析、计算等过程,确定每个待分类特征信息对应的分类结果;以每个待分类特征信息对应的分类结果作为类别标记,对每个待分类特征信息进行相应的标记;根据每一个标记有类别标记的待分类特征信息进行训练,可以通过训练获知特征信息之间的关联性,预测后续识别的多维特征信息的分类,获得相应的训练结果,并将训练结果存储于人机识别模型。
进一步的,所述根据预设的分类器对每个待分类特征信息进行分类处理,确定每个待分类特征信息对应的分类结果具体包括:
对于任一所述待分类特征信息,根据预设的朴素贝叶斯分类器,计算朴素贝叶斯多项式P(y1|xi)和P(y2|xi);其中,xi为第i个多维特征信息样本对应的待分类特征信息,且xi={xi1,xi2,…xin},xin为xi的第n个特征属性,i≥1,n≥1;y1和y2分别对应分类集合Y={y1,y2}中自然人操作类别和机器模拟操作类别;
根据公式P(ypred|xi)=max{P(y1|xi),P(y2|xi)},确定待分类特征信息xi对应的分类结果ypred。
具体的,以y1=0和y2=1为例,说明分类结果获得过程:每个所述多维特征信息样本经过特征工程转化成相应的待分类特征信息,可获得如下矩阵:
对于任一待分类特征信息xi={xi1,xi2,…xin},根据预设的朴素贝叶斯分类器,计算朴素贝叶斯多项式P(0|xi)和P(1|xi),估计各分类的概率分布;将P(0|xi)和P(1|xi)中较大的概率对应的分类类别作为与待分类特征信息xi={xi1,xi2,…xin}的相关性最大的分类类别,获得分类结果;例如,若P(ypred|x1)=P(0|x1),则待分类特征信息x1概率的分类结果为0,即当前滑动操作为自然人操作,该用户为自然人;若P(ypred|x2)=P(1|x2),则待分类特征信息x1概率的分类结果为1,即当前滑动操作为机器模拟操作,该用户为机器,是可疑用户或者恶意用户。
进一步的,所述轨迹点数量特征信息通过以下步骤获得:
统计验证区域中的每个分割块所包含的轨迹点的数量;
采用TF-IDF加权技术对每个分割块所包含的轨迹点的数量进行特征提取,获得所述轨迹点数量特征信息。
为了防止存在大量的分割块的轨迹点数量为0或数量数值过小不利于后续对信息进行处理,使用分割块之间相对的轨迹点数量作为轨迹点数量特征信息,具体的,统计验证区域中的每个分割块所包含的轨迹点的数量,例如各分割块的轨迹点数量用矩阵表示,得到a1=[0,0,1,…,1],为防止其中有大量的0以及数值过小,采用TF-IDF加权技术进行a1特征提取获得矩阵a2=[0.1,0.1,5,…,6],则将矩阵a2作为轨迹点数量特征。
需要说明的是,多维特征信息包括的各个维度的特征信息。例如包括运动轨迹特征信息、轨迹点数量特征信息、设备信息、登陆信息均可采用横向合并的方式合并成总的多维特征信息。以多维特征信息包括运动轨迹特征信息、轨迹点数量特征信息为例进行说明,若位移最大值20,位移最小值3,位移均值12,位移方差值3.4,构成的运动轨迹特征信息表示为[20,3,12,3.4];组成验证窗口的6个分割块中所包含的滑动轨迹点的数量分别为[0,1,0,3,2,1],经过特征工程处理获得轨迹点数量特征信息为[0.2,5,0.1,9,4,3],横向合并成多维特征信息[20,3,12,3.4,0.2,5,0.1,9,4,3]。
进一步的,所述预先建立的人机识别模型封装于预设的应用程序编程接口中。
其中,应用程序编程接口,即API(Application Programming Interface)接口,是一种操作系统或程序接口,供用户或开发者调用访问相关程序。
具体的,预先建立的人机识别模型封装于预设的应用程序编程接口中,应用于服务端,在用户完成当前滑动操作后,系统获取到多维特征信息,将会调用应用程序编程接口,便会根据预设的特征工程,将多维特征信息转化成待分类特征信息,并根据服务端的训练好的人机识别模块进行分类,确定多维特征信息的分类结果,以此判断当前滑动操作是否为机器模拟操作。将人机识别模型封装于预设的应用程序编程接口中,可以减少开发者的程序编写任务,提高研发效率。
可选的,调用应用程序编程接口,访问到服务端的人机识别模块,获得多维特征信息的分类结果后,分类结果可以以JSON格式返回到系统前端,根据分类结果判断当前滑动操作是否为机器模拟操作。
进一步的,所述设备信息的所述访问框架信息采用布尔变量表示;所述登陆信息采用布尔变量表示。
其中,布尔变量是一种包括真和假这两种逻辑状态的变量,访问框架信息和登陆信息的集合均较为庞大,采用分类变量表示需要对集合中的信息进行分类,集合庞大,类别过多,不利于信息的快速分析处理。访问框架信息和登陆信息均采用布尔变量表示,即可以用于判断是否与用户常用的信息相同,又可以快速对数据分析处理。
可选的,本发明实施例提供的基于滑动轨迹的人机识别方法,多维特征信息包括的特征内容以及特征表示形式的示意如下表1所示:
表1多维特征信息的内容示意表
需要说明的是,上述表1的内容只是多维特征信息的中各特征信息的示意,仅代表部分特征信息,在实际应用中,可以根据实际需求进行不同的调整。
具体实施时,系统采集当前滑动操作的滑动轨迹点,并判断当前滑动操作是否满足预设的验证规则;若当前滑动操作满足验证规则,则获取当前滑动操作的多维特征信息;根据预先建立的人机识别模型对多维特征信息进行处理,确定多维特征信息的分类结果;根据多维特征信息的分类结果,判断当前滑动操作是否为机器模拟操作。
本发明实施例提供的基于滑动轨迹的人机识别方法,能够采集当前滑动操作的多维特征信息,且多维特征信息包括轨迹点数量特征信息,能够获取验证区域的不同分割块所包含的轨迹点的数量,轨迹点在不同位置的不同数量是滑动操作产生的原始数据,可直接反映当前滑动操作是否具有人类独特的生物停顿和停顿位置偏好,这些生物偏好是机器难以模拟的,能从生物与机器的本质区别上对进行当前滑动操作的用户进行识别,提高了识别人类行为和机器行为的准确度。
本发明实施例还提供了一种基于滑动轨迹的人机识别装置,请参阅图2,图2是本发明提供的一种基于滑动轨迹的人机识别装置的一个优选实施例的示意图;所述装置包括:
采集模块,用于采集当前滑动操作的滑动轨迹点,并判断所述当前滑动操作是否满足预设的验证规则;
获取模块,用于若所述当前滑动操作满足所述验证规则,则获取所述当前滑动操作的多维特征信息;其中,所述多维特征信息包括根据所述滑动轨迹点生成的滑动轨迹特征信息,所述滑动轨迹特征信息包括轨迹点数量特征信息和运动轨迹特征信息,所述轨迹点数量特征信息用于指示组成验证区域的若干个分割块中的每个分割块所包含的轨迹点数量;
确定模块,用于根据预先建立的人机识别模型对所述多维特征信息进行处理,确定所述多维特征信息的分类结果;其中,所述人机识别模型根据至少一个多维特征信息样本以及每一所述多维特征信息样本对应的分类结果进行训练;
判断模块,用于根据所述多维特征信息的分类结果,判断所述当前滑动操作是否为机器模拟操作。
具体实施时,本发明实施例提供的一种基于滑动轨迹的人机识别装置,通过采集模块采集当前滑动操作的滑动轨迹点,并判断所述当前滑动操作是否满足预设的验证规则;若所述当前滑动操作满足所述验证规则,通过获取模块获取所述当前滑动操作的多维特征信息;并通过确定模块根据预先建立的人机识别模型对所述多维特征信息进行处理,确定所述多维特征信息的分类结果;通过判断模块根据所述多维特征信息的分类结果,判断所述当前滑动操作是否为机器模拟操作。
本发明实施例能够采集当前滑动操作的多维特征信息,且多维特征信息包括轨迹点数量特征信息,能够获取验证区域的不同分割块所包含的轨迹点的数量,轨迹点在不同位置的不同数量是滑动操作产生的原始数据,可直接反映当前滑动操作是否具有人类独特的生物停顿和停顿位置偏好,这些生物偏好是机器难以模拟的,能从生物与机器的本质区别上对进行当前滑动操作的用户进行识别,提高了识别人类行为和机器行为的准确度。
进一步的,所述多维特征信息还包括设备信息和/或登陆信息;其中,所述设备信息包括进行滑动操作时的设备类型信息、浏览器信息和访问框架信息,所述登陆信息包括用户登陆IP信息和登陆地信息。
进一步的,所述运动轨迹特征信息包括根据所有的相邻两个所述滑动轨迹点之间位移确定的位移最大值、位移最小值、位移均值和位移方差值。
进一步的,所述装置还包括训练模块,所述训练模块具体包括:
转化单元,用于根据预设的特征工程,将每个所述多维特征信息样本转化成相应的待分类特征信息;
确定单元,用于根据预设的分类器对每个待分类特征信息进行分类处理,确定每个待分类特征信息对应的分类结果;
标记单元,用于以每个待分类特征信息对应的分类结果作为类别标记,对每个所述待分类特征信息进行相应的标记;
训练单元,用于根据每一个标记有类别标记的待分类特征信息进行训练,获得相应的训练结果,并将训练结果存储于所述人机识别模型。
进一步的,所述确定单元具体包括:
计算子单元,用于对于任一所述待分类特征信息,根据预设的朴素贝叶斯分类器,计算朴素贝叶斯多项式P(y1|xi)和P(y2|xi);其中,xi为第i个多维特征信息样本对应的待分类特征信息,且xi={xi1,xi2,…xin},xin为xi的第n个特征属性,i≥1,n≥1;y1和y2分别对应分类集合Y={y1,y2}中自然人操作类别和机器模拟操作类别;
分类子单元,用于根据公式P(ypred|xi)=max{P(y1|xi),P(y2|xi)},确定待分类特征信息xi对应的分类结果ypred。
进一步的,所述装置还包括轨迹点数量特征信息获取模块,所述轨迹点数量特征信息获取模块具体用于:
统计验证区域中的每个分割块所包含的轨迹点的数量;
采用TF-IDF加权技术对每个分割块所包含的轨迹点的数量进行特征提取,获得所述轨迹点数量特征信息。
进一步的,所述预先建立的人机识别模型封装于预设的应用程序编程接口中。
进一步的,所述设备信息的所述访问框架信息采用布尔变量表示;所述登陆信息采用布尔变量表示。
需要说明的是,本发明实施例提供的一种基于滑动轨迹的人机识别装置用于执行上述实施例所述的基于滑动轨迹的人机识别方法的步骤,两者的工作原理和有益效果一一对应,因而不再赘述。
本领域技术人员可以理解,所述基于滑动轨迹的人机识别装置的示意图仅仅是基于滑动轨迹的人机识别装置的示例,并不构成对基于滑动轨迹的人机识别装置的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如所述基于滑动轨迹的人机识别装置还可以包括相应的功能模块、总线等。
本发明实施例还提供了一种电子设备,请参阅图3,图3是本发明提供的一种电子设备的一个优选实施例的示意图;所述电子设备包括处理器10、存储器20以及存储在所述存储器中且被配置为由所述处理器执行的计算机程序,所述处理器执行所述计算机程序时实现如上述提供的任意一项所述的基于滑动轨迹的人机识别方法。
具体的,该电子设备中的处理器、存储器均可以是一个或者多个,电子设备可以是电脑、手机、平板、云端设备等。
本发明实施例的电子设备包括:处理器、存储器以及存储在所述存储器中并可在所述处理器上运行的计算机程序。所述处理器执行所述计算机程序时实现上述实施例提供的基于滑动轨迹的人机识别方法中的步骤,例如图1所示的步骤S100、采集当前滑动操作的滑动轨迹点,并判断所述当前滑动操作是否满足预设的验证规则。或者,所述处理器执行所述计算机程序时实现上述各装置实施例中各模块的功能,例如采集模块11,用于采集当前滑动操作的滑动轨迹点,并判断所述当前滑动操作是否满足预设的验证规则。
示例性的,所述计算机程序可以被分割成一个或多个模块/单元(如图3所示的计算机程序1、计算机程序2、······),所述一个或者多个模块/单元被存储在所述存储器中,并由所述处理器执行,以完成本发明。所述一个或多个模块/单元可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述所述计算机程序在所述电子设备中的执行过程。例如,所述计算机程序可以被分割成采集模块11、获取模块12、确定模块13和判断模块14,各模块具体功能如下:
采集模块11,用于采集当前滑动操作的滑动轨迹点,并判断所述当前滑动操作是否满足预设的验证规则;
获取模块12,用于若所述当前滑动操作满足所述验证规则,则获取所述当前滑动操作的多维特征信息;其中,所述多维特征信息包括根据所述滑动轨迹点生成的滑动轨迹特征信息,所述滑动轨迹特征信息包括轨迹点数量特征信息和运动轨迹特征信息,所述轨迹点数量特征信息用于指示组成验证区域的若干个分割块中的每个分割块所包含的轨迹点数量;
确定模块13,用于根据预先建立的人机识别模型对所述多维特征信息进行处理,确定所述多维特征信息的分类结果;其中,所述人机识别模型根据至少一个多维特征信息样本以及每一所述多维特征信息样本对应的分类结果进行训练;
判断模块14,用于根据所述多维特征信息的分类结果,判断所述当前滑动操作是否为机器模拟操作。
所称处理器可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等,所述处理器是所述电子设备的控制中心,利用各种接口和线路连接整个电子设备的各个部分。
所述存储器可用于存储所述计算机程序和/或模块,所述处理器通过运行或执行存储在所述存储器内的计算机程序和/或模块,以及调用存储在存储器内的数据,实现所述电子设备的各种功能。所述存储器可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据手机的使用所创建的数据(比如音频数据、电话本等)等。此外,存储器可以包括高速随机存取存储器,还可以包括非易失性存储器,例如硬盘、内存、插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)、至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
其中,所述电子设备集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实现上述实施例提供的基于滑动轨迹的人机识别方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述任一实施例提供的基于滑动轨迹的人机识别方法的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,RandomAccess Memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括电载波信号和电信信号。
需要说明的是,上述电子设备可包括,但不仅限于,处理器10、存储器20,本领域技术人员可以理解,图3结构示意图仅仅是上述电子设备的示例,并不构成对电子设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件。
以上所述是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也视为本发明的保护范围。
Claims (10)
1.一种基于滑动轨迹的人机识别方法,其特征在于,所述方法包括:
采集当前滑动操作的滑动轨迹点,并判断所述当前滑动操作是否满足预设的验证规则;
若所述当前滑动操作满足所述验证规则,则获取所述当前滑动操作的多维特征信息;其中,所述多维特征信息包括根据所述滑动轨迹点生成的滑动轨迹特征信息,所述滑动轨迹特征信息包括轨迹点数量特征信息和运动轨迹特征信息,所述轨迹点数量特征信息用于指示组成验证区域的若干个分割块中的每个分割块所包含的轨迹点数量;
根据预先建立的人机识别模型对所述多维特征信息进行处理,确定所述多维特征信息的分类结果;其中,所述人机识别模型根据至少一个多维特征信息样本以及每一所述多维特征信息样本对应的分类结果进行训练;
根据所述多维特征信息的分类结果,判断所述当前滑动操作是否为机器模拟操作。
2.如权利要求1所述的滑动验证码人机识别方法,其特征在于,所述多维特征信息还包括设备信息和/或登陆信息;其中,所述设备信息包括进行滑动操作时的设备类型信息、浏览器信息和访问框架信息,所述登陆信息包括用户登陆IP信息和登陆地信息。
3.如权利要求1所述的滑动验证码人机识别方法,其特征在于,所述运动轨迹特征信息包括根据所有的相邻两个所述滑动轨迹点之间位移确定的位移最大值、位移最小值、位移均值和位移方差值。
4.如权利要求1所述的滑动验证码人机识别方法,其特征在于,所述人机识别模型通过以下步骤根据至少一个多维特征信息样本以及每一所述多维特征信息样本对应的分类结果进行训练:
根据预设的特征工程,将每个所述多维特征信息样本转化成相应的待分类特征信息;
根据预设的分类器对每个待分类特征信息进行分类处理,确定每个待分类特征信息对应的分类结果;
以每个待分类特征信息对应的分类结果作为类别标记,对每个所述待分类特征信息进行相应的标记;
根据每一个标记有类别标记的待分类特征信息进行训练,获得相应的训练结果,并将训练结果存储于所述人机识别模型。
5.如权利要求4所述的滑动验证码人机识别方法,其特征在于,
所述根据预设的分类器对每个待分类特征信息进行分类处理,确定每个待分类特征信息对应的分类结果具体包括:
对于任一所述待分类特征信息,根据预设的朴素贝叶斯分类器,计算朴素贝叶斯多项式P(y1|xi)和P(y2|xi);其中,xi为第i个多维特征信息样本对应的待分类特征信息,且xi={xi1,xi2,…xin},xin为xi的第n个特征属性,i≥1,n≥1;y1和y2分别对应分类集合Y={y1,y2}中自然人操作类别和机器模拟操作类别;
根据公式P(ypred|xi)=max{P(y1|xi),P(y2|xi)},确定待分类特征信息xi对应的分类结果ypred。
6.如权利要求1所述的滑动验证码人机识别方法,其特征在于,所述轨迹点数量特征信息通过以下步骤获得:
统计验证区域中的每个分割块所包含的轨迹点的数量;
采用TF-IDF加权技术对每个分割块所包含的轨迹点的数量进行特征提取,获得所述轨迹点数量特征信息。
7.如权利要求1所述的滑动验证码人机识别方法,其特征在于,所述预先建立的人机识别模型封装于预设的应用程序编程接口中。
8.如权利要求2所述的滑动验证码人机识别方法,其特征在于,所述设备信息的所述访问框架信息采用布尔变量表示;所述登陆信息采用布尔变量表示。
9.一种基于滑动轨迹的人机识别装置,其特征在于,所述装置包括:
采集模块,用于采集当前滑动操作的滑动轨迹点,并判断所述当前滑动操作是否满足预设的验证规则;
获取模块,用于若所述当前滑动操作满足所述验证规则,则获取所述当前滑动操作的多维特征信息;其中,所述多维特征信息包括根据所述滑动轨迹点生成的滑动轨迹特征信息,所述滑动轨迹特征信息包括轨迹点数量特征信息和运动轨迹特征信息,所述轨迹点数量特征信息用于指示组成验证区域的若干个分割块中的每个分割块所包含的轨迹点数量;
确定模块,用于根据预先建立的人机识别模型对所述多维特征信息进行处理,确定所述多维特征信息的分类结果;其中,所述人机识别模型根据至少一个多维特征信息样本以及每一所述多维特征信息样本对应的分类结果进行训练;
判断模块,用于根据所述多维特征信息的分类结果,判断所述当前滑动操作是否为机器模拟操作。
10.一种电子设备,其特征在于,包括处理器、存储器以及存储在所述存储器中且被配置为由所述处理器执行的计算机程序,所述处理器执行所述计算机程序时实现如权利要求1至8中任意一项所述的基于滑动轨迹的人机识别方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910201288.1A CN109977651A (zh) | 2019-03-14 | 2019-03-14 | 基于滑动轨迹的人机识别方法、装置及电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910201288.1A CN109977651A (zh) | 2019-03-14 | 2019-03-14 | 基于滑动轨迹的人机识别方法、装置及电子设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109977651A true CN109977651A (zh) | 2019-07-05 |
Family
ID=67079134
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910201288.1A Pending CN109977651A (zh) | 2019-03-14 | 2019-03-14 | 基于滑动轨迹的人机识别方法、装置及电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109977651A (zh) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110807183A (zh) * | 2019-10-12 | 2020-02-18 | 广州多益网络股份有限公司 | 一种多维度特征体系的滑动验证码人机行为识别方法 |
CN111125670A (zh) * | 2019-12-17 | 2020-05-08 | 美的集团股份有限公司 | 滑动轨迹人机识别方法、装置、电子设备及存储介质 |
CN111209601A (zh) * | 2020-01-06 | 2020-05-29 | 南京安璟信息科技有限公司 | 一种用于反欺诈的人机识别系统 |
CN111626769A (zh) * | 2020-04-30 | 2020-09-04 | 北京芯盾时代科技有限公司 | 一种人机识别方法、装置及存储介质 |
CN111666968A (zh) * | 2020-04-21 | 2020-09-15 | 北京奇艺世纪科技有限公司 | 人机识别方法及装置、电子设备、计算机可读存储介质 |
CN111787009A (zh) * | 2020-06-30 | 2020-10-16 | 北京明略昭辉科技有限公司 | 一种异常流量判断方法及装置 |
CN113553568A (zh) * | 2020-04-23 | 2021-10-26 | 京东数字科技控股有限公司 | 人机识别方法、滑块验证方法、装置、介质和设备 |
CN113660238A (zh) * | 2021-08-10 | 2021-11-16 | 建信金融科技有限责任公司 | 人机识别方法、装置、系统、设备及可读存储介质 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20040184062A1 (en) * | 2003-03-21 | 2004-09-23 | Ming-Wei Yu | Multi-function product capable of detecting a slope of a second functional machine installed above a first functional machine |
CN106020653A (zh) * | 2016-04-29 | 2016-10-12 | 努比亚技术有限公司 | 一种人机交互装置和方法 |
CN106155298A (zh) * | 2015-04-21 | 2016-11-23 | 阿里巴巴集团控股有限公司 | 人机识别方法及装置、行为特征数据的采集方法及装置 |
CN106843729A (zh) * | 2017-01-20 | 2017-06-13 | 宇龙计算机通信科技(深圳)有限公司 | 一种终端操控方法及终端 |
CN107679374A (zh) * | 2017-08-23 | 2018-02-09 | 北京三快在线科技有限公司 | 一种基于滑动轨迹的人机识别方法及装置,电子设备 |
CN109033793A (zh) * | 2018-07-11 | 2018-12-18 | 北京京东金融科技控股有限公司 | 滑动验证码人机识别方法及装置、电子设备及可读介质 |
CN109271762A (zh) * | 2018-08-03 | 2019-01-25 | 平安科技(深圳)有限公司 | 基于滑块验证码的用户认证方法及装置 |
-
2019
- 2019-03-14 CN CN201910201288.1A patent/CN109977651A/zh active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20040184062A1 (en) * | 2003-03-21 | 2004-09-23 | Ming-Wei Yu | Multi-function product capable of detecting a slope of a second functional machine installed above a first functional machine |
CN106155298A (zh) * | 2015-04-21 | 2016-11-23 | 阿里巴巴集团控股有限公司 | 人机识别方法及装置、行为特征数据的采集方法及装置 |
CN106020653A (zh) * | 2016-04-29 | 2016-10-12 | 努比亚技术有限公司 | 一种人机交互装置和方法 |
CN106843729A (zh) * | 2017-01-20 | 2017-06-13 | 宇龙计算机通信科技(深圳)有限公司 | 一种终端操控方法及终端 |
CN107679374A (zh) * | 2017-08-23 | 2018-02-09 | 北京三快在线科技有限公司 | 一种基于滑动轨迹的人机识别方法及装置,电子设备 |
CN109033793A (zh) * | 2018-07-11 | 2018-12-18 | 北京京东金融科技控股有限公司 | 滑动验证码人机识别方法及装置、电子设备及可读介质 |
CN109271762A (zh) * | 2018-08-03 | 2019-01-25 | 平安科技(深圳)有限公司 | 基于滑块验证码的用户认证方法及装置 |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110807183A (zh) * | 2019-10-12 | 2020-02-18 | 广州多益网络股份有限公司 | 一种多维度特征体系的滑动验证码人机行为识别方法 |
CN111125670A (zh) * | 2019-12-17 | 2020-05-08 | 美的集团股份有限公司 | 滑动轨迹人机识别方法、装置、电子设备及存储介质 |
CN111125670B (zh) * | 2019-12-17 | 2022-03-01 | 美的集团股份有限公司 | 滑动轨迹人机识别方法、装置、电子设备及存储介质 |
CN111209601A (zh) * | 2020-01-06 | 2020-05-29 | 南京安璟信息科技有限公司 | 一种用于反欺诈的人机识别系统 |
CN111666968A (zh) * | 2020-04-21 | 2020-09-15 | 北京奇艺世纪科技有限公司 | 人机识别方法及装置、电子设备、计算机可读存储介质 |
CN113553568A (zh) * | 2020-04-23 | 2021-10-26 | 京东数字科技控股有限公司 | 人机识别方法、滑块验证方法、装置、介质和设备 |
CN111626769A (zh) * | 2020-04-30 | 2020-09-04 | 北京芯盾时代科技有限公司 | 一种人机识别方法、装置及存储介质 |
CN111626769B (zh) * | 2020-04-30 | 2021-04-06 | 北京芯盾时代科技有限公司 | 一种人机识别方法、装置及存储介质 |
CN111787009A (zh) * | 2020-06-30 | 2020-10-16 | 北京明略昭辉科技有限公司 | 一种异常流量判断方法及装置 |
CN113660238A (zh) * | 2021-08-10 | 2021-11-16 | 建信金融科技有限责任公司 | 人机识别方法、装置、系统、设备及可读存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109977651A (zh) | 基于滑动轨迹的人机识别方法、装置及电子设备 | |
US9076030B2 (en) | Liveness detection | |
CN101894134B (zh) | 一种基于空间布局的钓鱼网页检测及其实现方法 | |
CN109241709B (zh) | 基于滑块验证码验证的用户行为识别方法及装置 | |
US10169853B2 (en) | Score weights for user interface (UI) elements | |
US11019099B2 (en) | Method of application malware detection based on dynamic API extraction, and readable medium and apparatus for performing the method | |
WO2020024414A1 (zh) | 基于滑块验证码的用户认证方法及装置 | |
CN112329816A (zh) | 数据分类方法、装置、电子设备和可读存储介质 | |
CN113468520A (zh) | 应用于区块链业务的数据入侵检测方法及大数据服务器 | |
CN113763057A (zh) | 用户身份画像的数据处理方法和装置 | |
CN118094118B (zh) | 数据集质量评估方法、系统、电子设备及存储介质 | |
CN113516144A (zh) | 目标检测方法及装置、计算设备 | |
CN111552865A (zh) | 用户兴趣画像方法及相关设备 | |
AU2019101158A4 (en) | A method of analyzing customer churn of credit cards by using logistics regression | |
CN115222443A (zh) | 客户群体划分方法、装置、设备及存储介质 | |
CN115545103A (zh) | 异常数据识别、标签识别方法和异常数据识别装置 | |
EP3882825A1 (en) | Learning model application system, learning model application method, and program | |
CN110225009A (zh) | 一种基于通信行为画像的代理使用者检测方法 | |
CN109299592A (zh) | 人机行为特征边界构建方法、系统、服务器及存储介质 | |
CN117235633A (zh) | 机构分类方法、装置、计算机设备及存储介质 | |
CN117194779A (zh) | 基于人工智能的营销系统优化方法、装置及设备 | |
CN114218574B (zh) | 一种数据检测方法、装置、电子设备以及存储介质 | |
CN112887408B (zh) | 一种用于解决多内核浏览器数据状态共享的系统和方法 | |
Ji et al. | Influence of embedded microprocessor wireless communication and computer vision in Wushu competition referees’ decision support | |
CN112910879A (zh) | 恶意域名分析方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20190705 |