CN106487747A - 用户识别方法、系统、装置及处理方法、装置 - Google Patents

用户识别方法、系统、装置及处理方法、装置 Download PDF

Info

Publication number
CN106487747A
CN106487747A CN201510531371.7A CN201510531371A CN106487747A CN 106487747 A CN106487747 A CN 106487747A CN 201510531371 A CN201510531371 A CN 201510531371A CN 106487747 A CN106487747 A CN 106487747A
Authority
CN
China
Prior art keywords
browser
information
user
browser information
page info
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201510531371.7A
Other languages
English (en)
Other versions
CN106487747B (zh
Inventor
彭高建
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba Group Holding Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Priority to CN201510531371.7A priority Critical patent/CN106487747B/zh
Publication of CN106487747A publication Critical patent/CN106487747A/zh
Application granted granted Critical
Publication of CN106487747B publication Critical patent/CN106487747B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Information Transfer Between Computers (AREA)

Abstract

本发明公开了一种用户识别方法、系统、装置及处理方法、装置。其中,该方法包括:接收来自用户针对浏览器的访问请求;对访问请求进行解析,得到解析结果;在解析结果中不存在用于反映浏览器行为的浏览器信息时,判定用户为机器人,其中,浏览器行为包括对浏览器的操作行为;在解析结果中存在反映浏览器行为的浏览器信息时,按照预设规则判断用户为机器人或自然人。本发明解决了由于CAPTCHA机制需要在正常的网络操作基础上附加验证码输入操作而造成的用户体验度差的技术问题。

Description

用户识别方法、系统、装置及处理方法、装置
技术领域
本发明涉及通信领域,具体而言,涉及一种用户识别方法、系统、装置及处理方法、装置。
背景技术
随着互联网的高速发展,网络社区、搜索、社交网站、网络银行、维基(wiki)、电商、网游等互联网产品开始涌现并渗透至人们的日常生活。但这些互联网产品的使用者不仅仅是人类,还有互联网机器人(Internet bot)。互联网机器人通常指通过互联网执行自动化任务的程序,这些机器人可用于正常用途比如搜索引擎爬虫,也可用于恶意用途比如垃圾注册、恶意网络交易下单、发布灌水广告信息等。
在相关技术中,人机识别验证系统定义为一种全自动区分计算机和人类的图灵测试(Completely Automated Public Turing test to tell Computers and Humans Apart,简称CAPTCHA),俗称验证码,是一种区分用户是计算机和人的公共全自动程序。在CAPTCHA测试中,作为服务器的计算机会自动生成一个问题由用户来解答。这个问题可以由计算机生成并评判,但是必须只有人类才能解答。由于计算机无法解答CAPTCHA的问题,所以回答出问题的用户就可以被认为是人类。
CAPTCHA的识别机制分为以下几个步骤:
1,用户访问受CAPTCHA保护的网络资源;
2,由CAPTCHA出题服务器产生测试问题;
3,用户将第2步产生的问题的答案提交至CAPTCHA验证服务器;
4,CAPTCHA验证服务器根据用户提交的答案判定该用户是否通过测试,如果未通过测试则不能访问受保护的网络资源,反之放行。相关技术中的验证码(CAPTCHA)机制在一定程度上能够避免恶意机器人滥用网络,但该机制需要在正常的网络操作基础上附加验证码输入操作,给用户体验造成非常大的影响;另外,现在主流的验证码都容易被OCR算法或人工打码平台破解。这里的用户体验是指CAPTCHA过程本身对用户正常使用的延迟以及经常出现的误操作。
针对上述的问题,目前尚未提出有效的解决方案。
发明内容
本发明实施例提供了一种用户识别方法、系统、装置及处理方法、装置,以至少解决由于CAPTCHA机制需要在正常的网络操作基础上附加验证码输入操作而造成的用户体验度差的技术问题。
根据本发明实施例的一个方面,提供了一种用户识别方法,包括:接收来自用户针对浏览器的访问请求;对访问请求进行解析,得到解析结果;在解析结果中不存在用于反映浏览器行为的浏览器信息时,判定用户为机器人,其中,浏览器行为包括对浏览器的操作行为;在解析结果中存在反映浏览器行为的浏览器信息时,按照预设规则判断用户为机器人或自然人。
根据本发明实施例的另一方面,还提供了一种用户识别系统,包括:包括:网络资源服务组件、人机识别组件;网络资源服务组件,用于接收用户针对浏览器的访问请求,并将访问请求发送给人机识别组件;人机识别组件,用于对访问请求进行解析,得到解析结果,在解析结果中不存在用于反映浏览器行为的浏览器信息时,判定用户为机器人,以及在解析结果中存在反映浏览器行为的浏览器信息时,按照预设规则判断用户为机器人或自然人;其中,浏览器行为包括对浏览器的操作行为。
根据本发明实施例的另一方面,还提供了一种用户识别装置,包括:接收模块,用于接收来自用户针对浏览器的访问请求;解析模块,用于对访问请求进行解析,得到解析结果;第一判定模块,用于在解析结果中不存在用于反映浏览器行为的浏览器信息时,判定用户为机器人以及在解析结果中存在反映浏览器行为的浏览器信息时,按照预设规则判断用户为机器人或自然人,其中,浏览器行为包括对浏览器的操作行为。
根据本发明实施例的另一方面,还提供了一种用户识别的处理方法,包括:采集针对浏览器的用于反映浏览器行为的浏览器信息,其中,浏览器行为包括:对浏览器的操作行为;将携带有浏览器信息的访问请求发送给服务器;访问请求用于为服务器按照预设规则对与浏览器操作行为对应的用户进行识别提供依据,与浏览器操作行为对应的用户包括:自然人用户和机器人用户。
根据本发明实施例的另一方面,还提供了一种用户识别的处理装置,包括:采集模块,用于采集针对浏览器的用于反映浏览器行为的浏览器信息,其中,浏览器行为包括:对浏览器的操作行为;发送模块,用于将携带有浏览器信息的访问请求发送给服务器;访问请求用于为所述服务器按照预设规则对与浏览器操作行为对应的用户进行识别提供依据,与所述浏览器操作行为对应的用户包括:自然人用户和机器人用户。
在本发明实施例中,采用接收到的针对浏览器的访问请求是否存在用于反映浏览器行为的浏览器信息来判断用户是否为机器人,其中,该浏览器行为包括对浏览器的操作行为的方式,通过采集浏览器行为的方式对用户进行识别,使得用户不会增加额外的网络操作,比如输入验证码的过程操作,从而提高了用户体验的技术效果,进而解决了由于CAPTCHA机制需要在正常的网络操作基础上附加验证码输入操作而造成的用户体验度差的技术问题。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是本发明实施例的一种用户识别方法的计算机终端的硬件结构框图;
图2是根据本发明实施例的用户识别方法的流程图一;
图3是根据本发明实施例的用户识别方法的流程图二;
图4是本发明优选实施例的用户识别方法的流程图;
图5是根据本发明实施例的用户识别系统的示意图一;
图6是根据本发明实施例的用户识别系统的示意图二;
图7是本发明优选实施例的用户识别系统的示意图;
图8是本发明实施例的用户识别装置的结构框图一;
图9是根据本发明实施例的用户识别装置的结构框图二;
图10是根据本发明实施例的用户识别装置的结构框图三;
图11是根据本发明实施例的用户识别的处理方法的流程图;
图12是根据本发明实施例的用户识别的处理装置的结构框图;
图13是根据本发明实施例的一种计算机终端的结构框图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
在相关技术中,主要通过CAPTCHA技术实现机器人和自然人的识别,而相关技术中主流的CAPTCHA技术大致分为以下几类:
文本CAPTCHA,主要利用自然人和机器人在字符识别方面的差异,由计算机随机产生一系列字符,这些字符包含数字、字母甚至中文或特殊符号,将这些产生的字符画在图片上,为防止被光学字符识别(Optical Character Recognition,简称OCR)还需要对图片进行拉伸、扭曲、粘连,添加干扰线、干扰色块等,验证时需要用户输入正确的字符。但是,随着OCR技术的发展,目前大多数简单的文本CAPTCHA都已经被成功破解,而相对复杂的文本CAPTCHA(进行拉伸、粘连程度较高的图片变换)让用户本身也难以识别,严重影响用户体验。
视频动画CAPTCHA,原理与文本CAPTCHA一致,区别在于文本的载体是MP4,FLV,GIF等文件格式,进一步加大了OCR的难度。但是,大多数视频动画CAPTCHA文件比文本CAPTCHA文件要大,要占用更多的网络带宽,在识别抽取出动画的关键帧后,其破解过程与文本CAPTCHA的破解过程完全相同。
图文点击CAPTCHA,主要利用自然人和机器人在目标识别、问题理解方面的差异,不需要用户进行文本输入,用户根据图片中的提示依次点击图片中的部分区域来完成验证。
图像CAPTCHA,主要利用自然人和机器人在图像分类,情感判断上的差异,比如计算机产生一组图片,其中大部分图片属于一个分类,另一张图片属于另一个分类,用户将不同分类的那张图片选出则验证成功。图像CAPTCHA比普通文本CAPTCHA的破解难度要大,但产出图像CAPTCHA之前需要事先对所有图像进行分类标注,该条件决定了图像CAPTCHA无法大规模产生。目前随着机器学习、人工智能技术的发展以及机器学习样本库的不断丰富,计算机分类算法变得越来越完善。Palo Alto ResearchCenter的研究人员公布了一组基于SVM的图像分类算法的测试数据,在学习了13000张不同的图像样本库后,分类算法在猫狗分类上的正确率达到80.6%。
声音CAPTCHA,由计算机随机产生一些数字、字母或词组,合成为一条语音并添加背景噪音,用户需要回答出该语音包含的在合成阶段选定的这些数字、字母或词组。
另外,在验证码生成技术和验证码破解技术相互竞争的同时,出现了一种利用人工进行验证码识别的破解方式。该方式利用了廉价劳动力资源,将验证码的测试任务转移至人工处理,由于验证码本身就是为了区分自然人和机器人,在引入人工后这种方式可以对已知的所有类型的CAPTCHA进行破解。具体运作方式如下:
1,机器人程序请求受验证码保护的网络资源;
2,机器人程序将出现的验证码提交到打码平台;
3,打码平台将该验证码派送至该平台的某个客户端,该客户端对应一个打码员;
4,打码员肉眼识别出该验证码,并将结果发送给打码平台;
5,打码平台将结果返回给机器人程序;
6,机器人程序通过验证后开始访问受保护的网络资源。
上述CAPTCHA机制需要在正常的网络操作基础上附加验证码输入操作,因而可能用户体验度差,而本发明实施例提供的用户识别方法、系统、装置及处理方法、装置,其是一种基于采集浏览器行为的人机识别方法,与CAPTCHA技术相比,用户不会增加额外的网络操作,也不会被打码平台破译,更加难以被攻破。
实施例1
根据本发明实施例,还提供了一种用户识别的方法实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
本申请实施例1所提供的方法实施例可以在移动终端、计算机终端或者类似的运算装置中执行。以运行在计算机终端上为例,图1是本发明实施例的一种用户识别方法的计算机终端的硬件结构框图。如图1所示,计算机终端10可以包括一个或多个(图中仅示出一个)处理器102(处理器102可以包括但不限于微处理器MCU或可编程逻辑器件FPGA等的处理装置)、用于存储数据的存储器104、以及用于通信功能的传输模块106。本领域普通技术人员可以理解,图1所示的结构仅为示意,其并不对上述电子装置的结构造成限定。例如,计算机终端10还可包括比图1中所示更多或者更少的组件,或者具有与图1所示不同的配置。
存储器104可用于存储应用软件的软件程序以及模块,如本发明实施例中的用户识别方法对应的程序指令/模块,处理器102通过运行存储在存储器104内的软件程序以及模块,从而执行各种功能应用以及数据处理,即实现上述的应用程序的用户识别方法。存储器104可包括高速随机存储器,还可包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器104可进一步包括相对于处理器102远程设置的存储器,这些远程存储器可以通过网络连接至计算机终端10。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
传输模块106用于经由一个网络接收或者发送数据。上述的网络具体实例可包括计算机终端10的通信供应商提供的无线网络。在一个实例中,传输模块106包括一个网络适配器(Network Interface Controller,NIC),其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中,传输模块106可以为射频(RadioFrequency,RF)模块,其用于通过无线方式与互联网进行通讯。
在上述运行环境下,本申请提供了如图2所示的用户识别方法。图2是根据本发明实施例的用户识别方法的流程图一,如图2所示,该方法包括步骤S202-S206:
步骤S202,接收来自用户针对浏览器的访问请求;
在本发明实施例中,以论坛发布新帖为例,该访问请求中可以包含用户填写的页面信息的表单,比如用户填写的论坛的帖子标题、帖子的内容等,还可能包括浏览器信息,该浏览器信息包括对浏览器的操作行为信息,例如:用户在填写帖子标题或者帖子内容时所进行的鼠标、键盘等的操作信息,该操作信息可以是指操作次数,但不限于此。
其中,上述操作行为信息可以通过浏览器中内置的脚本实现,例如可以从脚本库(例如Javascript组件库)中加载指定脚本来采集上述操作行为信息。
步骤S204,对访问请求进行解析,得到解析结果;
在该步骤中,对访问请求进行解析,即将上述访问请求中所包含的内容解析出来,得到解析结果,该解析结果中包括页面信息,也可能包括浏览器信息。
步骤S206,在解析结果中不存在用于反映浏览器行为的浏览器信息时,判定用户为机器人,其中,浏览器行为包括对浏览器的操作行为;在所述解析结果中存在反映浏览器行为的浏览器信息时,按照预设规则判断所述用户为机器人或自然人。
需要说明的是,由于打字或者切换输入框等行为需要自然人进行操作,因而是存在鼠标、键盘等操作信息的,进而,可以通过访问请求中是否存在该浏览器信息进而能够直接识别出机器人用户;在访问请求中不存在反应浏览器行为的浏览器信息时,可以对用户进行进一步的识别。
通过上述步骤,采用接收到的针对浏览器的访问请求是否存在用于反映浏览器行为的浏览器信息对用户进行识别,其中,该浏览器行为包括对浏览器的操作行为的方式,使得用户不会增加额外的网络操作,比如输入验证码的过程操作,从而提高了用户体验的技术效果,进而解决了由于CAPTCHA机制需要在正常的网络操作基础上附加验证码输入操作而造成的用户体验度差的技术问题,该方法与相关技术中的文本、图像、声音等CAPTCHA技术相比,用户仅仅进行了发帖的正常操作,并不需要增加额外的网络操作,比如输入验证码的过程,并且由于不需要验证码,因而也不会被打码平台破解。
在本发明实施例中,上述浏览器信息通过以下方式确定:针对浏览器,对反映浏览器行为的原始浏览器信息进行加密,得到浏览器信息。对原始浏览器信息进行加密可以在保证该信息传输的安全的同时,区分非法行为信息,例如:可以区分机器人对浏览器的操作行为信息比如对论坛进行发帖的标题、内容等,用户的非法操作信息等。其中,加密过程中所使用的加密算法可以在相关技术中查询得知,此处不再赘述。
在本发明实施例中,上述解析结果中包含浏览器的页面信息,在步骤S206中,按照预设规则判断用户为机器人或自然人可以通过以下方式进行判断:在解析结果中存在浏览器信息的情况下,判断浏览器信息和页面信息是否合法;在浏览器信息和页面信息中至少之一不合法的情况下,判定用户为机器人;在浏览器信息和页面信息都合法的情况下,判定用户为自然人。
该步骤中,判断浏览器信息是否合法的表现形式有多种,例如在本发明的一个可选实施例中,可以通过以下方式确定浏览器信息是否合法:判断浏览器信息中记录的用户对浏览器的操作次数是否超过预定次数;若超过预定次数,则确定浏览器信息合法;若没有预定次数,则确定浏览器信息不合法。以论坛发布新帖为例,在用户填写帖子标题、帖子内容等信息时所记录的鼠标操作次数为14次,键盘操作次数为19次(预定次数),则在解析结果中包含的浏览器信息中记录的鼠标操作次数为12次,键盘操作次数为17次,那么可以确定该浏览器信息不合法,在在解析结果中包含的浏览器信息中记录的鼠标操作次数也为15次,键盘操作次数为20次时认为该浏览器信息合法。
需要说明的是,上述预定次数可以依据历史经验值进行设定,也可以通过其他方式,比如根据历史经验值设定之后根据不同的业务场景进行动态调整,得到该预定次数。
在本发明的一个可选实施例中,可以通过以下方式确定页面信息是否合法:判断页面信息与浏览器当前显示页面的页面信息是否一致;若一致,则确定页面信息合法;若不一致,则确定页面信息不合法。以论坛发布新帖为例,用户填写帖子标题、帖子内容等信息之后,会在该帖子的当前页面进行显示,对该当前页面显示的页面信息与在解析结果中包含的页面信息进行比较,如果两者是一致的,那么认为是该页面信息合法,如果不一致,则认为该页面信息不合法。
需要说明的是,上述页面信息与浏览器当前显示页面的页面信息的一致性可以依据不同的业务场景进行模糊判断,比如可以是页面信息与浏览器当前显示页面的页面信息部分一致,该部分一致可以通过设定一定的阈值比例来进行判断,比如,设定该阈值比例为60%,即当页面信息与浏览器当前显示页面的页面信息只要有大于或者等于60%的内容是一致的,那么就可以认为上述两者是一致的,即该页面信息是合法的。该阈值比例可以依据历史经验值进行设定,也可以通过其他方式,比如根据历史经验值设定之后根据不同的业务场景进行动态调整,得到该该阈值比例;也可以通过其他方式进行判断,比如:可以通过页面信息与浏览器当前显示页面的页面信息的内容完全一致。
通过对浏览器信息以及页面信息进行合法性判断,即判断用户的行为是否符合当前的页面信息,进而对机器人用户进行进一步地识别,使得识别更加准确,同时能够更加准确地识别出自然人用户。
图3是根据本发明实施例的用户识别方法的流程图二,如图3所示,步骤S206之前,上述方法还包括:
步骤S302,对浏览器信息进行解密,在未解密成功的情况下,判定用户为机器人。
需要说明的是,在解密成功的情况下,需要继续执行图2中所示的步骤S206,以进行合法性判断。
为了便于理解上述方法,以下结合可选实施例进行详细说明,以某论坛发布新帖的页面为例。
自然人用户的判定步骤如下:
步骤1,用户访问发帖页面;
步骤2,浏览器加载相关的html,js等资源,用于采集浏览器行为的javascript脚本也将在这一步骤中进行加载,该脚本在加载前已经被混淆过,肉眼很难分析出该脚本的准确功能;
步骤3,用户填写帖子标题,帖子内容等信息;
步骤4,采集脚本收集浏览器相关信息,用户在进行步骤2时的鼠标、键盘等操作信息也会被记录,这些信息构成一个集合S1=(i1,i2,i3…ix);
步骤5,采集脚本将通过步骤4采集到的S1调用加密算法e1进行加密,生成一个加密行为串S2(可以为字符串);
步骤6,用户将带有帖子标题、帖子内容等信息的表单,连同步骤5生成的加密行为串S2打包成用户请求(即图2所示步骤S202中的访问请求),去访问论坛资源服务器;
步骤7,论坛资源服务器接收到用户请求,将该用户请求发送给人机识别系统中的规则引擎服务器;
步骤8,规则引擎服务器从用户请求中拿到加密行为串S2,调用解密服务器对加密行为串进行解密;
步骤9,解密服务器调用与e1加密算法相对应的de1加密算法进行解密,解密的结果为步骤4中的信息集合S1;
步骤10,规则引擎服务器对S1中的信息(即图3所示步骤S302中的浏览器信息)进行合法性判定,发现有M次鼠标操作,N次键盘操作记录,采集到的浏览器信息(即上述实施例中的页面信息)也合法,判定该次请求为自然人用户,其中,M和N为自然数;
步骤11,规则引擎服务器将判定结果返回给论坛资源服务器;
步骤12,论坛资源服务器接受该次新帖发布请求,提示用户发帖成功。
某机器人程序进行批量发贴的步骤如下:
步骤1,机器人程序构造帖子的标题、帖子内容等参数,打包成用户请求去访问论坛资源服务器;
步骤2,论坛资源服务器接收到用户请求(即图1所示步骤S202中的访问请求),将用户请求发送给人机识别的规则引擎服务器;
步骤3,规则引擎服务器从用户请求中未找到加密行为串,直接判定该次用户请求为机器人;
步骤4,规则引擎将判定结果返回给论坛资源服务器;
步骤5,论坛资源服务器对该次用户请求进行错误提示。
由此可见,自然人用户和机器人用户发帖的过程是不同的,机器人用户在发帖的过程中是没有加密行为串(即用于反映浏览器行为的浏览器信息)的,基于此,本发明提供了一种优选的用户识别方法,图4是本发明优选实施例的用户识别方法的流程图,如图4所示,该方法包括:
步骤S402,用户浏览器从js资源服务器中的js组件服务器中加载javascript(js)采集组件;
步骤S404,采集浏览器行为信息;
步骤S406,对用于指示浏览器行为信息的行为串(可以为字符串)进行加密,得到加密行为串;
步骤S408,向网络资源服务器发送携带加密行为串的用户请求,以向网络资源服务器请求网络资源;
步骤S410,网络资源服务器将用户请求(即图2所示步骤S202中的访问请求)发给规则引擎服务器;
步骤S412,进入人机识别判定入口;
步骤S414,判断加密行为串是否为空;如果是,转入步骤S420;如果否,执行步骤S416;
步骤S416,解密用户请求中携带的加密行为串;
步骤S418,判断解密是否成功;在解密成功的情况下,执行步骤S422;在解密不成功的情况下,执行步骤S420;
步骤S420,判定为机器人;执行步骤S432;
步骤S422,对解密后的行为串进行分析;
步骤S424,判断解密后的行为串所指示的信息是否符合当前页面(即判断解析后的浏览器信息和浏览器的页面信息是否合法);在符合当前页面时,执行步骤S426;在不符合当前页面时,执行步骤S420;对于合法性的判断可参考上述实施例的解释,此处不再赘述。
步骤S426,判定为自然人;
步骤S428,网络资源服务器正常返回网络资源;
步骤S430,访问网络资源;
步骤S432,网络资源服务器限制访问网络资源;
步骤S434,在用户浏览器中进行错误提示。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本发明所必须的。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到根据上述实施例的方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
实施例2
根据本发明实施例,还提供了一种用户识别系统,图5是根据本发明实施例的用户识别系统的示意图一,如图5所示,该系统包括:网络资源服务组件52、人机识别组件54;
网络资源服务组件52,用于接收用户针对浏览器的访问请求,并将访问请求发送给人机识别组件54;
在本发明的一个可选实施例中,上述网络资源服务组件包括但不限于以下至少之一:会员注册服务器,邮件服务器,交易服务器,内容管理服务器,实时通信服务器,支付服务器,论坛服务器。
在本发明实施例中,以用户在论坛发布新帖为例,论坛服务器接收用户的访问请求,该访问请求中包含用户填写的页面信息的表单,比如用户填写的论坛的帖子标题、帖子的内容等,还可能包括浏览器信息,该浏览器信息包括对浏览器的操作行为信息,例如:用户在填写帖子标题或者帖子内容时所进行的鼠标、键盘等的操作信息,该操作信息可以是指操作次数,但不限于此。
其中,上述操作行为信息可以通过浏览器中内置的脚本实现,例如可以从脚本库(例如Javascript组件库)中加载指定脚本来采集上述操作行为信息。
人机识别组件54,用于对访问请求进行解析,得到解析结果,在解析结果中不存在用于反映浏览器行为的浏览器信息时,判定用户为机器人,其中,浏览器行为包括对浏览器的操作行为;以及在解析结果中存在反映浏览器行为的浏览器信息时,按照预设规则判断用户为机器人或自然人。
由于打字或者切换输入框等行为需要自然人进行操作,因而是存在鼠标、键盘等操作信息的,进而,上述解析结果中可能存在浏览器信息,也可能不存在浏览器信息,进而可以通过访问请求中是否存在该浏览器信息进而能够直接识别出机器人用户,在访问请求中不存在反应浏览器行为的浏览器信息时,可以对用户再进行进一步的识别,以便更加准确的识别出机器人和自然人。
通过上述系统,人机识别组件54通过接收到的针对浏览器的访问请求是否存在用于反映浏览器行为的浏览器信息对用户进行识别,其中,该浏览器行为包括对浏览器的操作行为的方式,使得用户不会增加额外的网络操作,比如输入验证码的过程操作,从而提高了用户体验的技术效果,进而解决了由于CAPTCHA机制需要在正常的网络操作基础上附加验证码输入操作而造成的用户体验度差的技术问题,与相关技术中的文本、图像、声音等CAPTCHA技术相比,用户仅进行了发帖的正常操作,并不需要增加额外的网络操作,比如输入验证码的过程,并且由于不需要验证码,因而也不会被打码平台破解。
在本发明实施例中,上述浏览器信息通过以下方式确定:针对浏览器,对反映浏览器行为的原始浏览器信息进行加密,得到上述浏览器信息。对原始浏览器信息进行加密可以在保证该信息传输的安全的同时,区分非法行为信息,例如:可以区分机器人对浏览器的行为信息比如对论坛进行发帖的标题、内容等,用户的非法操作信息等。其中,加密过程中所使用的加密算法可以在相关技术中查询得知,此处不再赘述。
图6是根据本发明实施例的用户识别系统的示意图二,如图6所示,人机识别组件64包括:规则引擎服务器642;
规则引擎服务器642,用于对访问请求进行解析,以及判断解析结果中是否存在用于反映浏览器行为的浏览器信息,以及在解析结果中不存在浏览器信息时,判定用户为机器人。
在本发明一个可选实施例中,规则引擎服务器642,还用于在解析结果中存在浏览器信息的情况下,判断浏览器信息和浏览器的页面信息是否合法,以及在浏览器信息和页面信息中至少之一不合法的情况下,判定用户为机器人;在浏览器信息和页面信息都合法的情况下,判定用户为自然人;其中,浏览器的页面信息包括在解析结果中。
在本发明实施例中,规则引擎服务器642,还用于通过以下方式确定浏览器信息是否合法:判断浏览器信息中记录的用户对浏览器的操作次数是否超过预定次数;若超过预定次数,则确定浏览器信息合法;若没有超过预定次数,则确定浏览器信息不合法;以及还用于通过以下方式确定页面信息是否合法:判断页面信息与浏览器当前显示页面的页面信息是否一致;若一致,则确定页面信息合法;若不一致,则确定页面信息不合法。
以论坛发布新帖为例,规则引擎服务器642对于浏览器信息的合法性判定可以为以下方式,但不限于此:在用户填写帖子标题、帖子内容等信息时所记录的鼠标操作次数为14次,键盘操作次数为19次(预定次数),则在解析结果中包含的浏览器信息中记录的鼠标操作次数为12次,键盘操作次数为17次,那么可以确定该浏览器信息不合法,在在解析结果中包含的浏览器信息中记录的鼠标操作次数为15次,键盘操作次数为20次时认为该浏览器信息合法;规则引擎服务器642对于页面信息的合法性判定可以为以下方式,但不限于次:用户填写帖子标题、帖子内容等信息之后,会在该帖子的当前页面进行显示,对该当前页面显示的页面信息与在解析结果中包含的页面信息进行比较,如果两者是一致的,那么认为是该页面信息合法,如果不一致,则认为该页面信息不合法。
需要说明的是,上述预定次数可以有几种设定方式,比如可以依据历史经验值进行设定,也可以通过其他方式,比如根据历史经验值设定之后根据不同的业务场景进行动态调整,得到该预定次数。
上述页面信息与浏览器当前显示页面的页面信息的一致性可以依据不同的业务场景进行模糊判断,比如可以是页面信息与浏览器当前显示页面的页面信息完全一致,也可以是部分一致,该部分一致可以通过设定一定的阈值比例来进行判断,比如,设定该阈值比例为60%,即当页面信息与浏览器当前显示页面的页面信息只要有大于或者等于60%的内容是一致的,那么就可以认为上述两者是一致的,即该页面信息是合法的。该阈值比例可以依据历史经验值进行设定,也可以通过其他方式,比如根据历史经验值设定之后根据不同的业务场景进行动态调整,得到该阈值比例;也可以通过其他方式进行判断,比如:可以通过页面信息与浏览器当前显示页面的页面信息的内容完全一致。
另外,在本发明实施例中,还可以对自然人用户进行识别,在一个可选实施例中,如图6所示,人机识别组件64还包括:解密服务器644,用于对浏览器信息进行解密,并将解密结果发送给规则引擎服务器642;
上述规则引擎服务器642,还用于接收解密服务器发送的解密结果,以及在解密结果为浏览器信息未解密成功的情况下,判定用户为机器人。为了便于理解上述方法,以下结合可选实施例进行详细说明,图7是本发明优选实施例的用户识别系统的示意图,如图7所示,该系统包括:
用户终端层72,该层包含一个或多个终端,该终端可以是PC,也可以是平板电脑、智能手机等移动终端,这些终端上通过浏览器来访问网络资源,在浏览器上的行为会被采集组件捕获并加密;
人机识别层74,该层包括一个或多个规则引擎服务器用于判定从用户终端层发起的访问请求是否合法,一个或多个解密服务器用于对用户终端采集的浏览器行为信息进行解密;
网络资源服务层76,该层包括一个或多个网络资源服务器,用户终端在使用某个受人机识别系统保护的网络资源服务时,需要通过人机识别层的规则测试。
在本优选实施例中的人机识别层74与上述实施例中的人机识别组件64实现的功能部分相同,网络资源服务层76与网络资源服务组件62实现的功能部分相同。
实施例3
根据本发明实施例,还提供了一种用于实施实施例1中用户识别方法的装置,图8是本发明实施例的用户识别装置的结构框图一,如图8所示,该装置包括:
接收模块82,用于接收来自用户针对浏览器的访问请求;
在本发明实施例中,以论坛发布新帖为例,访问请求中包含用户填写的页面信息的表单,比如用户填写的论坛的帖子标题、帖子的内容等,还可能包括浏览器信息,该浏览器信息包括对浏览器的操作行为信息,例如:用户在填写帖子标题或者帖子内容时所进行的鼠标、键盘等的操作信息,该操作信息可以是指操作次数,但不限于此。
解析模块84,用于对访问请求进行解析,得到解析结果;
解析模块84对访问请求进行解析,即将上述访问请求中包含的内容解析出来,得到解析结果,该解析结果中包括页面信息,也可能包括浏览器信息。
第一判定模块86,用于在解析结果中不存在用于反映浏览器行为的浏览器信息时,判定用户为机器人,其中,浏览器行为包括对浏览器的操作行为;以及在解析结果中存在反映浏览器行为的浏览器信息时,按照预设规则判断用户为机器人或自然人。
由于打字或者切换输入框等行为需要自然人进行操作,因而是存在鼠标、键盘等操作信息的,进而,第一判断模块86可以通过访问请求中是否存在该浏览器信息进而能够直接识别出机器人用户,在访问请求中不存在反应浏览器行为的浏览器信息时,可以对用户再进行进一步的识别,以便更加准确的识别出机器人和自然人。
通过上述装置,采用接收到的针对浏览器的访问请求是否存在用于反映浏览器行为的浏览器信息对用户进行识别,其中,该浏览器行为包括对浏览器的操作行为的方式,使得用户不会增加额外的网络操作,比如输入验证码的过程操作,从而提高了用户体验的技术效果,进而解决了由于CAPTCHA机制需要在正常的网络操作基础上附加验证码输入操作而造成的用户体验度差的技术问题。与相关技术中的文本、图像、声音等CAPTCHA技术相比,用户仅进行了发帖的正常操作,并不需要增加额外的网络操作,比如输入验证码的过程,并且由于不需要验证码,因而也不会被打码平台破解。
在本发明实施例中,上述浏览器信息通过以下方式确定:针对浏览器,对反映浏览器行为的原始浏览器信息进行加密,得到浏览器信息。对原始浏览器信息进行加密可以在保证该信息传输的安全的同时,区分非法行为信息,例如:可以区分机器人对浏览器的操作行为信息比如对论坛进行发帖的标题、内容等,用户的非法操作信息等。其中,加密过程中所使用的加密算法可以在相关技术中查询得知,此处不再赘述。
在本发明实施例中,上述解析结果中包含浏览器的页面信息,图9是根据本发明实施例的用户识别装置的结构框图二,如图9所示,上述第一判定模块86还包括:
判断单元92,用于在解析结果中存在浏览器信息的情况下,判断浏览器信息和页面信息是否合法;
第一判定单元94,用于在浏览器信息和页面信息中至少之一不合法的情况下,判定用户为机器人;
第二判定单元96,用于在浏览器信息和页面信息都合法的情况下,判定用户为自然人。
上述判断单元92包括:第一判断次单元922,用于判断浏览器信息中记录的用户对浏览器的操作次数是否超过预定次数;其中,在操作次数超过预定次数的情况下,判定浏览器信息合法;在操作次数没有超过预定次数的情况下,确定浏览器信息不合法;第二判断次单元924,用于判断页面信息与浏览器当前显示页面的页面信息是否一致,其中,在页面信息与浏览器当前显示页面的页面信息一致的情况下,确定页面信息合法;在页面信息与浏览器当前显示页面的页面信息不一致的情况下,确定页面信息不合法。
以论坛发布新帖为例,第一判断单元922可以通过以下方式实现对浏览器信息的合法性判断,但不限于此:在用户填写帖子标题、帖子内容等信息时所记录的鼠标操作次数为14次,键盘操作次数为19次(预定次数),则在解析结果中包含的浏览器信息中记录的鼠标操作次数为12次,键盘操作次数为17次,那么可以确定该浏览器信息不合法,在在解析结果中包含的浏览器信息中记录的鼠标操作次数为15次,键盘操作次数为20次时才认为该浏览器信息合法;第二判断单元1024可以通过以下方式实现页面信息的合法性判定,但不限于此:用户填写帖子标题、帖子内容等信息之后,会在该帖子的当前页面进行显示,对该当前页面显示的页面信息与在解析结果中包含的页面信息进行比较,如果两者是一致的,那么认为是该页面信息合法,如果不一致,则认为该页面信息不合法。
需要说明的是,上述预定次数可以有几种设定方式,比如可以依据历史经验值进行设定,也可以通过其他方式,比如根据历史经验值设定之后根据不同的业务场景进行动态调整,得到该预定次数。
上述页面信息与浏览器当前显示页面的页面信息的一致性可以依据不同的业务场景进行模糊判断,比如可以是页面信息与浏览器当前显示页面的页面信息完全一致,也可以是部分一致,该部分一致可以通过设定一定的阈值比例来进行判断,比如,设定该阈值比例为60%,即当页面信息与浏览器当前显示页面的页面信息只要有大于或者等于60%的内容是一致的,那么就可以认为上述两者是一致的,即该页面信息是合法的。该阈值比例可以依据历史经验值进行设定,也可以通过其他方式,比如根据历史经验值设定之后根据不同的业务场景进行动态调整,得到该阈值比例;也可以通过其他方式进行判断,比如:可以通过页面信息与浏览器当前显示页面的页面信息的内容完全一致。
通过对浏览器信息以及页面信息进行合法性判断,即判断用户的行为是否符合当前的页面信息,进而对机器人用户进行进一步地识别,使得识别更加准确,同时能够更加准确地识别出自然人用户。
图10是根据本发明实施例的用户识别装置的结构框图三,如图10所示,上述第一判定模块86还包括:解密单元1002,用于在浏览器信息为对反映浏览器行为的原始浏览器信息进行加密后得到的信息的情况下,判断浏览器信息和页面信息是否合法之前,对浏览器信息进行解密;第三判定单元1004,用于在未解密成功的情况下,判定用户为机器人。
需要说明的是,上述各个模块是可以通过软件或硬件来实现的,对于后者,可以通过以下方式实现,但不限于此:上述模块(比如接收模块82、解析模块84、第一判定模块86)均位于同一处理器中;或者,上述模块分别位于多个处理器中。
实施例4
根据本发明实施例,还提供了一种用户识别的处理方法,图11是根据本发明实施例的用户识别的处理方法的流程图,如图11所示,该方法包括:
步骤S1102,采集针对浏览器的用于反映浏览器行为的浏览器信息,其中,浏览器行为包括:对浏览器的操作行为;
步骤S1104,将携带有浏览器信息的访问请求发送给服务器;访问请求用于为服务器按照预设规则对与对浏览器的操作行为对应的用户进行识别提供依据,与对所述浏览器的操作行为对应的用户包括:自然人用户和机器人用户。
在本发明实施例中,以论坛发布新帖为例,该访问请求中可以包含用户填写的页面信息的表单,比如用户填写的论坛的帖子标题、帖子的内容等,还可能包括浏览器信息,该浏览器信息包括对浏览器的操作行为信息,例如:用户在填写帖子标题或者帖子内容时所进行的鼠标、键盘等的操作信息,该操作信息可以是指操作次数,但不限于此。
其中,上述操作行为信息可以通过浏览器中内置的脚本实现,例如可以从脚本库(例如Javascript组件库)中加载指定脚本来采集上述操作行为信息。
需要说明的是,由于打字或者切换输入框等行为需要自然人进行操作,因而是存在鼠标、键盘等操作信息的,因而将访问请求发送给服务器后,如果服务器判断访问请求中没有携带有这种浏览器信息,那么可以判定该用户为机器人用户,如果携带有该浏览器信息,可以对用户进行进一步地识别。
通过上述步骤,通过采集的能够反映浏览器行为的浏览器信息,并以该浏览器信息作为用户识别的依据,将该浏览器信息通过访问请求发送给服务器,使得服务器能够根据该浏览器信息对用户进行识别,解决了由于CAPTCHA机制需要在正常的网络操作基础上附加验证码输入操作而造成的用户体验度差的技术问题,该方法与相关技术中的文本、图像、声音等CAPTCHA技术相比,用户仅仅进行了发帖的正常操作,并不需要增加额外的网络操作,比如输入验证码的过程,并且由于不需要验证码,因而也不会被打码平台破解。
在本发明实施例中,上述浏览器信息通过以下方式确定:针对浏览器,对反映浏览器行为的原始浏览器信息进行加密,得到浏览器信息。对原始浏览器信息进行加密可以在保证该信息传输的安全的同时,区分非法行为信息,例如:可以区分机器人对浏览器的操作行为信息比如对论坛进行发帖的标题、内容等,用户的非法操作信息等。其中,加密过程中所使用的加密算法可以在相关技术中查询得知,此处不再赘述。
需要说明的是,上述预设规则可以是在访问请求中包括浏览器的页面信息时,浏览器信息和页面信息是否合法,其中,在所述浏览器信息和所述页面信息中至少之一不合法时判定所述用户为机器人,在所述浏览器信息和所述页面信息都合法的情况下,判定所述用户为自然人;也可以是在所述浏览器信息为加密后的浏览器信息时,判断浏览器信息是否解密成功,在所述浏览器信息解密不成功的情况下,判定所述用户为机器人;在所述浏览器信息解密成功,并且所述浏览器信息和所述浏览器的页面信息都合法的情况下,判定所述用户为自然人,但不限于此。
在一个可选的实施例中,上述浏览器信息是否合法包括:浏览器信息中记录的用户对浏览器的操作次数是否超过预定次数;若超过预定次数,则确定浏览器信息合法;若没有超过预定次数,则确定浏览器信息不合法;上述页面信息是否合法包括:页面信息与浏览器当前显示页面的页面信息是否一致;若一致,则确定页面信息合法;若不一致,则确定页面信息不合法。
需要说明的是,上述预定次数可以依据历史经验值进行设定,也可以通过其他方式,比如根据历史经验值设定之后根据不同的业务场景进行动态调整,得到该预定次数。
本发明实施例可以运行一个计算机终端中,该计算机终端可以与图1中所示的计算机终端的结构相同,但是完成的功能并不相同,例如:实施例1中的计算机终端中的处理器102可以用于处理实施例1中的方法步骤,比如接收来自用户针对浏览器的访问请求;而本实施例中的计算机终端中的处理器可以处理采集针对浏览器的用于反映浏览器行为的浏览器信息。
实施例5
根据本发明实施例,还提供了一种用户识别的处理装置,图12是根据本发明实施例的用户识别的处理装置的结构框图,如图12所示,该装置包括:
采集模块1202,用于采集针对浏览器的用于反映浏览器行为的浏览器信息,其中,浏览器行为包括:对浏览器的操作行为;
发送模块1204,用于将携带有浏览器信息的访问请求发送给服务器;访问请求用于为服务器按照预设规则对与对浏览器的操作行为对应的用户进行识别提供依据,与对所述浏览器的操作行为对应的用户包括:自然人用户和机器人用户。
在本发明实施例中,以论坛发布新帖为例,该访问请求中可以包含用户填写的页面信息的表单,比如用户填写的论坛的帖子标题、帖子的内容等,还可能包括浏览器信息,该浏览器信息包括对浏览器的操作行为信息,例如:用户在填写帖子标题或者帖子内容时所进行的鼠标、键盘等的操作信息,该操作信息可以是指操作次数,但不限于此。
其中,上述操作行为信息可以通过浏览器中内置的脚本实现,例如可以从脚本库(例如Javascript组件库)中加载指定脚本来采集上述操作行为信息。
需要说明的是,由于打字或者切换输入框等行为需要自然人进行操作,因而是存在鼠标、键盘等操作信息的,因而将访问请求发送给服务器后,如果服务器判断访问请求中没有携带有这种浏览器信息,那么可以判定该用户为机器人用户,如果携带有该浏览器信息,可以对用户进行进一步地识别。
通过上述装置,通过采集的能够反映浏览器行为的浏览器信息,并以该浏览器信息作为用户识别的依据,将该浏览器信息通过访问请求发送给服务器,使得服务器能够根据该浏览器信息对用户进行识别,解决了由于CAPTCHA机制需要在正常的网络操作基础上附加验证码输入操作而造成的用户体验度差的技术问题,该方法与相关技术中的文本、图像、声音等CAPTCHA技术相比,用户仅仅进行了发帖的正常操作,并不需要增加额外的网络操作,比如输入验证码的过程,并且由于不需要验证码,因而也不会被打码平台破解。
在本发明实施例中,上述浏览器信息通过以下方式确定:针对浏览器,对反映浏览器行为的原始浏览器信息进行加密,得到浏览器信息。对原始浏览器信息进行加密可以在保证该信息传输的安全的同时,区分非法行为信息,例如:可以区分机器人对浏览器的操作行为信息比如对论坛进行发帖的标题、内容等,用户的非法操作信息等。其中,加密过程中所使用的加密算法可以在相关技术中查询得知,此处不再赘述。
需要说明的是,上述预设规则可以是在访问请求中包括浏览器的页面信息时,浏览器信息和页面信息是否合法,其中,在所述浏览器信息和所述页面信息中至少之一不合法时判定所述用户为机器人,在所述浏览器信息和所述页面信息都合法的情况下,判定所述用户为自然人;也可以是在所述浏览器信息为加密后的浏览器信息时,判断浏览器信息是否解密成功,在所述浏览器信息解密不成功的情况下,判定所述用户为机器人;在所述浏览器信息解密成功,并且所述浏览器信息和所述浏览器的页面信息都合法的情况下,判定所述用户为自然人,但不限于此。
在一个可选的实施例中,上述浏览器信息是否合法包括:浏览器信息中记录的用户对浏览器的操作次数是否超过预定次数;若超过预定次数,则确定浏览器信息合法;若没有超过预定次数,则确定浏览器信息不合法;上述页面信息是否合法包括:页面信息与浏览器当前显示页面的页面信息是否一致;若一致,则确定页面信息合法;若不一致,则确定页面信息不合法。
需要说明的是,上述预定次数可以依据历史经验值进行设定,也可以通过其他方式,比如根据历史经验值设定之后根据不同的业务场景进行动态调整,得到该预定次数。
需要说明的是,上述各个模块是可以通过软件或硬件来实现的,对于后者,可以通过以下方式实现,但不限于此:上述模块(比如采集模块1202、发送模块1204)均位于同一处理器中;或者,上述模块分别位于多个处理器中。
实施例6
本发明的实施例可以提供一种计算机终端,该计算机终端可以是计算机终端群中的任意一个计算机终端设备。可选地,在本实施例中,上述计算机终端也可以替换为移动终端等终端设备。
可选地,在本实施例中,上述计算机终端可以位于计算机网络的多个网络设备中的至少一个网络设备。
在本实施例中,上述计算机终端可以执行应用程序的用户识别方法中以下步骤的程序代码:接收来自用户针对浏览器的访问请求;对访问请求进行解析,得到解析结果;在解析结果中不存在用于反映浏览器行为的浏览器信息时,判定用户为机器人,其中,浏览器行为包括对浏览器的操作行为;在解析结果中存在反映浏览器行为的浏览器信息时,按照预设规则判断用户为机器人或自然人。
可选地,图13是根据本发明实施例的一种计算机终端的结构框图。如图13所示,该计算机终端A可以包括:一个或多个(图中仅示出一个)处理器1302、存储器1304。
其中,存储器1304可用于存储软件程序以及模块,如本发明实施例中的用户识别方法和装置对应的程序指令/模块,处理器通过运行存储在存储器内的软件程序以及模块,从而执行各种功能应用以及数据处理,即实现上述的用户识别方法。存储器1304可包括高速随机存储器,还可以包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器可进一步包括相对于处理器远程设置的存储器,这些远程存储器可以通过网络连接至终端A。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
处理器1302可以通过传输装置调用存储器存储的信息及应用程序,以执行下述步骤:在解析结果中存在浏览器信息的情况下,判断浏览器信息和页面信息是否合法;在浏览器信息和页面信息中至少之一不合法的情况下,判定用户为机器人;在浏览器信息和页面信息都合法的情况下,判定用户为自然人。
可选的,上述处理器还可以执行如下步骤的程序代码:对浏览器信息进行解密,在未解密成功的情况下,判定用户为机器人。
采用本发明实施例,提供了一种计算机终端的方案,计算机终端中的处理器1302采用接收到的针对浏览器的访问请求是否存在用于反映浏览器行为的浏览器信息对人用户进行识别,其中,该浏览器行为包括对浏览器的操作行为的方式,使得用户不会增加额外的网络操作,比如输入验证码的过程操作,从而提高了用户体验的技术效果,进而解决了由于CAPTCHA机制需要在正常的网络操作基础上附加验证码输入操作而造成的用户体验度差的技术问题。
本领域普通技术人员可以理解,图13所示的结构仅为示意,计算机终端也可以是智能手机(如Android手机、iOS手机等)、平板电脑、掌声电脑以及移动互联网设备(Mobile Internet Devices,MID)、PAD等终端设备。图13其并不对上述电子装置的结构造成限定。例如,计算机终端A还可包括比图13中所示更多或者更少的组件(如网络接口、显示装置等),或者具有与图12所示不同的配置。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令终端设备相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:闪存盘、只读存储器(Read-Only Memory,ROM)、随机存取器(Random Access Memory,RAM)、磁盘或光盘等。
实施例7
本发明的实施例还提供了一种存储介质。可选地,在本实施例中,上述存储介质可以用于保存上述实施例1所提供的用户识别方法所执行的程序代码。
可选地,在本实施例中,上述存储介质可以位于计算机网络中计算机终端群中的任意一个计算机终端中,或者位于移动终端群中的任意一个移动终端中。
可选地,在本实施例中,存储介质被设置为存储用于执行以下步骤的程序代码:接收来自用户针对浏览器的访问请求;对访问请求进行解析,得到解析结果;在解析结果中不存在用于反映浏览器行为的浏览器信息时,判定用户为机器人,其中,浏览器行为包括对浏览器的操作行为;在解析结果中存在反映浏览器行为的浏览器信息时,按照预设规则判断用户为机器人或自然人。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
在本发明的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的技术内容,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、只读存储器(ROM,Read-OnlyMemory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (25)

1.一种用户识别方法,其特征在于,包括:
接收来自用户针对浏览器的访问请求;
对所述访问请求进行解析,得到解析结果;
在所述解析结果中不存在用于反映浏览器行为的浏览器信息时,判定所述用户为机器人,其中,所述浏览器行为包括对所述浏览器的操作行为;在所述解析结果中存在反映浏览器行为的浏览器信息时,按照预设规则判断所述用户为机器人或自然人。
2.根据权利要求1所述的方法,其特征在于,所述浏览器信息通过以下方式确定:
针对所述浏览器,对反映浏览器行为的原始浏览器信息进行加密,得到所述浏览器信息。
3.根据权利要求1所述的方法,其特征在于,所述解析结果中还包含所述浏览器的页面信息,按照预设规则判断所述用户为机器人或自然人包括:
在所述解析结果中存在所述浏览器信息的情况下,判断所述浏览器信息和所述页面信息是否合法;在所述浏览器信息和所述页面信息中至少之一不合法的情况下,判定所述用户为机器人;
在所述浏览器信息和所述页面信息都合法的情况下,判定所述用户为自然人。
4.根据权利要求3所述的方法,其特征在于,
通过以下方式确定所述浏览器信息是否合法:判断所述浏览器信息中记录的所述用户对所述浏览器的操作次数是否超过预定次数;若超过所述预定次数,则确定所述浏览器信息合法;若没有超过所述预定次数,则确定所述浏览器信息不合法;
通过以下方式确定所述页面信息是否合法:判断所述页面信息与所述浏览器当前显示页面的页面信息是否一致;若一致,则确定所述页面信息合法;若不一致,则确定所述页面信息不合法。
5.根据权利要求3所述的方法,其特征在于,在所述浏览器信息为对反映浏览器行为的原始浏览器信息进行加密后得到的信息的情况下,判断所述浏览器信息和所述页面信息是否合法之前,所述方法还包括:
对所述浏览器信息进行解密,在未解密成功的情况下,判定所述用户为机器人。
6.一种用户识别系统,其特征在于,包括:网络资源服务组件、人机识别组件;
所述网络资源服务组件,用于接收用户针对浏览器的访问请求,并将所述访问请求发送给人机识别组件;
所述人机识别组件,用于对所述访问请求进行解析,得到解析结果,在所述解析结果中不存在用于反映浏览器行为的浏览器信息时,判定所述用户为机器人,其中,所述浏览器行为包括对所述浏览器的操作行为;以及在所述解析结果中存在反映浏览器行为的浏览器信息时,按照预设规则判断所述用户为机器人或自然人。
7.根据权利要求6所述的系统,其特征在于,所述浏览器信息通过以下方式确定:
针对所述浏览器,对反映浏览器行为的原始浏览器信息进行加密,得到所述浏览器信息。
8.根据权利要求7所述的系统,其特征在于,所述人机识别组件包括:规则引擎服务器;
所述规则引擎服务器,用于对所述访问请求进行解析,以及判断解析结果中是否存在用于反映浏览器行为的浏览器信息,以及在所述解析结果中不存在所述浏览器信息时,判定所述用户为机器人。
9.根据权利要求8所述的系统,其特征在于,
所述规则引擎服务器,还用于在所述解析结果中存在所述浏览器信息的情况下,判断所述浏览器信息和浏览器的页面信息是否合法,以及在所述浏览器信息和所述页面信息中至少之一不合法的情况下,判定所述用户为机器人;在所述浏览器信息和所述页面信息都合法的情况下,判定所述用户为自然人;其中,所述浏览器的页面信息包括在所述解析结果中。
10.根据权利要求9所述的系统,其特征在于,
所述规则引擎服务器,还用于通过以下方式确定所述浏览器信息是否合法:判断所述浏览器信息中记录的所述用户对所述浏览器的操作次数是否超过预定次数;若超过所述预定次数,则确定所述浏览器信息合法;若没有超过所述预定次数,则确定所述浏览器信息不合法;以及还用于通过以下方式确定所述页面信息是否合法:判断所述页面信息与所述浏览器当前显示页面的页面信息是否一致;若一致,则确定所述页面信息合法;若不一致,则确定所述页面信息不合法。
11.根据权利要求8所述的系统,其特征在于,
所述人机识别组件还包括:解密服务器,用于对所述浏览器信息进行解密,并将解密结果发送给所述规则引擎服务器;
所述规则引擎服务器,还用于接收所述解密服务器发送的解密结果,以及在解密结果为所述浏览器信息未解密成功的情况下,判定所述用户为机器人。
12.根据权利要求7所述的系统,其特征在于,所述网络资源服务组件包括以下至少之一:
会员注册服务器,邮件服务器,交易服务器,内容管理服务器,实时通信服务器,支付服务器,论坛服务器。
13.一种用户识别装置,其特征在于,包括:
接收模块,用于接收来自用户针对浏览器的访问请求;
解析模块,用于对所述访问请求进行解析,得到解析结果;
第一判定模块,用于在所述解析结果中不存在用于反映浏览器行为的浏览器信息时,判定所述用户为机器人,其中,所述浏览器行为包括对所述浏览器的操作行为;以及在所述解析结果中存在反映浏览器行为的浏览器信息时,按照预设规则判断所述用户为机器人或自然人。
14.根据权利要求13所述的装置,其特征在于,所述浏览器信息通过以下方式确定:
针对所述浏览器,对反映浏览器行为的原始浏览器信息进行加密,得到所述浏览器信息。
15.根据权利要求13所述的装置,其特征在于,所述解析结果中包含所述浏览器的页面信息,所述第一判定模块包括:
判断单元,用于在所述解析结果中存在所述浏览器信息的情况下,判断所述浏览器信息和所述页面信息是否合法;
第一判定单元,用于在所述浏览器信息和所述页面信息中至少之一不合法的情况下,判定所述用户为机器人;
第二判定单元,用于在所述浏览器信息和所述页面信息都合法的情况下,判定所述用户为自然人。
16.根据权利要求15所述的装置,其特征在于,所述判断单元包括:
第一判断次单元,用于判断所述浏览器信息中记录的所述用户对所述浏览器的操作次数是否超过预定次数;其中,在所述操作次数超过所述预定次数的情况下,判定所述浏览器信息合法;在所述操作次数没有超过所述预定次数的情况下,确定所述浏览器信息不合法;
第二判断次单元,用于判断所述页面信息与所述浏览器当前显示页面的页面信息是否一致,其中,在所述页面信息与所述浏览器当前显示页面的页面信息一致的情况下,确定所述页面信息合法;在所述页面信息与所述浏览器当前显示页面的页面信息不一致的情况下,确定所述页面信息不合法。
17.根据权利要求15所述的装置,其特征在于,所述第一判定模块还包括:
解密单元,用于在所述浏览器信息为对反映浏览器行为的原始浏览器信息进行加密后得到的信息的情况下,判断所述浏览器信息和所述页面信息是否合法之前,对所述浏览器信息进行解密;
第三判定单元,用于在未解密成功的情况下,判定所述用户为机器人。
18.一种用户识别的处理方法,其特征在于,包括:
采集针对浏览器的用于反映浏览器行为的浏览器信息,其中,所述浏览器行为包括:对所述浏览器的操作行为;
将携带有所述浏览器信息的访问请求发送给服务器;所述访问请求用于为所述服务器按照预设规则对与对所述浏览器的操作行为对应的用户进行识别提供依据,所述与对所述浏览器的操作行为对应的用户包括:自然人用户和机器人用户。
19.根据权利要求18所述的方法,其特征在于,所述浏览器信息通过以下方式确定:
针对所述浏览器,对反映浏览器行为的原始浏览器信息进行加密,得到所述浏览器信息。
20.根据权利要求18或19所述的方法,其特征在于,所述预设规则包括以下至少之一:
在所述访问请求中包括所述浏览器的页面信息时,判断所述浏览器信息和所述页面信息是否合法,其中,在所述浏览器信息和所述页面信息中至少之一不合法时判定所述用户为机器人,在所述浏览器信息和所述页面信息都合法的情况下,判定所述用户为自然人;
在所述浏览器信息为加密后的浏览器信息时,判断所述浏览器信息是否解密成功,其中,在所述浏览器信息解密不成功的情况下,判定所述用户为机器人;在所述浏览器信息解密成功,并且所述浏览器信息和所述浏览器的页面信息都合法的情况下,判定所述用户为自然人。
21.根据权利要求20所述的方法,其特征在于,
所述浏览器信息是否合法包括:所述浏览器信息中记录的所述用户对所述浏览器的操作次数是否超过预定次数;若超过所述预定次数,则确定所述浏览器信息合法;若没有超过所述预定次数,则确定所述浏览器信息不合法;和/或
所述页面信息是否合法包括:所述页面信息与所述浏览器当前显示页面的页面信息是否一致;若一致,则确定所述页面信息合法;若不一致,则确定所述页面信息不合法。
22.一种用户识别的处理装置,其特征在于,包括:
采集模块,用于采集针对浏览器的用于反映浏览器行为的浏览器信息,其中,所述浏览器行为包括:对所述浏览器的操作行为;
发送模块,用于将携带有所述浏览器信息的访问请求发送给服务器;所述访问请求用于为所述服务器按照预设规则对与对所述浏览器的操作行为对应的用户进行识别提供依据,所述与对所述浏览器的操作行为对应的用户包括:自然人用户和机器人用户。
23.根据权利要求22所述的装置,其特征在于,所述浏览器信息通过以下方式确定:
针对所述浏览器,对反映浏览器行为的原始浏览器信息进行加密,得到所述浏览器信息。
24.根据权利要求22或23所述的装置,其特征在于,所述预设规则包括以下至少之一:
在所述访问请求中包括所述浏览器的页面信息时,判断所述浏览器信息和所述页面信息是否合法,其中,在所述浏览器信息和所述页面信息中至少之一不合法时判定所述用户为机器人,在所述浏览器信息和所述页面信息都合法的情况下,判定所述用户为自然人;
在所述浏览器信息为加密后的浏览器信息时,判断所述浏览器信息是否解密成功,其中,在所述浏览器信息解密不成功的情况下,判定所述用户为机器人;在所述浏览器信息解密成功,并且所述浏览器信息和所述浏览器的页面信息都合法的情况下,判定所述用户为自然人。
25.根据权利要求24所述的装置,其特征在于,
所述浏览器信息是否合法包括:所述浏览器信息中记录的所述用户对所述浏览器的操作次数是否超过预定次数;若超过所述预定次数,则确定所述浏览器信息合法;若没有超过所述预定次数,则确定所述浏览器信息不合法;
所述页面信息是否合法包括:所述页面信息与所述浏览器当前显示页面的页面信息是否一致;若一致,则确定所述页面信息合法;若不一致,则确定所述页面信息不合法。
CN201510531371.7A 2015-08-26 2015-08-26 用户识别方法、系统、装置及处理方法、装置 Active CN106487747B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510531371.7A CN106487747B (zh) 2015-08-26 2015-08-26 用户识别方法、系统、装置及处理方法、装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510531371.7A CN106487747B (zh) 2015-08-26 2015-08-26 用户识别方法、系统、装置及处理方法、装置

Publications (2)

Publication Number Publication Date
CN106487747A true CN106487747A (zh) 2017-03-08
CN106487747B CN106487747B (zh) 2019-10-08

Family

ID=58233633

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510531371.7A Active CN106487747B (zh) 2015-08-26 2015-08-26 用户识别方法、系统、装置及处理方法、装置

Country Status (1)

Country Link
CN (1) CN106487747B (zh)

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107330311A (zh) * 2017-06-29 2017-11-07 苏州锦佰安信息技术有限公司 一种人机识别的方法和设备
CN108171024A (zh) * 2017-11-28 2018-06-15 苏州市东皓计算机系统工程有限公司 一种计算机系统的加密方法
CN108495272A (zh) * 2018-03-19 2018-09-04 上海哔哩哔哩科技有限公司 基于html5浏览器的机器人识别方法、系统及存储介质
CN108810019A (zh) * 2018-07-13 2018-11-13 腾讯科技(深圳)有限公司 拒绝服务攻击防御方法、装置、设备和存储介质
CN108959869A (zh) * 2018-07-03 2018-12-07 北京润信恒达科技有限公司 一种自然人操作的识别方法及装置
WO2019001558A1 (zh) * 2017-06-29 2019-01-03 苏州锦佰安信息技术有限公司 一种人机识别的方法和设备
CN109214181A (zh) * 2017-07-01 2019-01-15 武汉斗鱼网络科技有限公司 识别网络爬虫的方法、存储介质、电子设备及系统
CN109413004A (zh) * 2017-08-16 2019-03-01 阿里巴巴集团控股有限公司 验证方法、装置及设备
CN109902459A (zh) * 2017-12-11 2019-06-18 北京京东尚科信息技术有限公司 Web页面的人机识别验证方法、系统、设备和存储介质
CN110020059A (zh) * 2017-07-17 2019-07-16 塔塔咨询服务公司 用于包容性captcha的系统和方法
CN110879882A (zh) * 2018-09-06 2020-03-13 中国移动通信集团重庆有限公司 确认用户信息安全的方法、装置、设备和介质
CN111625700A (zh) * 2020-05-25 2020-09-04 北京世纪家天下科技发展有限公司 防抓取的方法、装置、设备及计算机存储介质
CN112365267A (zh) * 2020-11-10 2021-02-12 中国工商银行股份有限公司 一种基于操作行为的反爬虫方法及装置
CN114374560A (zh) * 2018-02-07 2022-04-19 阿里巴巴集团控股有限公司 数据处理方法、设备及存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090241174A1 (en) * 2008-02-19 2009-09-24 Guru Rajan Handling Human Detection for Devices Connected Over a Network
CN102737019A (zh) * 2011-03-31 2012-10-17 阿里巴巴集团控股有限公司 机器行为确定方法、网页浏览器及网页服务器
CN103218431A (zh) * 2013-04-10 2013-07-24 金军 一种能识别网页信息自动采集的系统与方法
US20130276125A1 (en) * 2008-04-01 2013-10-17 Leap Marketing Technologies Inc. Systems and methods for assessing security risk
WO2014138129A2 (en) * 2013-03-05 2014-09-12 Alibaba Group Holding Limited Method and system for distinguishing humans from machines

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090241174A1 (en) * 2008-02-19 2009-09-24 Guru Rajan Handling Human Detection for Devices Connected Over a Network
US20130276125A1 (en) * 2008-04-01 2013-10-17 Leap Marketing Technologies Inc. Systems and methods for assessing security risk
CN102737019A (zh) * 2011-03-31 2012-10-17 阿里巴巴集团控股有限公司 机器行为确定方法、网页浏览器及网页服务器
WO2014138129A2 (en) * 2013-03-05 2014-09-12 Alibaba Group Holding Limited Method and system for distinguishing humans from machines
CN103218431A (zh) * 2013-04-10 2013-07-24 金军 一种能识别网页信息自动采集的系统与方法

Cited By (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107330311A (zh) * 2017-06-29 2017-11-07 苏州锦佰安信息技术有限公司 一种人机识别的方法和设备
WO2019001558A1 (zh) * 2017-06-29 2019-01-03 苏州锦佰安信息技术有限公司 一种人机识别的方法和设备
CN109214181A (zh) * 2017-07-01 2019-01-15 武汉斗鱼网络科技有限公司 识别网络爬虫的方法、存储介质、电子设备及系统
CN110020059B (zh) * 2017-07-17 2023-04-07 塔塔咨询服务公司 用于包容性captcha的系统和方法
CN110020059A (zh) * 2017-07-17 2019-07-16 塔塔咨询服务公司 用于包容性captcha的系统和方法
CN109413004A (zh) * 2017-08-16 2019-03-01 阿里巴巴集团控股有限公司 验证方法、装置及设备
CN108171024A (zh) * 2017-11-28 2018-06-15 苏州市东皓计算机系统工程有限公司 一种计算机系统的加密方法
CN109902459A (zh) * 2017-12-11 2019-06-18 北京京东尚科信息技术有限公司 Web页面的人机识别验证方法、系统、设备和存储介质
CN114374560A (zh) * 2018-02-07 2022-04-19 阿里巴巴集团控股有限公司 数据处理方法、设备及存储介质
CN108495272A (zh) * 2018-03-19 2018-09-04 上海哔哩哔哩科技有限公司 基于html5浏览器的机器人识别方法、系统及存储介质
CN108959869A (zh) * 2018-07-03 2018-12-07 北京润信恒达科技有限公司 一种自然人操作的识别方法及装置
CN108810019B (zh) * 2018-07-13 2020-12-01 腾讯科技(深圳)有限公司 拒绝服务攻击防御方法、装置、设备和存储介质
CN108810019A (zh) * 2018-07-13 2018-11-13 腾讯科技(深圳)有限公司 拒绝服务攻击防御方法、装置、设备和存储介质
CN110879882A (zh) * 2018-09-06 2020-03-13 中国移动通信集团重庆有限公司 确认用户信息安全的方法、装置、设备和介质
CN110879882B (zh) * 2018-09-06 2022-09-27 中国移动通信集团重庆有限公司 确认用户信息安全的方法、装置、设备和介质
CN111625700A (zh) * 2020-05-25 2020-09-04 北京世纪家天下科技发展有限公司 防抓取的方法、装置、设备及计算机存储介质
CN111625700B (zh) * 2020-05-25 2023-04-07 北京世纪家天下科技发展有限公司 防抓取的方法、装置、设备及计算机存储介质
CN112365267A (zh) * 2020-11-10 2021-02-12 中国工商银行股份有限公司 一种基于操作行为的反爬虫方法及装置

Also Published As

Publication number Publication date
CN106487747B (zh) 2019-10-08

Similar Documents

Publication Publication Date Title
CN106487747A (zh) 用户识别方法、系统、装置及处理方法、装置
CN104495545B (zh) 基于动态二维码的电梯维保电子监管系统及方法
CN109509021B (zh) 基于行为轨迹的异常识别方法、装置、服务器及存储介质
CN111428881A (zh) 识别模型的训练方法、装置、设备及可读存储介质
CN109241711A (zh) 基于预测模型的用户行为识别方法及装置
CN107483500A (zh) 一种基于用户行为的风险识别方法、装置及存储介质
CN106131057A (zh) 基于虚拟现实场景的认证和装置
CN111782719B (zh) 数据处理方法及装置
CN109194689B (zh) 异常行为识别方法、装置、服务器及存储介质
CN111079184A (zh) 防护数据泄漏的方法、系统、设备以及存储介质
CN110247819A (zh) 一种基于加密流识别的Wi-Fi视频采集设备检测方法及系统
CN111931189A (zh) Api接口转用风险检测方法、装置和api服务系统
CN109754322A (zh) 一种数据服务系统
CN110675252A (zh) 风险评估方法、装置、电子设备及存储介质
CN103164787A (zh) 文化执法数字化终端系统和方法
CN115049070A (zh) 联邦特征工程数据的筛选方法及装置、设备及存储介质
CN114611008A (zh) 基于联邦学习的用户服务策略确定方法、装置及电子设备
CN105916005A (zh) 多媒体信息的内容模式控制方法和装置
CN114282882B (zh) 素材工单审核方法、装置、设备及存储介质
CN108924133A (zh) 一种网络数据防泄漏方法和系统
CN111353140B (zh) 验证码的生成、显示方法、装置和系统
CN107181822A (zh) 通信系统及其通信方法和装置、终端以及终端的控制方法
CN117319450B (zh) 基于物联网的超声波计量仪表数据交互方法、装置及设备
KR20230033239A (ko) 생활용 폐기물의 수거 관리 시스템 및 방법
CN113610550A (zh) 一种基于区块链的产品溯源方法及系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant