CN104899499B - 基于互联网图片搜索的Web验证码生成方法 - Google Patents

基于互联网图片搜索的Web验证码生成方法 Download PDF

Info

Publication number
CN104899499B
CN104899499B CN201510288911.3A CN201510288911A CN104899499B CN 104899499 B CN104899499 B CN 104899499B CN 201510288911 A CN201510288911 A CN 201510288911A CN 104899499 B CN104899499 B CN 104899499B
Authority
CN
China
Prior art keywords
picture
noun
verification code
code generation
generation methods
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201510288911.3A
Other languages
English (en)
Other versions
CN104899499A (zh
Inventor
魏松杰
周紫阳
崔聪
杨铃
陈秋冰
吴高翔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing University of Science and Technology
Original Assignee
Nanjing University of Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing University of Science and Technology filed Critical Nanjing University of Science and Technology
Priority to CN201510288911.3A priority Critical patent/CN104899499B/zh
Publication of CN104899499A publication Critical patent/CN104899499A/zh
Application granted granted Critical
Publication of CN104899499B publication Critical patent/CN104899499B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/30Authentication, i.e. establishing the identity or authorisation of security principals
    • G06F21/31User authentication
    • G06F21/36User authentication by graphic or iconic representation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2221/00Indexing scheme relating to security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F2221/21Indexing scheme relating to G06F21/00 and subgroups addressing additional information or applications relating to security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F2221/2119Authenticating web pages, e.g. with suspicious links
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2221/00Indexing scheme relating to security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F2221/21Indexing scheme relating to G06F21/00 and subgroups addressing additional information or applications relating to security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F2221/2133Verifying human interaction, e.g., Captcha

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Security & Cryptography (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Hardware Design (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于互联网图片搜索的Web验证码生成方法。该方法包括选取关键词、搜索并缓存图片、图片预处理、用户操作及验证等步骤。通过从词库中随机选取名词,利用搜索引擎得到与其对应的图片资源,从而生成一些名词与图片的对应关系,这些关系真实用户可以方便的识别而计算机程序却难以区分,进而可以规避一些恶意程序伪装成用户进行不合理操作的Web现象,提高网络的安全性和可靠性。本方法解决了现有验证码技术验证过程中用户体验不佳,验证码内容易被程序自动识别破解等技术问题。本发明具有验证码空间大、可靠性高、验证过程简单、用户识别快、用户体验好等优点。

Description

基于互联网图片搜索的Web验证码生成方法
技术领域
本发明涉及基于互联网的的验证码生成方法,具体是一种基于互联网搜索获取验证图片资源的方法。
背景技术
验证码的诞生是伴随着计算机安全技术和黑客技术的不断发展而出现的,为了防止恶意用户利用自动注册工具批量注册网站账号或重复提交表单消耗服务器资源而产生的一种网络验证技术,验证码从扭曲的文字符号到处理过的文字图片(黄赛平,许明。2009,验证码的识别与改进[J],南京师范大学学报(工程技术版),9(2):84-88),经历了从简单到复杂的过程,虽然在一定程度上提高了安全性,但同时也降低了用户的体验效果,扭曲的文字时常让用户难以辨认,让人不胜其烦。近年来图片验证码方法有了一些显著的提高,例如使用图片内容识别,而不再依赖单纯的文字识别,给出一张图片,让用户选出图片的内容(许明.验证码的识别与反识别[D].南京理工大学2007),这样的技术拥有较强的防御黑客攻击的能力,但图片的数量和来源限制了该方法的效果,实际的防御效果不尽如人意,所以图片技术在验证码识别技术领域的一些应用方面还有待改善,实现效果还有待提高。
发明内容
本发明提供了一种基于互联网图片搜索的web验证码生成方法。利用关键词搜索图片,将图片处理后缓存生成数据库,再从数据库中选取图片验证码展示在客户端以供选择,计算机计算选择结果的准确率,判断验证是否成功,从而达到图片验证码实现整个验证过程的目的。本发明可以为很多需要验证操作的网站提供安全保障,防止有人利用机器人自动批量注册以及对特定的用户密码进行暴力破解的行为,有效避免对服务器的恶意攻击和一些垃圾信息的传播过程。
实现本发明目的的技术解决方案为:建立一个动态的名词库,利用图片搜索引擎,建立和其对应的“名词-图片”数据库,为每个名词存储从互联网上搜索得到的随机的N张图片,随后从数据库中随机选取名词和需要的图片生成图片验证码,展示给客户端进行操作,根据操作反馈结果对该次操作行为进行评估以判断该操作是否是机器所为,从而达到检测该次操作是否机器恶意攻击行为的目的。主要包括以下步骤:
1)建立一个名词库,由名词单词组成,如:海豚、公鸡。具体单词可以根据系统应用需要由其相应的语言组成。
2)利用图片搜索引擎查找图片资源,如:http://image.baidu.com/、http://cn.bing.com/images,对名词库中的名词逐个进行搜索,每个名词在其对应的搜索结果图的前T(T>0)张(例如T=100)中随机选取N(0<N≤T)张(例如N=10),对这N张图片进行格式标准化处理,然后连同该名词一起存入数据库。如果该名词搜索出的结果个数小于T,则在名词库中换一个名词重新搜索,名词更换方式采取循环更换的方法。生成的数据库维护一个固定大小(数据库词条的个数要小于等于名词库中名词的个数,比如数据库有10000个名词条),数据库中每条数据的组成为名词单词和其对应的N张图片;
3)生成图片验证码,从数据库中随机选取m(m>0,例如2)个名词,从这m个词中每个词所对应的缓存图片中选取p(例如1或2)张,这样可以得到m×p张图片,再从整个数据库中随机选择(n-m×p)张(假设要展示在客户端用以选择的图片总数需求为n),然后将这n张图片连同这m个名词一起展示在客户端;
4)验证过程。采用评估算法评估客户端给出的反馈结果,与预定期望值进行比较,判断是否让此次验证过程成功通过,通过则完成整个验证过程,否则重复上一步;
5)不管验证成功与否,当次使用过的词条都会在数据中删除,为了维护数据库的固定大小,在数据库空闲的时候,会对里面的词条进行更新,在上次数据库更新之后使用过的词条都会被删除,然后重新从词库中选取名词对数据库进行补充,直到数据库达到饱和。
与现有技术相比,本发明的显著优点为:
(1)验证码所使用的资源的无限的。图片来自浩瀚且不断更新的互联网资源,而不局限于一个图库,增大黑客破解难度。
(2)使用互联网搜索引擎搜索图片,通过随机算法选择图片,不断更新和缓冲大量资源,使得验证码资源不断更新,增大了验证图片的随机性。
(3)使用搜索引擎确定的图片和名词的对应关系验证用户,提高了用户识别的友好体验,同时降低了机器识别的能力。
(4)计算准确率代替比较验证,在保证准确性的同时,适当的增加了一定的容错性,提高了用户体验。
附图说明
图1是本发明图片验证码生成流程示意图。
图2是图片验证流程示意图。
图3是图片搜索界面示意图。
图4是图片验证界面示意图。
具体实施方式
本发明一种基于互联网图片搜索的web验证码的生成方法,该方法基于关键词词库和互联网资源生成web端的图片验证码,可以用于防止有人利用机器人自动批量注册以消耗服务器资源、对特定用户的登录密码进行暴力破解等一些危害用户和服务器的行为。
下面结合实施例对本发明做进一步说明。
1)建立一个名词库,由名词单词组成,如:电池、火车。具体单词所用语言可以根据系统应用需要由其相应的语言组成。
2)在名词库中随机选取一个名词,使用图片搜索引擎对其进行搜索,比如选取“火车”,用搜索引擎http://cn.bing.com/images搜索得到的结果图如图3所示,此次试验中选取的变量T的值为50,由于搜索“火车”得到的图片数量大于等于50,所以继续操作。从得到的这50张图片中随机选取N张,此处的N值设置为10。对这最后确定的10张图片进行格式标准化处理,连同“火车”这个名词一起放入数据库中。
3)重复上述步骤直至数据库达到饱和,仅作为实验用,数据库大小只有100个词条。词库中包括小鸡、狗、猫、猪、树、书本、笔、球、冰激凌、茶杯、电池、电脑、手机、火车、飞机、太阳、溪水等共200个名词,对这些名词进行逐个搜索,得到的结果组成词条大小为100的“名词-图片”数据库。
4)从数据库中随机选取了2个名词,分别是“火车”和“电池”,从它们所对应的图片中选取p张图片,此次试验中的p采用的是从1和2两个数中随机得到的数,如图4所示,随机的结果是“火车”有两张图片,而“电池”只有一张图片。为了得到需要展示给客户端的共8张图片,再从数据库中随机选取了5(8-2-1)张图片,将这所有的共8张图片在客户端展示出来。
5)对于客户端反馈回来的选择结果,用公式的值是否大于等于来对选择结果进行评判,其中x表示客户端选择出的正确的个数,y表示实际正确的个数,z表示客户端选择错误的个数,n表示展示出的总的图片数。
例如:对于图4中的验证码,如果选择出了正确的两张火车和一张电池的图片,则公式中x=3,y=3,z=0,n=8,最后计算出的值为则此次验证通过;如果只选出了两张正确的图片,再选择了最后那张人物的图片,则公式中x=2,y=3,z=1,n=8,最后的计算结果为则此次验证不会通过,客户端会给出新的验证码要求重新验证。
刚才使用过的两个词条“火车”和“电池”将会从数据库中删除,并且从词库中重新选取两个单词重复第二步补充进数据库中以维护数据库的固定大小。

Claims (7)

1.一种基于互联网图片搜索的Web验证码生成方法,其特征在于,实现步骤包括:
第一步,建立一个名词库,包含名词单词;
第二步,对名词库中的名词逐个进行搜索,得到每个名词对应的搜索结果图,如果结果图的数量少于T,则在词库中重新选择单词进行搜索,如果结果图的数量大于等于T,则在每个名词其对应的搜索结果图的前T张图片中随机选取N张,将名词和其对应的N张图片存入数据库中;
第三步,从数据库中随机选取m个名词,从每个名词所对应的图片中选取p张,得到m×p张图片,再从整个数据库中随机选择(n-m×p)张,n为需要在客户端显示出的图片总数,将这n张图片连同选取出的m个名词在客户端显示出来;
每次完成验证之后删除当次使用的m个词条和其相关图片,返回步骤二。
2.根据权利要求1中所述的基于互联网图片搜索的Web验证码生成方法,其特征在于:步骤二中所述在每个名词其对应的搜索结果图的前T张图片中随机选取N张后,对这N张图片进行格式的标准化处理,得到格式和大小统一的图片。
3.根据权利要求1中所述的基于互联网图片搜索的Web验证码生成方法,其特征在于:步骤二中所述T和N均是自定义的阈值,且0<N<T。
4.根据权利要求1中所述的基于互联网图片搜索的Web验证码生成方法,其特征在于:步骤二中所述重新选择单词搜索时采用循环选取单词的方法。
5.根据权利要求1中所述的基于互联网图片搜索的Web验证码生成方法,其特征在于:步骤二中所述数据库维护固定大小,每条数据的组成为名词单词和其对应的N张图片,以名词单词作为关键词。
6.根据权利要求1中所述的基于互联网图片搜索的Web验证码生成方法,其特征在于:所述图片和名词在客户端显示出来后,根据这些名词选出其对应的一张或多张图片。
7.根据权利要求6所述的基于互联网图片搜索的Web验证码生成方法,其特征在于:所述选出其对应的一张或多张图片后,设定阈值,将选择结果与阈值进行比较,判断是否能通过验证,通过则完成验证,否则返回第三步。
CN201510288911.3A 2015-05-29 2015-05-29 基于互联网图片搜索的Web验证码生成方法 Active CN104899499B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510288911.3A CN104899499B (zh) 2015-05-29 2015-05-29 基于互联网图片搜索的Web验证码生成方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510288911.3A CN104899499B (zh) 2015-05-29 2015-05-29 基于互联网图片搜索的Web验证码生成方法

Publications (2)

Publication Number Publication Date
CN104899499A CN104899499A (zh) 2015-09-09
CN104899499B true CN104899499B (zh) 2017-09-22

Family

ID=54032160

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510288911.3A Active CN104899499B (zh) 2015-05-29 2015-05-29 基于互联网图片搜索的Web验证码生成方法

Country Status (1)

Country Link
CN (1) CN104899499B (zh)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017061253A1 (ja) * 2015-10-09 2017-04-13 アイビーリサーチ株式会社 表示制御装置、表示制御方法及び表示制御プログラム
CN105847293B (zh) * 2016-05-20 2019-05-14 深圳市金立通信设备有限公司 一种基于图像识别实现系统登录的方法和终端
CN106095754B (zh) * 2016-06-08 2018-06-19 广州同构医疗科技有限公司 一种医学术语词库词性标注方法
CN106485261B (zh) * 2016-09-08 2020-06-02 北京小米移动软件有限公司 一种图像识别的方法和装置
CN106302528B (zh) * 2016-09-28 2020-03-17 北京小米移动软件有限公司 短信息处理方法及装置
CN107609389B (zh) * 2017-08-24 2020-10-30 南京理工大学 一种基于图像内容相关性的验证方法及系统
CN110543754A (zh) * 2018-05-29 2019-12-06 武汉极意网络科技有限公司 存储器、验证码实现方法、装置和设备
CN109635535A (zh) * 2018-12-14 2019-04-16 泰康保险集团股份有限公司 用于验证用户身份的方法
CN116561733A (zh) * 2023-05-29 2023-08-08 北京百度网讯科技有限公司 基于图片验证码的验证方法及装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8621578B1 (en) * 2008-12-10 2013-12-31 Confident Technologies, Inc. Methods and systems for protecting website forms from automated access
CN104424426A (zh) * 2013-08-21 2015-03-18 北大方正集团有限公司 验证方法及装置
CN104468101A (zh) * 2013-09-12 2015-03-25 深圳市腾讯计算机系统有限公司 一种用户身份的验证方法、装置和验证服务系统
CN104660549A (zh) * 2013-11-19 2015-05-27 深圳市腾讯计算机系统有限公司 身份验证方法及装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130145441A1 (en) * 2011-06-03 2013-06-06 Dhawal Mujumdar Captcha authentication processes and systems using visual object identification

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8621578B1 (en) * 2008-12-10 2013-12-31 Confident Technologies, Inc. Methods and systems for protecting website forms from automated access
CN104424426A (zh) * 2013-08-21 2015-03-18 北大方正集团有限公司 验证方法及装置
CN104468101A (zh) * 2013-09-12 2015-03-25 深圳市腾讯计算机系统有限公司 一种用户身份的验证方法、装置和验证服务系统
CN104660549A (zh) * 2013-11-19 2015-05-27 深圳市腾讯计算机系统有限公司 身份验证方法及装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Image Recognition CAPTCHAs;Monica Chew et al;《the 7th International Information Security Conference(ISC 2004)》;20040930;正文第2节 *

Also Published As

Publication number Publication date
CN104899499A (zh) 2015-09-09

Similar Documents

Publication Publication Date Title
CN104899499B (zh) 基于互联网图片搜索的Web验证码生成方法
Verma et al. What's in a url: Fast feature extraction and malicious url detection
US9537814B2 (en) Spam detection and prevention in a social networking system
Chu et al. Detecting social spam campaigns on twitter
US7716297B1 (en) Message stream analysis for spam detection and filtering
KR101530941B1 (ko) 피싱 웹사이트들을 검출하기 위한 방법, 시스템 및 클라이언트 단말기
US20140181117A1 (en) Person search method and apparatus
CN106874253A (zh) 识别敏感信息的方法及装置
CN108846295B (zh) 敏感信息过滤方法、装置、计算机设备及存储介质
JP6161227B2 (ja) 入力リソースプッシュ方法、システム、コンピューター記憶媒体及びデバイス
CN107609389B (zh) 一种基于图像内容相关性的验证方法及系统
US20230004608A1 (en) Method for content recommendation and device
CN103810268A (zh) 加载搜索结果推荐信息、网址检测的方法、装置和系统
US20130067590A1 (en) Combining client and server classifiers to achieve better accuracy and performance results in web page classification
CN108234454B (zh) 一种身份认证方法、服务器及客户端设备
CN103793508A (zh) 一种加载推荐信息、网址检测的方法、装置和系统
CN110297967B (zh) 兴趣点确定方法、装置、设备及计算机可读存储介质
US20180032907A1 (en) Detecting abusive language using character n-gram features
WO2015084756A1 (en) Event detection through text analysis using trained event template models
US8356076B1 (en) Apparatus and method for performing spam detection and filtering using an image history table
CN111027065B (zh) 一种勒索病毒识别方法、装置、电子设备及存储介质
CN106921626B (zh) 一种用户注册方法及装置
KR20220152167A (ko) 도메인 네임 시스템(dns) 레코드들의 세트에서 피싱-도메인들을 검출하기 위한 시스템 및 방법
Lu et al. A method of SNS topic models extraction based on self-adaptively LDA modeling
Ulicny et al. Toward formal reasoning with epistemic policies about information quality in the twittersphere

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant