CN113033747B - 一种用于人机识别的图形识别码生成方法 - Google Patents
一种用于人机识别的图形识别码生成方法 Download PDFInfo
- Publication number
- CN113033747B CN113033747B CN202110578878.3A CN202110578878A CN113033747B CN 113033747 B CN113033747 B CN 113033747B CN 202110578878 A CN202110578878 A CN 202110578878A CN 113033747 B CN113033747 B CN 113033747B
- Authority
- CN
- China
- Prior art keywords
- picture
- interference
- interfered
- frame
- picture set
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06K—GRAPHICAL DATA READING; PRESENTATION OF DATA; RECORD CARRIERS; HANDLING RECORD CARRIERS
- G06K19/00—Record carriers for use with machines and with at least a part designed to carry digital markings
- G06K19/06—Record carriers for use with machines and with at least a part designed to carry digital markings characterised by the kind of the digital marking, e.g. shape, nature, code
- G06K19/06009—Record carriers for use with machines and with at least a part designed to carry digital markings characterised by the kind of the digital marking, e.g. shape, nature, code with optically detectable marking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2415—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
Abstract
本发明公开了一种用于人机识别的图形识别码生成方法,属于网络安全测试领域,解决现有验证码容易被基于机器学习技术训练的机器人自动识别并跳过,以及现有的图片对抗样本生成方式处理时间长和计算规模大的问题。本发明预设图片尺寸,基于图片尺寸选取图片集,将图片集和图片集的分类结果输入对抗样本生成系统生成扰动,再将扰动添加在图片集的图片边框上,得到初始化的图片对抗样本集;基于初始化的图片对抗样本集,利用白盒训练模型对干扰进行优化,生成最终的图片对抗样本,即图片干扰边框;将图片干扰边框加入待干扰图片上,形成图片识别码,即图片验证码,其中,待干扰图片的尺寸与图片集中的图片的尺寸大小相同。本发明用于生成干扰框架。
Description
技术领域
一种用于人机识别的图形识别码生成方法,用于生成干扰框架,属于网络安全测试领域。
背景技术
随着人工智能技术的发展,重复且机械性的人力劳动逐渐被机器所替代,而在网络上也出现了用机器代替人去实现一些个人目的场景出现(抢票、购物秒杀、网络爬虫等),大大的破化了市场公平和网络秩序。为了防御机器代替人来执行操作,人机识别技术也开始快速发展并且形成了较好的效果。现阶段主要的人机识别方式有逻辑运算、图片特征识别、图片行为识别等,通过在图片上增加干扰(旋转、模糊、拉伸)以达到在不影响真人识别的情况下拦截机器人访问,而现有的验证码容易被基于机器学习技术训练的机器人自动识别并跳过,使得验证码如同虚设,具体为:
验证码能够被机器识别并跳过的原因是机器学习目前已经有较为成熟的技术,例如KNN,K-means等,可以通过输入一些样本,分析验证码是如何被施加干扰的。最后可以形成一个识别系统,对于给出的加了干扰的验证码,能够成功地识别出它原本的样子,从而达到跳过验证的目的。这种现象出现的原因是有人为了达到个人目的,通过机器代替人力获得优势,从而为自己谋取利益。而为了维护市场公平,就必须想出应对方法来限制这种情况的发生,于是就产生了验证码。
基于图片对抗样本生成系统,现有的图片对抗样本生成方式主要是在图片上增加真人通过肉眼无法识别的噪声,形成特征点以达到分类系统误分类的结果,这样的方式虽然在表面上没有更改图片信息,实际上使得图片信息损失;除此之外,这类方法需要针对每次输入的图片进行误导,即每输入一次信息,就需要重新计算生成干扰以形成新的对抗样本,这就增加了处理时间和计算规模,具体为:
当前对于生成图像干扰,是每输入一次图片,都要通过计算如何形成干扰,这就需要一定的内存,并且生成的结果依赖于硬件的计算速度。该方法存在一定的滞后性(不能输入图片就能看到干扰结果这样“所见即所得”的效果)。
发明内容
针对上述研究的问题,本发明的目的在于提供一种用于人机识别的图形识别码生成方法,解决现有验证码容易被基于机器学习技术训练的机器人自动识别并跳过,以及现有的图片对抗样本生成方式处理时间长和计算规模大的问题。
为了达到上述目的,本发明采用如下技术方案:
一种用于人机识别的图形识别码生成方法,包括:
S1、预设图片尺寸, 基于图片尺寸选取图片集,将图片集和图片集的分类结果输入对抗样本生成系统生成扰动,再将扰动添加在图片集的图片边框上,得到初始化的图片对抗样本集;
S2、基于初始化的图片对抗样本集,利用白盒训练模型对干扰进行优化,生成最终的图片对抗样本,即图片干扰边框;
S3、将图片干扰边框加入待干扰图片或待干扰图片集上,形成图片识别码,即图片验证码,其中,待干扰图片或待干扰图片集中的图片的尺寸与图片集中的图片的尺寸大小相同。
进一步,所述步骤S1的具体步骤为:
进一步,所述步骤S2的具体步骤为:
更新方式:
本发明同现有技术相比,其有益效果表现在:
一、本发明不需要对输入图片集进行分析,直接利用预设对抗样本生成图形验证码,增强了图形验证码的可用性在保证不影响真人识别的情况下,干扰机器人的识别,;
二、本发明所形成的通用干扰边框可针对固定尺寸图片的干扰;
三、本发明用于筛查机器识别的针对性干扰,即所形成的通用干扰边框可以针对现有通用图像识别算法,训练出一个有目标的攻击模型框架,以达到机器识别结果往目标类靠近,从而分类出真人-机器人。如图片信息是长颈鹿,而生成的对抗模型能够以极大的概率误导机器识别为大象,从而根据结果记录疑似机器的访问请求并加以防御;
四、本发明具有良好的泛化效应的对抗框架(即通用干扰边框),即根据实验数据可以发现该对抗框架具有通用性,并且诱导误分类效果较好(在ImageNet dataset下选取的图片集,在不加干扰情况下识别系统正确率是70.22%,加入随机噪声使得正确率为56.37%,而在本发明技术下正确率仅为44.26%,具有较好的效果),可以适用于不同的类型的图片集,使用者可以根据该框架直接导入待干扰图片,不会改变原有图像具有的信息,只需要在其周围增加边框,且不需要其他计算时间和分析时间,就能够达到低成本高效果的目标;
五、本发明减去了计算要求,所以需要对于硬件的要求也降低了,有利于边缘计算。(即获得干扰框架后,本地可以自行计算而不需要向中心服务器发出申请)。
附图说明
图1为本发明中得到图片干扰边框的流程示意图;
图2为本发明中得到图形识别码的示意图。
具体实施方式
下面将结合附图及具体实施方式对本发明作进一步的描述。
对于人机识别领域,生成的图形识别码主要用于保护用户权益,使得真人能够正确识别图片信息,选出所属类别,同时使得机器误分类的结果。对于这个要求而言,需要考虑是生成图形识别码(验证码或图片验证码)的效率以及针对现有分类系统的误导率,所以如果能够形成一个固定的干扰框架,在框架上直接填入图片即可形成有效干扰,就可以大大提升对抗样本生成效率,减少计算成本。即将图片周围增加边框以形成对抗框架,从而完成人机识别的任务,达到拦截机器人访问的目的,该对抗框架生成后不需要其他额外计算成本,可以直接用于各种图片识别上(直接外镶在图片边框)。本发明中的图片尺寸作为训练参数,在训练前必须完成设定。训练完成后会形成对于该尺寸的通用干扰边框,可以适用于相同尺寸的各种图片集合或图片。每次训练前可以自定义训练尺寸以达到更好的适用性效果。同时也可以在生成固定尺寸的通用干扰边框后,导入待干扰图片时自动缩放到相应尺寸,虽然会损失一部分图片信息,但是不会影响真人识别。
一种用于人机识别的图形识别码生成方法,包括:
S1、预设图片尺寸, 基于图片尺寸选取图片集,将图片集和图片集的分类结果输入对抗样本生成系统生成扰动,再将扰动添加在图片集的图片边框上,得到初始化的图片对抗样本集,对抗样本生成系统为现有的;具体步骤为:
S1.3、将图片集和分类结果输入到对抗样本生成系统,生成只作用在图片边
框的扰动,将该扰动添加到图片集上,得到初始化的图片对抗样本集。具
体实现过程为:将图片集和分类结果输入到对抗样本生成系统,可获取图片集的参
数(H*W),即扰动,将扰动统一加入固定宽度d的边框,即新尺寸为(H+d)*(W+d);
S2、基于初始化的图片对抗样本集,利用白盒训练模型对干扰进行优化,生成最终的图片对抗样本,即图片干扰边框;具体步骤为:
更新方式:
S3、将图片干扰边框加入待干扰图片或待干扰图片集上,形成图片识别码,即图片验证码,其中,待干扰图片或待干扰图片集中的图片的尺寸与图片集中的图片的尺寸大小相同。假设待干扰图片尺寸是40*40,预先设置的初始化对抗边框宽度是1,将图片干扰边框加入待干扰图片上则图片尺寸变为42*42。
以上仅是本发明众多具体应用范围中的代表性实施例,对本发明的保护范围不构成任何限制。凡采用变换或是等效替换而形成的技术方案,均落在本发明权利保护范围之内。
Claims (1)
1.一种用于人机识别的图形识别码生成方法,其特征在于,包括:
步骤S1、预设图片尺寸, 基于图片尺寸选取图片集,将图片集和图片集的分类结果输入对抗样本生成系统生成扰动,再将扰动添加在图片集的图片边框上,得到初始化的图片对抗样本集;
步骤S2、基于初始化的图片对抗样本集,利用白盒训练模型对干扰进行优化,生成最终的图片对抗样本,即图片干扰边框;
步骤S3、将图片干扰边框加入待干扰图片或待干扰图片集上,形成图片识别码,即图片验证码,其中,待干扰图片或待干扰图片集中的图片的尺寸与图片集中的图片的尺寸大小相同;
所述步骤S2的具体步骤为:
更新方式:
所述步骤S1的具体步骤为:
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110578878.3A CN113033747B (zh) | 2021-05-26 | 2021-05-26 | 一种用于人机识别的图形识别码生成方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110578878.3A CN113033747B (zh) | 2021-05-26 | 2021-05-26 | 一种用于人机识别的图形识别码生成方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113033747A CN113033747A (zh) | 2021-06-25 |
CN113033747B true CN113033747B (zh) | 2021-07-27 |
Family
ID=76455792
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110578878.3A Active CN113033747B (zh) | 2021-05-26 | 2021-05-26 | 一种用于人机识别的图形识别码生成方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113033747B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113283545B (zh) * | 2021-07-14 | 2021-11-02 | 中国工程物理研究院计算机应用研究所 | 一种针对视频识别场景的物理干扰方法及系统 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102893287A (zh) * | 2010-06-28 | 2013-01-23 | 国际商业机器公司 | 基于屏蔽的质询响应测试 |
CN104766001A (zh) * | 2014-01-03 | 2015-07-08 | 瞻博网络公司 | 检测和破坏captcha自动化脚本以及防止图像刮削 |
CN105354480A (zh) * | 2014-08-20 | 2016-02-24 | 阿里巴巴集团控股有限公司 | 验证码图片生成方法及装置 |
CN111460426A (zh) * | 2020-04-02 | 2020-07-28 | 武汉大学 | 基于对抗演化框架的抗深度学习文本验证码生成系统及方法 |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8516606B2 (en) * | 2009-03-24 | 2013-08-20 | Aol Inc. | Systems and methods for challenge-response animation and randomization testing |
US10558789B2 (en) * | 2011-08-05 | 2020-02-11 | [24]7.ai, Inc. | Creating and implementing scalable and effective multimedia objects with human interaction proof (HIP) capabilities, with challenges comprising different levels of difficulty based on the degree on suspiciousness |
CN103400175B (zh) * | 2013-07-31 | 2017-02-08 | 贝壳网际(北京)安全技术有限公司 | 图形识别码处理方法及装置 |
CN110008680B (zh) * | 2019-04-03 | 2020-11-13 | 华南师范大学 | 基于对抗样本的验证码生成系统及方法 |
CN111476228A (zh) * | 2020-04-07 | 2020-07-31 | 海南阿凡题科技有限公司 | 针对场景文字识别模型的白盒对抗样本生成方法 |
CN112633280B (zh) * | 2020-12-31 | 2023-01-31 | 西北大学 | 一种对抗样本生成方法及系统 |
CN112818407B (zh) * | 2021-04-16 | 2021-06-22 | 中国工程物理研究院计算机应用研究所 | 一种基于生成对抗网络的视频隐私保护方法 |
CN112819109B (zh) * | 2021-04-19 | 2021-06-18 | 中国工程物理研究院计算机应用研究所 | 针对黑盒对抗样本攻击的视频分类系统安全性增强方法 |
-
2021
- 2021-05-26 CN CN202110578878.3A patent/CN113033747B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102893287A (zh) * | 2010-06-28 | 2013-01-23 | 国际商业机器公司 | 基于屏蔽的质询响应测试 |
CN104766001A (zh) * | 2014-01-03 | 2015-07-08 | 瞻博网络公司 | 检测和破坏captcha自动化脚本以及防止图像刮削 |
CN105354480A (zh) * | 2014-08-20 | 2016-02-24 | 阿里巴巴集团控股有限公司 | 验证码图片生成方法及装置 |
CN111460426A (zh) * | 2020-04-02 | 2020-07-28 | 武汉大学 | 基于对抗演化框架的抗深度学习文本验证码生成系统及方法 |
Non-Patent Citations (6)
Title |
---|
"Exploiting the Human–Machine Gap in Image Recognition for Designing CAPTCHAs";Ritendra Datta 等;《IEEE TRANSACTIONS ON INFORMATION FORENSICS AND SECURITY》;20090519;第4卷(第3期);第504-518页 * |
"修改thinkphp验证码样式(颜色边框背景)";ADMIN;《http://shanmao.me/webback/thinkphp/xiu-gai-thinkphp-yan-zheng-ma-yang-shi-yan-se-bian-kuang-bei-jing》;20120602;第1页 * |
"基于深度学习的验证码破解与新型3D验证码设计";田朝辉;《中国优秀硕士学位论文全文数据库(信息科技辑)》;20190815(第2019年第08期);第I138-642页 * |
"基于神经网络的图形验证码识别及防识别的研究与应用";田怀川;《中国优秀硕士学位论文全文数据库(信息科技辑)》;20110515(第2011年第05期);第I138-836页 * |
"基于群体智能进化算法的对抗样本生成研究";刘小垒;《中国博士学位论文全文数据库(信息科技辑)》;20200415(第2020年第04期);第I138-25页 * |
"对抗样本生成及攻防技术研究";刘小垒 等;《计算机应用研究》;20201215;第37卷(第11期);第3201-3205,3212页 * |
Also Published As
Publication number | Publication date |
---|---|
CN113033747A (zh) | 2021-06-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Pinto et al. | Face spoofing detection through visual codebooks of spectral temporal cubes | |
Malik et al. | DeepFake detection for human face images and videos: A survey | |
Agarwal et al. | Image transformation-based defense against adversarial perturbation on deep learning models | |
WO2021189364A1 (zh) | 一种对抗图像生成方法、装置、设备以及可读存储介质 | |
Wang et al. | Understanding the robustness of skeleton-based action recognition under adversarial attack | |
CN111460426B (zh) | 基于对抗演化框架的抗深度学习文本验证码生成系统及方法 | |
CN112883874A (zh) | 针对深度人脸篡改的主动防御方法 | |
Akhtar et al. | Attack to fool and explain deep networks | |
Cao et al. | Load balanced gans for multi-view face image synthesis | |
Mo et al. | MCTSteg: A Monte Carlo tree search-based reinforcement learning framework for universal non-additive steganography | |
Zhou et al. | Manifold projection for adversarial defense on face recognition | |
KR20200094938A (ko) | 생성적 대립 네트워크를 이용한 데이터의 불균형 해결방법 | |
CN113033747B (zh) | 一种用于人机识别的图形识别码生成方法 | |
Fernando et al. | Detection of fake and fraudulent faces via neural memory networks | |
Gong et al. | Deepfake forensics, an ai-synthesized detection with deep convolutional generative adversarial networks | |
CN115147682A (zh) | 一种具有迁移性的隐蔽白盒对抗样本生成方法及装置 | |
Dagar et al. | A literature review and perspectives in deepfakes: generation, detection, and applications | |
CN113724354B (zh) | 基于参考图颜色风格的灰度图像着色方法 | |
Liu et al. | Making DeepFakes more spurious: evading deep face forgery detection via trace removal attack | |
CN113435264A (zh) | 基于寻找黑盒替代模型的人脸识别对抗攻击方法及装置 | |
Li | A computer vision attack on the ARTiFACIAL CAPTCHA | |
CN115457374B (zh) | 基于推理模式评估深伪图像检测模型泛化性方法及装置 | |
Emeršič et al. | Towards accessories-aware ear recognition | |
Li et al. | Defending deepfakes by saliency-aware attack | |
Chen et al. | White-box content camouflage attacks against deep learning |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |