CN112132133B - 标识图像数据增强方法及真伪智能鉴定方法 - Google Patents

标识图像数据增强方法及真伪智能鉴定方法 Download PDF

Info

Publication number
CN112132133B
CN112132133B CN202010545903.3A CN202010545903A CN112132133B CN 112132133 B CN112132133 B CN 112132133B CN 202010545903 A CN202010545903 A CN 202010545903A CN 112132133 B CN112132133 B CN 112132133B
Authority
CN
China
Prior art keywords
true
graph
data
authentication
pseudo
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010545903.3A
Other languages
English (en)
Other versions
CN112132133A (zh
Inventor
曹娟
李潇雅
高科
谢添
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Zhongke Ruijian Technology Co ltd
Institute Of Digital Economy Industry Institute Of Computing Technology Chinese Academy Of Sciences
Original Assignee
Hangzhou Zhongke Ruijian Technology Co ltd
Institute Of Digital Economy Industry Institute Of Computing Technology Chinese Academy Of Sciences
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Zhongke Ruijian Technology Co ltd, Institute Of Digital Economy Industry Institute Of Computing Technology Chinese Academy Of Sciences filed Critical Hangzhou Zhongke Ruijian Technology Co ltd
Priority to CN202010545903.3A priority Critical patent/CN112132133B/zh
Publication of CN112132133A publication Critical patent/CN112132133A/zh
Application granted granted Critical
Publication of CN112132133B publication Critical patent/CN112132133B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/153Segmentation of character regions using recognition of characters or words
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T3/00Geometric image transformations in the plane of the image
    • G06T3/40Scaling of whole images or parts thereof, e.g. expanding or contracting
    • G06T3/4084Scaling of whole images or parts thereof, e.g. expanding or contracting in the transform domain, e.g. fast Fourier transform [FFT] domain scaling
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/62Text, e.g. of license plates, overlay texts or captions on TV images
    • G06V20/63Scene text, e.g. street names
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/158Segmentation of character regions using character size, text spacings or pitch estimation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Data Mining & Analysis (AREA)
  • Multimedia (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Biophysics (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Image Analysis (AREA)

Abstract

本发明涉及一种标识图像数据增强方法及真伪智能鉴定方法。本发明的目的是提供一种标识图像数据增强方法及真伪智能鉴定方法,解决现有图像分类算法遇到小样本问题时的解决方案。本发明的技术方案是:一种标识图像数据增强方法,其特征在于:获取显示有标识的真图;获取真图中标识的关键特征数据;基于关键特征数据建立伪图数据规则;根据数据规则生成伪图。本发明适用于计算机视觉技术领域。

Description

标识图像数据增强方法及真伪智能鉴定方法
技术领域
本发明涉及一种标识图像数据增强方法及真伪智能鉴定方法。适用于计算 机视觉技术领域。
背景技术
深度神经网络使得图像分类任务得到重大突破,在大型数据集如imagenet 上也取得很好的效果,但是当前的深度学习算法需要海量数据的支持,而数据 的获取和标注需要耗费大量人力物力,现实场景中往往获取不到大量的数据和 标注,尤其是图像真伪鉴定任务中,难以获取原始数据及标注,并且真假样本 数据往往是极度不均衡的,所以如何基于小样本数据进行训练成为现在亟待解 决的现实问题和当下热点。
目前,解决小样本图像真伪鉴别任务有三种常见方式,第一种是无监督与 训练的方式,该方法基于有大量容易获取的无标签同分布数据的假设;第二种 是迁移学习的方法,迁移学习放松同分布的要求,但是也基于有相似或者有重 叠的数据;第三种是数据增强的方法,传统的数据增强方法通过旋转、平移、 光照、颜色等方面增强数据,可以一定程度上缓解过拟合,但是该类方法并没有真正解决样本稀缺的问题;混合图像的方法操作,简单解释性和鲁棒性较差; 基于特征空间的数据增强方法可以对数据进行有效拓展,但是难以获取逼近现 实的图像,直观性差,解码反推过程耗时;基于gan的方法可以得到不同风格的数据,但是难以训练并且十分耗时。
发明内容
本发明要解决的技术问题是:针对上述存在的问题,提供一种标识图像数 据增强方法及真伪智能鉴定方法,解决现有图像分类算法遇到小样本问题时的 解决方案。
本发明所采用的技术方案是:一种标识图像数据增强方法,其特征在于:
获取显示有标识的真图;
获取真图中标识的关键特征数据;
基于关键特征数据建立伪图数据规则;
根据数据规则生成伪图。
所述标识包括文字标识、平面图形标识、立体特征标识中的一种或几种。
所述关键特征数据包括真图中标识与标识背景模块之间的位置关系数据和 大小比例关系数据
所述文字标识的关键特征数据还包括字体、字形和字间距数据。
一种真伪智能鉴定方法,其特征在于:
获取待鉴定图像;
将待鉴定图像输入经训练的真伪智能鉴定模型进行鉴定;
所述真伪智能鉴定模型的训练方法,包括:
获取真图集和伪图集;
利用真图集中的真图结合所述的标识图像数据增强方法生成伪图,并将生 成的伪图补充进伪图集;
利用真图集和伪图集对真伪智能鉴定模型进行训练。
所述真伪智能鉴定模型基于深度神经网络AlexNet。
生成的伪图经传统数据增强方法数据增强后补充进伪图集。
所述真图集中的真图经传统数据增强方法进行数据增强。
一种存储介质,存储有计算机程序,其特征在于:所述计算机程序被处理 器执行时实现所述真伪智能鉴定方法的步骤。
一种设备,具有存储器和处理器,存储器上存储有计算机程序,其特征在 于:所述计算机程序被处理器执行时实现所述真伪智能鉴定方法的步骤。
本发明的有益效果是:本发明通过数据分析标识的关键特征数据,建立数 据规则,根据数据规则生成伪图,对极少样本进行快速扩充,从而有效提升真 伪智能鉴定模型的鉴定准确性。
本发明中数据增强更加具有针对性,生成数据更加贴近真实样本;本发明 生成伪图过程中通过控制阈值,重点生成难例样本,能够生成更加贴近分界面 的伪图,更有利于网络学习类别差异。
附图说明
图1为实施例的流程图。
图2为正品呼吸阀示例图。
图3为呼吸阀位置关系示意图。
图4为文字标识与呼吸阀分离示意图。
图5、图6为不同位置关系的呼吸阀伪造图示例。
图7为不同位置关系的呼吸阀难例样本。
图8、图9为不同缩放程度的呼吸阀伪造图示例。
图10为不同缩放程度的呼吸阀难例样本。
图11、图12为不同拉伸程度的呼吸阀伪造图示例。
图13为不同拉伸程度的呼吸阀难例样本。
图14、图15为不同字体间距的呼吸阀伪造图示例。
图16为不同字体间距的呼吸阀难例样本。
图17、图18为不同角度方向的呼吸阀伪造图示例。
图19、图20为不同字体字形的呼吸阀伪造图示例。
图21为圆凹点抽样拟合示例图。
具体实施方式
本实施例为一种真伪智能鉴定方法,具体步骤如下:
获取待鉴定图像;
将待鉴定图像输入经训练的基于深度神经网络AlexNet的真伪智能鉴定模 型进行鉴定。
本实施例中真伪智能鉴定模型的训练方法,包括:
获取真图集和伪图集;
利用真图集中的真图通过标识图像数据增强方法生成伪图,生成的伪图补 充进伪图集;
对伪图集内的伪图抽样进行旋转、剪裁、缩放等传统数据增强方法进行数 据增强,使得检测结果更加鲁棒;
通过旋转、剪裁、缩放等传统数据增强方式对真图集中的真图进行数据增 强,以应对不同环境的真图;
通过数据增强后的真图集和伪图集对真伪智能鉴定模型进行训练。
如图1所示,通过标识图像数据增强方法生成伪图包括:
获取显示有标识的真图,标识包括文字标识、平面图形标识、立体特征标 识中的一种或几种;
获取真图中标识的关键特征数据,关键特征数据包括真图中标识与标识背 景模块之间的位置关系数据和大小比例关系数据,以及文字标识的的字体、字 形和字间距数据等。
基于关键特征数据建立伪图数据规则;
根据数据规则生成伪图。
本实施例以在3v口罩(N95、N90)真假鉴别任务中的应用进行标识图像 数据增强举例说明,可扩展应用于其他小样本图像真伪鉴定任务中:
通过对口罩的数据分析和专家鉴定规则,得到口罩3v字体、字形、粗细, 3v字体外框EFGH与呼吸阀外框ABCD相对位置、重要鉴别点圆形凹点的有无 等重要数据信息。
数据规则1:如图2所示,正规的3v口罩呼吸阀部位的3v字体中,3v字 样与呼吸阀的比例关系是确定的,a在0.35到0.5之内,b在0.45到0.55之内。
数据规则2:如图3所示,正规的3v口罩呼吸阀的3v字体、字形、字间距 均为是确定的。
数据规则3:正规的3v口罩的3v字样下方都有圆形凹点。
根据数据规则生成仿品图;
如图4所示,以真品口罩呼吸阀除去文字部分作为标识背景模块,通过对 3v字体不同位置、不同形变、不同角度、不同字体等进行合成得到大量仿品图, 并通过阈值控制进行仿品中难例样本的生成。
分离3v字体与背景
如图5~7所示,对3v进行不同位置关系的假品伪造:可以根据上文得到的 数据规则改变3v字体与呼吸阀边框的比例关系,对3v字体进行不同位置的伪 造。
如图8~10所示,对3v进行不同放缩程度的假品伪造:不同的放缩比例也 会导致3v在呼吸阀中所占比例的改变,所以根据前文所述的比例关系,对3v 进行不同程度大小放缩,获得伪造假品。为了接近真实数据,以标准3v字样中 心点为轴进行放缩。
如图11~13所示,对3v进行不同拉伸程度的假品伪造:对标准3v字体进 行各种拉伸形变的拟合改造,模拟仿品在伪造印刷过程中造成的不良扭曲,对 3v进行不同程度的拉伸形变拟合。在拟合过程中考虑到3v字体不同位置。
如图14~16所示,对3v进行不同字体间距的假品伪造:对3v字体设置不 同程度的间距构成伪造仿品。
如图17、图18所示,对3v进行不同角度方向的假品伪造:对3v字样进行 旋转模拟仿品合成中压印偏斜的情况,对3v字样进行不同方向的旋转构成伪造 假品。在拟合过程中考虑到3v字体不同位置。
如图19、图20所示,对3v进行不同字体字形的假品伪造:改变3v的字体 字形,模拟仿品合成过程中没有模板字体导致的字体字形差异,这也是现实中 常见3v仿品问题。在拟合过程中考虑到3v字体不同位置。
如图21所示,对圆凹点有无进行假品伪造:在去除呼吸阀圆凹点的情况下 对上述各种情况进行抽样拟合,模拟仿造口罩技艺不精或粗糙赶工漏掉圆形凹 印的情况。
利用本实施例中标识图像数据增强方法构建3v口罩真假鉴别数据集,并在 同时与没有使用数据增强比较,衡量的标准是真品和仿品的准确率,召回率和 F1值。
通过网络可视化结果可以看出本实施例真伪鉴定分类器更关注字体部分, 说明本实施例方法可以使得网络关注到具有区分性的特征,使得网络性能更好。
本实施例还提供一种存储介质,存储有计算机程序,该计算机程序被处理 器执行时实现本实施例中真伪智能鉴定方法、真伪智能鉴定模型的训练方法或 标识图像数据增强方法的步骤。
本实施例还提供一种设备,具有存储器和处理器,存储器上存储有计算机 程序,计算机程序被处理器执行时实现本实施例中真伪智能鉴定方法、真伪智 能鉴定模型的训练方法或标识图像数据增强方法的步骤。

Claims (7)

1.一种标识图像数据增强方法,其特征在于:
获取显示有标识的真图;
获取真图中标识的关键特征数据;
基于关键特征数据建立伪图数据规则;
根据数据规则生成伪图;
所述标识包括文字标识、平面图形标识、立体特征标识中的一种或几种;
所述关键特征数据包括真图中标识与标识背景模块之间的位置关系数据和大小比例关系数据;
所述文字标识的关键特征数据还包括字体、字形和字间距数据。
2.一种真伪智能鉴定方法,其特征在于:
获取待鉴定图像;
将待鉴定图像输入经训练的真伪智能鉴定模型进行鉴定;
所述真伪智能鉴定模型的训练方法,包括:
获取真图集和伪图集;
利用真图集中的真图结合权利要求1所述的标识图像数据增强方法生成伪图,并将生成的伪图补充进伪图集;
利用真图集和伪图集对真伪智能鉴定模型进行训练。
3.根据权利要求2所述的真伪智能鉴定方法,其特征在于:所述真伪智能鉴定模型基于深度神经网络AlexNet。
4.根据权利要求2或3所述的真伪智能鉴定方法,其特征在于:生成的伪图经传统数据增强方法数据增强后补充进伪图集。
5.根据权利要求2或3所述的真伪智能鉴定方法,其特征在于:所述真图集中的真图经传统数据增强方法进行数据增强。
6.一种存储介质,存储有计算机程序,其特征在于:所述计算机程序被处理器执行时实现权利要求2~5任意一项所述真伪智能鉴定方法的步骤。
7.一种真伪智能鉴定设备,具有存储器和处理器,存储器上存储有计算机程序,其特征在于:所述计算机程序被处理器执行时实现权利要求2~5任意一项所述真伪智能鉴定方法的步骤。
CN202010545903.3A 2020-06-16 2020-06-16 标识图像数据增强方法及真伪智能鉴定方法 Active CN112132133B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010545903.3A CN112132133B (zh) 2020-06-16 2020-06-16 标识图像数据增强方法及真伪智能鉴定方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010545903.3A CN112132133B (zh) 2020-06-16 2020-06-16 标识图像数据增强方法及真伪智能鉴定方法

Publications (2)

Publication Number Publication Date
CN112132133A CN112132133A (zh) 2020-12-25
CN112132133B true CN112132133B (zh) 2023-11-17

Family

ID=73851438

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010545903.3A Active CN112132133B (zh) 2020-06-16 2020-06-16 标识图像数据增强方法及真伪智能鉴定方法

Country Status (1)

Country Link
CN (1) CN112132133B (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006165818A (ja) * 2004-12-03 2006-06-22 Oki Electric Ind Co Ltd 改ざん検出装置,透かし入り画像出力装置,透かし入り画像入力装置,透かし入り画像出力方法,および透かし入り画像入力方法
CN109543742A (zh) * 2018-11-16 2019-03-29 聚时科技(上海)有限公司 一种基于GAN和Self-Attention的图像局部信息迁移方法
CN110188835A (zh) * 2019-06-05 2019-08-30 国家广播电视总局广播电视科学研究院 基于生成式对抗网络模型的数据增强行人再识别方法
CN110210393A (zh) * 2019-05-31 2019-09-06 百度在线网络技术(北京)有限公司 人脸图像的检测方法和装置
CN110458185A (zh) * 2019-06-26 2019-11-15 平安科技(深圳)有限公司 图像识别方法及装置、存储介质、计算机设备
CN111080629A (zh) * 2019-12-20 2020-04-28 河北工业大学 一种图像拼接篡改的检测方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3818693A4 (en) * 2018-07-02 2021-10-13 Stowers Institute for Medical Research FACIAL IMAGE RECOGNITION USING PSEUDO-IMAGES
US10964006B2 (en) * 2018-11-16 2021-03-30 Artifical Intelligence Foundation, Inc Identification of neural-network-generated fake images

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006165818A (ja) * 2004-12-03 2006-06-22 Oki Electric Ind Co Ltd 改ざん検出装置,透かし入り画像出力装置,透かし入り画像入力装置,透かし入り画像出力方法,および透かし入り画像入力方法
CN109543742A (zh) * 2018-11-16 2019-03-29 聚时科技(上海)有限公司 一种基于GAN和Self-Attention的图像局部信息迁移方法
CN110210393A (zh) * 2019-05-31 2019-09-06 百度在线网络技术(北京)有限公司 人脸图像的检测方法和装置
CN110188835A (zh) * 2019-06-05 2019-08-30 国家广播电视总局广播电视科学研究院 基于生成式对抗网络模型的数据增强行人再识别方法
CN110458185A (zh) * 2019-06-26 2019-11-15 平安科技(深圳)有限公司 图像识别方法及装置、存储介质、计算机设备
CN111080629A (zh) * 2019-12-20 2020-04-28 河北工业大学 一种图像拼接篡改的检测方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
qi p, cao j,et al.exploiting multi-domain visual information for fake news detection.2019 19th IEEE international conference on data mining(ICDM 2019).2019,518-527. *
邢楠 ; 朱虹 ; 王栋 ; 侯浩录.基于多分类器融合的图像真伪鉴别方法.计算机工程与应用.2014,164-167. *

Also Published As

Publication number Publication date
CN112132133A (zh) 2020-12-25

Similar Documents

Publication Publication Date Title
Krishnan et al. Textstylebrush: transfer of text aesthetics from a single example
Gebhardt et al. Document authentication using printing technique features and unsupervised anomaly detection
CN110503054B (zh) 文本图像的处理方法及装置
TW201732651A (zh) 一種單詞的分割方法和裝置
CN111242024A (zh) 基于机器学习识别图纸内图例及文字的方法及系统
US20100303356A1 (en) Method for processing optical character recognition (ocr) data, wherein the output comprises visually impaired character images
CN101894260A (zh) 基于匹配特征点随机生成特征线的伪造印章识别方法
CN106097794A (zh) 基于增强现实的汉语拼音组合认读学习系统及认读方法
CN110598693A (zh) 一种基于Faster-RCNN的船牌识别方法
US20130077856A1 (en) Processes and systems for training machine typesets for character recognition
CN105893952A (zh) 基于pca方法的手写签名识别方法
CN112347997A (zh) 一种试题检测识别方法、装置、电子设备及介质
CN114463770A (zh) 一种用于普遍试卷题目的智能切题方法
CN108921006B (zh) 手写签名图像真伪鉴别模型建立方法及真伪鉴别方法
CN117953224A (zh) 一种开放词汇3d全景分割方法及系统
CN114241492A (zh) 一种识别作文稿纸的手写文本识别并复现文本结构的方法
CN106709915A (zh) 一种图像重采样操作检测方法
CN112132133B (zh) 标识图像数据增强方法及真伪智能鉴定方法
CN110766001B (zh) 基于cnn和rnn的银行卡卡号定位与端到端识别方法
CN110443306B (zh) 葡萄酒木塞的鉴伪方法
CN111738177A (zh) 一种基于姿态信息提取的学生课堂行为识别方法
CN110674678A (zh) 视频中敏感标志的识别方法及装置
RU2560789C1 (ru) Способ идентификации печати на цифровом изображении
CN111046883B (zh) 一种基于古钱币图像的智能评估方法及系统
CN104462111A (zh) 图像检索数据库建立方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information
CB02 Change of applicant information

Address after: 12 / F, building 4, 108 Xiangyuan Road, Gongshu District, Hangzhou City, Zhejiang Province 310015

Applicant after: Institute of digital economy industry, Institute of computing technology, Chinese Academy of Sciences

Applicant after: Hangzhou Zhongke Ruijian Technology Co.,Ltd.

Address before: Room 302, building 5, 17-1 Chuxin Road, Hangzhou City, Zhejiang Province, 310015

Applicant before: Hangzhou Zhongke Ruijian Technology Co.,Ltd.

Applicant before: Institute of digital economy industry, Institute of computing technology, Chinese Academy of Sciences

GR01 Patent grant
GR01 Patent grant