CN114549471A - 证件图像质量检测方法、装置、计算机设备及存储介质 - Google Patents

证件图像质量检测方法、装置、计算机设备及存储介质 Download PDF

Info

Publication number
CN114549471A
CN114549471A CN202210167606.9A CN202210167606A CN114549471A CN 114549471 A CN114549471 A CN 114549471A CN 202210167606 A CN202210167606 A CN 202210167606A CN 114549471 A CN114549471 A CN 114549471A
Authority
CN
China
Prior art keywords
image
quality detection
certificate
model
attention
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210167606.9A
Other languages
English (en)
Inventor
冷绵绵
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Life Insurance Company of China Ltd
Original Assignee
Ping An Life Insurance Company of China Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Life Insurance Company of China Ltd filed Critical Ping An Life Insurance Company of China Ltd
Priority to CN202210167606.9A priority Critical patent/CN114549471A/zh
Publication of CN114549471A publication Critical patent/CN114549471A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/0002Inspection of images, e.g. flaw detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/048Activation functions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T3/00Geometric image transformations in the plane of the image
    • G06T3/40Scaling of whole images or parts thereof, e.g. expanding or contracting
    • G06T3/4038Image mosaicing, e.g. composing plane images from plane sub-images
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/11Region-based segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20084Artificial neural networks [ANN]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20112Image segmentation details
    • G06T2207/20132Image cropping
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30168Image quality inspection

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Biomedical Technology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Quality & Reliability (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请实施例属于人工智能中的图像处理技术领域,涉及一种基于注意力机制的证件图像质量检测方法、装置、计算机设备及存储介质。此外,本申请还涉及区块链技术,用户的待测证件图像和质量检测结果可存储于区块链中。本申请通过相关数据增广的方法和cbam结构的引入训练一个高精度的证件质量和完整度判断的模型,能够有效的将低质量不完整的证件拦截打回给上传数据的用户,提醒用户及时的重传符合业务需求的图片,减少不良的数据流转到整个数据处理流水线的下面环节,极大提高数据处理流水线的效率。

Description

证件图像质量检测方法、装置、计算机设备及存储介质
技术领域
本申请涉及人工智能中的图像处理技术领域,尤其涉及一种基于注意力 机制的证件图像质量检测方法、装置、计算机设备及存储介质。
背景技术
随着互联网时代的到来,信息技术和大数据的快速发展,促进了行业科学 技术的更新换代,更深刻影响了人们的生活方式的改变和商业模式的创新, 针对证件图片数据进行图像质量检测成为趋势。
现有一种证件质量检测方法,即采用人工对证件图片数据进行图像质量检 测,以审查证件图片数据的字迹等内容中是否完整、清晰。
然而,申请人发现传统的证件质量检测方法普遍不智能,由于人工审查方 法效率极低,而且,存在人为主观认知不同而审查标准不一造成审查准确度 低的问题,由此可见,传统的证件质量检测方法存在检测效率、检测准确度 较低的问题。
发明内容
本申请实施例的目的在于提出一种基于注意力机制的证件图像质量检测 方法、装置、计算机设备及存储介质,以解决传统的证件质量检测方法存在 检测效率、检测准确度较低的问题。
为了解决上述技术问题,本申请实施例提供一种基于注意力机制的证件 图像质量检测方法,采用了如下所述的技术方案:
读取证件图像数据库,在所述证件图像数据库中获取正样本图像;
根据图像增广方法对所述标准正样本图像进行图像增广操作,得到负样 本图像;
结合所述正样本图像以及所述负样本图像,得到训练数据;
根据所述训练数据对双标签分类模型进行模型训练操作,得到证件图像 质量检测模型,其中,所述双标签分类模型由卷积块注意模块以及轻量化网 络构成;
接收携带有待检测的待测证件图像;
将所述待测证件图像输入至所述证件图像质量检测模型进行质量检测操 作,得到质量检测结果;
输出所述质量检测结果。
为了解决上述技术问题,本申请实施例还提供一种基于注意力机制的证 件图像质量检测装置,采用了如下所述的技术方案:
正样本获取单元,用于读取证件图像数据库,在所述证件图像数据库中 获取正样本图像;
图像增广单元,用于根据图像增广方法对所述标准正样本图像进行图像 增广操作,得到负样本图像;
训练数据获取单元,用于结合所述正样本图像以及所述负样本图像,得 到训练数据;
模型训练单元,用于根据所述训练数据对双标签分类模型进行模型训练 操作,得到证件图像质量检测模型,其中,所述双标签分类模型由卷积块注 意模块以及轻量化网络构成;
待测图像获取单元,用于接收携带有待检测的待测证件图像;
质量检测单元,用于将所述待测证件图像输入至所述证件图像质量检测 模型进行质量检测操作,得到质量检测结果;
结果输出单元,用于输出所述质量检测结果。
为了解决上述技术问题,本申请实施例还提供一种计算机设备,采用了 如下所述的技术方案:
包括存储器和处理器,所述存储器中存储有计算机可读指令,所述处理 器执行所述计算机可读指令时实现如上所述的基于注意力机制的证件图像质 量检测方法的步骤。
为了解决上述技术问题,本申请实施例还提供一种计算机可读存储介质, 采用了如下所述的技术方案:
所述计算机可读存储介质上存储有计算机可读指令,所述计算机可读指 令被处理器执行时实现如上所述的基于注意力机制的证件图像质量检测方法 的步骤。
与现有技术相比,本申请实施例主要有以下有益效果:
本申请提供了一种基于注意力机制的证件图像质量检测方法,包括:读 取证件图像数据库,在所述证件图像数据库中获取正样本图像;根据图像增 广方法对所述标准正样本图像进行图像增广操作,得到负样本图像;结合所 述正样本图像以及所述负样本图像,得到训练数据;根据所述训练数据对双 标签分类模型进行模型训练操作,得到证件图像质量检测模型,其中,所述 双标签分类模型由卷积块注意模块以及轻量化网络构成;接收携带有待检测 的待测证件图像;将所述待测证件图像输入至所述证件图像质量检测模型进行质量检测操作,得到质量检测结果;输出所述质量检测结果。本申请通过 相关数据增广的方法和cbam结构的引入训练一个高精度的证件质量和完整 度判断的模型,能够有效的将低质量不完整的证件拦截打回给上传数据的用 户,提醒用户及时的重传符合业务需求的图片,减少不良的数据流转到整个 数据处理流水线的下面环节,极大提高数据处理流水线的效率。
附图说明
为了更清楚地说明本申请中的方案,下面将对本申请实施例描述中所需 要使用的附图作一个简单介绍,显而易见地,下面描述中的附图是本申请的 一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下, 还可以根据这些附图获得其他的附图。
图1是本申请可以应用于其中的示例性系统架构图;
图2是本申请实施例一提供的基于注意力机制的证件图像质量检测方法 的实现流程图;
图3是本申请实施例一提供的获取双标签分类模型的一种具体实施方式 的流程图;
图4是本申请实施例一提供的获取证件图像质量检测模型的一种具体实 施方式的流程图;
图5是本申请实施例一提供的图像增强操作的一种具体实施方式的流程 图;
图6是本申请实施例一提供的图像增强操作的一种具体实施方式的实例 图;
图7是图4中步骤S402的一种具体实施方式的流程图;
图8本申请实施例二提供的基于注意力机制的证件图像质量检测装置的 结构示意图;
图9是本申请实施例二提供的获取双标签分类模型的一种具体实施方式 的结构示意图;
图10是根据本申请的计算机设备的一个实施例的结构示意图。
具体实施方式
除非另有定义,本文所使用的所有的技术和科学术语与属于本申请的技 术领域的技术人员通常理解的含义相同;本文中在申请的说明书中所使用的 术语只是为了描述具体的实施例的目的,不是旨在于限制本申请;本申请的 说明书和权利要求书及上述附图说明中的术语“包括”和“具有”以及它们的任 何变形,意图在于覆盖不排他的包含。本申请的说明书和权利要求书或上述 附图中的术语“第一”、“第二”等是用于区别不同对象,而不是用于描述特定顺 序。
在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性 可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语 并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的 实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可 以与其它实施例相结合。
为了使本技术领域的人员更好地理解本申请方案,下面将结合附图,对 本申请实施例中的技术方案进行清楚、完整地描述。
如图1所示,系统架构100可以包括终端设备101、102、103,网络104 和服务器105。网络104用以在终端设备101、102、103和服务器105之间提 供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信 链路或者光纤电缆等等。
用户可以使用终端设备101、102、103通过网络104与服务器105交互, 以接收或发送消息等。终端设备101、102、103上可以安装有各种通讯客户 端应用,例如网页浏览器应用、购物类应用、搜索类应用、即时通信工具、 邮箱客户端、社交平台软件等。
终端设备101、102、103可以是具有显示屏并且支持网页浏览的各种电 子设备,包括但不限于智能手机、平板电脑、电子书阅读器、MP3播放器 (Moving Picture ExpertsGroup Audio Layer III,动态影像专家压缩标准音频层 面3)、MP4(Moving PictureExperts Group Audio Layer IV,动态影像专家压缩 标准音频层面4)播放器、膝上型便携计算机和台式计算机等等。
服务器105可以是提供各种服务的服务器,例如对终端设备101、102、 103上显示的页面提供支持的后台服务器。
需要说明的是,本申请实施例所提供的基于注意力机制的证件图像质量 检测方法一般由服务器/终端设备执行,相应地,基于注意力机制的证件图像 质量检测装置一般设置于服务器/终端设备中。
应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。 根据实现需要,可以具有任意数目的终端设备、网络和服务器。
继续参考图2,示出了本申请实施例一提供的基于注意力机制的证件图像 质量检测方法的实现流程图,为了便于说明,仅示出与本申请相关的部分。
上述的基于注意力机制的证件图像质量检测方法,包括以下步骤:步骤 S201、步骤S202、步骤S203、步骤S204、步骤S205、步骤S206以及步骤 S207。
步骤S201:读取证件图像数据库,在证件图像数据库中获取正样本图像。
步骤S202:根据图像增广方法对标准正样本图像进行图像增广操作,得 到负样本图像。
步骤S203:结合正样本图像以及负样本图像,得到训练数据。
步骤S204:根据训练数据对双标签分类模型进行模型训练操作,得到证 件图像质量检测模型,其中,双标签分类模型由卷积块注意模块以及改进后 的轻量化网络构成。
步骤S205:接收携带有待检测的待测证件图像。
步骤S206:将待测证件图像输入至证件图像质量检测模型进行质量检测 操作,得到质量检测结果。
步骤S207:输出质量检测结果。
在本申请实施例中,提供了一种基于注意力机制的证件图像质量检测方 法,包括:读取证件图像数据库,在证件图像数据库中获取正样本图像;根 据图像增广方法对标准正样本图像进行图像增广操作,得到负样本图像;结 合正样本图像以及负样本图像,得到训练数据;根据训练数据对双标签分类 模型进行模型训练操作,得到证件图像质量检测模型,其中,双标签分类模 型由卷积块注意模块以及轻量化网络构成;接收携带有待检测的待测证件图 像;将待测证件图像输入至证件图像质量检测模型进行质量检测操作,得到质量检测结果;输出质量检测结果。本申请通过相关数据增广的方法和cbam 结构的引入训练一个高精度的证件质量和完整度判断的模型,能够有效的将 低质量不完整的证件拦截打回给上传数据的用户,提醒用户及时的重传符合 业务需求的图片,减少不良的数据流转到整个数据处理流水线的下面环节, 极大提高数据处理流水线的效率。
继续参阅图3,示出了本申请实施例一提供的获取双标签分类模型的一种 具体实施方式的流程图,为了便于说明,仅示出与本申请相关的部分。
在本实施例的一些可选的实现方式中,轻量化网络为mobilenet_v2网络, 在步骤S204之前,还包括:步骤S301以及步骤S302。
步骤S301:将mobilenet_v2网络作为双标签分类模型的基准网络。
步骤S302:分别在mobilenet_v2网络中的每个mobilenet模块之后加入卷 积块注意模块,生成双标签分类模型。
在本实施例的一些可选的实现方式中,卷积块注意模块包括空间注意力 子模块以及通道注意力子模块,其中,
通道注意力子模块用于将输入特征F分别经过最大池化和平均池化,并 经过共享多层感知器,将得到的两个特征相加,再经过Sigmoid函数,最终生 成通道注意力特征Mc(F),通道注意力特征Mc(F)表示为:
Figure BDA0003517114290000071
其中,σ表示Sigmoid函数;MLP表示共享多层感知器;AvgPool表示平 均池化;MaxPool表示最大池化;W0和W1分别表示不同的权重矩阵;
Figure BDA0003517114290000072
表 示平均池化特征,
Figure BDA0003517114290000073
表示最大池化特征;
空间注意力子模块用于将通道注意力特征Mc(F)和输入特征F进行一个 基于对应元素逐个相乘的乘法操作,生成空间注意力子模块的输入特征F`,对 于输入的特征F`,分别经过最大池化和平均池化操作,然后进行卷积操作,接 着通过Sigmoid函数生成空间注意力特征Ms(F`),空间注意力特征Ms(F`)表示 为:
Figure BDA0003517114290000074
其中,σ表示Sigmoid函数;f7*7表示示7*7的卷积核;AvgPool表示平均 池化;MaxPool表示最大池化;
Figure BDA0003517114290000081
表示平均池化特征;
Figure BDA0003517114290000082
表示最大池化特 征。
在本实施例的一些可选的实现方式中,图像增广方法包括但不限于高斯 模糊方法以及运动模糊方法。
继续参阅图4,示出了本申请实施例一提供的获取证件图像质量检测模型 的一种具体实施方式的流程图,为了便于说明,仅示出与本申请相关的部分。
在本实施例的一些可选的实现方式中,在步骤S203之后,且步骤S204 之前,还包括:步骤S401;步骤S204具体包括:步骤S402。
步骤S401:对训练数据进行图像增强操作,得到增强训练数据。
在本申请实施例中,如下图5所示,图像增强操作的具体实现方式为: 将4张图片image1、image2、image3、image4分别进行随机裁剪(random_cut), 然后将4张裁剪后的图片再进行随机拼接组合(random_combine)得到1张 混合图片,最后再将这张混合图片进行resize成固定大小为512*512的图片 image作为最终模型的输入图像。
在实际应用中,如下图6所示,假设需要进行图像增强的4张图片分别 为图6中的image1、image2、image3、image4,首先对这4张图片分别进行 随机裁剪(即裁剪的位置和大小都是随机的)得到4张新的小图片(即图6 中的4个红色区域图片),然后将这4张小图片再进行随机组合(即4张小图 的拼接顺序是随机的,例如图6中的拼接顺序按顺时针分别为1->2->4->3, 也可以为1->2->3->4、1->3->4->2、3->4->2->1等等其他拼接顺序),接着将 组合得到的图片(即图6中的image)resize成固定大小512*512作为模型的 输入。
步骤S402:根据增强训练数据对双标签分类模型进行模型训练操作,得 到证件图像质量检测模型。
在本申请实施例中,引入图像增强算法Mosaic,从而增加输入模型的图 像的特征内容,增加模型的训练宽度,有效减少了误识别的情况,同时,增 加了恶劣光线等困难场景下拍摄的待检测图像的召回,提高了图像质量检测 的整体准确率和召回率。
继续参阅图7,示出了图4中步骤S402的一种具体实施方式的流程图, 为了便于说明,仅示出与本申请相关的部分。
在本实施例的一些可选的实现方式中,上述步骤S402具体包括:步骤 S701、步骤S702、步骤S703以及步骤S704。
步骤S701:判断增强训练数据像是否满足预设图像条件。
在本申请实施例中,预设图像条件主要用于限定输入至DarkNet53网络 的图像尺寸大小。
步骤S702:若增强训练数据满足预设图像条件,则执行模型训练操作, 得到证件图像质量检测模型。
步骤S703:若增强训练数据不满足预设图像条件,则对增强训练数据进 行预处理操作,获得规范训练数据。
步骤S704:根据规范训练数据对双标签分类模型进行模型训练操作,得 到证件图像质量检测模型。
在本申请实施例中,由于图像数据存在大小不统一的情况,进而影响双 标签分类模型进行模型训练的处理效率,通过对不满足预设图像条件的训练 图像数据进行预处理操作,从而为后续双标签分类模型的模型训练操作打好 基础,有效提高模型训练的处理效率。
综上所述,本申请提供了一种基于注意力机制的证件图像质量检测方法, 包括:读取证件图像数据库,在证件图像数据库中获取正样本图像;根据图 像增广方法对标准正样本图像进行图像增广操作,得到负样本图像;结合正 样本图像以及负样本图像,得到训练数据;根据训练数据对双标签分类模型 进行模型训练操作,得到证件图像质量检测模型,其中,双标签分类模型由 卷积块注意模块以及轻量化网络构成;接收携带有待检测的待测证件图像; 将待测证件图像输入至证件图像质量检测模型进行质量检测操作,得到质量 检测结果;输出质量检测结果。本申请通过相关数据增广的方法和cbam结构 的引入训练一个高精度的证件质量和完整度判断的模型,能够有效的将低质 量不完整的证件拦截打回给上传数据的用户,提醒用户及时的重传符合业务 需求的图片,减少不良的数据流转到整个数据处理流水线的下面环节,极大 提高数据处理流水线的效率。同时,引入图像增强算法Mosaic,从而增加输 入模型的图像的特征内容,增加模型的训练宽度,有效减少了误识别的情况, 同时,增加了恶劣光线等困难场景下拍摄的待检测图像的召回,提高了图像 质量检测的整体准确率和召回率;由于图像数据存在大小不统一的情况,进 而影响双标签分类模型进行模型训练的处理效率,通过对不满足预设图像条 件的训练图像数据进行预处理操作,从而为后续双标签分类模型的模型训练 操作打好基础,有效提高模型训练的处理效率。
需要强调的是,为进一步保证上述待测证件图像和质量检测结果的私密 和安全性,上述待测证件图像和质量检测结果还可以存储于一区块链的节点 中。
本申请所指区块链是分布式数据存储、点对点传输、共识机制、加密算 法等计算机技术的新型应用模式。区块链(Blockchain),本质上是一个去中心 化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中 包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个 区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。
本申请可用于众多通用或专用的计算机系统环境或配置中。例如:个人 计算机、服务器计算机、手持设备或便携式设备、平板型设备、多处理器系 统、基于微处理器的系统、置顶盒、可编程的消费电子设备、网络PC、小型 计算机、大型计算机、包括以上任何系统或设备的分布式计算环境等等。本 申请可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程 序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例 程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本 申请,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备 来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的 本地和远程计算机存储介质中。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程, 是可以通过计算机可读指令来指令相关的硬件来完成,该计算机可读指令可 存储于一计算机可读取存储介质中,该计算机可读指令在执行时,可包括如 上述各方法的实施例的流程。其中,前述的存储介质可为磁碟、光盘、只读 存储记忆体(Read-Only Memory,ROM)等非易失性存储介质,或随机存储 记忆体(Random Access Memory,RAM)等。
应该理解的是,虽然附图的流程图中的各个步骤按照箭头的指示依次显 示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有 明确的说明,这些步骤的执行并没有严格的顺序限制,其可以以其他的顺序 执行。而且,附图的流程图中的至少一部分步骤可以包括多个子步骤或者多 个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在 不同的时刻执行,其执行顺序也不必然是依次进行,而是可以与其他步骤或 者其他步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
实施例二
进一步参考图8,作为对上述图2所示方法的实现,本申请提供了一种基 于注意力机制的证件图像质量检测装置的一个实施例,该装置实施例与图2 所示的方法实施例相对应,该装置具体可以应用于各种电子设备中。
如图8所示,本实施例的基于注意力机制的证件图像质量检测装置200 包括:正样本获取单元210、图像增广单元220、训练数据获取单元230、模 型训练单元240、待测图像获取单元250、质量检测单元260以及结果输出单 元270。其中:
正样本获取单元210,用于读取证件图像数据库,在证件图像数据库中获 取正样本图像;
图像增广单元220,用于根据图像增广方法对标准正样本图像进行图像增 广操作,得到负样本图像;
训练数据获取单元230,用于结合正样本图像以及负样本图像,得到训练 数据;
模型训练单元240,用于根据训练数据对双标签分类模型进行模型训练操 作,得到证件图像质量检测模型,其中,双标签分类模型由卷积块注意模块 以及轻量化网络构成;
待测图像获取单元250,用于接收携带有待检测的待测证件图像;
质量检测单元260,用于将待测证件图像输入至证件图像质量检测模型进 行质量检测操作,得到质量检测结果;
结果输出单元270,用于输出质量检测结果。
在本申请实施例中,提供了一种基于注意力机制的证件图像质量检测装 置200,包括:正样本获取单元210,用于读取证件图像数据库,在证件图像 数据库中获取正样本图像;图像增广单元220,用于根据图像增广方法对标准 正样本图像进行图像增广操作,得到负样本图像;训练数据获取单元230,用 于结合正样本图像以及负样本图像,得到训练数据;模型训练单元240,用于 根据训练数据对双标签分类模型进行模型训练操作,得到证件图像质量检测 模型,其中,双标签分类模型由卷积块注意模块以及轻量化网络构成;待测图像获取单元250,用于接收携带有待检测的待测证件图像;质量检测单元 260,用于将待测证件图像输入至证件图像质量检测模型进行质量检测操作, 得到质量检测结果;结果输出单元270,用于输出质量检测结果。本申请通过 相关数据增广的方法和cbam结构的引入训练一个高精度的证件质量和完整 度判断的模型,能够有效的将低质量不完整的证件拦截打回给上传数据的用 户,提醒用户及时的重传符合业务需求的图片,减少不良的数据流转到整个 数据处理流水线的下面环节,极大提高数据处理流水线的效率。
继续参阅图9,示出了本申请实施例二提供的获取双标签分类模型的一种 具体实施方式的结构示意图,为了便于说明,仅示出与本申请相关的部分。
在本实施例的一些可选的实现方式中,上述基于注意力机制的证件图像 质量检测装置200还包括:基准网络确定单元280和模型生成单元290,其中:
基准网络确定单元280,用于将mobilenet_v2网络作为双标签分类模型的 基准网络;
模型生成单元290,用于分别在mobilenet_v2网络中的每个mobilenet模 块之后加入卷积块注意模块,生成双标签分类模型。
在本实施例的一些可选的实现方式中,卷积块注意模块包括空间注意力 子模块以及通道注意力子模块,其中,
通道注意力子模块用于将输入特征F分别经过最大池化和平均池化,并 经过共享多层感知器,将得到的两个特征相加,再经过Sigmoid函数,最终生 成通道注意力特征Mc(F),通道注意力特征Mc(F)表示为:
Figure BDA0003517114290000131
其中,σ表示Sigmoid函数;MLP表示共享多层感知器;AvgPool表示平 均池化;MaxPool表示最大池化;W0和W1分别表示不同的权重矩阵;
Figure BDA0003517114290000132
表 示平均池化特征,
Figure BDA0003517114290000133
表示最大池化特征;
空间注意力子模块用于将通道注意力特征Mc(F)和输入特征F进行一个 基于对应元素逐个相乘的乘法操作,生成空间注意力子模块的输入特征F`,对 于输入的特征F`,分别经过最大池化和平均池化操作,然后进行卷积操作,接 着通过Sigmoid函数生成空间注意力特征Ms(F`),空间注意力特征Ms(F`)表示 为:
Figure BDA0003517114290000134
其中,σ表示Sigmoid函数;f7*7表示示7*7的卷积核;AvgPool表示平均 池化;MaxPool表示最大池化;
Figure BDA0003517114290000135
表示平均池化特征;
Figure BDA0003517114290000136
表示最大池化特 征。
在本实施例的一些可选的实现方式中,图像增广方法包括但不限于高斯 模糊方法以及运动模糊方法。
在本实施例的一些可选的实现方式中,上述基于注意力机制的证件图像 质量检测装置200还包括:图像增强单元,上述模型训练单元240具体包括: 模型训练子单元,其中:
图像增强单元,用于对训练数据进行图像增强操作,得到增强训练数据;
第一模型训练子单元,用于根据增强训练数据对双标签分类模型进行模 型训练操作,得到证件图像质量检测模型
在本申请实施例中,如下图5所示,图像增强操作的具体实现方式为: 将4张图片image1、image2、image3、image4分别进行随机裁剪(random_cut), 然后将4张裁剪后的图片再进行随机拼接组合(random_combine)得到1张 混合图片,最后再将这张混合图片进行resize成固定大小为512*512的图片 image作为最终模型的输入图像。
在实际应用中,如下图6所示,假设需要进行图像增强的4张图片分别 为图6中的image1、image2、image3、image4,首先对这4张图片分别进行 随机裁剪(即裁剪的位置和大小都是随机的)得到4张新的小图片(即图6 中的4个红色区域图片),然后将这4张小图片再进行随机组合(即4张小图 的拼接顺序是随机的,例如图6中的拼接顺序按顺时针分别为1->2->4->3, 也可以为1->2->3->4、1->3->4->2、3->4->2->1等等其他拼接顺序),接着将 组合得到的图片(即图6中的image)resize成固定大小512*512作为模型的 输入。
在本申请实施例中,引入图像增强算法Mosaic,从而增加输入模型的图 像的特征内容,增加模型的训练宽度,有效减少了误识别的情况,同时,增 加了恶劣光线等困难场景下拍摄的待检测图像的召回,提高了图像质量检测 的整体准确率和召回率。
在本实施例的一些可选的实现方式中,上述模型训练单元240具体包括:
条件判断子单元,用于判断增强训练数据像是否满足预设图像条件;
第一结果子单元,用于若增强训练数据满足预设图像条件,则执行模型 训练操作,得到证件图像质量检测模型;
第二结果子单元,用于若增强训练数据不满足预设图像条件,则对增强 训练数据进行预处理操作,获得规范训练数据;
第二模型训练子单元,用于根据规范训练数据对双标签分类模型进行模 型训练操作,得到证件图像质量检测模型。
在本申请实施例中,预设图像条件主要用于限定输入至DarkNet53网络 的图像尺寸大小。
在本申请实施例中,由于图像数据存在大小不统一的情况,进而影响双 标签分类模型进行模型训练的处理效率,通过对不满足预设图像条件的训练 图像数据进行预处理操作,从而为后续双标签分类模型的模型训练操作打好 基础,有效提高模型训练的处理效率。
综上所述,本申请提供了一种基于注意力机制的证件图像质量检测装置 200,包括:正样本获取单元210,用于读取证件图像数据库,在证件图像数 据库中获取正样本图像;图像增广单元220,用于根据图像增广方法对标准正 样本图像进行图像增广操作,得到负样本图像;训练数据获取单元230,用于 结合正样本图像以及负样本图像,得到训练数据;模型训练单元240,用于根 据训练数据对双标签分类模型进行模型训练操作,得到证件图像质量检测模 型,其中,双标签分类模型由卷积块注意模块以及轻量化网络构成;待测图 像获取单元250,用于接收携带有待检测的待测证件图像;质量检测单元260, 用于将待测证件图像输入至证件图像质量检测模型进行质量检测操作,得到 质量检测结果;结果输出单元270,用于输出质量检测结果。本申请通过相关 数据增广的方法和cbam结构的引入训练一个高精度的证件质量和完整度判 断的模型,能够有效的将低质量不完整的证件拦截打回给上传数据的用户, 提醒用户及时的重传符合业务需求的图片,减少不良的数据流转到整个数据 处理流水线的下面环节,极大提高数据处理流水线的效率。同时,引入图像增强算法Mosaic,从而增加输入模型的图像的特征内容,增加模型的训练宽 度,有效减少了误识别的情况,同时,增加了恶劣光线等困难场景下拍摄的 待检测图像的召回,提高了图像质量检测的整体准确率和召回率;由于图像 数据存在大小不统一的情况,进而影响双标签分类模型进行模型训练的处理 效率,通过对不满足预设图像条件的训练图像数据进行预处理操作,从而为 后续双标签分类模型的模型训练操作打好基础,有效提高模型训练的处理效 率。
为解决上述技术问题,本申请实施例还提供计算机设备。具体请参阅图 10,图10为本实施例计算机设备基本结构框图。
所述计算机设备300包括通过系统总线相互通信连接存储器310、处理器 320、网络接口330。需要指出的是,图中仅示出了具有组件310-330的计算 机设备300,但是应理解的是,并不要求实施所有示出的组件,可以替代的实 施更多或者更少的组件。其中,本技术领域技术人员可以理解,这里的计算 机设备是一种能够按照事先设定或存储的指令,自动进行数值计算和/或信息 处理的设备,其硬件包括但不限于微处理器、专用集成电路(Application Specific Integrated Circuit,ASIC)、可编程门阵列(Field-Programmable Gate Array,FPGA)、数字处理器(Digital Signal Processor,DSP)、嵌入式设备等。
所述计算机设备可以是桌上型计算机、笔记本、掌上电脑及云端服务器 等计算设备。所述计算机设备可以与用户通过键盘、鼠标、遥控器、触摸板 或声控设备等方式进行人机交互。
所述存储器310至少包括一种类型的可读存储介质,所述可读存储介质 包括闪存、硬盘、多媒体卡、卡型存储器(例如,SD或DX存储器等)、随 机访问存储器(RAM)、静态随机访问存储器(SRAM)、只读存储器(ROM)、 电可擦除可编程只读存储器(EEPROM)、可编程只读存储器(PROM)、磁性 存储器、磁盘、光盘等。在一些实施例中,所述存储器310可以是所述计算 机设备300的内部存储单元,例如该计算机设备300的硬盘或内存。在另一 些实施例中,所述存储器310也可以是所述计算机设备300的外部存储设备, 例如该计算机设备300上配备的插接式硬盘,智能存储卡(Smart Media Card, SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。当然, 所述存储器310还可以既包括所述计算机设备300的内部存储单元也包括其 外部存储设备。本实施例中,所述存储器310通常用于存储安装于所述计算 机设备300的操作系统和各类应用软件,例如基于注意力机制的证件图像质 量检测方法的计算机可读指令等。此外,所述存储器310还可以用于暂时地 存储已经输出或者将要输出的各类数据。
所述处理器320在一些实施例中可以是中央处理器(Central Processing Unit,CPU)、控制器、微控制器、微处理器、或其他数据处理芯片。该处理 器320通常用于控制所述计算机设备300的总体操作。本实施例中,所述处 理器320用于运行所述存储器310中存储的计算机可读指令或者处理数据, 例如运行所述基于注意力机制的证件图像质量检测方法的计算机可读指令。
所述网络接口330可包括无线网络接口或有线网络接口,该网络接口330 通常用于在所述计算机设备300与其他电子设备之间建立通信连接。
本申请提供的计算机设备,本申请通过相关数据增广的方法和cbam结构 的引入训练一个高精度的证件质量和完整度判断的模型,能够有效的将低质 量不完整的证件拦截打回给上传数据的用户,提醒用户及时的重传符合业务 需求的图片,减少不良的数据流转到整个数据处理流水线的下面环节,极大 提高数据处理流水线的效率。
本申请还提供了另一种实施方式,即提供一种计算机可读存储介质,所 述计算机可读存储介质存储有计算机可读指令,所述计算机可读指令可被至 少一个处理器执行,以使所述至少一个处理器执行如上述的基于注意力机制 的证件图像质量检测方法的步骤。
本申请提供的计算机可读存储介质,本申请通过相关数据增广的方法和 cbam结构的引入训练一个高精度的证件质量和完整度判断的模型,能够有效 的将低质量不完整的证件拦截打回给上传数据的用户,提醒用户及时的重传 符合业务需求的图片,减少不良的数据流转到整个数据处理流水线的下面环 节,极大提高数据处理流水线的效率。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述 实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通 过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本申请的 技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体 现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光 盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务 器,空调器,或者网络设备等)执行本申请各个实施例所述的方法。
显然,以上所描述的实施例仅仅是本申请一部分实施例,而不是全部的 实施例,附图中给出了本申请的较佳实施例,但并不限制本申请的专利范围。 本申请可以以许多不同的形式来实现,相反地,提供这些实施例的目的是使 对本申请的公开内容的理解更加透彻全面。尽管参照前述实施例对本申请进 行了详细的说明,对于本领域的技术人员来而言,其依然可以对前述各具体 实施方式所记载的技术方案进行修改,或者对其中部分技术特征进行等效替 换。凡是利用本申请说明书及附图内容所做的等效结构,直接或间接运用在 其他相关的技术领域,均同理在本申请专利保护范围之内。

Claims (10)

1.一种基于注意力机制的证件图像质量检测方法,其特征在于,包括下述步骤:
读取证件图像数据库,在所述证件图像数据库中获取正样本图像;
根据图像增广方法对所述标准正样本图像进行图像增广操作,得到负样本图像;
结合所述正样本图像以及所述负样本图像,得到训练数据;
根据所述训练数据对双标签分类模型进行模型训练操作,得到证件图像质量检测模型,其中,所述双标签分类模型由卷积块注意模块以及轻量化网络构成;
接收携带有待检测的待测证件图像;
将所述待测证件图像输入至所述证件图像质量检测模型进行质量检测操作,得到质量检测结果;
输出所述质量检测结果。
2.根据权利要求1所述的基于注意力机制的证件图像质量检测方法,其特征在于,所述轻量化网络为mobilenet_v2网络,在所述根据所述训练数据对双标签分类模型进行模型训练操作,得到证件图像质量检测模型的步骤之前还包括:
将所述mobilenet_v2网络作为所述双标签分类模型的基准网络;
分别在所述mobilenet_v2网络中的每个mobilenet模块之后加入所述卷积块注意模块,生成所述双标签分类模型。
3.根据权利要求1所述的基于注意力机制的证件图像质量检测方法,其特征在于,所述卷积块注意模块包括空间注意力子模块以及通道注意力子模块,其中,
所述通道注意力子模块用于将输入特征F分别经过最大池化和平均池化,并经过共享多层感知器,将得到的两个特征相加,再经过Sigmoid函数,最终生成通道注意力特征Mc(F),所述通道注意力特征Mc(F)表示为:
Figure FDA0003517114280000021
其中,σ表示所述Sigmoid函数;MLP表示所述共享多层感知器;AvgPool表示所述平均池化;MaxPool表示所述最大池化;W0和W1分别表示不同的权重矩阵;
Figure FDA0003517114280000022
表示平均池化特征,
Figure FDA0003517114280000023
表示最大池化特征;
所述空间注意力子模块用于将所述通道注意力特征Mc(F)和输入特征F进行一个基于对应元素逐个相乘的乘法操作,生成空间注意力子模块的输入特征F`,对于输入的特征F`,分别经过最大池化和平均池化操作,然后进行卷积操作,接着通过所述Sigmoid函数生成空间注意力特征Ms(F`),所述空间注意力特征Ms(F`)表示为:
Figure FDA0003517114280000024
其中,σ表示所述Sigmoid函数;f7*7表示示7*7的卷积核;AvgPool表示所述平均池化;MaxPool表示所述最大池化;
Figure FDA0003517114280000025
表示平均池化特征;
Figure FDA0003517114280000026
表示最大池化特征。
4.根据权利要求1所述的基于注意力机制的证件图像质量检测方法,其特征在于,所述图像增广方法包括但不限于高斯模糊方法以及运动模糊方法。
5.根据权利要求1所述的基于注意力机制的证件图像质量检测方法,其特征在于,在所述结合所述正样本图像以及所述负样本图像,得到训练数据的步骤之后,且所述根据所述训练数据对双标签分类模型进行模型训练操作,得到证件图像质量检测模型的步骤之前,还包括:
对所述训练数据进行图像增强操作,得到增强训练数据;
所述根据所述训练数据对双标签分类模型进行模型训练操作,得到证件图像质量检测模型的步骤,具体包括:
根据所述增强训练数据对双标签分类模型进行所述模型训练操作,得到所述证件图像质量检测模型。
6.根据权利要求5所述的基于注意力机制的证件图像质量检测方法,其特征在于,所述根据所述增强训练数据对双标签分类模型进行所述模型训练操作,得到所述证件图像质量检测模型的步骤,具体包括:
判断所述增强训练数据像是否满足预设图像条件;
若所述增强训练数据满足所述预设图像条件,则执行所述模型训练操作,得到所述证件图像质量检测模型;
若所述增强训练数据不满足所述预设图像条件,则对所述增强训练数据进行预处理操作,获得规范训练数据;
根据所述规范训练数据对双标签分类模型进行所述模型训练操作,得到所述证件图像质量检测模型。
7.一种基于注意力机制的证件图像质量检测装置,其特征在于,包括:
正样本获取单元,用于读取证件图像数据库,在所述证件图像数据库中获取正样本图像;
图像增广单元,用于根据图像增广方法对所述标准正样本图像进行图像增广操作,得到负样本图像;
训练数据获取单元,用于结合所述正样本图像以及所述负样本图像,得到训练数据;
模型训练单元,用于根据所述训练数据对双标签分类模型进行模型训练操作,得到证件图像质量检测模型,其中,所述双标签分类模型由卷积块注意模块以及轻量化网络构成;
待测图像获取单元,用于接收携带有待检测的待测证件图像;
质量检测单元,用于将所述待测证件图像输入至所述证件图像质量检测模型进行质量检测操作,得到质量检测结果;
结果输出单元,用于输出所述质量检测结果。
8.根据权利要求7所述的基于注意力机制的证件图像质量检测装置,其特征在于,所述装置还包括:
基准网络确定单元,用于将所述mobilenet_v2网络作为所述双标签分类模型的基准网络;
模型生成单元,用于分别在所述mobilenet_v2网络中的每个mobilenet模块之后加入所述卷积块注意模块,生成所述双标签分类模型。
9.一种计算机设备,其特征在于,包括存储器和处理器,所述存储器中存储有计算机可读指令,所述处理器执行所述计算机可读指令时实现如权利要求1至6中任一项所述的基于注意力机制的证件图像质量检测方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机可读指令,所述计算机可读指令被处理器执行时实现如权利要求1至6中任一项所述的基于注意力机制的证件图像质量检测方法的步骤。
CN202210167606.9A 2022-02-23 2022-02-23 证件图像质量检测方法、装置、计算机设备及存储介质 Pending CN114549471A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210167606.9A CN114549471A (zh) 2022-02-23 2022-02-23 证件图像质量检测方法、装置、计算机设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210167606.9A CN114549471A (zh) 2022-02-23 2022-02-23 证件图像质量检测方法、装置、计算机设备及存储介质

Publications (1)

Publication Number Publication Date
CN114549471A true CN114549471A (zh) 2022-05-27

Family

ID=81676976

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210167606.9A Pending CN114549471A (zh) 2022-02-23 2022-02-23 证件图像质量检测方法、装置、计算机设备及存储介质

Country Status (1)

Country Link
CN (1) CN114549471A (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112418292A (zh) * 2020-11-17 2021-02-26 平安科技(深圳)有限公司 一种图像质量评价的方法、装置、计算机设备及存储介质
CN112465764A (zh) * 2020-11-24 2021-03-09 泰康保险集团股份有限公司 一种图像篡改检测方法和装置
CN114005094A (zh) * 2021-10-28 2022-02-01 洛阳师范学院 航拍车辆目标检测方法、系统及存储介质

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112418292A (zh) * 2020-11-17 2021-02-26 平安科技(深圳)有限公司 一种图像质量评价的方法、装置、计算机设备及存储介质
CN112465764A (zh) * 2020-11-24 2021-03-09 泰康保险集团股份有限公司 一种图像篡改检测方法和装置
CN114005094A (zh) * 2021-10-28 2022-02-01 洛阳师范学院 航拍车辆目标检测方法、系统及存储介质

Similar Documents

Publication Publication Date Title
WO2022174491A1 (zh) 基于人工智能的病历质控方法、装置、计算机设备及存储介质
WO2021143267A1 (zh) 基于图像检测的细粒度分类模型处理方法、及其相关设备
WO2022134584A1 (zh) 房产图片验证方法、装置、计算机设备及存储介质
WO2023035531A1 (zh) 文本图像超分辨率重建方法及其相关设备
CN112995414B (zh) 基于语音通话的行为质检方法、装置、设备及存储介质
US8718374B2 (en) Method and apparatus for accessing an electronic resource based upon a hand-drawn indicator
CN112330331A (zh) 基于人脸识别的身份验证方法、装置、设备及存储介质
CN113673519A (zh) 基于文字检测模型的文字识别方法及其相关设备
CN113886332B (zh) 一种大文件差异对比方法、装置、计算机设备及存储介质
CN114241411B (zh) 基于目标检测的计数模型处理方法、装置及计算机设备
CN112651399B (zh) 检测倾斜图像中同行文字的方法及其相关设备
CN114385694A (zh) 一种数据加工处理方法、装置、计算机设备及存储介质
CN114282258A (zh) 截屏数据脱敏方法、装置、计算机设备及存储介质
CN112434746A (zh) 基于层次化迁移学习的预标注方法及其相关设备
CN116774973A (zh) 数据渲染方法、装置、计算机设备及存储介质
WO2022105120A1 (zh) 图片文字检测方法、装置、计算机设备及存储介质
CN113139490B (zh) 一种图像特征匹配方法、装置、计算机设备及存储介质
CN114549471A (zh) 证件图像质量检测方法、装置、计算机设备及存储介质
CN113362249B (zh) 文字图像合成方法、装置、计算机设备及存储介质
CN113011132B (zh) 竖排文字识别方法、装置、计算机设备和存储介质
CN113988223A (zh) 证件图像识别方法、装置、计算机设备及存储介质
CN112036501A (zh) 基于卷积神经网络的图片的相似度检测方法及其相关设备
CN113989618A (zh) 可回收物品分类识别方法
CN115145823B (zh) 一种ui自动化测试方法、装置、计算机设备及存储介质
CN116363686B (zh) 一种在线社交网络视频平台来源检测方法及其相关设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination