CN106547912A - 身份证数据库中非二代身份证照片的识别和剔除方法 - Google Patents

身份证数据库中非二代身份证照片的识别和剔除方法 Download PDF

Info

Publication number
CN106547912A
CN106547912A CN201611054968.8A CN201611054968A CN106547912A CN 106547912 A CN106547912 A CN 106547912A CN 201611054968 A CN201611054968 A CN 201611054968A CN 106547912 A CN106547912 A CN 106547912A
Authority
CN
China
Prior art keywords
identity card
image
china
photo
white
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201611054968.8A
Other languages
English (en)
Inventor
张九龙
张福成
屈小娥
张烜
王新平
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xian University of Technology
Original Assignee
Xian University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xian University of Technology filed Critical Xian University of Technology
Priority to CN201611054968.8A priority Critical patent/CN106547912A/zh
Publication of CN106547912A publication Critical patent/CN106547912A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/5838Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using colour
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content

Landscapes

  • Engineering & Computer Science (AREA)
  • Library & Information Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Collating Specific Patterns (AREA)

Abstract

本发明公开的身份证数据库中非二代身份证照片的识别和剔除方法:1)判断源数据是否为图像格式:若为图像格式则进行2),若不是图像格式则保存到不合格图像数据库;2)判断图像大小是否符合二代身份证图像大小:若图像大小符合二代身份证图像大小则进行3),若图像大小不符合二代身份证图像大小则保存到不合格图像数据库;3)通过对图像左上角采样区域是否为白色块来判断整幅图像是否为二代身份证照片:若图像左上角采样区域为白色块则保存到合格图像数据库,若图像左上角采样区域不是白色块则保存到不合格图像数据库;4)对不合格图像数据库中的照片进行清洗处理。本发明非二代身份证照片的识别和剔除方法,方便清洗掉不符合要求的照片。

Description

身份证数据库中非二代身份证照片的识别和剔除方法
技术领域
本发明属于图像处理方法技术,具体涉及一种身份证数据库中非二代身份证照片的识别和剔除方法。
背景技术
现在全国人民使用的是二代身份证证件,但是由于中国人基数庞大,实施周期比较长,并且由于不同时间段执行的一些标准与规则并不完全相同,这就致使目前二代身份证数据库中存在不少不规范的身份证照片。这些照片对于正常事务的处理、数据的查找应用、数据库中不合格照片的更新都造成了影响。由此可见,如何快速查找、识别以及剔除这些不规范的二代身份证照片极为重要。
发明内容
本发明的目的在于提供一种身份证数据库中非二代身份证照片的识别和剔除方法,基于图像背景色块和一致性的方法查找身份证数据库内不符合要求的二代身份证照片,方便清洗掉不符合要求的照片。
本发明所采用的技术方案是,身份证数据库中非二代身份证照片的识别和剔除方法,具体按照以下步骤实施:
步骤1、搜索读取数据库中的图像字段的数据,判断源数据是否为图像格式:
若为图像格式,则进行步骤2;
若不是图像格式,则直接保存到不合格图像数据库;
步骤2、经步骤1后,判断图像大小是否符合二代身份证图像大小:
若图像大小符合二代身份证图像大小,则进行步骤3;
若图像大小不符合二代身份证图像大小,则直接保存到不合格图像数据库;
步骤3、经步骤2后,选取大小合格的照片左上角的一个区域块,标准二代身份证照片中该区域对应的是白色的,通过对图像左上角采样区域是否为白色块来判断整幅图像是否为二代身份证照片,即能完成对标准二代身份证照片的识别,考虑到合格照片的白色块并非红绿蓝三通道均为255,故设置阈值及采用背景色块一致性判断准则:
若图像左上角采样区域为白色块,则保存到合格图像数据库;
若图像左上角采样区域不是白色块,则保存到不合格图像数据库;
步骤4、对不合格图像数据库中的照片进行清洗处理,以剔除二代身份证数据库中不符合要求的照片。
本发明的特点还在于:
步骤1中的判断标准具体如下:
将身份证数据库中存储的照片信息从身份证数据库中提取出来时,照片已经不具有图像信息,这是由于源图像信息是以二进制形式保存在身份证数据库存储空间中,并且开始的二进制字符表示此数据是否为图像,根据这一规律,判断从身份证数据库中读取出来的二进制数据是否满足图像保存格式的要求。
步骤2中判断标准具体如下:
最新的标准二代身份证数据库中的图像大小都是标准大小,由于上传时间比较久远的图像大小不统一,因此根据现在标准二代身份证的标准大小为依据,经比较得出图像大小是否符合二代身份证图像大小。
步骤3是根据图像局部特征和一致性判断来识别不符合要求的二代身份证照片,具体的判断方法如下:
在图像的左上角取一个矩形区域,对于符合二代身份证的照片,该矩形区域为白色背景,选取的区域大小是在40*40的范围内;
在彩色照片中,纯白色的点(R,G,B)=(255,255,255),但实际情况中,图像左上角矩形区域不是所有点均为纯白色,而是接近白色;另外矩形区域内可能还含有头发的部分区域,则要按照如下算法来判断该区域是否为白色区域:
设置单通道阈值,选取theta=240,以此阈值判断每个通道是否满足白色对应的通道值范围:
若大于阈值则判断是白色;反之则判断不是白色;
若矩形区域每个通道中任意一个通道超过40%以上的点不是白色,则判断出该区域不是白色区域;
考虑到图像左上角区域为色度分布均匀的一个区域,若不是白色的点百分比在40%以下,则白色点在60%以上,根据区域均匀性能判断该矩形区域的大部分点为白色,即该矩形区域为白色区域,即该照片符合二代身份证照片的基本要求。
本发明的有益效果在于:
(1)本发明身份证数据库中非二代身份证照片的识别和剔除方法主要是基于图像背景色块和一致性的方法查找身份证数据库内不符合要求的二代身份证照片,能快速及方便的清洗掉不符合要求的照片。
(2)本发明身份证数据库中非二代身份证照片的识别和剔除方法操作起来非常简单,能快速从身份证数据库中识别符合标准的二代身份证照片;在各省市治安管理库中可以给相关机构提供需更新照片的身份证号列表,一方面收集合格的证件照片,另一方面,在公安破案的人像识别系统中能有效排除不清晰照片的干扰。
(3)本发明身份证数据库中非二代身份证照片的识别和剔除方法适合在一些数据库中存在非二代证件照的省、市推广使用。
附图说明
图1是本发明身份证数据库中非二代身份证照片的识别和剔除方法的流程图。
具体实施方式
下面结合附图和具体实施方式对本发明进行详细说明。
本发明身份证数据库中非二代身份证照片的识别和剔除方法,如图1所示,具体按照以下步骤实施:
步骤1、搜索读取数据库中的图像字段的数据,并判断源数据是否为图像格式:
若为图像格式,则进行步骤2;
若不是图像格式,则将其直接保存到不合格图像数据库;
判断源数据是否为图像格式的标准具体如下:
将身份证数据库中存储的照片信息从身份证数据库中提取出来时,照片已经不具有图像信息,这是由于源图像信息是以二进制形式保存在身份证数据库存储空间中,并且开始的二进制字符表示此数据是否为图像,根据这一规律,判断从身份证数据库中读取出来的二进制数据是否满足图像保存格式的要求,清洗掉不符合图像存储格式的非图像数据。
除此之外,针对海量数据,必须考虑算法的执行效率,要将算法的时间复杂度和空间复杂度将到最低。由于数据库的搜索读取也是一个非常慢的操作,因此要尽可能的降低数据的读取,所有数据记录都值读取一遍。为了提高搜索效率,要尽可能的减少限制条件,选取了执行搜索效率高的字段作为搜索条件,并为该字段增加了索引,这样能有效提高数据搜索效率和读取效率,使算法的执行效率达到最高。
步骤2、经步骤1后,判断图像大小是否符合二代身份证图像大小:
若图像大小符合二代身份证图像大小,则进行步骤3;
若图像大小不符合二代身份证图像大小,则将其直接保存到不合格图像数据库;
最新的标准二代身份证数据库中的图像大小都是标准大小,由于上传时间比较久远的图像大小不统一,因此根据现在标准二代身份证的标准大小为依据,经比较得出图像大小是否符合二代身份证图像大小。
步骤3、经步骤2后,选取大小合格的照片左上角的一个区域块,标准二代身份证照片中该区域对应的是白色的,通过对图像左上角采样区域是否为白色块来判断整幅图像是否为二代身份证照片,即能完成对标准二代身份证照片的识别,考虑到合格照片的白色块并非红绿蓝三通道均为255,故设置阈值及采用背景色块一致性判断准则:
若图像左上角采样区域为白色块,则将该图像保存到合格图像数据库;
若图像左上角采样区域不是白色块,则将该图像直接保存到不合格图像数据库。
在步骤3中,主要是根据图像局部特征和一致性判断来识别不符合要求的二代身份证照片,具体的判断方法如下:
在图像的左上角取一个矩形区域,对于符合二代身份证的照片,该矩形区域为白色背景,选取的区域大小是在40*40的范围内;
在彩色照片中,纯白色的点(R,G,B)=(255,255,255),但实际情况中,图像左上角矩形区域不是所有点均为纯白色,而是接近白色;另外矩形区域内可能还含有头发的部分区域,则要按照如下算法来判断该区域是否为白色区域:
设置单通道阈值,通过多次反复实验,最终选取theta=240,以此阈值判断每个通道是否满足白色对应的通道值范围:若大于阈值,就判断是白色,反之则不是白色;若该矩形区域每个通道中任意一个通道超过40%以上的点不是白色,则该区域不是白色区域;考虑到左上角区域一般为色度分布均匀的一个区域,若40%以下的点不是白色,则能判断本区域的大部分点为白色,即该区域为白色区域,即该照片符合二代身份证照片的基本要求。
步骤4、对不合格图像数据库中的所有图像进行清洗处理,以剔除二代身份证数据库中不符合要求的照片。
把对应的照片保存到相应的数据库中,即符合要求的保存到一个数据库表中,同时为了以后的验证,要将清洗出来的不符合要求的照片保存到另一个数据库表(不合格图像数据库)中;另外,非常重要的是要将每张二代身份证照片所对应全部个人信息分类保存到对应的数据库中。
本发明身份证数据库中非二代身份证照片的识别和剔除方法,基于图像背景色块和一致性的方法查找身份证数据库内不符合要求的二代身份证照片,方便清洗掉不符合要求的照片。

Claims (4)

1.身份证数据库中非二代身份证照片的识别和剔除方法,其特征在于,具体按照以下步骤实施:
步骤1、搜索读取数据库中的图像字段的数据,并判断源数据是否为图像格式:
若为图像格式,则进行步骤2;
若不是图像格式,则将其直接保存到不合格图像数据库;
步骤2、经步骤1后,判断图像大小是否符合二代身份证图像大小:
若图像大小符合二代身份证图像大小,则进行步骤3;
若图像大小不符合二代身份证图像大小,则将其直接保存到不合格图像数据库;
步骤3、经步骤2后,选取大小合格的照片左上角的一个区域块,标准二代身份证照片中该区域对应的是白色的,通过对图像左上角采样区域是否为白色块来判断整幅图像是否为二代身份证照片,即能完成对标准二代身份证照片的识别,考虑到合格照片的白色块并非红绿蓝三通道均为255,故设置阈值及采用背景色块一致性判断准则:
若图像左上角采样区域为白色块,则将该图像保存到合格图像数据库;
若图像左上角采样区域不是白色块,则将该图像直接保存到不合格图像数据库;
步骤4、对不合格图像数据库中的所有图像进行清洗处理,以剔除二代身份证数据库中不符合要求的照片。
2.根据权利要求1所述的身份证数据库中非二代身份证照片的识别和剔除方法,其特征在于,所述步骤1中的判断标准具体如下:
将身份证数据库中存储的照片信息从身份证数据库中提取出来时,照片已经不具有图像信息,这是由于源图像信息是以二进制形式保存在身份证数据库存储空间中,并且开始的二进制字符表示此数据是否为图像,根据这一规律,判断从身份证数据库中读取出来的二进制数据是否满足图像保存格式的要求。
3.根据权利要求1所述的身份证数据库中非二代身份证照片的识别和剔除方法,其特征在于,所述步骤2中判断标准具体如下:
最新的标准二代身份证数据库中的图像大小都是标准大小,由于上传时间比较久远的图像大小不统一,因此根据现在标准二代身份证的标准大小为依据,经比较得出图像大小是否符合二代身份证图像大小。
4.根据权利要求1所述的身份证数据库中非二代身份证照片的识别和剔除方法,其特征在于,在所述步骤3中,根据图像局部特征和一致性判断来识别不符合要求的二代身份证照片,具体的判断方法如下:
在图像的左上角取一个矩形区域,对于符合二代身份证的照片,该矩形区域为白色背景,选取的区域大小是在40*40的范围内;
在彩色照片中,纯白色的点(R,G,B)=(255,255,255),但实际情况中,图像左上角矩形区域不是所有点均为纯白色,而是接近白色;另外矩形区域内可能还含有头发的部分区域,则要按照如下算法来判断该区域是否为白色区域:
设置单通道阈值,=选取theta=240,以此阈值判断每个通道是否满足白色对应的通道值范围:
若大于阈值,就判断是白色,反之则不是白色;
若该矩形区域每个通道中任意一个通道超过40%以上的点不是白色,则该区域不是白色区域;
考虑到图像左上角区域为色度分布均匀的一个区域,若不是白色的点百分比在40%以下,则白色点在60%以上,根据区域均匀性能判断该矩形区域的大部分点为白色,即该矩形区域为白色区域,即该照片符合二代身份证照片的基本要求。
CN201611054968.8A 2016-11-25 2016-11-25 身份证数据库中非二代身份证照片的识别和剔除方法 Pending CN106547912A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201611054968.8A CN106547912A (zh) 2016-11-25 2016-11-25 身份证数据库中非二代身份证照片的识别和剔除方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201611054968.8A CN106547912A (zh) 2016-11-25 2016-11-25 身份证数据库中非二代身份证照片的识别和剔除方法

Publications (1)

Publication Number Publication Date
CN106547912A true CN106547912A (zh) 2017-03-29

Family

ID=58395174

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201611054968.8A Pending CN106547912A (zh) 2016-11-25 2016-11-25 身份证数据库中非二代身份证照片的识别和剔除方法

Country Status (1)

Country Link
CN (1) CN106547912A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108509885A (zh) * 2018-03-26 2018-09-07 东南大学 一种高效的身份证照片筛选方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102254129A (zh) * 2010-05-17 2011-11-23 无锡市美普索特电子科技有限公司 一种身份证验证系统
CN103345622A (zh) * 2013-07-09 2013-10-09 浙江省公安厅居民身份证制作中心 第二代身份证人像照片质量控制方法
CN105426818A (zh) * 2015-10-30 2016-03-23 小米科技有限责任公司 区域提取方法及装置
CN105528601A (zh) * 2016-02-25 2016-04-27 华中科技大学 基于接触式传感器的身份证图像采集、识别系统及采集识别方法
CN105912321A (zh) * 2016-04-01 2016-08-31 乐视控股(北京)有限公司 一种文字颜色设置方法及装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102254129A (zh) * 2010-05-17 2011-11-23 无锡市美普索特电子科技有限公司 一种身份证验证系统
CN103345622A (zh) * 2013-07-09 2013-10-09 浙江省公安厅居民身份证制作中心 第二代身份证人像照片质量控制方法
CN105426818A (zh) * 2015-10-30 2016-03-23 小米科技有限责任公司 区域提取方法及装置
CN105528601A (zh) * 2016-02-25 2016-04-27 华中科技大学 基于接触式传感器的身份证图像采集、识别系统及采集识别方法
CN105912321A (zh) * 2016-04-01 2016-08-31 乐视控股(北京)有限公司 一种文字颜色设置方法及装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108509885A (zh) * 2018-03-26 2018-09-07 东南大学 一种高效的身份证照片筛选方法

Similar Documents

Publication Publication Date Title
CN105450411B (zh) 利用卡片特征进行身份验证的方法、装置及系统
Wang et al. Fingerprint enhancement in the singular point area
CN104751142B (zh) 一种基于笔划特征的自然场景文本检测方法
CN105426829B (zh) 基于人脸图像的视频分类方法和装置
Shen et al. Improving OCR performance with background image elimination
CN106056083B (zh) 一种信息处理方法及终端
KR20140139730A (ko) 깊이 차이를 이용한 얼굴 구성요소의 자동 분류 방법
Hashim Pupil detection based on color difference and circular hough transform
CN104750678A (zh) 一种图像文本识别翻译眼镜及方法
Jun et al. Face detection based on LBP
Zhang et al. A combined algorithm for video text extraction
Zhang et al. Face spoofing video detection using spatio-temporal statistical binary pattern
Mohseni et al. Recognizing induced emotions with only one feature: A novel color histogram-based system
Bai et al. A fast stroke-based method for text detection in video
Song et al. Depth-aware saliency detection using discriminative saliency fusion
Devadethan et al. Face detection and facial feature extraction based on a fusion of knowledge based method and morphological image processing
Huang et al. M2-Net: multi-stages specular highlight detection and removal in multi-scenes
CN112070116B (zh) 一种基于支持向量机的艺术画作自动分类系统及方法
CN106547912A (zh) 身份证数据库中非二代身份证照片的识别和剔除方法
CN108877030A (zh) 图像处理方法、装置、终端和计算机可读存储介质
Youlian et al. Face detection method using template feature and skin color feature in rgb color space
Tian et al. Research of the Matlab application in the fingerprint identification system
Huang et al. A new video text extraction approach
Wang et al. A new method of speeded up robust features image registration based on image preprocessing
Sun et al. A multi-scale TVQI-based illumination normalization model

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20170329

RJ01 Rejection of invention patent application after publication