发明内容
本申请提供了一种证件图像的模糊度检测方法、装置、设备及存储介质,用以解决由于上传到系统中的证件图像模糊无法识别,而导致证件图像识别失败、反复退回重拍的问题。
第一方面,本申请提供了一种证件图像的模糊度检测方法,所述方法包括:
确定所述证件图像中的模糊度敏感区域;
计算所述模糊度敏感区域的模糊度;
判定所述模糊度敏感区域的模糊度不大于预设阈值后,定位所述证件图像中的文字区域;
计算所述证件图像中的文字区域的模糊度,并根据所述文字区域的模糊度,确定所述证件图像的模糊度检测结果。
可选地,定位所述证件图像中的文字区域,包括:
定位所述证件图像中的N个文字区域,所述N为大于或等于1的整数。
可选地,根据所述文字区域的模糊度,确定所述证件图像的模糊度检测结果,包括:
依次判断所述N个文字区域中的每个文字区域的模糊度是否大于所述文字区域所对应的模糊度阈值;
若所述N个文字区域中有至少一个文字区域所对应的判断结果为是,则确定所述证件图像的模糊度检测结果为不符合要求;
若所述N个文字区域所对应的判断结果均为否,则确定所述证件图像的模糊度检测结果为符合要求。
可选地,确定所述证件图像中的模糊度敏感区域,包括:
获取图像信息能够被正确识别的第一样本证件图像的集合;
分别对所述第一样本证件图像的集合中的每个第一样本图像进行模糊度逐步加大的模糊处理,直至在所述第一样本证件图像中,识别出第一块模糊度大于所述预设阈值的区域,作为备选区域;
统计每个所述备选区域出现的次数,将出现次数最多的备选区域作为所述模糊度敏感区域。
可选地,确定所述证件图像中的模糊度敏感区域,包括:
获取第二样本证件图像的集合;
分别对所述第二样本证件图像的集合中的每个第二样本证件图像进行以下处理:对所述第二样本证件图像进行模糊度逐步加大的S级模糊处理,对证件中的T个识别字段中的每个识别字段,统计所述识别字段的模糊度大于所述预设阈值时,经历的模糊处理的次数,作为所述识别字段的模糊度容忍度,其中,所述S为大于或者等于1的整数,所述T为大于或者等于1的整数;
分别针对每个所述识别字段进行以下处理:计算所述识别字段在各所述第二样本证件图像的模糊度容忍度的平均值,作为所述识别字段的平均模糊度容忍度;
选取平均模糊度容忍度最小的所述识别字段,作为所述模糊度敏感区域。
可选地,计算所述识别字段在各所述第二样本证件图像的模糊度容忍度的平均值,作为所述识别字段的平均模糊度容忍度之后,依次判断所述N个文字区域中的每个文字区域的模糊度是否大于所述文字区域所对应的模糊度阈值之前,所述方法还包括:
将T个所述识别字段划分为M类字段区域,为所述M类字段区域设置M个模糊度阈值,不同类字段区域所对应的模糊度阈值不同,其中,所述M为大于或者等于1的整数,所述T为大于或者等于1的整数;
分别对所述N个文字区域中的每个文字区域进行以下处理:确定所述文字区域所对应的字段区域,并获取所述文字区域所对应的字段区域的模糊度阈值,作为所述文字区域对应的模糊度阈值。
可选地,确定所述证件图像的模糊度检测结果为不符合要求之后,所述方法还包括:
若确定预设时长内统计的每个所述证件图像的模糊度检测结果均为不符合要求,则判断历史最清晰证件图像的模糊度与所述N个文字区域对应的最小的所述模糊度阈值的差值,是否小于设定值,若是,采用所述历史最清晰证件图像替换所述证件图像,否则,减小每个所述文字区域所对应的模糊度阈值。
第二方面,本申请提供了一种证件图像的模糊度检测装置,包括:
确定模块,用于确定所述证件图像中的模糊度敏感区域;
计算模块,用于计算所述模糊度敏感区域的模糊度;
解析模块,用于判定所述模糊度敏感区域的模糊度不大于预设阈值后,定位所述证件图像中的文字区域;
处理模块,用于计算所述证件图像中的文字区域的模糊度,并根据所述文字区域的模糊度,确定所述证件图像的模糊度检测结果。
第三方面,本申请提供了一种电子设备,包括:处理器、通信接口、存储器和通信总线,其中,处理器、通信接口和存储器通过通信总线完成相互间的通信;所述存储器,用于存储计算机程序;所述处理器,用于执行所述存储器中所存储的程序,实现所述证件图像的模糊度检测方法。
第四方面,本申请提供了一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时实现所述证件图像的模糊度检测方法。
本申请实施例提供的上述技术方案与现有技术相比具有如下优点:本申请实施例提供的该方法,首先对证件图像中的模糊度敏感区域进行模糊度判断,在判定模糊度满足条件后,对文字区域进行模糊度判断,使得检测后上传到系统中的证件图像的模糊度都满足条件,避免了将因上传到系统中的证件图像模糊导致证件图像识别失败、反复退回重拍的问题,使证件审核程序更高效、更便捷。并且,通过模糊度敏感区的预判,能够快速筛选出模糊度不符合要求的图像,进一步提高了筛选效率。另外,通过定位图像的局部区域,对局部区域进行模糊度判断,相较于整张图像的模糊度检测方式,减少了计算量,提高了检测效率。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请的一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请实施例提供了一种证件图像的模糊度检测方法,该方法适用于终端设备,例如,手机、电脑、平板等,该终端设备进行证件图像的模糊度检测的具体实施步骤如图1所示:
步骤101,确定证件图像中的模糊度敏感区域。
一个具体实施例中,采集该证件图像,下面以手机为例介绍采集过程:手机客户端在屏幕上显示用于采集证件图像的引导框;手机客户端通过语音或者文字提示用户将证件正面朝向手机客户端的后置摄像头,并将证件图像置于该引导框内;调整拍摄姿态,将整个证件图像全部置于引导框内,尽可能的使证件图像与引导框各边各角对齐,并保证亮度、模糊度足够明亮和清晰;手机客户端采集该引导框内的图像,得到该证件的正面图像。当然,也可以通过电脑、平板等智能终端采集证件图像,此处不在一一列举。
其中,证件图像中的模糊度敏感区域可以是预先确定的,预先确定模糊度敏感区域需要基于多幅样本图像,样本图像可以是在证件图像的历史采集过程中保存的清晰的证件图像。
确定模糊度敏感区域的方式有很多种,本申请实施例主要介绍以下两种:
第一种,获取图像信息能够被正确识别的第一样本证件图像的集合;分别对第一样本证件图像的集合中的每个第一样本图像进行模糊度逐步加大的模糊处理,直至在第一样本证件图像中,识别出第一块模糊度大于预设阈值的区域,作为备选区域;统计每个备选区域出现的次数,将出现次数最多的备选区域作为模糊度敏感区域。
通过具体实施例对第一种确定模糊度敏感区域的方式进行说明:对采集过程中保存的每一帧证件图像进行逐步加大模糊处理,以可正确识别的证件图像为例,具体如下:对该可正确识别的证件图像进行逐步加大模糊处理,每经过一次模糊处理以后采用识别算法识别处理后的证件图像,直至找到第一块模糊度大于预设阈值,即无法正确识别的备选区域A,经过多次对该可正确识别的证件图像的模糊处理,得到一系列备选区域,备选区域B,备选区域C等。
通过对采集过程中保存的每一帧图像都经过逐步加大模糊处理,每经过一次模糊处理以后采用识别算法识别处理后的图像,进而得到一系列无法正确识别的区域。统计这一系列无法正确识别的区域在进行模糊度处理时出现无法识别的次数,得到出现次数最多的区域I,该区域I为模糊度敏感区域。当该区域I能够被有效识别时,可以认为其他区域也能够被有效识别,即确定该证件图像能够被有效识别,则该证件图像是符合要求的。否则,当该区域I不能被有效识别时,可以确定该证件图像不能被有效识别,则该证件图像是不符合要求的,需要用户重新采集证件图像。通过对大量的图像进行模糊度处理,相对于单张图像处理,提高了数据的准确性和可靠性。
第二种,获取第二样本证件图像的集合;分别对第二样本证件图像的集合中的每个第二样本证件图像进行以下处理:对第二样本证件图像进行模糊度逐步加大的S级模糊处理,对证件中的T个识别字段中的每个识别字段,统计该识别字段的模糊度大于预设阈值时,经历的模糊处理的次数,作为识别字段的模糊度容忍度,其中,S为大于或者等于1的整数,所述T为大于或者等于1的整数;分别针对每个识别字段进行以下处理:计算该识别字段在各第二样本证件图像的模糊度容忍度的平均值,作为该识别字段的平均模糊度容忍度;选取平均模糊度容忍度最小的识别字段,作为模糊度敏感区域。
通过具体实施例对第二种确定模糊度敏感区域的方式进行说明:对采集过程中保存的每一帧证件图像进行逐步加大的S级模糊处理,统计模糊处理过程中,证件中的T个识别字段中的每个识别字段的模糊度大于预设阈值的次数,将该次数作为该识别字段的模糊容忍度。计算多次处理该识别字段产生的模糊度容忍度的平均值,将该平均值作为该识别字段的平均模糊度容忍度,将平均模糊度容忍度最小的识别字段,作为模糊度敏感区域。当该模糊度敏感区域能够被有效识别时,可以认为其他区域也能够被有效识别,即确定该证件图像能够被有效识别,则该证件图像是符合要求的。否则,当该模糊度敏感区域不能被有效识别时,可以确定该证件图像不能被有效识别,则该证件图像是不符合要求的,需要用户重新采集证件图像。通过对大量的图像进行模糊度处理,相对于单张图像处理,提高了数据的准确性和可靠性。
一个具体实施例中,将T个识别字段划分为M类字段区域,为所述M类字段区域设置M个模糊度阈值,不同类字段区域所对应的模糊度阈值不同,其中,所述M为大于或者等于1的整数,所述T为大于或者等于1的整数;分别对N个文字区域中的每个文字区域进行以下处理:确定该文字区域所对应的字段区域,并获取该文字区域所对应的字段区域的模糊度阈值,作为该文字区域对应的模糊度阈值。例如,文字区域1对应字段区域1,该字段区域1的模糊度阈值为a,则该文字区域1的模糊度阈值为a。
例如,可以将证件图像中的T个识别字段根据该模糊敏感度进行聚类划分,例如,当模糊敏感度小于设定值K时,该对应区域为不敏感区域,当模糊敏感度处于设定值K和L之间时,该对应区域为较敏感区域,当模糊敏感度大于设定值L时,该对应区域为很敏感区域。当然可以进一步细分,分为不敏感区域、稍微敏感区域、较大敏感区域、很敏感区域。
步骤102,计算模糊度敏感区域的模糊度。
其中,可以采用现有的任意一种模糊度计算算法来计算模糊度敏感区的模糊度,例如,采用拉普拉斯方差法和数字采样系统频域法计算模糊度敏感区域的模糊度。
步骤103,判定模糊度敏感区域的模糊度不大于预设阈值后,定位证件图像中的文字区域。
一个具体实施例中,当模糊度敏感区域的模糊度不大于预设阈值时,则该模糊度敏感区域符合要求,进而开始定位证件图像中的文字区域,其中,定位证件图像中的文字区域方式为绝对位置定位方法或相对位置定位方法。相对位置定位方法为:根据该证件图像中参考元素的位置,以及该参考元素与文字区域的相对位置关系,确定该证件图像中的第一文字区域,其中,图像中的参考元素可以是证件图像中容易被识别的元素,例如证件图像中的芯片。绝对位置定位方法为:根据文字的图像特征识别该证件图像中的文字区域,作为第二文字区域。
第一文字区域的获得过程具体为:将证件图像中的芯片作为参考元素,识别证件图像中芯片的像素位置;根据实际证件中芯片与文字区域的相对位置关系,以及证件图像中芯片的像素位置,确定证件图像中的文字区域,作为第一文字区域。
其中,对原始的证件图像进行预处理以及二值化后,根据实际证件中芯片的轮廓形状和面积大小,从二值化后的证件图像中识别出芯片的像素位置。具体地,通过对原始采集的证件图像进行灰度化和高斯模糊化等预处理后,对预处理后的证件图像进行自适应二值化处理,得到二值化图像,在二值化图像中通过芯片大小和形状确定芯片的像素位置。
第二文字区域的获得过程具体为:对证件图像进行形态学处理,获取处理后的证件图像中亮度低于预设值的图像区域,得到第一处理图像;对该第一处理图像进行梯度处理后得到第二处理图像;识别出该第二处理图像中的各个文字字符区域,对识别出的各个文字字符区域之间的间隙进行填充后,得到第三处理图像;对该第三处理图像进行二值化处理,得到该证件图像中的文字区域,作为第二文字区域。
也就是说,利用图像灰度、色彩变化的程度和文字特性,定位得到第二文字区域。具体地,对证件图像进行形态学中的黑帽(blackhat)操作,获取证件图像中亮度低于预设值的图像区域,作为第一处理图像;对第一处理图像进行scharr梯度处理,得到第二处理图像;对第二处理图像进行形态学中的闭操作,以填充字符之间的间隙,得到第三处理图像;对第三处理图像进行二值化处理,得到该证件图像中的文字区域,即第二文字区域。
另一具有实施例中,获得第一文字区域和第二文字区域后,可以根据该第一文字区域和该第二文字区域,确定证件图像的第一候选区域。该第一候选区域的确定方法为:计算第一文字区域与第二文字区域的交集区域,作为第一交集区域,以及计算第一文字区域与第二文字区域的并集区域,作为第一并集区域;计算第一交集区域与第一并集区域的比值,若所得的比值大于或等于第一预设值,则将第一并集区域作为该第一候选区域。另外,根据证件图像中文字区域的位置,定位该证件图像中的外扩中心点,其中,外扩中心点为证件图像的中心,在该证件图像中,以外扩中心点为中心外扩得到设定面积的区域,裁剪该设定面积的区域,作为第二候选区域。
当获得第一候选区域和第二候选区域后,通过计算该第一候选区域与该第二候选区域的交集区域,作为第二交集区域,以及计算该第一候选区域与该第二候选区域的并集区域,作为第二并集区域;计算第二交集区域与第二并集区域的比值,若所得的比值大于或等于第二预设值,判断第二候选区域的边界是否在第一候选区域的边界所限定的范围内,若是,则将第二候选区域作为所述证件图像中最终的文字区域,否则,从第一候选区域中选取与第二候选区域大小相同的区域,作为该证件图像中最终的文字区域。
一个具体实施例中,当模糊度敏感区域的模糊度大于预设阈值时,则该模糊度敏感区域不符合要求,即采集的该证件图像不符合要求,需要用户重新采集证件图像。另外,当预设时长内统计的多个证件图像的模糊检测结果总是为不符合要求,即都大于预设阈值,也有可能存在模糊度阈值设置的过于严苛情况。此时,需要判断历史最清晰证件图像的模糊度与N个文字区域对应的最小的模糊度阈值的差值,当该差值小于设定值时,采用历史最清晰证件图像替换该证件图像,否则,减小每个文字区域所对应的模糊度阈值,将减小后的模糊度阈值作为下一时间段的新阈值进行采集、判断。
步骤104,计算证件图像中的文字区域的模糊度,并根据文字区域的模糊度,确定证件图像的模糊度检测结果。
其中,可以采用现有的任意一种模糊度计算算法计算文字区域的模糊度,例如,采用拉普拉斯方差法和数字采样系统频域法计算文字区域的模糊度。
一个具体实施例中,当模糊度敏感区域的模糊度不大于预设阈值后,定位证件图像中的文字区域,该文字区域有N个,其中,N为大于或等于1的整数。
其中,在N等于1的情况下,即只有一个文字区域,只需要判断该文字区域的模糊度和预设阈值之间的关系,当该文字区域的模糊度大于预设阈值时,则确定该文字区域的模糊度不符合要求,即采集的证件图不符合要求,需要用户重新采集证件图像;当该文字区域的模糊度不大于预设阈值时,则确定该文字区域额模糊度符合要求,即采集的证件图像符合要求,证件图像采集流程结束,提交到审核流程中,或者进行当前证件图像的其他检测。
其中,在N大于1的情况下,需要依次判断N个文字区域的模糊度是否大于该文字区域所对应的模糊度阈值,当N个文字区域中有至少一个区域的模糊度大于该文字区域对应的模糊度阈值,则确定该证件图像的模糊度检测结果为不符合要求,即采集的证件图不符合要求,需要用户重新采集证件图像;当N个文字区域的模糊度都不大于其对应的模糊度阈值,则确定该证件图像的模糊度符合要求,即采集的证件图像符合要求,证件图像采集流程结束,提交到审核流程中,或者进行当前证件图像的其他检测。
本申请实施例中,首先对证件图像中的模糊度敏感区域进行模糊度判断,在判定模糊度满足条件后,对文字区域进行模糊度判断,使得检测后上传到系统中的证件图像的模糊度都满足条件,避免了将因上传到系统中的证件图像模糊导致证件图像识别失败、反复退回重拍的问题,使证件审核程序更高效、更便捷。并且,通过模糊度敏感区的预判,能够快速筛选出模糊度不符合要求的图像,进一步提高了筛选效率。另外,通过定位图像的局部区域,对局部区域进行模糊度判断,相较于整张图像的模糊度检测方式,减少了计算量,提高了检测效率。并且对证件图像的处理或者定位对文字区域都是基于对大量图像的处理,相对于单张图像处理,提高了数据的准确性和可靠性。
基于同一构思,本申请实施例中提供了一种证件图像的模糊度检测装置,该装置的具体实施可参见方法实施例部分的描述,重复之处不再赘述,如图2所示,该装置主要包括:
确定模块201,用于确定该证件图像中的模糊度敏感区域;
计算模块202,用于计算该模糊度敏感区域的模糊度;
解析模块203,用于判定该模糊度敏感区域的模糊度不大于预设阈值后,定位该证件图像中的文字区域;
处理模块204,用于计算该证件图像中的文字区域的模糊度,并根据该文字区域的模糊度,确定该证件图像的模糊度检测结果。
具体地,处理模块204用于:依次判断N个文字区域中的每个文字区域的模糊度是否大于该文字区域所对应的模糊度阈值;若该N个文字区域中有至少一个文字区域所对应的判断结果为是,则确定证件图像的模糊度检测结果为不符合要求;若该N个文字区域所对应的判断结果均为否,则确定该证件图像的模糊度检测结果为符合要求。
具体地,确定模块201用于:获取图像信息能够被正确识别的第一样本证件图像的集合;分别对该第一样本证件图像的集合中的每个第一样本图像进行模糊度逐步加大的模糊处理,直至在该第一样本证件图像中,识别出第一块模糊度大于预设阈值的区域,作为备选区域;统计每个备选区域出现的次数,将出现次数最多的备选区域作为模糊度敏感区域。
具体地,确定模块201用于:获取第二样本证件图像的集合;分别对该第二样本证件图像的集合中的每个第二样本证件图像进行以下处理:对该第二样本证件图像进行模糊度逐步加大的S级模糊处理,对证件中的T个识别字段中的每个识别字段,统计识别字段的模糊度大于预设阈值时,经历的模糊处理的次数,作为该识别字段的模糊度容忍度,其中,S为大于或者等于1的整数,T为大于或者等于1的整数;分别针对每个识别字段进行以下处理:计算该识别字段在该第二样本证件图像的模糊度容忍度的平均值,作为该识别字段的平均模糊度容忍度;选取平均模糊度容忍度最小的识别字段,作为模糊度敏感区域。
基于同一构思,本申请实施例中还提供了一种电子设备,如图3所示,该电子设备主要包括:处理器301、通信接口302、存储器303和通信总线304,其中,处理器301、通信接口302和存储器303通过通信总线304完成相互间的通信。其中,存储器303中存储有可被至处理器301执行的程序,处理器301执行存储器303中存储的程序,实现如下步骤:确定证件图像中的模糊度敏感区域;计算模糊度敏感区域的模糊度;判定模糊度敏感区域的模糊度不大于预设阈值后,定位证件图像中的文字区域;计算证件图像中的文字区域的模糊度,并根据文字区域的模糊度,确定证件图像的模糊度检测结果。
上述电子设备中提到的通信总线304可以是外设部件互连标准(PeripheralComponent Interconnect,简称PCI)总线或扩展工业标准结构(Extended IndustryStandard Architecture,简称EISA)总线等。该通信总线304可以分为地址总线、数据总线、控制总线等。为便于表示,图3中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
通信接口302用于上述电子设备与其他设备之间的通信。
存储器303可以包括随机存取存储器(Random Access Memory,简称RAM),也可以包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。可选地,存储器还可以是至少一个位于远离前述处理器301的存储装置。
上述的处理器301可以是通用处理器,包括中央处理器(Central ProcessingUnit,简称CPU)、网络处理器(Network Processor,简称NP)等,还可以是数字信号处理器(Digital Signal Processing,简称DSP)、专用集成电路(Application SpecificIntegrated Circuit,简称ASIC)、现场可编程门阵列(Field-Programmable Gate Array,简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
在本申请的又一实施例中,还提供了一种计算机可读存储介质,该计算机可读存储介质中存储有计算机程序,当该计算机程序在计算机上运行时,使得计算机执行上述实施例中所描述的证件图像的模糊度检测方法。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。该计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行该计算机指令时,全部或部分地产生按照本申请实施例所述的流程或功能。该计算机可以时通用计算机、专用计算机、计算机网络或者其他可编程装置。该计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,计算机指令从一个网站站点、计算机、服务器或者数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、微波等)方式向另外一个网站站点、计算机、服务器或数据中心进行传输。该计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。该可用介质可以是磁性介质(例如软盘、硬盘、磁带等)、光介质(例如DVD)或者半导体介质(例如固态硬盘)等。
需要说明的是,在本文中,诸如“第一”和“第二”等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上所述仅是本发明的具体实施方式,使本领域技术人员能够理解或实现本发明。对这些实施例的多种修改对本领域的技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所申请的原理和新颖特点相一致的最宽的范围。