CN115829915A - 图像质量检测方法、电子设备、存储介质及程序产品 - Google Patents
图像质量检测方法、电子设备、存储介质及程序产品 Download PDFInfo
- Publication number
- CN115829915A CN115829915A CN202210997763.2A CN202210997763A CN115829915A CN 115829915 A CN115829915 A CN 115829915A CN 202210997763 A CN202210997763 A CN 202210997763A CN 115829915 A CN115829915 A CN 115829915A
- Authority
- CN
- China
- Prior art keywords
- quality
- image
- target
- region
- category
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 135
- 238000003860 storage Methods 0.000 title claims abstract description 23
- 238000003709 image segmentation Methods 0.000 claims abstract description 59
- 238000000034 method Methods 0.000 claims abstract description 42
- 238000004590 computer program Methods 0.000 claims abstract description 27
- 238000000605 extraction Methods 0.000 claims description 47
- 238000012216 screening Methods 0.000 claims description 15
- 238000012549 training Methods 0.000 claims description 14
- 238000012935 Averaging Methods 0.000 claims description 7
- 230000002159 abnormal effect Effects 0.000 claims description 5
- 230000008520 organization Effects 0.000 claims description 5
- 238000005070 sampling Methods 0.000 claims description 4
- 238000012545 processing Methods 0.000 description 12
- 238000010586 diagram Methods 0.000 description 9
- 230000008569 process Effects 0.000 description 9
- 230000006870 function Effects 0.000 description 8
- 230000004927 fusion Effects 0.000 description 7
- 238000005516 engineering process Methods 0.000 description 6
- 238000013473 artificial intelligence Methods 0.000 description 5
- 238000004422 calculation algorithm Methods 0.000 description 5
- 238000012805 post-processing Methods 0.000 description 5
- 230000005540 biological transmission Effects 0.000 description 4
- 230000000694 effects Effects 0.000 description 4
- 230000006835 compression Effects 0.000 description 3
- 238000007906 compression Methods 0.000 description 3
- 238000013461 design Methods 0.000 description 3
- 238000012015 optical character recognition Methods 0.000 description 3
- 238000007781 pre-processing Methods 0.000 description 3
- 230000003796 beauty Effects 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 238000013135 deep learning Methods 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000011218 segmentation Effects 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 238000003786 synthesis reaction Methods 0.000 description 2
- 230000002194 synthesizing effect Effects 0.000 description 2
- 238000012795 verification Methods 0.000 description 2
- 241001465754 Metazoa Species 0.000 description 1
- 230000005856 abnormality Effects 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000003190 augmentative effect Effects 0.000 description 1
- 238000009529 body temperature measurement Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000013145 classification model Methods 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000007499 fusion processing Methods 0.000 description 1
- 238000009499 grossing Methods 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 210000004936 left thumb Anatomy 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000006386 neutralization reaction Methods 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000002265 prevention Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000012827 research and development Methods 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
Images
Landscapes
- Image Analysis (AREA)
Abstract
本申请实施例提供一种图像质量检测方法、电子设备、存储介质及计算机程序产品。方法包括:获取目标图像;将目标图像输入图像分割网络,获得图像分割网络输出的质量检测结果,质量检测结果包括目标图像中每个像素的像素质量信息;从目标图像中识别至少一个目标区域所在的位置,获得区域位置信息;基于质量检测结果以及区域位置信息,确定至少一个目标区域各自的区域质量信息。该方法可以实现对图像的像素级和区域级的质量检测,满足对图像细粒度的质量检测要求。
Description
技术领域
本申请涉及图像处理领域,更具体地涉及一种图像质量检测方法、电子设备、存储介质及计算机程序产品。
背景技术
近年来,图像质量检测被应用到多种场景中,例如在身份认证等领域,经常需要检测图像质量。图像质量检测是一种对图像的清晰度、光影、遮挡等质量问题进行检测、评估的方法,目的是为了在实际应用场景中,提前筛选、阻止低质量图像的上传,或对图像质量进行及时反馈,从而避免对检测或识别等任务的精度产生影响。
但是,目前的图像质量检测方法均为图像分类方法,其问题是不够细粒度,只能对整张图像给出定性的质量类别推测,而无法满足更精细的需求。如在实际业务中,如果用户仅仅关注身份证字段区域的质量,例如当高光、模糊等质量问题没有出现在身份证字段区域上时,就允许身份证图像通过质量检测,那么针对整张图像的质量分类模型便无法满足需求。
因此,需要一种能够满足更细粒度的质量检测需求的技术,以解决上述技术问题。
发明内容
考虑到上述问题而提出了本申请。本申请提供了一种图像质量检测方法、电子设备、存储介质及计算机程序产品。
根据本申请一方面,提供了一种图像质量检测方法,包括:获取目标图像;将目标图像输入图像分割网络,获得图像分割网络输出的质量检测结果,质量检测结果包括目标图像中每个像素的像素质量信息;从目标图像中识别至少一个目标区域所在的位置,获得区域位置信息;基于质量检测结果以及区域位置信息,确定至少一个目标区域各自的区域质量信息。
示例性地,像素质量信息包括与至少一种质量类别一一对应的质量得分,至少一种质量类别包括用于表示质量正常的第一质量类别和/或用于表示质量异常的第二质量类别,基于质量检测结果以及区域位置信息,确定至少一个目标区域各自的区域质量信息包括:对于至少一个目标区域中的任一目标区域,按照与第一质量类别相对应的质量得分从低到高的顺序从该目标区域包含的所有像素点中筛选第一数目或第一比例的像素点,或者按照与第二质量类别相对应的质量得分从高到低的顺序从该目标区域包含的所有像素点中筛选第二数目或第二比例的像素点;对于至少一种质量类别中的每一种,对筛选出的像素点的对应质量得分求平均,获得与该质量类别相对应的平均得分,对应质量得分是与该质量类别相对应的质量得分;基于与至少一种质量类别一一对应的平均得分,确定该目标区域的区域质量信息,其中,区域质量信息包括以下一项或多项:目标区域所属的质量类别;与目标区域所属的质量类别一一对应的质量得分;目标区域的质量得分。
示例性地,区域质量信息包括目标区域所属的质量类别,基于与至少一种质量类别一一对应的平均得分,确定该目标区域的区域质量信息包括:按照平均得分从高到低的顺序从至少一种质量类别中选择第三数目的质量类别作为该目标区域所属的质量类别;或者,从至少一种质量类别中选择平均得分高于对应的质量阈值的质量类别作为该目标区域所属的质量类别,其中,至少一种质量类别各自具有对应的质量阈值。
示例性地,第一质量类别包括正常类别,第二质量类别包括模糊类别、暗影类别、遮挡类别、高光类别中的一种或多种。
示例性地,在基于质量检测结果以及区域位置信息,确定至少一个目标区域各自的区域质量信息之后,方法还包括:基于至少一个目标区域的区域质量信息,确定目标图像的图像质量信息。
示例性地,区域质量信息包括目标区域所属的质量类别,图像质量信息包括目标图像所属的质量类别,基于至少一个目标区域的区域质量信息,确定目标图像的图像质量信息包括:将至少一个目标区域所属的质量类别的众数确定为目标图像所属的质量类别;或者,将至少一个目标区域所属的所有质量类别确定为目标图像所属的质量类别。
示例性地,区域质量信息包括与第一质量类别相对应的质量得分,第一质量类别用于表示质量正常,图像质量信息包括目标图像的质量得分,基于至少一个目标区域的区域质量信息,确定目标图像的图像质量信息包括:将至少一个目标区域各自的与第一质量类别相对应的质量得分中的最低质量得分确定为目标图像的质量得分。
示例性地,图像分割网络是通过如下过程训练得到的:获取初始图像;对初始图像执行以下一种或多种操作以生成样本图像:在初始图像上叠加背景信息;对初始图像进行缩放和/或旋转;对初始图像进行模糊处理;调整初始图像的明暗度以在初始图像上形成暗影;在初始图像上添加遮挡对象;在初始图像上添加高光;获取标注数据,标注数据用于指示样本图像中每个像素的像素质量信息;基于样本图像和标注数据对图像分割网络进行训练。
示例性地,初始图像是证件图像,获取初始图像包括:获取真实证件图像;从真实证件图像上删除每个字段区域内的真实个人信息以及头像区域的人脸,获得模板证件图像;根据每个字段区域内的字符组织规则,生成与每个字段区域相对应的合成个人信息;将合成个人信息填充到模板证件图像的对应字段区域内;获取待合成人脸图像;将待合成人脸图像叠加到模板证件图像的头像区域,获得初始图像。
示例性地,获取待合成人脸图像包括:获取初始人脸图像;将初始人脸图像转换为灰度图像;基于灰度图像确定灰度值高于灰度阈值的区域,以确定背景区域;在初始人脸图像中将背景区域的不透明度设置为低于不透明度阈值,获得待合成人脸图像。
示例性地,图像分割网络包括细节特征提取分支、语义特征提取分支和后续网络模块,将目标图像输入图像分割网络,获得图像分割网络输出的质量检测结果包括:将目标图像或目标图像的初始特征分别输入细节特征提取分支和语义特征提取分支;在细节特征提取分支中执行不多于两次的下采样,获得第一特征;在语义特征提取分支中执行比细节特征提取分支多且不多于四次的下采样,获得第二特征;将第一特征和第二特征输入后续网络模块,获得质量检测结果。
根据本申请另一方面,提供了一种电子设备,包括处理器和存储器,其中,存储器中存储有计算机程序指令,计算机程序指令被处理器运行时用于执行上述图像质量检测方法。
根据本申请另一方面,提供了一种存储介质,在所述存储介质上存储了程序指令,所述程序指令在运行时用于执行上述图像质量检测方法。
根据本申请另一方面,提供了一种计算机程序产品,所述计算机程序产品包括计算机程序,所述计算机程序在运行时用于执行上述图像质量检测方法。
根据本申请实施例的图像质量检测方法、电子设备、存储介质及计算机程序产品,能够基于目标图像的质量检测结果和区域位置信息,确定目标区域各自的区域质量信息,由此,可以实现对图像的像素级和区域级的质量检测,满足对图像细粒度的质量检测要求,有助于提高图像质量检测方法的适用性。
附图说明
通过结合附图对本申请实施例进行更详细的描述,本申请的上述以及其它目的、特征和优势将变得更加明显。附图用来提供对本申请实施例的进一步理解,并且构成说明书的一部分,与本申请实施例一起用于解释本申请,并不构成对本申请的限制。在附图中,相同的参考标号通常代表相同部件或步骤。
图1示出用于实现根据本申请实施例的图像质量检测方法和装置的示例电子设备的示意性框图;
图2示出根据本申请一个实施例的图像质量检测方法的示意性流程图;
图3示出了根据本申请一个实施例的图像分割网络的处理流程的示意图;
图4示出根据本申请一个实施例的图像质量检测装置的示意性框图;
图5示出根据本申请一个实施例的电子设备的示意性框图。
具体实施方式
近年来,基于人工智能的计算机视觉、深度学习、机器学习、图像处理、图像识别等技术研究取得了重要进展。人工智能(Artificial Intelligence,AI)是研究、开发用于模拟、延伸人的智能的理论、方法、技术及应用系统的新兴科学技术。人工智能学科是一门综合性学科,涉及芯片、大数据、云计算、物联网、分布式存储、深度学习、机器学习、神经网络等诸多技术种类。计算机视觉作为人工智能的一个重要分支,具体是让机器识别世界,计算机视觉技术通常包括人脸识别、活体检测、指纹识别与防伪验证、生物特征识别、人脸检测、行人检测、目标检测、行人识别、图像处理、图像识别、图像语义理解、图像检索、文字识别、视频处理、视频内容识别、三维重建、虚拟现实、增强现实、同步定位与地图构建(SLAM)、计算摄影、机器人导航与定位等技术。随着人工智能技术的研究和进步,该项技术在众多领域展开了应用,例如安全防控、城市管理、交通管理、楼宇管理、园区管理、人脸通行、人脸考勤、物流管理、仓储管理、机器人、智能营销、计算摄影、手机影像、云服务、智能家居、穿戴设备、无人驾驶、自动驾驶、智能医疗、人脸支付、人脸解锁、指纹解锁、人证核验、智慧屏、智能电视、摄像机、移动互联网、网络直播、美颜、美妆、医疗美容、智能测温等领域。
为了使得本申请的目的、技术方案和优点更为明显,下面将参照附图详细描述根据本申请的示例实施例。显然,所描述的实施例仅仅是本申请的一部分实施例,而不是本申请的全部实施例,应理解,本申请不受这里描述的示例实施例的限制。基于本申请中描述的本申请实施例,本领域技术人员在没有付出创造性劳动的情况下所得到的所有其它实施例都应落入本申请的保护范围之内。
为了至少部分地解决上述技术问题,本申请实施例提供了一种图像质量检测方法、电子设备、存储介质及计算机程序产品。根据本申请实施例的图像质量检测方法,可以实现针对图像的像素级和区域级的质量检测。
虽然上文以身份证图像的质量检测为例进一步描述现有的图像质量检测方法存在的问题,但是可以理解,根据本申请实施例的图像质量检测方法还可以应用于任何其他合适类型的图像质量检测领域,例如,风景图像的质量检测,人脸图像的质量检测,除身份证图像以外的其他证件图像的质量检测等等。此外,根据本申请实施例的图像质量检测方法可以应用于任何需要进行图像质量检测的领域,包括但不限于目标识别、目标检测、身份认证、人脸抓拍或其他任何需要对图像进行质量检测的技术领域。
首先,参照图1来描述用于实现根据本申请实施例的图像质量检测方法和装置的示例电子设备100。
如图1所示,电子设备100包括一个或多个处理器102、一个或多个存储装置104。可选地,电子设备100还可以包括输入装置106、输出装置108、以及图像拍摄装置110,这些组件通过总线系统112和/或其它形式的连接机构(未示出)互连。应当注意,图1所示的电子设备100的组件和结构只是示例性的,而非限制性的,根据需要,所述电子设备也可以具有其他组件和结构。
所述处理器102可以采用数字信号处理器(DSP)、现场可编程门阵列(FPGA)、可编程逻辑阵列(PLA)、微处理器中的至少一种硬件形式来实现,所述处理器102可以是中央处理单元(CPU)、图像处理器(GPU)、专用的集成电路(ASIC)或者具有数据处理能力和/或指令执行能力的其它形式的处理单元中的一种或几种的组合,并且可以控制所述电子设备100中的其它组件以执行期望的功能。
所述存储装置104可以包括一个或多个计算机程序产品,所述计算机程序产品可以包括各种形式的计算机可读存储介质,例如易失性存储器和/或非易失性存储器。所述易失性存储器例如可以包括随机存取存储器(RAM)和/或高速缓冲存储器(cache)等。所述非易失性存储器例如可以包括只读存储器(ROM)、硬盘、闪存等。在所述计算机可读存储介质上可以存储一个或多个计算机程序指令,处理器102可以运行所述程序指令,以实现下文所述的本申请实施例中(由处理器实现)的客户端功能以及/或者其它期望的功能。在所述计算机可读存储介质中还可以存储各种应用程序和各种数据,例如所述应用程序使用和/或产生的各种数据等。
所述输入装置106可以是用户用来输入指令的装置,并且可以包括键盘、鼠标、麦克风和触摸屏等中的一个或多个。
所述输出装置108可以向外部(例如用户)输出各种信息(例如图像和/或声音),并且可以包括显示器、扬声器等中的一个或多个。可选地,所述输入装置106和所述输出装置108可以集成在一起,采用同一交互装置(例如触摸屏)实现。
所述图像拍摄装置110可以采集图像,并且将所采集的图像存储在所述存储装置104中以供其它组件使用。图像拍摄装置110可以是单独的相机或移动终端中的摄像头等。应当理解,图像拍摄装置110仅是示例,电子设备100可以不包括图像拍摄装置110。在这种情况下,可以利用其他具有图像采集能力的器件采集图像,并将采集的图像发送给电子设备100。
示例性地,用于实现根据本申请实施例的图像质量检测方法和装置的示例电子设备可以在诸如个人计算机、终端设备、考勤机、面板机、相机或远程服务器等的设备上实现。
下面,将参考图2描述根据本申请实施例的图像质量检测方法。图2示出根据本申请一个实施例的图像质量检测方法200的示意性流程图。如图2所示,图像质量检测方法200包括步骤S210、S220、S230和S240。
步骤S210,获取目标图像。
示例性地,目标图像可以是任意类型的图像,包括但不限于针对工卡、护照、身份证、银行卡等各种证件采集获得的证件图像,人脸图像,车辆图像,或者风景图像等。
目标图像可以是静态图像,也可以是动态视频中的任一视频帧。目标图像可以是图像采集装置(例如相机中的图像传感器)采集到的原始图像,也可以是对原始图像进行预处理(诸如数字化、归一化、平滑等)之后获得的图像。需注意,对原始图像的预处理可以包括从图像采集装置采集到的原始图像中提取包含目标对象的子图像进而获得目标图像的操作。目标对象可以是任何物体,包括但不限于:字符、车辆、人或人体的一部分(诸如人脸)、动物、建筑物等。
步骤S220,将目标图像输入图像分割网络,获得图像分割网络输出的质量检测结果,质量检测结果包括目标图像中每个像素的像素质量信息。
示例性地,将基于上述步骤S210获取的目标图像输入图像分割网络,可以获得图像分割网络输出的质量检测结果。质量检测结果可以包括目标图像中每个像素的像素质量信息。示例性地,任一像素的像素质量信息可以包括该像素所属的质量类别和/或该像素的至少一种质量得分,至少一种质量得分与至少一种特定质量类别一一对应。与任一质量类别相对应的质量得分可以是像素属于该质量类别的概率。示例性地,可以根据像素的质量得分确定像素所属的质量类别。例如,可以将所有特定质量类别中质量得分最高的一种或多种质量类别,或将所有特定质量类别中质量得分大于得分阈值的质量类别,确定为像素所属的质量类别。示例性而非限制性地,至少一种特定质量类别可以各自具有对应的得分阈值,不同的特定质量类别可以具有相同或不同的得分阈值。
步骤S230,从目标图像中识别至少一个目标区域所在的位置,获得区域位置信息。
示例性地,可以利用目标检测网络识别目标图像中的目标区域。目标区域可以是任意区域,其可以是包含上述目标对象在内的区域,例如包含人脸在内的人脸检测框等。当然,目标区域也可以是不包含目标对象,只是用户希望针对该位置进行质量检测的任意区域。当目标图像是身份证图像时,目标区域可以是身份证图像上的字段区域和/或人脸区域,例如字段区域可以是身份证图像中显示性别为男/女的区域,或显示11位身份证号的区域等。在一个具体实施例中,针对身份证图像中的字段区域进行识别,此时可以利用光学字符识别(Optical Character Recognition,OCR)检测网络进行识别。
步骤S240,基于质量检测结果以及区域位置信息,确定至少一个目标区域各自的区域质量信息。
示例性地,基于步骤S230获得的区域位置信息,可以知道每个目标区域所在的位置。可以基于上述步骤S220中获取的目标图像的质量检测结果,确定位于每个目标区域内的像素的像素质量信息,并可以综合任一目标区域内的像素的像素质量信息确定该目标区域的区域质量信息。
在上述技术方案中,基于目标图像的质量检测结果和区域位置信息,确定目标区域各自的区域质量信息,由此,可以实现对图像的像素级和区域级的质量检测,满足对图像细粒度的质量检测要求,有助于提高图像质量检测方法200的适用性。
示例性地,根据本申请实施例的图像质量检测方法可以在具有存储器和处理器的设备、装置或者系统中实现。
根据本申请实施例的图像质量检测方法可以部署在图像采集端处,例如,可以部署在具有图像采集功能的个人终端或服务器端处。
替代地,根据本申请实施例的图像质量检测方法还可以分布地部署在服务器端(或云端)和个人终端处。例如,可以在客户端采集目标图像,客户端将采集的图像传送给服务器端(或云端),由服务器端(或云端)进行图像质量检测。
示例性地,像素质量信息包括与至少一种质量类别一一对应的质量得分,至少一种质量类别包括用于表示质量正常的第一质量类别和/或用于表示质量异常的第二质量类别,基于质量检测结果以及区域位置信息,确定至少一个目标区域各自的区域质量信息包括:对于至少一个目标区域中的任一目标区域,按照与第一质量类别相对应的质量得分从低到高的顺序从该目标区域包含的所有像素点中筛选第一数目或第一比例的像素点,或者按照与第二质量类别相对应的质量得分从高到低的顺序从该目标区域包含的所有像素点中筛选第二数目或第二比例的像素点;对于至少一种质量类别中的每一种,对筛选出的像素点的对应质量得分求平均,获得与该质量类别相对应的平均得分,对应质量得分是与该质量类别相对应的质量得分;基于与至少一种质量类别一一对应的平均得分,确定该目标区域的区域质量信息,其中,区域质量信息包括以下一项或多项:目标区域(即与区域质量信息相对应的目标区域,下同)所属的质量类别;与目标区域所属的质量类别一一对应的质量得分;目标区域的质量得分。
按照与第一质量类别相对应的质量得分从低到高的顺序从该目标区域包含的所有像素点中筛选第一数目或第一比例的像素点,是指优先筛选与第一质量类别相对应的质量得分更低的像素点,直至筛选出的像素点满足第一数目或第一比例的要求。例如,按照与第一质量类别相对应的质量得分从低到高的顺序从该目标区域包含的所有像素点中筛选第一数目或第一比例的像素点,可以包括:按照与第一质量类别相对应的质量得分从低到高的顺序对像素点排序,并从排序好的像素点中筛选出排在前面的第一数目或第一比例的像素点;或者,按照与第一质量类别相对应的质量得分从高到低的顺序对像素点排序,并从排序好的像素点中筛选出排在后面的第一数目或第一比例的像素点。按照与第二质量类别相对应的质量得分从高到低的顺序从该目标区域包含的所有像素点中筛选第二数目或第二比例的像素点,是指优先筛选与第二质量类别相对应的质量得分更高的像素点,直至筛选出的像素点满足第二数目或第二比例的要求。按照与第二质量类别相对应的质量得分从高到低的顺序从该目标区域包含的所有像素点中筛选第二数目或第二比例的像素点,可以包括:按照与第二质量类别相对应的质量得分从低到高的顺序对像素点排序,并从排序好的像素点中筛选出排在后面的第二数目或第二比例的像素点;或者,按照与第二质量类别相对应的质量得分从高到低的顺序对像素点排序,并从排序好的像素点中筛选出排在前面的第二数目或第二比例的像素点。
第一数目和第二数目可以是任何合适的数目,其大小可以根据需要设定,本申请不对此进行限制。第一数目与第二数目可以相同,也可以不同。类似地,第一比例和第二比例可以是任何合适的比例,其大小可以根据需要设定,本申请不对此进行限制。第一比例与第二比例可以相同,也可以不同。各目标区域可以对应有自己的第一数目、第二数目、第一比例和第二比例。对于第一数目、第二数目、第一比例和第二比例中的任一项来说,不同目标区域所对应的该项的值可以相同,也可以不同。
示例性而非限制性地,质量类别可以分为两大类:用于表示质量正常的第一质量类别和用于表示质量异常的第二质量类别,通过这两大类可以帮助筛选出质量异常(即质量较差)的图像,避免影响到后续的识别或检测等任务的准确率。
示例性地,第一质量类别可以包括正常类别,第二质量类别可以包括模糊类别、暗影类别、遮挡类别、高光类别中的一种或多种。在第一质量类别或第二质量类别包括多种质量类别的情况下,可以可选地通过对该多种质量类别所对应的质量得分加权求和或加权平均来获得与第一质量类别或第二质量类别相对应的质量得分。
第一质量类别包括正常类别仅是示例而非对本申请的限制,例如第一质量类别还可以包括诸如清晰类别(与模糊类别对照)、无遮挡类别(与遮挡类别对照)、无暗影类别(与暗影类别对照)、无高光类别(与高光类别对照)等中的一种或多种。此外,第二质量类别包括模糊类别、暗影类别、遮挡类别、高光类别中的一种或多种也仅是一种示例,第二质量类别还可以包括其他类型的能够反映图像质量异常的类别,例如人脸偏斜等。
示例性地,像素的像素质量信息可以包括与正常类别、模糊类别、暗影类别、遮挡类别、高光类别这五种质量类别一一对应的质量得分,其中,五种质量类别的质量得分相加等于1。例如,与质量类别一一对应的质量得分可以是正常类别0.5、模糊类别0.1、暗影类别0.1、遮挡类别0.1、高光类别0.2。
示例性地,图像分割网络可以输出大小为[5,h,w]的三维特征图,其中,h表示目标图像的高,w表示目标图像的宽。也就是说,对于目标图像上的每一个像素点,均给出了对应的5个质量得分,这是像素级的质量检测结果。假设对于目标图像Is的第i行,第j列的像素有对应质量得分其中,下角标1到5分别对应正常类别、模糊类别、暗影类别、遮挡类别和高光类别这五类。
此外,将目标图像输入到目标检测网络中,可以得到nr个目标区域R={rt|t∈[1,nr]}。对于每个目标区域rt,可以筛选rt中所有像素点里q1值最小的k个像素,获得k个对应的质量得分Qt={qi|i∈[1,k]}。可以分别计算Qt中所有类别得分的平均值计算方式如下:
此外,可以设定阈值th,当任一目标区域存在时,认为该目标区域正常,目标区域所属的质量类别qtt=1,否则,认为该目标区域属于质量异常。示例性地,在目标区域属于质量异常的情况下,目标区域所属的质量类别qtt可以为剩余到中平均得分最高的类别或者平均得分高于对应得分阈值的类别。目标区域所属的质量类别qtt计算如下:
下面以目标图像是身份证图像为例进行说明。示例性地,在目标图像是身份证图像的情况下,目标区域可以包括与“姓名”、“性别”、“出生年”、“出生月”、“出生日”、“住址”、“公民身份号码”这七个字段分别对应的七个字段区域以及用于呈现头像的人脸区域,一共八个目标区域。这八个目标区域可以分别用目标区域1至目标区域8表示。假设目标区域1中包括50个像素点,可以从这50个像素点中筛选10个或说20%个与第一质量类别,例如正常类别,相对应的质量得分最低的像素点。或者也可以从该目标区域1所包括的50个像素点中筛选15个或说30%个与第二质量类别,例如模糊、暗影、遮挡、高光中的一个或多个质量类别,相对应的质量得分最高的像素点。可以基于与目标区域1类似的方式分别确定目标区域2至目标区域8相对应的质量得分最低或最高的像素点,为了简洁,在此不再赘述。
示例性地,对于五种质量类别中的任一种,可以对上述筛选的10个或15个像素点相对应的质量得分求平均,例如加权平均,以获得与该质量类别相对应的平均得分。
获得筛选出的像素点的各质量类别的平均得分之后,可以基于这些平均得分确定目标区域所属的质量类别等区域质量信息。区域质量信息的示例性确定方式将在下文描述。
质量检测主要关注质量异常会影响后续检测或识别效果的部分,同一目标区域有些像素的质量很好,有些很差,针对所有像素求平均可能导致质量得分被中和,无法检测出质量差的部分,从而影响质量检测的准确度。在上述技术方案中,首先基于质量得分筛选像素点,然后通过对筛选出的像素点的质量得分求平均的方法确定目标区域所属的质量类别,这样可以避免直接求平均导致中和的问题,可以有效提高质量检测的精确性。
示例性地,区域质量信息可以包括目标区域所属的质量类别,基于与至少一种质量类别一一对应的平均得分,确定该目标区域的区域质量信息可以包括:按照平均得分从高到低的顺序从至少一种质量类别中选择第三数目的质量类别作为该目标区域所属的质量类别;从至少一种质量类别中选择平均得分高于对应的质量阈值的质量类别作为该目标区域所属的质量类别,其中,至少一种质量类别各自具有对应的质量阈值。
按照平均得分从高到低的顺序从至少一种质量类别中选择第三数目的质量类别作为该目标区域所属的质量类别,是指优先筛选平均得分更高的质量类别,直至筛选出的质量类别满足第三数目的要求。例如,按照平均得分从高到低的顺序从至少一种质量类别中选择第三数目的质量类别作为该目标区域所属的质量类别,可以包括:按照平均得分从高到低的顺序对至少一种质量类别排序,并从排序好的质量类别中筛选出排在前面的第三数目的质量类别;或者,按照平均得分从低到高的顺序对至少一种质量类别排序,并从排序好的质量类别中筛选出排在后面的第三数目的质量类别。
第三数目可以根据需要设定为任何合适的值,本申请不对此进行限制。第三数目可以是1个,也可以是大于或等于2的正整数。即,可以从至少一种质量类别中选择平均得分最高的前几名作为目标区域所属的质量类别。
示例性地,假设目标区域与质量类别相对应的平均得分分别是模糊类别0.27和高光类别0.31。平均得分最高的是高光类别对应的0.31,由此,可以将高光类别作为该目标区域所属的质量类别。
示例性地,用户可以预先设定每种质量类别所对应的阈值,例如,正常类别对应的阈值是0.54、模糊类别对应的阈值是0.25、暗影类别对应的阈值是0.25、遮挡类别对应的阈值是0.12、高光类别对应的阈值是0.19。沿用上述平均得分的示例,模糊类别0.27和高光类别0.31的平均得分均高于各自对应的阈值,由此,可以确定该目标区域所属的质量类别是模糊类别和高光类别。
可选地,可以将基于平均得分最高或高于阈值的标准所选择的质量类别中任一类别所对应的平均得分作为目标区域所属的质量类别中该类别的质量得分。
在上述技术方案中,基于与质量类别对应的平均得分,确定目标区域的区域质量信息,这种方式所确定的区域质量信息的准确性较高。
示例性地,目标区域的质量得分通过综合与目标区域所属的质量类别一一对应的质量得分获得。
示例性地,针对与目标区域所属的质量类别一一对应的质量得分,可以通过加权求和或者加权平均的方法获得目标区域的质量得分。例如,如果目标区域所属的质量类别仅为一种质量类别,例如正常类别,则该质量类别所对应的质量得分就是该目标区域的质量得分。如果目标区域所属的质量类别为多种质量类别,例如模糊、暗影、遮挡和高光四种类别中的至少两种,则可以通过对这些质量类别所对应的质量得分进行加权求和或者加权平均的方法获得目标区域的质量得分。在一个具体实施例中,目标区域所属的质量类别及其对应的质量得分分别是:暗影0.25和高光0.19。通过加权求和的方法确定该目标区域的质量得分P1等于0.44;通过加权平均的方法确定该目标区域的质量得分P2等于0.22。
在上述技术方案中,通过综合与目标区域所属的质量类别一一对应的质量得分获得目标区域的质量得分,由此,能够提高图像质量检测的精确性。
示例性地,在基于质量检测结果以及区域位置信息,确定至少一个目标区域各自的区域质量信息之后,方法还包括:基于至少一个目标区域的区域质量信息,确定目标图像的图像质量信息。
具体地,目标图像可以包括目标区域A、目标区域B、目标区域C、目标区域D和目标区域E。通过上述确定目标区域的区域质量信息的方法确定目标区域A、目标区域B、目标区域C、目标区域D和目标区域E的区域质量信息,随后可以通过综合这些目标区域的区域质量信息获得该目标图像的图像质量信息。
在上述技术方案中,通过目标区域的质量信息确定目标图像的质量信息,由此,在获得像素级和区域级的质量检测结果的情况下,还可以进一步获得整张图像的质量检测结果,这方便用户按需获取并查看多层次的质量检测结果,可以提高用户体验,适用性更广。
示例性地,区域质量信息包括目标区域所属的质量类别,图像质量信息包括目标图像所属的质量类别,基于至少一个目标区域的区域质量信息,确定目标图像的图像质量信息的方法可以包括:将至少一个目标区域所属的质量类别的众数确定为目标图像所属的质量类别;或者,将至少一个目标区域所属的所有质量类别确定为目标图像所属的质量类别。
在一个示例中,假设分别确定目标区域A1所属的质量类别是正常类别,目标区域B1所属的质量类别是模糊类别,目标区域C1所属的质量类别是正常类别,目标区域D1所属的质量类别是正常类别,目标区域E1所属的质量类别是高光类别。以上五个目标区域中,属于正常类别的数量最多,由此确定目标图像所属的质量类别是正常类别。如果上述五个目标区域中有两个目标区域属于高光类别,两个目标区域属于模糊类别,一个属于正常类别,其中高光类别和模糊类别的数量最多且相等,则可以将高光类别和模糊类别均确定为该目标图像所属的质量类别。
在另一个示例中,假设分别确定目标区域A2所属的质量类别是遮挡类别,目标区域B2所属的质量类别是模糊类别,目标区域C2所属的质量类别是遮挡类别,目标区域D2所属的质量类别是高光类别,目标区域E2所属的质量类别是高光类别。那么可以将遮挡类别、模糊类别和高光类别这所有的质量类别均确定为目标图像所属的质量类别。
在上述技术方案中,将目标区域中质量类别的众数或者是所有质量类别确定为目标图像所属的质量类别,由此,可以较为准确或全面地反应目标图像所属的质量类别。
示例性地,区域质量信息包括与第一质量类别相对应的质量得分,第一质量类别用于表示质量正常,图像质量信息包括目标图像的质量得分,基于至少一个目标区域的区域质量信息,确定目标图像的图像质量信息,可以包括:将至少一个目标区域各自的与第一质量类别相对应的质量得分中的最低质量得分确定为目标图像的质量得分。
例如,如果目标图像包括三个目标区域,第一个目标区域中与第一质量类别相对应的质量得分是0.6,第二个目标区域中与第一质量类别相对应的质量得分是0.45,第三个目标区域中与第一质量类别相对应的质量得分是0.63。在这些质量得分中,第二个目标区域的质量得分0.45是最低质量得分,由此,可以将该质量得分确定为目标图像的质量得分。
通过以上方式,可以将最不正常(即质量最差)的区域的质量得分确定为目标图像的质量得分,这样可以方便快速地筛选出质量较差的图像。
示例性地,图像分割网络是通过如下过程训练得到的:获取样本图像和标注数据,标注数据用于指示样本图像中每个像素的像素质量信息;基于样本图像和标注数据对图像分割网络进行训练。
示例性地,可以通过数据集下载或者传输工具传输等方式,获取样本图像和标注数据。
示例性地,基于样本图像和标注数据对图像分割网络进行训练可以包括如下操作。将样本图像输入图像分割网络,获得样本图像的质量检测结果。将样本图像的质量检测结果与标注数据代入损失函数中计算损失项。随后基于计算的损失项,通过反向传播与梯度下降算法对图像分割网络的参数进行优化。以上优化操作可以多次迭代执行,直至损失项收敛。
通过对图像分割网络进行训练,使得在实际应用过程中,通过图像分割网络检测的像素质量信息更接近实际的像素质量信息,可以提高图像质量检测的准确性。
模型训练通常需要大量的训练数据,很多领域(诸如身份证图像的质量检测领域)收集训练数据较为困难,这需要耗费大量的时间,训练效率比较低。下面提供一种样本图像的新的生成方式。
示例性地,样本图像可以通过以下方式获得:获取初始图像;对初始图像执行以下一种或多种操作以生成样本图像:在初始图像上叠加背景信息;对初始图像进行缩放和/或旋转;对初始图像进行模糊处理;调整初始图像的明暗度以在初始图像上形成暗影;在初始图像上添加遮挡对象;在初始图像上添加高光。
示例性地,针对已经获取的初始图像,可以在初始图像中叠加背景信息,例如叠加天空的背景,以更新初始图像。示例性地,可以对初始图像进行缩放和/或旋转任意角度,以更新初始图像。示例性地,可以对初始图像进行模糊处理,以更新初始图像。示例性地,可以调整图像的明暗度在初始图像上形成暗影,以更新初始图像。示例性地,可以通过图像叠加等方式在初始图像上添加任一遮挡对象,以更新初始图像。示例性地,可以借助诸如光线反射算法(phong reflection model),模拟手机拍摄场景下点光源反射造成的高光现象,在初始图像上添加高光合成数据,以更新初始图像。
以上每次更新后的初始图像可以进一步经过其他的更新后作为样本图像或者直接作为样本图像。
通过以上生成方式,可以自动、快速、便捷地基于初始图像生成大量图像分割网络的样本图像,可以有效提高网络训练的效率。
需注意,以上叠加了各种噪声(包括背景、模糊、暗影、遮挡、高光等)的初始图像属于一类样本图像,初始图像本身也可以属于一类样本图像。即,可以将叠加了噪声的初始图像与没有叠加噪声的初始图像均加入图像分割网络的训练数据集中,用于对图像分割网络进行训练。
示例性地,对初始图像进行模糊处理可以包括:基于高斯模糊、运动模糊、高斯噪声、图像压缩中的一种或多种方式对初始图像进行模糊处理。
在一个示例中,可以针对整个初始图像,基于高斯模糊、运动模糊、高斯噪声、图像压缩中的一种或多种方式进行模糊处理,这样可以获得全局模糊的初始图像。在另一个示例中,可以针对初始图像的指定区域,基于高斯模糊、运动模糊、高斯噪声、图像压缩中的一种或多种方式进行模糊处理,这样可以获得局部模糊的初始图像。
示例性地,调整初始图像的明暗度以在初始图像上形成暗影可以包括:针对全局或局部调整初始图像的像素透明度,以在初始图像上形成局部暗影、渐变暗影或全局暗影。
同步调整整个初始图像上的像素透明度,可以获得全局暗影效果。同步调整初始图像上的指定区域的像素透明度,可以获得局部暗影效果。通过渐变式的方式调整整个初始图像或初始图像上的指定区域的像素透明度,可以获得渐变暗影效果。
示例性地,在初始图像上添加遮挡对象包括:获取仅包含遮挡对象的对象图像;对象图像进行缩放和/或旋转;将对象图像叠加到初始图像上。
具体地,可以通过拍摄装置拍摄或者网络下载等方式获取仅包含遮挡对象的对象图像,例如该对象图像可以是一张仅包含左手拇指的图像。可以对该对象图像进行缩放和/或旋转以调整图像的大小和方向,以适应初始图像的大小和遮挡对象将要遮挡的位置。最后将调整后的对象图像叠加到初始图像上。
在诸如身份证图像的证件图像的质量检测领域,实际应用中,受限于样本图像的特殊性,真实证件难以采集。为此,本申请提出一种方法,借助虚拟证件图像的合成来构建图像分割网络的训练集。下面描述这种方法。
示例性地,初始图像是证件图像,获取初始图像包括:获取真实证件图像;从真实证件图像上删除每个字段区域内的真实个人信息以及头像区域的人脸,获得模板证件图像;根据每个字段区域内的字符组织规则,生成与每个字段区域相对应的合成个人信息;将合成个人信息填充到模板证件图像的对应字段区域内;获取待合成人脸图像;将待合成人脸图像叠加到模板证件图像的头像区域,获得初始图像。
在一个实施例中,当该图像质量检测方法应用于证件图像质量检测的场景中时,可以通过拍摄装置拍摄、网络下载或者传输工具传输等方法获取一张真实的证件图像,然后抹除图像中真实的身份信息,以获取模板证件图像。
例如,可以删除真实身份证图像上的一些或全部表征用户真实信息的字段以及人脸等信息,如可删除姓名、性别、出生日期、住址、身份证号等字段所对应的字段内容,以获得模板身份证图像。可以根据每个字段区域内的字符组织规则,生成与每个字段区域相对应的合成个人信息。生成方式可以是诸如随机生成等。例如,可以根据显示姓名的字段区域内的汉字为2至4个,显示性别的字段区域内的汉字只能是男或者女,以及显示身份证号的字段区域内包括11个数字或者10个数字和一个字母X等字符组织规则,随机生成与每个字段区域相对应的合成个人信息。然后将合成个人信息填充到模板身份证图像的对应字段区域内。
此外,还可以进一步获取任意人脸图像,将该人脸图像叠加到模板证件图像的头像区域。经过上述合成个人信息的填充以及人脸图像的叠加,可以最终获得所需的初始图像。
在上述技术方案中,通过合成虚拟的证件图像的方式获得初始图像,由此可以避免证件图像难以采集的情况,可以快速、方便地获取大量证件训练数据。
示例性地,获取待合成人脸图像包括:获取初始人脸图像;将初始人脸图像转换为灰度图像;基于灰度图像确定灰度值高于灰度阈值的区域,以确定背景区域;在初始人脸图像中将背景区域的不透明度设置为低于不透明度阈值,以获得待合成人脸图像。
获取初始人脸图像的方法在此前已经进行了详细的阐述,为了简洁,在此不再赘述。
示例性地,可以通过将初始人脸图像转换为灰度图像。将灰度值高于灰度阈值的区域,例如人脸图像中人物轮廓以外的空白区域,确定为背景区域。随后,可以将上述方法中确定的背景区域的不透明度调整至低于不透明度阈值,由此,在当前人脸图像中只能看到人脸部分,初始人脸图像中的空白区域显示为透明的样式。
在上述技术方案中,通过降低初始人脸图像的灰度图像中灰度值较高区域的不透明度以进行图像融合,由此,可以非常方便地实现证件头像的无痕融合。与常规的人脸抠像方式相比,这种待合成人脸的获取方式以及证件头像的融合方式算法简单,计算量小,合成效率高。
示例性地,图像分割网络包括细节特征提取分支、语义特征提取分支和后续网络模块,将目标图像输入图像分割网络,获得图像分割网络输出的质量检测结果包括:将目标图像或目标图像的初始特征分别输入细节特征提取分支和语义特征提取分支;在细节特征提取分支中执行不多于两次的下采样,获得第一特征;在语义特征提取分支中执行比细节特征提取分支多且不多于四次的下采样,获得第二特征;将第一特征和第二特征输入后续网络模块,获得质量检测结果。
图3示出了根据本申请一个实施例的图像分割网络的处理流程的示意图。如图3所示,后续网络模块可以包括特征融合模块、模型输出模块和图像后处理模块,这些模块的功能将在下文描述。此外,可选地,图像分割网络还可以包括模型输入模块,模型输入模块位于细节特征提取分支和语义特征提取分支之前。模型输入模块可以是共享的特征提取模块,其可以用于接收目标图像,并输出基于目标图像提取的特征,即初始特征。此外,模型输入模块也可以不对接收的图像进行特征提取,而是直接将目标图像输入后续的细节特征提取分支和语义特征提取分支。需注意,以上结合图3描述的图像分割网络的结构仅是示例而非对本申请的限制,图像分割网络并不局限于这种实现方式。例如,图像后处理模块可以从图像分割网络中移除,独立于图像分割网络存在,或者可以将图像后处理模块从整个图像质量检测方法的流程中删除,即不对图像分割网络输出的特征进行后处理。
在一个实施例中,将目标图像输入图像分割网络前,可以首先对初始目标图像进行图像预处理,以获得所需的目标图像。示例性而非限制性地,初始目标图像的预处理可以包括以下步骤。给定任意一张初始目标图像(例如身份证图像)I0,将初始目标图像输入诸如OCR检测网络的目标检测模型M,得到去除背景的矫正后的初始目标图像I1。然后可以将矫正后的初始目标图像I1缩放到标准输入大小,如h*w=192*288,其中h表示图像的高,w表示图像的宽。随后将缩放后的图像进行归一化操作,得到目标图像I。
细节特征提取分支和语义特征提取分支分别用于执行图像浅层的纹理细节的特征提取以及深层的语义特征的提取。
在细节特征提取分支和语义特征提取分支中,模型将目标图像I通过卷积的方式进行下采样,每次下采样可以使得特征图的分辨率下降至原来的1/2。细节特征提取分支和语义特征提取分支分别执行不同尺度的下采样。细节特征提取分支最多下采样到目标图像的1/4,语义特征提取分支最多下采样到目标图像的1/16。细节特征提取分支比语义特征提取分支的下采样次数少。也就是说,细节特征提取分支的下采样倍率较低,特征图可以更多地保留图像的纹理细节信息。而语义特征提取分支的下采样倍率较高,特征图可以更多地保留深层的语义信息。
发明人发现,由于用于质量检测的分割任务本身为低层次(low-level)任务,这种任务更关注图像纹理特征,因此,采用较小的下采样倍率就可以提升纹理信息在图像分割网络中的权重。因此,限制细节特征提取分支和语义特征提取分支的下采样倍率,使得二者的下采样倍率尽量小一些,这样可以在不影响分割结果(即质量检测结果)的同时,可以大幅度地提升模型的处理速度。这种限制网络的下采样倍率的方案可以视为是对图像分割网络的一种轻量化操作。
下面以细节特征提取分支下采样两次,语义特征提取分支下采样四次为例描述图像分割网络的处理流程。
细节特征提取过程可以表示为:Fdetail=encode1/4(I),语义特征提取过程可以表示为:Fsemantic=encode1/16(I),其中Fdetail表示第一特征,Fsemantic表示第二特征,encode表示图像的下采样卷积编码过程。
随后,可以将第一特征Fdetail和第二特征Fsemantic输入特征融合模块。特征融合模块可以用于对浅层细节特征(即第一特征)和深层语义特征(即第二特征)两类特征进行融合。融合过程表示如下:
其中,代表1/4倍下采样,up4代表4倍上采样,sigmoid代表sigmoid激活函数,为按位乘操作,concat为特征在通道(channel)维度的拼接操作。最后得到的Fcombine为原图1/4大小的特征图,即特征图维度为[C,48,72],其中C为特征通道数。
随后,可以将融合特征输入模型输出模块。模型输出模块可以包括至少一个卷积模块和softmax映射模块。融合特征经过几层简单的卷积模块之后,特征的通道数量被降维,再经过softmax映射,可以得到[5,48,72]的输出特征图。
随后,可以对输出特征图进行图像后处理。例如,可以将[5,24,36]的输出特征图通过双线性插值的方法,缩放到[5,192,288]大小。即一张目标图像,经过图像分割网络以及图像后处理之后,最终得到的是与原始目标图像相同大小的五通道特征图。特征图上每个像素的五个通道的得分分别对应目标图像上同一位置处的像素属于正常类别、模糊类别、暗影类别、遮挡类别、高光类别的得分,五个质量得分的和为1。
上文描述了通过限制下采样倍率的方式对图像分割网络进行轻量化的实现方案。根据本申请的一个实施例,还可以从特征通道维度方面,对图像分割网络进行裁剪,以实现其轻量化。
减小特征通道维度可以包括:对于图像分割网络的所有卷积模块,将输入特征图和输出特征图的通道维度减半。例如,对于图像分割网络中某一层的一个3*3卷积,原本输入的特征图为[N,32,96,144],卷积后输出的特征图为[N,64,48,72],该3*3卷积的参数量为3*3*32*64。将以上卷积模块的输入特征图和输出特征图的大小分别降为[N,16,96,144]及[N,32,48,72]后,卷积的参数量为3*3*16*32,整体参数量减少为原来的1/4。
根据本申请另一方面,提供一种图像质量检测装置。图4示出了根据本申请一个实施例的图像质量检测装置400的示意性框图。
如图4所示,根据本申请实施例的图像质量检测装置400包括获取模块410、输入模块420、识别模块430和确定模块440。各个模块可分别执行上文中图2描述的图像质量检测方法的各个步骤。以下仅对该图像质量检测装置400的各部件的主要功能进行描述,而省略以上已经描述过的细节内容。
获取模块410用于获取目标图像。获取模块410可以由图1所示的电子设备中的处理器102运行存储装置104中存储的程序指令来实现。
输入模块420用于将目标图像输入图像分割网络,获得图像分割网络输出的质量检测结果,质量检测结果包括目标图像中每个像素的像素质量信息。输入模块420可以由图1所示的电子设备中的处理器102运行存储装置104中存储的程序指令来实现。
识别模块430用于从目标图像中识别至少一个目标区域所在的位置,获得区域位置信息。识别模块430可以由图1所示的电子设备中的处理器102运行存储装置104中存储的程序指令来实现。
确定模块440用于基于质量检测结果以及区域位置信息,确定至少一个目标区域各自的区域质量信息。确定模块440可以由图1所示的电子设备中的处理器102运行存储装置104中存储的程序指令来实现。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
图5示出了根据本申请一个实施例的电子设备500的示意性框图。电子设备500包括存储器510和处理器520。
存储器510存储用于实现根据本申请实施例的图像质量检测方法中的相应步骤的计算机程序指令。
处理器520用于运行存储器510中存储的计算机程序指令,以执行根据本申请实施例的图像质量检测方法的相应步骤。
在一个实施例中,计算机程序指令被处理器520运行时用于执行以下步骤:获取目标图像;将目标图像输入图像分割网络,获得图像分割网络输出的质量检测结果,质量检测结果包括目标图像中每个像素的像素质量信息;从目标图像中识别至少一个目标区域所在的位置,获得区域位置信息;基于质量检测结果以及区域位置信息,确定至少一个目标区域各自的区域质量信息。
示例性地,电子设备500还可以包括图像采集装置530。图像采集装置530用于采集目标图像。图像采集装置530是可选的,电子设备500可以不包括图像采集装置530。在这种情况下,可以利用其他图像采集装置采集目标图像,并将采集的目标图像发送给电子设备500。
此外,根据本申请实施例,还提供了一种存储介质,在存储介质上存储了程序指令,在程序指令被计算机或处理器运行时用于执行本申请实施例的图像质量检测方法的相应步骤,并且用于实现根据本申请实施例的图像质量检测装置中的相应模块。存储介质例如可以包括智能电话的存储卡、平板电脑的存储部件、个人计算机的硬盘、只读存储器(ROM)、可擦除可编程只读存储器(EPROM)、便携式紧致盘只读存储器(CD-ROM)、USB存储器、或者上述存储介质的任意组合。
在一个实施例中,程序指令在被计算机或处理器运行时可以使得计算机或处理器实现根据本申请实施例的图像质量检测装置的各个功能模块,并和/或者可以执行根据本申请实施例的图像质量检测方法。
在一个实施例中,程序指令在运行时用于执行以下步骤:获取目标图像;将目标图像输入图像分割网络,获得图像分割网络输出的质量检测结果,质量检测结果包括目标图像中每个像素的像素质量信息;从目标图像中识别至少一个目标区域所在的位置,获得区域位置信息;基于质量检测结果以及区域位置信息,确定至少一个目标区域各自的区域质量信息。
此外,根据本申请实施例,还提供了一种计算机程序产品,计算机程序产品包括计算机程序,计算机程序在运行时用于执行上述图像质量检测方法200。
根据本申请实施例的电子设备中的各模块可以通过根据本申请实施例的实施图像质量检测的电子设备的处理器运行在存储器中存储的计算机程序指令来实现,或者可以在根据本申请实施例的计算机程序产品的计算机可读存储介质中存储的计算机指令被计算机运行时实现。
此外,根据本申请实施例,还提供了一种计算机程序,该计算机程序在运行时用于执行上述图像质量检测方法200。
尽管这里已经参考附图描述了示例实施例,应理解上述示例实施例仅仅是示例性的,并且不意图将本申请的范围限制于此。本领域普通技术人员可以在其中进行各种改变和修改,而不偏离本申请的范围和精神。所有这些改变和修改意在被包括在所附权利要求所要求的本申请的范围之内。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
在本申请所提供的几个实施例中,应该理解到,所揭露的设备和方法,可以通过其它的方式实现。例如,以上所描述的设备实施例仅仅是示意性的,例如,单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个设备,或一些特征可以忽略,或不执行。
在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本申请的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
类似地,应当理解,为了精简本申请并帮助理解各个申请方面中的一个或多个,在对本申请的示例性实施例的描述中,本申请的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该本申请的方法解释成反映如下意图:即所要求保护的本申请要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如相应的权利要求书所反映的那样,其发明点在于可以用少于某个公开的单个实施例的所有特征的特征来解决相应的技术问题。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本申请的单独实施例。
本领域的技术人员可以理解,除了特征之间相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
此外,本领域的技术人员能够理解,尽管在此的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本申请的范围之内并且形成不同的实施例。例如,在权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。
本申请的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本申请实施例的图像质量检测装置中的一些模块的一些或者全部功能。本申请还可以实现为用于执行这里所描述的方法的一部分或者全部的装置程序(例如,计算机程序和计算机程序产品)。这样的实现本申请的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。
应该注意的是上述实施例对本申请进行说明而不是对本申请进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本申请可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。
以上,仅为本申请的具体实施方式或对具体实施方式的说明,本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请的保护范围之内。本申请的保护范围应以权利要求的保护范围为准。
Claims (14)
1.一种图像质量检测方法,包括:
获取目标图像;
将所述目标图像输入图像分割网络,获得所述图像分割网络输出的质量检测结果,所述质量检测结果包括所述目标图像中每个像素的像素质量信息;
从所述目标图像中识别至少一个目标区域所在的位置,获得区域位置信息;
基于所述质量检测结果以及所述区域位置信息,确定所述至少一个目标区域各自的区域质量信息。
2.如权利要求1所述的方法,其中,所述像素质量信息包括与至少一种质量类别一一对应的质量得分,所述至少一种质量类别包括用于表示质量正常的第一质量类别和/或用于表示质量异常的第二质量类别,
所述基于所述质量检测结果以及所述区域位置信息,确定所述至少一个目标区域各自的区域质量信息包括:
对于所述至少一个目标区域中的任一目标区域,
按照与所述第一质量类别相对应的质量得分从低到高的顺序从该目标区域包含的所有像素点中筛选第一数目或第一比例的像素点,或者按照与所述第二质量类别相对应的质量得分从高到低的顺序从该目标区域包含的所有像素点中筛选第二数目或第二比例的像素点;
对于所述至少一种质量类别中的每一种,对筛选出的像素点的对应质量得分求平均,获得与该质量类别相对应的平均得分,所述对应质量得分是与该质量类别相对应的质量得分;
基于与所述至少一种质量类别一一对应的平均得分,确定该目标区域的区域质量信息,其中,所述区域质量信息包括以下一项或多项:目标区域所属的质量类别;与目标区域所属的质量类别一一对应的质量得分;目标区域的质量得分。
3.如权利要求2所述的方法,其中,所述区域质量信息包括目标区域所属的质量类别,所述基于与所述至少一种质量类别一一对应的平均得分,确定该目标区域的区域质量信息包括:
按照平均得分从高到低的顺序从所述至少一种质量类别中选择第三数目的质量类别作为该目标区域所属的质量类别;或者,
从所述至少一种质量类别中选择平均得分高于对应的质量阈值的质量类别作为该目标区域所属的质量类别,其中,所述至少一种质量类别各自具有对应的质量阈值。
4.如权利要求2或3所述的方法,其中,所述第一质量类别包括正常类别,所述第二质量类别包括模糊类别、暗影类别、遮挡类别、高光类别中的一种或多种。
5.如权利要求1至4任一项所述的方法,其中,在所述基于所述质量检测结果以及所述区域位置信息,确定所述至少一个目标区域各自的区域质量信息之后,所述方法还包括:
基于所述至少一个目标区域的区域质量信息,确定所述目标图像的图像质量信息。
6.如权利要求5所述的方法,其中,所述区域质量信息包括目标区域所属的质量类别,所述图像质量信息包括所述目标图像所属的质量类别,
所述基于所述至少一个目标区域的区域质量信息,确定所述目标图像的图像质量信息包括:
将所述至少一个目标区域所属的质量类别的众数确定为所述目标图像所属的质量类别;或者,
将所述至少一个目标区域所属的所有质量类别确定为所述目标图像所属的质量类别。
7.如权利要求5所述的方法,其中,所述区域质量信息包括与第一质量类别相对应的质量得分,所述第一质量类别用于表示质量正常,所述图像质量信息包括所述目标图像的质量得分,
所述基于所述至少一个目标区域的区域质量信息,确定所述目标图像的图像质量信息包括:
将所述至少一个目标区域各自的与所述第一质量类别相对应的质量得分中的最低质量得分确定为所述目标图像的质量得分。
8.如权利要求1至7任一项所述的方法,其中,所述图像分割网络是通过如下过程训练得到的:
获取初始图像;
对所述初始图像执行以下一种或多种操作以生成样本图像:
在所述初始图像上叠加背景信息;
对所述初始图像进行缩放和/或旋转;
对所述初始图像进行模糊处理;
调整所述初始图像的明暗度以在所述初始图像上形成暗影;
在所述初始图像上添加遮挡对象;
在所述初始图像上添加高光;
获取标注数据,所述标注数据用于指示所述样本图像中每个像素的像素质量信息;
基于所述样本图像和所述标注数据对所述图像分割网络进行训练。
9.如权利要求8所述的方法,其中,所述初始图像是证件图像,所述获取初始图像包括:
获取真实证件图像;
从所述真实证件图像上删除每个字段区域内的真实个人信息以及头像区域的人脸,获得模板证件图像;
根据每个字段区域内的字符组织规则,生成与每个字段区域相对应的合成个人信息;
将所述合成个人信息填充到所述模板证件图像的对应字段区域内;
获取待合成人脸图像;
将所述待合成人脸图像叠加到所述模板证件图像的头像区域,获得所述初始图像。
10.如权利要求9所述的方法,其中,所述获取待合成人脸图像包括:
获取初始人脸图像;
将所述初始人脸图像转换为灰度图像;
基于所述灰度图像确定灰度值高于灰度阈值的区域,以确定背景区域;
在所述初始人脸图像中将所述背景区域的不透明度设置为低于不透明度阈值,获得所述待合成人脸图像。
11.如权利要求1至10任一项所述的方法,其中,所述图像分割网络包括细节特征提取分支、语义特征提取分支和后续网络模块,
所述将所述目标图像输入图像分割网络,获得所述图像分割网络输出的质量检测结果包括:
将所述目标图像或所述目标图像的初始特征分别输入所述细节特征提取分支和所述语义特征提取分支;
在所述细节特征提取分支中执行不多于两次的下采样,获得第一特征;
在所述语义特征提取分支中执行比所述细节特征提取分支多且不多于四次的下采样,获得第二特征;
将所述第一特征和所述第二特征输入所述后续网络模块,获得所述质量检测结果。
12.一种电子设备,包括处理器和存储器,其特征在于,所述存储器中存储有计算机程序指令,所述计算机程序指令被所述处理器运行时用于执行如权利要求1至11任一项所述的图像质量检测方法。
13.一种存储介质,在所述存储介质上存储了程序指令,其特征在于,所述程序指令在运行时用于执行如权利要求1至11任一项所述的图像质量检测方法。
14.一种计算机程序产品,所述计算机程序产品包括计算机程序,其特征在于,所述计算机程序在运行时用于执行如权利要求1至11任一项所述的图像质量检测方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210997763.2A CN115829915A (zh) | 2022-08-19 | 2022-08-19 | 图像质量检测方法、电子设备、存储介质及程序产品 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210997763.2A CN115829915A (zh) | 2022-08-19 | 2022-08-19 | 图像质量检测方法、电子设备、存储介质及程序产品 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115829915A true CN115829915A (zh) | 2023-03-21 |
Family
ID=85523134
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210997763.2A Pending CN115829915A (zh) | 2022-08-19 | 2022-08-19 | 图像质量检测方法、电子设备、存储介质及程序产品 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115829915A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116152233A (zh) * | 2023-04-17 | 2023-05-23 | 北京邮电大学 | 图像处理方法、智能终端及存储介质 |
CN116342449A (zh) * | 2023-03-29 | 2023-06-27 | 银河航天(北京)网络技术有限公司 | 图像增强方法、装置以及存储介质 |
-
2022
- 2022-08-19 CN CN202210997763.2A patent/CN115829915A/zh active Pending
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116342449A (zh) * | 2023-03-29 | 2023-06-27 | 银河航天(北京)网络技术有限公司 | 图像增强方法、装置以及存储介质 |
CN116342449B (zh) * | 2023-03-29 | 2024-01-16 | 银河航天(北京)网络技术有限公司 | 图像增强方法、装置以及存储介质 |
CN116152233A (zh) * | 2023-04-17 | 2023-05-23 | 北京邮电大学 | 图像处理方法、智能终端及存储介质 |
CN116152233B (zh) * | 2023-04-17 | 2023-09-26 | 北京邮电大学 | 图像处理方法、智能终端及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10943145B2 (en) | Image processing methods and apparatus, and electronic devices | |
CN108875522B (zh) | 人脸聚类方法、装置和系统及存储介质 | |
CN109815843B (zh) | 图像处理方法及相关产品 | |
CN106447721B (zh) | 图像阴影检测方法和装置 | |
US9104914B1 (en) | Object detection with false positive filtering | |
CN108875540B (zh) | 图像处理方法、装置和系统及存储介质 | |
CN108875537B (zh) | 对象检测方法、装置和系统及存储介质 | |
CN115829915A (zh) | 图像质量检测方法、电子设备、存储介质及程序产品 | |
CN110163188B (zh) | 视频处理以及在视频中嵌入目标对象的方法、装置和设备 | |
CN105917354A (zh) | 用于图像处理的空间金字塔池化网络 | |
CN106650743B (zh) | 图像强反光检测方法和装置 | |
CN111626163B (zh) | 一种人脸活体检测方法、装置及计算机设备 | |
CN111008935B (zh) | 一种人脸图像增强方法、装置、系统及存储介质 | |
CN109977832B (zh) | 一种图像处理方法、装置及存储介质 | |
CN109740539B (zh) | 基于超限学习机和融合卷积网络的3d物体识别方法 | |
CN110807362A (zh) | 一种图像检测方法、装置和计算机可读存储介质 | |
CN114067431A (zh) | 图像处理方法、装置、计算机设备和存储介质 | |
CN111539351A (zh) | 一种多任务级联的人脸选帧比对方法 | |
CN113297956A (zh) | 一种基于视觉的手势识别方法及系统 | |
CN114708173A (zh) | 图像融合方法、计算机程序产品、存储介质及电子设备 | |
Qian et al. | LS3D: Single-view gestalt 3D surface reconstruction from Manhattan line segments | |
CN112927127A (zh) | 一种运行在边缘设备上的视频隐私数据模糊化方法 | |
CN116309050A (zh) | 图像超分辨率方法、程序产品、存储介质及电子设备 | |
Leberl et al. | Recognizing cars in aerial imagery to improve orthophotos | |
CN113792671A (zh) | 人脸合成图像的检测方法、装置、电子设备及介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |