WO2023246193A1

WO2023246193A1 - 一种图像清晰度确定方法、装置、设备及存储介质

Info

Publication number: WO2023246193A1
Application number: PCT/CN2023/081657
Authority: WO
Inventors: 谷爱国
Original assignee: 北京京东振世信息技术有限公司
Priority date: 2022-06-24
Filing date: 2023-03-15
Publication date: 2023-12-28
Also published as: CN117333421A

Abstract

本申请实施例公开了一种图像清晰度确定方法、装置、设备及存储介质。该方法包括：获取包含目标字符的目标图像，并从目标图像中提取出目标字符所在的字符区域，将字符区域划分为至少两个字符子区域；针对于每个字符子区域，确定字符子区域内目标字符的识别准确度，并根据识别准确度确定字符子区域的区域清晰度；根据至少两个字符子区域的区域清晰度确定目标图像的图像清晰度。

Description

一种图像清晰度确定方法、装置、设备及存储介质

本申请要求在2022年6月24日提交中国专利局、申请号为202210729982.2的中国专利申请的优先权，该申请的全部内容通过引用结合在本申请中。

技术领域

本申请实施例涉及图像处理技术领域，例如涉及一种图像清晰度确定方法、装置、设备及存储介质。

背景技术

在物流领域中，快递员需要对物流签单进行拍摄，然后将拍摄得到的签单图像上传到物流系统中以进行后续的相关操作。

为了保证后续操作的有效性，物流系统可以先确定签单图像的图像清晰度，然后再对图像清晰度较高的签单图像执行后续操作。目前，主要是通过对签单图像进行二分类或计算签单图像中像素点的梯度来确定图像清晰度。

在实现本申请的过程中，发明人发现相关技术中存在以下技术问题：图像清晰度的确定精度不高。

发明内容

本申请实施例提供了一种图像清晰度确定方法、装置、设备及存储介质，解决了图像清晰度的确定精度不高的问题。

根据本申请的一方面，提供了一种图像清晰度确定方法，可以包括：

获取包含目标字符的目标图像，从目标图像中提取出目标字符所在的字符区域，并将字符区域划分为至少两个字符子区域；

针对于每个字符子区域，确定字符子区域内目标字符的识别准确度，根据识别准确度确定字符子区域的区域清晰度；

根据所述至少两个字符子区域的区域清晰度确定目标图像的图像清晰度。

根据本申请的另一方面，提供了一种图像清晰度确定装置，可以包括：

字符区域划分模块，设置为获取包含目标字符的目标图像，并从目标图像中提取出目标字符所在的字符区域，将字符区域划分为至少两个字符子区域；

区域清晰度确定模块，设置为针对于每个字符子区域，确定字符子区域内的目标字符的识别准确度，并根据识别准确度确定字符子区域的区域清晰度；

图像清晰度确定模块，设置为根据所述至少两个字符子区域的区域清晰度确定目标图像的图像清晰度。

根据本申请的另一方面，提供了一种电子设备，可以包括：

至少一个处理器；以及

与至少一个处理器通信连接的存储器；其中，

存储器存储有可被至少一个处理器执行的计算机程序，计算机程序被至少一个处理器执行，以使至少一个处理器执行时实现本申请任意实施例所提供的图像清晰度确定方法。

根据本申请的另一方面，提供了一种计算机可读存储介质，其上存储有计算机指令，该计算机指令用于使处理器执行时实现本申请任意实施例所提供的图像清晰度确定方法。

附图说明

图1是根据本申请实施例提供的一种图像清晰度确定方法的流程图；

图2a是根据本申请实施例提供的一种图像清晰度确定方法中的签单图像的示意图；

图2b是根据本申请实施例提供的一种图像清晰度确定方法中从签单图像中提取出的签单区域的示意图；

图2c是根据本申请实施例提供的一种图像清晰度确定方法中从签单区域中提取出的字符区域的示意图；

图2d是根据本申请实施例提供的一种图像清晰度确定方法中的在图2c的基础上给出的字符区域的划分结果的示意图；

图3是根据本申请实施例提供的另一种图像清晰度确定方法的流程图；

图4是根据本申请实施例提供的再一种图像清晰度确定方法的流程图；

图5是根据本申请实施例提供的再一种图像清晰度确定方法中的可选示例的流程图；

图6是根据本申请实施例提供的一种图像清晰度确定装置的结构框图；

图7是实现本申请实施例的图像清晰度确定方法的电子设备的结构示意图。

具体实施方式

为了使本技术领域的人员更好地理解本申请方案，下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述。

需要说明的是，本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施。“目标”、“原始”等的情况类似，在此不再赘述。此外，术语“包括”和“具有”以及他们的任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

在介绍本申请实施例之前，先对背景技术中阐述的图像清晰度的确定精度较低的具体原因进行分析，以便结合后文可以更好地理解本申请实施例提出的图像清晰度确定方案具有更高的确定精度的原因所在。继续以签单图像为例，上述两种方案得到的图像清晰度是一种全局清晰度，其无法准确捕获签单图像内的各个局部区域是否清晰，更是无法准确捕获该局部区域内的签单字符(即物流签单上的字符)是否清晰，而签单字符是否清晰正是图像清晰度最主要的关注点，因此这就有可能出现全局清晰而某些局部区域模糊和/或某些签单字符模糊的情况，从而导致图像清晰度的确定精度较低。

图1是本申请实施例中提供的一种图像清晰度确定方法的流程图。本实施例可适用于确定图像清晰度的情况，尤其适用于通过目标图像上多个字符子区域的区域清晰度共同确定图像清晰度的情况。该方法可以由本申请实施例提供的图像清晰度确定装置来执行，该装置可以由软件和/或硬件的方式实现，该装置可以集成在电子设备上，该电子设备可以是各种用户终端或是服务器。

参见图1，本申请实施例的方法包括如下步骤：

S110、获取包含目标字符的目标图像，从目标图像中提取出目标字符所在的字符区域，并将字符区域划分为至少两个字符子区域。

其中，目标图像可以是对目标对象进行拍摄后得到的包含有目标对象上的目标字符的图像，该目标字符可以是目标对象上的对象字符，例如可以是文字、标点符号、图像符号以及数字等，在此未做限定。

图像清晰度可以通过目标图像内的各目标字符是否清晰来确定，因为当各目标字符都较为清晰时，目标图像也自然较为清晰。为此，可以先从目标图像中提取出目标字符所在的字符区域，从而通过聚焦于字符区域的区域清晰度来确定图像清晰度，以避免那些非字符区域对于图像清晰度的干扰。需要说明的，当目标字符的字符数量是至少两个时，上述字符区域可以理解为包含全部目标字符的区域。在实际应用中，可选的，由于对目标对象进行拍摄后得到的目标图像可能包含除目标对象之外的对象，因此为了保证字符区域提取的精准度，可以先从目标图像中提取出目标对象所在的对象区域，如通过某目标检测算法检测出对象区域，然后再从该对象区域中提取出字符区域。示例性的，继续以签单图像为例，参见图2a-图2c，它们分别表示签单图像、基于yolov3从签单图像上检测出的签单区域、以及在签单区域上提取出的字符区域。当通过I表示签单图像时，签单区域可以通过I(x1,y1,x2,y2)进行表示，即I(x1,y1,x2,y2)＝yolov3(I)，其中x1,y1,x2,y2分别表示签单区域的左上顶点的横坐标、左上顶点的纵坐标、右下顶点的横坐标及右下顶点的纵坐标。需要说明的是，上述坐标均是以I的左上顶点为原点、横轴是指向右方的水平轴及纵轴是指向下方的垂直轴为例得到的。这一说明也适用于下述有关于坐标的举例。

在此基础上，如果直接通过字符区域的区域清晰度来确定目标图像的图像清晰度，这依然存在图像清晰度的确定精度不高的问题，其在字符区域在整张目标图像中占比较大的情况下尤为明显，这是因为字符区域中某局部子区域的模糊很难影响到整个字符区域的区域清晰度。因此，为了提高图像清晰度的确定精度，可以将字符区域划分为至少两个字符子区域，以便与后续步骤相配合，通过各字符子区域的区域清晰度来确定图像清晰度。示例性的，继续以上述示例为例，假设从签单区域I(x1,y1,x2,y2)中提取出的字符区域通过I(xmin,ymin,xmax,ymax)进行表示，其中，xmin,ymin,xmax,ymax分别表示字符区域的左上顶点的横坐标、左上顶点的纵坐标、右下顶点的横坐标及右下顶点的纵坐标。现将I(xmin,ymin,xmax,ymax)划分为成N×N的字符子区域，以N＝3为例，参见图2d，其中的每个网格分别表示一个字符子区域。

S120、针对于每个字符子区域，确定字符子区域内目标字符的识别准确度，并根据识别准确度确定字符子区域的区域清晰度。

其中，分别对每个字符子区域执行下述步骤：对字符子区域内的目标字符进行识别，即确定该目标字符是什么字符，从而得到该目标字符的识别准确度。在实际应用中，可选的，该识别准确度可以通过识别置信度/识别概率进行表示或确定，这是因为识别置信度/识别概率可以直接反映出目标字符识别的准确性，这是从字符颗粒度上提高了识别准确度的确定精度。常理来看，由于目标字符越清晰则越易被识别，其的识别准确度也相应越高，因此可以通过识别准确度确定该字符子区域的区域清晰度。需要说明的是，某字符子区域内的目标字符的字符数量可能是一个、两个或多个，当其内存在至少两个目标字符时，可以分别确定每个目标字符的识别准确度，然后根据各识别准确度确定区域准确度。

示例性的，继续以上述示例为例，假设通过表示第i,j个字符子区域(即第i行第j列的字符子区域)，其中分别表示该字符子区域内的多个签单字符(即目标字符)的左上顶点的横坐标的集合、左上顶点的纵坐标的集合、右下顶点的横坐标的集合以及右下顶点的纵坐标的集合。将卷积循环神经网络(Convolutional Recurrent Neural Network，CRNN)作为字符识别模型，作用于上，得到多个签单字符的识别准确度的集合M_i,j，即然后计算M_i,j的均值AVG_i,j，即AVG_i,j＝mean(M_i,j)，并将由此得到的AVG_i,j作为该字符子区域的区域清晰度。

S130、根据所述至少两个字符子区域的区域清晰度确定目标图像的图像清晰度。

其中，通过每个区域清晰度确定目标图像的图像清晰度，在实际应用中，可选的，该图像清晰度可以通过数值进行定量表示，或是通过清晰和模糊这两个类别进行定性表示，在此未做限定。示例性的，以定性表示为例，可以在每个区域清晰度均大于预设清晰度阈值、或是与大于预设清晰度阈值的区域清晰度对应的字符子区域的区域数量超过预设数量阈值时，认为目标图像清晰，否则认为其模糊。

本申请实施例的技术方案，通过获取包含目标字符的目标图像，并从目标图像中提取出目标字符所在的字符区域，以避免非字符区域对于图像清晰度的确定过程造成干扰，进而将字符区域划分为至少两个字符子区域，以通过分别处理至少两个字符子区域来保证图像清晰度的确定精准度；针对于每个字符子区域，确定字符子区域内目标字符的识别准确度，并根据识别准确度确定字符子区域的区域清晰度，该区域清晰度可以直接反映出其中的目标字符是清晰还是模糊；在得到每个字符子区域的区域清晰度后，可以根据至少两个字符子区域的区域清晰度确定目标图像的图像清晰度。上述技术方案，通过每个字符子区域内目标字符的识别准确度确定出的区域清晰度确定图像清晰度，可以准确反映出目标图像内的每个字符子区域(即局部区域)是否清晰，更是可以准确反映出每个字符子区域内的目标字符是否清晰，由此可以避免出现全局清晰但是某些字符子区域和/或某些字符子区域内的某些目标字符模糊的情况，从而保证了图像清晰度的确定精度。

一种可选的技术方案，在针对于每个字符子区域后，上述图像清晰度确定方法，还可以包括：对字符子区域进行分类，其中，分类类别包括第一类别和第二类别，与第一类别对应的类别清晰度大于与第二类别对应的类别清晰度；得到字符子区域属于第一类别或是第二类别的分类概率；则根据识别准确度确定字符子区域的区域清晰度，可以包括：根据识别准确度和分类概率确定字符子区域的区域清晰度。

其中，根据识别准确度确定出的区域清晰度可以理解为一种局部清晰度，而且考虑到很多字符处理算法如字符定位算法和字符识别算法等，它们更多是用于处理文字、标点符号和数字等字符，对于图像符号的处理能力较为一般，这意味着字符子区域内图像符号的不清晰可能难以体现在根据识别准确度确定出的区域清晰度上。因此，为了提高区域清晰度的确定精度，可以通过融合全局确定方案和局部确定方案的方式实现。示例性的，将字符子区域分类为第一类别或是第二类别，其中，与第一类别对应的类别清晰度大于第二类别，这意味着第一类别可以理解为清晰类别，第二类别可以理解为模糊类别。在对字符子区域进行分类后，可以得到其属于第一类别或是第二类别的分类概率，然后根据该分类概率确定该字符子区域在整体上是否清晰，从而可将图像符号的清晰与否体现出来。需要强调的是，整体上清晰并不意味着其内的每个目标字符均清晰，因此可以将分类概率和识别准确度相结合，由此从多个角度共同确定区域清晰度，保证了区域清晰度的确定精度。

示例性的，继续以上述示例为例，将resnet18作为分类网络，对至少两个字符子区域进行分类，即P(x)＝resnet18(x)，其中，x＝I(xmin,ymin,xmax,ymax)；P(x)是一张大小为N×N的分类概率图，表示经过分类网络后，输出为清晰类别的概率，概率越大则表示越清晰；通过P_i,j表示第i,j个字符子区域的分类概率。在此基础上，对于第i,j个字符子区域，通过如下式子表示其的区域清晰度H_i,j(x)：H_i,j(x)＝P_i,j+AVG_i,j。假设H_i,j(x)大于预设清晰度阈值thr时，认为该第i,j个字符子区域清晰，并且在所有字符子区域均清晰时，认为签单图像清晰，即h(x)＝1,if H_i,j(x)＞thr,i,j＝1,2,…,N，其中h(x)＝1表示签单图像清晰。

图3是本申请实施例中提供的另一种图像清晰度确定方法的流程图。本实施例以上述各技术方案为基础进行细化。本实施例中，可选的，从目标图像中提取出目标字符所在的字符区域，可包括：确定目标字符在目标图像中的字符位置信息；根据字符位置信息，确定目标图像中与目标字符对应的字符区域在目标图像中的区域位置信息；根据区域位置信息从目标图像中提取出字符区域。其中，与上述各实施例相同或相应的术语的解释在此不再赘述。

参见图3，本实施例的方法可以包括如下步骤：

S210、获取包含目标字符的目标图像。

S220、确定目标字符在目标图像中的字符位置信息，并根据字符位置信息，确定目标图像中与目标字符对应的字符区域在目标图像中的区域位置信息。

其中，字符位置信息可以是目标字符在目标图像中的位置信息，实际应用中，可选的，其可以通过相对位置信息(例如在目标图像的左上1/3处等)和坐标信息等进行表示，在此未做限定。在得到字符位置信息后，可以根据其直接确定字符区域在目标图像中的区域位置信息。

示例性的，继续以上述示例为例，采用字符检测算法定位出签单图像中的各签单字符，由此得到它们各自的字符位置信息。这里将可微分的二值化网络(Differentiable Binarization Net，DBNet)作为字符检测算法，在签单区域I(x1,y1,x2,y2)中检测出各签单字符的字符位置信息，即X1,Y1,X2,Y2＝DBNet(I(x1,y1,x2,y2))，其中分别表示各签单字符的左上顶点的横坐标的集合、左上顶点的纵坐标的集合、右下顶点的横坐标的集合以及右下顶点的纵坐标的集合，n表示在该签单图像中存在n个签单字符。

S230、根据区域位置信息从目标图像中提取出字符区域，并将字符区域划分为至少两个字符子区域。

其中，由于区域位置信息可以表示出字符区域位于目标图像中的哪个位置，因此根据该区域位置信息可以从目标图像中准确提取出字符区域。

S240、针对于每个字符子区域，确定字符子区域内目标字符的识别准确度，并根据识别准确度确定字符子区域的区域清晰度。

S250、根据所述至少两个字符子区域的区域清晰度确定目标图像的图像清晰度。

本申请实施例中的技术方案，通过确定出的目标字符在目标图像中的字符位置信息，可以得到字符区域在目标图像中的区域位置信息，从而可以根据该区域位置信息从目标图像中提取出字符区域，由此保证了字符区域的有效提取。

在此基础上，一种可选的技术方案，目标字符的字符数量包括至少两个，根据字符位置信息，确定目标图像中与目标字符对应的字符区域在目标图像中的区域位置信息，可包括：根据所有目标字符的字符位置信息确定包含全部目标字符的最小外接矩形框的框位置信息，并将框位置信息作为目标图像中与目标字符对应的字符区域在目标图像中的区域位置信息。其中，为了保证提取得到的字符区域可以涵盖住全部目标字符，而且不会涵盖住除目标字符之外的其余对象(这是为了避免其余对象对图像清晰度的确定过程造成干扰)，可以根据字符位置信息确定包含全部目标字符的最小外接矩形框的框位置信息，然后将该框位置信息作为区域位置信息，从而保证了提取出的字符区域满足上述要求。示例性的，继续以上述示例为例，上述最小外接矩形框可以通过I(xmin,ymin,xmax,ymax)进行表示，其中，xmin＝min(X1)，ymin＝min(Y1)，xmax＝max(X2)，ymax＝max(Y2)，即xmin,ymin,xmax,ymax分别表示最小外接矩形框的左上顶点的横坐标、左上顶点的纵坐标、右下顶点的横坐标以及右下顶点的纵坐标，将这些坐标作为框位置信息，即区域位置信息。

另一种可选的技术方案，上述图像清晰度确定方法，还可包括：根据区域位置信息以及字符子区域的区域数量，分别确定所述至少两个字符子区域在目标图像中的子区域位置信息；针对于每个目标字符，根据目标字符的字符位置信息以及所述至少两个字符子区域在所述目标图像中的子区域位置信息，确定目标字符所在的字符子区域。其中，根据区域位置信息和区域数量，可以分别确定每个字符子区域在目标图像中的子区域位置信息，即针对于任一字符子区域，可以根据整个字符区域的区域位置信息以及该字符子区域在所有字符子区域中的相对位置，得到其的子区域位置信息。进而，对于某个目标字符而言，可以根据其的字符位置信息和各子区域位置信息间的相对关系确定该目标字符所在的字符子区域，如将与包含该字符位置信息的子区域位置信息对应的字符子区域，作为该目标字符所在的字符子区域。

示例性的，继续以上述示例为例，假设字符子区域数量是N²(即N*N)，则第i,j个字符子区域的子区域位置信息可以表示为以及这四个式子分别表示该字符子区域的左上顶点的横坐标、左上顶点的纵坐标、右下顶点的横坐标及右下顶点的纵坐标。在此基础上，当第k个签单字符的字符位置信息满足如下式子时，则认为该签单字符位于该字符子区域内：

其中，是S220的示例中给出的各签单字符的坐标集合，在此不再赘述。这里可以通过表示该字符子区域内各签单字符的坐标集合。

图4是本申请实施例中提供的再一种图像清晰度确定方法的流程图。本实施例以上述各技术方案为基础进行细化。在本实施例中，可选的，目标图像是对目标对象进行拍摄后得到的图像，目标对象包含对象字符，上述清晰度确定方法，还可以包括：根据字符区域在目标图像中的区域位置信息，判断被拍摄到目标图像中的目标字符是否涵盖全部对象字符；根据判断结果确定字符区域的完整性。其中，与上述各实施例相同或相应的术语的解释在此不再赘述。

参见图4，本实施例的方法可以包括如下步骤：

S310、获取包含目标字符的目标图像，其中，目标图像是对目标对象进行拍摄后得到的图像，目标对象包含对象字符。

其中，由于目标图像是对包含对象字符的目标对象进行拍摄后得到的图像，而且拍摄到的目标对象中包含目标符号，这说明目标字符属于对象符号。但是，目标图像中是否包含全部的对象符号，即目标符号是否涵盖住全部的对象符号，这是待确定的，因为有可能因拍摄角度的偏差而导致未拍摄到全部的对象符号。示例性的，继续以上述示例为例，目标对象可以理解为物流签单，而对象符号可以理解为物流签单中的全部符号，图2c给出了签单图像中的签单符号包含了全部对象符号的示例。

S320、确定目标图像中的与目标字符对应的字符区域在目标图像中的区域位置信息，并根据区域位置信息判断被拍摄到目标图像中的目标字符是否涵盖全部对象字符，根据判断结果确定字符区域的完整性。

其中，由于区域位置信息可以表示出涵盖住全部目标字符的字符区域位于目标图像中的哪个位置，因此可以根据该区域位置信息判断目标图像中的这些目标字符是否涵盖住全部对象字符，如根据该区域位置信息确定出的字符区域与目标图像间的相对位置关系来判断、根据该相对位置关系再结合目标对象与全部对象字符间的相对位置关系来判断等，在此未做限定。示例性的，可以根据判断结果确定字符区域的完整性，即当目标字符涵盖住全部对象字符时，则认为拍摄到的字符区域是完整的，否则认为不完整。在实际应用中，可选的，由于字符区域是目标图像中的关键区域，因此也可以通过字符区域的完整性来得到目标图像的完整性，如字符区域完整则目标图像完整，反之则不完整。

S330、根据区域位置信息从目标图像中提取出字符区域，并将字符区域划分为至少两个字符子区域。

S340、针对于每个字符子区域，确定字符子区域内目标字符的识别准确度，并根据识别准确度确定字符子区域的区域清晰度。

S350、根据所述至少两个字符子区域的区域清晰度确定目标图像的图像清晰度。

本申请实施例的技术方案，通过字符区域在目标图像中的区域位置信息来判断被拍摄到目标图像中的这些目标字符是否涵盖住全部对象字符，从而可以根据判断结果确定字符区域的完整性(即确定目标图像的完整性)，这与图像清晰度的确定过程相配合，由此达到了准确确定目标图像的拍摄质量的效果。

在此基础上，一种可选的技术方案，区域位置信息通过字符区域上的区域顶点的顶点坐标进行表示；根据字符区域在目标图像中的区域位置信息，判断被拍摄到目标图像中的目标字符是否涵盖全部对象字符，可以包括：获取预先设置的第一临界值，且确定目标图像的尺寸值，根据第一临界值和尺寸值确定第二临界值；根据顶点坐标与第一临界值和/或第二临界值间的数值关系，判断被拍摄到目标图像中的目标字符是否涵盖全部对象字符。

其中，第一临界值可以是预先设置的用于表示与目标图像中的某条边界间的相距距离的数值，第二临界值可以是根据第一临界值和尺寸值确定出的用于表示与目标图像中的另一条边界间的相距距离的数值，该另一条边界与上述的该条边界可以是相互平行的两条边界。示例性的，假设尺寸值包括宽(W)和高(H)，第一临界值是T，那么第二临界值可以包括W-T和H-T。可以根据顶点坐标与第一临界值和/或第二临界值间的数值关系，判断目标字符是否涵盖全部对象字符。示例性的，继续以上述示例为例，假设字符区域上的区域顶点的顶点坐标(即字符区域的左上顶点的横坐标、左上顶点的纵坐标、右下顶点的横坐标及右下顶点的纵坐标)通过xmin、ymin、xmax以及ymax进行表示，那么当顶点坐标满足xmin＜T(这说明字符区域非常靠近目标图像的左边界)、ymin＜T(这说明字符区域非常靠近目标图像的上边界)、xmax＞W-T(这说明字符区域非常靠近目标图像的右边界)及ymax＞H-T(这说明字符区域非常靠近目标图像的下边界)中的至少一个不等式时(此时的字符区域非常靠近目标图像的至少一条边界)，则认为目标字符未涵盖住全部对象字符，否则认为涵盖住全部对象字符。

另一种可选的技术方案，将字符区域划分为至少两个字符子区域，可包括：如果字符区域完整，则将字符区域划分为至少两个字符子区域。其中，由于在字符区域不完整(即目标图像不完整)时，确定图像清晰度的意义是有限的，因为即使图像清晰度较高，不完整的目标图像依然是无法应用的。因此，可以先确定字符区域是否完整，并在完整的情况下，再执行将字符区域划分为至少两个字符子区域的步骤来实现图像清晰度的确定。在此基础上，可选的，上述图像清晰度确定方法，还可包括：如果字符区域不完整，可以生成并展示提示信息，该提示信息可以包括与未拍摄到全部对象字符，请重新拍摄相关的信息。

为了从整体上更好地理解上述各技术方案的具体实现过程，下面结合具体示例，对其进行示例性说明。示例性的，继续以上述示例为例，如图5所示，这是一个基于区域划分和字符粒度识别来判断签单图像是否完整以及是否清晰的完整实现过程的具体示例。获取对物流签单进行拍摄后得到的签单图像，从签单图像中检测出物流签单所在的签单区域，并从签单区域中检测出包含物流签单上的签单字符的字符区域。根据字符区域上的签单字符是否覆盖住物流签单上的全部签单字符确定签单图像的完整性，如果不完整，则结束，否则执行下述步骤。将字符区域划分为N*N个字符子区域，针对于每个字符子区域，对该字符子区域进行分类，得到属于清晰类别的分类概率；并且，分别识别该字符子区域内的每个签单字符，得到各自的识别准确度。进而，将分类概率和各识别准确度进行融合，得到该字符子区域的区域清晰度。从而，根据N*N个字符子区域的区域清晰度确定签单图像的图像清晰度。

图6为本申请实施例提供的图像清晰度确定装置的结构框图，该装置设置为执行上述任意实施例所提供的图像清晰度确定方法。该装置与上述各实施例的图像清晰度确定方法属于同一个发明构思，在图像清晰度确定装置的实施例中未详尽描述的细节内容，可以参考上述图像清晰度确定方法的实施例。参见图6，该装置可以包括：字符区域划分模块410、区域清晰度确定模块420和图像清晰度确定模块430。其中，

字符区域划分模块410，设置为获取包含目标字符的目标图像，从目标图像中提取出目标字符所在的字符区域，并将字符区域划分为至少两个字符子区域；

区域清晰度确定模块420，设置为针对于每个字符子区域，确定字符子区域内目标字符的识别准确度，并根据识别准确度确定字符子区域的区域清晰度；

图像清晰度确定模块430，设置为根据所述至少两个字符子区域的区域清晰度确定目标图像的图像清晰度。

可选的，上述图像清晰度确定装置，还可以包括：

字符子区域分类模块，设置为在针对于每个字符子区域之后，对字符子区域进行分类，其中，分类类别包括第一类别和第二类别，与第一类别对应的类别清晰度大于与第二类别对应的类别清晰度；

分类概率得到模块，设置为得到字符子区域属于第一类别或第二类别的分类概率；

区域清晰度确定模块420，可以包括：

区域清晰度确定单元，设置为根据识别准确度和分类概率确定字符子区域的区域清晰度。

可选的，字符区域划分模块410，可以包括：

字符位置信息确定单元，设置为确定目标字符在目标图像中的字符位置信息；

区域位置信息确定单元，设置为根据字符位置信息，确定目标图像中与目标字符对应的字符区域在目标图像中的区域位置信息；

字符区域提取单元，设置为根据区域位置信息从目标图像中提取出字符区域。

在此基础上，可选的，目标字符的字符数量包括至少两个，区域位置信息确定单元，可以设置为：

根据所有目标字符的字符位置信息确定包含全部的目标字符的最小外接矩形框的框位置信息，并将框位置信息作为目标图像中与目标字符对应的字符区域在目标图像中的区域位置信息。

再可选的，上述图像清晰度确定装置，还可以包括：

子区域位置信息确定模块，设置为根据区域位置信息以及字符子区域的区域数量，分别确定所述至少两个字符子区域在目标图像中的子区域位置信息；

目标字符定位模块，设置为针对于每个目标字符，根据目标字符的字符位置信息以及所述至少两个字符子区域在所述目标图像中的子区域位置信息，确定目标字符所在的字符子区域。

可选的，目标图像包括对目标对象进行拍摄后得到的图像，目标对象包含对象字符，上述图像清晰度确定装置，还可以包括：

目标字符判断模块，设置为根据字符区域在目标图像中的区域位置信息判断被拍摄到目标图像中的目标字符是否涵盖全部对象字符；

完整性确定模块，设置为根据判断结果确定字符区域的完整性。

在此基础上，可选的，区域位置信息是通过字符区域上的区域顶点的顶点坐标进行表示；目标字符判断模块，可以包括：

第二临界值确定单元，设置为获取预先设置的第一临界值，并确定目标图像的尺寸值，根据第一临界值和尺寸值确定第二临界值；

目标字符判断单元，设置为根据顶点坐标与第一临界值和/或第二临界值间的数值关系，判断被拍摄到目标图像中的目标字符是否涵盖全部对象字符。

再可选的，字符区域划分模块410，可以包括：

字符区域划分单元，设置为如果字符区域完整，则将字符区域划分为至少两个字符子区域。

本申请实施例中提供的图像清晰度确定装置，通过字符区域划分模块获取包含目标字符的目标图像，并从目标图像中提取出目标字符所在的字符区域，以避免非字符区域对于图像清晰度的确定过程造成干扰，进而将字符区域划分为至少两个字符子区域，以通过分别处理所述至少两个字符子区域来保证图像清晰度的确定精准度；通过区域清晰度确定模块针对每个字符子区域，确定字符子区域内目标字符的识别准确度，并根据识别准确度确定字符子区域的区域清晰度，该区域清晰度可以直接反映出其中的目标字符是清晰还是模糊；通过图像清晰度确定模块在得到每个字符子区域的区域清晰度后，可以根据所述至少两个字符子区域的区域清晰度确定目标图像的图像清晰度。上述装置，通过所述至少两个字符子区域内目标字符的识别准确度确定出的区域清晰度确定图像清晰度，可以准确反映出目标图像内的每个字符子区域(即局部区域)是否清晰，更是可以准确反映出每个字符子区域内的目标字符是否清晰，由此可以避免出现全局清晰但是某些字符子区域和/或某些字符子区域内的某些目标字符模糊的情况，从而保证了图像清晰度的确定精度。

本申请实施例所提供的图像清晰度确定装置可执行本申请任意实施例所提供的图像清晰度确定方法，具备执行方法相应的功能模块。

值得注意的是，上述图像清晰度确定装置的实施例中，所包括的各个单元和模块只是按照功能逻辑进行划分的，但并不局限于上述的划分，只要能够实现相应的功能即可；另外，各功能单元的具体名称也只是为了便于相互区分，并不用于限制本申请的保护范围。

图7示出了可以用来实施本申请的实施例的电子设备10的结构示意图。电子设备旨在表示各种形式的数字计算机，诸如，膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置，诸如，个人数字处理、蜂窝电话、智能电话、可穿戴设备(如头盔、眼镜、手表等)和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例，并且不意在限制本文中描述的和/或者要求的本申请的实现。

如图7所示，电子设备10包括至少一个处理器11，以及与至少一个处理器11通信连接的存储器，如只读存储器(Read-Only Memory，ROM)12、随机访问存储器(Random Access Memory，RAM)13等，其中，存储器存储有可被至少一个处理器执行的计算机程序，处理器11可以根据存储在只读存储器(ROM)12中的计算机程序或从存储单元18加载到随机访问存储器(RAM)13中的计算机程序，来执行各种适当的动作和处理。在RAM 13中，还可存储电子设备10操作所需的各种程序和数据。处理器11、ROM 12以及RAM 13通过总线14彼此相连。输入/输出(Input/Output，I/O)接口15也连接至总线14。

电子设备10中的多个部件连接至I/O接口15，包括：输入单元16，例如键盘、鼠标等；输出单元17，例如各种类型的显示器、扬声器等；存储单元18，如磁盘、光盘等；以及通信单元19，例如网卡、调制解调器、无线通信收发机等。通信单元19允许电子设备10通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。

处理器11可以是各种具有处理和计算能力的通用和/或专用处理组件。处理器11的一些示例包括但不限于中央处理单元(Central Processing Unit，CPU)、图形处理单元(Graphics Processing Unit，GPU)、各种专用的人工智能(Artificial Intelligence，AI)计算芯片、各种运行机器学习模型算法的处理器、数字信号处理器(Digital Signal Processing，DSP)、以及任何适当的处理器、控制器、微控制器等。处理器11执行上文所描述的各个方法和处理，例如图像清晰度确定方法。

在一些实施例中，图像清晰度确定方法可被实现为计算机程序，其被有形地包含于计算机可读存储介质，如存储单元18。在一些实施例中，计算机程序的部分或者全部可以经由ROM 12和/或通信单元19而被载入和/或安装到电子设备10上。当计算机程序加载到RAM 13并由处理器11执行时，可以执行上文描述的图像清晰度确定方法的至少一个步骤。备选地，在其他实施例中，处理器11可以通过其他任何适当的方式(例如，借助于固件)而被配置为执行图像清晰度确定方法。

本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(Field Programmable Gate Array，FPGA)、专用集成电路(Application Specific Integrated Circuit，ASIC)、专用标准产品(Application Specific Standard Parts，ASSP)、芯片上系统的系统(System on Chip，SOC)、负载可编程逻辑设备(Complex Programmable Logic Device，CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括：实施在至少一个计算机程序中，该至少一个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释，该可编程处理器可以是专用或者通用可编程处理器，可以从存储系统、至少一个输入装置、以及至少一个输出装置接收数据和指令，并且将数据和指令传输至该存储系统、该至少一个输入装置、以及该至少一个输出装置。

用于实施本申请的方法的计算机程序可以采用至少一个编程语言的任何组合来编写。这些计算机程序可以提供给通用计算机、专用计算机或是其他可编程数据处理装置的处理器，使得计算机程序当由处理器执行时使流程图和/或框图中所规定的功能/操作被实施。计算机程序可以完全在机器上执行、部分地在机器上执行，作为独立软件包部分地在机器上执行并且部分地在远程机器上执行或完全在远程机器或服务器上执行。

在本申请的上下文中，计算机可读存储介质可以是有形的介质，其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的计算机程序。计算机可读存储介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备，或者上述内容的任何合适组合。备选地，计算机可读存储介质可以是机器可读信号介质。机器可读存储介质的更具体示例会包括基于至少一个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器((Erasable Programmable Read-Only Memory，EPROM)或快闪存储器)、光纤、便捷式紧凑盘只读存储器(Compact Disc Read-Only Memory，CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。

为了提供与用户的交互，可以在电子设备上实施此处描述的系统和技术，该电子设备具有：用于向用户显示信息的显示装置(例如，阴极射线管(Cathode Ray Tube，CRT)或者液晶显示器(Liquid Crystal Display，LCD)监视器)；以及键盘和指向装置(例如，鼠标或者轨迹球)，用户可以通过该键盘和该指向装置来将输入提供给电子设备。其它种类的装置还可以用于提供与用户的交互；例如，提供给用户的反馈可以是任何形式的传感反馈(例如，视觉反馈、听觉反馈、或者触觉反馈)；并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。

可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如，作为数据服务器)、或者包括中间件部件的计算系统(例如，应用服务器)、或者包括前端部件的计算系统(例如，具有图形用户界面或者网络浏览器的用户计算机，用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如，通信网络)来将系统的部件相互连接。通信网络的示例包括：局域网(Local Area Network，LAN)、广域网(Wide Area Network，WAN)、区块链网络和互联网。

计算系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器，又称为云计算服务器或云主机，是云计算服务体系中的一项主机产品，以解决了传统物理主机与虚拟专用服务器(Virtual Private Server，VPS)服务中，存在的管理难度大，业务扩展性弱的缺陷。

应该理解，可以使用上面所示的各种形式的流程，重新排序、增加或删除步骤。例如，本申请中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行，只要能够实现本申请的技术方案所期望的结果，本文在此不进行限制。

Claims

一种图像清晰度确定方法，包括：

获取包含目标字符的目标图像，并从所述目标图像中提取出所述目标字符所在的字符区域，将所述字符区域划分为至少两个字符子区域；

针对于每个所述字符子区域，确定所述字符子区域内所述目标字符的识别准确度，并根据所述识别准确度确定所述字符子区域的区域清晰度；

根据所述至少两个字符子区域的区域清晰度确定所述目标图像的图像清晰度。
根据权利要求1所述的方法，在所述针对于每个所述字符子区域之后，还包括：

对所述字符子区域进行分类，其中，分类类别包括第一类别和第二类别，与所述第一类别对应的类别清晰度大于与所述第二类别对应的类别清晰度；

得到所述字符子区域属于所述第一类别或是所述第二类别的分类概率；

所述根据所述识别准确度确定所述字符子区域的区域清晰度，包括：

根据所述识别准确度和所述分类概率确定所述字符子区域的区域清晰度。
根据权利要求1所述的方法，其中，所述从所述目标图像中提取出所述目标字符所在的字符区域，包括：

确定所述目标字符在所述目标图像中的字符位置信息；

根据所述字符位置信息，确定所述目标图像中与所述目标字符对应的字符区域在所述目标图像中的区域位置信息；

根据所述区域位置信息从所述目标图像中提取出所述字符区域。
根据权利要求3所述的方法，其中，所述目标字符的字符数量是至少两个，所述根据所述字符位置信息，确定所述目标图像中与所述目标字符对应的字符区域在所述目标图像中的区域位置信息，包括：

根据所有目标字符的字符位置信息确定包含全部所述目标字符的最小外接矩形框的框位置信息，并将所述框位置信息作为所述目标图像中与所述目标字符对应的字符区域在所述目标图像中的区域位置信息。
根据权利要求3所述的方法，还包括：

根据所述区域位置信息以及所述字符子区域的区域数量，分别确定所述至少两个字符子区域在所述目标图像中的子区域位置信息；

针对于每个所述目标字符，根据所述目标字符的所述字符位置信息以及所述至少两个字符子区域在所述目标图像中的子区域位置信息，确定所述目标字符所在的所述字符子区域。
根据权利要求1所述的方法，其中，所述目标图像是对目标对象进行拍摄后得到的图像，所述目标对象包含对象字符，所述方法还包括：

根据所述字符区域在所述目标图像中的区域位置信息，判断被拍摄到的所述目标图像中的所述目标字符是否涵盖全部所述对象字符；

根据判断结果确定所述字符区域的完整性。
根据权利要求6所述的方法，其中，所述区域位置信息通过所述字符区域上的区域顶点的顶点坐标进行表示；

所述根据所述字符区域在所述目标图像中的区域位置信息，判断被拍摄到的所述目标图像中的所述目标字符是否涵盖全部所述对象字符，包括：

获取预先设置的第一临界值，并且确定所述目标图像的尺寸值，根据所述第一临界值和所述尺寸值确定第二临界值；

根据所述顶点坐标与所述第一临界值的数值关系和所述顶点坐标与所述第二临界值间的数值关系中的至少之一，判断被拍摄到的所述目标图像中的所述目标字符是否涵盖全部所述对象字符。
根据权利要求6所述的方法，其中，所述将所述字符区域划分为至少两个字符子区域，包括：

响应于所述字符区域完整，将所述字符区域划分为至少两个字符子区域。
一种图像清晰度确定装置，包括：

字符区域划分模块，设置为获取包含目标字符的目标图像，从所述目标图像中提取出所述目标字符所在的字符区域，将所述字符区域划分为至少两个字符子区域；

区域清晰度确定模块，设置为针对于每个所述字符子区域，确定所述字符子区域内所述目标字符的识别准确度，根据所述识别准确度确定所述字符子区域的区域清晰度；

图像清晰度确定模块，设置为根据所述至少两个字符子区域的区域清晰度确定所述目标图像的图像清晰度。
一种电子设备，包括：

至少一个处理器；以及

与所述至少一个处理器通信连接的存储器；其中，

所述存储器存储有可被所述至少一个处理器执行的计算机程序，所述计算机程序被所述至少一个处理器执行，以使所述至少一个处理器执行如权利要求1-8中任一项所述的图像清晰度确定方法。
一种计算机可读存储介质，所述计算机可读存储介质存储有计算机指令，所述计算机指令用于使处理器执行时实现如权利要求1-8中任一所述的图像清晰度确定方法。