CN112668640B

CN112668640B - 一种文本图像质量评估方法、装置、设备及介质

Info

Publication number: CN112668640B
Application number: CN202011576838.7A
Authority: CN
Inventors: 喻庐军; 韩森尧; 李驰; 刘岩
Original assignee: Taikang Insurance Group Co Ltd
Current assignee: Taikang Insurance Group Co Ltd
Priority date: 2020-12-28
Filing date: 2020-12-28
Publication date: 2023-10-17
Anticipated expiration: 2040-12-28
Also published as: CN112668640A

Abstract

本发明公开了一种文本图像质量评估方法、装置、设备及介质，用于解决现有识别文本图像中文本信息的识别效率较低的问题。由于本发明实施例可以确定待评估文本图像对应的目标文本图像的文本区域中每个像素点对应的第一清晰度值，根据每个第一清晰度值，确定目标文本图像的第二清晰度值，并基于第二清晰度值，判断该待评估文本图像是否满足预设的图像质量条件，并可以在确定待评估文本图像的图像质量不满足条件时，输出重新上传图像质量满足条件的文本图像的提示信息，从而可以在源头上保证上传的文本图像的图像质量，进而提高后续识别文本图像中文本信息的识别效率。

Description

一种文本图像质量评估方法、装置、设备及介质

技术领域

本发明涉及图像质量评估技术领域，尤其涉及一种文本图像质量评估方法、装置、设备及介质。

背景技术

现有进行保险理赔和核保时，通常需要客户上传保险单、医疗票据、身份证、银行卡等医疗或保险文本图像，在识别医疗文本图像等或保险业务涉及的文本图像等中的文本信息时，除了传统人工识别外，随着科技的发展，现在可以利用传统光字符检测技术(OCR)识别文本图像中的文本信息，相比传统人工识别，大幅提升了识别文本图像中文本信息的效率。

然而OCR主要面向图像质量较高的文本图像，在文本图像符合图像质量要求的条件下OCR能够达到较高的文本识别水平。当文本图像质量不高时，如聚焦不准、光线过曝或过暗等时，OCR就可能会出现不能准确识别文本图像中的文本信息的情况，当出现这种情况时，通常还需人工复核识别该文本图像中的文本信息，占用了大量人力成本的同时，也降低了文本图像中文本信息的识别效率。

发明内容

本发明实施例提供了一种文本图像质量评估方法、装置、设备及介质，用于解决现有识别文本图像中文本信息的识别效率较低的问题。

第一方面，本发明实施例提供了一种文本图像质量评估方法，所述方法包括：

接收待评估文本图像，其中所述待评估文本图像包括医疗文本图像或保险业务涉及的文本图像；

根据预设的理想图像尺寸，确定接收到的所述待评估文本图像对应的目标文本图像；

将所述目标文本图像输入到预先训练完成的文本质量评估模型，确定所述目标文本图像的文本区域中每个像素点对应的第一清晰度值；

根据每个所述第一清晰度值，确定所述目标文本图像的第二清晰度值，并基于所述第二清晰度值，判断所述待评估文本图像是否满足预设的图像质量条件，若否，确定所述待评估文本图像的图像质量不满足条件，并输出重新上传图像质量满足条件的文本图像的提示信息。

进一步地，所述根据预设的理想图像尺寸，确定接收到的待评估文本图像对应的目标文本图像包括：

若所述待评估文本图像为预设的理想图像尺寸，将所述待评估文本图像确定为目标文本图像；

若所述待评估文本图像非预设的理想图像尺寸，根据预设的理想图像尺寸，将所述待评估文本图像划分为至少一个目标文本图像，其中任一所述目标文本图像的图像尺寸均为预设的理想图像尺寸。

进一步地，所述基于所述第二清晰度值，判断所述待评估文本图像是否满足预设的图像质量条件，若否，确定所述待评估文本图像的图像质量不满足条件包括：

根据每个所述目标文本图像的第二清晰度值，确定所述待评估文本图像的第三清晰度值，判断所述第三清晰度值是否大于预设的清晰度阈值，若否，确定所述待评估文本图像的图像质量不满足条件。

进一步地，所述根据每个所述第一清晰度值，根据每个所述第一清晰度值，确定所述目标文本图像的第二清晰度值包括：

将所述目标文本图像的文本区域中每个像素点对应的第一清晰度值的平均值，确定为所述目标文本图像的第二清晰度值；

所述根据所述目标文本图像的第二清晰度值，确定所述待评估文本图像的第三清晰度值包括：

将每个所述目标文本图像的第二清晰度值的平均值，确定为所述待评估文本图像的第三清晰度值。

针对每个所述目标文本图像，若该目标文本图像的第二清晰度值大于预设的清晰度阈值，确定该目标文本图像的图像质量满足条件；并确定每个所述目标文本图像中，图像质量满足条件的目标文本图像的数量与目标文本图像总数量的比值，判断所述比值是否大于预设的比值阈值，若否，确定所述待评估文本图像的图像质量不满足条件。

进一步地，若所述待评估文本图像满足预设的图像质量条件，所述方法还包括：

将所述待评估图像进行保存。

进一步地，训练所述文本质量评估模型的过程包括：

获取样本集中任一样本文本图像，所述样本文本图像中每个像素点对应有样本类别标签，其中所述样本类别标签用于标识该像素点是否为文本；针对样本文本图像中的每个像素点，若该像素点为文本时，该像素点对应有样本清晰度值；

通过原始文本质量评估模型，确定所述样本文本图像中每个像素点的识别类别标签和对应的识别清晰度值；

根据所述样本类别标签和所述识别类别标签，以及所述样本清晰度值和识别清晰度值，对原始文本质量评估模型进行训练，得到训练完成的文本质量评估模型。

进一步地，确定所述样本类别标签和所述样本清晰度值的过程包括：

识别所述样本文本图像中人工标注的文本框，其中所述文本框对应有人工标注的样本类别标签和样本清晰度值，根据所述样本类别标签和样本清晰度值，确定所述文本框中每个像素点的样本类别标签和样本清晰度值。

识别所述样本文本图像中包含的每个文字，针对每个文字，确定该文字对应的样本类别标签和样本清晰度值；并根据该文字的样本类别标签和样本清晰度值，确定该文字对应的每个像素点的样本类别标签和样本清晰度值。

第二方面，本发明实施例提供了一种文本图像质量评估装置，所述装置包括：

接收模块，用于接收待评估文本图像，其中所述待评估文本图像包括医疗文本图像或保险业务涉及的文本图像；

第一确定模块，用于根据预设的理想图像尺寸，确定接收到的所述待评估文本图像对应的目标文本图像；

第二确定模块，用于将所述目标文本图像输入到预先训练完成的文本质量评估模型，确定所述目标文本图像的文本区域中每个像素点对应的第一清晰度值；

判断模块，用于根据每个所述第一清晰度值，确定所述目标文本图像的第二清晰度值，并基于所述第二清晰度值，判断所述待评估文本图像是否满足预设的图像质量条件，若否，确定所述待评估文本图像的图像质量不满足条件，并输出重新上传图像质量满足条件的文本图像的提示信息。

进一步地，所述第一确定模块，具体用于若所述待评估文本图像为预设的理想图像尺寸，将所述待评估文本图像确定为目标文本图像；

进一步地，所述判断模块，具体用于根据每个所述目标文本图像的第二清晰度值，确定所述待评估文本图像的第三清晰度值，判断所述第三清晰度值是否大于预设的清晰度阈值，若否，确定所述待评估文本图像的图像质量不满足条件。

进一步地，所述判断模块，具体用于将所述目标文本图像的文本区域中每个像素点对应的第一清晰度值的平均值，确定为所述目标文本图像的第二清晰度值；

进一步地，所述判断模块，具体用于针对每个所述目标文本图像，若该目标文本图像的第二清晰度值大于预设的清晰度阈值，确定该目标文本图像的图像质量满足条件；并确定每个所述目标文本图像中，图像质量满足条件的目标文本图像的数量与目标文本图像总数量的比值，判断所述比值是否大于预设的比值阈值，若否，确定所述待评估文本图像的图像质量不满足条件。

进一步地，所述判断模块，还用于若所述待评估文本图像满足预设的图像质量条件，将所述待评估图像进行保存。

进一步地，训练所述文本质量评估模型的过程包括：

第三方面，本发明实施例提供了一种电子设备，所述电子设备至少包括处理器和存储器，所述处理器用于执行存储器中存储的计算机程序时实现如上述任一所述文本图像质量评估方法的步骤。

第四方面，本发明实施例提供了一种计算机可读存储介质，其存储有计算机程序，所述计算机程序被处理器执行时实现如上述任一所述文本图像质量评估方法的步骤。

由于本发明实施例可以确定待评估文本图像对应的目标文本图像的文本区域中每个像素点对应的第一清晰度值，根据每个第一清晰度值，确定目标文本图像的第二清晰度值，并基于第二清晰度值，判断该待评估文本图像是否满足预设的图像质量条件，并可以在确定待评估文本图像的图像质量不满足条件时，输出重新上传图像质量满足条件的文本图像的提示信息，从而可以在源头上保证上传的文本图像的图像质量，进而提高后续识别文本图像中文本信息的识别效率。

附图说明

图1为本发明实施例提供的第一种文本图像质量评估过程示意图；

图2为本发明实施例提供的第二种文本图像质量评估过程示意图；

图3为本发明实施例提供的第三种文本图像质量评估过程示意图；

图4为本发明实施例提供的一种文本质量评估模型训练过程示意图；

图5为本发明实施例提供的另一种文本质量评估模型训练过程示意图；

图6为本发明实施例提供的一种文本图像质量评估装置结构示意图；

图7为本发明实施例提供的一种电子设备结构示意图。

具体实施方式

为了使本发明的目的、技术方案和优点更加清楚，下面将结合附图对本发明作进一步地详细描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例，都属于本发明保护的范围。

为了保证上传的文本图像的图像质量，以提高后续识别文本图像中文本信息的识别效率，本发明实施例提供了一种文本图像质量评估方法、装置、设备及介质。

实施例1：

图1为本发明实施例提供的第一种文本图像质量评估过程示意图，该过程包括以下步骤：

S101：接收待评估文本图像，其中所述待评估文本图像包括医疗文本图像或保险业务涉及的文本图像。

本发明实施例提供的文本图像质量评估方法应用于电子设备，该电子设备例如可以是PC、移动终端等设备，也可以是服务器等。其中该电子设备可以联网，也可以不联网，在一种可能的实施方式中，为了提高识别效率，电子设备可以不联网，即在离线状态下进行文本图像质量的评估，提高识别效率的同时也可以降低运营成本。

电子设备可以接收待评估文本图像，其中该待评估文本图像可以是电子设备中的图像采集模块采集的，也可以是其他电子设备发送的待评估文本图像。本发明实施例对待评估文本图像的来源和类型不做具体限定，例如可以是摄像机拍摄的文本图像、也可以是移动终端、PC等拍摄的文本图像、也可以是复印件、扫描件等文本图像等。

在一种可能的实施方式中，待评估文本图像可以是进行保险理赔和核保时，需要客户上传的保险单、医疗票据、身份证、银行卡等医疗文本图像或保险业务涉及的文本图像，本发明实施例对医疗文本图像或保险业务涉及的文本图像的具体类别不做具体限定，可以根据需求灵活设置。

S102：根据预设的理想图像尺寸，确定接收到的所述待评估文本图像对应的目标文本图像。

为了准确判断接收到的待评估文本图像的图像质量，在本发明实施例中，可以根据预设的理想图像尺寸，确定接收到的待评估文本图像对应的目标文本图像。示例性的，如果接收到的待评估文本图像的图像尺寸非预设的理想图像尺寸，可以将该待评估文本图像的图像尺寸调整为理想图像尺寸，具体的可以采用现有技术对待评估文本图像的图像尺寸进行调整，在此不再赘述。理想图像尺寸的具体数值可以根据需求灵活设置，例如可以是224像素*224像素等，本发明实施例对此不做具体限定。

S103：将所述目标文本图像输入到预先训练完成的文本质量评估模型，确定所述目标文本图像的文本区域中每个像素点对应的第一清晰度值。

在本发明实施例中，可以将图像尺寸为理想图像尺寸的目标文本图像输入到预先训练完成的文本质量评估模型，从而基于该预先训练完成的文本质量评估模型，可以确定该目标文本图像的文本区域中每个像素点对应的第一清晰度值。具体的，文本质量评估模型可以根据需求灵活选择，例如可以是U-Net神经网络模型等。第一清晰度值的具体数值可以根据需求灵活数值，示例性的，第一清晰度值可以是大于等于0，且小于等于1的正数，为方便理解，若将第一清晰度值用SV表示，则0≤SV≤1。其中，可以是第一清晰度值越大，表示该像素点的图像质量越高、越清晰；也可以是第一清晰度值越小，表示该像素点的图像质量越高、越清晰，可以根据需求灵活设置。通常情况下，可以是第一清晰度值越高，认为该像素点的图像质量越高，越清晰；第一清晰度值越低，认为该像素点的图像质量越低，越模糊。

S104：根据每个所述第一清晰度值，确定所述目标文本图像的第二清晰度值，并基于所述第二清晰度值，判断所述待评估文本图像是否满足预设的图像质量条件，若否，确定所述待评估文本图像的图像质量不满足条件，并输出重新上传图像质量满足条件的文本图像的提示信息。

在本发明实施例中，可以根据目标文本图像的文本区域中每个像素点对应的第一清晰度值，确定该目标文本图像的第二清晰度值。示例性的，可以将该目标文本图像的文本区域中每个像素点的第一清晰度值中的最大值、最小值等，确定为该目标文本图像的第二清晰度值。确定了每个目标文本图像的第二清晰度值后，可以基于每个第二清晰度值，判断待评估文本图像是否满足预设的图像质量条件。其中预设的图像质量条件可以根据需求灵活设置，示例性的，预设的图像质量条件可以是每个目标文本图像的第二清晰度值均大于预设的清晰度阈值、或设定比例的目标文本图像的第二清晰度值大于预设的清晰度阈值等。

为了提高对文本图像质量评估的准确性，在本发明实施例中可以根据目标文本图像的文本区域中每个像素点对应的第一清晰度值，确定目标文本图像的第二清晰度值，进而基于第二清晰度值，判断待评估文本图像是否满足预设的图像质量条件，从而可以排除非文本区域对图像质量评估所造成的干扰，提高对文本图像质量评估的准确性。

如果判断待评估文本图像不满足预设的图像质量条件，可以确定该待评估文本图像的图像质量不满足条件，为了保证上传的文本图像的图像质量，以提高后续识别文本图像中文本信息的识别效率，可以输出重新上传图像质量满足条件的文本图像的提示信息，以提示用户重新上传相关文本图像。其中，提示信息的具体内容可以根据需求灵活设置，本发明实施例对此不做具体限定。

实施例2：

为了确定待评估文本图像对应的目标文本图像，在上述实施例的基础上，在本发明实施例中，所述根据预设的理想图像尺寸，确定接收到的待评估文本图像对应的目标文本图像包括：

在一种可能的实施方式中，为了提高识别效率，输入预先训练完成的文本评估模型中的目标文本图像的图像尺寸可以是理想图像尺寸。该理想图像尺寸可以根据文本质量评估模型来确定，示例性的，如果文本评估模型是基于理想图像尺寸进行训练的，则待评估文本图像对应的目标文本图像的图像尺寸也可以为该理想图像尺寸。

可以理解的，如果待评估文本图像的图像尺寸就是该预设的理想图像尺寸，则可以将该待评估文本图像直接确定为目标文本图像。如果待评估文本图像的图像尺寸并非预设的理想图像尺寸，在一种可能的实施方式中，可以根据预设的理想图像尺寸，将待评估文本图像划分为至少一个目标文本图像，其中划分的任一目标文本图像的图像尺寸可以均为该预设的理想图像尺寸。具体的，可以利用现有技术将待评估文本图像划分为至少一个目标文本图像，在此不再赘述。

实施例3：

为了准确评估文本图像质量，在上述各实施例的基础上，在本发明实施例中，所述基于所述第二清晰度值，判断所述待评估文本图像是否满足预设的图像质量条件，若否，确定所述待评估文本图像的图像质量不满足条件包括：

在一种可能的实施方式中，针对每个目标文本图像，可以是先根据该目标文本图像的文本区域中每个像素点的第一清晰度值，确定该目标文本图像的第二清晰度值。然后再根据每个目标文本图像的第二清晰度值，确定待评估文本图像的第三清晰度值，具体的，可以根据每个目标文本图像的第二清晰度值中的最大值、最小值等，确定待评估文本图像的第三清晰度值，可以根据需求灵活设置。

在一种可能的实施方式中，为了准确确定目标文本图像的第二清晰度值和待评估文本图像的第三清晰度值，在上述各实施例的基础上，在本发明实施例中，根据每个所述第一清晰度值，确定所述目标文本图像的第二清晰度值包括：

在一种可能的实施方式中，在确定目标文本图像的第二清晰度值时，可以根据该目标文本图像的文本区域中每个像素点对应的第一清晰度值的平均值，确定该目标文本图像的第二清晰度值。在确定待评估文本图像的第三清晰度值时，可以根据每个目标文本图像的第二清晰度值的平均值，确定待评估文本图像的第三清晰度值。

确定了待评估文本图像的第三清晰度值后，可以判断该第三清晰度值是否大于预设的清晰度阈值，若是，可以认为该待评估文本图像的图像质量满足条件；若否，即该第三清晰度值不大于预设的清晰度阈值，可以认为该待评估文本图像的图像质量不满足条件。与上述实施例相同，为了提示用户，可以输出重新上传图像质量满足条件的文本图像的提示信息。其中清晰度阈值的具体数值可以根据需求灵活设置。

为方便理解，下面通过一个具体实施例对本发明实施例提供的文本图像质量评估过程进行说明。

在一种可能的实施方式中，因为可以将目标文本图像的文本区域中每个像素点对应的第一清晰度值的平均值，确定为该目标文本图像的第二清晰度值；并可以将每个目标文本图像的第二清晰度值的平均值，确定为待评估文本图像的第三清晰度值，所以待评估文本图像的第三清晰度值可以是与每个目标文本图像的文本区域中每个像素点对应的第一清晰度值的平均值相同的数值。示例性的，如果待评估文本图像对应的每个目标文本图像的文本区域的像素点总个数用count表示，每个目标文本图像的文本区域中每个像素点对应的第一清晰度值用validMap表示，则待评估文本图像对应的每个目标文本图像的文本区域中每个像素点对应的第一清晰度值的和用sum(validMap)表示，则该待评估文本图像的第三清晰度值Q＝sum(validMap)/count。

预设的清晰度阈值用Thr表示，则如果Q＞Thr，可以认为待评估文本图像的图像质量满足条件；否则，例如Q≤Thr可以认为待评估文本图像的图像质量不满足条件，可以输出重新上传图像质量满足条件的文本图像的提示信息。

为方便理解，下面再通过一个具体实施例对本发明实施例提供的文本图像质量评估过程进行说明。图2为本发明实施例提供的第二种文本图像质量评估过程示意图，如图2所示，该过程包括以下步骤：

S201：接收待评估文本图像，其中该待评估文本图像包括医疗文本图像或保险业务涉及的文本图像。

S202：根据预设的理想图像尺寸，确定接收到的待评估文本图像对应的目标文本图像。

S203：将目标文本图像输入到预先训练完成的文本质量评估模型，确定目标文本图像的文本区域中每个像素点对应的第一清晰度值。

S204：将目标文本图像的文本区域中每个像素点对应的第一清晰度值的平均值，确定为该目标文本图像的第二清晰度值；并将每个目标文本图像的第二清晰度值的平均值，确定为待评估文本图像的第三清晰度值。

S205：判断第三清晰度值是否大于预设的清晰度阈值，若否，确定待评估文本图像的图像质量不满足条件。

S206：输出重新上传图像质量满足条件的文本图像的提示信息。

实施例4：

为了判断待评估文本图像是否满足预设的图像质量条件，在上述各实施例的基础上，在本发明实施例中，所述基于所述第二清晰度值，判断所述待评估文本图像是否满足预设的图像质量条件，若否，确定所述待评估文本图像的图像质量不满足条件包括：

在本发明实施例中，针对每个目标文本图像，可以根据该目标文本图像的文本区域中每个像素点对应的第一清晰度值，确定该目标文本图像的第二清晰度值。在一种可能的实施方式中，可以将该目标文本图像的文本区域中每个像素点对应的第一清晰度值的平均值，确定为该目标文本图像的第二清晰度值。

为了判断目标文本图像的图像质量，针对每个目标文本图像，可以比较该目标文本图像的第二清晰度值与预设的清晰度阈值的大小关系，若该目标文本图像的第二清晰度值大于预设的清晰度阈值，可以认为该目标文本图像的图像质量满足条件。相反，如果该目标文本图像的第二清晰度值不大于预设的清晰度阈值，可以认为该目标文本图像的图像质量不满足条件。其中预设的清晰度阈值可以根据需求灵活设置，本发明实施例对清晰度阈值的具体数值不做具体限定。

在一种可能的实施方式中，为了判断待评估文本图像的图像质量是否满足条件，可以确定每个目标文本图像中，图像质量满足条件的目标文本图像的数量，并确定图像质量满足条件的目标文本图像的数量与目标文本图像总数量的比值，判断该比值是否大于预设的比值阈值，如果是，可以认为该待评估文本图像的图像质量满足条件。相反，如果该比值不大于预设的比值阈值，可以认为该待评估文本图像的图像质量不满足条件。与上述实施例相同，为了提示用户，可以输出重新上传图像质量满足条件的文本图像的提示信息。其中预设的比值阈值可以根据需求灵活设置，本发明实施例对比值阈值的具体数值不做具体限定。

为方便理解，下面通过一个具体实施例对本发明实施例提供的文本图像质量评估过程进行说明。图3为本发明实施例提供的第三种文本图像质量评估过程示意图，如图3所示，该过程包括以下步骤：

S301：接收待评估文本图像，其中待评估文本图像包括医疗文本图像或保险业务涉及的文本图像。

S302：根据预设的理想图像尺寸，确定接收到的待评估文本图像对应的目标文本图像。

S303：将目标文本图像输入到预先训练完成的文本质量评估模型，确定目标文本图像的文本区域中每个像素点对应的第一清晰度值。

S304：针对每个目标文本图像，根据该目标文本图像的文本区域中每个像素点对应的第一清晰度值，确定该目标文本图像的第二清晰度值。

S305：若该目标文本图像的第二清晰度值大于预设的清晰度阈值，确定该目标文本图像的图像质量满足条件；并确定每个目标文本图像中，图像质量满足条件的目标文本图像的数量与目标文本图像总数量的比值，判断该比值是否大于预设的比值阈值，若否，确定待评估文本图像的图像质量不满足条件。

S306：输出重新上传图像质量满足条件的文本图像的提示信息。

实施例5：

为了便于后续识别文本图像中的文本信息，在上述各实施例的基础上，在本发明实施例中，若所述待评估文本图像满足预设的图像质量条件，所述方法还包括：

将所述待评估图像进行保存。

在本发明实施例中，如果待评估文本图像的图像质量满足预设的图像质量条件，可以认为该待评估文本图像质量较高，可以用于后续识别文本图像中的文本信息，可以将该待评估文本图像进行保存，以便后续识别该待评估文本图像中的文本信息。

实施例6：

为了准确评估文本图像质量，在上述各实施例的基础上，在本发明实施例中，训练所述文本质量评估模型的过程包括：

在本发明实施例中，可以通过预先训练完成的文本质量评估模型，确定目标文本图像的每个像素点是否为文本，即确定目标文本图像的每个像素点是否属于文本区域中的像素点，以及在确定该像素点属于文本区域中的像素点时，可以输出文本区域中每个像素点对应的第一清晰度值。

为了可以准确评估文本图像质量，在本发明实施例中，样本集中包含多个样本文本图像。在一种可能的实施方式中，样本集中包括的任一样本文本图像的图像尺寸均为预设的理想图像尺寸。为了准确评估文本图像质量，目标文本图像与样本集中包含的样本文本图像的图像尺寸相同，均为该预设的理想图像尺寸。

样本集中的每个样本文本图像中每个像素点均对应有样本类别标签，该样本类别标签用于标识该像素点是否为文本，示例性的，当该像素点为文本时，该像素点的样本类别标签可以是1，当该像素点不为文本时，该像素点的样本类别标签可以是0。

为了可以获取文本区域的每个像素点的清晰度值，样本文本图像中样本类别标签为文本的像素点还对应有该像素点的样本清晰度值。

在一种可能的实施方式中，为了提高标注效率，在上述各实施例的基础上，在本发明实施例中，确定所述样本类别标签和所述样本清晰度值的过程包括：

在一种可能的实施方式中，可以基于人工对样本文本图像中每个像素点的样本类别标签以及文本区域的像素点的样本清晰度值进行标注。示例性的，为了提高标注效率，人工可以将样本文本图像中的多个像素点用同一个文本框选定，对该文本框标注一个样本类别标签和样本清晰度值，电子设备可以识别样本文本图像中人工标注的文本框，以及该文本框对应的人工标注的样本类别标签和样本清晰度值，并可以将该文本框对应的样本类别标签和样本清晰度值，确定为该文本框中的每个像素点的样本类别标签和样本清晰度值。

相比为样本文本图像中的每个像素点分别设置样本类别标签和对应的样本清晰度值的方式，本发明实施例可以针对文本框中的多个像素点，同时设置多个像素点对应的样本类别标签和样本清晰度值，从而可以快捷的确定样本文本图像中每个像素点的样本类别标签以及对应的样本清晰度值，提高标注效率。

另外，为了提高标注效率，本发明实施例还提供了另一种确定样本文本图像中每个像素点的样本类别标签和所述样本清晰度值的过程，在上述各实施例的基础上，在本发明实施例中，确定所述样本类别标签和所述样本清晰度值的过程包括：

在一种可能的实施方式中，可以基于OCR等文本识别技术识别样本文本图像中包含的每个文字，其中本发明实施例对可以识别的样本文本图像中包含的每个文字的语言类别不做具体限定，例如可以是汉语、英语、德语等。可以基于OCR等文本识别技术以文字为单位，逐字标注每个文字对应的样本类别标签以及每个文字的样本清晰度值，针对每个文字，可以根据该文字对应的样本类别标签和样本清晰度值，确定该文字对应的每个像素点的样本类别标签以及样本清晰度值。

相比为样本文本图像中的每个像素点分别设置样本类别标签和对应的样本清晰度值的方式，本发明实施例可以针对每个文字对应的多个像素点，同时设置多个像素点的样本类别标签和对应的样本清晰度值，从而可以快捷的确定样本文本图像中每个像素点的样本类别标签以及对应的样本清晰度值，提高标注效率。

在对原始文本质量评估模型进行训练时，可以获取样本集中任一样本文本图像，该样本文本图像中每个像素点对应有样本类别标签、以及针对样本文本图像中的每个像素点，若该像素点为文本时，该像素点对应有样本清晰度值。将该获取到的任一样本文本图像输入原始文本质量评估模型，通过原始文本质量评估模型，获取该样本文本图像中每个像素点对应的识别类别标签，以及对应的识别清晰度值。

具体实施中，确定了输入的样本文本图像的识别类别标签和对应的识别清晰度值后，因为预先保存了该样本文本图像的样本类别标签、以及针对样本文本图像中的每个像素点，若该像素点为文本时，该像素点对应有样本清晰度值，因此可以根据每个像素点的样本类别标签与识别类别标签是否一致，以及样本清晰度值与识别清晰度值是否一致，确定该文本质量评估模型的识别结果是否准确。具体实施中，若不一致，说明该文本质量评估模型的识别结果不准确，则需要对该文本质量评估模型的参数进行调整，从而对文本质量评估模型进行训练。

具体实施中，对文本质量评估模型中的参数进行调整时，可以采用梯度下降算法，对文本质量评估模型的参数的梯度进行反向传播，从而对文本质量评估模型进行训练。

在一种可能的实施方式中，可以对样本集中的每个样本文本图像都进行上述操作，当满足预设的收敛条件时，确定该文本质量评估模型训练完成。

其中，满足预设的收敛条件可以为样本集中的样本文本图像通过该原始文本质量评估模型，被正确识别的样本文本图像的个数大于设定数量，或对文本质量评估模型进行训练的迭代次数达到设置的最大迭代次数等。具体实施中可以灵活进行设置，在此不做具体限定。

在一种可能的实施方式中，可以通过不同的损失函数来约束文本质量评估模型，示例性的，可以基于三元损失函数(Triplet Loss)通过最大化类间(如清晰样本文本图像与模糊样本文本图像)距离和最小化类内(如清晰样本文本图像与清晰样本文本图像，模糊样本文本图像与模糊样本文本图像)距离，使得文本质量评估模型更好的收敛。可以基于回归损失函数(Regression Loss)通过计算样本清晰度值与识别清晰度值矩阵之间误差，使得文本质量评估模型更好的收敛。可以基于分类损失函数(Classification Loss)或交叉熵函数(CrossEntropy Loss)通过加入辅助判别来判断文本图像的像素点对应的清晰度值等。

在一种可能的实施方式中，在进行原始文本质量评估模型训练时，可以把样本集中的样本文本图像分为训练样本文本图像和测试样本文本图像，先基于训练样本文本图像对原始文本质量评估模型进行训练，再基于测试样本文本图像对上述已训练的文本质量评估模型的可靠程度进行验证。

为方便理解，下面通过一个具体实施例对本发明实施例提供的模型训练过程进行说明。图4为本发明实施例提供的一种文本质量评估模型训练过程示意图，如图4所示，文本质量评估模型训练过程包括以下步骤：

S401：根据预设的理想图像尺寸，确定样本集中包括的每个样本文本图像。即样本集中包括的每个样本文本图像的图像尺寸均为该预设的理想图像尺寸。

S402：获取样本集中任一样本文本图像，其中该样本文本图像中每个像素点对应有样本类别标签，其中样本类别标签用于标识该像素点是否为文本；针对样本文本图像中的每个像素点，若该像素点为文本时，该像素点对应有样本清晰度值。

S403：通过原始文本质量评估模型，确定样本文本图像中每个像素点的识别类别标签和对应的识别清晰度值。

S404：根据样本类别标签和识别类别标签，以及样本清晰度值和识别清晰度值，对原始文本质量评估模型进行训练，得到训练完成的文本质量评估模型。

为方便理解，下面再通过一个具体实施例对本发明实施例提供的模型训练过程进行说明。图5为本发明实施例提供的另一种文本质量评估模型训练过程示意图，如图5所示：

可以将图像尺寸为理想图像尺寸的任一样本文本图像输入文本质量评估模型，首先进行图像卷积(Encoder)，提取文本图像中的图像特征。具体过程如下：

示例性的，该样本文本图像输入文本质量评估模型时，进入文本质量评估模型中的卷积层，其中样本文本图像尺寸为224像素*224像素，样本文本图像对应有RGB三个颜色通道，样本文本图像的图像参数(input image)用W*H*C表示，其中W为样本文本图像的宽(单位为像素)、H为样本文本图像的高(单位为像素)、C为通道数。所以该样本文本图像的图像参数为224*224*3；卷积核大小为7*7；采样间隔为2，即经过该卷积层后，图像尺寸缩小1/2；通道数为64，即将该文本图像对应的通道数转换为该层的通道数；经过该卷积层后，图像尺寸转换为112*112*64，将该卷积层的输出标记为conv1。

将卷积层的输出conv1输入最大池化(maxpool)层(图中的E1)，该层的采样间隔为2，即经过该maxpool层后，图像尺寸缩小1/2，图像参数转换为56*56*64，将该maxpool层的输出标记为maxpool。

将maxpool输入文本质量评估模型中的第一瓶颈(bottlenetck)层(图中的E2)，该层的卷积核大小为3*3，采样间隔为1，图像尺寸不变，通道数为64，该层输出的图像参数为56*56*64，将该层的输出标记为conv2。

将conv2输入文本质量评估模型中的第二瓶颈(bottlenetck)层(图中的E3)，该层的卷积核大小为3*3，采样间隔为2，图像尺寸缩小1/2，通道数为128，该层输出的图像参数为28*28*128，将该层的输出标记为conv3。

将conv3输入文本质量评估模型中的第三瓶颈(bottlenetck)层(图中的E4)，该层的卷积核大小为3*3，采样间隔为2，图像尺寸缩小1/2，通道数为256，该层输出的图像参数为14*14*256，将该层的输出标记为conv4。

将conv4输入文本质量评估模型中的第四瓶颈(bottlenetck)层(图中的E5)，该层的卷积核大小为3*3，采样间隔为2，图像尺寸缩小1/2，通道数为512，该层输出的图像参数为7*7*512，将该层的输出标记为conv5。

利用图像卷积，提取出文本图像中的图像特征后，可以进而通过上采样等步骤对图像解码(Decoder)，获取样本文本图像中每个像素点的识别类别标签以及识别清晰度值等。为方便描述，可以将每个像素点均携带有识别类别标签以及识别清晰度值的图像称为该文本图像对应的清晰度图像(Sharpness Map)。可以理解的，Sharpness Map与对应的文本图像的图像尺寸相同，Sharpness Map中的每个像素点对应有类别标签以及清晰度值。

下面对获得Sharpness Map的过程进行说明。

将conv5输入第五瓶颈层(图中的D1)进行图像上采样，该层的卷积核大小为3*3，采样间隔为2，将图像尺寸增大两倍，通道数为256，该层输出的图像参数为14*14*256，将该层的输出标记为deconv1。其中在D1中的图像特征包括E4和E5步骤的图像特征。

将deconv1输入第六瓶颈层(图中的D2)进行图像上采样，该层的卷积核大小为3*3，采样间隔为2，将图像尺寸增大两倍，通道数为128，该层输出的图像参数为28*28*128，将该层的输出标记为deconv2。其中D2中的图像特征包括D1和E3步骤的图像特征。

将deconv2输入第七瓶颈层(图中的D3)进行图像上采样，该层的卷积核大小为3*3，采样间隔为2，将图像尺寸增大两倍，通道数为64，该层输出的图像参数为56*56*64，将该层的输出标记为deconv3。其中D3中的图像特征包括D2和E2步骤的图像特征。

将deconv3输入第八瓶颈层(图中的D4)进行图像上采样，该层的卷积核大小为3*3，采样间隔为2，将图像尺寸增大两倍，通道数为64，该层输出的图像参数为112*112*64，将该层的输出标记为deconv4。其中D4中的图像特征包括D3和E1步骤的图像特征。

将deconv4输入第九瓶颈层进行图像上采样，该层的卷积核大小为3*3，采样间隔为2，将图像尺寸增大两倍，通道数为1，该层输出的图像尺寸为224*224*1，该层的输出即为Sharpness Map，从而得到与原文本图像的图像尺寸相同的清晰度图像。基于该SharpnessMap，可以获知对应的文本图像中每个像素点对应的类别标签以及清晰度值。

在一种可能的实施方式中，文本质量评估模型可以为U-Net神经网络模型，其中提取图像特征的过程(即图中E1-E5的过程)可以基于U-Net神经网络模型中的主干网络模型完成，主干网络模型包括但不限于resnet网络模型，如resnet18网络模型。在一种可能的实施方式中，图中的E2、E3、E4、E5、D1、D2、D3、D4、D5均包含两个bottlenetck层。

在一种可能的实施方式中，基于预先训练完成的文本质量评估模型，确定待评估文本图像对应的目标文本图像的每个像素点的类别标签以及清晰度值。在一种可能的实施方式中，可以基于目标检测算法(Single Shot MultiBox Detector，SSD)识别像素点的样本类别标签，并确定文本区域像素点的数量。示例性的，样本类别标签可以用数值表示，例如针对目标文本图像中的每个像素点，当该像素点为文本时，该像素点的样本类别标签为1，当该像素点不为文本时，该像素点的样本类别标签为0，为方便理解，将样本类别标签的数值用mask表示，则目标文本图像的文本区域的像素点总个数count为每个样本类别标签的和，即count＝sum(Mask)。

实施例7：

在上述各实施例的基础上，本发明实施例提供的一种文本图像质量评估装置，图6为本发明实施例提供的一种文本图像质量评估装置结构示意图，如图6所示，所述装置包括：

接收模块61，用于接收待评估文本图像，其中所述待评估文本图像包括医疗文本图像或保险业务涉及的文本图像；

第一确定模块62，用于根据预设的理想图像尺寸，确定接收到的所述待评估文本图像对应的目标文本图像；

第二确定模块63，用于将所述目标文本图像输入到预先训练完成的文本质量评估模型，确定所述目标文本图像的文本区域中每个像素点对应的第一清晰度值；

判断模块64，用于根据每个所述第一清晰度值，确定所述目标文本图像的第二清晰度值，并基于所述第二清晰度值，判断所述待评估文本图像是否满足预设的图像质量条件，若否，确定所述待评估文本图像的图像质量不满足条件，并输出重新上传图像质量满足条件的文本图像的提示信息。

在一种可能的实施方式中，所述第一确定模块62，具体用于若所述待评估文本图像为预设的理想图像尺寸，将所述待评估文本图像确定为目标文本图像；

在一种可能的实施方式中，所述判断模块64，具体用于根据每个所述目标文本图像的第二清晰度值，确定所述待评估文本图像的第三清晰度值，判断所述第三清晰度值是否大于预设的清晰度阈值，若否，确定所述待评估文本图像的图像质量不满足条件。

在一种可能的实施方式中，所述判断模块64，具体用于将所述目标文本图像的文本区域中每个像素点对应的第一清晰度值的平均值，确定为所述目标文本图像的第二清晰度值；

在一种可能的实施方式中，所述判断模块64，具体用于针对每个所述目标文本图像，若该目标文本图像的第二清晰度值大于预设的清晰度阈值，确定该目标文本图像的图像质量满足条件；并确定每个所述目标文本图像中，图像质量满足条件的目标文本图像的数量与目标文本图像总数量的比值，判断所述比值是否大于预设的比值阈值，若否，确定所述待评估文本图像的图像质量不满足条件。

在一种可能的实施方式中，所述判断模块63，还用于若所述待评估文本图像满足预设的图像质量条件，将所述待评估图像进行保存。

在一种可能的实施方式中，训练所述文本质量评估模型的过程包括：

在一种可能的实施方式中，确定所述样本类别标签和所述样本清晰度值的过程包括：

实施例8：

在上述各实施例的基础上，本发明实施例还提供了一种电子设备，图7为本发明实施例提供的一种电子设备结构示意图，如图7所示，该电子设备包括：处理器71、通信接口72、存储器73和通信总线74，其中，处理器71，通信接口72，存储器73通过通信总线74完成相互间的通信；

所述存储器73中存储有计算机程序，当所述程序被所述处理器71执行时，使得所述处理器71执行如下步骤：

在一种可能的实施方式中，处理器71，具体用于若所述待评估文本图像为预设的理想图像尺寸，将所述待评估文本图像确定为目标文本图像；

在一种可能的实施方式中，处理器71，具体用于根据每个所述目标文本图像的第二清晰度值，确定所述待评估文本图像的第三清晰度值，判断所述第三清晰度值是否大于预设的清晰度阈值，若否，确定所述待评估文本图像的图像质量不满足条件。

在一种可能的实施方式中，处理器71，具体用于将所述目标文本图像的文本区域中每个像素点对应的第一清晰度值的平均值，确定为所述目标文本图像的第二清晰度值；

在一种可能的实施方式中，处理器71，具体用于针对每个所述目标文本图像，若该目标文本图像的第二清晰度值大于预设的清晰度阈值，确定该目标文本图像的图像质量满足条件；并确定每个所述目标文本图像中，图像质量满足条件的目标文本图像的数量与目标文本图像总数量的比值，判断所述比值是否大于预设的比值阈值，若否，确定所述待评估文本图像的图像质量不满足条件。

在一种可能的实施方式中，处理器71，还用于若所述待评估文本图像满足预设的图像质量条件，将所述待评估图像进行保存。

由于上述电子设备解决问题的原理与文本图像质量评估方法相似，因此上述电子设备的实施可以参见方法的实施，重复之处不再赘述。

上述电子设备提到的通信总线可以是外设部件互连标准(Peripheral ComponentInterconnect，PCI)总线或扩展工业标准结构(Extended Industry StandardArchitecture，EISA)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示，图中仅用一条粗线表示，但并不表示仅有一根总线或一种类型的总线。

通信接口72用于上述电子设备与其他设备之间的通信。

存储器可以包括随机存取存储器(Random Access Memory，RAM)，也可以包括非易失性存储器(Non-Volatile Memory，NVM)，例如至少一个磁盘存储器。可选地，存储器还可以是至少一个位于远离前述处理器的存储装置。

上述处理器可以是通用处理器，包括中央处理器、网络处理器(NetworkProcessor，NP)等；还可以是数字指令处理器(Digital Signal Processing，DSP)、专用集成电路、现场可编程门陈列或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。

实施例9：

在上述各实施例的基础上，本发明实施例提供了一种计算机可读存储介质，所述计算机可读存储介质内存储有可由电子设备执行的计算机程序，当所述程序在所述电子设备上运行时，使得所述电子设备执行时实现如下步骤：

在一种可能的实施方式中，所述根据预设的理想图像尺寸，确定接收到的待评估文本图像对应的目标文本图像包括：

在一种可能的实施方式中，所述基于所述第二清晰度值，判断所述待评估文本图像是否满足预设的图像质量条件，若否，确定所述待评估文本图像的图像质量不满足条件包括：

在一种可能的实施方式中，根据每个所述第一清晰度值，确定所述目标文本图像的第二清晰度值包括：

在一种可能的实施方式中，若所述待评估文本图像满足预设的图像质量条件，所述方法还包括：

将所述待评估图像进行保存。

上述计算机可读存储介质可以是电子设备中的处理器能够存取的任何可用介质或数据存储设备，包括但不限于磁性存储器如软盘、硬盘、磁带、磁光盘(MO)等、光学存储器如CD、DVD、BD、HVD等、以及半导体存储器如ROM、EPROM、EEPROM、非易失性存储器(NANDFLASH)、固态硬盘(SSD)等。

本领域内的技术人员应明白，本申请的实施例可提供为方法、系统、或计算机程序产品。因此，本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本申请是参照根据本申请的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

显然，本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样，倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内，则本申请也意图包含这些改动和变型在内。

Claims

1.一种文本图像质量评估方法，其特征在于，所述方法包括：

根据每个所述第一清晰度值，确定所述目标文本图像的第二清晰度值，并基于所述第二清晰度值，判断所述待评估文本图像是否满足预设的图像质量条件，若否，确定所述待评估文本图像的图像质量不满足条件，并输出重新上传图像质量满足条件的文本图像的提示信息；

训练所述文本质量评估模型的过程包括：

根据预设的理想图像尺寸，确定样本集中包括的每个样本文本图像；获取样本集中任一样本文本图像，所述样本文本图像中每个像素点对应有样本类别标签，其中所述样本类别标签用于标识该像素点是否为文本；针对样本文本图像中的每个像素点，若该像素点为文本时，该像素点对应有样本清晰度值；将获取的所述样本文本图像输入原始文本质量评估模型，通过所述原始文本质量评估模型，确定所述样本文本图像中每个像素点的识别类别标签和对应的识别清晰度值；根据每个像素点的样本类别标签和识别类别标签是否一致，以及样本清晰度值和识别清晰度值是否一致，确定所述原始文本质量评估模型的识别结果是否准确，对所述原始文本质量评估模型进行训练，得到训练完成的文本质量评估模型；

其中，确定所述样本类别标签和所述样本清晰度值的过程包括：

识别所述样本文本图像中人工标注的任一文本框，其中所述文本框对应有人工标注的样本类别标签和样本清晰度值，将所述文本框对应的样本类别标签和样本清晰度值，确定为所述文本框中包含的多个像素点的样本类别标签和样本清晰度值；或者，

基于文本识别技术以文字为单位，逐字标注每个文字对应的样本类别标签和样本清晰度值，识别所述样本文本图像中包含的每个文字，针对每个文字，确定该文字对应的样本类别标签和样本清晰度值；并根据该文字的样本类别标签和样本清晰度值，确定该文字对应的每个像素点的样本类别标签和样本清晰度值。

2.根据权利要求1所述的方法，其特征在于，所述根据预设的理想图像尺寸，确定接收到的所述待评估文本图像对应的目标文本图像包括：

若所述待评估文本图像为非预设的理想图像尺寸，根据预设的理想图像尺寸，将所述待评估文本图像划分为至少一个目标文本图像，其中任一所述目标文本图像的图像尺寸均为预设的理想图像尺寸。

3.根据权利要求1或2所述的方法，其特征在于，所述基于所述第二清晰度值，判断所述待评估文本图像是否满足预设的图像质量条件，若否，确定所述待评估文本图像的图像质量不满足条件包括：

4.根据权利要求3所述的方法，其特征在于，所述根据每个所述第一清晰度值，确定所述目标文本图像的第二清晰度值包括：

所述根据每个所述目标文本图像的第二清晰度值，确定所述待评估文本图像的第三清晰度值包括：

5.根据权利要求1或2所述的方法，其特征在于，所述基于所述第二清晰度值，判断所述待评估文本图像是否满足预设的图像质量条件，若否，确定所述待评估文本图像的图像质量不满足条件包括：

6.一种文本图像质量评估装置，其特征在于，所述装置包括：

第二确定模块，用于将所述目标文本图像输入到预先训练完成的文本质量评估模型，确定所述目标文本图像的文本区域中每个像素点对应的第一清晰度值；其中，训练所述文本质量评估模型的过程包括：根据预设的理想图像尺寸，确定样本集中包括的每个样本文本图像；获取样本集中任一样本文本图像，所述样本文本图像中每个像素点对应有样本类别标签，其中所述样本类别标签用于标识该像素点是否为文本；针对样本文本图像中的每个像素点，若该像素点为文本时，该像素点对应有样本清晰度值；将获取的所述样本文本图像输入原始文本质量评估模型，通过所述原始文本质量评估模型，确定所述样本文本图像中每个像素点的识别类别标签和对应的识别清晰度值；根据每个像素点的样本类别标签和识别类别标签是否一致，以及样本清晰度值和识别清晰度值是否一致，确定所述原始文本质量评估模型的识别结果是否准确，对所述原始文本质量评估模型进行训练，得到训练完成的文本质量评估模型；

基于文本识别技术以文字为单位，逐字标注每个文字对应的样本类别标签和样本清晰度值，识别所述样本文本图像中包含的每个文字，针对每个文字，确定该文字对应的样本类别标签和样本清晰度值；并根据该文字的样本类别标签和样本清晰度值，确定该文字对应的每个像素点的样本类别标签和样本清晰度值；

7.一种电子设备，其特征在于，所述电子设备至少包括处理器和存储器，所述处理器用于执行存储器中存储的计算机程序时实现如权利要求1-5中任一所述文本图像质量评估方法的步骤。

8.一种计算机可读存储介质，其特征在于，其存储有计算机程序，所述计算机程序被处理器执行时实现如权利要求1-5中任一所述文本图像质量评估方法的步骤。