CN108647351A

CN108647351A - 文本图像的处理方法、装置、存储介质及终端

Info

Publication number: CN108647351A
Application number: CN201810468188.0A
Authority: CN
Inventors: 王宇鹭
Original assignee: Guangdong Oppo Mobile Telecommunications Corp Ltd
Current assignee: Guangdong Oppo Mobile Telecommunications Corp Ltd
Priority date: 2018-05-16
Filing date: 2018-05-16
Publication date: 2018-10-12
Anticipated expiration: 2038-05-16
Also published as: CN108647351B

Abstract

本申请实施例公开了一种文本图像的处理方法、装置、存储介质及终端，该方法包括：接收用户对选取的针对多个文本图像的清晰化处理指令；从所述多个文本图像中确定目标文本图像，所述目标文本图像的文本质量高于其余文本图像；对所述目标文本图像进行清晰化处理，并输出清晰化处理结果，能够节省系统资源。

Description

文本图像的处理方法、装置、存储介质及终端

技术领域

本申请实施例涉及移动终端技术领域，尤其涉及文本图像的处理方法、装置、存储介质及终端。

背景技术

随着移动终端拍照功能的不断发展，用户可以使用移动终端对同一文本进行多次拍照后，处理得到一张最清晰的文本图像。

但是，在选择最清晰的文本图像时，若预先不对拍摄的多张文本图像进行清晰化处理直接选择，容易导致预估的最清晰文本图像不准确；若预先对每张文本图像都进行清晰化处理后再进行选择，步骤繁琐，浪费系统资源。

发明内容

本申请实施例的目的是提供一种文本图像的处理方法、装置、存储介质及终端，可以节省系统资源

第一方面，本申请实施例提供了一种文本图像的处理方法，包括：

接收用户对选取的针对多个文本图像的清晰化处理指令；

根据所述多个文本图像确定目标文本图像，所述目标文本图像的文本质量高于其余文本图像；

对所述目标文本图像进行清晰化处理，并输出清晰化处理结果。

第二方面，本申请实施例提供了一种文本图像的处理装置，包括：

接收模块，用于接收用户对选取的针对多个文本图像的清晰化处理指令；

确定模块，用于根据所述接收模块接收的所述多个文本图像确定目标文本图像，所述目标文本图像的文本质量高于其余文本图像；

清晰化处理模块，用于对所述确定模块确定的所述目标文本图像进行清晰化处理；

输出模块，用于输出所述清晰化处理模块得到的清晰化处理结果。

第三方面，本申请实施例提供了一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现如第一方面所示的文本图像的处理方法。

第四方面，本申请实施例提供了一种终端，包括存储器，处理器及存储在存储器上并可在处理器运行的计算机程序，所述处理器执行所述计算机程序时实现如第一方面所示的文本图像的处理方法。

本申请实施例中提供的文本图像的处理方案，首先接收用户对选取的针对多个文本图像的清晰化处理指令；然后，根据多个文本图像确定目标文本图像，所述目标文本图像的文本质量高于其余文本图像；最后，对目标文本图像进行清晰化处理，并输出清晰化处理结果，简化了文本图像的处理步骤，能够节省系统资源。

附图说明

图1为本申请实施例提供的一种文本图像的处理方法的流程示意图；

图2为本申请实施例提供的另一种文本图像的处理方法的流程示意图；

图3为本申请实施例提供的另一种文本图像的处理方法的流程示意图；

图4为本申请实施例提供的另一种文本图像的处理方法的流程示意图；

图5为本申请实施例提供的另一种文本图像的处理方法的流程示意图；

图6为本申请实施例提供的另一种文本图像的处理方法的流程示意图；

图7为本申请实施例提供的一种文本图像的处理装置的结构示意图；

图8为本申请实施例提供的一种终端设备的结构示意图。

具体实施方式

下面结合附图并通过具体实施方式来进一步说明本申请的技术方案。可以理解的是，此处所描述的具体实施例仅仅用于解释本申请，而非对本申请的限定。另外还需要说明的是，为了便于描述，附图中仅示出了与本申请相关的部分而非全部结构。

在更加详细地讨论示例性实施例之前应当提到的是，一些示例性实施例被描述成作为流程图描绘的处理或方法。虽然流程图将各步骤描述成顺序的处理，但是其中的许多步骤可以被并行地、并发地或者同时实施。此外，各步骤的顺序可以被重新安排。当其操作完成时所述处理可以被终止，但是还可以具有未包括在附图中的附加步骤。所述处理可以对应于方法、函数、规程、子例程、子程序等等。

随着移动终端拍照功能的不断发展，用户可以使用移动终端对同一文本进行多次拍照后，处理得到一张最清晰的文本图像。但是，在选择最清晰的文本图像时，若预先不对拍摄的多张文本图像进行清晰化处理直接选择，容易导致预估的最清晰文本图像不准确；若预先对相同文本内容的文本图像都预先进行相同的清晰化处理后再进行选择，步骤繁琐。

本申请实施例提供了一种文本图像的处理方法，能够接收到用户的清晰化处理指令时，从用户选择的多个文本图像中确定高质量的目标文本图像，只对目标文本图像进行处理并输出处理结果，进而避免了对多个文本图像重复处理，简化了文本图像处理步骤，降低文本图像处理功耗的同时，能够节省系统资源。具体方案如下所示：

图1为本申请实施例提供的文本图像的处理方法的流程示意图，该方法用于终端对相同文本内容的多张文本图像进行处理的情况，该方法可以由自带图像处理功能的移动终端或安装有图像处理类应用程序(如美颜相机、美图秀秀等)的移动终端来执行，该移动终端可以为智能手机、平板电脑、可穿戴设备、笔记本电脑等，该方法具体包括如下步骤：

步骤110、接收用户对选取的针对多个文本图像的清晰化处理指令。

多个文本图像可以是针对相同文本内容拍摄的多张文本图像。用户选取多个文本图像可以是在文本图像存储单元(如移动终端的图库)中通过点选或框选的方式选取。针对多个文本图像的清晰化处理指令可以是用来控制文本图像进行处理操作的指令，目的是为了在清晰化处理后从多个文本图像中确定出文本质量最高的文本图像。可选的，针对多个文本图像的清晰化处理指令可以包括：曝光控制、白平衡控制、多帧降噪、直方图调整、对比度调节、平滑去噪或细节锐化等处理操作中的一个或多个的组合。其中，该指令中所包括的处理操作可以是系统默认的，也可以是由用户根据自身需求预先设定的。

用户对选取的针对多个文本图像的清晰化处理指令可以是用户点击清晰化处理按键后触发的指令，包括一个或多个清晰化处理操作，例如，可以是用户点击显示屏上图像处理界面上的“一键清晰”按键后触发的清晰化处理指令。清晰化处理指令也可以是包括用户在多个可选的清晰化处理操作中触发的一个或多个子清晰化处理按键产生的指令。例如，可以是用户在对同一文本内容拍摄了多张照片后，想通过对拍摄的多张照片进行清晰化处理后选出文本质量最高的一张，此时，可以从多个可供选择的清晰化处理操作中，选择一些常用的清晰化处理子操作(如白平衡控制、多帧降噪和对比度调节等)，由各清晰化处理子操作共同触发的清晰化处理指令。

本申请实施例中，接收用户对选取的针对多个文本图像的清晰化处理指令，可以从中获取待处理的多个文本图像以及要对多个文本图像进行的具体清晰化处理操作。

步骤120、根据多个文本图像确定目标文本图像。

其中，目标文本图像的文本质量高于其余文本图像。

本申请实施例中，从多个文本图像中确定目标文本图像，也就是从多个文本图像中确定出文本质量最高的文本图像作为目标图像，确定目标文本图像的方法有很多，本申请对此不进行限定。例如，可以是基于多个文本图像的统计特征，确定目标文本图像，具体的，先计算文本图像的像素均值、标准差和平均梯度，然后均衡各文本图像的均值、标准差和平均梯度确定出质量最高的目标文本图像。其中，均值反应文本图像的平均亮度，在一定范围内均值越大，图像质量越好；平均亮度标准差反应文本图像中灰度值相对于均值的离散程度，在一定范围内标准差越大，图像质量越好；平均梯度反映文本图像的清晰程度，在一定范围内平均梯度越大，图像清晰度越高。也可以是从图像的构图参数、色彩参数、曝光参数、倾斜角度参数、文本完整性等多维度对各文本图像进行分析评分，选择综合评分最高的文本图像作为质量最高的目标文本图像。

步骤130、对目标文本图像进行清晰化处理，并输出清晰化处理结果。

在对目标文本图像进行清晰化处理时，可以是依据用户针对多个文本图像的清晰化处理指令，对目标文本图像执行清晰化处理。在对目标文本图像进行清晰化处理时，各清晰化处理子操作步骤顺序不同会导致最后的处理结果也不同。因此，可以按照用户触发的清晰化处理操作步骤序列，依次执行各清晰化处理子操作步骤。为了避免用户不了解各清晰化处理子操作步骤的最佳执行顺序，移动终端也可以在用户触发的清晰化处理操作步骤序列不合理的情况下，自动对用户触发的清晰化处理子操作步骤进行排序后，按照排序顺序依次执行各清晰化处理子操作步骤。

对目标文本图像进行清晰化处理后，可以通过移动终端的显示屏向用户显示输出的清晰化处理结果。

本申请实施例中提供的文本图像的处理方法，首先接收用户对选取的针对多个文本图像的清晰化处理指令；然后，从多个文本图像中确定目标文本图像，所述目标文本图像的文本质量高于其余文本图像；最后，对目标文本图像进行清晰化处理，并输出清晰化处理结果。相对于对多个文本图像都进行清晰化处理，再选择文本质量高的文本图像，本申请实施例能够在接收到用户的清晰化处理指令后，从多个文本图像中确定目标文本图像进行清晰化处理，并输出处理结果，简化了文本图像处理步骤，降低文本图像处理功耗的同时，能够节省系统资源。

图2为本申请实施例提供的另一种文本图像的处理方法的流程示意图，作为对上述实施例的进一步说明，包括：

步骤210、接收用户对选取的针对多个文本图像的清晰化处理指令。

步骤220、根据至少一个评分参数对多个文本图像进行评分，得到每个文本图像的评分结果。

其中，评分参数包括构图参数、色彩参数、曝光参数、倾斜角度参数、文本完整性参数中的一个或多个的组合。

可选的，可以预先为各评分参数都设置一个与其对应的评分体系，例如，评分参数中色彩参数的评分体系可以是针对文本图像的白平衡指标进行评判，当图像的红、绿、蓝三基色的灰度值比趋近于1：1：1时，文本图像的色彩最趋近于真实文本内容，此时色彩参数评分最高。按照各评分体系对文本图像的各评分参数进行评分。

本申请实施例中，若评分参数为一个，则将该评分结果作为文本图像的评分结果。若评分参数为多个，则可以是对每个文本图像的各评分参数对应的评分结果求均值，得到该文本图像的评分结果；也可以是为每个文本图像的各评分参数设置权重值，计算各评分参数的加权评分得到该文本图像的评分结果。可选的，各评分参数的权重值可以是移动终端根据文本图像的特性默认设置的，例如，对于文本图像文本的完整度尤为重要，而构图参数相对来说就不那么重要，因此，可以将文本完整度的评分参数权重值设置的大些，将构图参数的评分参数权重值设置的小些。也可以是用户根据自身的需求手动设置的。

步骤230、判断每个文本图像的评分结果是否均小于预设评分阈值。

预设评分阈值可以是在确保文本图像质量的前提下，综合文本图像评分结果和文本图像的质量设置的最低评分值。可以由系统默认分析设置，还可以由用户根据自身需求进行预先设置。

可选的，为了避免拍摄的多个文本图像质量都不是很好，即使对评分最高的图像进行清晰化处理，也得不到清晰文本图像的情况，可以在确定目标文本图像前，判断每个文本图像的评分结果是否均小于评分阈值，若均小于评分阈值，说明多个文本图像质量都不是很高，则执行步骤240，对各文本图像进一步处理后再确定目标文本图像；若未均小于评分阈值，说明多个文本图像中存在满足图像质量要求的文本图像，则执行步骤280，从多个文本图像中确定目标文本图像。

步骤240、当每个文本图像的评分结果均小于预设评分阈值时，对多个文本图像中的至少两个文本图像进行分割，得到每个文本图像对应的多个分割区域。

如果每个文本图像的评分结果均小于预设评分阈值，说明多个文本图像的质量都不是很好，可以从多个文本图像中选择评分结果相对高的至少两个文本图像进行分割处理，例如，可以是在多个文本中选择评分结果靠前的预设个数的文本图像，还可以是移动终端根据多个文本图像的实际评分结果设置一个分割评分阈值，选择评分结果高于分割评分阈值的至少两个文本图像。

对选出的至少两个文本图像进行分割时，可以是将各文本图像按照统一的分割规则进行图像的分割。可选的，分割规则可以是将文本图像按面积平均分割为多个规则区域，例如，可以是将各文本图像分割为田字格状的四个规则区域。也可以是将文本图像先按照背景和文字分割为两部分，再对背景部分和/或文字部分进行进一步的分割。例如，可以是将文本图像按照背景和文字分割为两部分后，若文字部分面积比较大，则可以将文字部分按段落进行进一步的分割；若背景部分面积较大，则可以将背景部分进行平均分割。

步骤250、计算分割区域的评分分数。

对分割区域进行评分可以与对每个文本图像进行评分的方法一样，从构图参数、色彩参数、曝光参数、倾斜角度参数、文本完整性参数中的一个或多个维度对各文本图像的各分割区域进行评分。也可以是根据各分割区域的属性特征，为各分割区域设置不同的评分体系，例如，文本图像的背景分割区域通常比较单一，可以着重对图像的噪声进行评分，防止后期清晰化处理时将噪声误认为文字，给清晰化处理结果造成干扰；而文字分割区域着重从清晰度和完整度方面进行评分，保证文本图像文字部分的准确性。

步骤260、根据评分分数确定多个目标分割区域。

其中，目标分割区域可以是从各文本图像的同一分割区域选出的图像质量最高的分割区域，例如，可以是从各图像对应的同一分割区域中，选择评分最高的分割区域作为目标分割区域。

根据各文本图像的各分割区域的评分结果确定多个目标分割区域时，可以是对各文本图像的每一相同的分割区域都确定出对应的一个目标分割区。可选的，若各文本图像的某一相同分割区域的评分结果都不是很高，可以对该类的多个分割区域采用与步骤250和步骤260相同的方法进行再次分割，选出多个子目标分割区域。

步骤270、将多个目标分割区域合并为目标文本图像。

将评分结果较高的多个目标分割区域进行合并后即可得到质量较高的目标文本图像。

可选的，目标文本图像是由各文本图像中质量较高的分割区域合并而成的，在各分割区域的连接处可能出现明显的界限，例如，两个相邻分割区域虽然评分结果都很高，但是两个分割区域的亮度不同，导致目标文本图像中两分割区域有明显的界限。为了避免这种情况的出现，可以是在步骤250对各分割区域进行评分时，对各评分参数设置权重值来减少选出的各目标分割区域之间的差异。例如，将评分参数中色彩参数、曝光参数的权重设置的大一些，从而保证选出的各目标分割区域的亮度、色彩或分辨率相差不大。还可以对合并后的目标文本图像进行预处理操作，消除各分割区域之间的亮度、色彩或分辨率等差距。例如，可以对各分割区域的亮度、色彩或分辨率进行均衡处理，来减少边界差异。可选的，对目标文本图像进行预处理操作可以是在合并后进行，也可以是在执行步骤290时，结合清晰化处理操作结果进一步执行预处理操作。

步骤280、根据每个文本图像的评分结果确定目标文本图像。

如果存在文本图像的评分结果大于或等于预设评分阈值时，可以是根据文本图像的评分结果，从多个评分大于或等于预设评分阈值的文本图像中选出评分结果最高的文本图像作为目标文本图像。

步骤290、对目标文本图像进行清晰化处理，并输出清晰化处理结果。

本申请实施例提供的文本图像的处理方法，能够接收到用户的清晰化处理指令后，根据至少一个评分参数对多个文本图像进行评分，若评分结果均小于评分阈值则需要对多个目标文本图像分割后合并为目标文本图像，进行清晰化处理并输出处理结果，保证了目标文本图像选择的准确性，只对目标文本图像进行清晰化处理，简化了文本图像处理步骤，降低文本图像处理功耗的同时，能够节省系统资源。

图3为本申请实施例提供的另一种文本图像的处理方法的流程示意图，作为对上述实施例的进一步说明，包括：

步骤310、接收用户对选取的针对多个文本图像的清晰化处理指令。

步骤320、根据至少一个评分参数对多个文本图像进行评分，得到每个文本图像的评分结果。

步骤330、判断每个文本图像的评分结果是否均小于预设评分阈值。

判断每个文本图像的评分结果是否均小于评分阈值，若均小于评分阈值，说明多个文本图像质量都不是很高，则执行步骤340，通过识别文本图像中的文字数据及其文本属性信息对文字图像区域进行修复形成目标文本图像；若未均小于评分阈值，说明多个文本图像中存在满足图像质量要求的文本图像，则执行步骤370，从多个文本图像中确定目标文本图像。

步骤340、当每个文本图像的评分结果均小于预设评分阈值时，识别文本图像中的文字数据以及文字数据的文本属性信息。

文字数据可以是文本图像中的文字内容信息，该文字数据包括文本图像中的文字、字母或数字中的至少一个。文本属性信息即描述文字数据的属性信息，包括文字在图像中的位置、大小、字体、粗细等。由于本申请的多个文本图像是针对同一文本内容的图像，因此，本申请的多个文本图像都对应相同的文本数据和文本数据属性信息。

本申请实施例中，对识别的文本图像不作限定，可以是选择评分结果相对最高的一个文本图像作为识别图像，只识别评分最高的文本图像中的文字数据以及文字数据的文本属性信息；也可以是对多个文本图像都进行文字数据和文本属性信息的识别，将多个文本图像的识别结果进行融合得到最终的文字数据和文本属性信息。

文本图像通常包括文字部分和简单的背景部分，而背景部分单一，对文本图像的评分影响不大，所以，评分结果高低主要依据文字部分的质量。如果每个文本图像的评分结果均小于预设评分阈值，说明拍摄的多个文本图像的文字图像区域的质量不高，此时可以识别文本图像的文字数据以及其文本属性信息。可选的，识别文本图像中的文字数据以及文字数据的文本属性信息的时候可以是通过文字识别(optical character recognition，OCR)算法识别文字数据及其文本属性信息。例如，可以是通过OCR算法先定位文本图像中文字数据所在的位置，然后再进一步识别获取该位置处的文字内容信息、文字的位置、颜色、字体以及粗细等。

可选的，为了避免识别文本数据及其文本属性信息时发生错误，可以向用户显示识别结果，若接收到用户的确认指令后再执行步骤350，若接收到用户的修改指令，根据用户输入的修改内容对识别内容修改后在执行步骤350。

步骤350、删除文本图像的文字图像区域。

文字图像区域是文本图像中文字数据所占区域，删除文字图像区域的文本图像可以是评分结果相对最高的一个文本图像，也可以是选择文字图像中背景区域质量最好的文本图像，还可以是将多个文本图像融合后的文本图像，例如，由多个文本图像的各像素灰度值的平均值形成的新的文本图像。

步骤360、根据文本属性信息将文本数据填充文字图像区域对应的图像区域，得到目标文本图像。

将识别到的文字数据按照其文本属性信息(如文字所在位置、大小、字体、粗细等)填充到删除的文字图像区域所对应的位置，此时形成的目标文本图像文字内容清晰，能够提高目标文本图像的文本质量。

步骤370、根据每个文本图像的评分结果确定目标文本图像。

步骤380、对目标文本图像进行清晰化处理，并输出清晰化处理结果。

本申请实施例提供的文本图像的处理方法，能够接收到用户的清晰化处理指令后，根据至少一个评分参数对多个文本图像进行评分，若评分结果均小于评分阈值则识别文本图像的文字数据及其文本属性信息，替换文本图像中的文字数据形成目标文本图像，进行清晰化处理并输出处理结果，保证了目标文本图像选择的准确性，只对目标文本图像进行清晰化处理，简化了文本图像处理步骤，降低文本图像处理功耗的同时，能够节省系统资源。

图4为本申请实施例提供的另一种文本图像的处理方法的流程示意图，作为对上述实施例的进一步说明，包括：

步骤410、接收用户对选取的针对多个文本图像的清晰化处理指令。

步骤420、获取多个文本图像的图片方向。

图片方向可以是由移动终端的拍摄角度或拍摄物体自身角度决定的。在获取多个文本的图片方向时，可以是依据文本图像特有的文字区域边缘明显的特征，以文本图像边缘为基准，根据文字区域边缘几何特征与基准的相对旋转角度来预估文本图像的图片方向，例如，文字区域的边缘呈长方形，若长方形的四条边与文本图像的边缘不平行，说明文本图像是存在倾斜角度的，进一步通过四条边与文本图像边缘所呈角度来估算文本图像的图片方向。还可以是用户从多个文本图像中选出一个文本图像作为基准图像，系统将其余文本图像分别与基准图像进行比对，确定各文本图像的图片方向。

步骤430、判断图片方向是否与预设图片方向一致。

预设的图片方向可以是系统默认的文本图像边缘的方向，也可以是用户根据自身需求设定的图片方向。判断多个文本图像的图片方向与预设图片方向是否一致，若不一致，执行步骤440，调整文本图像的图片方向；若一致，执行步骤450，从多个文本图像中确定目标文本图像。

步骤440、当图片方向与预设图片方向不一致时，将多个文本图像的图片方向调整为预设图片方向。

如果图片方向与预设图片方向不一致，将文本图像的图片方向调整为预设图片方向时，可以是将文本图像整体旋转至预设图片方向。由于文本图像的背景单一，最重要的是文字图像区域，因此，在调整文本图像的图片方向时也可以是只将文字图像区域旋转至预设图片方向。

步骤450、从多个文本图像中确定目标文本图像。

从多个文本图像(包括调整过图片方向的文本图像和/或没有调整过图片方向的文本图像)中确定目标文本图像。

步骤460、对目标文本图像进行清晰化处理，并输出清晰化处理结果。

本申请实施例提供的文本图像的处理方法，能够将文本图像的图片方向调至预设图片方向后再从多个文本图像中确定目标文本图像进行清晰化处理，并输出处理结果，保证了文本图像清晰化处理结果的准确性，降低文本图像处理功耗的同时，能够节省系统资源。

图5为本申请实施例提供的另一种文本图像的处理方法的流程示意图，作为对上述实施例的进一步说明，包括：

步骤510、接收用户对选取的针对多个文本图像的清晰化处理指令。

步骤520、判断文本图像中是否存在非文本对象。

非文本对象包括图形对象或线条对象。例如，可以是文本图像中的表格、图表、图标等非文本对象。

判断文本图像中是否存在非文本对象时，可以是通过大量样本训练非文本对象识别模型，由训练好的非文本对象识别模型来判断文本图像中是否存在非文本对象。还可以是通过ORC算法对文本图像中的内容进行识别，若存在无法识别的对象，则说明文本图像中存在非文本对象。为了防止自动判断时出现误判，也可以是在移动终端判断错误时，用户手动进行判断结果的修改。例如，移动终端在自动判断后会将判断结果显示在移动终端的显示屏上，若用户发现出现误判，则可点击错误按钮，若系统判断正确，则点击确认按钮。

可选的，由于多个文本图像拍摄的是相同文本内容，所以若存在非文本对象，说明每个文本图像中都存在，因此判断文本图像中是否存在非文本对象时可以是对多个文本图像中的任意一个文本图像进行判断，可以是对所有的文本图像进行判断，从多个判断结果中确定最终判断结果。例如，可以是若达到预设个数的判断结果都是存在时，说明存在非文本对象；也可以是默认多数判断结果。

判断文本图像中是否存在非文本对象，若存在，则执行步骤530，截取文本图像中的非文本对象；若不存在，执行步骤540，根据多个文本图像确定目标文本图像。

步骤530、当文本图像中存在非文本对象时，从文本图像中截取非文本对象，得到仅包含文本数据的文本图像。

本申请实施例中，从文本图像中截取非文本对象可以包括，从多个文本图像中将各文本图像中的非文本对象删除以及获取非文本对象及其属性信息(例如，非文本对象的位置、颜色、尺寸等)。可选的，可以将截取的非文本图像及其属性信息缓存在非文本图像缓存区，以供后期再次添加非文本对象时使用。

从文本图像中截取非文本对象，得到仅包含文本数据的文本图像，后期只从仅包含文本数据的文本图像确定目标文本图像进行清晰化处理，避免了非文本对象对清晰化处理带来的干扰，还可以提高清晰化处理的效率。

步骤540、根据仅包含文本数据的文本图像确定目标文本图像。

根据仅包含文本数据的文本图像(包括截取了非文本对象的文本图像或没有截取过非文本对象的原始文本图像)确定目标文本图像。

步骤550、对目标文本图像进行清晰化处理。

步骤560、判断文本图像中是否存在非文本对象。

再次判断用户选择的多个文本图像中是否存在非文本对象，若存在，则执行步骤570，将截取的非文本对象添加到清晰化处理结果中；若不存在，则执行步骤590，直接输出清晰化处理结果。

步骤570、将非文本对象添加到清晰化处理结果中；

原始的文本图像中是存在非文本对象的，只是为了避免非文本对象对清晰化处理带来干扰，在确定目标文本图像前将文本图像中的非文本对象删除了，因此，为了保证输出清晰化处理结果的准确性，要将前期删除的非文本对象添加到清晰化处理结果中。可选的在添加非文本对象时，可以从缓存区获取非文本对象及其属性信息，依据属性信息在清晰化处理结果中添加非文本对象。

可选的，在添加非文本对象后还可以对非文本对象进行相应的处理，例如，非文本对象为表格，但是添加到清晰化处理结果后，发现表格的线条不清晰或有断点，此时可以对表格的线条进行清晰处理或进行修复处理。

步骤580、输出添加非文本对象的清晰化处理结果。

步骤590、输出清晰化处理结果。

本申请实施例提供的文本图像的处理方法，能够截取文本图像中的非文本对象后，从多个文本图像中确定目标文本图像进行清晰化处理，在清晰化处理结果中添加非文本对象后输出处理结果，保证了文本图像清晰化处理结果的准确性，降低文本图像处理功耗的同时，能够节省系统资源。

图6为本申请实施例提供的另一种文本图像的处理方法的流程示意图，作为对上述实施例的进一步说明，包括：

步骤610、接收用户对选取的针对多个文本图像的清晰化处理指令。

步骤620、从多个文本图像中确定目标文本图像。

步骤630、判断所述目标文本图像中是否包含不完整文字。

对于文本图像而言，文字区域是否完整尤为重要，因此在进行清晰化处理时要先判断目标文本图像中是否包含不完整文字区域，可选的，文本图像不完整可以包括文字区域缺失或模糊等。例如，可能是拍摄时对焦不准确导致的文字模糊不清；还可能是拍摄时由于亮度过强导致的文字部分缺失。

可选的，判断目标文本图像中是否包含不完整文字区域可以是移动终端自动进行判断的，例如，移动终端结合文字区域所特有的特征，识别目标文本图像，若识别到文字区域出现空白，则说明文字区域不完整。还可以是人工进行判断，例如，可以是在预览界面向用户显示目标文本图像供用户人工进行判断，若用户发现第二图像中包含不完整的文字区域，则会触发对文字区域进行修复发指令。

判断第二图像中是否包含不完整文字区域，若包含则要执行步骤640先对文字区域进行修复，若不包含，则可执行步骤650对目标文本图像进行清晰化处理。

步骤640、当所述目标文本图像中包含不完整文字时，将修补不完整文字，得到完整的目标文本图像。

如果目标文本图像中包含不完整的文字区域，对文字区域进行修补方法本申请不做限定，例如，若不完整文字区域是文字模糊造成的，可以通过文字内容识别工具识别模糊的文字内容，然后将识别出的文字替代文字区域的原有的文字，以达到对文字区域的修补。若不完整文字区域是文字缺失造成的，则需要判断缺失的文字部分是否能通过语义分析工具确定缺失文字，若可以，则可以将确定的缺失文字补入文字缺失区域，若文字缺失内容较多无法通过语义分析工具确定时，可以通过提示用户输入缺失文字，根据用户输入的缺失文字对文字区域进行修补。

可选的，若用户发现对文字区域修补后出现了错误，可以对错误的部分进行修改，例如，用户可以在目标文本图像中选出错误的文字区域，点击修改按键后，在修改界面输入正确的文字，点击确认后，系统会自动替换出错文字。

步骤650、对完整的目标文本图像进行清晰化处理。

若目标文本图像中包含不完整文字，修补后得到完整的目标文本图像，对完整的目标文本图像进行清晰化处理；若目标文本图像本身就是完整的，则可以直接对完整的目标文本图像进行清晰化处理。

步骤660、输出清晰化处理结果。

本申请实施例提供的文本图像的处理方法，能够在从多个文本图像中确定目标文本图像后，在对目标文本图像处理时先修补目标文本图像中的不完整文字再进行清晰化处理，并输出处理结果，保证了文本图像清晰化处理结果的准确性，降低文本图像处理功耗的同时，能够节省系统资源。

图7为本申请实施例提供的一种文本图像的处理装置的结构示意图。如图7所示，该装置包括：接收模块710，确定模块720，清晰化处理模块730，输出模块740。

接收模块710，用于接收用户对选取的针对多个文本图像的清晰化处理指令；

确定模块720，用于根据所述接收模块710接收的所述多个文本图像确定目标文本图像，所述目标文本图像的文本质量高于其余文本图像；

清晰化处理模块730，用于对所述确定模块720确定的所述目标文本图像进行清晰化处理；

输出模块740，用于输出所述清晰化处理模块730得到的清晰化处理结果。

进一步的，确定模块720用于，根据至少一个评分参数对所述多个文本图像进行评分，得到每个文本图像的评分结果，所述评分参数包括构图参数、色彩参数、曝光参数、倾斜角度参数、文本完整性参数中的一个或多个的组合；

根据所述每个文本图像的评分结果确定目标文本图像。

进一步的，确定模块720用于，判断所述每个文本图像的评分结果是否均小于预设评分阈值；

当所述每个文本图像的评分结果均小于预设评分阈值时，对所述多个文本图像中的至少两个文本图像进行分割，得到每个文本图像对应的多个分割区域；

计算所述分割区域的评分分数；

根据所述评分分数确定多个目标分割区域；

将所述多个目标分割区域合并为目标文本图像。

当所述每个文本图像的评分结果均小于预设评分阈值时，识别文本图像中的文字数据以及所述文字数据的文本属性信息；

删除所述文本图像的文字图像区域；

根据所述文本属性信息将所述文本数据填充所述文字图像区域对应的图像区域，得到目标文本图像。

进一步的，上述装置还包括：

图片方向获取模块，用于获取所述多个文本图像的图片方向；

图片方向判断模块，用于判断所述图片方向是否与预设图片方向一致；

图片方向调整模块，用于当所述图片方向与预设图片方向不一致时，将所述多个文本图像的图片方向调整为所述预设图片方向。

进一步的，确定模块720用于，判断所述文本图像中是否存在非文本对象，所述非文本对象包括图形对象或线条对象；

当所述文本图像中存在非文本对象时，从所述文本图像中截取所述非文本对象，得到仅包含文本数据的文本图像；

根据所述仅包含文本数据的文本图像确定目标文本图像；

相应的，输出模块740用于，将所述非文本对象添加到所述清晰化处理结果中；

输出添加所述非文本对象的清晰化处理结果。

进一步的，清晰化处理模块730用于，判断所述目标文本图像中是否包含不完整文字；

当所述目标文本图像中包含不完整文字时，修补所述不完整文字，得到完整的目标文本图像；

对所述完整的目标文本图像进行清晰化处理。

本申请实施例中提供的文本图像的处理装置，首先接收模块710接收用户对选取的针对多个文本图像的清晰化处理指令；然后，确定模块720从多个文本图像中确定目标文本图像，所述目标文本图像的文本质量高于其余文本图像；最后，清晰化处理模块730对目标文本图像进行清晰化处理，输出模块740输出清晰化处理结果。相对于对多个文本图像都进行清晰化处理，再选择文本质量高的文本图像，本申请实施例能够在接收到用户的清晰化处理指令后，从多个文本图像中确定目标文本图像进行清晰化处理，并输出处理结果，简化了文本图像处理步骤，降低文本图像处理功耗的同时，能够节省系统资源。

上述装置可执行本申请前述所有实施例所提供的方法，具备执行上述方法相应的功能模块和有益效果。未在本实施例中详尽描述的技术细节，可参见本申请前述所有实施例所提供的方法。

图8是本申请实施例提供的一种终端设备的结构示意图。如图8所示，该终端可以包括：壳体(图中未示出)、存储器801、中央处理器(Central Processing Unit，CPU)802(又称处理器，以下简称CPU)、存储在存储器801上并可在处理器802上运行的计算机程序、电路板(图中未示出)和电源电路(图中未示出)。所述电路板安置在所述壳体围成的空间内部；所述CPU802和所述存储器801设置在所述电路板上；所述电源电路，用于为所述终端的各个电路或器件供电；所述存储器801，用于存储可执行程序代码；所述CPU802通过读取所述存储器801中存储的可执行程序代码来运行与所述可执行程序代码对应的程序。

所述终端还包括：外设接口803、RF(Radio Frequency，射频)电路805、音频电路806、扬声器811、电源管理芯片808、输入/输出(I/O)子系统809、触摸屏812、其他输入/控制设备810以及外部端口804，这些部件通过一个或多个通信总线或信号线807来通信。

应该理解的是，图示终端设备800仅仅是终端的一个范例，并且终端设备800可以具有比图中所示出的更多的或者更少的部件，可以组合两个或更多的部件，或者可以具有不同的部件配置。图中所示出的各种部件可以在包括一个或多个信号处理和/或专用集成电路在内的硬件、软件、或硬件和软件的组合中实现。

下面就本实施例提供的用于一种终端设备进行详细的描述，该终端设备以智能手机为例。

存储器801，所述存储器801可以被CPU802、外设接口803等访问，所述存储器801可以包括高速随机存取存储器，还可以包括非易失性存储器，例如一个或多个磁盘存储器件、闪存器件、或其他易失性固态存储器件。

外设接口803，所述外设接口803可以将设备的输入和输出外设连接到CPU802和存储器801。

I/O子系统809，所述I/O子系统809可以将设备上的输入输出外设，例如触摸屏812和其他输入/控制设备810，连接到外设接口803。I/O子系统809可以包括显示控制器8091和用于控制其他输入/控制设备810的一个或多个输入控制器8092。其中，一个或多个输入控制器8092从其他输入/控制设备810接收电信号或者向其他输入/控制设备810发送电信号，其他输入/控制设备810可以包括物理按钮(按压按钮、摇臂按钮等)、拨号盘、滑动开关、操纵杆、点击滚轮。值得说明的是，输入控制器8092可以与以下任一个连接：键盘、红外端口、USB接口以及诸如鼠标的指示设备。

其中，按照触摸屏的工作原理和传输信息的介质分类，触摸屏812可以为电阻式、电容感应式、红外线式或表面声波式。按照安装方式分类，触摸屏812可以为：外挂式、内置式或整体式。按照技术原理分类，触摸屏812可以为：矢量压力传感技术触摸屏、电阻技术触摸屏、电容技术触摸屏、红外线技术触摸屏或表面声波技术触摸屏。

触摸屏812，所述触摸屏812是用户终端与用户之间的输入接口和输出接口，将可视输出显示给用户，可视输出可以包括图形、文本、图标、视频等。可选的，触摸屏812将用户在触屏幕上触发的电信号(如接触面的电信号)，发送给处理器802。

I/O子系统809中的显示控制器8091从触摸屏812接收电信号或者向触摸屏812发送电信号。触摸屏812检测触摸屏上的接触，显示控制器8091将检测到的接触转换为与显示在触摸屏812上的用户界面对象的交互，即实现人机交互，显示在触摸屏812上的用户界面对象可以是运行游戏的图标、联网到相应网络的图标等。值得说明的是，设备还可以包括光鼠，光鼠是不显示可视输出的触摸敏感表面，或者是由触摸屏形成的触摸敏感表面的延伸。

RF电路805，主要用于建立智能音箱与无线网络(即网络侧)的通信，实现智能音箱与无线网络的数据接收和发送。例如收发短信息、电子邮件等。

音频电路806，主要用于从外设接口803接收音频数据，将该音频数据转换为电信号，并且将该电信号发送给扬声器811。

扬声器811，用于将智能音箱通过RF电路805从无线网络接收的语音信号，还原为声音并向用户播放该声音。

电源管理芯片808，用于为CPU802、I/O子系统及外设接口所连接的硬件进行供电及电源管理。

在本实施例中，中央处理器802用于：

接收用户对选取的针对多个文本图像的清晰化处理指令；

进一步的，所述根据所述多个文本图像确定目标文本图像，包括：

根据至少一个评分参数对所述多个文本图像进行评分，得到每个文本图像的评分结果，所述评分参数包括构图参数、色彩参数、曝光参数、倾斜角度参数、文本完整性参数中的一个或多个的组合；

根据所述每个文本图像的评分结果确定目标文本图像。

计算所述分割区域的评分分数；

根据所述评分分数确定多个目标分割区域；

将所述多个目标分割区域合并为目标文本图像。

进一步的，所述从所述多个文本图像中确定目标文本图像，包括：

删除所述文本图像的文字图像区域；

进一步的，在所述从所述多个文本图像中确定目标文本图像之前，包括：

获取所述多个文本图像的图片方向；

当所述图片方向与预设图片方向不一致时，将所述多个文本图像的图片方向调整为所述预设图片方向。

当所述文本图像中存在非文本对象时，从所述文本图像中截取所述非文本对象，得到仅包含文本数据的文本图像，所述非文本对象包括图形对象或线条对象；

根据所述仅包含文本数据的文本图像确定目标文本图像；

相应的，所述输出清晰化处理结果，包括：

将所述非文本对象添加到所述清晰化处理结果中；

输出添加所述非文本对象的清晰化处理结果。

进一步的，所述对所述目标文本图像进行清晰化处理，包括：

对所述完整的目标文本图像进行清晰化处理。

本申请实施例还提供一种包含终端设备可执行指令的存储介质，所述终端设备可执行指令在由终端设备处理器执行时用于执行一种文本图像的处理方法，该方法包括：

接收用户对选取的针对多个文本图像的清晰化处理指令；

根据所述每个文本图像的评分结果确定目标文本图像。

计算所述分割区域的评分分数；

根据所述评分分数确定多个目标分割区域；

将所述多个目标分割区域合并为目标文本图像。

删除所述文本图像的文字图像区域；

获取所述多个文本图像的图片方向；

根据所述仅包含文本数据的文本图像确定目标文本图像；

相应的，所述输出清晰化处理结果，包括：

将所述非文本对象添加到所述清晰化处理结果中；

输出添加所述非文本对象的清晰化处理结果。

对所述完整的目标文本图像进行清晰化处理。

本申请实施例的计算机存储介质，可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件，或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括：具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中，计算机可读存储介质可以是任何包含或存储程序的有形介质，该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。

计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号，其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式，包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质，该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。

计算机可读介质上包含的程序代码可以用任何适当的介质传输，包括——但不限于无线、电线、光缆、RF等等，或者上述的任意合适的组合。

可以以一种或多种程序设计语言或其组合来编写用于执行本申请操作的计算机程序代码，程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++，还包括常规的过程式程序设计语言—诸如”C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中，远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机，或者，可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。

当然，本申请实施例所提供的一种包含计算机可执行指令的存储介质,其计算机可执行指令不限于如上所述的文本图像的处理操作，还可以执行本申请任意实施例所提供的文本图像的处理方法中的相关操作。

注意，上述仅为本申请的较佳实施例及所运用技术原理。本领域技术人员会理解，本申请不限于这里所述的特定实施例，对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本申请的保护范围。因此，虽然通过以上实施例对本申请进行了较为详细的说明，但是本申请不仅仅限于以上实施例，在不脱离本申请构思的情况下，还可以包括更多其他等效实施例，而本申请的范围由所附的权利要求范围决定。

Claims

1.一种文本图像的处理方法，其特征在于，包括：

接收用户对选取的针对多个文本图像的清晰化处理指令；

2.根据权利要求1所述的文本图像的处理方法，其特征在于，所述根据所述多个文本图像确定目标文本图像，包括：

根据所述每个文本图像的评分结果确定目标文本图像。

3.根据权利要求2所述的文本图像的处理方法，其特征在于，所述根据所述多个文本图像确定目标文本图像，包括：

计算所述分割区域的评分分数；

根据所述评分分数确定多个目标分割区域；

将所述多个目标分割区域合并为目标文本图像。

4.根据权利要求2所述的文本图像的处理方法，其特征在于，所述从所述多个文本图像中确定目标文本图像，包括：

删除所述文本图像的文字图像区域；

5.根据权利要求1所述的文本图像的处理方法，其特征在于，在所述从所述多个文本图像中确定目标文本图像之前，包括：

获取所述多个文本图像的图片方向；

6.根据权利要求1所述的文本图像的处理方法，其特征在于，所述根据所述多个文本图像确定目标文本图像，包括：

根据所述仅包含文本数据的文本图像确定目标文本图像；

相应的，所述输出清晰化处理结果，包括：

将所述非文本对象添加到所述清晰化处理结果中；

输出添加所述非文本对象的清晰化处理结果。

7.根据权利要求1所述的文本图像的处理方法，其特征在于，所述对所述目标文本图像进行清晰化处理，包括：

对所述完整的目标文本图像进行清晰化处理。

8.一种文本图像的处理装置，其特征在于，包括：

9.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，该程序被处理器执行时实现如权利要求1-7中任一所述文本图像的处理方法。

10.一种终端，包括存储器，处理器及存储在存储器上并可在处理器运行的计算机程序，其特征在于，所述处理器执行所述计算机程序时实现如权利要求1-7任一所述的文本图像的处理方法。