CN116485920A

CN116485920A - 字符颜色处理方法、装置、设备及存储介质

Info

Publication number: CN116485920A
Application number: CN202310429187.6A
Authority: CN
Inventors: 兴百桥
Original assignee: Shenzhen Xingtong Technology Co ltd
Current assignee: Shenzhen Xingtong Technology Co ltd
Priority date: 2023-04-14
Filing date: 2023-04-14
Publication date: 2023-07-25

Abstract

本公开涉及一种字符颜色处理方法、装置、设备及存储介质。该方法包括：对待处理页的题目图像数据进行字符区块检测和字符分割处理，得到题目图像数据的目标字符区块和字符分割图，其中，目标字符区块中各字符对应第一二值化信息，字符分割图包含各字符的第二二值化信息；基于各字符的第一二值化信息和各字符的第二二值化信息，确定各字符的目标二值化信息；基于字符的目标二值化信息，对题目图像数据中各字符的初始颜色值进行处理，得到题目图像数据中各字符的目标颜色值。由此，对题目图像数据同时进行字符区块检测和字符分割处理，防止出现字符漏检的问题，并基于各字符的目标二值化信息统一字符的颜色，不会出现未进行颜色统一的字符。

Description

字符颜色处理方法、装置、设备及存储介质

技术领域

本公开涉及计算机技术领域，尤其涉及一种字符颜色处理方法、装置、设备及存储介质。

背景技术

近年来，学生采用的教辅书各种各样，教辅书上推荐的题目是从题库中选择的，由于题库中的题目来源众多，题目图像中的字符颜色不统一，采用字符颜色不统一的题目图像进行排版时，美观性较差，也会影响学生的答题效率和答题准确性。

为了提高题目图像排版的美观性，相关技术中首先从题目图像中分割出字符，然后对分割后的字符进行颜色处理，使得将题目图像中的字符统一处理成相同的颜色，并基于颜色处理处理后的字符进行题目排版。然而，字符分割过程中容易出现字符丢失的问题，导致颜色处理之后依然存在少量的字符未进行颜色处理，使得字符的颜色处理结果的可靠性较差。

发明内容

为了解决上述技术问题，本公开提供了一种字符颜色处理方法、装置、设备及存储介质。

第一方面，本公开提供了一种字符颜色处理方法，该方法包括：

对待处理页的题目图像数据进行字符区块检测，确定所述题目图像数据中的目标字符区块，以及对所述题目图像数据进行字符分割处理，得到所述题目图像数据的字符分割图，其中，所述目标字符区块中各字符对应第一二值化信息，所述字符分割图包含各字符的第二二值化信息；

基于所述各字符的第一二值化信息和所述各字符的第二二值化信息，确定所述各字符的目标二值化信息；

基于所述各字符的目标二值化信息，对所述题目图像数据中各字符的初始颜色值进行处理，得到所述题目图像数据中各字符的目标颜色值。

第二方面，本公开提供了一种字符颜色处理装置，该装置包括：

检测模块，用于对待处理页的题目图像数据进行字符区块检测，确定所述题目图像数据中的目标字符区块，其中，所述目标字符区块中各字符对应第一二值化信息；

分割模块，用于对所述题目图像数据进行字符分割处理，得到所述题目图像数据的字符分割图，其中，所述字符分割图包含各字符的第二二值化信息；

确定模块，用于基于所述各字符的第一二值化信息和所述各字符的第二二值化信息，确定所述各字符的目标二值化信息；

颜色处理模块，用于基于所述各字符的目标二值化信息，对所述题目图像数据中各字符的初始颜色值进行处理，得到所述题目图像数据中各字符的目标颜色值。

第三方面，本公开实施例还提供了一种电子设备，该设备包括：

处理器；

存储器，用于存储可执行指令；

其中，处理器用于从存储器中读取可执行指令，并执行可执行指令以实现上述第一方面所提供的方法。

第四方面，本公开实施例还提供了一种计算机可读存储介质，其上存储有计算机程序，其中，存储介质存储有计算机程序，当计算机程序被处理器执行时，使得处理器实现上述第一方面所提供的方法。

本公开实施例提供的技术方案与现有技术相比具有如下优点：

本公开实施例的一种字符颜色处理方法、装置、设备及存储介质，对待处理页的题目图像数据进行字符区块检测，确定题目图像数据中的目标字符区块，以及对题目图像数据进行字符分割处理，得到题目图像数据的字符分割图，其中，目标字符区块中各字符对应第一二值化信息，字符分割图包含各字符的第二二值化信息；基于各字符的第一二值化信息和各字符的第二二值化信息，确定各字符的目标二值化信息；基于字符的目标二值化信息，对所题目图像数据中各字符的初始颜色值进行处理，得到题目图像数据中各字符的目标颜色值。由此，当对字符颜色进行处理时，对题目图像数据同时进行字符区块检测和字符分割处理，防止出现字符漏检的问题，得到所有字符的二值化信息，并基于各字符的二值化信息统一字符的颜色，不会出现未进行颜色统一的字符，保证了字符的颜色处理结果的可靠性。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本公开的实施例，并与说明书一起用于解释本公开的原理。

为了更清楚地说明本公开实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，对于本领域普通技术人员而言，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1为本公开实施例提供的一种字符颜色处理方法的流程示意图；

图2为本公开实施例提供的一种字符颜色处理方法的逻辑示意图；

图3为本公开实施例提供的一种字符颜色处理装置的结构示意图；

图4为本公开实施例提供的一种电子设备的结构示意图。

具体实施方式

下面将参照附图更详细地描述本公开的实施例。虽然附图中显示了本公开的某些实施例，然而应当理解的是，本公开可以通过各种形式来实现，而且不应该被解释为限于这里阐述的实施例，相反提供这些实施例是为了更加透彻和完整地理解本公开。应当理解的是，本公开的附图及实施例仅用于示例性作用，并非用于限制本公开的保护范围。

应当理解，本公开的方法实施方式中记载的各个步骤可以按照不同的顺序执行，和/或并行执行。此外，方法实施方式可以包括附加的步骤和/或省略执行示出的步骤。本公开的范围在此方面不受限制。

本文使用的术语“包括”及其变形是开放性包括，即“包括但不限于”。术语“基于”是“至少部分地基于”。术语“一个实施例”表示“至少一个实施例”；术语“另一实施例”表示“至少一个另外的实施例”；术语“一些实施例”表示“至少一些实施例”。其他术语的相关定义将在下文描述中给出。需要注意，本公开中提及的“第一”、“第二”等概念仅用于对不同的装置、模块或单元进行区分，并非用于限定这些装置、模块或单元所执行的功能的顺序或者相互依存关系。

需要注意，本公开中提及的“一个”、“多个”的修饰是示意性而非限制性的，本领域技术人员应当理解，除非在上下文另有明确指出，否则应该理解为“一个或多个”。

本公开实施方式中的多个装置之间所交互的消息或者信息的名称仅用于说明性的目的，而并不是用于对这些消息或信息的范围进行限制。

相关技术中，字符颜色的处理方案一般基于字符分割模型从题目图像数据中分割出字符，然后对分割出的字符统一颜色。然而，基于字符分割模型的字符分割方法容易出现字符丢失的问题，导致颜色处理之后依然存在少量的字符未进行颜色处理。相关技术还采用基于图像二值化方法，从题目图像数据中提取各字符的二值化信息，并基于各字符的二值化信息对字符统一颜色，但是，基于图像的二值化方法容易出现图像二值化失败的问题，使得题目图像数据中的部分字符无法提取到二值化信息，导致题目图像中的部分字符无法进行颜色统一。

综上，基于相关技术中的字符颜色处理方式，容易出现题目图像中的部分字符的颜色无法统一的问题，导致字符颜色处理结果的可靠性较差。

为了提高字符颜色处理结果的可靠性，下面结合图1至图2对本公开实施例提供的字符颜色处理方法进行说明。在本公开实施例中，该字符颜色处理方法可以由电子设备或服务器执行。其中，电子设备可以包括移动电话、平板电脑、台式计算机、笔记本电脑等具有通信功能的设备。服务器可以是云服务器或者服务器集群等具有存储及计算功能的设备。需要说明的是，以下实施例以电子设备作为执行主体进行示例性的解释。

图1示出了本公开实施例提供的一种字符颜色处理方法的流程示意图。

如图1所示，该字符颜色处理方法可以包括如下步骤。

S110、对待处理页的题目图像数据进行字符区块检测，确定题目图像数据中的目标字符区块，以及对题目图像数据进行字符分割处理，得到题目图像数据的字符分割图，其中，目标字符区块中各字符对应第一二值化信息，字符分割图包含各字符的第二二值化信息。

在本实施例中，当对教辅书中的字符颜色进行统一时，获取教辅书中的任意一个页面作为待处理页，待处理页中包含多个题目，获取待处理页的题目图像数据，然后对题目图像数据中的各字符进行颜色统一处理。

在一些实施例中，从题目图像数据中去除多个连通域区块，并将剩余的区块作为目标字符区块，目标字符区块的各字符对应第一二值化信息。可选的，去除的多个连通域区块可以包括但不限于插图区块、噪声区块以及与插图交集较大的区块。

在另一些实施例中，对题目图像数据进行单字符检测，并将检测到的单字符区块作为题目图像数据中的目标字符区块，目标字符区块的各字符对应第一二值化信息。

在本公开实施例中，对题目图像数据进行字符分割之前，对题目图像数据进行预处理，例如将题目图像数据缩放至标准大小或者进行数据标准化处理，然后对预处理之后的题目图像数据进行字符分割处理，得到字符分割图，字符分割图中各字符对应第二二值化信息。可选的，利用预先训练的字符分割模型、平均分割算法以及颜色填充分割算法(CFS)等方式，对题目图像数据进行字符分割处理，得到字符分割图。

由此，当对字符颜色进行处理时，对题目图像数据同时进行字符区块检测和字符分割处理，防止出现字符漏检的问题，得到所有字符的二值化信息。

S120、基于各字符的第一二值化信息和各字符的第二二值化信息，确定各字符的目标二值化信息。

可以理解的是，对题目图像数据进行字符区块检测可能存在字符漏检问题，对题目图像数据进行字符分割处理可能出现二值化信息发生丢失，结合各字符的第一二值化信息和各字符的第二二值化信息，可以尽可能的防止部分字符笔画的二值化信息丢失。基于此原因，S120具体包括：将各字符的第一二值化信息和各字符的第二二值化信息相加，得到各字符的目标二值化信息。

其中，目标二值化信息是题目图像中所有字符的二值化信息。

进一步的，将各字符的目标二值化信息与预设二值化阈值比较，将大于预设二值化阈值的目标二值化信息的字符确定为字符像素点，并将小于预设二值化阈值的目标二值化信息的字符确定为背景像素点。可选的，预设二值化阈值可以是0，字符像素点的目标二值化信息为1，背景像素点的目标二值化信息为0。

S130、基于各字符的目标二值化信息，对题目图像数据中各字符的初始颜色值进行处理，得到题目图像数据中各字符的目标颜色值。

在本实施例中，可选的，S130具体包括：

S1301、获取预设的背景图，并确定预设的背景图中各像素点的颜色值；

S1302、基于各字符的目标二值化信息以及预设的背景图中各像素点的颜色值，对题目图像数据中各字符的初始颜色值进行处理，得到题目图像数据中各字符的目标颜色值。

其中，S1302具体包括：将各字符的初始颜色值与各字符的目标二值化信息相乘，得到第一乘积；将各字符的目标二值化信息的相反数与目标值相加，并将相反数与目标值的和与预设的背景图中各像素点的颜色值相乘，得到第二乘积；计算第一乘积和第二乘积的和，得到题目图像数据中各字符的目标颜色值。

可选的，各字符的目标颜色值可以通过如下方式确定：

Img_out＝Fcolor*MSK+Img_bg*(1-MSK)

其中，Img_out是各字符的目标颜色值，MSK是各字符的目标二值化信息，具体是字符像素点的目标二值化信息为1，背景像素点的目标二值化信息为0，Fcolor是各字符的初始颜色值，Img_bg是预设的背景图中各像素点的颜色值。

通过上述公式，各字符的初始颜色值与目标二值化信息1相乘后变为字体颜色值，字符的初始颜色值与目标二值化信息0相乘后变为背景像素值，(1-目标二值化信息1)与背景像素值相乘后，变为0，(1-目标二值化信息0)与背景像素值相乘后，变为背景像素。由此，将各字符的初始颜色与背景图相加组成一个前景和背景共存的图像，得到各字符的目标颜色值。

本公开实施例提供了一种字符颜色处理方法，对待处理页的题目图像数据进行字符区块检测，确定题目图像数据中的目标字符区块，以及对题目图像数据进行字符分割处理，得到题目图像数据的字符分割图，其中，目标字符区块中各字符对应第一二值化信息，字符分割图包含各字符的第二二值化信息；基于各字符的第一二值化信息和各字符的第二二值化信息，确定各字符的目标二值化信息；基于字符的目标二值化信息，对所题目图像数据中各字符的初始颜色值进行处理，得到题目图像数据中各字符的目标颜色值。由此，当对字符颜色进行处理时，对题目图像数据同时进行字符区块检测和字符分割处理，防止出现字符漏检的问题，得到所有字符的二值化信息，并基于各字符的二值化信息统一字符的颜色，不会出现未进行颜色统一的字符，保证了字符的颜色处理结果的可靠性。

可以理解的是，题目图像数据中可能存在尺寸较多的插图，为了避免插图对字符颜色处理产生影响，首先对题目图像数据进行预处理，例如，将题目图像数据缩放至标准大小或者进行数据标准化等，然后去除题目图像数据中的插图，得到去除插图的题目图像数据，再对去除插图的题目图像数据中的字符进行颜色处理。

在本实施例中，在S110之前，该方法还包括：对待处理页的题目图像数据进行插图去除处理，得到插图去除后的题目图像数据；

相应的，S110具体包括：对插图去除后的题目图像数据进行字符区块检测，确定题目图像数据中的目标字符区块，以及对插图去除后的题目图像数据进行字符分割处理，得到题目图像数据的字符分割图。

其中，对待处理页的题目图像数据进行插图去除处理，得到插图去除后的题目图像数据，包括：利用预先训练的插图检测模型，对题目图像数据进行插图检测处理，确定题目图像数据中的多个插图，并将多个插图从题目图像数据中去除，得到插图去除后的题目图像数据。

其中，预先训练的插图检测模型可以是YOLOv系列的模型，具体可以是YOLOv7模型。在其他实施例中，预先训练的插图检测模型还可以是SSD、mask-rcnn等模型。

由此，在对题目图像数据进行字符区块检测以及字符分割处理之前，对题目图像数据进行插图去除处理，能够避免插图对字符颜色处理产生影响，有利于提高字符区块检测以及字符分割处理过程的精度。

在本公开另一种实施方式中，通过两种方式对题目图像数据进行字符区块检测，得到题目图像数据中的目标字符区块，并采用字符分割模型对题目图像数据进行字符分割处理，得到题目图像的字符分割图。

在本公开一些实施例中，S110中“对待处理页的题目图像数据进行字符区块检测，确定题目图像数据中的目标字符区块”，包括：

S1101、对题目图像数据进行区块去除处理，得到第一字符检测区块；

S1102、对题目图像数据进行单字符检测处理，得到第二字符检测区块；

S1103、合并第一字符检测区块和所述第二字符检测区块，得到目标字符区块。

其中，S1101具体包括：S1、对题目图像数据进行二值化处理，生成题目二值图像；S2、对题目二值图像进行连通域分析，得到多个连通域区块；S3、根据多个连通域区块的区块信息，从题目图像数据中去除多个目标连通域区块，并将剩余的区块作为第一字符检测区块。

具体的，首先采用诸如OTSU二值化、固定阈值二值化以及自适应二值化等方式对题目图像数据进行二值化处理，得到题目二值化图像，然后对题目二值图像进行连通域分析，得到多个连通域区块，并确定每个连通域区块的区块信息，接着基于多个连通域区块的区块信息去除多个目标连通域区块，得到第一字符加测区块。

其中，S3中“根据多个连通域区块的区块信息，从题目图像数据中去除多个目标连通域区块”，包括：在区块信息是每个连通域区块的区块尺寸的情况下，从题目图像数据中确定区块尺寸大于或等于第一尺寸阈值的第一类区块，将第一类区块作为目标连通域区块并去除；和/或，在区块信息是每个连通域区块的区块尺寸的情况下，从题目图像数据中去除区块尺寸大于或等于第二尺寸阈值的第二类区块，将第二类区块作为目标连通域区块并去除；和/或，在区块信息是每个连通域区块与插图的交集范围的情况下，从题目图像数据中去除交集区块范围大于或等于预设交集范围阈值的第三类区块，将第三类区块作为目标连通域区块并去除。

其中，每个连通域区块的区块尺寸包括但不限于平均宽度Wr、平均高度Hr、平均宽度Wr*平均高度Hr。

其中，第一类区块是题目图像数据中的插图区块，插图区块比字符大很多，则需要将插图区块进行过滤。

在一些实施例中，区块尺寸是当前区块的平均宽度Wr，第一尺寸阈值是区块平均宽度Wavg*插图宽度阈值W1，若当前区块的平均宽度Wr>区块平均宽度Wavg*插图宽度阈值W1，则当前区块属于第一类区块，将第一类区块作为目标连通域区块并去除。

在另一些实施例中，区块尺寸是当前区块的平均高度Hr，第一尺寸阈值是区块平均高度Hr*插图高度阈值W2，若当前区块的平均高度Hr>区块平均高度Havg*插图高度阈值W2，则当前区块属于第一类区块，将第一类区块作为目标连通域区块并去除。

在又一些实施例中，区块尺寸是当前区块的平均高度Hr*平均宽度Wr，第一尺寸阈值是区块平均高度Havg*区块平均宽度Wavg*插图面积阈值W3，若当前区块的平均高度Hr*平均宽度Wr>区块平均高度Havg*区块平均宽度Wavg*插图面积阈值W3，则当前区块属于第一类区块，将第一类区块作为目标连通域区块并去除。

其中，第二类区块是题目图像数据中的噪声区块，具体可以是椒盐噪声区块，噪声区块比字符大，则需要将噪声区块进行过滤。

具体的，区块尺寸是当前区块的平均高度Hr*平均宽度Wr，第二尺寸阈值是区块平均高度Hr*插图面积阈值W3，若当前区块的平均高度Hr*平均宽度Wr>区块平均高度Havg*区块平均宽度Wavg*插图面积阈值W3，则当前区块属于第二类区块，将第二类区块作为目标连通域区块并去除。

其中，第三类区块是与插图交集较大的噪声区块。可以理解的是，若交集越大，说明该区块也是题目插图，应该被滤除，相反的，若交集较小，说明该区块属于题目插图的可能性较小，则将该区块保留。

其中，交集范围根据每个连通域区块与插图相交的像素点的位置确定。预设交集范围阈值是根据经验预选确定的。

其中，S1102具体包括：利用预先训练的单字符检测模型，对题目图像数据进行单字符检测处理，得到第二字符检测区块。

具体的，在对题目图像数据进行单字符检测处理之前，可以对题目图像数据进行预处理，例如，将题目图像数据缩放至标准大小，或者，对题目图像数据进行数据标准化处理，然后将题目图像数据输入预先训练的单字符检测模型，利用单字符检测模型对题目图像数据进行前向推理，检测题目图像数据中单个字符的位置信息，基于单个字符的位置信息确定第二字符检测区块。

可选的，预先训练的单字符检测模型包括但不限于YOLOv5、SSD模型等。

可以理解的是，单独采用区块去除处理或者单字符检测处理方式进行字符区块检测时，容易出现字符漏检的问题，为了对字符进行全面检测，结合区块去除处理方式和单字符检测处理方式进行字符检测，并将检测得到的第一字符检测区块和第二字符检测区块进行合并，得到题目图像数据的目标字符区块，避免出现字符漏检的问题，提高了字符检测结果的可靠性。

在本公开一些实施例中，S110中“对题目图像数据进行字符分割处理，得到题目图像数据的字符分割图”，包括：利用预先训练的字符分割模型，对题目图像数据进行字符分割处理，得到题目图像数据的字符分割图。

具体的，在对题目图像数据进行字符分割处理之前，可以对题目图像数据进行预处理，例如，将题目图像数据缩放至标准大小，或者，对题目图像数据进行数据标准化处理，然后将题目图像数据输入预先训练的字符分割模型，利用预先训练的字符分割模型对题目图像数据进行前向推理，确定各字符的第二二值化信息，并基于各字符的第二二值化信息以及各字符的位置，生成字符分割图。

可选的，预先训练的字符分割模型包括但不限于U2net、U2net系列的其他模型以及PointRend模型等。

在其他实施例中，还可以从题目图像数据中检测各字符的位置信息，并基于各字符的位置信息，从题目图像数据中分割出多个字符，并确定各字符的二值化信息，基于各字符以及各字符的二值化信息，生成题目图像数据的字符分割图。

进一步的，将各字符的第一二值化信息和各字符的第二二值化信息相加，得到各字符的目标二值化信息，使得利用各字符的目标二值化信息进行颜色统一处理。

综上，首先使用传统的区块去除方式以及单字符模型检测方式一起检测字符区块，确定各字符的第一二值化信息，能够防止字符漏检，然后再利用字符分割模型确定各字符的第二二值化信息，最终利用各字符的第一二值化信息以及各字符的第二二值化信息一起进行字符颜色处理，因此，避免出现未进行颜色统一的字符，保证了字符的颜色处理结果的可靠性。

在本公开又一种实施方式中，对字符颜色处理方法进行整体解释。

图2示出了本公开实施例提供的一种字符颜色处理方法的逻辑示意图。

如图2所示，该字符颜色处理方法可以包括如下步骤。

S210、输入待处理页的题目图像数据。

S220、对待处理页的题目图像数据进行插图去除处理，得到插图去除后的题目图像数据。

具体的，利用预先训练的插图检测模型，对题目图像数据进行插图检测处理，确定题目图像数据中的多个插图，并将多个插图从所述题目图像数据中去除，得到插图去除后的题目图像数据。

S230、从插图去除后的题目图像数据中提取各字符的目标二值化信息。

其中，S230具体包括：对插图去除后的题目图像数据进行字符区块检测，确定目标字符区块，以及对插图去除后的题目图像数据进行字符分割处理，得到字符分割图，其中，目标字符区块中各字符对应第一二值化信息，字符分割图包含各字符的第二二值化信息；合并第一字符检测区块和第二字符检测区块，得到目标字符区块。

其中，对插图去除后的题目图像数据进行字符区块检测，确定目标字符区块，包括：对插图去除后的题目图像数据进行区块去除处理，得到第一字符检测区块；对插图去除后的题目图像数据进行单字符检测处理，得到第二字符检测区块；合并第一字符检测区块和第二字符检测区块，得到目标字符区块。

其中，对插图去除后的题目图像数据进行字符分割处理，得到字符分割图，包括：利用预先训练的单字符检测模型，对题目图像数据进行单字符检测处理，得到第二字符检测区块。

其中，对插图去除后的题目图像数据进行字符分割处理，得到字符分割图，包括：利用预先训练的字符分割模型，对插图去除后的题目图像数据进行字符分割处理，得到字符分割图。

S240、基于各字符的目标二值化信息，对题目图像数据中各字符的初始颜色值进行处理，得到题目图像数据中各字符的目标颜色值。

其中，S240具体包括：获取预设的背景图，并确定预设的背景图中各像素点的颜色值；基于各字符的目标二值化信息以及预设的背景图中各像素点的颜色值，对题目图像数据中各字符的初始颜色值进行处理，得到题目图像数据中各字符的目标颜色值。

本公开实施例还提供了一种用于实现上述的字符颜色处理方法的字符颜色处理装置，下面结合图3进行说明。在本公开实施例中，该字符颜色处理装置可以为电子设备或服务器。其中，电子设备可以包括移动电话、平板电脑、台式计算机、笔记本电脑等具有通信功能的设备。服务器可以是云服务器或者服务器集群等具有存储及计算功能的设备。

图3示出了本公开实施例提供的一种字符颜色处理装置的结构示意图。

如图3所示，字符颜色处理装置300可以包括：

检测模块310，用于对待处理页的题目图像数据进行字符区块检测，确定所述题目图像数据中的目标字符区块，其中，所述目标字符区块中各字符对应第一二值化信息；

分割模块320，用于对所述题目图像数据进行字符分割处理，得到所述题目图像数据的字符分割图，其中，所述字符分割图包含各字符的第二二值化信息；

确定模块330，用于基于所述各字符的第一二值化信息和所述各字符的第二二值化信息，确定所述各字符的目标二值化信息；

颜色处理模块340，用于基于所述各字符的目标二值化信息，对所述题目图像数据中各字符的初始颜色值进行处理，得到所述题目图像数据中各字符的目标颜色值。

本公开实施例提供了一种字符颜色处理装置，对待处理页的题目图像数据进行字符区块检测，确定题目图像数据中的目标字符区块，以及对题目图像数据进行字符分割处理，得到题目图像数据的字符分割图，其中，目标字符区块中各字符对应第一二值化信息，字符分割图包含各字符的第二二值化信息；基于各字符的第一二值化信息和各字符的第二二值化信息，确定各字符的目标二值化信息；基于字符的目标二值化信息，对所题目图像数据中各字符的初始颜色值进行处理，得到题目图像数据中各字符的目标颜色值。由此，当对字符颜色进行处理时，对题目图像数据同时进行字符区块检测和字符分割处理，防止出现字符漏检的问题，得到所有字符的二值化信息，并基于各字符的二值化信息统一字符的颜色，不会出现未进行颜色统一的字符，保证了字符的颜色处理结果的可靠性。

在一些可选的实施例中，检测模块310，包括：

区块去除单元，用于对所述题目图像数据进行区块去除处理，得到第一字符检测区块；

单字符检测单元，用于对所述题目图像数据进行单字符检测处理，得到第二字符检测区块；

区块合并单元，用于合并所述第一字符检测区块和所述第二字符检测区块，得到所述目标字符区块。

在一些可选的实施例中，区块去除单元具体用于：

对所述题目图像数据进行二值化处理，生成题目二值图像；

对所述题目二值图像进行连通域分析，得到多个连通域区块；

根据所述多个连通域区块的区块信息，从所述题目图像数据中去除多个目标连通域区块，并将剩余的区块作为所述第一字符检测区块。

在一些可选的实施例中，区块去除单元具体用于：

在所述区块信息是每个连通域区块的区块尺寸的情况下，从所述题目图像数据中确定所述区块尺寸大于或等于第一尺寸阈值的第一类区块，将所述第一类区块作为所述目标连通域区块并去除；和/或，

在所述区块信息是每个连通域区块的区块尺寸的情况下，从所述题目图像数据中去除所述区块尺寸大于或等于第二尺寸阈值的第二类区块，将所述第二类区块作为所述目标连通域区块并去除；和/或，

在所述区块信息是每个连通域区块与插图的交集范围的情况下，从所述题目图像数据中去除所述交集区块范围大于或等于预设交集范围阈值的第三类区块，将所述第三类区块作为所述目标连通域区块并去除。

在一些可选的实施例中，单字符检测单元具体用于：

利用预先训练的单字符检测模型，对所述题目图像数据进行单字符检测处理，得到所述第二字符检测区块。

在一些可选的实施例中，分割模块320具体用于：

利用预先训练的字符分割模型，对所述题目图像数据进行字符分割处理，得到所述题目图像数据的字符分割图。

在一些可选的实施例中，确定模块330具体用于：

将所述各字符的第一二值化信息和所述各字符的第二二值化信息相加，得到所述各字符的目标二值化信息。

在一些可选的实施例中，颜色处理模块340，包括：

获取单元，用于获取预设的背景图，并确定所述预设的背景图中各像素点的颜色值；

颜色处理单元，用于基于所述各字符的目标二值化信息以及所述预设的背景图中各像素点的颜色值，对所述题目图像数据中各字符的初始颜色值进行处理，得到所述题目图像数据中各字符的目标颜色值。

在一些可选的实施例中，颜色处理单元具体用于：

将所述各字符的初始颜色值与所述各字符的目标二值化信息相乘，得到第一乘积；

将所述各字符的目标二值化信息的相反数与目标值相加，并将所述相反数与目标值的和与所述预设的背景图中各像素点的颜色值相乘，得到第二乘积；

计算所述第一乘积和所述第二乘积的和，得到所述题目图像数据中各字符的目标颜色值。

在一些可选的实施例中，该装置还包括：

插图去除模块，用于对待处理页的题目图像数据进行插图去除处理，得到插图去除后的题目图像数据；

相应的，检测模块310具体用于：

对所述插图去除后的题目图像数据进行字符区块检测，确定所述题目图像数据中的目标字符区块；

相应的，分割模块320具体用于：

对所述插图去除后的题目图像数据进行字符分割处理，得到所述题目图像数据的字符分割图。

在一些可选的实施例中，插图去除模块具体用于：

利用预先训练的插图检测模型，对所述题目图像数据进行插图检测处理，确定所述题目图像数据中的多个插图，并将所述多个插图从所述题目图像数据中去除，得到所述插图去除后的题目图像数据。

需要说明的是，图3所示的字符颜色处理装置300可以执行图1至图2所示的方法实施例中的各个步骤，并且实现图1至图2所示的方法实施例中的各个过程和效果，在此不做赘述。

本公开示例性实施例还提供一种电子设备，包括：至少一个处理器；以及与至少一个处理器通信连接的存储器。存储器存储有能够被至少一个处理器执行的计算机程序，计算机程序在被至少一个处理器执行时用于使电子设备执行根据本公开实施例的方法。

本公开示例性实施例还提供一种存储有计算机程序的非瞬时计算机可读存储介质，其中，计算机程序在被计算机的处理器执行时用于使计算机执行根据本公开实施例的方法。

本公开示例性实施例还提供一种计算机程序产品，包括计算机程序，其中，计算机程序在被计算机的处理器执行时用于使计算机执行根据本公开实施例的方法。

参考图4，现将描述可以作为本公开的服务器或客户端的电子设备400的结构框图，其是可以应用于本公开的各方面的硬件设备的示例，该电子设备400可以是上述电子设备。电子设备旨在表示各种形式的数字电子的计算机设备，诸如，膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置，诸如，个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例，并且不意在限制本文中描述的和/或者要求的本公开的实现。

如图4所示，电子设备400包括计算单元401，其可以根据存储在只读存储器(ROM)402中的计算机程序或者从存储单元408加载到随机访问存储器(RAM)403中的计算机程序，来执行各种适当的动作和处理。在RAM403中，还可存储电子设备400操作所需的各种程序和数据。计算单元401、ROM402以及RAM403通过总线404彼此相连。输入/输出(I/O)接口405也连接至总线404。

电子设备400中的多个部件连接至I/O接口405，包括：输入单元406、输出单元407、存储单元408以及通信单元409。输入单元406可以是能向电子设备400输入信息的任何类型的设备，输入单元406可以接收输入的数字或字符信息，以及产生与电子设备的用户设置和/或功能控制有关的键信号输入。输出单元407可以是能呈现信息的任何类型的设备，并且可以包括但不限于显示器、扬声器、视频/音频输出终端、振动器和/或打印机。存储单元408可以包括但不限于磁盘、光盘。通信单元409允许电子设备400通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据，并且可以包括但不限于调制解调器、网卡、红外通信设备、无线通信收发机和/或芯片组，例如蓝牙TM设备、WiFi设备、WiMax设备、蜂窝通信设备和/或类似物。

计算单元401可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元401的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。计算单元401执行上文所描述的各个方法和处理。例如，在一些实施例中，字符颜色处理方法可被实现为计算机软件程序，其被有形地包含于机器可读介质，例如存储单元408。在一些实施例中，计算机程序的部分或者全部可以经由ROM402和/或通信单元409而被载入和/或安装到电子设备400上。在一些实施例中，计算单元401可以通过其他任何适当的方式(例如，借助于固件)而被配置为执行字符颜色处理方法。

用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器，使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行，作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。

在本公开的上下文中，机器可读介质可以是有形的介质，其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备，或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。

如本公开使用的，术语“机器可读介质”和“计算机可读介质”指的是用于将机器指令和/或数据提供给可编程处理器的任何计算机程序产品、设备、和/或装置(例如，磁盘、光盘、存储器、可编程逻辑装置(PLD))，包括，接收作为机器可读信号的机器指令的机器可读介质。术语“机器可读信号”指的是用于将机器指令和/或数据提供给可编程处理器的任何信号。

为了提供与用户的交互，可以在计算机上实施此处描述的系统和技术，该计算机具有：用于向用户显示信息的显示装置(例如，CRT(阴极射线管)或者LCD(液晶显示器)监视器)；以及键盘和指向装置(例如，鼠标或者轨迹球)，用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互；例如，提供给用户的反馈可以是任何形式的传感反馈(例如，视觉反馈、听觉反馈、或者触觉反馈)；并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。

可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如，作为数据服务器)、或者包括中间件部件的计算系统(例如，应用服务器)、或者包括前端部件的计算系统(例如，具有图形用户界面或者网络浏览器的用户计算机，用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如，通信网络)来将系统的部件相互连接。通信网络的示例包括：局域网(LAN)、广域网(WAN)和互联网。

计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。

需要说明的是，在本文中，诸如“第一”和“第二”等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括要素的过程、方法、物品或者设备中还存在另外的相同要素。

以上仅是本公开的具体实施方式，使本领域技术人员能够理解或实现本公开。对这些实施例的多种修改对本领域的技术人员来说将是显而易见的，本文中所定义的一般原理可以在不脱离本公开的精神或范围的情况下，在其它实施例中实现。因此，本公开将不会被限制于本文的这些实施例，而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims

1.一种字符颜色处理方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，所述对待处理页的题目图像数据进行字符区块检测，确定所述题目图像数据中的目标字符区块，包括：

对所述题目图像数据进行区块去除处理，得到第一字符检测区块；

对所述题目图像数据进行单字符检测处理，得到第二字符检测区块；

合并所述第一字符检测区块和所述第二字符检测区块，得到所述目标字符区块。

3.根据权利要求2所述的方法，其特征在于，所述对所述题目图像数据进行区块去除处理，得到第一字符检测区块，包括：

对所述题目图像数据进行二值化处理，生成题目二值图像；

4.根据权利要求3所述的方法，其特征在于，所述根据所述多个连通域区块的区块信息，从所述题目图像数据中去除多个目标连通域区块，包括：

5.根据权利要求2所述的方法，其特征在于，所述对所述题目图像数据进行单字符检测处理，得到第二字符检测区块，包括：

6.根据权利要求1所述的方法，其特征在于，所述对所述题目图像数据进行字符分割处理，得到所述题目图像数据的字符分割图，包括：

7.根据权利要求1所述的方法，其特征在于，所述基于所述各字符的第一二值化信息和所述各字符的第二二值化信息，确定所述各字符的目标二值化信息，包括：

8.根据权利要求1所述的方法，其特征在于，所述基于所述各字符的目标二值化信息，对所述题目图像数据中各字符的初始颜色值进行处理，得到所述题目图像数据中各字符的目标颜色值，包括：

获取预设的背景图，并确定所述预设的背景图中各像素点的颜色值；

基于所述各字符的目标二值化信息以及所述预设的背景图中各像素点的颜色值，对所述题目图像数据中各字符的初始颜色值进行处理，得到所述题目图像数据中各字符的目标颜色值。

9.根据权利要求8所述的方法，其特征在于，所述基于所述各字符的目标二值化信息以及所述预设的背景图中各像素点的颜色值，对所述题目图像数据中各字符的初始颜色值进行处理，得到所述题目图像数据中各字符的目标颜色值，包括：

10.根据权利要求1～9任一项所述的方法，其特征在于，在所述对待处理页的题目图像数据进行字符区块检测，确定所述题目图像数据中的目标字符区块，以及对所述题目图像数据进行字符分割处理，得到所述题目图像数据的字符分割图之前，所述方法还包括：

对待处理页的题目图像数据进行插图去除处理，得到插图去除后的题目图像数据；

所述对待处理页的题目图像数据进行字符区块检测，确定所述题目图像数据中的目标字符区块，以及对所述题目图像数据进行字符分割处理，得到所述题目图像数据的字符分割图，包括：

对所述插图去除后的题目图像数据进行字符区块检测，确定所述题目图像数据中的目标字符区块，以及对所述插图去除后的题目图像数据进行字符分割处理，得到所述题目图像数据的字符分割图。

11.根据权利要求10所述的方法，其特征在于，所述对待处理页的题目图像数据进行插图去除处理，得到插图去除后的题目图像数据，包括：

12.一种字符颜色处理装置，其特征在于，包括：

13.一种电子设备，其特征在于，包括：

处理器；

存储器，用于存储可执行指令；

其中，所述处理器用于从所述存储器中读取所述可执行指令，并执行所述可执行指令以实现上述权利要求1-11中任一项所述的方法。

14.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，所述存储介质存储有计算机程序，当所述计算机程序被处理器执行时，使得处理器实现上述权利要求1-11中任一项所述的方法。