WO2021190155A1

WO2021190155A1 - 文本行中的空格识别方法、装置、电子设备及存储介质

Info

Publication number: WO2021190155A1
Application number: PCT/CN2021/074886
Authority: WO
Inventors: 尚太章
Original assignee: Oppo广东移动通信有限公司
Priority date: 2020-03-23
Filing date: 2021-02-02
Publication date: 2021-09-30
Also published as: CN111461126A; CN111461126B

Abstract

本申请公开了一种文本行中的空格识别方法、装置、电子设备及存储介质，涉及图像处理技术领域。其中，该方法包括：获取文本灰度图，所述文本灰度图中仅包括单行文本；计算所述文本灰度图中预设方向上的每一排像素点的像素值之和，所述预设方向为与所述单行文本中的文字排列方向垂直的方向；将在第一像素值区间内的像素值之和对应的像素点形成的连通域，作为所述单行文本中的空格，所述第一像素值区间为文本灰度图中空格对应的像素值之和所在的区间。该技术方案可以确定出单行文本中的空格。

Description

文本行中的空格识别方法、装置、电子设备及存储介质

相关申请的交叉引用

本申请要求于2020年3月23日提交的申请号为202010231850.8的中国申请的优先权，其在此出于所有目的通过引用将其全部内容并入本文

技术领域

本申请涉及图像处理技术领域，更具体地，涉及一种文本行中的空格识别方法、装置、电子设备及存储介质。

背景技术

在图像中，若存在一行字符，则需要对其中的空格进行提取，以确定哪些字符之间存在空格，用于获得包含有空格的真实文本信息。

发明内容

鉴于上述问题，本申请提出了一种文本行中的空格识别方法、装置、电子设备及存储介质。

第一方面，本申请实施例提供了一种文本行中的空格识别方法，获取文本灰度图，所述文本灰度图中仅包括单行文本；计算所述文本灰度图中预设方向上的每一排像素点的像素值之和，所述预设方向为与所述单行文本中的文字排列方向垂直的方向；将在第一像素值区间内的像素值之和对应的像素点形成的连通域，作为所述单行文本中的空格，所述第一像素值区间为文本灰度图中空格对应的像素值之和所在的区间。

第二方面，本申请实施例提供了一种文本行中的空格识别装置，所述装置包括：图片获取模块，用于获取文本灰度图，所述文本灰度图中仅包括单行文本；像素值获取模块，用于计算所述文本灰度图中预设方向上的每一排像素点的像素值之和，所述预设方向为与所述单行文本中的文字排列方向垂直的方向；空格确定模块，用于将在第一像素值区间内的像素值之和对应的像素点形成的连通域，作为所述单行文本中的空格，所述第一像素值区间为文本灰度图中空格对应的像素值之和所在的区间。

第三方面，本申请实施例提供了一种电子设备，包括：一个或多个处理器；存储器；一个或多个程序，其中所述一个或多个程序被存储在所述存储器中并被配置为由所述一个或多个处理器执行，所述一个或多个程序被所述处理器执行用于执行上述的方法。

第四方面，本申请实施例提供了一种计算机可读存储介质，所述计算机可读存储介质中存储有程序代码，所述程序代码可被处理器调用执行上述的方法。

附图说明

为了更清楚地说明本申请实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1示出了本申请一实施例提供的文本行中的空格识别方法的流程图。

图2示出了本申请一实施例提供的像素点排列示意图。

图3示出了本申请另一实施例提供的文本行中的空格识别方法的流程图。

图4示出了本申请实施例提供的示意性的文本灰度图。

图5示出了本申请实施例提供的文本灰度图中像素值与像素点数量之间的拟合曲线图。

图6示出了本申请实施例提供的对背景部分的像素值进行统一后的示意图。

图7示出了本申请实施例提供的对图6所示的文本灰度图进行闭操作后的示意性的文本灰度图。

图8示出了本申请实施例提供的对图7的颜色进行翻转后的示意图。

图9示出了对图8中每一列像素点计算像素值之和后的统计结果图。

图10示出了本申请实施例提供的文本行中的空格识别装置的功能模块图。

图11示出了本申请实施例提供的电子设备的结构框图。

图12是本申请实施例的用于保存或者携带实现根据本申请实施例的文本行中的空格识别方法的程序代码的存储单元。

具体实施方式

为了使本技术领域的人员更好地理解本申请方案，下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述。

对于图片中的文字，无法进行直接编辑、复制以及剪切等文字处理操作，因此，通常需要对其进行识别，获得可以以文本形式进行表现的文字，从而可以对获得的文本进行编辑、复制以及剪切等文字处理操作。

对于图片中中文字符的处理，每个字符可以作为一个单独的文字存在，不管有没有识别出空格，都可以将每个字符进行一定间隔的排序形成具有真实文本信息的文本。但是，对于其他语种的识别，例如对于英文单词的识别，每个单词由对应的字母字符组成，不同单词的字母都是从同一个字母表中进行选择。当出现连续的一行字符的时候，对单词之间的空格提取就显得极为重要，如果无法提取出空格，那么得到的每行文本将会是连在一起的一连串字母，无法分别具体是什么单词，造成后续的机器处理难度及人类自己理解识别的难度。

因此，本申请实施例提供了一种文本行中的空格识别方法、装置、电子设备及存储介质，通过计算得到的像素值之和是否在文本灰度图中空格对应的像素值之和所在区间，确定文本灰度图中的单行文本的空格。下面将通过具体实施例对本申请实施例提供的文本行中的空格识别方法、装置、电子设备及存储介质进行详细说明。

请参阅图1，示出了本申请实施例提供的文本行中的空格识别方法。具体的，该方法包括：

步骤S110：获取文本灰度图，所述文本灰度图中仅包括单行文本。

该文本灰度图是一幅灰度图，其中只包括一行文本，该一行文本即该文本灰度图中的单行文本。识别该文本灰度图中文本行中的空格，即识别该单行文本中的空格。

在本申请实施例中，文本灰度图中单行文本的具体排列方向并不限定，可以是横向排列；也可以是纵向排列，当然，也可以是其他方向的排列。本申请实施例以横向排列为例进行说明。

可选的，文本灰度图中文字排列为横向还是纵向的识别，在本申请实施例中并不限定。例如，可以是默认对横向排列的进行处理，或者默认对纵向排列的进行处理。又如，根据文本灰度图中相互垂直的两条边确定文字排列方向，可以确定其中较长的一条边的延伸方向为文字排列方向。

步骤S120：计算所述文本灰度图中预设方向上的每一排像素点的像素值之和，所述预设方向为与所述单行文本中的文字排列方向垂直的方向。

在文本灰度图中，定义单行文本中文字排列的方向为文字排列方向，与文字排列方向垂直的方向为预设方向。例如，横向排列的单行文本中，横向为文字排列方向，纵向为预设方向。

在本申请实施例中，可以计算文本灰度图中，在预设方向上每一排像素点的像素值之和。其中，预设方向上的一排像素点，表示一排像素点的排列方向为预设方向。例如，文字横向排列的单行文本中，纵向上的一排像素点为一列像素点，计算文本灰度图中每一列像素点的像素值之和。如图2示出了一种文字横向排列的文本灰度图中的像素点示意图，第I1列的像素点包括(I1，J1)(I1，J2)(I1，J3)；第I2列的像素点包括(I2，J1)(I2，J2)(I2，J3)；第I3列的像素点包括(I3，J1)(I3，J2)(I3，J3)，依次类推。预设方向为纵向，计算预设方向上的每一排像素点的像素值之和，即计算其中每一列像素点的灰度值之和，获得分别对应第I1列至第I7列的7个像素值之和。

可选的，由于像素点排列紧密，每个空格可能包括多排像素点，为了提高计算速度，在本申请实施例中，也可以计算预设方向上每相邻两排或每相邻多排的像素点的像素值之和。

可选的，由于像素点排列紧密，每个空格可能包括多排像素点，为了提高计算速度，在本申请实施例中，也可以隔一排或者隔多排计算一排或多排在预设方向上的像素点的像素值之和。

步骤S130：将在第一像素值区间内的像素值之和对应的像素点形成的连通域，作为所述单行文本中的空格，所述第一像素值区间为文本灰度图中空格对应的像素值之和所在的区间。

为了便于文本的识别，在单行文本图片中，通常文字之间的颜色相同或接近，背景的颜色相同或接近，文字与背景之间的颜色差别较大。即形成文本的像素点的像素值相同或接近，形成背景的像素点的像素值相同或接近，形成文本的像素点与形成背景的像素点的像素值之间，差别较大，如像素值之差大于某个预设像素差值。背景即单行文本图片中文本以外的部分，包括空格、文本行的上下左右等各个区域。则在单行文本图片中，形成文本的像素点的像素值与形成空格的像素点的像素值差别较大。

因此，在本申请实施例中，空格中的像素点用于按照前述步骤中计算像素值之和的方式进行计算后，可能处于一个像素值区间范围，定义为第一像素值区间。该第一像素值区间具有独特性，与文本中的像素点用于按照前述步骤中计算像素值之和的方式进行计算后可能处于的像素值区间范围不同。

可以将在第一像素值区间内的像素值之和对应的像素点形成的连通域，识别为单行文本中的空格。即将在第一像素值区间内的像素值之和对应的像素点组成的区域确定为空格。

其中，计算的为预设方向上每排像素点的像素值之和，或者计算的是预设方向上每相邻两排或每相邻多排的像素点的像素值之和，像素值之和对应的像素点，可以是用于计算该像素值之和的所有像素点。

若计算像素点的像素值之和时，隔一排或者隔多排计算一排或多排在预设方向上的像素点的像素值之和，像素值之和对应的像素点，可以包括用于计算该像素值之和的所有像素点，以及计算该像素值之和时被间隔的未进行像素值之和计算的像素点。例如，横向排列的单行文本中，计算了第一列像素点的像素值之和，第三列像素点的像素点像素值之和，依次类推的奇数列像素点的像素值之和。则每一奇数列的像素值之和对应的像素点，可以包括该奇数列的像素点以及被该奇数列间隔掉的偶数列像素点，可以理解的，在该举例中，每一奇数列像素点间隔掉的偶数列像素点，为比该奇数小一的偶数列的像素点。

在本申请实施例中，对于单行文本所在的文本灰度图，以与单行文本中的文字排列方向垂直的方向作为预设方向，计算预设方向上每一排像素点的像素值之和。再根据文本灰度图中空格对应的像素点的像素值之和可能存在的第一像素值区间，确定哪些像素值之和在第一像素值区间，将在第一像素值区间内的像素值之和对应的像素点形成的连通域，作为所述单行文本中的空格，从而较为准确地识别到单行文本中的空格。

本申请另一实施例提供的文本行中的空格识别方法中，还可以包括对背景部分进行颜色统一，以使空格部分像素值更加统一，计算获得的不同像素值之和差别更小，更加集中，方便更准确地设置到可以衡量像素值之和所在范围的第一像素值区间。请参见图3，该方法包括：

步骤S210：获取文本灰度图，所述文本灰度图中仅包括单行文本。

在本申请实施例中，该文本灰度图的具体获取方式并不限定。在该文本灰度图中，文字的大小、文字高度与图片高度之间的比例以及文字宽度与图片宽度之间的比例等并不限定。

可选的，文本灰度图可以是通过从文本图片中进行单行文本提取，获得仅包括单行文本的单行文本图片。再通过图像预处理，将该单行文本图片转换为该文本灰度图。其中，提取单行文本的方式在本申请实施例中并不限定，例如可以是通过深度学习的算法进行提取，如textboxes系列算法，east算法系列，sglink等算法。

可选的，该文本灰度图也可以是对本身只包括一行文本的单行文本图片进行图像预处理获得。

其中，在本申请实施例中，图像预处理可以包括以下一种或多种：

若单行文本图片本身并非灰度图，如是RGB三通道图片，可以对单行文本图片进行灰度化处理，转换为灰度图，作为该文本灰度图；

对文本灰度图进行去噪处理，如中值模糊处理；

对文本灰度图进行均衡化处理，以使文本灰度图中的像素值分布更加均衡，防止图片中像素值的过分的偏移。

可选的，当图像预处理包括两种或两种以上的处理方式时，各处理方式之间的处理顺序可以与上述的描述顺序一致，在灰度转换后再进行去噪，在去噪后再均衡化处理，降低每一步处理的难度，提高处理的有效性。

另外，可选的，在本申请实施例中，获取到的也可以是灰度化后的文本灰度图后，在获取到文本灰度图后，进行去噪以及均衡化等图像预处理操作。

步骤S220：获取所述文本灰度图中的分割像素值。

由于文本灰度图中噪声的存在，以及文本灰度图本身并非二值化，空格部分并非纯粹的像素值，可以通过分割像素值对更大概率是空格的像素值进行确定以及统一。

也就是说，文本灰度图中的分割像素值，可以较为准确地区分空格以及文字，分割像素值的一侧的像素值，相比于文字的像素值，更大概率是空格的像素值；分割像素值的另一侧的像素值，相对于空格，更大概率是文字的像素值。即分割像素值一侧的像素值，是空格像素值的概率大于是文字像素值的概率；分割像素值的另一侧的像素值，是文字的概率大于是空格的概率。

其中，分割像素值的一侧和另一侧表示分割像素值相对的两侧，相对的两侧的像素值分别为比分割像素值大的像素值以及比分割像素值小的像素值。具体哪一侧更大概率是空格哪一侧更大概率是文字，根据文本灰度图中空格和文字的实际像素确定。

因此，在本申请实施例中，可以获取文本灰度图中的分割像素值，将更大概率是空格的一侧的像素值统一为一个相同的像素值，以使空格中计算得到的像素值更集中。并且，为了有效区分空格和文字，统一到的像素值与更大概率是文字的一侧的像素值不同。

由于包括空格的背景部分颜色相对文字通常具有较大区别，而背景部分的像素点数量比文字的像素点数量更多，可选的，可以以像素值为横坐标，像素点数量为纵坐标，建立坐标系，用于确定像素点数量随像素值的变化。在该坐标系中，可以获取像素值以及每个像素值对应的像素点数量之间的拟合曲线，获取该拟合曲线中所有极大值中的最大值。该最大值更大概率是背景的像素值，则更大概率是空格的像素值。

由于分割像素值的一侧需要更大概率是文字像素值，另一侧需要更大概率是空格像素值，则分割像素值的数量应当较少，且更大概率处于文字像素值以及空格像素值之间。因此，选取的分割像素值可以是一个对应的像素点数量较少的像素值，可以获取与最大值相邻的一个极小值，以获取的极小值对应的像素值作为所述分割像素值。该极小值表示像素点数量较少，且其与最大值相邻，表示其对应的像素值可能处于文字像素值和空格像素值之间。

另外，由分割像素值在空格像素值和文字像素值之间，可以根据文本灰度图的实际情况，选择最大值左侧相邻的极小值，或者选择最大值右侧相邻的极小值。其中，最大值左侧的极小值，表示对应的像素值比最大值对应的像素值小的极小值；最大值右侧的极小值，表示对应的像素值比最大值对应的像素值大的极小值。

由于均衡化处理后的文本灰度图中，像素值分布更均衡。背景和文字之间颜色区分度较大，则背景的像素值和文字的像素值差别较大。而背景包括空格，通过背景的像素值代表空格的像素值，对背景像素值的处理可以实现对空格像素值的处理。若背景更靠近白色，则文字更靠近黑色，分割像素值应当小于最大值对应的像素值，选择与最大值相邻的、且在最大值左侧的极小值；若背景更靠近黑色，则文字更靠近白色，分割像素值应当大于最大值对应的像素值，选择最大值右侧且与最大值相邻的极小值。

在一种实施方式中，背景更靠近白色还是黑色，可以是默认的，直接按照默认的颜色对应的处理方式进行处理。例如，默认文本灰度图中背景为白色，或者背景更靠近白色，按照背景更靠近白色的方式处理，选择最大值左侧的极小值对应的像素值，作为分割像素值。

可选的，在该实施方式中，若背景的实际颜色与默认的背景颜色不同，可以通过颜色翻转将文本灰度图中背景的颜色以及文字的颜色转换到默认的颜色。如默认背景是白色或更靠近白色，但实际文本灰度图中背景是黑色或者更靠近黑色，可以将每个像素点的像素值转换为255减去当前像素值的差值，实现黑白颜色的翻转。例如某像素点像素值为214，转换后像素值变为(255-214)＝41。

在另一种实施方式中，可以通过一个预设像素值区分白色和黑色，以区分背景更靠近白色和黑色。在该实施方式中，若背景的像素值大于该预设像素值，确定背景更靠近白色；若背景的颜色小于或等于该预设像素值，确定背景更靠近黑色。该预设像素值具体值并不做具体限定，可以根据实际需求设置，如设置为是居中的灰度值，如127或128。

可选的，在该实施方式中，由于像素点较多，背景的像素值可以通过最大值对应的像素值代表，即以最大值对应的像素值作为背景像素值。

可选的，由于文本灰度图中的边角通常为背景的一部分，可以选取文本灰度图中四角的平均像素值、四角中一角或多角的平均像素值、四角中对应像素点最多的像素值、四角中一角或多角中对应像素点最多的像素值等其中一个像素值代表背景的像素值。

另外，可选的，获取分割像素值的方式也可以是，在以像素值为横坐标，像素点数量为纵坐标，建立的坐标系中，获取对应像素点数量最多的像素值，定义该像素值对应的像素点数量为最大值。再获取与所述最大值相邻的一个极小值，以获取的极小值对应的像素值作为分割像素值。获取最大值相邻的极小值的具体方式参见前述描述，在此不再赘述。

步骤S230：若所述文本灰度图中背景的像素值大于所述分割像素值，将像素值大于所述分割像素值的像素点设置为第一像素值，所述第一像素值大于或等于背景的像素值。若所述文本灰度图中背景的像素值小于所述分割像素值，将像素值小于所述分割像素值的像素点设置为第二像素值，所述第二像素值小于或等于所述背景的像素值。

若背景更靠近白色，背景的像素值大于分割像素值，可以将背景的像素值转换为同一个像素值。具体的，可以将像素值大于分割像素值的像素点设置为第一像素值，该第一像素值大于或等于背景的像素值。可选的，在本申请实施例中，可以将背景统一转换为白色，即第一像素值为255。

若背景更靠近黑色，背景的像素值小于分割像素值，也可以将背景的像素值转换为同一个像素值。具体的，可以将像素值小于分割像素值的像素点设置为第二像素值，该第二像素值小于或等于背景的像素值。可选的，在本申请实施例中，可以将背景统一转换为黑色，即第二像素值为0。

可选的，在本申请实施例中，可以通过获取文本灰度图中背景的像素值确定背景的像素点应该设置为第一像素值还是第二像素值。

可选的，在该实施例中，也可以默认背景更靠近哪一颜色，设置为所靠近的颜色对应的像素值。如默认背景更靠近白色，则直接将像素值大于分割像素值的像素点设置为第一像素值。

可选的，若背景的实际颜色与该默认的颜色条件不匹配，可以对文本灰度图中的像素值进行翻转。例如，默认文本灰度图中背景更靠近白色，但是实际文本灰度图中背景更靠近黑色，则将每个像素点的像素值转换为255减去当前像素值的差值，实现黑白颜色的翻转。

在本申请实施例中，背景包括空格，将背景的像素值转换为同一个像素值，则实现将空格的像素值转换为同一个像素值。

步骤S240：计算所述文本灰度图中预设方向上的每一排像素点的像素值之和，所述预设方向为与所述单行文本中的文字排列方向垂直的方向。

可选的，在本申请实施例中，由于闭操作可以消弥狭窄的间断和长细的鸿沟，消除小的空洞，并填补轮廓线中的断裂，可以对文本灰度图进行闭操作，进一步减少空格部分的噪声，使空格部分的像素值更纯净，空格部分计算获得的像素值之和受到的干扰更小，可以更加集中。

步骤S250：将在第一像素值区间内的像素值之和对应的像素点形成的连通域，作为所述单行文本中的空格，所述第一像素值区间为文本灰度图中空格对应的像素值之和所在的区间。

在文本灰度图中，计算与文字排列方向垂直的方向上，每一排像素点的像素值之和，即对每一排像素点的像素值求和。由于空格的像素值进行了统一，则空格部分求得的像素值之和更加集中在一个区间内，因此，可以根据计算的像素值之和有没有在空格对应的像素值之和所在区间，确定获得的各个像素值之和是否为空格部分的像素点求得的像素值之和。将在第一像素值区间内的像素值之和对应的像素点形成的连通域，作为所述单行文本中的空格。

可选的，在第一像素值区间内的像素值之和对应的像素点形成的连通域的确定方式可以是，从文本灰度图中在文字排列方向上的一端开始，向另一端依次检测各个像素值之和是否在第一像素值区间内。当检测到在第一像素值区间内的像素值之和时，作为连通域的开始，并且在同一方向上继续检测像素值之和是否在第一像素值区间内。当检测到不在第一像素值区间内的像素值之和时，确定前一个像素值之和对应连通域的结束，从而确定一个连通域。

可选的，由于文字本身也具有一定的间隔，如同一个单词的不同字母之间存在间隔，为了降低对空格的误识别，可以对空格的宽度进行限定，设置空格的宽度区间，将在第一像素值区间内的像素值之和对应的像素点形成的连通域中，宽度在空格的宽度区间内的，作为所述单行文本中的空格。可以理解的，空格的宽度表示在文字排列方向上的宽度。例如，文字横向排列的文本灰度图中，空格宽度为空格在横向上的长度。

在一种实施方式中，空格的宽度区间可以根据字符宽度进行设置。

在该实施方式中，可以获取所述文本灰度图中的字符宽度，该字符宽度可以是在文字排列方向上的宽度。再根据字符宽度设置空格的宽度区间。

在该实施方式中，由于在单行文本图片中，字符数量包括多个，则可以获得字符的宽度包括多个。可以根据获得的多个字符的宽度确定一个字符宽度，用于设置空格的宽度区间。

可选的，可以获取所述文本灰度图中每个字符的宽度；以获取到的所有字符的宽度中的中位数，作为用于设置空格的宽度区间的字符宽度。

可选的，也可以获取文本灰度图中每个字符的宽度，以获取到的所有的字符的宽度的平均数，作为用于设置空格的宽度区间的字符宽度。

其中，字符的宽度也可以根据像素值之和所在区间范围进行确定。具体的，可以将在第二像素值区间内的像素值之和对应的像素点形成的每个连通域的宽度，作为单个字符的宽度。即在第二像素值区间内的像素值之和对应的像素点形成的每个连通域，分别对应一个字符，每个连通域的宽度，作为对应的字符的宽度。

该第二像素值区间为文本灰度图中字符对应的像素值之和所在的区间，或者说包括字符且不包括空格的区域内，预设方向上每一排像素点的像素值之和所在的像素值区间。其中，字符对应的像素值之和，为字符的像素点所在的一排的像素点的像素值之和，例如图2所示的像素排列示意图中，若像素点(I2，J2)为字符的像素点，则I2列的像素值之和为文本灰度图中字符对应的像素值之和。另外，可以理解的，文字和空格的像素值不同，第二像素值区间与所述第一像素值区间不同。

可选的，根据用于设置空格的宽度区间的字符宽度，设置空格的宽度区间时，由于空格的宽度通常大于字符宽度的一个比例，小于字符宽度的另一个比例，则可以以字符宽度乘以第一比例得到第一数值，以字符宽度乘以第二比例得到第二数值，将第一数值和第二数值形成的区间，作为空格的宽度区间。例如，第一比例为三分之一，第二比例为二分之一，则空格的宽度区间设置为字符宽度的三分之一到字符宽度的二分之一。具体的比例设置在本申请实施例中并不限定，可以根据实际情况设定。

可选的，由于不同字号的文字，对应的空格宽度不同，而不同字号的字，对应的文字宽度也不同。在该实施方式中，可以设置对应不同字符宽度的空格宽度区间。在确定文本灰度图中的字符宽度后，根据对应关系，确定空格的宽度区间。

在一种实施方式中，由于空格的宽度比文字本身内部的缝隙大，且比文字末尾可能形成的无文字区域小，因此，在该实施方式中，还可以获取在第一像素值区间内的像素值之和对应的像素点形成的连通域中，宽度居中的连通域。在该宽度居中的连通域的宽度基础上，加减一定的比例形成空格宽度区间。例如，宽度居中的连通域的宽度为6，加减的比例分别为三分之一，即2，则获得的空格宽度区间为4至8。

在一种实施方式中，空格的宽度区间也可以根据通用的空格宽度预先设置。

在本申请实施例中，在确定空格的宽度空间的基础上，将在第一像素值区间内的像素值之和对应的像素点形成的连通域中，宽度在所述宽度区间内的连通域，确定为所述单行文本中的空格。也就是说，由在第一像素值区间内的像素值之和对应的像素点形成的连通域中，宽度在空格的宽度区间范围内的连通域，确定为文本灰度图中的空格，宽度在宽度区间之外的连通域，不认为是文本灰度图中的空格。

可选的，在文本灰度图中，宽度比宽度区间更大的连通域，也可以确定为单行文本结束后的空白区域部分。

在本申请实施例中，背景的像素值统一后，更靠近白色还是更靠近黑色，或者背景像素值是黑色，设置的第一像素值区间可以不同。

在一种实施方式中，若背景统一为黑色，即背景的像素点的像素值统一为0，即空格的像素值统一为0，多少个像素值为0的像素点求和所得的值都为0。即使空格中有噪点，通过处理后噪点的数量也较少，且因为噪点本身通过灰度值进行表现，则在空格部分的像素值之和都可以集中在一个偏小的区间内，基本不受文本灰度图高度、字体大小等因素影响。在该实施方式中，为了有效容错，可以设置第一像素值区间偏小，在小于127的像素值内设置一个像素值区间作为第一像素值区间，如5至40。

在该实施方式中，文字的像素点的像素值大于0，求和后的最大值不确定，上述第二像素值区间为右端无穷大的无限区间，即为大于一个最小像素值的区间。为了有效容错，该第一像素值区间与上述第二像素值区间可以有交叉，且第一像素值区间的最小像素值小于第二像素值区间的最小像素值。例如，第一像素值区间设置为5至40，第二像素值区间设置为大于10。

在一种实施方式中，若背景的像素点的像素值统一为非0的像素值，如统一为大于预设像素值，由于文本灰度图在预设方向上的高度不同，空格部分的像素点相加的和不同，空格部分像素点之和的最小像素值不同，可能达到的最大像素值也不确定，即第一像素值区间的范围不定，该第一像素值区间可以是一个右端无穷大的无限区间，即大于一个最小像素值的区间。

可选的，在该实施方式中，第一像素值区间可以与文本灰度图的高度对应，即可以对应不同的高度设置不同的第一像素值区间。根据文本灰度图当前的实际高度，选择对应的第一像素值区间。

可选的，在该实施方式中，可以设置一默认的第一像素值区间，该默认的第一像素值区间对应默认的高度。可以将原文本灰度图按比例变换到默认的高度，再以默认高度下的文本灰度图作为确定空格位置的文本灰度图。在确定默认高度下文本灰度图中的空格位置后，再根据默认高度下文本灰度图与原文本灰度图之间的比例关系，确定原文本灰度图中空格的位置。即对默认高度下的文本灰度图获取预设方向上每一排的像素点的像素值之和，并获取在第一像素值区间内的像素值之和对应的像素点形成的连通域，根据获取的连通域确定空格。

对应的，在该实施方式中，由于文字接近黑色，像素值较小，该第二像素值区间可以是一个像素值到另一个像素值之间的像素值区间。但是，由于文字部分还包括部分背景的颜色，则对于不同高度的文本灰度图，像素点数量不同，第二像素值区间的范围也不同。

因此，可选的，该实施方式中，可以对应不同的高度设置不同的第二像素值区间。根据文本灰度图当前的实际高度，选择对应的第二像素值区间。

可选的，在该实施方式中，可以设置一默认的第二像素值区间，该默认的第二像素值区间对应默认的高度。可以将原文本灰度图按比例变换到默认的高度，再根据默认高度下的文本灰度图以及第二像素值区间计算字符宽度，根据字符宽度确定空格的宽度区间。

另外，在该实施方式中，为了容错，可以是第一像素值区间与第二像素值区间有交叉，且第一像素值区间的最小像素值大于所述第二像素值区间的最小像素值。

在本申请实施例中，对文本灰度图的每一次处理，处理操作都可以是默认背景更接近白色或者背景更接近黑色。若文本灰度图中背景的当前颜色与默认的颜色不符，可以对文本灰度图进行颜色翻转后再进行处理。

在本申请实施例中，通过分割像素值确定背景部分的像素点，将背景部分的像素点进行颜色统一，空格部分全部属于背景，理论上空格部分的像素值统一，从而在计算像素值之和时，即使受噪点影响，空格部分获得的像素值之和也比较集中，可以通过第一像素值区间将空格选定出来，从而确定文本灰度图中单行文本的空格。

本申请实施例通过一种具体的使用场景对该文本行中的空格识别方法进行说明。

获取到的文本灰度图如图4所示，背景部分更接近白色，文字部分接近黑色，但是包括很多噪音。可选的，可以对该文本灰度图可以进行中值模糊以及均衡化等图像预处理，以进行图像预处理后的文本灰度图，作为后续处理的文本灰度图。

在文本灰度图中，可以以像素值为横坐标，像素点数量为纵坐标，获取像素值以及每个像素值对应的像素点数量之间的拟合曲线，获取到的拟合曲线如图5中的曲线L所示。

在该曲线L中，可以确定极大值中的最大值为极值点m1。由于在该文本灰度图中，背景部分更偏向白色，选择做大值左侧的相邻极小值，即选择m1左侧第一个极小值点，如图5中的极小值点m2。以m2对应的像素值作为分割像素值。本申请实施例以如图5中极小值点m2对应的像素值为213进行举例。

在该文本灰度图中，背景更偏向白色，例如以最大值点对应的像素点的像素值代表背景的像素值，也可以确定背景更偏向白色。将文本灰度图中大于分割像素值的像素点设置为第一像素值。在本申请实施例中，以255作为第一像素值，将文本灰度图中像素值大于213的像素点设置为255，获得的文本灰度图如图6所示。

为了进一步去除噪点，可以对图6所示的文本灰度图进行闭操作，获得的文本灰度图如图7所示。从图7可以看出，闭操作后的文本灰度图中，噪点更少，空白部分更加纯净。

在本申请实施例中，为了更方便计算，设置的第一像素值区间以及第二像素值区间可以是针对背景为黑色，即背景的像素值为0的。因此，可以将如图7所示文本灰度图进行颜色翻转，即将每个像素点的像素值设置为255减去当前像素值，实现该文本灰度图中所有的像素值为255的白色部分转换为像素值为0的黑色部分，获得的文本灰度图如图8所示。

对图8进行每排像素值之和的统计。该文本灰度图为文字横向排列的文本灰度图，统计每一列的像素值之和。获得的统计结果可以如图9所示。在如图9所示的统计结果中，纵坐标表示像素值之和；横坐标表示文字排列方向上的每一个像素点位置，或者说表示第几列。例如，图9中的横坐标100对应的纵坐标值可以表示第100列像素点的像素值之和。

确定各个像素值之和是否在第一像素值区间内。本申请实施例以5至40作为第一像素值区间为例。可以对图9所示的统计结果中，从左至右依次确认各个纵坐标值是否在5至40的范围内。确定在该范围内的连续的纵坐标对应的横坐标，将确定的横坐标对应的像素列连起来，作为在第一像素值区间内的像素值之和对应的像素点形成的连通域。

另外，还可以设置空格的宽度区间。例如，将字符宽度的三分之一到字符宽度的二分之一确定为空格的宽度区间。而字符宽度的确定可以参见前述实施例。

根据空格的宽度区间，将根据第一像素值区间确定的连通域中，在空格的宽度区间内的连通域确定为空格，而不在空格的宽度区间内的连通域确定为非空格。从而可以通过该文本行中的空格识别方法，有效确定文本行中的空格。

该空格识别方法可以用于OCR光学字符识别中，在检测到文本之后，然后检测出单行文本。使用该方法，提取出空格的位置，将分割开的单词送入OCR识别模块进行一个一个单词的识别，之后再使用空格将识别的各个单词连接起来，可以得到最终的带有空格的完整的单行文本，防止得到所有单词连在一起，没有空格，人类无法识别的文本。

本申请实施例还提供了一种文本行中的空格识别装置300，如图10所示，该装置300包括：图片获取模块310，用于获取文本灰度图，所述文本灰度图中仅包括单行文本；像素值获取模块320，用于计算所述文本灰度图中预设方向上的每一排像素点的像素值之和，所述预设方向为与所述单行文本中的文字排列方向垂直的方向；空格确定模块330，用于将在第一像素值区间内的像素值之和对应的像素点形成的连通域，作为所述单行文本中的空格，所述第一像素值区间为文本灰度图中空格对应的像素值之和所在的区间。

可选的，该装置还可以包括分割模块，包括分割像素值确定单元，用于获取所述文本灰度图中的分割像素值；像素值设置单元，用于若所述文本灰度图中背景的像素值大于所述分割像素值，将像素值大于所述分割像素值的像素点设置为第一像素值，所述第一像素值大于或等于背景的像素值；若所述文本灰度图中背景的像素值小于所述分割像素值，将像素值小于所述分割像素值的像素点设置为第二像素值，所述第二像素值小于或等于所述背景的像素值。

可选的，分割像素值确定单元，用于以像素值为横坐标，像素点数量为纵坐标，获取像素值以及每个像素值对应的像素点数量之间的拟合曲线；获取所述拟合曲线中所有极大值中的最大值；获取与所述最大值相邻的一个极小值；以获取的极小值对应的像素值作为所述分割像素值。

可选的，该装置还可以包括去噪模块，用于对所述文本灰度图进行闭操作。

可选的，空格确定模块330可以用于获取所述文本灰度图中的字符宽度；根据所述字符宽度设置空格的宽度区间；将在第一像素值区间内的像素值之和对应的像素点形成的连通域中，宽度在所述宽度区间内的连通域，确定为所述单行文本中的空格。

可选的，空格确定模块330可以用于获取所述文本灰度图中每个字符的宽度；以获取到的所有字符的宽度中的中位数，作为所述字符宽度。

可选的，空格确定模块330可以用于将在第二像素值区间内的像素值之和对应的像素点形成的每个连通域的宽度，作为单个字符的宽度，所述第二像素值区间与所述第一像素值区间不同，所述第二像素值区间为文本灰度图中字符对应的像素值之和所在的区间。

可选的，若所述文本灰度图中背景的像素值大于预设像素值，所述第一像素值区间与所述第二像素值区间有交叉，且所述第一像素值区间的最小像素值大于所述第二像素值区间的最小像素值；若所述文本灰度图中背景的像素值小于或等于预设像素值，所述第一像素值区间与所述第二像素值区间有交叉，且所述第一像素值区间的最小像素值小于所述第二像素值区间的最小像素值。

可选的，该装置还可以包括均衡化模块，用于对所述文本灰度图进行均衡化处理。

本申请实施例提供的文本行中的空格识别方法及装置，通过智能寻找最佳分割点，可以有效的提取文本中的空格位置。

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述的各个方法实施例之间可以相互参照；上述描述装置和模块的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

在本申请所提供的几个实施例中，模块相互之间的耦合可以是电性，机械或其它形式的耦合。

另外，在本申请各个实施例中的各功能模块可以集成在一个处理模块中，也可以是各个模块单独物理存在，也可以两个或两个以上模块集成在一个模块中。上述集成的模块既可以采用硬件的形式实现，也可以采用软件功能模块的形式实现。各个模块可以配置在不同的电子设备中，也可以配置在相同的电子设备中，本申请实施例并不限定。

请参考图11，其示出了本申请实施例提供的一种电子设备500的结构框图。该电子设备可以包括一个或多个处理器510(图中仅示出一个)，存储器520以及一个或多个程序。其中，所述一个或多个程序被存储在所述存储器520中，并被配置为由所述一个或多个处理器510执行。所述一个或多个程序被处理器执行用于执行前述实施例所描述的方法。

处理器510可以包括一个或者多个处理核。处理器510利用各种接口和线路连接整个电子设备500内的各个部分，通过运行或执行存储在存储器520内的指令、程序、代码集或指令集，以及调用存储在存储器520内的数据，执行电子设备500的各种功能和处理数据。可选地，处理器510可以采用数字信号处理(Digital Signal Processing，DSP)、现场可编程门阵列(Field－Programmable Gate Array，FPGA)、可编程逻辑阵列(Programmable Logic Array，PLA)中的至少一种硬件形式来实现。处理器510可集成中央处理器(Central Processing Unit，CPU)、图像处理器(Graphics Processing Unit，GPU)和调制解调器等中的一种或几种的组合。其中，CPU主要处理操作系统、用户界面和应用程序等；GPU用于负责显示内容的渲染和绘制；调制解调器用于处理无线通信。可以理解的是，上述调制解调器也可以不集成到处理器510中，单独通过一块通信芯片进行实现。

存储器520可以包括随机存储器(Random Access Memory，RAM)，也可以包括只读存储器(Read-Only Memory)。存储器520可用于存储指令、程序、代码、代码集或指令集。存储器520可包括存储程序区和存储数据区，其中，存储程序区可存储用于实现操作系统的指令、用于实现至少一个功能的指令、用于实现上述各个方法实施例的指令等。存储数据区还可以电子设备在使用中所创建的数据等。

请参考图12，其示出了本申请实施例提供的一种计算机可读存储介质的结构框图。该计算机可读存储介质700中存储有程序代码，所述程序代码可被处理器调用执行上述方法实施例中所描述的方法。

计算机可读存储介质700可以是诸如闪存、EEPROM(电可擦除可编程只读存储器)、EPROM、硬盘或者ROM之类的电子存储器。可选地，计算机可读存储介质700包括非易失性计算机可读介质(non-transitory computer-readable storage medium)。计算机可读存储介质700具有执行上述方法中的任何方法步骤的程序代码710的存储空间。这些程序代码可以从一个或者多个计算机程序产品中读出或者写入到这一个或者多个计算机程序产品中。程序代码710可以例如以适当形式进行压缩。

最后应说明的是：以上实施例仅用以说明本申请的技术方案，而非对其限制；尽管参照前述实施例对本申请进行了详细的说明，本领域的普通技术人员当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不驱使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。

Claims

一种文本行中的空格识别方法，其特征在于，所述方法包括：

获取文本灰度图，所述文本灰度图中仅包括单行文本；

计算所述文本灰度图中预设方向上的每一排像素点的像素值之和，所述预设方向为与所述单行文本中的文字排列方向垂直的方向；

将在第一像素值区间内的像素值之和对应的像素点形成的连通域，作为所述单行文本中的空格，所述第一像素值区间为文本灰度图中空格对应的像素值之和所在的区间。
根据权利要求1所述的方法，其特征在于，所述计算所述文本灰度图中预设方向上的每一排像素点的像素值之和之前，还包括：

获取所述文本灰度图中的分割像素值；

若所述文本灰度图中背景的像素值大于所述分割像素值，将像素值大于所述分割像素值的像素点设置为第一像素值，所述第一像素值大于或等于背景的像素值；

若所述文本灰度图中背景的像素值小于所述分割像素值，将像素值小于所述分割像素值的像素点设置为第二像素值，所述第二像素值小于或等于所述背景的像素值。
根据权利要求2所述的方法，其特征在于，所述获取所述文本灰度图中的分割像素值，包括：

以像素值为横坐标，像素点数量为纵坐标，获取像素值以及每个像素值对应的像素点数量之间的拟合曲线；

获取所述拟合曲线中所有极大值中的最大值；

获取与所述最大值相邻的一个极小值；

以获取的极小值对应的像素值作为所述分割像素值。
根据权利要求3所述的方法，其特征在于，所述获取与所述最大值相邻的一个极小值，包括：

若所述文本灰度图中背景的像素值大于预设像素值，获取与所述最大值相邻的且在所述最大值左侧的极小值；

若所述文本灰度图中背景的像素值小于或等于所述预设像素值时，获取与所述最大值相邻的且在所述最大值右侧的极小值。
根据权利要求2至4任一项所述的方法，其特征在于，所述背景的像素值为所述文本灰度图中四角的平均像素值、所述四角中一角或多角的平均像素值、所述四角中对应像素点最多的像素值、以及所述四角中一角或多角中对应像素点最多的像素值中的任意一种。
根据权利要求1至5任一项所述的方法，其特征在于，所述计算所述文本灰度图中预设方向上的每一排像素点的像素值之和之前，还包括：

对所述文本灰度图进行闭操作。
根据权利要求1至6任一项所述的方法，其特征在于，所述将在第一像素值区间内的像素值之和对应的像素点形成的连通域，作为所述单行文本中的空格，包括：

获取所述文本灰度图中的字符宽度；

根据所述字符宽度设置空格的宽度区间；

将在第一像素值区间内的像素值之和对应的像素点形成的连通域中，宽度在所述宽度区间内的连通域，确定为所述单行文本中的空格。
根据权利要求7所述的方法，其特征在于，所述获取所述文本灰度图中的字符宽度，包括：

获取所述文本灰度图中每个字符的宽度；

以获取到的所有字符的宽度中的中位数，作为所述字符宽度。
根据权利要求7所述的方法，其特征在于，所述获取所述文本灰度图中的字符宽度，包括：

获取所述文本灰度图中每个字符的宽度；

以获取到的所有字符的宽度中的平均数，作为所述字符宽度。
根据权利要求8或9所述的方法，其特征在于，所述获取所述文本灰度图中每个字符的宽度，包括：

将在第二像素值区间内的像素值之和对应的像素点形成的每个连通域的宽度，作为单个字符的宽度，所述第二像素值区间与所述第一像素值区间不同，所述第二像素值区间为文本灰度图中字符对应的像素值之和所在的区间。
根据权利要求10所述的方法，其特征在于，若所述文本灰度图中背景的像素值大于预设像素值，所述第一像素值区间与所述第二像素值区间有交叉，且所述第一像素值区间的最小像素值大于所述第二像素值区间的最小像素值；

若所述文本灰度图中背景的像素值小于或等于预设像素值，所述第一像素值区间与所述第二像素值区间有交叉，且所述第一像素值区间的最小像素值小于所述第二像素值区间的最小像素值。
根据权利要求7至11任一项所述的方法，其特征在于，所述根据所述字符宽度设置空格的宽度区间，包括：

以所述字符宽度乘以第一比例，得到第一数值；

以所述字符宽度乘以第二比例，得到第二数值；

将所述第一数值和所述第二数值形成的区间，作为空格的宽度区间。
根据权利要求1至12任一项所述的方法，其特征在于，所述计算所述文本灰度图中预设方向上的每一排像素点的像素值之和之前，还包括：

对所述文本灰度图进行均衡化处理。
根据权利要求1至13任一项所述的方法，其特征在于，所述计算所述文本灰度图中预设方向上的每一排像素点的像素值之和之前，还包括：

对所述文本灰度图进行去噪处理。
根据权利要求1至14任一项所述的方法，其特征在于，所述获取文本灰度图，包括：

从文本图片中进行单行文本提取，获得仅包括单行文本的单行文本图片；

对所述单行文本图片进行灰度化处理，得到文本灰度图。
根据权利要求1至15任一项所述的方法，其特征在于，所述第一像素值区间与所述文本灰度图的高度对应。
根据权利要求1至16任一项所述的方法，其特征在于，所述在第一像素值区间内的像素值之和对应的像素点形成的连通域，包括：

当检测到在第一像素值区间内的像素值之和时，作为连通域的开始，并在同一方向上继续检测像素值之和是否在所述第一像素值区间内；

当检测到不在所述第一像素值区间内的像素值之和时，确定前一个像素值之和对应所述连通域的结束。
一种文本行中的空格识别装置，其特征在于，所述装置包括：

图片获取模块，用于获取文本灰度图，所述文本灰度图中仅包括单行文本；

像素值获取模块，用于计算所述文本灰度图中预设方向上的每一排像素点的像素值之和，所述预设方向为与所述单行文本中的文字排列方向垂直的方向；

空格确定模块，用于将在第一像素值区间内的像素值之和对应的像素点形成的连通域，作为所述单行文本中的空格，所述第一像素值区间为文本灰度图中空格对应的像素值之和所在的区间。
一种电子设备，其特征在于，包括：

一个或多个处理器；

存储器；

一个或多个程序，其中所述一个或多个程序被存储在所述存储器中并被配置为由所述一个或多个处理器执行，所述一个或多个程序被所述处理器执行用于执行如权利要求1-17任一项所述的方法。
一种计算机可读存储介质，其特征在于，所述计算机可读存储介质中存储有程序代码，所述程序代码可被处理器调用执行如权利要求1-17任一项所述的方法。