WO2018166276A1

WO2018166276A1 - 文字区域定位方法和装置、计算机可读存储介质

Info

Publication number: WO2018166276A1
Application number: PCT/CN2017/119692
Authority: WO
Inventors: 王永亮; 王青泽; 陈标龙
Original assignee: 北京京东尚科信息技术有限公司; 北京京东世纪贸易有限公司
Priority date: 2017-03-15
Filing date: 2017-12-29
Publication date: 2018-09-20
Also published as: US11017260B2; CN108573251A; US20200012879A1; CN108573251B

Abstract

一种文字区域定位方法和装置、计算机可读存储介质，涉及图像处理领域。该文字区域定位方法包括：根据原始图像获取方差图（501）；获取方差图的边缘图像（502）；若边缘图像中相邻两条边缘线中位置相对的边缘点之间距离的差值在预定距离差范围时，则确定相邻两条边缘线之间的区域为文字区域（503）。通过这样的方法，能够利用文字区域中文字高度相似的特点，根据边缘图像中边缘线之间的距离确定文字区域，不会由于文字笔画粗度变化造成影响，适用于各种不同的字体，且能够避免图像复杂的像素变化情况对定位造成影响，提高文字区域定位的准确性。

Description

文字区域定位方法和装置、计算机可读存储介质

相关申请的交叉引用

本申请是以CN申请号为201710152728.X，申请日为2017年3月15日的申请为基础，并主张其优先权，该CN申请的公开内容在此作为整体引入本申请中。

技术领域

本公开涉及图像处理领域，特别是一种文字区域定位方法和装置、计算机可读存储介质。

背景技术

在文字识别过程中，需要先利用某些算法在图片中定位出文字区域，再在文字区域中利用相关的图像算法提取文字内容，因此文字定位是文字识别引擎的一个重要的模块。目前常用的方法有笔画宽度定位法(Stroke Width Transform)和稳定极值区域检测法(Maximally Stable Extremal Regions)。

笔画宽度定位法利用打印体文字的笔画宽度不变这一特性，在一个图片中寻找一对平行线，并将平行线判定为笔画，再把相互靠近的笔画聚集成文字区域。

稳定极值区域检测法是利用图像中的文字区域会跟背景图像形成鲜明的对比这一特点进行文字区域定位。

发明内容

发明人发现上述相关技术存在各自不同的缺陷。微软正黑体的文字笔画的宽度是一致的，能够采用笔画宽度定位法进行定位；但是，宋体文字其笔画宽度并不相同，因此不适用于采用笔画宽度定位法进行定位。而采用稳定极值区域检测法需要文字区域的像素对比度高，但在应用过程中，对比度高的区域不一定是文字，因此该算法很容易引入额外的噪声。另外，这两种方法都只能先定位文字区域，还需要额外的算法将单个文字串成行，较为繁琐，降低了运算效率。

为了解决上述问题中的至少一个，本公开提出一种文字区域定位方案，能够提高对不同字体的适应能力，提高文字区域定位的准确性。

根据本公开的一些实施例，提出一种文字区域定位方法，包括：根据原始图像获取方差图；获取方差图的边缘图像；当边缘图像中相邻两条边缘线中位置相对的边缘点之间距离的差值在预定距离差范围时，确定相邻两条边缘线之间的区域为文字区域。

可选地，确定相邻两条边缘点之间的区域为文字区域包括：确定第一边缘点和位于相邻边缘线上的第二边缘点；根据第一边缘点和第二边缘点之间的距离确定行高；连接行高的差值在预定距离差范围内的相邻的第一边缘点，以确定第一边缘线，连接行高的差值在预定距离差范围内的相邻的第二边缘点，以确定第二边缘线，第一边缘线与第二边缘线之间的区域为文字区域。

可选地，确定第一边缘点和位于相邻边缘线上的第二边缘点包括：在边缘图像中取一点作为第一边缘点；从第一边缘点沿像素梯度的方向发射射线，直至下一边缘点；当第一边缘点与下一边缘点法向量的夹角小于预定角度阈值时，确定下一边缘点为第二边缘点。

可选地，根据原始图像获取方差图包括：获取原始图像中目标像素位置的像素值，及目标像素位置的邻近像素点的像素值，其中，邻近像素点为目标像素位置在不同方向连续预定数量的像素点；将原始图像中目标像素位置和邻近像素点的像素值取方差值，确定方差图中目标像素位置的像素值。

可选地，获取方差图的边缘图像包括：基于方差图利用Canny算子计算图像边缘，获取边缘图像。

可选地，文字区域包括横向文字区域、纵向文字区域、倾斜文字区域和/扇形文字区域中的至少一种。

通过这样的方法，能够利用文字区域中文字高度相似的特点，根据边缘图像中边缘线之间的距离确定文字区域，不会由于文字笔画粗度变化造成影响，适用于各种不同的字体，且能够避免图像复杂的像素变化情况对定位造成影响，提高文字区域定位的准确性。

根据本公开的另一些实施例，提出一种文字区域定位装置，包括：方差图确定模块，用于根据原始图像获取方差图；边缘图像获取模块，用于获取方差图的边缘图像；文字区域定位模块，用于当边缘图像中相邻两条边缘线中位置相对的边缘点之间距离的差值在预定距离差范围内时，确定相邻两条边缘线之间的区域为文字区域。

可选地，文字区域定位模块包括：边缘点确定单元，用于确定第一边缘点和位于相邻边缘线上的第二边缘点；行高确定单元，用于根据第一边缘点和第二边缘点之间的距离确定行高；边缘线连接单元，用于连接行高的差值在预定距离差范围内的相邻的第一边缘点，以确定第一边缘线，连接行高的差值在预定距离差范围内的相邻的第二边缘点，以确定第二边缘线，第一边缘线与第二边缘线之间的区域为文字区域。

可选地，边缘点确定单元包括：第一边缘点指定子单元，用于在边缘图像中取一点作为第一边缘点；下一边缘点获取子单元，用于从第一边缘点沿像素梯度的方向发射射线，直至下一边缘点；第二边缘点确定子单元，用于当第一边缘点与下一边缘点法向量的夹角小于预定角度阈值时，确定下一边缘点为第二边缘点。

可选地，方差图确定模块用于：获取原始图像中目标像素位置的像素值，及目标像素位置的邻近像素点的像素值，其中，邻近像素点为目标像素位置在不同方向连续预定数量的像素点；将原始图像中目标像素位置和邻近像素点的像素值取方差值，确定方差图中目标像素位置的像素值。

可选地，边缘图像获取模块用于：基于方差图利用Canny算子计算图像边缘，获取边缘图像。

可选地，文字区域包括横向文字区域、纵向文字区域、倾斜文字区域和扇形文字区域中的至少一种。

这样的装置能够利用文字区域中文字高度相似的特点，根据边缘图像中边缘线之间的距离确定文字区域，不会由于文字笔画粗度变化造成影响，适用于各种不同的字体，且能够避免图像复杂的像素变化情况对定位造成影响，提高文字区域定位的准确性。

根据本公开的又一些实施例，提出一种文字区域定位装置，包括：存储器；以及耦接至存储器的处理器，处理器被配置为基于存储在存储器的指令执行上文中提到的任意一种文字区域定位方法。

根据本公开的再一些实施例，提出一种计算机可读存储介质，其上存储有计算机程序指令，该指令被处理器执行时实现上文中提到的任意一种文字区域定位方法的步骤。

这样的计算机存储介质能够在文字区域定位装置运行过程中利用文字区域中文字高度相似的特点，根据边缘图像中边缘线之间的距离确定文字区域，适用于各种不同的字体，提高文字区域定位的准确性。通过以下参照附图对本公开的示例性实施例的详细描述，本公开的其它特征及其优点将会变得清楚。

附图说明

此处所说明的附图用来提供对本公开的进一步理解，构成本申请的一部分，本公开的示意性实施例及其说明用于解释本公开，并不构成对本公开的不当限定。

图1A～图1C为相关技术中笔画宽度定位法的示意图，其中，图1A为笔画放大效果图，图1B为轮廓示意图，图1C为笔画宽度计算示意图。

图2为相关技术中稳定极值区域检测法的示意图。

图3A为文字笔画宽度一致的字体示意图。

图3B为文字笔画宽度不一致的字体示意图。

图4为不适用于稳定极值区域检测法图片的示意图。

图5为本公开的文字区域定位方法的一些实施例的流程图。

图6A为采用本公开的文字区域定位方法的一些实施例的原始图像。

图6B为对图6A采用本公开的文字区域定位方法时确定的方差图。

图6C为对图6B采用本公开的文字区域定位方法时确定的边缘图像。

图6D为对图6C采用本公开的文字区域定位方法时确定的文字区域示意图。

图7为本公开的文字区域定位方法中在边缘图像中定位文字区域的一些实施例的流程图。

图8为本公开的文字区域定位方法中确定边缘点的一些实施例的流程图。

图9为本公开的文字区域定位装置的一些实施例的示意图。

图10为本公开的文字区域定位装置中文字区域定位模块的一些实施例的示意图。

图11为本公开的文字区域定位装置中边缘点确定单元的一些实施例的示意图。

图12为本公开的文字区域定位装置的另一些实施例的示意图。

图13为本公开的文字区域定位装置的又一些实施例的示意图。

具体实施方式

现在将参照附图来详细描述本公开的各种示例性实施例。应注意到：除非另外具体说明，否则在这些实施例中阐述的部件和步骤的相对布置、数字表达式和数值不限制本公开的范围。

同时，应当明白，为了便于描述，附图中所示出的各个部分的尺寸并不是按照实际的比例关系绘制的。

以下对至少一个示例性实施例的描述实际上仅仅是说明性的，决不作为对本公开及其应用或使用的任何限制。

对于相关领域普通技术人员已知的技术、方法和设备可能不作详细讨论，但在适当情况下，所述技术、方法和设备应当被视为授权说明书的一部分。

在这里示出和讨论的所有示例中，任何具体值应被解释为仅仅是示例性的，而不是作为限制。因此，示例性实施例的其它示例可以具有不同的值。

应注意到：相似的标号和字母在下面的附图中表示类似项，因此，一旦某一项在一个附图中被定义，则在随后的附图中不需要对其进行进一步讨论。

图1A～图1C为利用笔画宽度定位法进行文字定位的示意图。

图1A的灰色区域是文字的一个笔画放大数倍之后的效果，其中灰色的小格子是笔画上的像素，白色的小格子是图像背景。图1B中，利用Canny算子勾勒出了笔画的两条轮廓，大致可以看出这两条轮廓相互平行，p和q为轮廓两侧相对的点，两点之间的直线距离为W。图1C是在图1B的基础上计算轮廓上的像素到与其平行的轮廓上的像素点最小的距离，这个距离就是笔画宽度。

图2为相关技术中稳定极值区域检测法的示意图。

如图2所示，图像中的字体跟背景的颜色对比明显，通过不断提高二值化阈值，可以获得右边的两张图片，在右边的图片中可以清晰的看到文字信息。

但是，上述相关技术存在各自不同的缺陷。

图3A为文字笔画宽度一致的字体示意图。图3B为文字笔画宽度不一致的字体示意图。如图3A中所示，微软正黑体的文字笔画的宽度是一致的，能够采用笔画宽度定位法进行定位，但是，如图3B中所示的宋体文字其笔画宽度并不相同，如笔画撇(丿)就是上半部分宽度比较粗，下边比较细，因此不适用于采用笔画宽度定位法进行定位。而采用稳定极值区域检测法需要文字区域的像素对比度高，但在应用过程中，对比度高的区域不一定是文字，因此该算法很容易引入额外的噪声。

图4为不适用于稳定极值区域检测法图片的示意图。

如图4所示，矩形框所选中的位置都是稳定极值区域，但是只有不到一半的区域是文字区域。另外，这两种方法都只能先定位文字区域，还需要额外的算法将单个文字串成行，较为繁琐，降低了运算效率。

基于此，本公开提出一种文字区域定位方案，能够提高对不同字体的适应能力，提高文字区域定位的准确性。

图5示出本公开的文字区域定位方法的一些实施例的流程图。如图5所示，文字区域定位方法包括步骤501-503。

在步骤501中，根据原始图像获取方差图。在一些实施例中，可以根据原始图像中每个点的像素值获取图像中每个像素点与周围几个像素点的像素值方差，如根据水平连续几个点的像素值取方差，确定其中一个点的方差图像素。通过计算每个点与周围几个点像素值的方差，可以确定方差图。

在步骤502中，获取方差图的边缘图像。在一些实施例中，可以采用相关技术中任意一种边缘检测算法计算边缘图像。

在步骤503中，当边缘图像中相邻两条边缘线中位置相对的边缘点之间距离的差值在预定距离差范围内时，确定相邻两条边缘线之间的区域为文字区域。在一些实施例中，可以在边缘图像中得到两条近似平行的边缘线，该边缘线可以为直线、曲线，中间可以有断点等。若两条边缘线之间的距离相对稳定，距离变化范围在预定距离差范围内，也可以认为这两条边缘线之间的区域为文字区域。

通过这样的方法，能够利用文字区域中文字高度相似的特点，根据边缘图像中边缘线之间的距离确定文字区域。这样就不会由于文字笔画粗度变化造成影响，能够适用于各种不同的字体，且能够避免图像复杂的像素变化情况对定位造成影响，提高文字区域定位的准确性。另外，由于无需逐字的确定文字区域再进行拼接，而是直接在复杂版面的打印体图片中直接快速的定位文字行，提高了文字区域的确定效率。

在一些实施例中，可以获取原始图像中目标像素位置的像素值、及目标像素位置的邻近像素点的像素值，将原始图像中目标像素位置和邻近像素点的像素值取方差值来确定方差图中目标像素位置的像素值。邻近像素点可以为目标像素位置在不同方向(例如，水平、竖直方向)连续预定数量的像素点。预定数量可以根据经验或者实际需求设定。例如，假定原始图像为G，原始图像中坐标位置为(x，y)的像素点的像素值为G(x，y)，如G(0,0)代表图像左上角的像素值。假定方差图为I，方差图中坐标位置为(x，y)的像素点的像素值为I(x，y)。以水平方差图为例，G(x，y)的邻近像素点包括G(x-t,y)、G(x-t+1,y)、……G(x-1,y)、G(x+1,y)、……G(x+t,y)，根据公式：

I(x,y)＝Var(G(x-t,y),G(x-t+1,y),..G(x,y),G(x+1,y),..G(x+t,y))

计算方差图中(x，y)点的像素值I(x,y)。在公式中，t的数值可以根据需要或效果设定，如设置为5。

对于位于两端的像素点，如G(0,0)，可以只根据G(0,0)、G(1,0)……G(t,0)确定I(0,0)。

对于特殊的应用场合，还可以计算竖直方差图，即以竖直方向续预定数量的像素点的像素值确定方差值。还可以设定上下左右预定范围内的像素点为邻近像素点。

通过这样的方法，能够在原始图像的基础上计算其方差图。方差图能够反应图像的变化情况，从而获取图像发生剧烈变化的位置，便于将文字区域与其他图像区域区分。如图6A所示为原始图像，6B为图6A的方差图。从方差图中能够看出，文字区域呈现明显的长条状，具有突出的特点。

在一些实施例中，在方差图的基础上，可以进一步提取方差图的边缘轮廓，得到边缘图像。可以利用相关技术中任意一种边缘图像提取算法进行实现，如采用Canny算子计算图像边缘，得到边缘图像。

通过这样的方法，能够在方差图的基础上进一步得到方差图的边缘轮廓，从而便于在边缘图像的基础上进行运算，得到位于边缘点之间的文字区域。如图6C所示，在图像6B的基础上进行边缘轮廓提取，能够得到6C中的边缘图像。图6C中的边缘图像线条清楚，能够便于进行边缘点提取和距离计算，得到如图6D所示的文字区域示意图。

图7示出本公开的文字区域定位方法中在边缘图像中定位文字区域的一些实施例的流程图。如图7所示，文字区域定位方法包括步骤701-703。

在步骤701中，确定第一边缘点和位于相邻边缘线上的第二边缘点。在一些实施例中，可以遍历边缘图像，每次取一个边缘点作为第一边缘点，直至完成整幅图像或整条边缘线上每个边缘点与相对的第二边缘点间的关联确认。在第一边缘点的基础上可以取与第一边缘点所处的边缘线相邻的边缘线上与第一边缘点位置相对的像素点作为第二边缘点。如两条水平的边缘线上下平行，第一边缘点坐标为(x，y)，则第二边缘点坐标为(x，y+n)，其中，n为第一、第二边缘点之间的距离。

在步骤702中，根据第一边缘点和第二边缘点之间的距离确定行高。在一些实施例中，可以遍历整幅图，得到每个第一边缘点和对应的第二边缘点之间的行高。

在步骤703中，连接行高的差值在预定距离差范围内的相邻的第一边缘点，确定第一边缘线，连接行高的差值在预定距离差范围内的相邻的第二边缘点，确定第二边缘线，第一边缘线与第二边缘线之间的区域为文字区域。在一些实施例中，若至少两个第一边缘点相邻、且第一边缘点对应的第二边缘点也相邻，且这些相邻的边缘点中，第一边缘点与第二边缘点之间的距离的差值在预定距离差范围内，则可以认为第一边缘点和第二边缘点分别为文字的上边线点、下边线点(在竖直状态下是左、右边线点)。从而可以将相邻边缘点连接，得到文字的上边线、文字的下边线(在竖直状态下是左、右边线)，边线之间的区域即为文字区域。

通过这样的方法，能够在边缘图像的基础上得到文字的边线，从而得到文字区域，由于无需进行单个文字的判断，降低了运算量，且不受笔画粗度不同、像素值有较大差异的不规则区域的影响，提高了文字区域定位的效率和准确度。

图8示出本公开的文字区域定位方法中确定边缘点的一些实施例的流程图。如图8所示，文字区域定位方法包括步骤801-803。

在步骤801中，在边缘图像中取一点作为第一边缘点。在一些实施例中，可以遍历边缘图像，每次取一个边缘点作为第一边缘点，直至确定整幅图像中每个边缘点对应的第二边缘点，或完成确定整条边缘线上每个边缘点的第二边缘点。

在步骤802中，从第一边缘点沿像素梯度的方向发射射线，直至下一边缘点，从而能够找到与第一边缘点所处的边缘线相邻的边缘线上与第一边缘点位置相对的点。

在步骤803中，若第一边缘点与下一边缘点法向量的夹角小于预定角度阈值，则确定下一边缘点为第二边缘点。在一些实施例中，预定角度阈值可以为30度。像素的法向量即像素的梯度或像素的导数，数字图像作为离散的点值谱，可以称为二维离散函数，可以通过对该二维离散函数求导确定其法向量。

通过这样的方法，能够在边缘图像的基础上确定第一边缘点和与其位置相对的第二边缘点，为计算第一边缘点与第二边缘点的距离提供了数据基础。由于采用沿像素梯度的方向发射射线的方式确定第二边缘点，得到的第二边缘点与第一边缘点的相对位置不确定，根据像素变化情况可能是上下、左右或其他位置关系，从而能够确定横向文字区域、纵向文字区域、倾斜文字区域，甚至是扇形文字区域，防止不规则排版造成的漏定位，提高文字定位的准确度。

图9示出本公开的文字区域定位装置的一些实施例示意图。如图9所示，文字区域定位装置包括方差图确定模块901、边缘图像获取模块902和文字区域定位模块903。

方差图确定模块901能够根据原始图像获取方差图。在一些实施例中，可以根据原始图像中每个点的像素值获取图像中每个像素点与周围几个像素点的像素值方差，如根据水平连续几个点的像素值取方差，确定其中一个点的方差图像素。通过计算每个点与周围几个点像素值的方差，确定方差图。

在一些实施例中，方差图确定模块901能够获取原始图像中目标像素位置的像素值，及目标像素位置的邻近像素点的像素值，将原始图像中目标像素位置和邻近像素点的像素值取方差值来确定方差图中目标像素位置的像素值。邻近像素点可以为目标像素位置水平、竖直方向连续预定数量，或上下左右预定范围内的像素点。预定数量可以根据经验或者实际需求设定。

通过这样的方法，能够在原始图像的基础上计算其方差图，方差图能够反应图像的变化情况，从而获取图像发生剧烈变化的位置，便于将文字区域与其他图像区域区分。

边缘图像获取模块902能够获取方差图的边缘图像。在一些实施例中，可以采用相关技术中任意一种边缘检测算法计算边缘图像。

在一些实施例中，边缘图像获取模块902能够在方差图的基础上进一步提取方差图的边缘轮廓，得到边缘图像。可以利用相关技术中任意一种边缘图像提取算法进行实现，如采用Canny算子计算图像边缘，得到边缘图像。

通过这样的方法，能够在方差图的基础上进一步得到方差图的边缘轮廓，从而便于在边缘图像的基础上进行运算，得到位于边缘点之间的文字区域。

文字区域定位模块903能够在边缘图像中相邻两条边缘线中位置相对的边缘点之间距离的差值在预定距离差范围内时，确定相邻两条边缘线之间的区域为文字区域。在一些实施例中，可以在边缘图像中得到两条近似平行的边缘线，该边缘线可以为直线、曲线，中间可以有断点等，若两条边缘线之间的距离相对稳定，距离变化范围在预定距离差范围内，则可以认为这两条边缘线之间的区域为文字区域。

图10进一步示出本公开的文字区域定位装置中文字区域定位模块的一些实施例的示意图。如图10所示，文字区域定位模块边缘点确定单元1001、行高确定单元1002 和边缘线连接单元1003。

边缘点确定单元1001能够确定第一边缘点和位于相邻边缘线上的第二边缘点。在一些实施例中，可以遍历边缘图像，每次取一个边缘点作为第一边缘点，直至完成整幅图像或整条边缘线上每个边缘点与相对的第二边缘点间关联关系的确认。在第一边缘点的基础上可以取与第一边缘点所处的边缘线相邻的边缘线上与第一边缘点位置相对的像素点作为第二边缘点。如两条水平的边缘线上下平行，第一边缘点坐标为(x，y)，则第二边缘点坐标为(x，y+n)，其中，n为第一、第二边缘点之间的距离。

行高确定单元1002能够根据第一边缘点和第二边缘点之间的距离确定行高。在一些实施例中，可以遍历整幅图，得到每个第一边缘点和对应的第二边缘点之间的行高。

边缘线连接单元1003连接行高的差值在预定距离差范围内的相邻的第一边缘点，确定第一边缘线，连接行高的差值在预定距离差范围内的相邻的第二边缘点，确定第二边缘线，第一边缘线与第二边缘线之间的区域为文字区域。

在一些实施例中，若至少两个第一边缘点相邻、且第一边缘点对应的第二边缘点也相邻，且这些相邻的边缘点中，第一边缘点与第二边缘点之间的距离的差值在预定距离差范围内，则可以认为第一边缘点和第二边缘点分别为文字的上边线点、下边线点(在竖直状态下是左、右边线点)。从而可以将相邻边缘点连接，得到文字的上边线、文字的下边线(在竖直状态下是左、右边线)，边线之间的区域即为文字区域。

这样的装置能够在边缘图像的基础上得到文字的边线，从而得到文字区域，由于无需进行单个文字的判断，降低了运算量，且不受笔画粗度不同、像素值有较大差异的不规则区域的影响，提高了文字区域定位的效率和准确度。

图11进一步示出本公开的文字区域定位装置中边缘点确定单元的一些实施例的示意图。如图11所示，边缘点确定单元包括第一边缘点指定子单元1101、下一边缘点获取子单元1102和第二边缘点确定子单元1103。

第一边缘点指定子单元1101能够在边缘图像中取一点作为第一边缘点。在一些实施例中，可以遍历边缘图像，每次取一个边缘点作为第一边缘点，直至确定整幅图像中每个边缘点对应的第二边缘点，或完成确定整条边缘线上每个边缘点的第二边缘点。

下一边缘点获取子单元1102能够从第一边缘点沿像素梯度的方向发射射线，直至下一边缘点，从而能够找到与第一边缘点所处的边缘线相邻的边缘线上与第一边缘点位置相对的点。

第二边缘点确定子单元1103能够当第一边缘点与下一边缘点法向量的夹角小于预定角度阈值时，确定下一边缘点为第二边缘点。在一些实施例中，预定角度阈值可以为30度。

这样的装置能够在边缘图像的基础上确定第一边缘点和与其位置相对的第二边缘点，为计算第一边缘点与第二边缘点的距离提供了数据基础。由于采用沿像素梯度的方向发射射线的方式确定第二边缘点，得到的第二边缘点与第一边缘点的相对位置不确定，根据像素变化情况可能是上下、左右或其他位置关系。这样能够确定横向文字区域、纵向文字区域、倾斜文字区域，甚至是扇形文字区域，防止不规则排版造成的漏定位，提高文字定位的准确度。

图12示出本公开文字区域定位装置的另一些实施例的结构示意图。如图12所示，文字区域定位装置包括存储器1210和处理器1220。

存储器1210可以是磁盘、闪存或其它任何非易失性存储介质。存储器用于存储文字区域定位方法的对应实施例中的指令，包括仿真平台侧指令，也可以包括管理系统侧指令。

处理器1220耦接至存储器1210，可以作为一个或多个集成电路来实施，例如微处理器或微控制器。该处理器1220用于执行存储器中存储的指令，能够实现文字区域的定位。

在一些实施例中，还可以如图13所示，文字区域定位装置1300包括存储器1310和处理器1320。处理器1320通过BUS总线1330耦合至存储器1310。该文字区域定位装置1300还可以通过存储接口1040连接至外部存储装置1350以便调用外部数据，还可以通过网络接口1360连接至网络或者另外一台计算机系统(未标出)。此处不再进行详细介绍。

在该实施例中，通过存储器存储数据指令，再通过处理器处理上述指令，能够实现文字区域定位装置的运转。

在另一些实施例中，一种计算机可读存储介质，其上存储有计算机程序指令，该指令被处理器执行时实现文字区域定位方法对应实施例中的方法的步骤。本领域内的技术人员应明白，本公开的实施例可提供为方法、装置、或计算机程序产品。因此，本公开可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本公开可采用在一个或多个其中包含有计算机可用程序代码的计算机可用非瞬时性存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本公开是参照根据本公开实施例的方法、设备(系统)和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

至此，已经详细描述了本公开。为了避免遮蔽本公开的构思，没有描述本领域所公知的一些细节。本领域技术人员根据上面的描述，完全可以明白如何实施这里公开的技术方案。

可能以许多方式来实现本公开的方法以及装置。例如，可通过软件、硬件、固件或者软件、硬件、固件的任何组合来实现本公开的方法以及装置。用于所述方法的步骤的上述顺序仅是为了进行说明，本公开的方法的步骤不限于以上具体描述的顺序，除非以其它方式特别说明。此外，在一些实施例中，还可将本公开实施为记录在记录介质中的程序，这些程序包括用于实现根据本公开的方法的机器可读指令。因而，本公开还覆盖存储用于执行根据本公开的方法的程序的记录介质。

最后应当说明的是：以上实施例仅用以说明本公开的技术方案而非对其限制；尽管参照较佳实施例对本公开进行了详细的说明，所属领域的普通技术人员应当理解：依然可以对本公开的具体实施方式进行修改或者对部分技术特征进行等同替换；而不脱离本公开技术方案的精神，其均应涵盖在本公开请求保护的技术方案范围当中。

Claims

一种文字区域定位方法，包括：

根据原始图像获取方差图；

获取所述方差图的边缘图像；

当所述边缘图像中相邻两条边缘线中位置相对的边缘点之间距离的差值在预定距离差范围内时，确定所述相邻两条边缘线之间的区域为文字区域。
根据权利要求1所述的文字区域定位方法，其中，所述确定所述相邻两条边缘点之间的区域为文字区域包括：

确定第一边缘点和位于相邻边缘线上的第二边缘点；

根据所述第一边缘点和所述第二边缘点之间的距离确定行高；

连接行高的差值在预定距离差范围内的相邻的所述第一边缘点，以确定第一边缘线，连接行高的差值在预定距离差范围内的相邻的所述第二边缘点，以确定第二边缘线，所述第一边缘线与所述第二边缘线之间的区域为所述文字区域。
根据权利要求2所述的文字区域定位方法，所述确定第一边缘点和位于相邻边缘线上的第二边缘点包括：

在所述边缘图像中取一点作为所述第一边缘点；

从所述第一边缘点沿像素梯度的方向发射射线，直至下一边缘点；

当所述第一边缘点与所述下一边缘点法向量的夹角小于预定角度阈值时，确定所述下一边缘点为所述第二边缘点。
根据权利要求1所述的文字区域定位方法，所述根据原始图像获取方差图包括：

获取原始图像中目标像素位置的像素值、及所述目标像素位置的邻近像素点的像素值，其中，所述邻近像素点为所述目标像素位置在不同方向连续预定数量的像素点；

将所述原始图像中所述目标像素位置和所述邻近像素点的像素值取方差值，确定所述方差图中所述目标像素位置的像素值。
根据权利要求1所述的文字区域定位方法，其中，所述获取所述方差图的边缘图像包括：基于所述方差图利用Canny算子计算图像边缘，获取所述边缘图像。
根据权利要求1所述的文字区域定位方法，其中，所述文字区域包括横向文字区域、纵向文字区域、倾斜文字区域和扇形文字区域中的至少一种。
一种文字区域定位装置，包括：

方差图确定模块，用于根据原始图像获取方差图；

边缘图像获取模块，用于获取所述方差图的边缘图像；

文字区域定位模块，用于当所述边缘图像中相邻两条边缘线中位置相对的边缘点之间距离的差值在预定距离差范围内时，确定所述相邻两条边缘线之间的区域为文字区域。
根据权利要求7所述的文字区域定位装置，其中，所述文字区域定位模块包括：

边缘点确定单元，用于确定第一边缘点和位于相邻边缘线上的第二边缘点；

行高确定单元，用于根据所述第一边缘点和所述第二边缘点之间的距离确定行高；

边缘线连接单元，用于连接行高的差值在预定距离差范围内的相邻的所述第一边缘点，以确定第一边缘线，连接行高的差值在预定距离差范围内的相邻的所述第二边缘点，以确定第二边缘线，所述第一边缘线与所述第二边缘线之间的区域为所述文字区域。
根据权利要求8所述的文字区域定位装置，其中，所述边缘点确定单元包括：

第一边缘点指定子单元，用于在所述边缘图像中取一点作为所述第一边缘点；

下一边缘点获取子单元，用于从所述第一边缘点沿像素梯度的方向发射射线，直至下一边缘点；

第二边缘点确定子单元，用于当所述第一边缘点与所述下一边缘点法向量的夹角小于预定角度阈值时，确定所述下一边缘点为所述第二边缘点。
根据权利要求7所述的文字区域定位装置，其中，所述方差图确定模块用于：

获取原始图像中目标像素位置的像素值，及所述目标像素位置的邻近像素点的像素值，其中，所述邻近像素点为所述目标像素位置在不同方向连续预定数量的像素点；

将所述原始图像中所述目标像素位置和所述邻近像素点的像素值取方差值，确定所述方差图中所述目标像素位置的像素值。
根据权利要求7所述的文字区域定位装置，其中，所述边缘图像获取模块用于基于所述方差图利用Canny算子计算图像边缘，获取所述边缘图像。
根据权利要求7所述的文字区域定位装置，其中，所述文字区域包括横向文字区域、纵向文字区域、倾斜文字区域和扇形文字区域中的至少一种。
一种文字区域定位装置，包括：

存储器；以及

耦接至所述存储器的处理器，所述处理器被配置为基于存储在所述存储器的指令执行如权利要求1至6任一项所述的文字区域定位方法。
一种计算机可读存储介质，其上存储有计算机程序指令，该指令被处理器执行时实现权利要求1至6任意一项所述的文字区域定位方法。