WO2015018337A1

WO2015018337A1 - 在图像中线段吸附的方法及装置，构造多边形的方法及装置

Info

Publication number: WO2015018337A1
Application number: PCT/CN2014/083783
Authority: WO
Inventors: 龙腾; 王跃; 镇立新
Original assignee: 上海合合信息科技发展有限公司
Priority date: 2013-08-06
Filing date: 2014-08-06
Publication date: 2015-02-12
Also published as: CN103400387B; CN103400387A

Abstract

一种在图像中线段吸附的方法，包括预设线段，通过选择所述线段的第一部位拖拽该线段，当该线段的第二部位拖拽至图像中某一线段的相应的第二部位的附近时，将所述预设线段设置为与该某一线段重合，所述附近是指二者之间的距离符合预先设定的规则。通过采用上述技术方案，能够根据图像中已经存在的线段，便捷的协助用户定义多边形边框，以便进行后续的图像处理。

Description

在图像中线段吸附的方法及装置，构造多边形的方法及装置发明领域

本发明涉及一种图像识别技术，尤其是一种在图像中线段吸附的方法。本发明还涉及一种图像识别装置，尤其是一种在图像中线段吸附的装置。本发明又涉及一种图像处理的方法，尤其是一种在图像中构造多边形的方法。本发明又涉及一种图像处理装置，尤其是一种在图像中构造多边形的装置。背景技术

目前，在商务设备如扫描仪，商务手机上，开始越来越多的出现对所拍摄图片的信息进行加工和提取的功能。这些功能一般可归结为两类：

1 ) 白板图像的校正和增强

白板图像是对会议白板，公告牌和其他文本类矩形目标拍摄所得的图像。白板图像中用户感兴趣的信息一般在矩形区域内，而拍摄所得的图片，首先在目标矩形区域之外会有不需要的边缘区域，其次因为拍摄角度的问题，目标矩形区域可能会出现不规则四边形（如图 1 ) , 或者缺角（如图 2 ) 的情况。通过对图像的处理，将目标区域之外的部分去除，并将不规则四边形变形为规则的矩形（如图 3 ) , 或者将缺角部分填平（如图 4 ) , 并将彩色图像转换为黑白图像，并做图像增强操作，使文字更加清晰。

2 ) 对文本图像中文本的识别

文本图像是对标准文本，如 A4格式纸质文本，各种书籍中的页面，电影海报等进行拍摄所得的图像。文本识别是通过文本识别引擎，对文本图像数据进行处理，识别出图像中的文本。文本图像文本内容一般显示在矩形区域内，而拍摄所得的图片，在目标矩形区域之外会有不需要的边缘区域，其次因为拍摄角度的问题，目标矩形区域可能会出现不规则四边形（如图 1 ) , 或者缺角 (如图 2 ) 的情况。为了使文本识别引擎对文本图像的识别更加准确迅速，需要通过对图像的处理，将目标区域之外的部分去除，并将不规则四边形变形为规则的矩形（如图 3 ) , 或者将缺角部分填平（如图 4 ) , 并将彩色文本图像转换为黑白图像，并做图像增强操作，使图像中的文字和背景的对比更加明显。

上述两类操作都需要做四边形框检测操作。四边形框检测操作是指对所拍摄的图像进行检测，提取目标四边形框，从而在之后的操作中，去除四边形框以外的区域，并对该四边形框进行矩形框校正或补角操作。然而在实际操作中，自动检测所得的四边形框范围可能不是期望结果，如图 5 , 原本目标框的是虚线范围内的部分，但实际检测到的是实线范围部分；或者如图 6, 源图中有多个框可供抓取，目标框是左侧虚线范围部分，但实际检测到的是右侧实线范围部分。因此，在对图像进行初次检测时候，需要提供一个交互界面供用户做目标框的调整。

公开号为 CN101807293A的中国发明专利公开文本中，记载了一种采用顶点吸附构造四边形框的方法。但是，在实际操作中，可能由于拍照背景比较杂乱，会使得顶点位置难以识别，或者待识别的四边形，其顶点是圓角。这都造成顶点吸附功能无法使用，使用者无法通过顶点构造四边形边框。发明概述

本发明所要解决的技术问题是提供一种在图像中线段吸附的方法，和采用这种方法的线段吸附的设备，以及一种在图像中构造多边形的方法，和采用这种方法的构造多边形的设备，能够便捷的识别图像中的四边形边框位置，从而构造出四边形以便后续图像处理使用。

为解决上述技术问题，本发明在图像中线段吸附的方法的技术方案是，包括预设线段，通过选择所述线段的第一部位拖拽该线段，当该线段的第二部位拖拽至图像中某一线段的相应的第二部位的附近时，将所述预设线段设置为与该某一线段重合，所述附近是指二者之间的距离符合预先设定的规则。

本发明在图像中线段吸附的方法的另一技术方案是，包括预设线段，通过选择所述线段的第一部位拖拽该线段，当拖拽动作结束时，该线段的第二部位位于图像中某一线段的相应的第二部位的附近，则将所述预设线段设置为与该某一线段重合，所述附近是指二者之间的距离符合预先设定的规则。

本发明还公开了一种在图像中线段吸附的装置，其技术方案是，基于移动通信数据终端平台，采用了上述在图像中线段吸附的方法。

本发明又公开了一种在图像中构造多边形的方法，其技术方案是，预设一个多边形边框；所述多边形边框中至少一条边的线段采用上述在图像中线段吸附的方法来确定其长度和位置，从而在图像中构造一个多边形。

本发明再公开了一种在图像中构造多边形的装置，其技术方案是，基于移动通信数据终端平台，采用了上述在图像中构造多边形的方法。

本发明通过采用上述技术方案，能够根据图像中已经存在的线段，便捷的协助用户定义多边形边框，以便进行后续的图像处理。附图的简要描述

下面结合附图和实施例对本发明作进一步详细的说明：

图 1-图 4是白板和文本拍摄和处理后图像的示意图；

图 5和图 6是抓框后目的框需要再调整的示意图。发明的详细说明

本发明公开了一种在图像中线段吸附的方法，包括预设线段，通过选择所述线段的第一部位拖拽该线段，当该线段的第二部位拖拽至图像中某一线段的相应的第二部位的附近时，将所述预设线段设置为与该某一线段重合，所述附近是指二者之间的距离在相互靠近过程中符合预先设定的规则。该实施例中，在拖拽预设线段的过程中，一旦该线段的第二部位拖拽至图像中某一线段的相应的第二部位的附近时，预设线段就被吸附至该某一线段上，即与该某一线段重合。

在本发明的另一个公开的实施例中，一种在图像中线段吸附的方法，包括预设线段，通过选择所述线段的第一部位拖拽该线段，当拖拽动作结束时，该线段的第二部位位于图像中某一线段的相应的第二部位的附近，则将所述预设线段设置为与该某一线段重合，所述附近是指二者之间的距离在相互靠近过程中符合预先设定的规则。该实施例中，只有在拖拽预设线段过程结束时，例如采用触摸屏的智能手机上，用户拖拽预设线段后手指离开触摸屏时，该线段的第二部位如果在图像中某一线段的相应的第二部位的附近时，预设线段就被吸附至该某一线段上，即与该某一线段重合。

对图像中某一线段进行检测的方法是目前比较成熟的技术，具体可以有多种，比如可以通过霍夫变换得到图像中所有的线段。本发明中所述的图像中的某一线段，可以是直线段，也可以是近似直线段的曲线段。在一些图像，尤其是照片图像中，由于拍摄镜头失真，或者被拍摄物体边缘不平等原因，拍摄后的照片，本该是直线段的部分可能会出现弯曲或波动，对于弯曲和波动不是很严重的曲线段，在本发明中也可作为直线段进行识别，具体的识别方式，在现有技术中也非常成熟。

在采用触摸屏的智能手机上，用户点击的位置可能不会非常的精确，因此拖拽所述预设线段时所选择的第一部位可以在所述预设线段上，也可以在所述预设线段附近。

拖拽所述预设线段时所选择的第一部位与所述该线段上的第二部位为同一部位或不同部位。如果是同一部位，可便于用户更直接的将预设线段拖拽至想要拖拽的位置。但是如果图像中内容比较复杂，所述的第一部位和第二部位就可以是不同的部位，这样用户在拖拽时，用户的手指不会将第二部位遮挡，便于用户在拖拽过程中对于预设线段的位置做出判断。

所述第二部位可以是该预设线段及图像中某一线段的端点，也可以是该预设线段及图像中某一线段的中点。同样，也可以是该预设线段及图像中某一线段的其它位置，这可以在使用时进行设定。对于第二部位的选择，可以避开线段上与其它线段相交的位置，使得吸附时更加准确。这些第二部位可以被以特殊的标记标注，以供使用者注意。

所述预先设定的规则可以是距离小于预先设定的数值。

所述预先设定的规则也可以是距离符合预先设定的公式，例如根据图像中某一线段的长度乘以一个比例因子得到一个数值，当距离小于该数值时，预设线段就吸附上去，即与该某一线段重合。类似的规则还有很多，本领域技术人员对该规则可以灵活设置，在此不多做赘述。

本发明还公开了一种在图像中线段吸附的装置，基于移动通信数据终端平台，采用了上述在图像中线段吸附的方法。

本发明又公开了一种在图像中构造多边形的方法，预设一个多边形边框；所述多边形边框中至少一条边的线段采用上述在图像中线段吸附的方法来确定其长度和位置，从而在图像中构造一个多边形。

在实际应用中，所述多边形为四边形的情况最为常见，可方便用户进行各种图像处理。

在一个优选实施例中，首先在图像上预设一个多边形，之后所述多边形边框中至少一条边的线段采用上述在图像中线段吸附的方法来确定其长度和位置，从而在图像中构造一个多边形。

更进一步的，所述预设的多边形的至少一条边设置为图像中的某一线段。在拖拽某一条边框时，除该边框的两个端点之外的所述多边形的其它顶点保持不动。这样，用户可以尽可能少的边线进行调整，之后得到需要的四边形边框。以四边形为例，一般情况下，用户只要对两条对边进行调整，就可以得到一个四边形边框。

在构造多边形时，如果相邻的两条边在采用上述在图像中线段吸附的方法来确定其位置之后仍旧没有交点，则将该相邻的两条边在能够相交的方向延长并相交，该交点和延长后的相邻的两条边都作为所构造多边形的组成部分。对于图像中的多边形其顶点如果不是直线相交的角而是倒圓角，或者其顶点位置由于其他原因在图像中无法被清晰识别时，采用上述方法可以有效的找到该顶点的位置从而构造出多边形。

本发明再公开了一种在图像中构造多边形的装置，基于移动通信数据终端平台，采用了上述在图像中构造多边形的方法。

现有技术，对于在图像中识别多边形，需要用户确定各条边线的端点，因此每条线段至少要进行两次设置，本发明通过采用上述技术方案，能够根据图像中已经存在的线段，只进行一次设置就可以完成线段位置的确定，便捷的协助用户定义多边形边框，以便进行后续的图像处理。

以上所述仅为本发明的较佳是实力而已，并非用以限定本发明的实质技术内容范围，本发明的实质技术内容是广义的定义于申请的权利要求范围中，任何他人完成的技术实体或方法，若是与申请的权利要求范围所定义的完全相同，也或是一种等效的变更，均将被视为涵盖于该权利要求范围之中。

Claims

权利要求书

1.一种在图像中线段吸附的方法，其特征在于，包括预设线段，通过选择所述线段的第一部位拖拽该线段，当该线段的第二部位拖拽至图像中某一线段的相应的第二部位的附近时，将所述预设线段设置为与该某一线段重合，所述附近是指二者之间的距离符合预先设定的规则。

2.根据权利要求 1所述的在图像中线段吸附的方法，其特征在于，拖拽所述预设线段时所选择的第一部位或者在所述预设线段上，或者在所述预设线段附近。

3.根据权利要求 1所述的在图像中线段吸附的方法，其特征在于，拖拽所述预设线段时所选择的第一部位与所述该线段上的第二部位为同一部位或不同部位。

4.根据权利要求 1、 2或 3所述的在图像中线段吸附的方法，其特征在于，所述第二部位为该预设线段及图像中某一线段的端点或中点或其它任意特定位置的点。

5.根据权利要求 1所述的在图像中线段吸附的方法，其特征在于，所述预先设定的规则是距离小于预先设定的数值，或者是距离符合预先设定的公式。

6.—种在图像中线段吸附的方法，其特征在于，包括预设线段，通过选择所述线段的第一部位拖拽该线段，当拖拽动作结束时，该线段的第二部位位于图像中某一线段的相应的第二部位的附近，则将所述预设线段设置为与该某一线段重合，所述附近是指二者之间的距离符合预先设定的规则。

7.根据权利要求 6所述的在图像中线段吸附的方法，其特征在于，拖拽所述预设线段时所选择的第一部位或者在所述预设线段上，或者在所述预设线段附近。

8.根据权利要求 6所述的在图像中线段吸附的方法，其特征在于，拖拽所述预设线段时所选择的第一部位与所述该线段上的第二部位为同一部位。

9.根据权利要求 6、 7或 8所述的在图像中线段吸附的方法，其特征在于，所述第二部位为该预设线段及图像中某一线段的端点或中点或其它任意特定位置的点。

10. 根据权利要求 6所述的在图像中线段吸附的方法，其特征在于，所述预先设定的规则是距离小于预先设定的数值，或者是距离符合预先设定的公式。

11. 一种在图像中线段吸附的装置，其特征在于，基于移动通信数据终端平台，采用了如权利要求 1-10中任意一项所述的在图像中线段吸附的方法。

12. 一种在图像中构造多边形的方法，其特征在于，预设一个多边形边框；所述多边形边框中至少一条边的线段采用如权利要求 1-10中任意一项所述的在图像中线段吸附的方法来确定其位置，从而在图像中构造一个多边形。

13. 根据权利要求 12所述的在图像中构造多边形的方法，其特征在于，所述多边形为四边形。

14. 根据权利要求 12所述的在图像中构造多边形的方法，其特征在于，首先在图像上预设一个多边形，之后所述多边形边框中至少一条边的线段采用如权利要求 1-10 中任意一项所述的在图像中线段吸附的方法来确定其长度和位置，从而在图像中构造一个多边形。

15. 根据权利要求 14所述的在图像中构造多边形的方法，其特征在于，所述预设的多边形的至少一条边设置为图像中的某一线段。

16. 根据权利要求 12所述的在图像中构造多边形的方法，其特征在于，在拖拽某一条边框时，除该边框的两个端点之外的所述多边形的其它顶点保持不动。

17. 根据权利要求 12所述的在图像中构造多边形的方法，其特征在于，在构造多边形时，如果相邻的两条边在采用如权利要求 1-10中任意一项所述的在图像中线段吸附的方法来确定其位置之后仍旧没有交点，则将该相邻的两条边在能够相交的方向延长并相交，该交点和延长后的相邻的两条边都作为所构造多边形的组成部分。

18. 一种在图像中构造多边形的装置，其特征在于，基于移动通信数据终端平台，采用了如权利要求 12-17中任意一项所述的在图像中构造多边形的方法。