CN111047617B - 一种矩形识别优化方法、装置及设备 - Google Patents

一种矩形识别优化方法、装置及设备 Download PDF

Info

Publication number
CN111047617B
CN111047617B CN201911310409.2A CN201911310409A CN111047617B CN 111047617 B CN111047617 B CN 111047617B CN 201911310409 A CN201911310409 A CN 201911310409A CN 111047617 B CN111047617 B CN 111047617B
Authority
CN
China
Prior art keywords
preset
line segment
point
line segments
module
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201911310409.2A
Other languages
English (en)
Other versions
CN111047617A (zh
Inventor
吴晖
王杨
陈辉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Southern Power Grid Power Technology Co Ltd
Original Assignee
China Southern Power Grid Power Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Southern Power Grid Power Technology Co Ltd filed Critical China Southern Power Grid Power Technology Co Ltd
Priority to CN201911310409.2A priority Critical patent/CN111047617B/zh
Publication of CN111047617A publication Critical patent/CN111047617A/zh
Application granted granted Critical
Publication of CN111047617B publication Critical patent/CN111047617B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/13Edge detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20092Interactive image processing based on input by user
    • G06T2207/20104Interactive definition of region of interest [ROI]

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Image Analysis (AREA)

Abstract

本申请公开了一种矩形识别优化方法、装置及设备,方法包括:获取预置类矩形边缘特征图中所有线段的端点坐标;任选当前线段的一端作为中心点,沿所述当前线段的另一端反向延长的预置区域作为预置考察区域;选取区域中的符合条件的白点作为新端点进行延长操作;以所述新端点作为新的中心点,或者选择所述当前线段的另一端的端点作为中心点,重复延长操作,直至找不到符合条件的点;对符合预置线段合并条件的两条线段进行合并操作,得到合并线段,使得所述预置类矩形边缘特征图中的类矩形得到优化。本申请解决了矩形识别过程中提取的直线长短不一、冗余度较大的技术问题。

Description

一种矩形识别优化方法、装置及设备
技术领域
本申请涉及图像识别技术领域,尤其涉及一种矩形识别优化方法、装置及设备。
背景技术
在电力产业的方面,智能巡检作为电力产业的重要一环,相应的智能巡检机器人也就扮演者越来越重要的角色。在智能巡检的过程中,往往会涉及到对各种仪表、开关等对象的识别,这其中往往会涉及到对矩形对象的识别,能否准确快速地识别出图像中的矩形对象将会直接影响后续智能分析的结果。
矩形识别的算法流程分为三步,首先是边缘特征检测,利用Canny边缘检测算子的方法,提取出图像的边缘特征,然后利用概率霍夫变换的方法,在边缘特征图的基础上提取出其中的线段,最后根据线段的位置分布判断哪些线段属于同一个矩形的四条边缘,进而识别出对应的矩形。
目前比较常用的线段检测算法是基于统计霍夫变换的线段提取算法,但该方法检测效果往往不是特别地准确:不能保证所有的线段边缘都能够被准确无误的检测出来。对于某一条边缘,理论上应该只检测出一条与边缘本身长度一致的线段,但实际上检测的线条存在较大冗余且长短不一,这将在很大程度上影响矩形的识别准确率。
发明内容
本申请提供了一种矩形识别优化方法、装置及设备,用于解决现有技术的基于统计霍夫变换的线段提取算法,不能保证所有的线段边缘都能够被准确无误的检测出来,对矩形识别获取的线段长短不一,冗余度较大,导致无法准确描述矩形边缘,影响矩形识别准确率的技术问题。
有鉴于此,本申请第一方面提供了矩形识别优化方法,包括:
S1、获取预置类矩形边缘特征图中所有线段的端点坐标;
S2、任选当前线段的一端作为中心点,扩展预置个像素,生成预置ROI区域,将在所述预置ROI区域中以所述中心点为出发点,沿所述当前线段的另一端反向延长的预置区域作为预置考察区域,所述预置考察区域经过所述中心点的预置长度的边界线垂直于所述当前线段;
S3、获取所述预置ROI区域中每个像素点的权值,得到权值矩阵;
S4、获取所述预置边缘特征图中与所述预置ROI区域对应的像素部分,得到特征矩阵;
S5、将所述权值矩阵与所述特征矩阵每个元素对应相乘,得到端点矩阵;
S6、将所述端点矩阵中的值降序排列,依次选取所述降序排列中的点,若选取的点与所述中心点所确定的线段与所述当前线段之间形成的锐角在预置角度范围内,则将选取的点作为所述当前线段的新端点,并结束选取操作;
S7、以所述新端点作为新的中心点,重复步骤S2-S6,直至找不到同时在所述预置ROI区域、所述预置考察区域和所述预置角度范围内的点;
S8、选择所述当前线段的另一端的端点作为中心点,重复步骤S2-S7,直至找不到同时在所述预置ROI区域、所述预置考察区域和所述预置角度范围内的点;
S9、对符合预置线段合并条件的两条线段进行合并操作,得到合并线段,使得所述预置类矩形边缘特征图中的类矩形得到优化。
优选地,步骤S9包括:
S91、任选两条线段,在所述两条线段满足预置线段合并条件时,将所述两条线段形成的锐角的角平分线作为合并线段的方向,所述预置线段合并条件为线段的中点与另一条线段的距离小于第一距离阈值、所述两条线段的水平距离和垂直距离之和小于第二距离阈值以及两条线段形成的锐角小于角度阈值;
S92、将所述两条线段端点映射于所述合并线段上,并将映射得到的四个点中相距最远的两个点作为所述合并线段的端点;
S93、获取所述合并线段的端点坐标,并删除所述两条线段;
S94、重新选择任意两条线段,重复步骤S91-S93,直至不存在满足所述预置线段合并条件的两条线段。
优选地,步骤S2包括:
以所述中心点为基准,同时向上下扩展第一预置个像素,向左右扩展第二预置个像素,生成所述预置ROI区域。
优选地,步骤S3包括:
将所述预置ROI区域中不在所述预置考察区域的像素点的权值置0;
计算所述预置考察区域中每个像素点与沿所述当前线段的另一端反向延长线的第一偏离距离以及与所述中心点所在的所述预置考察区域边界的第二偏离距离;
通过预置公式计算所述预置考察区域中每个像素点的权值,得到所述权值矩阵,所述预置公式为:
wi,j=1+[RT×1.5+RS]
其中,i,j为每个像素点的位置,RT为所述第一偏离距离,RS为所述第二偏离距离。
本申请第二方面提供了一种矩形识别优化装置,包括:
获取模块,用于获取预置类矩形边缘特征图中所有线段的端点坐标;
扩展模块,用于任选当前线段的一端作为中心点,扩展预置个像素,生成预置ROI区域,将在所述预置ROI区域中以所述中心点为出发点,沿所述当前线段的另一端反向延长的预置区域作为预置考察区域,所述预置考察区域经过所述中心点的预置长度的边界线垂直于所述当前线段;
权值模块,用于获取所述预置ROI区域中每个像素点的权值,得到权值矩阵;
特征模块,用于获取所述预置边缘特征图中与所述预置ROI区域对应的像素部分,得到特征矩阵;
计算模块,用于将所述权值矩阵与所述特征矩阵每个元素对应相乘,得到端点矩阵;
新端点选取模块,用于将所述端点矩阵中的值降序排列,依次选取所述降序排列中的点,若选取的点与所述中心点所确定的线段与所述当前线段之间形成的锐角在预置角度范围内,则将选取的点作为所述当前线段的新端点,并结束选取操作;
第一更新模块,用于以所述新端点作为新的中心点,触发所述扩展模块,直至找不到同时在所述预置ROI区域、所述预置考察区域和所述预置角度范围内的点;
第二更新模块,用于选择所述当前线段的另一端的端点作为中心点,触发所述扩展模块,直至找不到同时在所述预置ROI区域、所述预置考察区域和所述预置角度范围内的点;
线段合并模块,用于对符合预置线段合并条件的两条线段进行合并操作,得到合并线段,使得所述预置类矩形边缘特征图中的类矩形得到优化。
优选地,所述线段合并模块包括:
筛选模块,用于任选两条线段,在所述两条线段满足预置线段合并条件时,将所述两条线段形成的锐角的角平分线作为合并线段的方向,所述预置线段合并条件为线段的中点与另一条线段的距离小于第一距离阈值、所述两条线段的水平距离和垂直距离之和小于第二距离阈值以及两条线段形成的锐角小于角度阈值;
映射模块,用于将所述两条线段端点映射于所述合并线段上,并将映射得到的四个点中相距最远的两个点作为所述合并线段的端点;
获取模块,用于获取所述合并线段的端点坐标,并删除所述两条线段;
第三更新模块,用于重新选择任意两条线段,触发筛选模块,直至不存在满足所述预置线段合并条件的两条线段。
优选地,所述扩展模块包括:
扩展子模块,用于以所述中心点为基准,同时向上下扩展第一预置个像素,向左右扩展第二预置个像素,生成预置ROI区域。
优选地,所述权值模块包括:
权值子模块,用于将所述预置ROI区域中不在所述预置考察区域的像素点的权值置0;
计算所述预置考察区域中每个像素点与沿所述当前线段的另一端反向延长线的第一偏离距离以及与所述中心点所在的所述预置考察区域边界的第二偏离距离;
通过预置公式计算所述预置考察区域中每个像素点的权值,得到所述权值矩阵,所述预置公式为:
wi,j=1+[RT×1.5+RS]
其中,i,j为每个像素点的位置,RT为所述第一偏离距离,RS为所述第二偏离距离。
本申请第三方面提供了一种矩形识别优化设备,其特征在于,所述设备包括处理器以及存储器:
所述存储器用于存储程序代码,并将所述程序代码传输给所述处理器;
所述处理器用于根据所述程序代码中的指令执行第一方面提供的任一项所述的矩形识别优化方法。
本申请第四提供了一种计算机可读存储介质,其特征在于,所述计算机可读存储介质用于存储程序代码,所述程序代码用于执行第一方面提供的任一项所述的矩形识别优化方法。
从以上技术方案可以看出,本申请实施例具有以下优点:
本申请中,提供了一种矩形识别优化方法,包括:获取预置类矩形边缘特征图中所有线段的端点坐标;任选当前线段的一端作为中心点,扩展预置个像素,生成预置ROI区域,将在预置ROI区域中以中心点为出发点,沿当前线段的另一端反向延长的预置区域作为预置考察区域,预置考察区域经过中心点的预置长度的边界线垂直于当前线段;获取预置ROI区域中每个像素点的权值,得到权值矩阵;获取预置边缘特征图中与预置ROI区域对应的像素部分,得到特征矩阵;将权值矩阵与特征矩阵每个元素对应相乘,得到端点矩阵;将端点矩阵中的值降序排列,依次选取降序排列中的点,若选取的点与中心点所确定的线段与当前线段之间形成的锐角在预置角度范围内,则将选取的点作为当前线段的新端点,并结束选取操作;以新端点作为新的中心点,重新进行扩展操作,直至找不到同时在预置ROI区域、预置考察区域和预置角度范围内的点;选择当前线段的另一端的端点作为中心点,重新进行扩展操作,直至找不到同时在预置ROI区域、预置考察区域和预置角度范围内的点;对符合预置线段合并条件的两条线段进行合并操作,得到合并线段,使得预置类矩形边缘特征图中的类矩形得到优化。
本申请提供的矩形识别优化方法中,将在预置特征图中提取的线段进行两步优化处理,对提取的线段进行延长处理,是由于直接使用统计霍夫变换所得到的线段未能完整地覆盖相应的边缘,这样检测出来的线段对矩形位置判断以及形状描述都是不利的,所以本申请通过延长获取到的线段至边缘,从而得到完整的描述边界的线段,在具体的延长过程中,通过限制考察区域,限制延伸的角度使得线段是按照原有方向延伸的,从而可以完整描绘矩形的轮廓,确保了矩形识别的准确性;而对符合预置条件的两条线进行合并操作可以减少矩形同一条边的线段冗余度,提高矩形识别的精度。因此,本申请提供的矩形识别优化方法能够解决现有技术的基于统计霍夫变换的线段提取算法,不能保证所有的线段边缘都能够被准确无误的检测出来,对矩形识别获取的线段长短不一,冗余度较大,导致无法准确描述矩形边缘,影响矩形识别准确率的技术问题。
附图说明
图1为本申请提供的一种矩形识别优化方法的实施例一的流程示意图;
图2为本申请提供的一种矩形识别优化方法的实施例二的流程示意图;
图3为本申请提供的直线延长算法原理图一;
图4为本申请提供的直线延长算法原理图二;
图5为本申请提供的两条直线之间的距离示意图一;
图6为本申请提供的两条直线之间的距离示意图二;
图7为本申请提供的直线合并原理图;
图8为统计霍夫变换提取的矩形轮廓示意图;
图9为本申请提供的矩形识别优化方法提取的矩形轮廓示意图;
图10为本申请提供的一种矩形识别优化装置的实施例的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
为了便于理解,请参阅图1,本申请提供的一种矩形识别优化方法的实施例一,包括:
步骤101、获取预置类矩形边缘特征图中所有线段的端点坐标。
步骤102、任选当前线段的一端作为中心点,扩展预置个像素,生成预置ROI区域,将在预置ROI区域中以中心点为出发点,沿当前线段的另一端反向延长的预置区域作为预置考察区域。
其中,预置考察区域经过中心点的预置长度的边界线垂直于当前线段。
需要说明的是,扩展预置个像素得到的ROI区域为主要研究区域,扩展多少个像素,就能够得到相应大小的ROI区域;预置考察区域的选取是为了确保线段延长的方向始终保持在当前线段延伸的方向上,没有较大的偏差,也保障了延长线段的准确率。
步骤103、获取预置ROI区域中每个像素点的权值,得到权值矩阵。
需要说明的是,预置ROI区域中每个像素点都可以根据其位置状态计算得到一个权值,形成一个权值矩阵,权值矩阵的大小与预置ROI区域的大小一致。
步骤104、获取预置边缘特征图中与预置ROI区域对应的像素部分,得到特征矩阵。
需要说明的是,当前线段是从预置边缘特征图中提取得到的,所以预置边缘特征图上存在对应于预置ROI区域大小的部分,该部分的像素值可以作为特征组成特征矩阵,特征矩阵的大小与权值矩阵的大小是一致的。
步骤105、将权值矩阵与特征矩阵每个元素对应相乘,得到端点矩阵。
需要说明的是,特征矩阵与权值矩阵大小一致,元素一一对应,直接相乘可以得到一个新的矩阵,即端点矩阵。
步骤106、将端点矩阵中的值降序排列,依次选取降序排列中的点,若选取的点与中心点所确定的线段与当前线段之间形成的锐角在预置角度范围内,则将选取的点作为当前线段的新端点,并结束选取操作。
需要说明的是,将端点矩阵中的所有值从大到小的排序,在规定选取的点与中心点所确定的线段与当前线段形成的最小角小于预置角度后,就可以在满足偏离条件的情况下得到与当前线段大致在同一水平方向上的延长线段,使得延长操作不影响线段原有的方向。换句话说,通过角度范围的限定,在端点矩阵中找最大值,最大值即为白点,就是需要在当前线段的延伸方向上,找到最大值的点,将此点作为新端点,从而实现线段的延长;预置角度范围设置是对延长方向上偏离的制约,预置角度一般设置为±1°,超出此范围内的最大值将会被丢弃。
步骤107、以新端点作为新的中心点,重复步骤102-106,直至找不到同时在预置ROI区域、预置考察区域和预置角度范围内的点。
需要说明的是,线段的延长操作并非一次完成,而是不断寻找符合条件的“白点”作为新端点,直到在当前线段的延伸方向上找不到最大值,或者是找到的最大值偏离当前线段角度太大,则停止循环操作,当前线段一端的延长即完成。
步骤108、选择当前线段的另一端的端点作为中心点,重复步骤102-107,直至找不到同时在预置ROI区域、预置考察区域和预置角度范围内的点。
需要说明的是,当前线段的两端均需要进行延长,而两端的延长方法相同,只需要更换当前研究的中心点即可,只有当两端均完成线段延长,才会终止对当前线段的延长操作。
步骤109、对符合预置线段合并条件的两条线段进行合并操作,得到合并线段,使得预置类矩形边缘特征图中的类矩形得到优化。
需要说明的是,直接使用现有技术提取的线段冗余度较大,这对矩形的识别而言是噪声,影响矩形的判定,本实施例的主要是将两条相近的线段合并为一条,使得在两条线被删除后的合并线段更具有代表性,更加准确,且减少了线段的冗余度。
本实施例提供的矩形识别优化方法中,将在预置特征图中提取的线段进行两步优化处理,对提取的线段进行延长处理,是由于直接使用统计霍夫变换所得到的线段未能完整地覆盖相应的边缘,这样检测出来的线段对矩形位置判断以及形状描述都是不利的,所以本实施例通过延长获取到的线段至边缘,从而得到完整的描述边界的线段,在具体的延长过程中,通过限制考察区域,限制延伸的角度使得线段是按照原有方向延伸的,从而可以完整描绘矩形的轮廓,确保了矩形识别的准确性;而对符合预置条件的两条线进行合并操作可以减少矩形同一条边的线段冗余度,提高矩形识别的精度。因此,本实施例提供的矩形识别优化方法能够解决现有技术的基于统计霍夫变换的线段提取算法,不能保证所有的线段边缘都能够被准确无误的检测出来,对矩形识别获取的线段长短不一,冗余度较大,导致无法准确描述矩形边缘,影响矩形识别准确率的技术问题。
为了便于理解,请参阅图2,本申请实施例中提供了一种矩形识别优化方法的实施例二,包括:
步骤201、获取预置类矩形边缘特征图中所有线段的端点坐标。
步骤202、任选当前线段的一端作为中心点,扩展预置个像素,生成预置ROI区域,将在预置ROI区域中以中心点为出发点,沿当前线段的另一端反向延长的预置区域作为预置考察区域。
其中,预置考察区域经过中心点的预置长度的边界线垂直于当前线段。
需要说明的是,以中心点为基准,同时向上下扩展第一预置个像素,向左右扩展第二预置个像素,生成预置ROI区域。
需要说明的是,请参阅图3,设定预置个像素为range_xy,那么可以建立边长为2*range_xy+1的正方形ROI区域,当前线段的一端为该ROI区域的中心点,以中心点为起点,向前延伸的方向上设置预置宽度区域作为预置考察区域,预置宽度为2err_dis,以中心点为预置考察区域起始边的中点。
步骤203、将预置ROI区域中不在预置考察区域的像素点的权值置0。
需要说明的是,预置ROI区域中不在预置考察区域的像素点为非研究点,说明线段不会延长至此,直接设置为0,即为黑色点,只有预置考察区域的像素点为非零值点。
步骤204、计算预置考察区域中每个像素点与沿当前线段的另一端反向延长线的第一偏离距离以及与中心点所在的预置考察区域边界的第二偏离距离。
步骤205、通过预置公式计算预置考察区域中每个像素点的权值,得到权值矩阵。
需要说明的是,请参阅图4,图4为ROI区域中的线段延长方法示意图,由于图像本身为离散像素,所以需要将ROI区域进行离散处理,得到图4,用l表示当前线段,以其端点O为中心点,沿着垂直于l的方向作线段AB,要求满足OA=OB=err_dis,再分别以A、B作为端点,沿着线段l的方向做线段m、n,线段m、n分别与ROI区域的边界相交于C、E两点。最后,由线段AB、AE、BC与ROI区域边界所包围而成的区域为预置考察区域。
预置公式为:
wi,j=1+[RT×1.5+RS]
其中,i,j为每个像素点的位置,RT为第一偏离距离,RS为第二偏离距离。
需要说明的是,请参阅图4,根据ROI区域中各个像素点的状态建立一个权值矩阵H,由于ROI区域的宽高均为2*range_xy+1个像素点,因此权值矩阵H的大小也为(2*range_xy+1)×(2*range_xy+1)。预置考察区域内的权值矩阵H上相应位置赋为非0值,具体赋值的大小由两个因素决定:像素点偏离原方向的长度以及像素点离原端点,即中心点的距离在原线段方向上的投影长度。对于预置考察区域内某一像素点的中心R,R与线段AE垂直于点T,与线段AB垂直于点S,定义线段RT的长度为像素点偏离原方向的程度,而线段RS的长度则为像素点离原端点的距离在原线段方向上的投影长度。对应的权值记为wi,j=1+[RT×1.5+RS],权值矩阵H的每一个元素wi,j的值代表相应位置的权值,其中RT为像素R与线段AE的垂直距离,即第一偏离距离,RS为像素R与线段AB的垂直距离,即第二偏离距离。在预置考察区域的某些位置,取整的结果可能会得到0,为了与非预置考察区域区别,所以在取整结果的基础上加1。
步骤206、获取预置边缘特征图中与预置ROI区域对应的像素部分,得到特征矩阵。
需要说明的是,获取的是预置边缘特征图的与当前线段生成的预置ROI区域对应的部分,以该部分的像素值作为特征形成特征矩阵H0,特征矩阵的大小与权值矩阵H的大小一致。
步骤207、将权值矩阵与特征矩阵每个元素对应相乘,得到端点矩阵。
步骤208、将端点矩阵中的值降序排列,依次选取降序排列中的点,若选取的点与中心点所确定的线段与当前线段之间形成的锐角在预置角度范围内,则将选取的点作为当前线段的新端点,并结束选取操作。
需要说明的是,特征矩阵H0与权值矩阵H是对应元素一对一相乘,因此,得到的端点矩阵的大小与权值矩阵一致,且权值矩阵的权值为0的位置,在端点矩阵的相应位置应当也为0,端点矩阵只有与权值矩阵的预置考察区域的非零部分对应的部分才有非零值,将这些值进行降序排列,在其中选择最大值,再判断以该点作为新端点时,其线段方向是否在当前线段的延伸方向的预置角度范围内,预置角度范围设置为±1°,如果是,则可以确定此点为新端点,如果不满足预置角度范围的条件,则丢弃这个最大值,重新在排序中向下选取最大值,再次进行判定,直到找到这个点,或者无法找到满足条件的点,结束本次操作。在实际过程中需要先预选最大值的点作为新端点,再判断是否在预置角度范围内。
步骤209、以新端点作为新的中心点,重复步骤202-208,直至找不到同时在预置ROI区域、预置考察区域和预置角度范围内的点。
需要说明的是,线段的延长并非一次完成,需要不断循环寻找符合条件的白点,更新端点的位置,直到无法找到满足条件的点才可结束当前线段的延长操作。
步骤210、选择当前线段的另一端的端点作为中心点,重复步骤202-209,直至找不到同时在预置ROI区域、预置考察区域和预置角度范围内的点。
需要说明的是,长短不一的线段的两端均需要进行延长操作,具体的操作过程一致,对于两端延长的先后没有限制,不影响最终的线段的延长结果。
步骤211、任选两条线段,在两条线段满足预置线段合并条件时,将两条线段形成的锐角的角平分线作为合并线段的方向。
其中,预置线段合并条件为线段的中点与另一条线段的距离小于第一距离阈值、两条线段的水平距离和垂直距离之和小于第二距离阈值以及两条线段形成的锐角小于角度阈值。
需要说明的是,实际就是约束进行合并的两条线必须是距离较近,且交叉角度较小,而不是实际意义上的随便两条线段的合并。合并的线段位置在两条线段的角平分线上,使得合并线段更能作为两条线段的代表。
需要说明的是,请参阅图5和图6,具体约束过程是两条线段的中点分别与另一条线段的距离d1和d2均小于第一距离阈值distance_L1;第二距离条件是两条线段的水平距离和垂直距离之和小于第二距离阈值distance_L2;角度条件是两条线段形成的小于90°的夹角,即形成的锐角小于角度阈值distance_SL。其中水平距离是两条线段在x轴上投影所得到的的线段的端点间最邻近的两个端点距离,垂直距离是两条线段在y轴上投影所得到的线段的端点间最邻近的两个端点的距离,当两个条线段存在交叠时,将其距离定义为0,请参阅图6,其中,x1,x2,x3,x4为两条线段在x轴上的投影,水平距离表示为x3-x2;y1,y2,y3,y4为两条线段在y轴上的投影,垂直距离表示为y3-y2;在满足以上条件后,就可以将两条线段形成的锐角的角平分线作为合并线段的方向,从而确定唯一方向上的合并线段。
步骤212、将两条线段端点映射于合并线段上,并将映射得到的四个点中相距最远的两个点作为合并线段的端点。
步骤213、获取合并线段的端点坐标,并删除两条线段。
步骤214、重新选择任意两条线段,重复步骤211-213,直至不存在满足预置线段合并条件的两条线段。
需要说明的是,请参阅图7,两条线段分别为l1和l2,合并线段为l0,A、B、C、D分别为两条线段的端点在合并线段上的投影,l0上的黑点为两条线段的四个端点计算得到的重心,l0经过该点长度以A和D界定。根据A和D与两条线段之间的关系,可以求得合并线段的坐标,删除两条线段,降低线条的冗余度,得到端点坐标的合并线段需要添加至线段簇中,继续参与合并优化,直至无法找到满足条件的一对线段,即终止循环操作。直接使用现有技术提取的线段冗余度较大,这对矩形的识别而言是噪声,影响矩形的判定,本实施例的主要是将两条距离以及角度相近的线段合并为一条,通过多个条件限定被处理的线段,使得在两条线被删除后的合并线段更具有代表性,更加准确。
为了便于理解,提供一种矩形识别优化方法的应用例,请参阅图8,图9,图8为直接由统计霍夫变换得到的矩形,图9为本申请的矩形识别优化方法得到的矩形;在实际的智能机器人的智能巡检过程中,对各种仪表、开关等装置进行矩形检测识别,用本实施例中的矩形识别优化方法,通过线段延长和线段合并的两级优化的方法对检测的器件进行轮廓的描述,可以得到轮廓更加明显的矩形框,对各器件的边缘描述更为准确,图8和图9为现有基本方法与本实施例的方法的对比图。
为了便于理解,请参与图10,本申请中还提供了一种矩形识别优化装置的实施例,包括:
获取模块301,用于获取预置类矩形边缘特征图中所有线段的端点坐标;
扩展模块302,用于任选当前线段的一端作为中心点,扩展预置个像素,生成预置ROI区域,将在预置ROI区域中以中心点为出发点,沿当前线段的另一端反向延长的预置区域作为预置考察区域,预置考察区域经过中心点的预置长度的边界线垂直于当前线段;
权值模块303,用于获取预置ROI区域中每个像素点的权值,得到权值矩阵;
特征模块304,用于获取预置边缘特征图中与预置ROI区域对应的像素部分,得到特征矩阵;
计算模块305,用于将权值矩阵与特征矩阵每个元素对应相乘,得到端点矩阵;
新端点选取模块306,用于将端点矩阵中的值降序排列,依次选取降序排列中的点,若选取的点与中心点所确定的线段与当前线段之间形成的锐角在预置角度范围内,则将选取的点作为当前线段的新端点,并结束选取操作;
第一更新模块307,用于以新端点作为新的中心点,触发扩展模块302,直至找不到同时在预置ROI区域、预置考察区域和预置角度范围内的点;
第二更新模块308,用于选择当前线段的另一端的端点作为中心点,触发扩展模块302,直至找不到同时在预置ROI区域、预置考察区域和预置角度范围内的点;
线段合并模块309,用于对符合预置线段合并条件的两条线段进行合并操作,得到合并线段,使得预置类矩形边缘特征图中的类矩形得到优化。
进一步地,扩展模块302包括:
扩展子模块3021,用于以中心点为基准,同时向上下扩展第一预置个像素,向左右扩展第二预置个像素,生成预置ROI区域。
进一步地,权值模块303包括:权值子模块3031,用于将预置ROI区域中不在预置考察区域的像素点的权值置0;
计算预置考察区域中每个像素点与沿当前线段的另一端反向延长线的第一偏离距离以及与中心点所在的预置考察区域边界的第二偏离距离;
通过预置公式计算预置考察区域中每个像素点的权值,得到权值矩阵,预置公式为:
wi,j=1+[RT×1.5+RS]
其中,i,j为每个像素点的位置,RT为第一偏离距离,RS为第二偏离距离。
进一步地,线段合并模块309包括:
筛选模块3091,用于任选两条线段,在两条线段满足预置线段合并条件时,将两条线段形成的锐角的角平分线作为合并线段的方向,预置线段合并条件为线段的中点与另一条线段的距离小于第一距离阈值、两条线段的水平距离和垂直距离之和小于第二距离阈值以及两条线段形成的锐角小于角度阈值;
映射模块3092,用于将两条线段端点映射于合并线段上,并将映射得到的四个点中相距最远的两个点作为合并线段的端点;
获取模块3093,用于获取合并线段的端点坐标,并删除两条线段;
第三更新模块3094,用于重新选择任意两条线段,触发筛选模块3091,直至不存在满足预置线段合并条件的两条线段。
为了便于理解,本申请提供了一种矩形识别优化设备,其特征在于,设备包括处理器以及存储器:
存储器用于存储程序代码,并将程序代码传输给处理器;
处理器用于根据程序代码中的指令执行矩形识别优化方法任一实施例的矩形识别优化方法。
为了便于理解,本申请提供了一种计算机可读存储介质,其特征在于,计算机可读存储介质用于存储程序代码,程序代码用于执行矩形识别优化方法任一实施例的矩形识别优化方法。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以通过一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(英文全称:Read-OnlyMemory,英文缩写:ROM)、随机存取存储器(英文全称:Random Access Memory,英文缩写:RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,以上实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。

Claims (10)

1.一种矩形识别优化方法,其特征在于,包括:
S1、获取预置类矩形边缘特征图中所有线段的端点坐标;
S2、任选当前线段的一端作为中心点,扩展预置个像素,生成预置ROI区域,将在所述预置ROI区域中以所述中心点为出发点,沿所述当前线段的另一端反向延长的预置区域作为预置考察区域,所述预置考察区域经过所述中心点的预置长度的边界线垂直于所述当前线段;
S3、获取所述预置ROI区域中每个像素点的权值,得到权值矩阵;
S4、获取所述预置边缘特征图中与所述预置ROI区域对应的像素部分,得到特征矩阵;
S5、将所述权值矩阵与所述特征矩阵每个元素对应相乘,得到端点矩阵;
S6、将所述端点矩阵中的值降序排列,依次选取所述降序排列中的点,若选取的点与所述中心点所确定的线段与所述当前线段之间形成的锐角在预置角度范围内,则将选取的点作为所述当前线段的新端点,并结束选取操作;
S7、以所述新端点作为新的中心点,重复步骤S2-S6,直至找不到同时在所述预置ROI区域、所述预置考察区域和所述预置角度范围内的点;
S8、选择所述当前线段的另一端的端点作为中心点,重复步骤S2-S7,直至找不到同时在所述预置ROI区域、所述预置考察区域和所述预置角度范围内的点;
S9、对符合预置线段合并条件的两条线段进行合并操作,得到合并线段,使得所述预置类矩形边缘特征图中的类矩形得到优化。
2.根据权利要求1所述的矩形识别优化方法,其特征在于,步骤S9包括:
S91、任选两条线段,在所述两条线段满足预置线段合并条件时,将所述两条线段形成的锐角的角平分线作为合并线段的方向,所述预置线段合并条件为线段的中点与另一条线段的距离小于第一距离阈值、所述两条线段的水平距离和垂直距离之和小于第二距离阈值以及两条线段形成的锐角小于角度阈值;
S92、将所述两条线段端点映射于所述合并线段上,并将映射得到的四个点中相距最远的两个点作为所述合并线段的端点;
S93、获取所述合并线段的端点坐标,并删除所述两条线段;
S94、重新选择任意两条线段,重复步骤S91-S93,直至不存在满足所述预置线段合并条件的两条线段。
3.根据权利要求1所述的矩形识别优化方法,其特征在于,步骤S2包括:
以所述中心点为基准,同时向上下扩展第一预置个像素,向左右扩展第二预置个像素,生成所述预置ROI区域。
4.根据权利要求1所述的矩形识别优化方法,其特征在于,步骤S3包括:
将所述预置ROI区域中不在所述预置考察区域的像素点的权值置0;
计算所述预置考察区域中每个像素点与沿所述当前线段的另一端反向延长线的第一偏离距离以及与所述中心点所在的所述预置考察区域边界的第二偏离距离;
通过预置公式计算所述预置考察区域中每个像素点的权值,得到所述权值矩阵,所述预置公式为:
wi,j=1+[RT×1.5+RS]
其中,i,j为每个像素点的位置,RT为所述第一偏离距离,RS为所述第二偏离距离。
5.一种矩形识别优化装置,其特征在于,包括:
获取模块,用于获取预置类矩形边缘特征图中所有线段的端点坐标;
扩展模块,用于任选当前线段的一端作为中心点,扩展预置个像素,生成预置ROI区域,将在所述预置ROI区域中以所述中心点为出发点,沿所述当前线段的另一端反向延长的预置区域作为预置考察区域,所述预置考察区域经过所述中心点的预置长度的边界线垂直于所述当前线段;
权值模块,用于获取所述预置ROI区域中每个像素点的权值,得到权值矩阵;
特征模块,用于获取所述预置边缘特征图中与所述预置ROI区域对应的像素部分,得到特征矩阵;
计算模块,用于将所述权值矩阵与所述特征矩阵每个元素对应相乘,得到端点矩阵;
新端点选取模块,用于将所述端点矩阵中的值降序排列,依次选取所述降序排列中的点,若选取的点与所述中心点所确定的线段与所述当前线段之间形成的锐角在预置角度范围内,则将选取的点作为所述当前线段的新端点,并结束选取操作;
第一更新模块,用于以所述新端点作为新的中心点,触发所述扩展模块,直至找不到同时在所述预置ROI区域、所述预置考察区域和所述预置角度范围内的点;
第二更新模块,用于选择所述当前线段的另一端的端点作为中心点,触发所述扩展模块,直至找不到同时在所述预置ROI区域、所述预置考察区域和所述预置角度范围内的点;
线段合并模块,用于对符合预置线段合并条件的两条线段进行合并操作,得到合并线段,使得所述预置类矩形边缘特征图中的类矩形得到优化。
6.根据权利要求5中所述的矩形识别优化装置,其特征在于,所述线段合并模块包括:
筛选模块,用于任选两条线段,在所述两条线段满足预置线段合并条件时,将所述两条线段形成的锐角的角平分线作为合并线段的方向,所述预置线段合并条件为线段的中点与另一条线段的距离小于第一距离阈值、所述两条线段的水平距离和垂直距离之和小于第二距离阈值以及两条线段形成的锐角小于角度阈值;
映射模块,用于将所述两条线段端点映射于所述合并线段上,并将映射得到的四个点中相距最远的两个点作为所述合并线段的端点;
获取模块,用于获取所述合并线段的端点坐标,并删除所述两条线段;
第三更新模块,用于重新选择任意两条线段,触发筛选模块,直至不存在满足所述预置线段合并条件的两条线段。
7.根据权利要求5中所述的矩形识别优化装置,其特征在于,所述扩展模块包括:
扩展子模块,用于以所述中心点为基准,同时向上下扩展第一预置个像素,向左右扩展第二预置个像素,生成预置ROI区域。
8.根据权利要求5中所述的矩形识别优化装置,其特征在于,所述权值模块包括:
权值子模块,用于将所述预置ROI区域中不在所述预置考察区域的像素点的权值置0;
计算所述预置考察区域中每个像素点与沿所述当前线段的另一端反向延长线的第一偏离距离以及与所述中心点所在的所述预置考察区域边界的第二偏离距离;
通过预置公式计算所述预置考察区域中每个像素点的权值,得到所述权值矩阵,所述预置公式为:
wi,j=1+[RT×1.5+RS]
其中,i,j为每个像素点的位置,RT为所述第一偏离距离,RS为所述第二偏离距离。
9.一种矩形识别优化设备,其特征在于,所述设备包括处理器以及存储器:
所述存储器用于存储程序代码,并将所述程序代码传输给所述处理器;
所述处理器用于根据所述程序代码中的指令执行权利要求1-4任一项所述的矩形识别优化方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质用于存储程序代码,所述程序代码用于执行权利要求1-4任一项所述的矩形识别优化方法。
CN201911310409.2A 2019-12-18 2019-12-18 一种矩形识别优化方法、装置及设备 Active CN111047617B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911310409.2A CN111047617B (zh) 2019-12-18 2019-12-18 一种矩形识别优化方法、装置及设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911310409.2A CN111047617B (zh) 2019-12-18 2019-12-18 一种矩形识别优化方法、装置及设备

Publications (2)

Publication Number Publication Date
CN111047617A CN111047617A (zh) 2020-04-21
CN111047617B true CN111047617B (zh) 2021-07-23

Family

ID=70237638

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911310409.2A Active CN111047617B (zh) 2019-12-18 2019-12-18 一种矩形识别优化方法、装置及设备

Country Status (1)

Country Link
CN (1) CN111047617B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115035120B (zh) * 2022-08-12 2022-11-04 山东迪格重工机械有限公司 基于物联网的机床控制方法及系统

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9189886B2 (en) * 2008-08-15 2015-11-17 Brown University Method and apparatus for estimating body shape
CN104835184B (zh) * 2014-02-10 2018-03-20 成都理想境界科技有限公司 图像中四边形区域的提取方法
CN105389165B (zh) * 2015-10-21 2019-04-30 广州视睿电子科技有限公司 一种文档图片显示方法、装置及终端
CN105930813B (zh) * 2016-04-27 2019-03-01 北京以萨技术股份有限公司 一种在任意自然场景下检测行文本的方法
JP6935786B2 (ja) * 2018-05-28 2021-09-15 日本電信電話株式会社 幾何変換行列推定装置、幾何変換行列推定方法、及びプログラム
CN109711415A (zh) * 2018-11-13 2019-05-03 平安科技(深圳)有限公司 证件轮廓确定方法、装置及存储介质、服务器
CN110287932B (zh) * 2019-07-02 2021-04-13 中国科学院空天信息创新研究院 基于深度学习图像语义分割的道路阻断信息提取方法

Also Published As

Publication number Publication date
CN111047617A (zh) 2020-04-21

Similar Documents

Publication Publication Date Title
CN107092877B (zh) 基于建筑物基底矢量的遥感影像屋顶轮廓提取方法
CN111275730A (zh) 地图区域的确定方法、装置、设备及存储介质
CN110619333B (zh) 一种文本行分割方法、文本行分割装置及电子设备
CN111259854B (zh) 一种文本图像中表格的结构化信息的识别方法及装置
US11227433B2 (en) Device and method for extracting terrain boundary
CN106980851B (zh) 一种数据矩阵dm码的定位方法及装置
CN109461133B (zh) 桥梁螺栓脱落检测方法及终端设备
CN108334879B (zh) 一种区域提取方法、系统及终端设备
CN106770323A (zh) 基于层次聚类和Gabor滤波的纺织品瑕疵检测方法
CN110780276A (zh) 一种基于激光雷达的托盘识别方法、系统和电子设备
WO2019019250A1 (zh) 倾斜图像的倾斜值获取方法、装置、终端及存储介质
CN111047617B (zh) 一种矩形识别优化方法、装置及设备
CN109344750B (zh) 一种基于结构描述子的复杂结构三维对象识别方法
CN108960247A (zh) 图像显著性检测方法、装置以及电子设备
CN113177941A (zh) 一种钢卷边裂识别方法、系统、介质和终端
CN116452604B (zh) 一种复杂变电站场景分割方法、设备及存储介质
Srisang et al. Segmentation of overlapping chromosome images using computational geometry
CN106023191B (zh) 一种基于结构特征的光学刻划字符边缘提取和边缘拟合方法
Landa et al. Detection of pole-like objects from LIDAR data
CN115063578B (zh) 芯片图像中目标对象检测与定位方法、装置及存储介质
CN108256425B (zh) 一种利用遥感光谱信息高效率提取港口集装箱的方法
CN113343987B (zh) 文本检测处理方法、装置、电子设备及存储介质
CN115880228A (zh) 多缺陷合并方法、装置、计算机设备及存储介质
CN114511862A (zh) 表格识别方法、装置及电子设备
CN114862870A (zh) 散斑图分区方法、装置、设备及介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information
CB02 Change of applicant information

Address after: Room 501-503, annex building, Huaye building, No.1-3 Chuimao new street, Xihua Road, Yuexiu District, Guangzhou City, Guangdong Province 510000

Applicant after: China Southern Power Grid Power Technology Co.,Ltd.

Address before: Room 501-503, annex building, Huaye building, No.1-3 Chuimao new street, Xihua Road, Yuexiu District, Guangzhou City, Guangdong Province 510000

Applicant before: GUANGDONG ELECTRIC POWER SCIENCE RESEARCH INSTITUTE ENERGY TECHNOLOGY Co.,Ltd.

GR01 Patent grant
GR01 Patent grant