CN117274205A - 一种基于新型数据标注与数据增强的四边形检测方法 - Google Patents

一种基于新型数据标注与数据增强的四边形检测方法 Download PDF

Info

Publication number
CN117274205A
CN117274205A CN202311258243.0A CN202311258243A CN117274205A CN 117274205 A CN117274205 A CN 117274205A CN 202311258243 A CN202311258243 A CN 202311258243A CN 117274205 A CN117274205 A CN 117274205A
Authority
CN
China
Prior art keywords
picture
point
data
quadrilateral
quadrangle
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202311258243.0A
Other languages
English (en)
Inventor
谌波
韩智素
赵月月
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen 666 International Travel Service Co ltd
Original Assignee
Shenzhen 666 International Travel Service Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen 666 International Travel Service Co ltd filed Critical Shenzhen 666 International Travel Service Co ltd
Priority to CN202311258243.0A priority Critical patent/CN117274205A/zh
Publication of CN117274205A publication Critical patent/CN117274205A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/0002Inspection of images, e.g. flaw detection
    • G06T7/0004Industrial image inspection
    • G06T7/001Industrial image inspection using an image reference approach
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/70Determining position or orientation of objects or cameras
    • G06T7/73Determining position or orientation of objects or cameras using feature-based methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/22Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition
    • G06V10/225Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition based on a marking or identifier characterising the area
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/25Determination of region of interest [ROI] or a volume of interest [VOI]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/82Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20084Artificial neural networks [ANN]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V2201/00Indexing scheme relating to image or video recognition or understanding
    • G06V2201/07Target detection

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Multimedia (AREA)
  • Evolutionary Computation (AREA)
  • Health & Medical Sciences (AREA)
  • Quality & Reliability (AREA)
  • Artificial Intelligence (AREA)
  • Computing Systems (AREA)
  • Databases & Information Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种基于新型数据标注与数据增强的四边形检测方法,涉及数据检测技术领域,包括数据搜集模块、数据标注模块、数据增强模块和模型训练模块,据搜集模块用于批量搜集大量需要进行四边形检测的图片,包括检测图片中待检测物体不完整的图片,得到四边形待测数据库,数据标准模块用于对于不完全处于图片范围内的待检测物体,根据物体在图片内已有的点位信息推测出图片范围之外的其他点的位置。本发明一种基于新型数据标注与数据增强的四边形检测方法,使得四边形检测框更加准确且更加符合实际待检测物体的形状规则,符合实际物体的形状,使得四边形的检测结果更加符合实际物体的形状,增加四边形检测的精确性。

Description

一种基于新型数据标注与数据增强的四边形检测方法
技术领域
本发明涉及数据检测技术领域,特别涉及一种基于新型数据标注与数据增强的四边形检测方法。
背景技术
四边形是在同一平面上由四条直线所围成的几何图形,由不在同一直线上的四条线段依次首尾相接围成的封闭的平面图形或立体图形叫四边形,由凸四边形和凹四边形组成,顺次连接任意四边形上的中点所得四边形叫中点四边形,中点四边形都是平行四边形,菱形的中点四边形是矩形,矩形中点四边形是菱形,等腰梯形的中点四边形是菱形,正方形中点四边形就是正方形。
现有的四边形检测方法主要存在以下两个问题:1、标注过程中,遇到拍照物体部分超出图片范围,四边形的四点将会以截断方式进行标注,不符合实际物体的形状;2、训练过程中,对四边形标注与图片进行透视变化时,四边形超出图片范围的部分也进行截断或者超出范围的点不进行模型训练,不符合实际物体的形状;由于以上问题,导致模型训练效果有待提高。
因此,现提出一种基于新型数据标注与数据增强的四边形检测方法解决上述问题。
发明内容
本发明的主要目的在于提供一种基于新型数据标注与数据增强的四边形检测方法,以解决上述背景中提出的问题。
为实现上述目的,本发明采取的技术方案为:一种基于新型数据标注与数据增强的四边形检测方法,包括数据搜集模块、数据标注模块、数据增强模块和模型训练模块;
所述数据搜集模块用于批量搜集大量需要进行四边形检测的图片,包括检测图片中待检测物体不完整的图片,得到四边形待测数据库;
所述数据标准模块用于对于不完全处于图片范围内的待检测物体,根据物体在图片内已有的点位信息推测出图片范围之外的其他点的位置,然后按照四边形四点顺序进行标注;
所述数据增强模块用于对需要进行透视变换数据增强的图片和四边形框同时进行同样透视变换操作,得到透视变换后的图片形状和四边形框对应的四点标注;
所述模型训练模块用于将做完数据增强后的图片与四点坐标同时送入神经网络进行四边形检测模型的训练,无论最终的四点坐标有无超出图片范围都进行回归四点坐标。
所述数据搜集模块包括图像采集、图形比对及图形残缺定位;
所述图像采集采用扫描仪对待检测四边形进行初级扫描,得到初级扫描点信息,并添加标注框;
所述图像比对用于通过初级扫描点信息与四边形完整图片进行比对,得到四边形不完全处于图片范围内的残缺图片,并进入图形残缺定位进行初级定位。
所述数据标注模块包括已有点位置信息、定位计算和推测范围外的点位置;
所述已有点位置信息用于接收所得到的四边形点的位置信息,对于完全处于图片内的待检测物体,直接标注四边形的四点。
所述定位计算用于对于不完全处于图片范围内的待检测物体,根据物体在图片内已有的点位信息推测出图片范围之外的其他点的位置,推测出范围外的点位置;
假设原始图像I的大小为M×N,构造两个大小为3M×3N的图像I0和I1,I0为原始图像的镜像图,以原始图像I为中心,四周以黑边填充,构成黑边环绕的图像I1,此时,在图像I1中原始图像I的四个顶点的坐标分别为:
A1=(N,M),B1=(2N,M),C1=(N,2M),D1=(2N,2M),然后,通过同一个变换矩阵P,对I0、I1进行同样的透视变换得到I1、I2,在I1中,A1,B1,C1,D1投影后的点坐标可以通过透视变换得到;经过标注对齐,得到A0=(X min,Y min),B0=(X max,Y min),C0=(X min,Ymax),D0=(X max,Y max);
则A0,B0,C0,D0构成四边形A1,B1,C1,D1的外接矩形,(Xmin,Ymin),分别表示该矩形框左上角和右下角坐标;根据点A0,B0,C0,D0的坐标裁减出矩形,该矩形即为原图填充后的图像,从而进行目标检测。
所述数据增强模块包括图片比对、透视变换矫正、透视变换逆变换及最小外接矩阵;
所述图片比对用于对原图进行数据比对;
选取原始图像的四个顶点A,B,C,D以及输出图像中的四个随机采样点A0,B0,C0,D0来生成透视变换矩阵,即将原始图像的四个顶点透视投影到新图像中的四个采样点A0,B0,C0,D0,随机采样点A0=(x1,y1),B0=(x1,W-y1),C0=(H-x2,W-y2),D0=(H-x3,y3)由透视因子0控制,x1,x1,x2,x3∈(0,H*(λ0)),y1,y1,y2,y3∈(0,W*(λ0)),其中λ为平衡参数,H,W分别表示原始图像的长和宽;
通过对应的4对点A,B,C,D、A0,B0,C0,D0,得到透视变换矩阵P,用求得的变换矩阵对原始图像中的所有像素点进行变换,从而得到新的图像;在生成的图像中,图像信息外的部分用黑色象素点填充。
所述透视变换矫正将原始图像中的矩形标注框用[a,b,c,d]表示,(X1,Y2),(x1,y1)分别表示该矩形框左上角和右下角坐标,经过透视变换得到的非矩形标注框的四个顶点坐标变为a1=(x1,y1),b1=(x2,y2),c1=(x3,y3),d1=(x4,y4),令Xmin=min{x1,x2,x3,x4}Xmax=max{x1,x2,x3,x4},Ymin=min{y1,y2,y3,y4},Ymax=max{y1,y2,y3,y4};则{Xmin,Xmax,Ymin,Ymax}表示变换后标注框;
如果图片中有任一一点超出图像范围,则计算出将图片转为正矩形框后对应的四点坐标;
通过图片与计算出图片到透视变换矩阵M,通过图片四边形的宽高,得到四边形的四个顶点,将四边形使用透视变换矩阵M进行变换得到转正后的图片四点坐标四边形,计算四边形所围成的矩形四边形与所围成的四边形的交集的最小外界矩形的四点十字标,十字标即为实际待检测矩形物体的区域再将十字标进行透视变换矩阵M的逆变换M得到最后一点,最后一点即为原图与原标注做完数据增强后的真正四点坐标位置。
所述模型训练模块包括数据记录仪、神经网络和回归四点坐标;
所述数据记录仪用于记录和储存四边形检测的数据执行内容;
所述神经网络将做完数据增强后的图片与四点坐标同时送入神经网络进行四边形检测模型的训练,实现回归四点坐标。
一种基于新型数据标注与数据增强的四边形检测方法,其步骤如下:
步骤一:批量搜集大量需要进行四边形检测的图片,包括检测图片中待检测物体不完整的图片;
步骤二:对于完全处于图片内的待检测物体,直接标注四边形的四点;对于不完全处于图片范围内的待检测物体,根据物体在图片内已有的点位信息推测出图片范围之外的其他点的位置,然后按照四边形四点顺序进行标注;
步骤三:对需要进行透视变换数据增强的图片和四边形框同时进行同样透视变换操作,得到透视变换后的图片和四边形框对应的四点标注图片。如果图片中有任一一点超出图像范围,则进行以下操作:
a.计算出将图片转为正矩形框后对应的四点坐标;
b.通过图片与计算出图片到透视变换矩阵M;
c.通过图片四边形的宽高,得到四边形的四个顶点,将四边形使用透视变换矩阵M进行变换得到转正后的图片四点坐标四边形;
d.计算四边形所围成的矩形四边形与所围成的四边形的交集的最小外界矩形的四点十字标,十字标即为实际待检测矩形物体的区域;
e.再将十字标进行透视变换矩阵M的逆变换M得到最后一点,最后一点即为原图与原标注做完数据增强后的真正四点坐标位置;
步骤四:将做完数据增强后的图片与四点坐标同时送入神经网络进行四边形检测模型的训练,无论最终的四点坐标有无超出图片范围都需要进行回归四点坐标。
本发明具有如下有益效果:
1.本发明中,通过数据标注模块,数据标注模块首先对已有点的位置进行数据信息获取,获取后对于不完全处于图片范围内的待检测物体进行定位计算,根据物体在图片内已有的点位信息推测出图片范围之外的其他点的位置,然后按照四边形四点顺序进行标注,推测出范围外的点位置信息,使得四边形检测框更加准确且更加符合实际待检测物体的形状规则,符合实际物体的形状。
2.本发明中,通过数据增强模块,数据增强部分的五个步骤,使用透视矫正变换、透视矫正逆变换以及使用矫正图片与矫正坐标计算交集最小外界矩形等操作,使得四边形的检测结果更加符合实际物体的形状,增加四边形检测的精确性。
3.本发明中,通过模型训练模块,将做完数据增强后的图片与四点坐标同时送入神经网络进行四边形检测模型的训练,无论最终的四点坐标有无超出图片范围都进行回归四点坐标。
附图说明
图1为本发明一种基于新型数据标注与数据增强的四边形检测方法的系统架构图;
图2为本发明一种基于新型数据标注与数据增强的四边形检测方法的数据标准模块的构架图;
图3为本发明一种基于新型数据标注与数据增强的四边形检测方法的数据增强模块的构架图;
图4为本发明一种基于新型数据标注与数据增强的四边形检测方法的模型训练模块的构架图。
具体实施方式
为使本发明实现的技术手段、创作特征、达成目的与功效易于明白了解,下面结合具体实施方式,进一步阐述本发明。
实施例一
请参照图1-2所示:一种基于新型数据标注与数据增强的四边形检测方法,包括数据搜集模块、数据标注模块、数据增强模块和模型训练模块;
数据搜集模块用于批量搜集大量需要进行四边形检测的图片,包括检测图片中待检测物体不完整的图片,得到四边形待测数据库;
数据标准模块用于对于不完全处于图片范围内的待检测物体,根据物体在图片内已有的点位信息推测出图片范围之外的其他点的位置,然后按照四边形四点顺序进行标注;
数据增强模块用于对需要进行透视变换数据增强的图片和四边形框同时进行同样透视变换操作,得到透视变换后的图片形状和四边形框对应的四点标注;
模型训练模块用于将做完数据增强后的图片与四点坐标同时送入神经网络进行四边形检测模型的训练,无论最终的四点坐标有无超出图片范围都进行回归四点坐标。
数据搜集模块包括图像采集、图形比对及图形残缺定位;
图像采集采用扫描仪对待检测四边形进行初级扫描,得到初级扫描点信息,并添加标注框;
图像比对用于通过初级扫描点信息与四边形完整图片进行比对,得到四边形不完全处于图片范围内的残缺图片,并进入图形残缺定位进行初级定位。
数据标注模块包括已有点位置信息、定位计算和推测范围外的点位置;
已有点位置信息用于接收所得到的四边形点的位置信息,对于完全处于图片内的待检测物体,直接标注四边形的四点。
定位计算用于对于不完全处于图片范围内的待检测物体,根据物体在图片内已有的点位信息推测出图片范围之外的其他点的位置,推测出范围外的点位置;
假设原始图像I的大小为M×N,构造两个大小为3M×3N的图像I0和I1,I0为原始图像的镜像图,以原始图像I为中心,四周以黑边填充,构成黑边环绕的图像I1,此时,在图像I1中原始图像I的四个顶点的坐标分别为:
A1=(N,M),B1=(2N,M),C1=(N,2M),D1=(2N,2M),然后,通过同一个变换矩阵P,对I0、I1进行同样的透视变换得到I1、I2,在I1中,A1,B1,C1,D1投影后的点坐标可以通过透视变换得到;经过标注对齐,得到A0=(X min,Y min),B0=(X max,Y min),C0=(X min,Ymax),D0=(X max,Y max);
则A0,B0,C0,D0构成四边形A1,B1,C1,D1的外接矩形,(Xmin,Ymin),分别表示该矩形框左上角和右下角坐标;根据点A0,B0,C0,D0的坐标裁减出矩形,该矩形即为原图填充后的图像,从而进行目标检测。
数据标注模块首先对已有点的位置进行数据信息获取,获取后对于不完全处于图片范围内的待检测物体进行定位计算,根据物体在图片内已有的点位信息推测出图片范围之外的其他点的位置,然后按照四边形四点顺序进行标注,推测出范围外的点位置信息,使得四边形检测框更加准确且更加符合实际待检测物体的形状规则,符合实际物体的形状。
实施例二
请参照图3所示:一种基于新型数据标注与数据增强的四边形检测方法,包括数据搜集模块、数据标注模块、数据增强模块和模型训练模块;
数据搜集模块用于批量搜集大量需要进行四边形检测的图片,包括检测图片中待检测物体不完整的图片,得到四边形待测数据库;
数据标准模块用于对于不完全处于图片范围内的待检测物体,根据物体在图片内已有的点位信息推测出图片范围之外的其他点的位置,然后按照四边形四点顺序进行标注;
数据增强模块用于对需要进行透视变换数据增强的图片和四边形框同时进行同样透视变换操作,得到透视变换后的图片形状和四边形框对应的四点标注;
模型训练模块用于将做完数据增强后的图片与四点坐标同时送入神经网络进行四边形检测模型的训练,无论最终的四点坐标有无超出图片范围都进行回归四点坐标。
数据增强模块包括图片比对、透视变换矫正、透视变换逆变换及最小外接矩阵;
图片比对用于对原图进行数据比对;
选取原始图像的四个顶点A,B,C,D以及输出图像中的四个随机采样点A0,B0,C0,D0来生成透视变换矩阵,即将原始图像的四个顶点透视投影到新图像中的四个采样点A0,B0,C0,D0,随机采样点A0=(x1,y1),B0=(x1,W-y1),C0=(H-x2,W-y2),D0=(H-x3,y3)由透视因子0控制,x1,x1,x2,x3∈(0,H*(λ0)),y1,y1,y2,y3∈(0,W*(λ0)),其中λ为平衡参数,H,W分别表示原始图像的长和宽;
通过对应的4对点A,B,C,D、A0,B0,C0,D0,得到透视变换矩阵P,用求得的变换矩阵对原始图像中的所有像素点进行变换,从而得到新的图像;在生成的图像中,图像信息外的部分用黑色象素点填充。
透视变换矫正将原始图像中的矩形标注框用[a,b,c,d]表示,(X1,Y2),(x1,y1)分别表示该矩形框左上角和右下角坐标,经过透视变换得到的非矩形标注框的四个顶点坐标变为a1=(x1,y1),b1=(x2,y2),c1=(x3,y3),d1=(x4,y4),令Xmin=min{x1,x2,x3,x4}Xmax=max{x1,x2,x3,x4},Ymin=min{y1,y2,y3,y4},Ymax=max{y1,y2,y3,y4};则{Xmin,Xmax,Ymin,Ymax}表示变换后标注框;
如果图片中有任一一点超出图像范围,则计算出将图片转为正矩形框后对应的四点坐标;
通过图片与计算出图片到透视变换矩阵M,通过图片四边形的宽高,得到四边形的四个顶点,将四边形使用透视变换矩阵M进行变换得到转正后的图片四点坐标四边形,计算四边形所围成的矩形四边形与所围成的四边形的交集的最小外界矩形的四点十字标,十字标即为实际待检测矩形物体的区域再将十字标进行透视变换矩阵M的逆变换M得到最后一点,最后一点即为原图与原标注做完数据增强后的真正四点坐标位置。
数据增强部分的五个步骤,使用透视矫正变换、透视矫正逆变换以及使用矫正图片与矫正坐标计算交集最小外界矩形等操作,使得四边形的检测结果更加符合实际物体的形状,增加四边形检测的精确性。
实施例三
请参照图4所示:一种基于新型数据标注与数据增强的四边形检测方法,包括数据搜集模块、数据标注模块、数据增强模块和模型训练模块;
数据搜集模块用于批量搜集大量需要进行四边形检测的图片,包括检测图片中待检测物体不完整的图片,得到四边形待测数据库;
数据标准模块用于对于不完全处于图片范围内的待检测物体,根据物体在图片内已有的点位信息推测出图片范围之外的其他点的位置,然后按照四边形四点顺序进行标注;
数据增强模块用于对需要进行透视变换数据增强的图片和四边形框同时进行同样透视变换操作,得到透视变换后的图片形状和四边形框对应的四点标注;
模型训练模块用于将做完数据增强后的图片与四点坐标同时送入神经网络进行四边形检测模型的训练,无论最终的四点坐标有无超出图片范围都进行回归四点坐标。
模型训练模块包括数据记录仪、神经网络和回归四点坐标;
数据记录仪用于记录和储存四边形检测的数据执行内容;
神经网络将做完数据增强后的图片与四点坐标同时送入神经网络进行四边形检测模型的训练,实现回归四点坐标。
模型训练模块将做完数据增强后的图片与四点坐标同时送入神经网络进行四边形检测模型的训练,无论最终的四点坐标有无超出图片范围都进行回归四点坐标。
本发明中,一种基于新型数据标注与数据增强的四边形检测方法,本发明是对现有的四边形检测方法的标注方法与数据增强方法进行优化,从而增加超出图片范围或者处于图片边界的四边形的检测精度,在数据标注阶段,数据标注模块首先对已有点的位置进行数据信息获取,获取后对于不完全处于图片范围内的待检测物体进行定位计算,根据物体在图片内已有的点位信息推测出图片范围之外的其他点的位置,然后按照四边形四点顺序进行标注,推测出范围外的点位置信息,使得四边形检测框更加准确且更加符合实际待检测物体的形状规则,符合实际物体的形状;在数据增强阶段,通过数据增强部分的五个步骤,使用透视矫正变换、透视矫正逆变换以及使用矫正图片与矫正坐标计算交集最小外界矩形等操作,使得四边形的检测结果更加符合实际物体的形状,增加四边形检测的精确性;通过模型训练模块,将做完数据增强后的图片与四点坐标同时送入神经网络进行四边形检测模型的训练,无论最终的四点坐标有无超出图片范围都进行回归四点坐标。整个系统智能化强,实用性强。
一种基于新型数据标注与数据增强的四边形检测方法,其步骤如下:
步骤一:批量搜集大量需要进行四边形检测的图片,包括检测图片中待检测物体不完整的图片;
步骤二:对于完全处于图片内的待检测物体,直接标注四边形的四点;对于不完全处于图片范围内的待检测物体,根据物体在图片内已有的点位信息推测出图片范围之外的其他点的位置,然后按照四边形四点顺序进行标注;
步骤三:对需要进行透视变换数据增强的图片和四边形框同时进行同样透视变换操作,得到透视变换后的图片和四边形框对应的四点标注图片。如果图片中有任一一点超出图像范围,则进行以下操作:
a.计算出将图片转为正矩形框后对应的四点坐标;
b.通过图片与计算出图片到透视变换矩阵M;
c.通过图片四边形的宽高,得到四边形的四个顶点,将四边形使用透视变换矩阵M进行变换得到转正后的图片四点坐标四边形;
d.计算四边形所围成的矩形四边形与所围成的四边形的交集的最小外界矩形的四点十字标,十字标即为实际待检测矩形物体的区域;
e.再将十字标进行透视变换矩阵M的逆变换M得到最后一点,最后一点即为原图与原标注做完数据增强后的真正四点坐标位置;
步骤四:将做完数据增强后的图片与四点坐标同时送入神经网络进行四边形检测模型的训练,无论最终的四点坐标有无超出图片范围都需要进行回归四点坐标。
以上显示和描述了本发明的基本原理和主要特征和本发明的优点。本行业的技术人员应该了解,本发明不受上述实施例的限制,上述实施例和说明书中描述的只是说明本发明的原理,在不脱离本发明精神和范围的前提下,本发明还会有各种变化和改进,这些变化和改进都落入要求保护的本发明范围内。本发明要求保护范围由所附的权利要求书及其等效物界定。

Claims (8)

1.一种基于新型数据标注与数据增强的四边形检测系统,其特征在于,所述一种基于新型数据标注与数据增强的四边形检测系统包括数据搜集模块、数据标注模块、数据增强模块和模型训练模块;
所述数据搜集模块用于批量搜集大量需要进行四边形检测的图片,包括检测图片中待检测物体不完整的图片,得到四边形待测数据库;
所述数据标准模块用于对于不完全处于图片范围内的待检测物体,根据物体在图片内已有的点位信息推测出图片范围之外的其他点的位置,然后按照四边形四点顺序进行标注;
所述数据增强模块用于对需要进行透视变换数据增强的图片和四边形框同时进行同样透视变换操作,得到透视变换后的图片形状和四边形框对应的四点标注;
所述模型训练模块用于将做完数据增强后的图片与四点坐标同时送入神经网络进行四边形检测模型的训练,无论最终的四点坐标有无超出图片范围都进行回归四点坐标。
2.根据权利要求1所述的系统,其特征在于:所述数据搜集模块包括图像采集、图形比对及图形残缺定位;
所述图像采集采用扫描仪对待检测四边形进行初级扫描,得到初级扫描点信息,并添加标注框;
所述图像比对用于通过初级扫描点信息与四边形完整图片进行比对,得到四边形不完全处于图片范围内的残缺图片,并进入图形残缺定位进行初级定位。
3.根据权利要求1所述的系统,其特征在于:所述数据标注模块包括已有点位置信息、定位计算和推测范围外的点位置;
所述已有点位置信息用于接收所得到的四边形点的位置信息,对于完全处于图片内的待检测物体,直接标注四边形的四点。
4.根据权利要求3所述的系统,其特征在于:所述定位计算用于对于不完全处于图片范围内的待检测物体,根据物体在图片内已有的点位信息推测出图片范围之外的其他点的位置,推测出范围外的点位置;
假设原始图像I的大小为M×N,构造两个大小为3M×3N的图像I0和I1,I0为原始图像的镜像图,以原始图像I为中心,四周以黑边填充,构成黑边环绕的图像I1,此时,在图像I1中原始图像I的四个顶点的坐标分别为:
A1=(N,M),B1=(2N,M),C1=(N,2M),D1=(2N,2M),然后,通过同一个变换矩阵P,对I0、I1进行同样的透视变换得到I1、I2,在I1中,A1,B1,C1,D1投影后的点坐标可以通过透视变换得到;经过标注对齐,得到A0=(X min,Y min),B0=(X max,Y min),C0=(X min,Ymax),D0=(X max,Y max);
则A0,B0,C0,D0构成四边形A1,B1,C1,D1的外接矩形,(Xmin,Ymin),分别表示该矩形框左上角和右下角坐标;根据点A0,B0,C0,D0的坐标裁减出矩形,该矩形即为原图填充后的图像,从而进行目标检测。
5.根据权利要求1所述的系统,其特征在于:所述数据增强模块包括图片比对、透视变换矫正、透视变换逆变换及最小外接矩阵;
所述图片比对用于对原图进行数据比对;
选取原始图像的四个顶点A,B,C,D以及输出图像中的四个随机采样点A0,B0,C0,D0来生成透视变换矩阵,即将原始图像的四个顶点透视投影到新图像中的四个采样点A0,B0,C0,D0,随机采样点A0=(x1,y1),B0=(x1,W-y1),C0=(H-x2,W-y2),D0=(H-x3,y3)由透视因子0控制,x1,x1,x2,x3∈(0,H*(λ0)),y1,y1,y2,y3∈(0,W*(λ0)),其中λ为平衡参数,H,W分别表示原始图像的长和宽;
通过对应的4对点A,B,C,D、A0,B0,C0,D0,得到透视变换矩阵P,用求得的变换矩阵对原始图像中的所有像素点进行变换,从而得到新的图像;在生成的图像中,图像信息外的部分用黑色象素点填充。
6.根据权利要求5所述的系统,其特征在于:所述透视变换矫正将原始图像中的矩形标注框用[a,b,c,d]表示,(X1,Y2),(x1,y1)分别表示该矩形框左上角和右下角坐标,经过透视变换得到的非矩形标注框的四个顶点坐标变为a1=(x1,y1),b1=(x2,y2),c1=(x3,y3),d1=(x4,y4),令Xmin=min{x1,x2,x3,x4}Xmax=max{x1,x2,x3,x4},Ymin=min{y1,y2,y3,y4},
Ymax=max{y1,y2,y3,y4};则{Xmin,Xmax,Ymin,Ymax}表示变换后标注框;
如果图片中有任一一点超出图像范围,则计算出将图片转为正矩形框后对应的四点坐标;
通过图片与计算出图片到透视变换矩阵M,通过图片四边形的宽高,得到四边形的四个顶点,将四边形使用透视变换矩阵M进行变换得到转正后的图片四点坐标四边形,计算四边形所围成的矩形四边形与所围成的四边形的交集的最小外界矩形的四点十字标,十字标即为实际待检测矩形物体的区域再将十字标进行透视变换矩阵M的逆变换M得到最后一点,最后一点即为原图与原标注做完数据增强后的真正四点坐标位置。
7.根据权利要求1所述的系统,其特征在于:所述模型训练模块包括数据记录仪、神经网络和回归四点坐标;
所述数据记录仪用于记录和储存四边形检测的数据执行内容;
所述神经网络将做完数据增强后的图片与四点坐标同时送入神经网络进行四边形检测模型的训练,实现回归四点坐标。
8.一种基于新型数据标注与数据增强的四边形检测方法,其步骤如下:
步骤一:批量搜集大量需要进行四边形检测的图片,包括检测图片中待检测物体不完整的图片;
步骤二:对于完全处于图片内的待检测物体,直接标注四边形的四点;对于不完全处于图片范围内的待检测物体,根据物体在图片内已有的点位信息推测出图片范围之外的其他点的位置,然后按照四边形四点顺序进行标注;
步骤三:对需要进行透视变换数据增强的图片和四边形框同时进行同样透视变换操作,得到透视变换后的图片和四边形框对应的四点标注图片。如果图片中有任一一点超出图像范围,则进行以下操作:
a.计算出将图片转为正矩形框后对应的四点坐标;
b.通过图片与计算出图片到透视变换矩阵M;
c.通过图片四边形的宽高,得到四边形的四个顶点,将四边形使用透视变换矩阵M进行变换得到转正后的图片四点坐标四边形;
d.计算四边形所围成的矩形四边形与所围成的四边形的交集的最小外界矩形的四点十字标,十字标即为实际待检测矩形物体的区域;
e.再将十字标进行透视变换矩阵M的逆变换M得到最后一点,最后一点即为原图与原标注做完数据增强后的真正四点坐标位置;
步骤四:将做完数据增强后的图片与四点坐标同时送入神经网络进行四边形检测模型的训练,无论最终的四点坐标有无超出图片范围都需要进行回归四点坐标。
CN202311258243.0A 2023-09-27 2023-09-27 一种基于新型数据标注与数据增强的四边形检测方法 Pending CN117274205A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311258243.0A CN117274205A (zh) 2023-09-27 2023-09-27 一种基于新型数据标注与数据增强的四边形检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311258243.0A CN117274205A (zh) 2023-09-27 2023-09-27 一种基于新型数据标注与数据增强的四边形检测方法

Publications (1)

Publication Number Publication Date
CN117274205A true CN117274205A (zh) 2023-12-22

Family

ID=89211879

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311258243.0A Pending CN117274205A (zh) 2023-09-27 2023-09-27 一种基于新型数据标注与数据增强的四边形检测方法

Country Status (1)

Country Link
CN (1) CN117274205A (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109063748A (zh) * 2018-07-16 2018-12-21 重庆大学 基于数据增强的目标检测方法
CN111383205A (zh) * 2020-03-11 2020-07-07 西安应用光学研究所 一种基于特征点和三维模型的图像融合定位方法
CN112183529A (zh) * 2020-09-23 2021-01-05 创新奇智(北京)科技有限公司 四边形物体检测、模型训练方法、装置、设备及存储介质

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109063748A (zh) * 2018-07-16 2018-12-21 重庆大学 基于数据增强的目标检测方法
CN111383205A (zh) * 2020-03-11 2020-07-07 西安应用光学研究所 一种基于特征点和三维模型的图像融合定位方法
CN112183529A (zh) * 2020-09-23 2021-01-05 创新奇智(北京)科技有限公司 四边形物体检测、模型训练方法、装置、设备及存储介质

Similar Documents

Publication Publication Date Title
CN110727747B (zh) 基于经纬度识别的纸质地图快速矢量化方法及系统
US20080031490A1 (en) Position and orientation measuring apparatus and position and orientation measuring method, mixed-reality system, and computer program
CN110009561A (zh) 一种监控视频目标映射到三维地理场景模型的方法及系统
US5892854A (en) Automatic image registration using binary moments
CN104794748A (zh) 基于Kinect视觉技术的三维空间地图构建方法
CN112305557B (zh) 一种全景相机与多线激光雷达外参标定系统
CN114998545A (zh) 一种基于深度学习的三维建模阴影识别系统
CN114677435A (zh) 一种点云全景融合要素提取方法和系统
US9204130B2 (en) Method and system for creating a three dimensional representation of an object
CN113592839B (zh) 基于改进Faster RCNN的配网线路典型缺陷诊断方法及系统
JP2672509B2 (ja) カメラモデルの自動キャリブレーション方法およびその装置
CN112509110A (zh) 一种陆地对抗智能体的图像数据集自动采取与标注框架
JPH08110807A (ja) 自動キャリブレーション方法およびその装置
CN110853103B (zh) 一种用于深度学习姿态估计的数据集制作方法
CN117274205A (zh) 一种基于新型数据标注与数据增强的四边形检测方法
CN116993612A (zh) 一种鱼眼镜头非线性畸变校正方法
CN111380503A (zh) 一种采用激光辅助标定的单目相机测距方法
CN114792343B (zh) 图像获取设备的标定方法、获取图像数据的方法、装置
CN116125489A (zh) 一种室内物体三维检测方法、计算机设备及存储介质
CN116704518A (zh) 一种文本识别方法及装置、电子设备、存储介质
CN110008918B (zh) 一种摩托车模拟器驾驶员姿态识别方法
Lynch et al. Backpropagation neural network for stereoscopic vision calibration
JPH07146937A (ja) パターンマッチング方法
CN112995641A (zh) 一种3d模组成像装置及方法、电子设备
CN113269207B (zh) 一种用于网格结构光视觉测量中的图像特征点提取方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination