CN107895173A - 标注图像目标的方法、装置、设备及可读存储介质 - Google Patents

标注图像目标的方法、装置、设备及可读存储介质 Download PDF

Info

Publication number
CN107895173A
CN107895173A CN201711079416.7A CN201711079416A CN107895173A CN 107895173 A CN107895173 A CN 107895173A CN 201711079416 A CN201711079416 A CN 201711079416A CN 107895173 A CN107895173 A CN 107895173A
Authority
CN
China
Prior art keywords
msub
mrow
mtd
inclined rectangular
mtr
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201711079416.7A
Other languages
English (en)
Other versions
CN107895173B (zh
Inventor
钱基业
何国军
曹盼
李俊杰
伏进
吴高林
宋伟
邓邦飞
万凌云
张海兵
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chongqing University
Electric Power Research Institute of State Grid Chongqing Electric Power Co Ltd
State Grid Corp of China SGCC
Original Assignee
Chongqing University
Electric Power Research Institute of State Grid Chongqing Electric Power Co Ltd
State Grid Corp of China SGCC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chongqing University, Electric Power Research Institute of State Grid Chongqing Electric Power Co Ltd, State Grid Corp of China SGCC filed Critical Chongqing University
Priority to CN201711079416.7A priority Critical patent/CN107895173B/zh
Publication of CN107895173A publication Critical patent/CN107895173A/zh
Application granted granted Critical
Publication of CN107895173B publication Critical patent/CN107895173B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Other Investigation Or Analysis Of Materials By Electrical Means (AREA)
  • Image Analysis (AREA)
  • Image Processing (AREA)

Abstract

本发明公开了一种标注图像目标的方法、装置、设备以及计算机可读存储介质,包括:根据预选的张成倾斜矩形的点集,生成标注目标的倾斜矩形,以便获取所述倾斜矩形的标注数据;将所述倾斜矩形的标注数据存储为兼容的正矩形的标注数据;根据所述正矩形的标注数据以及所述倾斜矩形的标注数据,确定所述倾斜矩形的姿态信息;通过所述正矩形的标注数据以及所述姿态信息,重构标注目标的所述倾斜矩形。本发明所提供的方法、装置、设备及计算机存储介质可以极大的抑制背景信息对标注图像目标的干扰,并提供与正矩形标注方法兼容的标注数据。

Description

标注图像目标的方法、装置、设备及可读存储介质
技术领域
本发明涉及计算机技术领域,特别是涉及一种标注图像目标的方法、装置、设备以及计算机可读存储介质。
背景技术
人工标注图像中的目标对模型训练有重要的意义。图像中人工标注的目标作为训练模型的数据,标注结果不仅直接影响到模型训练的性能,还是评价对比各种算法性能的重要参考标准。在对大量图像的标注过程中,准确的标注有助于训练性能更优的模型;高效快速的标注方法可提高标注效率、节约成本。
现有技术中,人工标注图像的方法主要有两种:正矩形标注和像素级标注。正矩形就是边长平行于坐标轴的矩形。正矩形标注效率高,但是会引入较多的背景信息,尤其是待标注的目标是细长型且以倾斜姿态呈现在图像中时,正矩形标注目标会引入大量的背景信息,且无法反应被标注对象的姿态信息。像素级标注精确,但是标注复杂度太高。
综上所述可以看出:一方面,如何高效地标注,并在标注目标时减少背景信息的干扰是目前有待解决的问题;另一方面,如何存储标注结果,使之与现有主要标注方法兼容是拓宽标注数据应用范围的关键。发明内容
本发明的目的是提供一种标注图像目标的方法、装置、设备以及计算机可读存储介质,已解决现有技术中正矩形标注目标受到大量背景信息干扰的问题。
为解决上述技术问题,本发明提供一种标注图像目标的方法,包括:根据预选的张成倾斜矩形的点集,生成标注目标的倾斜矩形,以便获取所述倾斜矩形的标注数据;将所述倾斜矩形的标注数据存储为兼容的正矩形的标注数据;根据所述正矩形的标注数据以及所述倾斜矩形的标注数据,确定所述倾斜矩形的姿态信息;通过所述正矩形的标注数据以及所述姿态信息,重构标注目标的所述倾斜矩形。
优选地,所述根据预选的张成倾斜矩形的点集,生成标注目标的倾斜矩形,以便获取所述倾斜矩形的标注数据包括:根据预选点集,生成包含所述预选点集的最小外接矩形,依据预设规则以及所述最小外接矩形的顶点坐标(x′1,y′1)、(x′2,y′2)、(x′3,y′3)和(x′4,y′4),确定标注目标的倾斜矩形的顶点坐标(x1,y1)、(x2,y2)、(x3,y3)和(x4,y4)。
优选地,所述将所述倾斜矩形的标注数据存储为兼容的正矩形的标注数据包括:生成包括倾斜矩形顶点的最小外接正矩形作为兼容的正矩形,根据所述倾斜矩形的顶点坐标(xi,yi)(i=1,2,3,4),确定并存储所述正矩形的对角顶点坐标(xmin,ymin)和(xmax,ymax);
其中
优选地,所述根据所述正矩形的标注数据以及所述倾斜矩形的标注数据,确定所述倾斜矩形的姿态信息包括:
根据所述倾斜矩形的顶点坐标(x1,y1)、(x2,y2)以及所述正矩形的对角顶点坐标(xmin,ymin)、(xmax,ymax),确定所述倾斜矩形的姿态信息;
所述姿态信息包括倾斜距离s=x2-xmin和倾斜角度其中,xth(xth>0)为X轴设定的距离差阈值。
优选地,所述根据所述正矩形的标注数据以及所述倾斜矩形的标注数据,确定所述倾斜矩形的姿态信息后还包括:
当所述倾斜矩形的标注数据满足a、b或c其中任一条件时,利用所述倾斜矩阵的标注数据重新修订所述正矩形的标注数据(xmin,ymin)和(xmax,ymax)、倾斜距离s以及倾斜角度α;
其中a:0<r<rth;rth(rth>0)为设定的标注有效性阈值,r为倾斜矩形标注有效性的指标,根据所述倾斜矩形面积Srect′与所述正矩形面积Srect的比率获得:
b:|π/2-α|<αth;其中αthth>0)为设定的倾斜角度阈值;c:s<xth
修正后的所述正矩形的标注数据(xmin,ymin)和(xmax,ymax)为:
修正后的倾斜距离s为0;修正后的倾斜角度α=π/2。
优选地,所述通过所述正矩形的标注数据以及所述姿态信息,重构标注目标的所述倾斜矩形包括:根据所述正矩形的对角顶点坐标、所述倾斜距离以及所述倾斜角度,重构所述倾斜矩阵的顶点坐标(x1,y1)、(x2,y2)、(x3,y3)和(x4,y4),以便重构所述标注目标的倾斜矩阵;其中所述倾斜矩阵的顶点坐标(x1,y1)、(x2,y2)、(x3,y3)和(x4,y4)分别为:
本发明还提供了一种标注图像目标的装置,包括:
获取模块,用于根据预选的张成倾斜矩形的点集,生成标注目标的倾斜矩形,以便获取所述倾斜矩形的标注数据;
存储模块,用于将所述倾斜矩形的标注数据存储为兼容的正矩形的标注数据;
确定模块,用于根据所述正矩形的标注数据以及所述倾斜矩形的标注数据,确定所述倾斜矩形的姿态信息;
重构模块,用于通过所述正矩形的标注数据以及所述姿态信息,重构标注目标的所述倾斜矩形。
优选地,所述获取模块具体用于,根据预选点集,生成包含所述预选点集的最小外接矩形,依据预设规则以及所述最小外接矩形的顶点坐标(x′1,y′1)、(x′2,y′2)、(x′3,y′3)和(x′4,y′4),确定标注目标的倾斜矩形的顶点坐标(x1,y1)、(x2,y2)、(x3,y3)和(x4,y4)。
本发明还提供了一种标注图像目标的设备,包括:存储器,用于存储计算机程序;处理器,用于执行所述计算机程序时实现上述一种标注图像目标的方法的步骤。
本发明还提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现上述一种标注图像目标的方法的步骤。
本发明所提供的标注图像目标的方法、装置、设备以及计算机可读存储介质,根据图像中待标注目标确定点集,确保点集可以张成的倾斜矩形能覆盖住待标注目标,根据所述倾斜矩形的标注数据,存储为与当前主流兼容的正矩形标注形式,为正矩形标注提供训练模型;同时确定所述倾斜矩形的姿态信息。根据所述正矩形的标注数据以及所述姿态信息,重构所述倾斜矩形。利用上述倾斜矩形标注图像目标的方法,高效标注的同时极大的抑制了图像中背景信息对标注目标的干扰,同时提供了目标的姿态信息;并提供与正矩形标注方法兼容的标注数据。
附图说明
为了更清楚的说明本发明实施例或现有技术的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明所提供的标注图像目标的方法的第一种具体实施例的流程图;
图2为根据图像目标选择点集的示意图;
图3为确定倾斜矩形的示意图;
图4为与所述倾斜矩形兼容的正矩形标注的示意图;
图5为本发明所提供的标注图像目标的方法的第一种具体实施例的流程图;
图6为本发明实施例提供的一种标注图像目标的装置的结构框图。
具体实施方式
本发明的核心是提供一种标注图像目标的方法、装置、设备以及计算机可读存储介质,可以极大的抑制背景信息对标注图像目标的干扰。
为了使本技术领域的人员更好地理解本发明方案,下面结合附图和具体实施方式对本发明作进一步的详细说明。显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参考图1,图1为本发明所提供的标注图像目标的方法的第一种具体实施例的流程图;具体操作步骤如下:
步骤S101:根据预选的张成倾斜矩形的点集,生成标注目标的倾斜矩形,以便获取所述倾斜矩形的标注数据;
根据图像中待标注的目标,确定点集{(x″1,y″1),(x″2,y″2),...,(x″N,y″N)},确保该点集张成的倾斜矩形能覆盖住待标注的目标。优选地,所述点集由待标注的目标与背景的边界附近的点确定。如图2所示,N=4,围绕目标对象的四个黑色圆点就是待标注目标的点集。
根据所述点集中的四个点,生成包含该点集的最小外接矩形,所述最小外接矩形就是用于目标标注的倾斜矩形,该倾斜矩形可由其四个顶点(x′1,y′1)、(x′2,y′2)、(x′3,y′3)和(x′4,y′4)完全确定,将所述四个顶点按顺时针方向排列。
首先,确定该倾斜矩形的起点坐标(x1,y1),四个顶点在X轴的最小值记为该最小X轴坐标对应的Y轴坐标记为y1;需要说明的是,当四个顶点在X轴存在两个相同的最小值时,选取其中Y轴值较大的顶点的Y轴坐标记为y1。其次选择距离(x1,y1)最远的对角顶点作为(x3,y3):
然后,在剩下的两个顶点中,选择Y轴取值较小的坐标作为(x2,y2)。最后剩下的一个坐标即为(x4,y4)。利用该四个顶点确定的倾斜矩形,能够在引入较少背景的前提下对目标进行标注,如图3所示。
步骤S102:将所述倾斜矩形的标注数据存储为兼容的正矩形的标注数据;
所述步骤S102通过倾斜矩形的四个顶点,确定存储倾斜矩形的六个参数。为与当前流行的正矩形标注方法兼容,根据所述倾斜矩形的四个顶点,生成倾斜矩形的最小外接正矩形。该最小外接正矩形可与当前正矩形标注兼容并且可由两对角顶点(xmin,ymin)和(xmax,ymax)完全确定。通过求最小值和最大值确定该正矩形两对角顶点的方法为:
步骤S103:根据所述正矩形的标注数据以及所述倾斜矩形的标注数据,确定所述倾斜矩形的姿态信息;
如图4所示,只通过最小外接正矩形两对角顶点,只能确定与倾斜矩形兼容的最小外接正矩形,还不能完全确定倾斜矩形。本具体实施例添通过为所述正矩形增加两个额外的参数,可以完全确定用于目标标注的倾斜矩形,并且提供了目标的姿态信息:倾斜距离s和倾斜角度α;所述倾斜距离s和倾斜角度α的具体计算方法为:
其中,xth(xth>0)为X轴设定的距离差阈值。
步骤S104:通过所述正矩形的标注数据以及所述姿态信息,重构标注目标的所述倾斜矩形。
本步骤通过正矩形两对角顶点的坐标、倾斜距离和倾斜角度{xmin,ymin,xmax,ymax,s,α},可重构出倾斜矩阵的四个顶点(x1,y1)、(x2,y2)、(x3,y3)和(x4,y4),通过该四个顶点可完全确定目标标注的倾斜矩形,四个顶点的计算方式如下:
在本具体实施例中,可以直接利用{xmin,ymin,xmax,ymax,s,α}中的前四个参数{xmin,ymin,xmax,ymax},即两对角顶点坐标确定与倾斜矩形标注兼容的正矩形标注;利用{xmin,ymin,xmax,ymax,s,α}重构出的四个顶点(x1,y1)、(x2,y2)、(x3,y3)和(x4,y4),可确定目标的倾斜矩形标注。
利用本实施例的倾斜矩形标注图像目标的方法,极大的抑制了图像中背景信息对标注目标的干扰,同时提供了目标的姿态信息。并且本实施例中的倾斜矩形标注可以自动存储为与当前主流正矩形标注完全兼容的结果,使得本实施例的倾斜矩形标注也完全适用于目前正矩形标注的模型训练。
请参考图5,图5为本发明所提供的标注图像目标的方法的第二种具体实施例的流程图。
在上述具体实施例的基础上,本具体实施增加了判断所述倾斜矩形是否合理的操作以及对特殊化的倾斜矩形进行调整的操作步骤;本实施例具体操作步骤如下:
步骤S501:根据图像中待标注目标,确定张成倾斜矩形的点集;
步骤S502:根据所述点集,确定标注目标的倾斜矩形以及所述倾斜矩形标注数据;
步骤S503:根据所述倾斜矩形标注数据,存储所述倾斜矩形为兼容的正矩形标注数据,并确定所述倾斜矩形的倾斜角度和倾斜距离;
步骤S504:判断所述倾斜矩形是否满足预设条件;
当所述倾斜矩形的标注数据满足a、b或c其中任一条件时,利用所述倾斜矩阵的标注数据重新修订所述正矩形的标注数据(xmin,ymin)和(xmax,ymax)、倾斜距离s以及倾斜角度α;
其中a:0<r<rth;rth(rth>0)为设定的标注有效性阈值,r为倾斜矩形标注有效性的指标,根据所述倾斜矩形面积Srect′与所述正矩形面积Srect的比率获得:
r取值越大表示倾斜矩形标注抑制背景信息的能力越强,r取值越小表示倾斜矩形标注越接近正矩形标注。
b:|π/2-α|<αth;其中αthth>0)为设定的倾斜角度阈值;
c:s<xth
步骤S505:调整满足预设条件的倾斜矩形;
当标注的倾斜矩形出现过大、过小或者姿态不准确等情况,无法满足标注要求时,可通过以下两种方式之一或两种方式的组合,调整倾斜矩形:
(1)、通过修改点集{(x″1,y″1),(x″2,y″2),...,(x″N,y″N)},调整倾斜矩形;修改点集包含以下三种方式:
(A)删除点集中已有的点,得到新点集:
(B)在点集中的添加新点,得到新点集:
(C)上述方法(A)和(B)的组合。
(2)、通过修改倾斜距离s和倾斜角度α,调整倾斜矩形;修改倾斜距离s和倾斜角度α包含以下三种方式:
(A)修改倾斜距离s(0≤s<xmax-xmin),当修改至s<xth时,设置s=0,α=π/2;
(B)修改倾斜角度α(0<α≤π/2),当修改至|π/2-α|<αth时,设置s=0,α=π/2;
(C)上述方法(A)和(B)的组合。
修正后的所述正矩形的标注数据(xmin,ymin)和(xmax,ymax)为:
修正后的倾斜距离s为0;修正后的倾斜角度α=π/2。
步骤S506:根据所述正矩形的两对角顶点、倾斜距离以及倾斜角度重构用于标注目标的倾斜矩形。
在本具体实施例中,可以对自动生成的倾斜矩形进行判断,并对特殊化的倾斜矩形进行调整,根据修正后的正矩形的对角顶点的坐标、修正后的倾斜距离以及修正后的倾斜角度重构所述倾斜矩形。
请参考图6,图6为本发明实施例提供的一种标注图像目标的装置的结构框图;具体装置可以包括:
获取模块100,用于根据预选的张成倾斜矩形的点集,生成标注目标的倾斜矩形,以便获取所述倾斜矩形的标注数据;
存储模块200,用于将所述倾斜矩形的标注数据存储为兼容的正矩形的标注数据;
确定模块300,用于根据所述正矩形的标注数据以及所述倾斜矩形的标注数据,确定所述倾斜矩形的姿态信息;
重构模块400,用于通过所述正矩形的标注数据以及所述姿态信息,重构标注目标的所述倾斜矩形。
本实施例的标注图像目标的装置用于实现前述的标注图像目标的方法,因此标注图像目标的装置中的具体实施方式可见前文中的标注图像目标的方法的实施例部分,例如,获取模块100,存储模块200,确定模块300,重构模块400,分别用于实现上述标注图像目标的方法中步骤S101,S102,S103和S104,所以,其具体实施方式可以参照相应的各个部分实施例的描述,在此不再赘述。
本发明具体实施例还提供了一种标注图像目标的设备,包括:存储器,用于存储计算机程序;处理器,用于执行所述计算机程序时实现上述一种标注图像目标的方法的步骤。
本发明具体实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现上述一种标注图像目标的方法的步骤。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其它实施例的不同之处,各个实施例之间相同或相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。
以上对本发明所提供的标注图像目标的方法、装置、设备以及计算机可读存储介质进行了详细介绍。本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以对本发明进行若干改进和修饰,这些改进和修饰也落入本发明权利要求的保护范围内。

Claims (10)

1.一种标注图像目标的方法,其特征在于,包括:
根据预选的张成倾斜矩形的点集,生成标注目标的倾斜矩形,以便获取所述倾斜矩形的标注数据;
将所述倾斜矩形的标注数据存储为兼容的正矩形的标注数据;
根据所述正矩形的标注数据以及所述倾斜矩形的标注数据,确定所述倾斜矩形的姿态信息;
通过所述正矩形的标注数据以及所述姿态信息,重构标注目标的所述倾斜矩形。
2.如权利要求1所述的方法,其特征在于,所述根据预选的张成倾斜矩形的点集,生成标注目标的倾斜矩形,以便获取所述倾斜矩形的标注数据包括:
根据预选点集,生成包含所述预选点集的最小外接矩形,依据预设规则以及所述最小外接矩形的顶点坐标(x1′,y1′)、(x2′,y2′)、(x3′,y3′)和(x4′,y4′),确定标注目标的倾斜矩形的顶点坐标(x1,y1)、(x2,y2)、(x3,y3)和(x4,y4)。
3.如权利要求2所述的方法,其特征在于,所述将所述倾斜矩形的标注数据存储为兼容的正矩形的标注数据包括:
生成包括倾斜矩形顶点的最小外接正矩形作为兼容的正矩形,根据所述倾斜矩形的顶点坐标(xi,yi)(i=1,2,3,4),确定并存储所述正矩形的对角顶点坐标(xmin,ymin)和(xmax,ymax);
其中
4.如权利要求3所述的方法,其特征在于,所述根据所述正矩形的标注数据以及所述倾斜矩形的标注数据,确定所述倾斜矩形的姿态信息包括:
根据所述倾斜矩形的顶点坐标(x1,y1)、(x2,y2)以及所述正矩形的对角顶点坐标(xmin,ymin)、(xmax,ymax),确定所述倾斜矩形的姿态信息;
所述姿态信息包括倾斜距离s=x2-xmin和倾斜角度其中,xth(xth>0)为X轴设定的距离差阈值。
5.如权利要求4所述的方法,其特征在于,所述根据所述正矩形的标注数据以及所述倾斜矩形的标注数据,确定所述倾斜矩形的姿态信息后还包括:
当所述倾斜矩形的标注数据满足a、b或c其中任一条件时,利用所述倾斜矩阵的标注数据重新修订所述正矩形的标注数据(xmin,ymin)和(xmax,ymax)、倾斜距离s以及倾斜角度α;
其中a:0<r<rth;rth(rth>0)为设定的标注有效性阈值,r为倾斜矩形标注有效性的指标,根据所述倾斜矩形面积Srect′与所述正矩形面积Srect的比率获得:
<mrow> <mi>r</mi> <mo>=</mo> <mn>1</mn> <mo>-</mo> <mfrac> <msub> <mi>S</mi> <mrow> <msup> <mi>rect</mi> <mo>&amp;prime;</mo> </msup> </mrow> </msub> <msub> <mi>S</mi> <mrow> <mi>r</mi> <mi>e</mi> <mi>c</mi> <mi>t</mi> </mrow> </msub> </mfrac> <mo>=</mo> <mn>1</mn> <mo>-</mo> <mfrac> <mrow> <msqrt> <mrow> <msup> <mrow> <mo>(</mo> <msub> <mi>x</mi> <mn>1</mn> </msub> <mo>-</mo> <msub> <mi>x</mi> <mn>2</mn> </msub> <mo>)</mo> </mrow> <mn>2</mn> </msup> <mo>+</mo> <msup> <mrow> <mo>(</mo> <msub> <mi>y</mi> <mn>1</mn> </msub> <mo>-</mo> <msub> <mi>y</mi> <mn>2</mn> </msub> <mo>)</mo> </mrow> <mn>2</mn> </msup> </mrow> </msqrt> <msqrt> <mrow> <msup> <mrow> <mo>(</mo> <msub> <mi>x</mi> <mn>1</mn> </msub> <mo>-</mo> <msub> <mi>x</mi> <mn>4</mn> </msub> <mo>)</mo> </mrow> <mn>2</mn> </msup> <mo>+</mo> <msup> <mrow> <mo>(</mo> <msub> <mi>y</mi> <mn>1</mn> </msub> <mo>-</mo> <msub> <mi>y</mi> <mn>4</mn> </msub> <mo>)</mo> </mrow> <mn>2</mn> </msup> </mrow> </msqrt> </mrow> <mrow> <mo>(</mo> <msub> <mi>x</mi> <mrow> <mi>m</mi> <mi>a</mi> <mi>x</mi> </mrow> </msub> <mo>-</mo> <msub> <mi>x</mi> <mrow> <mi>m</mi> <mi>i</mi> <mi>n</mi> </mrow> </msub> <mo>)</mo> <mo>(</mo> <msub> <mi>y</mi> <mi>max</mi> </msub> <mo>-</mo> <msub> <mi>y</mi> <mi>min</mi> </msub> <mo>)</mo> </mrow> </mfrac> <mo>;</mo> </mrow>
b:|π/2-α|<αth;其中αthth>0)为设定的倾斜角度阈值;c:s<xth
修正后的所述正矩形的标注数据(xmin,ymin)和(xmax,ymax)为:
<mrow> <mfenced open = "{" close = ""> <mtable> <mtr> <mtd> <mrow> <msub> <mi>x</mi> <mrow> <mi>m</mi> <mi>i</mi> <mi>n</mi> </mrow> </msub> <mo>=</mo> <mfrac> <mrow> <msub> <mi>x</mi> <mn>2</mn> </msub> <mo>-</mo> <msub> <mi>x</mi> <mn>1</mn> </msub> </mrow> <mrow> <msub> <mi>y</mi> <mn>2</mn> </msub> <mo>-</mo> <msub> <mi>y</mi> <mn>1</mn> </msub> </mrow> </mfrac> <mrow> <mo>(</mo> <msub> <mi>y</mi> <mn>3</mn> </msub> <mo>-</mo> <msub> <mi>y</mi> <mn>1</mn> </msub> <mo>)</mo> </mrow> <mo>+</mo> <msub> <mi>x</mi> <mn>1</mn> </msub> </mrow> </mtd> </mtr> <mtr> <mtd> <mrow> <msub> <mi>x</mi> <mi>max</mi> </msub> <mo>=</mo> <mfrac> <mrow> <msub> <mi>x</mi> <mn>4</mn> </msub> <mo>-</mo> <msub> <mi>x</mi> <mn>3</mn> </msub> </mrow> <mrow> <msub> <mi>y</mi> <mn>4</mn> </msub> <mo>-</mo> <msub> <mi>y</mi> <mn>3</mn> </msub> </mrow> </mfrac> <mrow> <mo>(</mo> <msub> <mi>y</mi> <mn>1</mn> </msub> <mo>-</mo> <msub> <mi>y</mi> <mn>3</mn> </msub> <mo>)</mo> </mrow> <mo>+</mo> <msub> <mi>x</mi> <mn>3</mn> </msub> </mrow> </mtd> </mtr> <mtr> <mtd> <mrow> <msub> <mi>y</mi> <mrow> <mi>m</mi> <mi>i</mi> <mi>n</mi> </mrow> </msub> <mo>=</mo> <msub> <mi>y</mi> <mn>3</mn> </msub> </mrow> </mtd> </mtr> <mtr> <mtd> <mrow> <msub> <mi>y</mi> <mi>max</mi> </msub> <mo>=</mo> <msub> <mi>y</mi> <mn>1</mn> </msub> </mrow> </mtd> </mtr> </mtable> </mfenced> <mo>;</mo> </mrow>
修正后的倾斜距离s为0;修正后的倾斜角度α=π/2。
6.如权利要求4所述的方法,其特征在于,所述通过所述正矩形的标注数据以及所述姿态信息,重构标注目标的所述倾斜矩形包括:
根据所述正矩形的对角顶点坐标、所述倾斜距离以及所述倾斜角度,重构所述倾斜矩阵的顶点坐标(x1,y1)、(x2,y2)、(x3,y3)和(x4,y4),以便重构所述标注目标的倾斜矩阵;其中所述倾斜矩阵的顶点坐标(x1,y1)、(x2,y2)、(x3,y3)和(x4,y4)分别为:
<mrow> <mfenced open = "{" close = ""> <mtable> <mtr> <mtd> <mrow> <msub> <mi>x</mi> <mn>1</mn> </msub> <mo>=</mo> <msub> <mi>x</mi> <mi>min</mi> </msub> </mrow> </mtd> </mtr> <mtr> <mtd> <mrow> <msub> <mi>y</mi> <mn>1</mn> </msub> <mo>=</mo> <mfenced open = "{" close = ""> <mtable> <mtr> <mtd> <msub> <mi>y</mi> <mi>max</mi> </msub> </mtd> <mtd> <mrow> <mo>|</mo> <mi>&amp;pi;</mi> <mo>/</mo> <mn>2</mn> <mo>-</mo> <mi>&amp;alpha;</mi> <mo>|</mo> <mo>&lt;</mo> <msub> <mi>&amp;alpha;</mi> <mrow> <mi>t</mi> <mi>h</mi> </mrow> </msub> </mrow> </mtd> </mtr> <mtr> <mtd> <mrow> <msub> <mi>y</mi> <mi>min</mi> </msub> <mo>+</mo> <mi>s</mi> <mi> </mi> <mi>tan</mi> <mi>&amp;alpha;</mi> </mrow> </mtd> <mtd> <mrow> <mi>o</mi> <mi>t</mi> <mi>h</mi> <mi>e</mi> <mi>r</mi> <mi>s</mi> </mrow> </mtd> </mtr> </mtable> </mfenced> </mrow> </mtd> </mtr> </mtable> </mfenced> <mo>,</mo> <mfenced open = "{" close = ""> <mtable> <mtr> <mtd> <mrow> <msub> <mi>x</mi> <mn>2</mn> </msub> <mo>=</mo> <msub> <mi>x</mi> <mi>min</mi> </msub> <mo>+</mo> <mi>s</mi> </mrow> </mtd> </mtr> <mtr> <mtd> <mrow> <msub> <mi>y</mi> <mn>2</mn> </msub> <mo>=</mo> <msub> <mi>y</mi> <mi>min</mi> </msub> </mrow> </mtd> </mtr> </mtable> </mfenced> <mo>,</mo> <mfenced open = "{" close = ""> <mtable> <mtr> <mtd> <mrow> <msub> <mi>x</mi> <mn>3</mn> </msub> <mo>=</mo> <msub> <mi>x</mi> <mi>max</mi> </msub> </mrow> </mtd> </mtr> <mtr> <mtd> <mrow> <msub> <mi>y</mi> <mn>3</mn> </msub> <mo>=</mo> <mfenced open = "{" close = ""> <mtable> <mtr> <mtd> <msub> <mi>y</mi> <mi>min</mi> </msub> </mtd> <mtd> <mrow> <mo>|</mo> <mi>&amp;pi;</mi> <mo>/</mo> <mn>2</mn> <mo>-</mo> <mi>&amp;alpha;</mi> <mo>|</mo> <mo>&lt;</mo> <msub> <mi>&amp;alpha;</mi> <mrow> <mi>t</mi> <mi>h</mi> </mrow> </msub> </mrow> </mtd> </mtr> <mtr> <mtd> <mrow> <msub> <mi>y</mi> <mi>max</mi> </msub> <mo>-</mo> <mi>s</mi> <mi> </mi> <mi>tan</mi> <mi>&amp;alpha;</mi> </mrow> </mtd> <mtd> <mrow> <mi>o</mi> <mi>t</mi> <mi>h</mi> <mi>e</mi> <mi>r</mi> <mi>s</mi> </mrow> </mtd> </mtr> </mtable> </mfenced> </mrow> </mtd> </mtr> </mtable> </mfenced> <mo>,</mo> <mfenced open = "{" close = ""> <mtable> <mtr> <mtd> <mrow> <msub> <mi>x</mi> <mn>4</mn> </msub> <mo>=</mo> <msub> <mi>x</mi> <mi>max</mi> </msub> <mo>-</mo> <mi>s</mi> </mrow> </mtd> </mtr> <mtr> <mtd> <mrow> <msub> <mi>y</mi> <mn>4</mn> </msub> <mo>=</mo> <msub> <mi>y</mi> <mi>max</mi> </msub> </mrow> </mtd> </mtr> </mtable> </mfenced> <mo>.</mo> </mrow>
7.一种标注图像目标的装置,其特征在于,包括:
获取模块,用于根据预选的张成倾斜矩形的点集,生成标注目标的倾斜矩形,以便获取所述倾斜矩形的标注数据;
存储模块,用于将所述倾斜矩形的标注数据存储为兼容的正矩形的标注数据;
确定模块,用于根据所述正矩形的标注数据以及所述倾斜矩形的标注数据,确定所述倾斜矩形的姿态信息;
重构模块,用于通过所述正矩形的标注数据以及所述姿态信息,重构标注目标的所述倾斜矩形。
8.如权利要求7所述的装置,其特征在于,所述获取模块具体用于,根据预选点集,生成包含所述预选点集的最小外接矩形,依据预设规则以及所述最小外接矩形的顶点坐标(x1′,y1′)、(x2′,y2′)、(x3′,y3′)和(x4′,y4′),确定标注目标的倾斜矩形的顶点坐标(x1,y1)、(x2,y2)、(x3,y3)和(x4,y4)。
9.一种标注图像目标的设备,其特征在于,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现如权利要求1至6任一项所述一种标注图像目标的方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至6任一项所述一种标注图像目标的方法的步骤。
CN201711079416.7A 2017-11-06 2017-11-06 标注图像目标的方法、装置、设备及可读存储介质 Active CN107895173B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711079416.7A CN107895173B (zh) 2017-11-06 2017-11-06 标注图像目标的方法、装置、设备及可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711079416.7A CN107895173B (zh) 2017-11-06 2017-11-06 标注图像目标的方法、装置、设备及可读存储介质

Publications (2)

Publication Number Publication Date
CN107895173A true CN107895173A (zh) 2018-04-10
CN107895173B CN107895173B (zh) 2021-08-17

Family

ID=61804128

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711079416.7A Active CN107895173B (zh) 2017-11-06 2017-11-06 标注图像目标的方法、装置、设备及可读存储介质

Country Status (1)

Country Link
CN (1) CN107895173B (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108875181A (zh) * 2018-06-07 2018-11-23 南京骐骏软件有限公司 一种三维模型的三维标注修订变更追踪方法
CN109063748A (zh) * 2018-07-16 2018-12-21 重庆大学 基于数据增强的目标检测方法
CN110223302A (zh) * 2019-05-08 2019-09-10 华中科技大学 一种基于旋转区域提取的舰船多目标检测方法
CN110378227A (zh) * 2019-06-17 2019-10-25 北京达佳互联信息技术有限公司 修正样本标注数据的方法、装置、设备及存储介质
CN111144426A (zh) * 2019-12-28 2020-05-12 广东拓斯达科技股份有限公司 一种分拣方法、装置、设备和存储介质
WO2021184139A1 (zh) * 2020-03-14 2021-09-23 唐锐 一种倾斜矩形范围框标注方式

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090034808A1 (en) * 2006-07-10 2009-02-05 Siemens Corporate Research, Inc. Automatic Cardiac View Classification of Echocardiography
US7668404B2 (en) * 2004-06-30 2010-02-23 Lexmark International, Inc. Method and system of deskewing an image using monochrome conversion to separate foreground from background
CN103810481A (zh) * 2014-03-12 2014-05-21 中国矿业大学(北京) 一种平面图形对象特征信息提取及识别方法
US9443158B1 (en) * 2014-06-22 2016-09-13 Kristopher Haskins Method for computer vision to recognize objects marked for identification with a bigram of glyphs, and devices utilizing the method for practical purposes
CN106203397A (zh) * 2016-07-26 2016-12-07 江苏鸿信系统集成有限公司 基于图像中表格分析技术的表格鉴别和定位方法
CN106203237A (zh) * 2015-05-04 2016-12-07 杭州海康威视数字技术股份有限公司 集装箱拖车编号的识别方法和装置
CN111695567A (zh) * 2020-07-10 2020-09-22 中国水利水电科学研究院 一种改进的倾斜矩形范围框标注方式

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7668404B2 (en) * 2004-06-30 2010-02-23 Lexmark International, Inc. Method and system of deskewing an image using monochrome conversion to separate foreground from background
US20090034808A1 (en) * 2006-07-10 2009-02-05 Siemens Corporate Research, Inc. Automatic Cardiac View Classification of Echocardiography
CN103810481A (zh) * 2014-03-12 2014-05-21 中国矿业大学(北京) 一种平面图形对象特征信息提取及识别方法
US9443158B1 (en) * 2014-06-22 2016-09-13 Kristopher Haskins Method for computer vision to recognize objects marked for identification with a bigram of glyphs, and devices utilizing the method for practical purposes
CN106203237A (zh) * 2015-05-04 2016-12-07 杭州海康威视数字技术股份有限公司 集装箱拖车编号的识别方法和装置
CN106203397A (zh) * 2016-07-26 2016-12-07 江苏鸿信系统集成有限公司 基于图像中表格分析技术的表格鉴别和定位方法
CN111695567A (zh) * 2020-07-10 2020-09-22 中国水利水电科学研究院 一种改进的倾斜矩形范围框标注方式

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
JIANQI MA 等: "Arbitrary-Oriented Scene Text Detection via Rotation Proposals", 《COMPUTER VISION AND PATTERN RECOGNITION》 *
YINGYING JIANG 等: "R2CNN: Rotational Region CNN for Orientation Robust Scene Text Detection", 《COMPUTER VISION AND PATTERN RECOGNITION》 *

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108875181A (zh) * 2018-06-07 2018-11-23 南京骐骏软件有限公司 一种三维模型的三维标注修订变更追踪方法
CN109063748A (zh) * 2018-07-16 2018-12-21 重庆大学 基于数据增强的目标检测方法
CN109063748B (zh) * 2018-07-16 2021-11-16 重庆大学 基于数据增强的目标检测方法
CN110223302A (zh) * 2019-05-08 2019-09-10 华中科技大学 一种基于旋转区域提取的舰船多目标检测方法
CN110223302B (zh) * 2019-05-08 2021-11-19 华中科技大学 一种基于旋转区域提取的舰船多目标检测方法
CN110378227A (zh) * 2019-06-17 2019-10-25 北京达佳互联信息技术有限公司 修正样本标注数据的方法、装置、设备及存储介质
CN110378227B (zh) * 2019-06-17 2021-04-13 北京达佳互联信息技术有限公司 修正样本标注数据的方法、装置、设备及存储介质
CN111144426A (zh) * 2019-12-28 2020-05-12 广东拓斯达科技股份有限公司 一种分拣方法、装置、设备和存储介质
WO2021184139A1 (zh) * 2020-03-14 2021-09-23 唐锐 一种倾斜矩形范围框标注方式

Also Published As

Publication number Publication date
CN107895173B (zh) 2021-08-17

Similar Documents

Publication Publication Date Title
CN107895173A (zh) 标注图像目标的方法、装置、设备及可读存储介质
CN107122774B (zh) 一种随图像中关键点移动的自适应贴图方法和系统
Wu et al. Tooth segmentation on dental meshes using morphologic skeleton
CN107993216A (zh) 一种图像融合方法及其设备、存储介质、终端
CN105518748B (zh) 3d对象跟踪
CN107451950A (zh) 人脸图像生成方法、人脸识别模型训练方法及相应装置
EP3603761A1 (en) Method and device for locking target object in game scene, electronic device and storage medium
CN107330854B (zh) 一种基于新型模板的图像超分辨率增强方法
CN108596133A (zh) 一种基于点阵的识别方法
CN106327429A (zh) 一种图片合成方法、装置及终端设备
CN108038877A (zh) 一种可视化头影测量方法、系统和计算机处理设备
JP4542976B2 (ja) 画像処理装置、画像処理方法、画像処理プログラム及び記録媒体
CN110246079A (zh) 基于b样条曲面拟合的摄像头畸变矫正方法、系统及介质
CN105513006B (zh) 一种TrueType字体轮廓粗细调整方法及装置
CN108376416A (zh) 一种图像生成方法以及装置
CN112184852A (zh) 基于虚拟成像的辅助绘图方法和装置、存储介质、电子装置
CN106297477A (zh) 一种生成数字化字帖的方法及装置
CN113750519A (zh) 场景地形编辑方法、装置、电子终端和机器可读存储介质
CN106204418A (zh) 一种虚拟现实移动端中基于矩阵逆运算的图像扭曲方法
CN108038900A (zh) 倾斜摄影模型单体化方法、系统及计算机可读存储介质
CN1438615A (zh) 图像处理方法
CN107037901A (zh) 一种图像生成方法、终端和图形用户界面
TWI532007B (zh) 3d模型的平面區域搜尋方法
CN107479839A (zh) 色盘、双色渲染方法、取色方法、可读存储介质及计算机
CN108734671A (zh) 三维纹理修饰方法及其系统、自动贴图方法及其系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant