CN111815519A - 旋转目标检测方法、装置、系统与可读介质 - Google Patents

旋转目标检测方法、装置、系统与可读介质 Download PDF

Info

Publication number
CN111815519A
CN111815519A CN202010902190.1A CN202010902190A CN111815519A CN 111815519 A CN111815519 A CN 111815519A CN 202010902190 A CN202010902190 A CN 202010902190A CN 111815519 A CN111815519 A CN 111815519A
Authority
CN
China
Prior art keywords
center point
target frame
fisheye camera
camera picture
rotation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010902190.1A
Other languages
English (en)
Other versions
CN111815519B (zh
Inventor
杨帆
王瀚洋
胡建国
白立群
陈凯琪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xiaoshi Technology Jiangsu Co ltd
Original Assignee
Nanjing Zhenshi Intelligent Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing Zhenshi Intelligent Technology Co Ltd filed Critical Nanjing Zhenshi Intelligent Technology Co Ltd
Priority to CN202010902190.1A priority Critical patent/CN111815519B/zh
Publication of CN111815519A publication Critical patent/CN111815519A/zh
Application granted granted Critical
Publication of CN111815519B publication Critical patent/CN111815519B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T3/00Geometric image transformations in the plane of the image
    • G06T3/60Rotation of whole images or parts thereof
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/60Analysis of geometric attributes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/60Analysis of geometric attributes
    • G06T7/66Analysis of geometric attributes of image moments or centre of gravity
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/50Context or environment of the image
    • G06V20/52Surveillance or monitoring of activities, e.g. for recognising suspicious objects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10016Video; Image sequence
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30232Surveillance

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Geometry (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)

Abstract

本发明涉及图像处理技术领域,提供一种旋转目标检测方法、装置、系统与可读介质,根据鱼眼相机和相机照片特性,针对传统标记的坐标值改变标注方式,进行模型训练,模型训练中仅有目标框宽、高、中心点坐标值,可计算出准确的旋转角度,比直接旋转检测方法更加精准。本发明的旋转目标检测过程中无需对偏转角度进行模型训练,可实现对鱼眼图片旋转矫正,获得正向的目标框,即检测框,从而利于进行目标的抠取以及采用现有的目标识别算法进行检测,提高识别的成功率和精度,解决传统直接模型检测中引入的旋转角度作为模型训练因子导致的精确度降低和识别速度降低、识别运算量大的问题。

Description

旋转目标检测方法、装置、系统与可读介质
技术领域
本发明涉及图像处理技术领域,尤其是目标检测,具体而言涉及一种基于鱼眼相机图片的旋转目标检测方法、系统与计算机可读存储介质。
背景技术
在目前安防领域中,因为鱼眼镜头视角范围广,通常会使用其作为视频流采集工具。但在实际应用时,鱼眼镜头中的目标旋转角度各异,旋转的目标不便于识别。
在识别任务中,目标为正向的识别通过率一般比其他旋转角度高,为提升识别精度,需将目标旋转至正向。例如,在大量旋转目标的任务中,为追求检测和识别的高精度,对于旋转的目标,我们通常期望能够使用旋转的框来包围目标。而旋转框需要使用旋转角度,但在标注框和检测器的训练中,额外增加旋转角度信息会增加大量工作。常见算法如R-RPN、EAST、PCN算法等,通常应用在文字及遥感目标检测中。此类检测算法的检测结果格式通常为
Figure 770581DEST_PATH_IMAGE001
,即检测框的中心点坐标
Figure 311284DEST_PATH_IMAGE002
,宽高
Figure 954755DEST_PATH_IMAGE003
,旋转角度
Figure 8031DEST_PATH_IMAGE004
。由此可见,相对于普通检测,需要在训练和测试中引入额外的旋转角度
Figure 736952DEST_PATH_IMAGE004
。由于
Figure 81346DEST_PATH_IMAGE004
是模型训练中的一个参数,必然受到数据标注干净程度、模型训练收敛程度以及算法性能的影响,在实际使用存在一定问题;引入额外的参数,也会影响原模型的运算速度;旋转的检测框在图像中无法抠取,需要矫正成正向矩形并裁剪方可进行识别;标注时也需要精确标出框的旋转角度,同样增加了大量工作。
发明内容
本发明目的在于提供一种基于鱼眼相机图片的旋转目标检测方法与系统,使用通用的检测算法仅通过预测框的中心点坐标和宽高,并根据鱼眼相机球面特性,将检测框旋转后准确匹配目标,实现旋转目标的检测。
为实现上述目的,本发明的第一方面提出一种基于鱼眼相机图片的旋转目标检测方法,包括以下步骤:
接收鱼眼相机照片输入;
预测鱼眼相机图片的目标框中心点
Figure 517006DEST_PATH_IMAGE005
坐标和宽高;
获取目标框中心点
Figure 554232DEST_PATH_IMAGE005
到鱼眼相机图片中心点
Figure 708133DEST_PATH_IMAGE006
的连线与水平轴的夹角;
Figure 590639DEST_PATH_IMAGE006
为旋转中心,根据目标框中心点
Figure 208702DEST_PATH_IMAGE005
与鱼眼相机图片中心点
Figure 151250DEST_PATH_IMAGE006
的关系以及所述夹角,将鱼眼相机图片的原图旋转至目标框正向;
获取旋转后的目标框中心点
Figure 792447DEST_PATH_IMAGE007
坐标,并保持原始宽高不变,得到的矩形即为正向目标框;以及
基于正向目标框进行图像抠取和目标检测。
根据本发明目的的第二方面提出一种基于鱼眼相机图片的旋转目标检测装置,包括:
用于接收鱼眼相机照片输入的图像接收模块;
用于预测鱼眼相机图片的目标框中心点
Figure 744222DEST_PATH_IMAGE005
坐标和宽高的预测模块;
用于获取目标框中心点
Figure 951213DEST_PATH_IMAGE005
到鱼眼相机图片中心点
Figure 525981DEST_PATH_IMAGE006
的连线与水平轴的夹角的夹角获取模块;
用于以
Figure 716791DEST_PATH_IMAGE006
为旋转中心,根据目标框中心点
Figure 941099DEST_PATH_IMAGE005
与鱼眼相机图片中心点
Figure 471438DEST_PATH_IMAGE006
的关系以及所述夹角,将鱼眼相机图片的原图旋转至目标框正向的旋转模块;
用于获取旋转后的目标框中心点
Figure 755788DEST_PATH_IMAGE007
坐标,并保持原始宽高不变,得到的矩形即为正向目标框的正向目标框获取模块;以及
用于基于正向目标框进行图像抠取的抠取模块和用于目标检测的检测模块。
根据本发明目的的第三方面提出一种基于鱼眼相机图片的旋转目标检测系统,包括:
一个或多个处理器;
存储器,存储可被操作的指令,所述指令在通过所述一个或多个处理器执行时使得所述一个或多个处理器执行操作,所述操作包括:
接收鱼眼相机照片输入;
预测鱼眼相机图片的目标框中心点
Figure 371578DEST_PATH_IMAGE005
坐标和宽高;
获取目标框中心点
Figure 399576DEST_PATH_IMAGE005
到鱼眼相机图片中心点
Figure 846738DEST_PATH_IMAGE006
的连线与水平轴的夹角;
Figure 505253DEST_PATH_IMAGE006
为旋转中心,根据目标框中心点
Figure 139496DEST_PATH_IMAGE005
与鱼眼相机图片中心点
Figure 971186DEST_PATH_IMAGE006
的关系以及所述夹角,将鱼眼相机图片的原图旋转至目标框正向;
获取旋转后的目标框中心点
Figure 272855DEST_PATH_IMAGE007
坐标,并保持原始宽高不变,得到的矩形即为正向目标框;以及
基于正向目标框进行图像抠取和目标检测。
根据本发明目的的第四方面提出一种用于旋转目标检测的服务器,包括:
一个或多个处理器;
存储器,存储可被操作的指令,所述指令在通过所述一个或多个处理器执行时使得所述一个或多个处理器执行操作,所述操作包括:
接收鱼眼相机图片输入;
预测鱼眼相机图片的目标框中心点
Figure 351538DEST_PATH_IMAGE005
坐标和宽高;
获取目标框中心点
Figure 738657DEST_PATH_IMAGE005
到鱼眼相机图片中心点
Figure 108458DEST_PATH_IMAGE006
的连线与水平轴的夹角;
Figure 467895DEST_PATH_IMAGE006
为旋转中心,根据目标框中心点
Figure 530529DEST_PATH_IMAGE005
与鱼眼相机图片中心点
Figure 139365DEST_PATH_IMAGE006
的关系以及所述夹角,将鱼眼相机图片的原图旋转至目标框正向;
获取旋转后的目标框中心点
Figure 250541DEST_PATH_IMAGE007
坐标,并保持原始宽高不变,得到的矩形即为正向目标框;以及
基于正向目标框进行图像抠取和目标检测。
根据本发明目的的第五方面提出一种存储软件的计算机可读存储介质,所述软件包括能通过一个或多个计算机执行的指令,所述指令通过这样的执行使得所述一个或多个计算机执行操作,所述操作包括:
接收鱼眼相机图片输入;
预测鱼眼相机图片的目标框中心点
Figure 526801DEST_PATH_IMAGE005
坐标和宽高;
获取目标框中心点
Figure 494757DEST_PATH_IMAGE005
到鱼眼相机图片中心点
Figure 794152DEST_PATH_IMAGE006
的连线与水平轴的夹角;
Figure 505756DEST_PATH_IMAGE006
为旋转中心,根据目标框中心点
Figure 636523DEST_PATH_IMAGE005
与鱼眼相机图片中心点
Figure 227910DEST_PATH_IMAGE006
的关系以及所述夹角,将鱼眼相机图片的原图旋转至目标框正向;
获取旋转后的目标框中心点
Figure 76917DEST_PATH_IMAGE007
坐标,并保持原始宽高不变,得到的矩形即为正向目标框;以及
基于正向目标框进行图像抠取和目标检测。
根据本发明目的的第六方面提出一种用于对于鱼眼相机图片中的旋转目标确定正向检测框的方法,包括以下步骤:
接收鱼眼相机照片输入;
预测鱼眼相机图片的目标框中心点
Figure 795475DEST_PATH_IMAGE005
坐标和宽高;
获取目标框中心点
Figure 780748DEST_PATH_IMAGE005
到鱼眼相机图片中心点
Figure 293769DEST_PATH_IMAGE006
的连线与水平轴的夹角;
Figure 630072DEST_PATH_IMAGE006
为旋转中心,根据目标框中心点
Figure 886741DEST_PATH_IMAGE005
与鱼眼相机图片中心点
Figure 992101DEST_PATH_IMAGE006
的关系以及所述夹角,将鱼眼相机图片的原图旋转至目标框正向;以及
获取旋转后的目标框中心点
Figure 925290DEST_PATH_IMAGE007
坐标,并保持原始宽高不变,得到的矩形即为正向目标框。
根据本发明目的的第七方面提出一种用于对于鱼眼相机图片中的旋转目标确定正向检测框的装置,包括:
用于接收鱼眼相机照片输入的图像接收模块;
用于预测鱼眼相机图片的目标框中心点
Figure 748890DEST_PATH_IMAGE005
坐标和宽高的预测模块;
用于获取目标框中心点
Figure 543671DEST_PATH_IMAGE005
到鱼眼相机图片中心点
Figure 503536DEST_PATH_IMAGE006
的连线与水平轴的夹角的夹角获取模块;
用于以
Figure 623939DEST_PATH_IMAGE006
为旋转中心,根据目标框中心点
Figure 669256DEST_PATH_IMAGE005
与鱼眼相机图片中心点
Figure 267727DEST_PATH_IMAGE006
的关系以及所述夹角,将鱼眼相机图片的原图旋转至目标框正向的旋转模块;以及
用于获取旋转后的目标框中心点
Figure 347679DEST_PATH_IMAGE007
坐标,并保持原始宽高不变,得到的矩形即为正向目标框的正向目标框获取模块。
根据本发明目的的第八方面提出一种用于对于鱼眼相机图片中的旋转目标确定正向检测框的系统,包括:
一个或多个处理器;
存储器,存储可被操作的指令,所述指令在通过所述一个或多个处理器执行时使得所述一个或多个处理器执行操作,所述操作包括:
接收鱼眼相机图片输入;
预测鱼眼相机图片的目标框中心点
Figure 170141DEST_PATH_IMAGE005
坐标和宽高;
获取目标框中心点
Figure 892634DEST_PATH_IMAGE005
到鱼眼相机图片中心点
Figure 357113DEST_PATH_IMAGE006
的连线与水平轴的夹角;
Figure 229254DEST_PATH_IMAGE006
为旋转中心,根据目标框中心点
Figure 488197DEST_PATH_IMAGE005
与鱼眼相机图片中心点
Figure 242527DEST_PATH_IMAGE006
的关系以及所述夹角,将鱼眼相机图片的原图旋转至目标框正向;以及
获取旋转后的目标框中心点
Figure 182801DEST_PATH_IMAGE007
坐标,并保持原始宽高不变,得到的矩形即为正向目标框。
本发明上述提出的各个方面的实施,无需在训练模型过程中加入角度参数,可显著提高检测精度和速度;同时基于鱼眼相机图片中每个物体具有朝向图片中心点的特性,依据目标中心点与图片中心点连线的水平夹角确定偏转角度,然后将原图旋转按规则旋转后使得目标正向,将目标矫正后抠取识别,以更好地匹配目标,有利于提升识别精度,相对于传统比直接的旋转检测算法更加精准。
附图说明
附图不意在按比例绘制。在附图中,在各个图中示出的每个相同或近似相同的组成部分可以用相同的标号表示。为了清晰起见,在每个图中,并非每个组成部分均被标记。现在,将通过例子并参考附图来描述本发明的各个方面的实施例,其中:
图1是本发明示例性实施例的对于鱼眼相机图片中的旋转目标确定正向检测框的流程示意图。
图2是本发明示例性实施例的原图的检测框的示意图。
图3是本发明示例性实施例中对原图的检测框进行旋转的示意图。
图4是本发明示例性的鱼眼相机获得的照片的示意图。
图5是本发明示例性的原始鱼眼相机照片中的目标检测框的中心点与图片中心点的水平夹角的示意图。
图6是本发明示例性的确定所述水平夹角的原理示意图。
图7是本发明示例性的对原始鱼眼相机照片旋转后得到正向目标框的示意图。
图8是本发明示例性的基于对鱼眼相机照片进行旋转矫正后的得到正向目标框进行目标检测的测试结果示意图。
图9是本发明示例性的用于对于鱼眼相机图片中的旋转目标确定正向检测框的原理框图。
图10是本发明示例性的鱼眼相机图片中的旋转目标检测装置的原理框图。
图11是本发明示例性的计算机系统的系统架构图。
具体实施方式
为了更了解本发明的技术内容,特举具体实施例并配合所附图式说明如下。
结合图示,根据本发明的实施例的对于鱼眼相机图片中的旋转目标检测方法,旨在实现与鱼眼相机获得的鱼眼图片进行旋转矫正,获得正向的目标框(即检测框),从而利于进行目标的抠取以及采用现有的目标识别算法进行检测,提高识别的成功率和精度。
在进行目标检测识别过程中,相对于传统的直接模型检测中引入的旋转角度作为模型训练因子导致的精确度降低和识别速度降低、识别运算量大的问题,本发明实施例的目标检测过程中无需对偏转(旋转)角度进行模型训练,在示例性的实现中,根据鱼眼相机和相机照片特性,针对传统标记的坐标值改变标注方式,并进行坐标的模型训练,模型训练中仅有目标框宽、高、中心点坐标值,可以计算出准确的旋转角度,比直接旋转检测算法更加精准。依据目标中心点与图片中心点连线的水平夹角,然后将原图旋转按规则旋转后使得目标正向,得到正向目标框,即检测用的矩形框,更好地匹配目标,有利于提升识别精度,相对于传统比直接的旋转检测算法更加精准,而且模型训练的效率和最终目标检测的速度和效率均得到提高,并且检测精度得到提升。
图1示例性的表示了本发明用于对于鱼眼相机图片中的旋转目标确定正向检测框的方法的示例性实施流程,其中,包括以下步骤:
接收鱼眼相机照片输入;
预测鱼眼相机图片的目标框中心点
Figure 971765DEST_PATH_IMAGE005
坐标和宽高;
获取目标框中心点
Figure 604872DEST_PATH_IMAGE005
到鱼眼相机图片中心点
Figure 846498DEST_PATH_IMAGE006
的连线与水平轴的夹角;
Figure 387200DEST_PATH_IMAGE006
为旋转中心,根据目标框中心点
Figure 483201DEST_PATH_IMAGE005
与鱼眼相机图片中心点
Figure 818368DEST_PATH_IMAGE006
的关系以及所述夹角,将鱼眼相机图片的原图旋转至目标框正向;
获取旋转后的目标框中心点
Figure 812868DEST_PATH_IMAGE007
坐标,并保持原始宽高不变,得到的矩形即为正向目标框。
通过上述步骤的实施,可实现鱼眼相机采集的照片中的对象检测框的矫正,得到矩形的正向目标检测框,从而可以利于在后续的目标检测算法中提高检测效率和准确地,可采用不同的算法实现。如此,通过本发明使用的模型训练检测算法预测目标框中心点和宽高,并根据鱼眼相机球面特性,将目标框旋转后,准确匹配目标。再可选的实施例中,可以基于正向目标框进行图像抠取和目标检测,实现高效、精确的对象检测。
本发明的实施例中,图像抠取过程和目标检测过程,可采用现有的算法实现即可。
下面我们将结合附图所示,更加具体的描述上述过程的实施。
预测鱼眼相机图片的目标框中心点
Figure 94945DEST_PATH_IMAGE005
坐标和宽高
作为目标框的矩形框通常用来包围目标,其具有四个顶点,坐标包括
Figure 592923DEST_PATH_IMAGE008
,共8个值。
在可选的实施例中,旋转检测模型训练过程中,改变以往的标注,将标注格式由四个点坐标转为中心点
Figure 630149DEST_PATH_IMAGE005
坐标
Figure 784050DEST_PATH_IMAGE009
,宽高
Figure 666555DEST_PATH_IMAGE010
由此,旋转检测模型训练过程中,以鱼眼相机图片以及转换后标注数据为训练数据,使用无锚(Anchor-Free)检测器(例如CenterNet网络)训练旋转检测模型,输出
Figure 284618DEST_PATH_IMAGE011
,其中转换后的标注数据为从旋转的检测框对应矩形的四个顶点坐标转换成目标框中心点
Figure 430429DEST_PATH_IMAGE005
坐标
Figure 133942DEST_PATH_IMAGE009
,宽高
Figure 554559DEST_PATH_IMAGE010
然后,利用训练得到旋转检测模型,输入获得的鱼眼相机图片预测得到目标框中心点
Figure 479659DEST_PATH_IMAGE005
的坐标和宽高数据。
如图4所示为所获取的鱼眼相机照片的示例,其中包括多个旋转的人体目标,本发明的实施例中以人体为检测目标进行示例说明。其中的灰色框为针对原始图像(原图)的目标框,如图示,目标框包围人体目标,其为旋转状态,为追求检测和识别的高精度,对于旋转的目标,通常期望能够使用旋转的框来包围目标。旋转框需要使用旋转角度进行矫正,但在现有的标注框和检测器的训练中,额外增加旋转角度信息会增加大量工作,导致训练速度、检测精度和效率的下降。
获取夹角
结合图2、3,在可选的实施例中,所述的夹角的获取包括以下步骤:
获得目标框中心点
Figure 858688DEST_PATH_IMAGE005
坐标
Figure 783918DEST_PATH_IMAGE009
与鱼眼相机图片的中心点
Figure 211489DEST_PATH_IMAGE006
坐标
Figure 272986DEST_PATH_IMAGE012
之间的水平距离
Figure 822916DEST_PATH_IMAGE013
和垂直距离
Figure 438705DEST_PATH_IMAGE014
Figure 466704DEST_PATH_IMAGE015
Figure 913866DEST_PATH_IMAGE016
然后,根据两个方向上的距离计算连线与水平轴的夹角:
Figure 306801DEST_PATH_IMAGE017
由此,得到夹角
Figure 206624DEST_PATH_IMAGE018
由于
Figure 38313DEST_PATH_IMAGE019
存在正负值,在本发明的实施例中取绝对值
Figure 792512DEST_PATH_IMAGE020
进行统一计算,并利于后期确定旋转角度。
结合图4、5、6,在本发明的实施例中,根据鱼眼相机球面特性,利用鱼眼相机图片中每个物体具有朝向图片中心点的特性,可依据目标中心点与图片中心点连线的水平夹角
Figure 153086DEST_PATH_IMAGE021
,然后将原图旋转按规则旋转后使得目标框正向。而因此,在在鱼眼镜头图片中,检测器可被设计成仅仅预测目标中心点和宽高,从而计算出偏转角度,可将图片和目标框旋转矫正,而不对偏转角度进行模型训练和检测。
在已知方框的偏转角度和两个对角顶点坐标,则可以计算出该矩形框的宽w和高h,以及中心点C1。 反之,已知某框的中心点C1、宽w和高h。同样能够准确的计算出该框的准确位置。由于矩形框的偏转角度即θ,则高h是与两个中心点的连线平行距离。
旋转鱼眼相机图片
结合图2、3,在本发明的实施例中,将目标框以图片中心点
Figure 805784DEST_PATH_IMAGE006
为旋转中心,将目标框旋转至例如图3所示的状态,以远离鱼眼相机图片的中心点
Figure 378848DEST_PATH_IMAGE006
的矩形边朝上,则需要根据上一步骤中计算的夹角
Figure 269443DEST_PATH_IMAGE021
和目标框中心点
Figure 332077DEST_PATH_IMAGE005
在平面坐标系中所处象限分别算出每个目标框具体的旋转角度:
如目标框中心点
Figure 144176DEST_PATH_IMAGE005
在右上角第一象限中,则将鱼眼相机图片的原图逆时针旋转
Figure 317668DEST_PATH_IMAGE022
如目标框中心点
Figure 593929DEST_PATH_IMAGE005
在左上角第二象限中,则将鱼眼相机图片的原图顺时针旋转
Figure 765147DEST_PATH_IMAGE022
如目标框中心点
Figure 861279DEST_PATH_IMAGE005
在左下角第三象限中,则将鱼眼相机图片的原图顺时针旋转
Figure 838462DEST_PATH_IMAGE023
如目标框中心点
Figure 153250DEST_PATH_IMAGE005
在右下角第四象限中,则将鱼眼相机图片的原图逆时针旋转
Figure 292107DEST_PATH_IMAGE023
其中,所述的旋转过程均以鱼眼相机图片中心点
Figure 141115DEST_PATH_IMAGE006
为旋转中心。
确定旋转后的目标框中心点
Figure 594093DEST_PATH_IMAGE007
的坐标
结合图2、3,旋转后的目标框中心点
Figure 579366DEST_PATH_IMAGE007
的坐标获取包括以下过程:
鱼眼相机图片的原图旋转后,由于旋转后的目标框中心点
Figure 154704DEST_PATH_IMAGE007
与鱼眼相机图片中心点
Figure 225428DEST_PATH_IMAGE006
均位于y轴,则两点的横坐标一致均为
Figure 482097DEST_PATH_IMAGE024
Figure 587457DEST_PATH_IMAGE007
的纵坐标
Figure 68117DEST_PATH_IMAGE025
即为原中心点
Figure 563820DEST_PATH_IMAGE005
Figure 686497DEST_PATH_IMAGE006
的距离,
Figure 380783DEST_PATH_IMAGE007
的纵坐标
Figure 484874DEST_PATH_IMAGE025
表达为:
Figure 530191DEST_PATH_IMAGE026
由此,得到旋转后目标框的中心点
Figure 190979DEST_PATH_IMAGE007
坐标为
Figure 943035DEST_PATH_IMAGE027
,宽高为
Figure 31076DEST_PATH_IMAGE010
至此,获得保持原始宽高不变的矩形,作为正向目标框。在此基础上,根据正向的坐标框抠取目标,再进行目标识别任务。
结合图4、7所示,在训练的旋转检测模型输出位置信息和宽高信息后,计算中心点水平夹角θ,以图片中心点C2为旋转中心,将图片旋转至正向,如图7所示,矩形框为正向,计算出原中心点C1旋转后在图上的新位置C3,同时方框宽高不变,则得到正向框并可以进行图片抠取和识别的常规操作。
图8表示了基于对鱼眼相机照片进行旋转矫正后的得到正向目标框进行目标检测的测试结果示意。在测试过程中,使用10000张训练图片,共有80937个行人;测试集共2000张图片,其中包含13581个行人。
试验中使用相同训练集和测试集,对比无旋转检测CenterNet、本专利基于CenterNet旋转检测和R-RPN的检测和识别结果。
其中无旋转检测的CenterNet需要将旋转框4个点的坐标转换成最小包围矩形的左上和右下角的坐标,且识别模型在转换后最小包围矩形裁剪框的数据上训练;后两者旋转检测方法的识别模型则是在矫正至正向的矩形框的数据上训练。
图8测试结果为检测后识别的整体精度,误检率FPR计算公式为
Figure 563689DEST_PATH_IMAGE028
,其中FP为识别错误或检测错误的个数,测试图片总数即为2000;召回率TPR计算公式为
Figure 965851DEST_PATH_IMAGE029
,其中TP为检测并识别正确的正样本个数,正样本总数即为13581。
通过上述试验以及测试结果分析可见:
1.无旋转检测CenterNet的检测结果,由于相邻检测框大面积重合,经过NMS后会减少部分正确的检测框,使得召回率降低;
2.无旋转检测CenterNet的检测结果是正向的矩形框,但其中的目标却是旋转的,此时抠取矩形框会存留较多背景信息,干扰识别精度;
3.R-RPN检测算法尽管能够检测旋转目标,但其预测的旋转角度因其训练方式而不够准确,直接影响检测框回归以及旋转矫正的结果,从而降低了识别精度;
4.本专利算法通过预测目标框的中心点和宽高,并准确计算出偏转角度,在于R-RPN使用相同训练识别模型的前提下,由于检测精度的提升,整体识别精度能够更高。
用于对于鱼眼相机图片中的旋转目标确定正向检测框的装置
图9示例性的表示了用于对于鱼眼相机图片中的旋转目标确定正向检测框的装置的示意图。
结合图示示例的装置100包括:
用于接收鱼眼相机照片输入的图像接收模块101;
用于预测鱼眼相机图片的目标框中心点
Figure 369151DEST_PATH_IMAGE005
坐标和宽高的预测模块102;
用于获取目标框中心点
Figure 893673DEST_PATH_IMAGE005
到鱼眼相机图片中心点
Figure 648002DEST_PATH_IMAGE006
的连线与水平轴的夹角的夹角获取模块103;
用于以
Figure 588277DEST_PATH_IMAGE006
为旋转中心,根据目标框中心点
Figure 377241DEST_PATH_IMAGE005
与鱼眼相机图片中心点
Figure 807085DEST_PATH_IMAGE006
的关系以及所述夹角,将鱼眼相机图片的原图旋转至目标框正向的旋转模块104;以及
用于获取旋转后的目标框中心点
Figure 235662DEST_PATH_IMAGE007
坐标,并保持原始宽高不变,得到的矩形即为正向目标框的正向目标框获取模块105。
其中,在可选的实施例中,用于预测鱼眼相机图片的目标框中心点
Figure 776364DEST_PATH_IMAGE005
坐标和宽高的预测模块还包括旋转检测模型训练模块,用于以鱼眼相机图片以及转换后标注数据为训练数据,使用无锚检测器训练旋转检测模型,输出
Figure 685414DEST_PATH_IMAGE011
,其中转换后的标注数据为从旋转的检测框对应矩形的四个顶点坐标转换成目标框中心点
Figure 223843DEST_PATH_IMAGE005
坐标
Figure 952765DEST_PATH_IMAGE009
,宽高
Figure 297158DEST_PATH_IMAGE010
其中,在可选的实施例中,所述夹角获取模块被设置成以下述方式确定夹角
Figure 998398DEST_PATH_IMAGE021
获得目标框中心点
Figure 504466DEST_PATH_IMAGE005
坐标
Figure 986263DEST_PATH_IMAGE009
与鱼眼相机图片的中心点
Figure 868768DEST_PATH_IMAGE006
坐标
Figure 424514DEST_PATH_IMAGE012
之间的水平距离
Figure 632642DEST_PATH_IMAGE013
和垂直距离
Figure 70576DEST_PATH_IMAGE014
Figure 943723DEST_PATH_IMAGE015
Figure 416293DEST_PATH_IMAGE016
然后,根据两个方向上的距离计算连线与水平轴的夹角:
Figure 529743DEST_PATH_IMAGE017
由此,得到夹角
Figure 454973DEST_PATH_IMAGE018
其中,在可选的实施例中,所述旋转模块对鱼眼相机图片的旋转,其中以下述方式确定旋转角度:
如目标框中心点在右上角第一象限中,则将鱼眼相机图片的原图逆时针旋转
Figure 882544DEST_PATH_IMAGE022
如目标框中心点
Figure 475199DEST_PATH_IMAGE005
在左上角第二象限中,则将鱼眼相机图片的原图顺时针旋转
Figure 759550DEST_PATH_IMAGE022
如目标框中心点
Figure 375339DEST_PATH_IMAGE005
在左下角第三象限中,则将鱼眼相机图片的原图顺时针旋转
Figure 137758DEST_PATH_IMAGE023
如目标框中心点
Figure 584920DEST_PATH_IMAGE005
在右下角第四象限中,则将鱼眼相机图片的原图逆时针旋转
Figure 40172DEST_PATH_IMAGE023
其中,所述的旋转过程均以鱼眼相机图片中心点
Figure 143258DEST_PATH_IMAGE006
为旋转中心。
其中,在可选的实施例中,所述正向目标框获取模块被设置以下述方式确定旋转后的目标框中心点
Figure 974947DEST_PATH_IMAGE007
的坐标:
鱼眼相机图片的原图旋转后,旋转后的目标框中心点
Figure 11037DEST_PATH_IMAGE007
与鱼眼相机图片中心点
Figure 92650DEST_PATH_IMAGE006
均位于y轴,则两点的横坐标一致均为
Figure 745348DEST_PATH_IMAGE024
Figure 849570DEST_PATH_IMAGE007
的纵坐标
Figure 209007DEST_PATH_IMAGE025
即为原中心点
Figure 6062DEST_PATH_IMAGE005
Figure 880477DEST_PATH_IMAGE006
的距离,
Figure 257232DEST_PATH_IMAGE007
的纵坐标表达为:
Figure 501448DEST_PATH_IMAGE026
由此,得到旋转后目标框的中心点
Figure 800843DEST_PATH_IMAGE007
坐标为
Figure 246867DEST_PATH_IMAGE027
,宽高为
Figure 643214DEST_PATH_IMAGE010
基于鱼眼相机图片的旋转目标检测装置
图10示例性的表示了本发明的基于鱼眼相机图片的旋转目标检测装置的示意图。
结合图10所示的旋转目标检测装置200包括:
用于接收鱼眼相机照片输入的图像接收模块201;
用于预测鱼眼相机图片的目标框中心点
Figure 782071DEST_PATH_IMAGE005
坐标和宽高的预测模块202;
用于获取目标框中心点
Figure 818029DEST_PATH_IMAGE005
到鱼眼相机图片中心点
Figure 67745DEST_PATH_IMAGE006
的连线与水平轴的夹角的夹角获取模块203;
用于以
Figure 318597DEST_PATH_IMAGE006
为旋转中心,根据目标框中心点
Figure 831618DEST_PATH_IMAGE005
与鱼眼相机图片中心点
Figure 902343DEST_PATH_IMAGE006
的关系以及所述夹角,将鱼眼相机图片的原图旋转至目标框正向的旋转模块204;
用于获取旋转后的目标框中心点
Figure 221328DEST_PATH_IMAGE007
坐标,并保持原始宽高不变,得到的矩形即为正向目标框的正向目标框获取模块205;以及
用于基于正向目标框进行图像抠取的抠取模块206和用于目标检测的检测模块207。
应当理解,在基于鱼眼相机图片的旋转目标检测装置的实现过程中,上述模块201-205的功能与实现过程可采用与所述模块101-105的实现方式。
抠取模块206和检测模块207可采用现有的图像抠取算法(SDK)、目标(例如人体目标)检测识别算法(SDK)实现。
计算机系统
图11示例性的表示了计算机系统的示例,该计算机系统可以是至少一个包括处理器和存储器的电子处理设备,例如PC电脑,不论是个人用PC电脑、商用PC电脑,或者图形处理用PC电脑、服务器级PC电脑。这些PC电脑通过具有数据接口和/或网络接口,实现有线和/或无线的数据传输,尤其是图像数据。
在另一些实施例,该计算机系统还可以是服务器,尤其是云服务器,具有数据存储、处理以及网络通讯功能。
图11所示,以服务器300为例进行说明,其包括由系统总线301连接的至少一个处理器302、存储器和网络接口310。网络接口310用于与其他设备/系统进行通信。
处理器302用于提供系统的计算和控制。
存储器包括非易失性存储器303和缓存304。
非易失性存储器303通常具有海量存储能力,可以存储操作系统以及计算机程序,这些计算机程序可以包括可被操作的指令,这些指令在通过一个或多个处理器执行时使得一个或多个处理器能够执行对于鱼眼相机图片中的旋转目标确定正向检测框的方法,实现鱼眼图片目标框的正向矫正,或者执行基于鱼眼相机图片的旋转目标检测。
在可选的实施例中,图11所示计算机系统仅仅是示例性的框图。在需要或者合理的实现方式中,计算机系统,不论是PC设备或者服务器,还可以包括比图示中更多或者更少的部件,或者组合,或者采用不同的硬件、软件等不同部件或者不同的部署方式。
结合上述实施例,本发明还可被配置成按照下述之一的方式实施。
用于旋转目标检测的服务器
一种用于旋转目标检测的服务器,包括:
一个或多个处理器;
存储器,存储可被操作的指令,所述指令在通过所述一个或多个处理器执行时使得所述一个或多个处理器执行操作,所述操作包括:
接收鱼眼相机图片输入;
预测鱼眼相机图片的目标框中心点
Figure 264371DEST_PATH_IMAGE005
坐标和宽高;
获取目标框中心点
Figure 745031DEST_PATH_IMAGE005
到鱼眼相机图片中心点
Figure 303051DEST_PATH_IMAGE006
的连线与水平轴的夹角;
Figure 160149DEST_PATH_IMAGE006
为旋转中心,根据目标框中心点
Figure 57697DEST_PATH_IMAGE005
与鱼眼相机图片中心点
Figure 709259DEST_PATH_IMAGE006
的关系以及所述夹角,将鱼眼相机图片的原图旋转至目标框正向;
获取旋转后的目标框中心点
Figure 20154DEST_PATH_IMAGE007
坐标,并保持原始宽高不变,得到的矩形即为正向目标框;以及
基于正向目标框进行图像抠取和目标检测。
用于旋转目标检测的电子设备
用于旋转目标检测的电子设备,包括:
一个或多个处理器;
存储器,存储可被操作的指令,所述指令在通过所述一个或多个处理器执行时使得所述一个或多个处理器执行操作,所述操作包括:
接收鱼眼相机图片输入;
预测鱼眼相机图片的目标框中心点
Figure 867893DEST_PATH_IMAGE005
坐标和宽高;
获取目标框中心点
Figure 416686DEST_PATH_IMAGE005
到鱼眼相机图片中心点
Figure 770307DEST_PATH_IMAGE006
的连线与水平轴的夹角;
Figure 37341DEST_PATH_IMAGE006
为旋转中心,根据目标框中心点
Figure 173924DEST_PATH_IMAGE005
与鱼眼相机图片中心点
Figure 108382DEST_PATH_IMAGE006
的关系以及所述夹角,将鱼眼相机图片的原图旋转至目标框正向;
获取旋转后的目标框中心点
Figure 367325DEST_PATH_IMAGE007
坐标,并保持原始宽高不变,得到的矩形即为正向目标框;以及
基于正向目标框进行图像抠取和目标检测。
基于鱼眼相机图片的旋转目标检测系统
一种基于鱼眼相机图片的旋转目标检测系统,包括:
一个或多个处理器;
存储器,存储可被操作的指令,所述指令在通过所述一个或多个处理器执行时使得所述一个或多个处理器执行操作,所述操作包括:
接收鱼眼相机照片输入;
预测鱼眼相机图片的目标框中心点
Figure 59337DEST_PATH_IMAGE005
坐标和宽高;
获取目标框中心点
Figure 61929DEST_PATH_IMAGE005
到鱼眼相机图片中心点
Figure 850893DEST_PATH_IMAGE006
的连线与水平轴的夹角;
Figure 15158DEST_PATH_IMAGE006
为旋转中心,根据目标框中心点
Figure 460046DEST_PATH_IMAGE005
与鱼眼相机图片中心点
Figure 266328DEST_PATH_IMAGE006
的关系以及所述夹角,将鱼眼相机图片的原图旋转至目标框正向;
获取旋转后的目标框中心点
Figure 644220DEST_PATH_IMAGE007
坐标,并保持原始宽高不变,得到的矩形即为正向目标框;以及
基于正向目标框进行图像抠取和目标检测。
用于对于鱼眼相机图片中的旋转目标确定正向检测框的系统
一种用于对于鱼眼相机图片中的旋转目标确定正向检测框的系统,包括:
一个或多个处理器;
存储器,存储可被操作的指令,所述指令在通过所述一个或多个处理器执行时使得所述一个或多个处理器执行操作,所述操作包括:
接收鱼眼相机图片输入;
预测鱼眼相机图片的目标框中心点
Figure 697495DEST_PATH_IMAGE005
坐标和宽高;
获取目标框中心点
Figure 160837DEST_PATH_IMAGE005
到鱼眼相机图片中心点
Figure 770810DEST_PATH_IMAGE006
的连线与水平轴的夹角;
Figure 268788DEST_PATH_IMAGE006
为旋转中心,根据目标框中心点
Figure 978118DEST_PATH_IMAGE005
与鱼眼相机图片中心点
Figure 459915DEST_PATH_IMAGE006
的关系以及所述夹角,将鱼眼相机图片的原图旋转至目标框正向;以及
获取旋转后的目标框中心点
Figure 342420DEST_PATH_IMAGE007
坐标,并保持原始宽高不变,得到的矩形即为正向目标框。
计算机可读存储介质
一种存储软件的计算机可读存储介质,所述软件包括能通过一个或多个计算机执行的指令,所述指令通过这样的执行使得所述一个或多个计算机执行操作,所述操作包括:
接收鱼眼相机图片输入;
预测鱼眼相机图片的目标框中心点
Figure 898166DEST_PATH_IMAGE005
坐标和宽高;
获取目标框中心点
Figure 840715DEST_PATH_IMAGE005
到鱼眼相机图片中心点
Figure 278649DEST_PATH_IMAGE006
的连线与水平轴的夹角;
Figure 168108DEST_PATH_IMAGE006
为旋转中心,根据目标框中心点
Figure 375098DEST_PATH_IMAGE005
与鱼眼相机图片中心点
Figure 754127DEST_PATH_IMAGE006
的关系以及所述夹角,将鱼眼相机图片的原图旋转至目标框正向;
获取旋转后的目标框中心点
Figure 140677DEST_PATH_IMAGE007
坐标,并保持原始宽高不变,得到的矩形即为正向目标框;以及
基于正向目标框进行图像抠取和目标检测。
虽然本发明已以较佳实施例揭露如上,然其并非用以限定本发明。本发明所属技术领域中具有通常知识者,在不脱离本发明的精神和范围内,当可作各种的更动与润饰。因此,本发明的保护范围当视权利要求书所界定者为准。

Claims (14)

1.一种旋转目标检测方法,其特征在于,包括以下步骤:
接收鱼眼相机照片输入;
预测鱼眼相机图片的目标框中心点
Figure 970919DEST_PATH_IMAGE001
坐标和宽高;
获取目标框中心点
Figure 949239DEST_PATH_IMAGE001
到鱼眼相机图片中心点
Figure 138912DEST_PATH_IMAGE002
的连线与水平轴的夹角
Figure 710839DEST_PATH_IMAGE003
Figure 11370DEST_PATH_IMAGE002
为旋转中心,根据目标框中心点
Figure 47459DEST_PATH_IMAGE001
与鱼眼相机图片中心点
Figure 470350DEST_PATH_IMAGE002
的关系以及所述夹角
Figure 591890DEST_PATH_IMAGE003
,将鱼眼相机图片的原图旋转至目标框正向;
获取旋转后的目标框中心点
Figure 696112DEST_PATH_IMAGE004
坐标,并保持原始宽高不变,得到的矩形即为正向目标框;
基于正向目标框进行图像抠取和目标检测。
2.根据权利要求1所述的旋转目标检测方法,其特征在于,所述方法更加包括旋转检测模型训练,其中以鱼眼相机图片以及转换后标注数据为训练数据,使用无锚检测器训练旋转检测模型,输出
Figure 773659DEST_PATH_IMAGE005
,其中转换后的标注数据为从旋转的检测框对应矩形的四个顶点坐标转换成目标框中心点
Figure 305134DEST_PATH_IMAGE001
坐标
Figure 710708DEST_PATH_IMAGE006
,宽高
Figure 618621DEST_PATH_IMAGE007
然后,利用训练的旋转检测模型,输入获得的鱼眼相机图片预测得到目标框中心点
Figure 629302DEST_PATH_IMAGE001
的坐标和宽高数据。
3.根据权利要求1所述的旋转目标检测方法,其特征在于,所述方法中,所述夹角
Figure 269362DEST_PATH_IMAGE003
的获取包括以下步骤:
获得目标框中心点
Figure 99915DEST_PATH_IMAGE001
坐标
Figure 342677DEST_PATH_IMAGE006
与鱼眼相机图片的中心点
Figure 473444DEST_PATH_IMAGE002
坐标
Figure 346722DEST_PATH_IMAGE008
之间的水平距离
Figure 930151DEST_PATH_IMAGE009
和垂直距离
Figure 101238DEST_PATH_IMAGE010
Figure 820932DEST_PATH_IMAGE011
Figure 130691DEST_PATH_IMAGE012
然后,根据两个方向上的距离计算连线与水平轴的夹角
Figure 998153DEST_PATH_IMAGE003
Figure 785980DEST_PATH_IMAGE013
由此,得到夹角
Figure 625760DEST_PATH_IMAGE003
4.根据权利要求1所述的旋转目标检测方法,其特征在于,对鱼眼相机图片的旋转,以远离鱼眼相机图片的中心点
Figure 778524DEST_PATH_IMAGE002
的矩形边朝上。
5.根据权利要求1或4所述的旋转目标检测方法,其特征在于,对鱼眼相机图片的旋转,以下述方式确定旋转角度:
如目标框中心点
Figure 805386DEST_PATH_IMAGE001
在右上角第一象限中,则将鱼眼相机图片的原图逆时针旋转
Figure 662483DEST_PATH_IMAGE014
如目标框中心点
Figure 153507DEST_PATH_IMAGE001
在左上角第二象限中,则将鱼眼相机图片的原图顺时针旋转
Figure 805069DEST_PATH_IMAGE014
如目标框中心点
Figure 584806DEST_PATH_IMAGE001
在左下角第三象限中,则将鱼眼相机图片的原图顺时针旋转
Figure 898457DEST_PATH_IMAGE015
如目标框中心点
Figure 447250DEST_PATH_IMAGE001
在右下角第四象限中,则将鱼眼相机图片的原图逆时针旋转
Figure 269712DEST_PATH_IMAGE015
其中,所述的旋转过程均以鱼眼相机图片中心点
Figure 333483DEST_PATH_IMAGE002
为旋转中心。
6.根据权利要求1所述的旋转目标检测方法,其特征在于,所述旋转后的目标框中心点
Figure 266804DEST_PATH_IMAGE004
的坐标获取包括以下过程:
鱼眼相机图片的原图旋转后,旋转后的目标框中心点
Figure 670104DEST_PATH_IMAGE004
与鱼眼相机图片中心点
Figure 929047DEST_PATH_IMAGE002
均位于y轴,则两点的横坐标一致均为
Figure 89901DEST_PATH_IMAGE016
Figure 826913DEST_PATH_IMAGE004
的纵坐标
Figure 350298DEST_PATH_IMAGE017
即为原中心点
Figure 311301DEST_PATH_IMAGE001
Figure 552926DEST_PATH_IMAGE002
的距离,
Figure 828050DEST_PATH_IMAGE004
的纵坐标
Figure 127313DEST_PATH_IMAGE017
表达为:
Figure 728058DEST_PATH_IMAGE018
由此,得到旋转后目标框的中心点
Figure 925822DEST_PATH_IMAGE004
坐标为
Figure 270215DEST_PATH_IMAGE019
,宽高为
Figure 564930DEST_PATH_IMAGE007
7.一种旋转目标检测装置,其特征在于,包括:
用于接收鱼眼相机照片输入的图像接收模块;
用于预测鱼眼相机图片的目标框中心点
Figure 805419DEST_PATH_IMAGE001
坐标和宽高的预测模块;
用于获取目标框中心点
Figure 21637DEST_PATH_IMAGE001
到鱼眼相机图片中心点
Figure 576246DEST_PATH_IMAGE002
的连线与水平轴的夹角
Figure 663150DEST_PATH_IMAGE003
的夹角获取模块;
用于以
Figure 340119DEST_PATH_IMAGE002
为旋转中心,根据目标框中心点
Figure 574792DEST_PATH_IMAGE001
与鱼眼相机图片中心点
Figure 995409DEST_PATH_IMAGE002
的关系以及夹角
Figure 202399DEST_PATH_IMAGE003
,将鱼眼相机图片的原图旋转至目标框正向的旋转模块;
用于获取旋转后的目标框中心点
Figure 237220DEST_PATH_IMAGE004
坐标,并保持原始宽高不变,得到的矩形即为正向目标框的正向目标框获取模块;
用于基于正向目标框进行图像抠取的抠取模块和用于目标检测的检测模块。
8.根据权利要求7所述的旋转目标检测装置,其特征在于,所述用于预测鱼眼相机图片的目标框中心点
Figure 896872DEST_PATH_IMAGE001
坐标和宽高的预测模块还包括旋转检测模型训练模块,用于以鱼眼相机图片以及转换后标注数据为训练数据,使用无锚检测器训练旋转检测模型,输出
Figure 121180DEST_PATH_IMAGE005
,其中转换后的标注数据为从旋转的检测框对应矩形的四个顶点坐标转换成目标框中心点
Figure 244993DEST_PATH_IMAGE001
坐标
Figure 263765DEST_PATH_IMAGE006
,宽高
Figure 410713DEST_PATH_IMAGE007
9.根据权利要求7所述的旋转目标检测装置,其特征在于,所述夹角获取模块被设置成以下述方式确定夹角
Figure 110815DEST_PATH_IMAGE003
获得目标框中心点
Figure 26819DEST_PATH_IMAGE001
坐标
Figure 482071DEST_PATH_IMAGE006
与鱼眼相机图片的中心点
Figure 178631DEST_PATH_IMAGE002
坐标
Figure 479163DEST_PATH_IMAGE008
之间的水平距离
Figure 515252DEST_PATH_IMAGE009
和垂直距离
Figure 62777DEST_PATH_IMAGE010
Figure 918737DEST_PATH_IMAGE011
Figure 288539DEST_PATH_IMAGE012
然后,根据两个方向上的距离计算连线与水平轴的夹角
Figure 241451DEST_PATH_IMAGE003
Figure 38506DEST_PATH_IMAGE013
由此,得到夹角
Figure 381763DEST_PATH_IMAGE003
10.根据权利要求7所述的旋转目标检测装置,其特征在于,所述旋转模块对鱼眼相机图片的旋转,其中以下述方式确定旋转角度:
如目标框中心点
Figure 961780DEST_PATH_IMAGE001
在右上角第一象限中,则将鱼眼相机图片的原图逆时针旋转
Figure 972461DEST_PATH_IMAGE014
如目标框中心点
Figure 674838DEST_PATH_IMAGE001
在左上角第二象限中,则将鱼眼相机图片的原图顺时针旋转
Figure 567707DEST_PATH_IMAGE014
如目标框中心点
Figure 279311DEST_PATH_IMAGE001
在左下角第三象限中,则将鱼眼相机图片的原图顺时针旋转
Figure 144499DEST_PATH_IMAGE015
如目标框中心点
Figure 207658DEST_PATH_IMAGE001
在右下角第四象限中,则将鱼眼相机图片的原图逆时针旋转
Figure 525507DEST_PATH_IMAGE015
其中,所述的旋转过程均以鱼眼相机图片中心点
Figure 775222DEST_PATH_IMAGE002
为旋转中心。
11.根据权利要求7所述的旋转目标检测装置,其特征在于,所述正向目标框获取模块被设置以下述方式确定旋转后的目标框中心点
Figure 557234DEST_PATH_IMAGE004
的坐标:
鱼眼相机图片的原图旋转后,旋转后的目标框中心点
Figure 866992DEST_PATH_IMAGE004
与鱼眼相机图片中心点
Figure 406558DEST_PATH_IMAGE002
均位于y轴,则两点的横坐标一致均为
Figure 132068DEST_PATH_IMAGE016
Figure 706269DEST_PATH_IMAGE004
的纵坐标
Figure 186929DEST_PATH_IMAGE017
即为原中心点
Figure 541687DEST_PATH_IMAGE001
Figure 867626DEST_PATH_IMAGE002
的距离,
Figure 827492DEST_PATH_IMAGE004
的纵坐标
Figure 400425DEST_PATH_IMAGE017
表达为:
Figure 711320DEST_PATH_IMAGE018
由此,得到旋转后目标框的中心点
Figure 106529DEST_PATH_IMAGE004
坐标为
Figure 655322DEST_PATH_IMAGE019
,宽高为
Figure 149889DEST_PATH_IMAGE007
12.一种旋转目标检测系统,其特征在于,包括:
一个或多个处理器;
存储器,存储可被操作的指令,所述指令在通过所述一个或多个处理器执行时使得所述一个或多个处理器执行操作,所述操作包括如权利要求1所述的旋转目标检测方法的流程。
13.一种服务器,其特征在于,包括:
一个或多个处理器;
存储器,存储可被操作的指令,所述指令在通过所述一个或多个处理器执行时使得所述一个或多个处理器执行操作,所述操作包括如权利要求1所述的旋转目标检测方法的流程。
14.一种存储软件的计算机可读存储介质,其特征在于,所述软件包括能通过一个或多个计算机执行的指令,所述指令通过这样的执行使得所述一个或多个计算机执行操作,所述操作包括如权利要求1所述的旋转目标检测方法的流程。
CN202010902190.1A 2020-09-01 2020-09-01 旋转目标检测方法、装置、系统与可读介质 Active CN111815519B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010902190.1A CN111815519B (zh) 2020-09-01 2020-09-01 旋转目标检测方法、装置、系统与可读介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010902190.1A CN111815519B (zh) 2020-09-01 2020-09-01 旋转目标检测方法、装置、系统与可读介质

Publications (2)

Publication Number Publication Date
CN111815519A true CN111815519A (zh) 2020-10-23
CN111815519B CN111815519B (zh) 2021-04-30

Family

ID=72860650

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010902190.1A Active CN111815519B (zh) 2020-09-01 2020-09-01 旋转目标检测方法、装置、系统与可读介质

Country Status (1)

Country Link
CN (1) CN111815519B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113468968A (zh) * 2021-06-02 2021-10-01 中国地质大学(武汉) 一种基于无锚框的遥感图像旋转目标检测方法
CN115204383A (zh) * 2021-04-13 2022-10-18 北京三快在线科技有限公司 中心点预测模型的训练方法及装置

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109961055A (zh) * 2019-03-29 2019-07-02 广州市百果园信息技术有限公司 人脸关键点检测方法、装置、设备及存储介质
CN110547803A (zh) * 2019-07-27 2019-12-10 华南理工大学 一种适用于鱼眼相机俯视拍摄的行人身高估计方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109961055A (zh) * 2019-03-29 2019-07-02 广州市百果园信息技术有限公司 人脸关键点检测方法、装置、设备及存储介质
CN110547803A (zh) * 2019-07-27 2019-12-10 华南理工大学 一种适用于鱼眼相机俯视拍摄的行人身高估计方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115204383A (zh) * 2021-04-13 2022-10-18 北京三快在线科技有限公司 中心点预测模型的训练方法及装置
CN113468968A (zh) * 2021-06-02 2021-10-01 中国地质大学(武汉) 一种基于无锚框的遥感图像旋转目标检测方法

Also Published As

Publication number Publication date
CN111815519B (zh) 2021-04-30

Similar Documents

Publication Publication Date Title
WO2020199906A1 (zh) 人脸关键点检测方法、装置、设备及存储介质
US20210366124A1 (en) Graphical fiducial marker identification
CN109242913B (zh) 采集器相对参数的标定方法、装置、设备和介质
CN107633526B (zh) 一种图像跟踪点获取方法及设备、存储介质
CN111640181A (zh) 一种交互式视频投影方法、装置、设备及存储介质
WO2019011249A1 (zh) 一种图像中物体姿态的确定方法、装置、设备及存储介质
CN110335317B (zh) 基于终端设备定位的图像处理方法、装置、设备和介质
CN110222703B (zh) 图像轮廓识别方法、装置、设备和介质
CN112396122B (zh) 基于顶点距离与交并比多重优化目标检测器的方法与系统
US20110311100A1 (en) Method, Apparatus and Computer Program Product for Providing Object Tracking Using Template Switching and Feature Adaptation
CN111815519B (zh) 旋转目标检测方法、装置、系统与可读介质
Dubská et al. Real Projective Plane Mapping for Detection of Orthogonal Vanishing Points.
CN111860489A (zh) 一种证件图像校正方法、装置、设备及存储介质
CN112016638A (zh) 一种钢筋簇的识别方法、装置、设备及存储介质
US20130208009A1 (en) Method and apparatus for optimization and incremental improvement of a fundamental matrix
CN108509988B (zh) 一种试卷分数自动统计方法、装置、电子设备及存储介质
CN111507908A (zh) 图像矫正处理方法、装置、存储介质及计算机设备
CN113095316B (zh) 基于多级融合和角点偏移的图像旋转目标检测方法
WO2022105569A1 (zh) 页面方向识别方法、装置、设备及计算机可读存储介质
CN108875479A (zh) 人脸图像的获取方法及装置
CN113724135A (zh) 图像拼接方法、装置、设备及存储介质
CN109753981B (zh) 一种图像识别的方法及装置
CN111950554A (zh) 一种身份证识别方法、装置、设备及存储介质
CN113963158A (zh) 一种掌静脉图像感兴趣区域提取方法及装置
CN113538291B (zh) 卡证图像倾斜校正方法、装置、计算机设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CP01 Change in the name or title of a patent holder
CP01 Change in the name or title of a patent holder

Address after: No.568 longmian Avenue, gaoxinyuan, Jiangning District, Nanjing City, Jiangsu Province, 211000

Patentee after: Xiaoshi Technology (Jiangsu) Co.,Ltd.

Address before: No.568 longmian Avenue, gaoxinyuan, Jiangning District, Nanjing City, Jiangsu Province, 211000

Patentee before: NANJING ZHENSHI INTELLIGENT TECHNOLOGY Co.,Ltd.