CN116152679A - 基于ai视觉的认知定位方法 - Google Patents

基于ai视觉的认知定位方法 Download PDF

Info

Publication number
CN116152679A
CN116152679A CN202211704973.4A CN202211704973A CN116152679A CN 116152679 A CN116152679 A CN 116152679A CN 202211704973 A CN202211704973 A CN 202211704973A CN 116152679 A CN116152679 A CN 116152679A
Authority
CN
China
Prior art keywords
coordinate system
image
vision
positioning method
camera
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211704973.4A
Other languages
English (en)
Inventor
封晨
杨琳
王鹏飞
武欣桐
吕晓钢
王通宇
孙冠群
杨文�
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tianjin Optical Electrical Communication Technology Co Ltd
Original Assignee
Tianjin Optical Electrical Communication Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tianjin Optical Electrical Communication Technology Co Ltd filed Critical Tianjin Optical Electrical Communication Technology Co Ltd
Priority to CN202211704973.4A priority Critical patent/CN116152679A/zh
Publication of CN116152679A publication Critical patent/CN116152679A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/10Terrestrial scenes
    • G06V20/17Terrestrial scenes taken from planes or by drones
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/22Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/32Normalisation of the pattern dimensions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V2201/00Indexing scheme relating to image or video recognition or understanding
    • G06V2201/07Target detection

Abstract

本发明提供了一种基于AI视觉的认知定位方法,包括如下步骤:S1、对机载摄像机拍摄图像进行目标识别,并将输出信息转换至以图像中心为原点的归一化坐标系;S2、计算所述归一化坐标系预测框的相应坐标,并根据图像的原始尺寸放大坐标,得到图像坐标系中的角点坐标;S3、增加坐标维度,将图像坐标点转化至摄像机坐标系;S4、将所述摄像机坐标系再转换至载机机体坐标系;S5、将所述载机机体坐标系转换到地理坐标系,完成对目标的定位。该方法通过人工智能算法识别图像中的目标,成本低,识别准确度高。

Description

基于AI视觉的认知定位方法
技术领域
本发明涉及视觉定位和目标检测技术领域,具体涉及一种基于AI视觉的认知定位方法、电子设备和可读存储介质。
背景技术
电子侦察领域对目标的定位一直是研究的重点问题。目前成熟的定位的方法主要有雷达定位和卫星定位,但这两种定位方法容易受到电磁波的干扰,而且成本相对较高。无源定位主要依靠目标辐射的电磁波信号进行分析处理,但需要多个观测站的数据协同处理。
因此,有必要提供一种新的目标识别定位方法,降低目标定位的成本。
发明内容
解决的技术问题
针对现有技术所存在的上述缺点,本发明提供了一种基于AI视觉的认知定位方法,该方法通过人工智能算法识别图像中的目标,成本低,识别准确度高。
技术方案
为实现以上目的,本发明通过以下技术方案予以实现:
本发明提供了一种基于AI视觉的认知定位方法,包括如下步骤:
S1、对机载摄像机拍摄图像进行目标识别,并将输出信息转换至以图像中心为原点的归一化坐标系;
S2、计算所述归一化坐标系预测框的相应坐标,并根据图像的原始尺寸放大坐标,得到图像坐标系中的角点坐标;
S3、增加坐标维度,将图像坐标点转化至摄像机坐标系;
S4、将所述摄像机坐标系再转换至载机机体坐标系;
S5、将所述载机机体坐标系转换到地理坐标系,完成对目标的定位。
进一步地,所述基于AI视觉的认知定位方法以YOLO v4目标检测算法为基础,对机载摄像机拍摄图像进行目标识别。
进一步地,按下式将YOLO v4目标检测算法的输出信息转换至以图像中心为原点的归一化坐标系:
Figure BDA0004026021460000021
其中,xi,yi是YOLO网络预测框的中心坐标,wi,hi分别是预测框的宽度和高度值。
进一步地,根据下式计算所述归一化坐标系预测框的相应坐标:
Figure BDA0004026021460000022
进一步地,根据图像的原始尺寸对所述归一化坐标系预测框的相应坐标进行放大,得到图像坐标系中的角点坐标如下:
Figure BDA0004026021460000023
然后将图像坐标点转化至摄像机坐标系[xs,ys,zs]。
进一步地,将所述摄像机坐标系[xs,ys,zs]按照下式转换至载机机体坐标系:
(xa,ya,za)T=Q2Q1(xs,ys,zs)T
Figure BDA0004026021460000031
其中,α,β为摄像机方位角和高低角。
进一步地,将所述载机机体坐标系按照下式转换到地理坐标系:
(xg,yg,zg)T=Q5Q4Q3(xa,ya,za)T
Figure BDA0004026021460000032
其中,ψ,θ,
Figure BDA0004026021460000033
分别为无人机的航偏角、俯仰角和横滚角。
基于同一发明构想,本发明还提供了一种电子设备,包括处理器和存储器,所述存储器上存储有计算机程序,所述计算机程序被所述处理器执行时,实现上述任一项所述的方法。
基于同一发明构想,本发明还提供了一种可读存储介质,所述可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时,实现上述任一项所述的方法。
有益效果
本发明设计了一种基于AI视觉的认知定位方法,将AI视觉与定位技术相结合,利用无人平台(无人机)获取到目标的视觉信息,通过人工智能算法识别图像中的目标,并根据视觉成像原理对目标的图像位置与实际空间位置进行坐标转换,进而换算出目标的地理位置信息,通过矩阵转换获得较为准确的目标位置,成本低廉。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍。显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明一实施例提供的基于AI视觉的认知定位方法步骤示意图;
图2为本发明一实施例提供的基于AI视觉的认知定位方法流程示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述。显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
参阅图1,本发明一实施例提供了一种基于AI视觉的认知定位方法,包括如下步骤:
S1、对机载摄像机拍摄图像进行目标识别,并将输出信息转换至以图像中心为原点的归一化坐标系;
S2、计算所述归一化坐标系预测框的相应坐标,并根据图像的原始尺寸放大坐标,得到图像坐标系中的角点坐标;
S3、增加坐标维度,将图像坐标点转化至摄像机坐标系;
S4、将所述摄像机坐标系再转换至载机机体坐标系;
S5、将所述载机机体坐标系转换到地理坐标系,完成对目标的定位。
具体实施的时候,首先对拍摄图像内目标进行准确识别;再根据拍摄图像中像点在像片坐标系中的位置,算出像点在摄像机坐标系中的坐标;然后根据摄像机坐标系与载机机体坐标系间的关系,计算它们之间的转换矩阵,求解像点在载机机体坐标系中的坐标;再根据载机机体坐标系与载机地理坐标系间的转换关系,求解出像点在载机地理坐标系中的坐标;最后再根据像点与目标点之间的几何关系,求解出目标在地面坐标系中的坐标,完成对目标的定位。本发明是通过将AI视觉与定位技术相结合,利用基于矩阵的坐标转换关系实现目标位置信息的有效提取。
在本实施例中,参阅图2,首先以YOLO v4目标检测算法为基础,对图像目标进行识别,并针对遥感图像的特征和定位算法的需求对其训练过程进行了优化,对其输出参数进行了修改,以实现对目标的自动检测及后续的定位实现。按下式将YOLO的输出信息转换至以图像中心为原点的归一化坐标系:
Figure BDA0004026021460000051
其中,xi,yi是YOLO网络预测框的中心坐标,wi,hi分别是预测框的宽度和高度值。
然后计算该坐标系预测框的相应坐标。
Figure BDA0004026021460000052
最后,根据图像的原始尺寸对坐标进行放大,得到图像坐标系中的角点坐标。
Figure BDA0004026021460000061
将图像坐标点转化至摄像机坐标系,由于相片坐标系和摄像系是平行的,因此目标中心在摄像机坐标系中的坐标仅需添加相机z轴坐标,即[xs,ys,zs]。
再将摄像机坐标系在转换至载机机体坐标系。
(xa,ya,za)T=Q2Q1(xs,ys,zs)T
Figure BDA0004026021460000062
其中,α,β为摄像机方位角和高低角。
最后将载机机体坐标系转换到地理坐标系:
(xg,yg,zg)T=Q5Q4Q3(xa,ya,za)T
Figure BDA0004026021460000063
其中,ψ,θ,
Figure BDA0004026021460000064
分别为无人机的航偏角、俯仰角和横滚角。
具体而言,本发明提出一种基于AI视觉的认知定位方法,通过无人平台(无人机)获取到目标的视觉信息,通过人工智能算法识别图像中的目标,并根据视觉成像原理对目标的图像位置与实际空间位置进行坐标转换,进而换算出目标的地理位置信息。本发明提出算法的具体的过程是:首先对拍摄图像内目标进行准确识别;再根据拍摄图像中像点在像片坐标系中的位置,算出像点在摄像机坐标系中的坐标;然后根据摄像机坐标系与载机机体坐标系间的关系,计算它们之间的转换矩阵,求解像点在载机机体坐标系中的坐标;再根据载机机体坐标系与载机地理坐标系间的转换关系,求解出像点在载机地理坐标系中的坐标;最后再根据像点与目标点之间的几何关系,求解出目标在地面坐标系中的坐标,完成对目标的定位。目标定位的实质是解决不同坐标系之间的矩阵转换问题。
在本实施例中,YOLO-v4算法是在原有YOLO目标检测架构的基础上,采用了近些年CNN领域中最优秀的优化策略,从数据处理、主干网络、网络训练、激活函数、损失函数等各个方面都有着不同程度的优化,虽没有理论上的创新,但是会受到许许多多的工程师的欢迎,各种优化算法的尝试。文章如同于目标检测的trick综述,效果达到了实现FPS与Precision平衡的目标检测。
基于同一发明构想,本发明还提供了一种电子设备,包括处理器和存储器,所述存储器上存储有计算机程序,所述计算机程序被所述处理器执行时,实现所述基于AI视觉的认知定位方法。
所述处理器在一些实施例中可以是中央处理器(Central Processing Unit,CPU)、控制器、微控制器、微处理器(例如GPU(Graphics Processing Unit-图形处理器))、或其他数据处理芯片。该处理器通常用于控制所述电子设备的总体操作。本实施例中,所述处理器用于运行所述存储器中存储的程序代码或者处理数据,例如运行所述基于AI视觉的认知定位方法的程序代码。
所述存储器至少包括一种类型的可读存储介质,所述可读存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如,SD或DX存储器等)、随机访问存储器(RAM)、静态随机访问存储器(SRAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、可编程只读存储器(PROM)、磁性存储器、磁盘、光盘等。在一些实施例中,所述存储器可以是所述电子设备的内部存储单元,例如该电子设备的硬盘或内存。在另一些实施例中,所述存储器也可以是所述电子设备的外部存储设备,例如该电子设备上配备的插接式硬盘,智能存储卡(SmartMedia Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。当然,所述存储器还可以既包括所述电子设备的内部存储单元也包括其外部存储设备。本实施例中,所述存储器通常用于存储安装于所述电子设备的操作方法和各类应用软件,例如所述基于AI视觉的认知定位方法的程序代码等。此外,所述存储器还可以用于暂时地存储已经输出或者将要输出的各类数据。
基于同一发明构想,本发明还提供一种可读存储介质,所述可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时,实现所述基于AI视觉的认知定位方法。
本发明的优点在于设计了一种基于AI视觉的认知定位方法,将AI视觉与定位技术相结合,利用无人平台(无人机)获取到目标的视觉信息,通过人工智能算法识别图像中的目标,并根据视觉成像原理对目标的图像位置与实际空间位置进行坐标转换,进而换算出目标的地理位置信息,通过矩阵转换获得较为准确的目标位置,成本低廉。
以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不会使相应技术方案的本质脱离本发明各实施例技术方案的保护范围。

Claims (9)

1.一种基于AI视觉的认知定位方法,其特征在于,包括如下步骤:
S1、对机载摄像机拍摄图像进行目标识别,并将输出信息转换至以图像中心为原点的归一化坐标系;
S2、计算所述归一化坐标系预测框的相应坐标,并根据图像的原始尺寸放大坐标,得到图像坐标系中的角点坐标;
S3、增加坐标维度,将图像坐标点转化至摄像机坐标系;
S4、将所述摄像机坐标系再转换至载机机体坐标系;
S5、将所述载机机体坐标系转换到地理坐标系,完成对目标的定位。
2.根据权利要求1所述的基于AI视觉的认知定位方法,其特征在于,所述基于AI视觉的认知定位方法以YOLO v4目标检测算法为基础,对机载摄像机拍摄图像进行目标识别。
3.根据权利要求2所述的基于AI视觉的认知定位方法,其特征在于,按下式将YOLO v4目标检测算法的输出信息转换至以图像中心为原点的归一化坐标系:
Figure FDA0004026021450000011
其中,xi,yi是YOLO网络预测框的中心坐标,wi,hi分别是预测框的宽度和高度值。
4.根据权利要求3所述的基于AI视觉的认知定位方法,其特征在于,根据下式计算所述归一化坐标系预测框的相应坐标:
Figure FDA0004026021450000021
5.根据权利要求4所述的基于AI视觉的认知定位方法,其特征在于,根据图像的原始尺寸对所述归一化坐标系预测框的相应坐标进行放大,得到图像坐标系中的角点坐标如下:
Figure FDA0004026021450000022
然后将图像坐标点转化至摄像机坐标系[xs,ys,zs]。
6.根据权利要求5所述的基于AI视觉的认知定位方法,其特征在于,将所述摄像机坐标系[xs,ys,zs]按照下式转换至载机机体坐标系:
(xa,ya,za)T=Q2Q1(xs,ys,zs)T
Figure FDA0004026021450000023
其中,α,β为摄像机方位角和高低角。
7.根据权利要求6所述的基于AI视觉的认知定位方法,其特征在于,将所述载机机体坐标系按照下式转换到地理坐标系:
(xg,yg,zg)T=Q5Q4Q3(xa,ya,za)T
Figure FDA0004026021450000024
其中,ψ,θ,
Figure FDA0004026021450000025
分别为无人机的航偏角、俯仰角和横滚角。
8.一种电子设备,其特征在于,包括处理器和存储器,所述存储器上存储有计算机程序,所述计算机程序被所述处理器执行时,实现如权利要求1-7所述的方法。
9.一种可读存储介质,其特征在于,所述可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时,实现如权利要求1-7所述的方法。
CN202211704973.4A 2022-12-29 2022-12-29 基于ai视觉的认知定位方法 Pending CN116152679A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211704973.4A CN116152679A (zh) 2022-12-29 2022-12-29 基于ai视觉的认知定位方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211704973.4A CN116152679A (zh) 2022-12-29 2022-12-29 基于ai视觉的认知定位方法

Publications (1)

Publication Number Publication Date
CN116152679A true CN116152679A (zh) 2023-05-23

Family

ID=86340021

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211704973.4A Pending CN116152679A (zh) 2022-12-29 2022-12-29 基于ai视觉的认知定位方法

Country Status (1)

Country Link
CN (1) CN116152679A (zh)

Similar Documents

Publication Publication Date Title
WO2021226876A1 (zh) 一种目标检测方法及装置
EP3771198B1 (en) Target tracking method and device, movable platform and storage medium
CN113989450B (zh) 图像处理方法、装置、电子设备和介质
WO2021016854A1 (zh) 一种标定方法、设备、可移动平台及存储介质
CN115063454B (zh) 多目标跟踪匹配方法、装置、终端及存储介质
CN114063098A (zh) 多目标跟踪方法、装置、计算机设备和存储介质
CN116449392B (zh) 一种地图构建方法、装置、计算机设备及存储介质
CN111964680A (zh) 一种巡检机器人的实时定位方法
CN111273701A (zh) 一种云台视觉控制系统以及控制方法
CN111950370A (zh) 动态环境下线拓展视觉里程计方法
CN111179309A (zh) 一种跟踪方法及设备
CN116486290B (zh) 一种无人机监测追踪方法、装置、电子设备及存储介质
CN112686149A (zh) 一种基于视觉的固定翼无人机近地段自主着陆方法
CN116152679A (zh) 基于ai视觉的认知定位方法
CN117347996A (zh) 一种连续雷达区域的目标接力方法、系统及设备
CN113721240B (zh) 一种目标关联方法、装置、电子设备及存储介质
Duan et al. Image digital zoom based single target apriltag recognition algorithm in large scale changes on the distance
CN115993616A (zh) 一种基于异源影像匹配的无人机快速地理定位方法及装置
CN115235478A (zh) 基于视觉标签和激光slam的智能汽车定位方法及系统
CN113763457B (zh) 落差地形的标定方法、装置、电子设备和存储介质
CN116817929B (zh) 一种无人机对地平面多目标同时定位方法及系统
CN113223076B (zh) 车辆与车载摄像头的坐标系标定方法、设备及存储介质
CN117495898A (zh) 无人机目标识别追踪方法、装置、设备及存储介质
CN116129332B (zh) 多船舶目标的跟踪识别方法、装置、电子设备及存储介质
CN118014921A (zh) 一种预检测方法、介质及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination