CN116152679A

CN116152679A - 基于ai视觉的认知定位方法

Info

Publication number: CN116152679A
Application number: CN202211704973.4A
Authority: CN
Inventors: 封晨; 杨琳; 王鹏飞; 武欣桐; 吕晓钢; 王通宇; 孙冠群; 杨文�
Original assignee: Tianjin Optical Electrical Communication Technology Co Ltd
Current assignee: Tianjin Optical Electrical Communication Technology Co Ltd
Priority date: 2022-12-29
Filing date: 2022-12-29
Publication date: 2023-05-23

Abstract

本发明提供了一种基于AI视觉的认知定位方法，包括如下步骤：S1、对机载摄像机拍摄图像进行目标识别，并将输出信息转换至以图像中心为原点的归一化坐标系；S2、计算所述归一化坐标系预测框的相应坐标，并根据图像的原始尺寸放大坐标，得到图像坐标系中的角点坐标；S3、增加坐标维度，将图像坐标点转化至摄像机坐标系；S4、将所述摄像机坐标系再转换至载机机体坐标系；S5、将所述载机机体坐标系转换到地理坐标系，完成对目标的定位。该方法通过人工智能算法识别图像中的目标，成本低，识别准确度高。

Description

基于AI视觉的认知定位方法

技术领域

本发明涉及视觉定位和目标检测技术领域，具体涉及一种基于AI视觉的认知定位方法、电子设备和可读存储介质。

背景技术

电子侦察领域对目标的定位一直是研究的重点问题。目前成熟的定位的方法主要有雷达定位和卫星定位，但这两种定位方法容易受到电磁波的干扰，而且成本相对较高。无源定位主要依靠目标辐射的电磁波信号进行分析处理，但需要多个观测站的数据协同处理。

因此，有必要提供一种新的目标识别定位方法，降低目标定位的成本。

发明内容

解决的技术问题

针对现有技术所存在的上述缺点，本发明提供了一种基于AI视觉的认知定位方法，该方法通过人工智能算法识别图像中的目标，成本低，识别准确度高。

技术方案

为实现以上目的，本发明通过以下技术方案予以实现：

本发明提供了一种基于AI视觉的认知定位方法，包括如下步骤：

S1、对机载摄像机拍摄图像进行目标识别，并将输出信息转换至以图像中心为原点的归一化坐标系；

S2、计算所述归一化坐标系预测框的相应坐标，并根据图像的原始尺寸放大坐标，得到图像坐标系中的角点坐标；

S3、增加坐标维度，将图像坐标点转化至摄像机坐标系；

S4、将所述摄像机坐标系再转换至载机机体坐标系；

S5、将所述载机机体坐标系转换到地理坐标系，完成对目标的定位。

进一步地，所述基于AI视觉的认知定位方法以YOLO v4目标检测算法为基础，对机载摄像机拍摄图像进行目标识别。

进一步地，按下式将YOLO v4目标检测算法的输出信息转换至以图像中心为原点的归一化坐标系：

其中，x_i,y_i是YOLO网络预测框的中心坐标，w_i,h_i分别是预测框的宽度和高度值。

进一步地，根据下式计算所述归一化坐标系预测框的相应坐标：

进一步地，根据图像的原始尺寸对所述归一化坐标系预测框的相应坐标进行放大，得到图像坐标系中的角点坐标如下：

然后将图像坐标点转化至摄像机坐标系[x_s,y_s,z_s]。

进一步地，将所述摄像机坐标系[x_s,y_s,z_s]按照下式转换至载机机体坐标系：

(x_a,y_a,z_a)^T＝Q₂Q₁(x_s,y_s,z_s)^T

其中，α,β为摄像机方位角和高低角。

进一步地，将所述载机机体坐标系按照下式转换到地理坐标系：

(x_g,y_g,z_g)^T＝Q₅Q₄Q₃(x_a,y_a,z_a)^T

其中，ψ,θ,

分别为无人机的航偏角、俯仰角和横滚角。

基于同一发明构想，本发明还提供了一种电子设备，包括处理器和存储器，所述存储器上存储有计算机程序，所述计算机程序被所述处理器执行时，实现上述任一项所述的方法。

基于同一发明构想，本发明还提供了一种可读存储介质，所述可读存储介质内存储有计算机程序，所述计算机程序被处理器执行时，实现上述任一项所述的方法。

有益效果

本发明设计了一种基于AI视觉的认知定位方法，将AI视觉与定位技术相结合，利用无人平台(无人机)获取到目标的视觉信息，通过人工智能算法识别图像中的目标，并根据视觉成像原理对目标的图像位置与实际空间位置进行坐标转换，进而换算出目标的地理位置信息，通过矩阵转换获得较为准确的目标位置，成本低廉。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍。显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明一实施例提供的基于AI视觉的认知定位方法步骤示意图；

图2为本发明一实施例提供的基于AI视觉的认知定位方法流程示意图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述。显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

参阅图1，本发明一实施例提供了一种基于AI视觉的认知定位方法，包括如下步骤：

S3、增加坐标维度，将图像坐标点转化至摄像机坐标系；

S4、将所述摄像机坐标系再转换至载机机体坐标系；

具体实施的时候，首先对拍摄图像内目标进行准确识别；再根据拍摄图像中像点在像片坐标系中的位置，算出像点在摄像机坐标系中的坐标；然后根据摄像机坐标系与载机机体坐标系间的关系，计算它们之间的转换矩阵，求解像点在载机机体坐标系中的坐标；再根据载机机体坐标系与载机地理坐标系间的转换关系，求解出像点在载机地理坐标系中的坐标；最后再根据像点与目标点之间的几何关系，求解出目标在地面坐标系中的坐标，完成对目标的定位。本发明是通过将AI视觉与定位技术相结合，利用基于矩阵的坐标转换关系实现目标位置信息的有效提取。

在本实施例中，参阅图2,首先以YOLO v4目标检测算法为基础，对图像目标进行识别，并针对遥感图像的特征和定位算法的需求对其训练过程进行了优化，对其输出参数进行了修改，以实现对目标的自动检测及后续的定位实现。按下式将YOLO的输出信息转换至以图像中心为原点的归一化坐标系：

然后计算该坐标系预测框的相应坐标。

最后，根据图像的原始尺寸对坐标进行放大，得到图像坐标系中的角点坐标。

将图像坐标点转化至摄像机坐标系，由于相片坐标系和摄像系是平行的，因此目标中心在摄像机坐标系中的坐标仅需添加相机z轴坐标，即[x_s,y_s,z_s]。

再将摄像机坐标系在转换至载机机体坐标系。

(x_a,y_a,z_a)^T＝Q₂Q₁(x_s,y_s,z_s)^T

其中，α,β为摄像机方位角和高低角。

最后将载机机体坐标系转换到地理坐标系：

(x_g,y_g,z_g)^T＝Q₅Q₄Q₃(x_a,y_a,z_a)^T

其中，ψ,θ,

分别为无人机的航偏角、俯仰角和横滚角。

具体而言，本发明提出一种基于AI视觉的认知定位方法，通过无人平台(无人机)获取到目标的视觉信息，通过人工智能算法识别图像中的目标，并根据视觉成像原理对目标的图像位置与实际空间位置进行坐标转换，进而换算出目标的地理位置信息。本发明提出算法的具体的过程是：首先对拍摄图像内目标进行准确识别；再根据拍摄图像中像点在像片坐标系中的位置，算出像点在摄像机坐标系中的坐标；然后根据摄像机坐标系与载机机体坐标系间的关系，计算它们之间的转换矩阵，求解像点在载机机体坐标系中的坐标；再根据载机机体坐标系与载机地理坐标系间的转换关系，求解出像点在载机地理坐标系中的坐标；最后再根据像点与目标点之间的几何关系，求解出目标在地面坐标系中的坐标，完成对目标的定位。目标定位的实质是解决不同坐标系之间的矩阵转换问题。

在本实施例中，YOLO-v4算法是在原有YOLO目标检测架构的基础上，采用了近些年CNN领域中最优秀的优化策略，从数据处理、主干网络、网络训练、激活函数、损失函数等各个方面都有着不同程度的优化，虽没有理论上的创新，但是会受到许许多多的工程师的欢迎，各种优化算法的尝试。文章如同于目标检测的trick综述，效果达到了实现FPS与Precision平衡的目标检测。

基于同一发明构想，本发明还提供了一种电子设备，包括处理器和存储器，所述存储器上存储有计算机程序，所述计算机程序被所述处理器执行时，实现所述基于AI视觉的认知定位方法。

所述处理器在一些实施例中可以是中央处理器(Central Processing Unit，CPU)、控制器、微控制器、微处理器(例如GPU(Graphics Processing Unit-图形处理器))、或其他数据处理芯片。该处理器通常用于控制所述电子设备的总体操作。本实施例中，所述处理器用于运行所述存储器中存储的程序代码或者处理数据，例如运行所述基于AI视觉的认知定位方法的程序代码。

所述存储器至少包括一种类型的可读存储介质，所述可读存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如，SD或DX存储器等)、随机访问存储器(RAM)、静态随机访问存储器(SRAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、可编程只读存储器(PROM)、磁性存储器、磁盘、光盘等。在一些实施例中，所述存储器可以是所述电子设备的内部存储单元，例如该电子设备的硬盘或内存。在另一些实施例中，所述存储器也可以是所述电子设备的外部存储设备，例如该电子设备上配备的插接式硬盘，智能存储卡(SmartMedia Card,SMC)，安全数字(Secure Digital,SD)卡，闪存卡(Flash Card)等。当然，所述存储器还可以既包括所述电子设备的内部存储单元也包括其外部存储设备。本实施例中，所述存储器通常用于存储安装于所述电子设备的操作方法和各类应用软件，例如所述基于AI视觉的认知定位方法的程序代码等。此外，所述存储器还可以用于暂时地存储已经输出或者将要输出的各类数据。

基于同一发明构想，本发明还提供一种可读存储介质，所述可读存储介质内存储有计算机程序，所述计算机程序被处理器执行时，实现所述基于AI视觉的认知定位方法。

本发明的优点在于设计了一种基于AI视觉的认知定位方法，将AI视觉与定位技术相结合，利用无人平台(无人机)获取到目标的视觉信息，通过人工智能算法识别图像中的目标，并根据视觉成像原理对目标的图像位置与实际空间位置进行坐标转换，进而换算出目标的地理位置信息，通过矩阵转换获得较为准确的目标位置，成本低廉。

以上实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不会使相应技术方案的本质脱离本发明各实施例技术方案的保护范围。