CN113673479A

CN113673479A - 基于视觉关注点识别物体的方法

Info

Publication number: CN113673479A
Application number: CN202111031189.7A
Authority: CN
Inventors: 冯志全
Original assignee: University of Jinan
Current assignee: University of Jinan
Priority date: 2021-09-03
Filing date: 2021-09-03
Publication date: 2021-11-19

Abstract

本发明提供了一种基于视觉关注点识别物体的方法，所述的方法包括：S1：采用眼动仪设备获取人眼视线方向向量(a,b,c)；S2：计算视线方向向量(a,b,c)在场景图像中的位置P(x,y)；S3：把P点周围的局部图像IM进行放大；S4：在IM的所有原始子图像中发现识别对象。本发明结合视觉关注技术和人工智能技术，解决在人机交互、智能监控与行为评价等应用系统中场景物体的识别率问题。

Description

基于视觉关注点识别物体的方法

技术领域

本发明涉及VR/AR技术领域，具体涉及基于视觉关注点识别物体的方法。

背景技术

在VR/AR系统中，操作者识别物体的方式，完全取决于操作者的视角，而操作者的视角等同于摄像头的视角，操作者离物体的距离越远，摄像头的视角范围就越大，视角范围内的可识别物体就会越多，这就导致当操作者远离识别物体时，无法精准识别场景中的物体。

现有技术中，对于上述远距离物体的识别，一般采用以下两种方式：

1)将视角范围内的全部物体显示出来，由操作者进行手动选择；

2)不显示距离过远的物体，操作者只能主动靠近识别物体后才能识别。

上述两种方式，均不能直接读取操作者的识别意图，将识别物体直接标注出来。

发明内容

为了解决上述问题，本申请提供了AR系统中增强呈现方式的方法，通过视线方向向量获取人对交互场景中的关注点，再将该关注点所在的局部图像放大进行识别。本发明公开了如下技术方案：

本发明实施例提供了基于视觉关注点识别物体的方法，所述的方法包括：

S1：获取人眼视线方向向量(a,b,c)；

S2：计算视线方向向量(a,b,c)在场景图像中的位置P(x,y)；

S3：把P点周围的局部图像IM进行放大；

S4：在IM的所有原始子图像中发现识别对象。

进一步的，步骤S2的具体实现过程为：

构建视线方向向量(a,b,c)在场景图像中位置的映射关系；

分别计算x、y的坐标。

进一步的，采用眼动仪设备或者现有公知的眼球视线跟踪方法来获取人眼视线方向向量。

进一步的，视线方向向量(a,b,c)在场景图像中位置的映射关系为：

其中，f_x、f_y分别表示场景摄像机沿水平和垂直方向的焦距，m、n分别表示场景摄像机沿水平和垂直方向的偏移量,R是相机的旋转矩阵，t是相机的平移向量，T代表转置矩阵。f_x、f_y、m、n是场景摄像机的内部参数，R、t是场景摄像机的外部参数，可以通过张正友相机标定方法获取摄像机的内部参数和外部参数。

进一步的，x、y的坐标为：

进一步的，步骤S3的具体实现方法为：

把场景图像分为M×N个子图像块；

依次选取P所在图像块的8k(k＝1,2,…)邻域作为原始子图像进行缩放。

进一步，步骤S4中发现识别对象的原理为：对IM的所有原始子图像采用深度卷积神经网络进行训练，对原始子图像中感兴趣的对象进行识别。

本发明的有益效果：

相比于现有技术中不能识别或识别对象过多的问题，本申请可以将视角方向的关注点直接转换为场景图像中的位置坐标，将视角变成视点，实现对物体的精准定位，对于识别对象与操作者距离过远的问题，本申请可以将视点周围的局部图像IM进行放大，从放大的图像中精准获取识别对象。

附图说明

图1为本发明方法实施例的流程图。

具体实施方式

为使本发明要解决的技术问题、技术方案和优点更加清楚，下面将结合附图及具体实施例进行详细描述。本领域技术人员应当知晓，下述具体实施例或具体实施方式，是本发明为进一步解释具体的发明内容而列举的一系列优化的设置方式，而该些设置方式之间均是可以相互结合或者相互关联使用的，除非在本发明明确提出了其中某些或某一具体实施例或实施方式无法与其他的实施例或实施方式进行关联设置或共同使用。同时，下述的具体实施例或实施方式仅作为最优化的设置方式，而不作为限定本发明的保护范围的理解。

如图1所示，本发明实施例提供了基于视觉关注点识别物体的方法，所述的方法包括以下步骤：

1)采用眼动仪设备获取人眼视线方向向量(a,b,c)。

该步骤具体操作时，可以在室内设置一个固定摄像机获取场景图像；在戴在头上的支架上设置一个微型摄像机获取眼动数据，采用公知的视线跟踪软件或方法获取人眼视线方向向量。

2)计算视线方向向量(a,b,c)在场景图像中的位置P(x,y)。

为了实现P(x,y)的计算，首先要构建视线方向向量(a,b,c)在场景图像中位置的映射关系为：

然后，分别计算x、y的坐标为：

3)把P点周围的局部图像IM进行放大。

对于图像的放大处理，一种优选的实现方法为：

把场景图像分为M×N个子图像块；

4)在IM的所有原始子图像中发现识别对象。

结合人工智能技术发现识别对象的原理为：对IM的所有原始子图像采用深度卷积神经网络进行训练，对原始子图像中感兴趣的对象进行识别。

例如，可以把场景图像分为25×25的子块，采用8邻域生成原始子图像，利用目标检测深度学习卷积神经网络(CNN)Yolov5对原始子图像分别放大到5倍、20倍进行训练，构建识别模型。

以上为本申请实现的技术原理，在具体操作时，可以利用场景摄像机和人眼摄像机分别获取人操作的场景图像和人眼图像等信息，摄像机数据通过有线或无线(云处理)方式传输到计算设备进行实时处理。

场景摄像机既可以设置于支架上，也可以固定于实验场景中，还可以将人眼摄像机和场景摄像机布置在一个环形支架上，该环形支架可以戴在额头上。

应当指出，以上所述具体实施方式可以使本领域的技术人员更全面地理解本发明的具体结构，但不以任何方式限制本发明创造。因此，尽管说明书及附图和实施例对本发明创造已进行了详细的说明，但是，本领域技术人员应当理解，仍然可以对本发明创造进行修改或者等同替换；而一切不脱离本发明创造的精神和范围的技术方案及其改进，其均涵盖在本发明创造专利的保护范围当中。

Claims

1.基于视觉关注点识别物体的方法，其特征在于，所述的方法包括：

S1：获取人眼视线方向向量(a,b,c)；

S2：计算视线方向向量(a,b,c)在场景图像中的位置P(x,y)；

S3：把P点周围的局部图像IM进行放大；

S4：在IM的所有原始子图像中发现识别对象。

2.根据权利要求1所述的基于视觉关注点识别物体的方法，其特征在于，步骤S2的具体实现过程为：

构建视线方向向量(a,b,c)在场景图像中位置的映射关系；

分别计算x、y的坐标。

3.根据权利要求1所述的基于视觉关注点识别物体的方法，其特征在于，采用眼动仪设备获取人眼视线方向向量。

4.根据权利要求1所述的基于视觉关注点识别物体的方法，其特征在于，采用现有公知的眼球视线跟踪方法获取人眼视线方向向量。

5.根据权利要求2所述的基于视觉关注点识别物体的方法，其特征在于，视线方向向量(a,b,c)在场景图像中位置的映射关系为：

其中，f_x、f_y分别表示场景摄像机沿水平和垂直方向的焦距，m、n分别表示场景摄像机沿水平和垂直方向的偏移量,R是相机的旋转矩阵，t是相机的平移向量，T代表转置矩阵。

6.根据权利要求5所述的基于视觉关注点识别物体的方法，其特征在于，x、y的坐标为：

7.根据权利要求1所述的基于视觉关注点识别物体的方法，其特征在于，步骤S3的具体实现方法为：

把场景图像分为M×N个子图像块；

8.根据权利要求1所述的基于视觉关注点识别物体的方法，其特征在于，步骤S4中发现识别对象的原理为：对IM的所有原始子图像采用深度卷积神经网络进行训练，对原始子图像中感兴趣的对象进行识别。