CN110415256A

CN110415256A - 基于视觉的快速多目标识别方法及系统

Info

Publication number: CN110415256A
Application number: CN201910620506.5A
Authority: CN
Inventors: 吴峰华; 杨哲海; 张玉萍; 王昊
Original assignee: Shenyang City College
Current assignee: Shenyang City College
Priority date: 2019-07-10
Filing date: 2019-07-10
Publication date: 2019-11-05
Anticipated expiration: 2039-07-10
Also published as: CN110415256B

Abstract

本发明提供了基于视觉的快速多目标识别方法及系统，该方法包括：采集原始YUV格式图像；根据设定好的Y、U、V通道的阈值，分别形成白色二值图像和绿色二值图像；继而形成白色积分图和绿色积分图；针对目标物，分别构造形态学类Haar特征滤波器，对白色积分图和绿色积分图进行滤波，得到目标物的候选得分热图；并根据候选区数量设置，选择候选得分热图分数最高的几个点并计算对应位置的目标物尺寸，得到“感兴趣”区域位置和尺寸，再从机器人采集的原始YUV图像相应位置提取相应尺寸的图块作为“感兴趣”区域；基于感兴趣区域进行目标物识别。本发明能够实现准确、快速地识别目标物。

Description

基于视觉的快速多目标识别方法及系统

技术领域

本发明属于机器人视觉识别领域，特别涉及仿人足球机器人快速准确识别球场目标物的方法及其系统。

背景技术

仿人足球机器人是仿照人类身体结构和功能设计的足球运动机器人。该机器人的用途是与人组成球队完成足球比赛、帮助足球爱好者或专业足球运动员实现人员不足情况下的比赛或训练。仿人机器人快速准确识别足球场上的目标物，是其执行足球比赛的先决条件。

常规的基于视觉的目标物识别方法有两大类：一是采用传统的图像处理方法，利用目标物与球场主体颜色差别作为边缘检测依据，勾画出目标物的边界，并认为边界包围区域是目标物。这种方法受光线影响严重，边界常常不准确，导致机器人不能正确识别目标物；二是采用近年流行的基于卷积神经网络的深度学习方法，构建卷积神经网络模型、采集大量带有目标物的图像作为样本，并人工在这些样本上框选和标记出目标物。将原始样本集和对应的人工标记目标物的样本集分别作为卷积神经网络的输入和输出信息，令神经网络进行自学习训练，调整卷积神经网络内部参数。达到一定的训练精度后，再采用另一批样本进行测试。测试精度合格，即可保存卷积神经网络的结构和参数，加载到在线识别系统，用于系统在线识别目标物。这种方法识别目标物的准确率较高，受光线变化影响较小。但缺点是卷积计算量大导致的计算耗时较长、在线识别速度慢，无法适应机器人和目标物位置变化频繁的足球运动；处理样本的过程中，由于样本数量巨大造成人工框选和标记工作量巨大，且极容易产生不确定偏差，影响仿人机器人对目标物的位置判断。

发明内容

本发明的目的在于克服现有技术的不足，提出一种用于仿人足球机器人的快速多目标识别方法及相关系统，避免了传统的图像处理方法识别目标物不准确和受光线变化影响较大的问题，以及深度学习方法计算量过大导致目标识别速度慢、人工标记样本上的目标物的巨大工作量和标记偏差问题。具体而言，本发明提供了以下的技术方案：

一方面，本发明提供了一种基于视觉的快速多目标识别方法，所述方法包括：

S1、采集原始YUV格式图像；

S2、依据预设Y、U、V通道的阈值，形成白色二值图像与绿色二值图像；

S3、基于所述白色二值图像、绿色二值图像，分别获得白色积分图、绿色积分图；

S4、针对不同目标物，分别构造形态学类Haar特征滤波器，对所述白色积分图、绿色基本图进行滤波，得到目标物的候选得分热图；选择的粉土分数最高的若干个点，并计算对应位置的目标物尺寸，得到“感兴趣”区域位置和尺寸，再基于所述原始YUV格式图像，提取所述“感兴趣”区域位置和尺寸的图块，作为“感兴趣”区域Rois；

S5、基于所述“感兴趣”区域Rois，识别目标物。

优选地，当所述目标物为球形时，所述S4进一步包括：设所述原始YUV格式图像中某一点为球心O点，其对应的候选区域，即附图2的ABCD为与O点同心、为边长为2R的正方形，求得球心O点的候选得分S_O：

其中，w_W和w_G分别为白色权重和绿色权重。S_W和S_G分别为白色得分和绿色得分，其中S_W是类Haar特征；R＝k·r，k为候选区尺寸系数，r为原始YUV格式图像采集点处观察到的球形的半径；

将所述球心O点遍历积分图像，计算每个像素点的候选得分S_O，选择得分最高的n个候选区，基于所述原始YUV格式图像，提取所述“感兴趣”区域位置和尺寸的图块，作为“感兴趣”区域Rois。N为大于等于1的自然数，可以依据识别精度等要求进行设置。

优选地，当所述目标物为圆柱时，所述S4进一步包括：设所述原始YUV格式图像中某一点O’为圆柱与绿色草坪的接触线的中心，其对应的候选区域，即附图3的A’B’C’D’为与O’点同心、边长为2R的正方形，O’点的候选得分S_O，为：

其中，Uco和Fco分别为顶部系数和侧方系数，Uco＝A’D’/D’F’；Fco＝a’b’/A’B’，a’b’c’d’为原始YUV格式图像中圆柱位于草坪水平线之上的矩形区域；S₁₂₃₄为由1，2，3，4，1四点围成的区域得分；

将O’点遍历积分图像，计算每个像素点的候选得分值S_O’，选择得分最高的n个候选区，基于所述原始YUV格式图像，提取所述“感兴趣”区域位置和尺寸的图块，作为“感兴趣”区域Rois。

优选地，当所述目标物为罚球点时，所述S4进一步包括：设所述原始YUV格式图像中某一点O”为罚球点的中心，其对应的候选区域，即附图4的A”B”C”D”为与O”点同心、边长为2R的正方形，O”点的候选得分S_O”为：

其中，w′_W和w′_G分别为白色权重和绿色权重；S′_W和S′_G分别为基于形态学类Haar特征的白色得分和绿色得分；

将O”点遍历积分图像，计算每个像素点的候选得分值S_O”，选择得分最高的n个候选区，基于所述原始YUV格式图像，提取所述“感兴趣”区域位置和尺寸的图块，作为“感兴趣”区域Rois。

优选地，所述S_W类Haar特征计算方法如下：

S_W＝(W_abcd+W_dcfe)+(W_abcd-W_hgba)-W_ABCD

其中，W_****为白色区域像素和，下标A、B、C、D为附图2的候选区域为边长为2R的正方形的四个顶点，a、b、f、e为球形外接正方形的四个顶点，c、d分别为bf和ae的中点。

优选地，所述绿色得分S_G计算方法如下：

S_G＝G_ABCD-G_abfe

其中，G_****为绿色区域像素和。

优选地，所述S₁₂₃₄的计算方式为：

其中，I_G*为绿色积分图在*点的数值，I_w*为白色积分图在*点的数值。

优选地，所述S′_W和S′_G的计算方式为：

S′_W＝(W_{a″b″c″d″}-W_{A″E″G″D″})+(W_{a″b″c″d″}-W_{E″B″C″G″})+(W_{a″b″c″d″}-W_{A″B″F″H″})+(W_{a″b″c″d″}-W_{H″F″C″D″})S′_G＝(G_{A″E″G″D″}-G_{A″B″C″D″})+(G_{E″B″C″G″}-W_{A″B″C″D″})+(W_{A″B″F″H″}-W_{A″B″C″D″})+(W_{H″F″C″D″}-W_{A″B″C″D″})

其中，W_****为白色区域像素和，G_****为绿色区域像素和。下标A”、B”、C”、D”为附图4的候选区域为边长为2R的正方形的四个顶点，a”、b”、c”、d”为罚球点十字图案外接正方形的四个顶点，F”、H”分别为B”C”和A”D”的中点。

优选地，所述S5进一步包括：采用卷积神经网络，识别目标物。

此外，本发明还提供了一种基于视觉的快速多目标识别系统，所述系统包括：

图像采集模块，用于采集原始YUV格式图像；

图像处理模块，依据预设Y、U、V通道的阈值，形成白色二值图像与绿色二值图像；基于所述白色二值图像、绿色二值图像，分别获得白色积分图、绿色积分图；

区域划分模块，用于针对不同目标物，分别构造形态学类Haar特征滤波器，对所述白色积分图、绿色基本图进行滤波，得到目标物的候选得分热图；选择候选得分热图分数最高的若干个点，并计算对应位置的目标物尺寸，得到“感兴趣”区域位置和尺寸，再基于所述原始YUV格式图像，提取所述“感兴趣”区域位置和尺寸的图块，作为“感兴趣”区域Rois；

识别模块，基于所述“感兴趣”区域Rois，识别目标物。

本发明具有以下有益效果及优点：

1.能够保证仿人足球机器人即准确又快速地识别赛场上的目标物，包括足球、球门柱和罚球点；

2.针对目标物足球、球门柱和罚球点，自动标记“感兴趣”区域(Rois)，既用于在线识别目标物，又可保存成样本库，供领域专家点选“目标物”和“非目标物”，形成正、负样本集，用于离线训练卷积神经网络模型。避免了人工在海量原始图片上框选目标物的巨大工作量和由此带来的不确定因素；

3.基于形态学类Haar特征构造滤波器，确保自动标记的“感兴趣”区域(Rois)包含真正的目标物的准确位置，有利于仿人机器人对于目标物的定位；

4.针对目标物足球、球门柱和罚球点的“感兴趣”区域，构造轻量级卷积神经网络，用于辨识对应的“感兴趣”区域(Rois)是否为目标物。由于“感兴趣”区域的尺寸远远小于机器人采集的原始图像，因此所构造的轻量级卷积神经网络的卷积计算量远小于利用原始图像进行计算所需的卷积神经网络，从而大大提高了卷积神经网络辨识目标物的速度；

5.本发明设计的仿人足球机器人快速多目标识别方法受光线变化影响较小，保证仿人机器人适用于实际比赛。

附图说明

图1为本发明实施例的算法流程图；

图2为本发明实施例的目标足球的形态学类Haar特征滤波模板；

图3为本发明实施例的目标物球门柱的形态学类Haar特征滤波模板；

图4为本发明实施例的目标物罚球点的形态学类Haar特征滤波模板；

图5a为本发明实施例的仿人机器人采集的原始图像；

图5b为本发明实施例的形成的白色二值图像和绿色二值图像；

图5c为本发明实施例的经过目标物足球的形态学类Haar特征滤波模板滤波生成的热图；

图5d为本发明实施例的为“感兴趣”区域；

图6为本发明实施例的足球、球门柱和罚球点三种目标物同时识别的效果图。

具体实施例

下面将结合本发明实施例中的图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有付出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

本发明的目的在于克服现有技术的不足，提出一种用于机器人的快速多目标识别方法，避免了传统的图像处理方法识别目标物不准确和受光线变化影响较大的问题，以及深度学习方法计算量过大导致目标识别速度慢、人工标记样本上的目标物的巨大工作量和标记偏差问题。

在一个具体的实例中，以仿人足球机器人为例进行说明。需要指出的是，本发明的技术方案同样可以应用于其他需要快速、准确进行目标识别的机器人应用场景之中，不应以足球机器人为限定而理解本发明的实施例。在仿人足球机器人应用场景中，该基于视觉的快速多目标识别方法包括以下步骤：

1)机器人采集原始YUV格式图像；

2)根据设定好的Y、U、V通道的阈值，分别形成白色二值图像和绿色二值图像；

3)利用白色二值图像和绿色二值图像形成白色积分图和绿色积分图；

4)针对目标物足球、球门柱和罚球点，分别构造形态学类Haar特征滤波器，对白色积分图和绿色积分图进行滤波，得到目标物的候选得分热图。并根据候选区数量设置，选择候选得分热图分数最高的几个点并计算对应位置的目标物尺寸，得到感兴趣区域位置和尺寸，再从机器人采集的原始YUV图像相应位置提取相应尺寸的图块作为“感兴趣”区域(Rois)。具体实现过程如下：

①足球Rois自动标记

附图2为假定机器人采集图片上的某一点O为足球的球心。由于机器人本体和相机位置角度均为已知，相机参数固定、足球实际尺寸固定，则该点处的球半径r为已知。球的外接正方形为abfe。该点对应的候选区为边长为2R的正方形ABCD。R＝k·r，k为候选区尺寸系数。通常1≤k≤2。则O点的候选得分S_O如式(1)所示：

其中，w_W和w_G分别为白色权重和绿色权重。S_W和S_G分别为白色得分和绿色得分。S_W类Haar特征计算方法如式(2)所示：

S_W＝(W_abcd+W_dcfe)+(W_abcd-W_hgba)-W_ABCD (2)

其中，W_****为白色区域像素和，计算公式如式(3)所示：

W₁₂₃₄＝(I_W1+I_W3-I_W2-I_W4)/A₁₂₃₄ (3)

其中，A₁₂₃₄为由1，2，3，4，1四点围成的区域面积；I_W*为白色积分图在*点的数值。

(1)式中的绿色得分S_G计算方法如式(4)所示：

S_G＝G_ABCD-G_abfe (4)

其中，G_****为绿色区域像素和，计算公式如式(5)所示：

G₁₂₃₄＝(I_G1+I_G3-I_G2-I_G4)/A₁₂₃₄ (5)

其中，I_G*为绿色积分图在*点的数值。

将O点遍历积分图像，计算每个像素点的候选得分值S_O，根据设定候选区的个数n，选择得分值最高的n个候选区，并在机器人采集原始YUV格式图像的对应位置和尺寸提取出小图块，即“感兴趣”区域(Rois)，输出到足球识别卷积神经网络模型进行辨识。

如果比赛场地采用无影灯，则球的白色得分S_W可以直接用W_ABCD计算。但实际场地光线可视为自上而下的平行光。球的距离稍远时，就会产生“上明下暗”现象。因此，用W_abfe计算的结果往往使球的计算中心偏高，影响球的定位。本技术方案构造的(2)式，第一项将上半部分与下半部分白色得分相加，得到完整圆形得分，但此时圆形中心会偏高；第二项是去掉球的上方部分白色，去除远处场地边界以外的白色影响；第三项在减除Rois区域的白色得分过程中，对于实际足球目标，偏上部分的分数要高于偏下部分，因此从形态学角度能够在一定程度上修正第一项产生的偏差，得到更为合理的球心位置。

②球门柱Rois自动标记

附图3为假定机器人采集图片上的某一点O’为球门柱与绿色草坪的接触线的中心。D’C’线为草坪的边界线。综合考虑球门柱形状特征和与草坪的颜色差异，O’点的候选得分S_o’如式(6)所示：

其中，Uco和Fco分别为顶部系数和侧方系数。Uco＝A’D’/D’F’；Fco＝a’b’/A’B’；S₁₂₃₄为由1，2，3，4，1四点围成的区域得分，计算方法如式(7)所示：

与标记足球的方式相同，将O’点遍历积分图像，计算每个像素点的候选得分值S_O’，根据设定格式选择得分值最高的几个Rois，输出到球门柱识别卷积神经网络模型进行辨识。

③罚球点Rois自动标记

图4为假定机器人采集图片上的某一点O”为罚球点的中心。O”点的候选得分S_O”如式(8)所示：

其中，w′_W和w′_G分别为白色权重和绿色权重。S′_W和S′_G分别为白色得分和绿色得分，基于形态学类Haar特征的计算方法分别如式(9)、(10)所示：

将O”点遍历积分图像，计算每个像素点的候选得分值S_O”，根据设定个数选择得分值最高的几个Rois，输出到罚球点识别卷积神经网络模型进行辨识。

5)在一个优选的实施方式中，可分别为目标物足球、球门柱和罚球点的“感兴趣”区域构造轻量级卷积神经网络，对输入的“感兴趣”区域进行辨识，判断出这些Rois“是目标物”或“非目标物”。

因为“感兴趣”区域的尺寸远小于机器人采集的原始图片尺寸，因此构造的轻量级卷积神经网络计算量显著降低，大大加快卷积计算的速度。这也是本专利的快速识别的主要体现。

6)机器人在线产生的“感兴趣”区域可以存储于目标物样本库，由领域专家离线分选出“正”、“负”样本集。只需要轻松点选即可，避免了人工从海量样本中框选目标物的巨大工作量和由此造成的不确定因素。

7)领域专领域专家分选出的“正”、“负”样本集用于离线训练轻量级卷积神经网络模型，使其达到足够的辨识“目标物”和“非目标物”的精度，并保存神经网络的结构和参数，加载于仿人机器人，用于实际比赛识别目标物。

在又一个具体的实施方式中，本发明还可以以搭载在机器人上的识别系统的方式来实现，该系统在一个优选的实施方式中，可以包括如下结构：

图像采集模块，用于采集原始YUV格式图像；

区域划分模块，用于针对不同目标物，分别构造形态学类Haar特征滤波器，对所述白色积分图、绿色基本图进行滤波，得到目标物的候选得分热图；选择的粉土分数最高的若干个点，并计算对应位置的目标物尺寸，得到感兴趣区域位置和尺寸，再基于所述原始YUV格式图像，提取所述“感兴趣”区域位置和尺寸的图块，作为“感兴趣”区域Rois；

识别模块，基于所述“感兴趣”区域Rois，识别目标物。

该系统，可以执行如上提及的基于视觉的快速多目标识别方法。当然，该系统的结构，可以以其他硬件或者硬件与软件相配合的方式来实现本发明技术方案中所提及的具体方法，而上述的基于本发明技术方案而进行的系统结构的常规调整，均应当视为落入本发明的保护范围之内。

在一个具体的实施场景中，结合图5、6，说明本发明技术方案的实施效果。目标物足球的识别过程如附图5所示，附图5(a)为仿人机器人采集的原始图像；附图5(b)为步骤2)形成的白色二值图像和绿色二值图像；附图5(c)为经过目标物足球的形态学类Haar特征滤波模板滤波生成的热图；附图5(d)为“感兴趣”区域，其中绿色框的“感兴趣”区域为经过足球“感兴趣”区域轻量级神经网络辨识到的目标物。

足球、球门柱和罚球点三种目标物同时识别的效果如附图6所示。

本发明的快速多目标识别方法在仿人机器人的CPU内核的主机硬件平台运行，能够在0.03秒内对目标物足球、球门柱和罚球点的识别率分别达到95.8％、96.2％和96.0％。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的程序可存储于一计算机可读取存储介质中，该程序在执行时，可包括如上述各方法的实施例的流程。其中，所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory，ROM)或随机存储记忆体(Random AccessMemory，RAM)等。

最后应说明的是：以上实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明实施例技术方案的精神和范围。

Claims

1.基于视觉的快速多目标识别方法，其特征在于，所述方法包括：

S1、采集原始YUV格式图像；

S5、基于所述“感兴趣”区域Rois，识别目标物。

2.根据权利要求1所述的方法，其特征在于，当所述目标物为球形时，所述S4进一步包括：设所述原始YUV格式图像中某一点为球心O点，其对应的候选区域ABCD为与O点同心、边长为2R的正方形,求得球心O点的候选得分S_O：

将所述球心O点遍历积分图像，计算每个像素点的候选得分S_O，选择得分最高的n个候选区，基于所述原始YUV格式图像，提取所述“感兴趣”区域位置和尺寸的图块，作为“感兴趣”区域Rois。

3.根据权利要求1所述的方法，其特征在于，当所述目标物为圆柱时，所述S4进一步包括：设所述原始YUV格式图像中某一点O’为圆柱与绿色草坪的接触线的中心，其对应的候选区域A’B’C’D’为与O’点同心、边长为2R的正方形，O’点的候选得分S_O’为：

其中，Uco和Fco分别为顶部系数和侧方系数，Uco＝A’D’/D’F’；Fco＝a’b’/A’B’，a’b’c’d’为原始YUV格式图像中圆柱位于草坪水平线之上的矩形区域；S₁₂₃₄为由1,2,3,4,1四点围成的区域得分；R＝k·r，k为候选区尺寸系数，r为原始YUV格式图像采集点处观察到的球星的半径；

4.根据权利要求1所述的方法，其特征在于，当所述目标物为罚球点时，所述S4进一步包括：设所述原始YUV格式图像中某一点O”为罚球点的中心，其对应的候选区域A”B”C”D”为与O”点同心、边长为2R的正方形，O”点的候选得分S_O”为：

其中，w′_W和w′_G分别为白色权重和绿色权重；S′_W和S′_G分别为基于形态学类Haar特征的白色得分和绿色得分；R＝k·r，k为候选区尺寸系数，r为原始YUV格式图像采集点处观察到的球星的半径；

5.根据权利要求2所述的方法，其特征在于，所述S_W类Haar特征计算方法如下：

S_W＝(W_abcd+W_dcfe)+(W_abcd-W_hgba)-W_ABCD

其中，W_****为白色区域像素和，下标A、B、C、D为候选区域为边长为2R的正方形的四个顶点，a、b、f、e为球形外接正方形的四个顶点，c、d分别为bf和ae的中点。

6.根据权利要求2所述的方法，其特征在于，所述绿色得分S_G计算方法如下：

S_G＝G_ABCD-G_abfe

其中，G_****为绿色区域像素和。

7.根据权利要求3所述的方法，其特征在于，所述S₁₂₃₄的计算方式为：

其中，为绿色积分图在*点的数值，为白色积分图在*点的数值。

8.根据权利要求4所述的方法，其特征在于，所述S′_W和S′_G的计算方式为：

S'_W＝(W_a"b"c"d"-W_A"E"G"D")+(W_a"b"c"d"-W_E"B"C"G")+(W_a"b"c"d"-W_A"B"F"H")+(W_a"b"c"d"-W_H"F"C"D")

S'_G＝(G_A"E"G"D"-G_A"B"C"D")+(G_E"B"C"G"-W_A"B"C"D")+(W_A"B"F"H"-W_A"B"C"D")+(W_H"F"C"D"-W_A"B"C"D")

其中，W_****为白色区域像素和，G_****为绿色区域像素和；下标A”、B”、C”、D”为候选区域正方形的四个顶点，a”、b”、c”、d”为罚球点十字图案外接正方形的四个顶点，F”、H”分别为B”C”和A”D”的中点。

9.根据权利要求1所述的方法，其特征在于，所述S5进一步包括：采用卷积神经网络，识别目标物。

10.基于视觉的快速多目标识别系统，其特征在于，所述系统包括：

图像采集模块，用于采集原始YUV格式图像；

区域划分模块，用于针对不同目标物，分别构造形态学类Haar特征滤波器，对所述白色积分图、绿色基本图进行滤波，得到目标物的候选得分热图；选择候选得分热图分数最高的若干个点，并计算对应位置的目标物尺寸，得到感兴趣区域位置和尺寸，再基于所述原始YUV格式图像，提取所述“感兴趣”区域位置和尺寸的图块，作为“感兴趣”区域Rois；

识别模块，基于所述“感兴趣”区域Rois，识别目标物。