CN108230328B

CN108230328B - 获取目标对象的方法、装置和机器人

Info

Publication number: CN108230328B
Application number: CN201611199672.5A
Authority: CN
Inventors: 不公告发明人
Original assignee: Xinyi Avatar Intelligent Technology Co Ltd
Current assignee: Xinyi avatar Intelligent Technology Co., Ltd
Priority date: 2016-12-22
Filing date: 2016-12-22
Publication date: 2021-10-22
Anticipated expiration: 2036-12-22
Also published as: US11127151B2; JP2020502705A; KR102293163B1; EP3531374A4; US20190311491A1; CN108230328A; WO2018113259A1; KR20190099259A; EP3531374A1; JP6810813B2

Abstract

本发明公开了一种获取目标对象的方法、装置和机器人。其中，该方法包括：获取视频图像中的多帧连续图像，其中，每帧图像包括第一目标对象；根据包括第一目标对象的连续图像获取去除背景的第一目标图像；根据第一目标图像的第一中心点至共同边界的距离获取第二目标对象处于第一目标图像中的位置，其中，第一中心点根据第二目标对象的颜色确定，共同边界为第二目标对象与第一目标对象重合的边界，第二目标对象包含于第一目标对象；根据第二目标对象处于第一目标图像中的位置提取第二目标对象。本发明解决了现有技术中收集的图像中包括与目标对象相似的内容，导致后续处理过程复杂的技术问题。

Description

获取目标对象的方法、装置和机器人

技术领域

本发明涉及图像处理领域，具体而言，涉及一种获取目标对象的方法、装置和机器人。

背景技术

为了研究人工智能/深度学习/手势识别，我们需要大量不同手掌的图片，除了保存图片外，还要记录手掌的x轴坐标/y轴坐标/宽度/高度。而且是不同的人的手掌的形状和姿势，但目前通常采用对手掌进行拍照的方式获取不同手掌在不同动作时的图像，没有连贯性，手机图片的速度较慢，且收集的图片中包含不需要的手臂部分。

针对现有技术中收集的图像中包括与目标对象相似的内容，导致后续处理过程复杂的问题，目前尚未提出有效的解决方案。

发明内容

本发明实施例提供了一种获取目标对象的方法、装置和机器人，以至少解决现有技术中收集的图像中包括与目标对象相似的内容，导致后续处理过程复杂的技术问题。

根据本发明实施例的一个方面，提供了一种获取目标对象的方法，包括：获取视频图像中的多帧连续图像，其中，每帧图像包括第一目标对象；根据包括第一目标对象的连续图像获取去除背景的第一目标图像；根据第一目标图像的第一中心点至共同边界的距离获取第二目标对象处于第一目标图像中的位置，其中，第一中心点根据第二目标对象的颜色确定，共同边界为第二目标对象与第一目标对象重合的边界，第二目标对象包含于第一目标对象；根据第二目标对象处于第一目标图像中的位置提取第二目标对象。

根据本发明实施例的另一方面，还提供了一种获取目标对象的装置，包括：第一获取模块，用于获取视频图像中的多帧连续图像，其中，每帧图像包括第一目标对象；第二获取模块，用于根据包括第一目标对象的连续图像获取去除背景的第一目标图像；第三获取模块，用于根据第一目标图像的第一中心点至共同边界的距离获取第二目标对象处于第一目标图像中的位置，其中，第一中心点根据第二目标对象的颜色确定，共同边界为第二目标对象与第一目标对象重合的边界，第二目标对象包含于第一目标对象；提取模块，用于根据第二目标对象处于第一目标图像中的位置提取第二目标对象。

根据本发明实施例的另一方面，还提供了一种获取目标对象的装置，包括任意一种获取目标对象的装置。

在本发明实施例中，案获取视频图像中多帧包括第一目标对象的连续图像，根据包括第一目标对象的连续图像获取去除背景的第一目标图像，根据第一目标图像的第一中心点至共同边界的距离获取第二目标对象处于第一目标图像中的位置，根据第二目标对象处于第一目标图像中的位置提取第二目标对象。上述方案跟踪视频图像中的动态图像，并收集去除背景的第一目标图像，从而达到了快速收集目标图像的效果，并根据第一中心点和第一目标对象以及第二目标对象的共同边界确定第二目标对象的位置，使得能够从原图像中提取出第二目标对象，从而解决了现有技术中收集的图像中包括与目标对象相似的内容，导致后续处理过程复杂的技术问题。

附图说明

此处所说明的附图用来提供对本发明的进一步理解，构成本申请的一部分，本发明的示意性实施例及其说明用于解释本发明，并不构成对本发明的不当限定。在附图中：

图1是根据本发明实施例的获取目标对象的方法的流程图；

图2是根据本发明实施例的一种获取视频中包括第一目标对象的连续图像；

图3是根据本发明实施例的一种可选的去除背景的第一目标图像的示意图；

图4是根据本发明实施例的一种可选的权重分布图的示意图；

图5是根据本发明实施例的一种可选的确定权重值分布图中权重值的最大的点的示意图；

图6是根据本发明实施例的一种可选的扩张方圈的示意图；

图7是根据本发明实施例的一种可选的收缩方圈的示意图；

图8是根据本发明实施例的一种可选的将方圈确定的范围内的颜色值清零的示意图；

图9是根据本发明实施例的一种可选的得到的多个方圈的示意图；

图10是根据本发明实施例的一种可选的获取去除背景的手时取点的示意图；

图11是根据本发明实施例的一种确定目标上下限的示意图；以及

图12是根据本发明实施例的一种可选的获取目标对象的装置的示意图。

具体实施方式

为了使本技术领域的人员更好地理解本发明方案，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分的实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都应当属于本发明保护的范围。

需要说明的是，本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外，术语“包括”和“具有”以及他们的任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

实施例1

根据本发明实施例，提供了一种获取目标对象的方法的实施例，需要说明的是，在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行，并且，虽然在流程图中示出了逻辑顺序，但是在某些情况下，可以以不同于此处的顺序执行所示出或描述的步骤。

图1是根据本发明实施例的获取目标对象的方法的流程图，如图1所示，该方法包括如下步骤：

步骤S102，获取视频图像中的多帧连续图像，其中，每帧图像包括第一目标对象。

具体的，上述连续图像可以是视频中的图像，例如，用户在摄像头前动作，摄像头记录用户动作的视频，该视频则记录了包括用户的连续图像。图2是根据本发明实施例的一种获取视频中包括第一目标对象的连续图像，在该示例中，连续图像为用户在摄像头前挥手构成的图像，第一目标对象为用户出现在图像中的部分。

步骤S104，根据包括第一目标对象的连续图像获取去除背景的第一目标图像。

在一种可选的实施例中，该实施例获取用户在摄像头前摆动手臂的图像，以用户出现在图像中的部分作为中的第一目标对象，去除背景后得到第一目标图像，具体可如图3所示。

步骤S106，根据第一目标图像的第一中心点至共同边界的距离获取第二目标对象处于第一目标图像中的位置，其中，第一中心点根据第二目标对象的颜色确定，其中，共同边界为第二目标对象与第一目标对象重合的边界，第二目标对象包含于第一目标对象。

在一种可选的实施例中，仍以图3为例，在该示例中，第一目标对象仍为用户出现在图像中的部分，第二对象仅为图像中手掌部分，第一目标对象和第二目标对象的共同边界为手掌的边界，第一中心点可以根据第二目标对象的颜色来确定，然后根据第一中心点距离手掌边界的距离来估算手掌的范围，从而划定手掌在第一目标图像中的位置。

步骤S108，根据第二目标对象处于第一目标图像中的位置提取第二目标对象。

在确定了第二目标对象在第一目标对象图像中的位置后，可以截取第二目标对象从而获取到第二目标对象。

在一种可选的实施例中，将摄像头获取用户在摄像头前挥手的视频并转入Matlab，再跟踪视频中移动的物件(该示例中移动端物件为手)，之后将与手的颜色及与手颜色相近的颜色记录下来，并保存手的部份放入图片之内，去除手以外的部分(例如：手臂)。

由上可知，本申请上述方案获取视频图像中多帧包括第一目标对象的连续图像，根据包括第一目标对象的连续图像获取去除背景的第一目标图像，根据第一目标图像的第一中心点至共同边界的距离获取第二目标对象处于第一目标图像中的位置，根据第二目标对象处于第一目标图像中的位置提取第二目标对象。上述方案跟踪视频图像中的动态图像，并收集去除背景的第一目标图像，从而达到了快速收集目标图像的效果，并根据第一中心点和第一目标对象以及第二目标对象的共同边界确定第二目标对象的位置，使得能够从原图像中提取出第二目标对象，从而解决了现有技术中收集的图像中包括与目标对象相似的内容，导致后续处理过程复杂的技术问题。

可选的，根据本申请上述实施例，步骤S104，根据包括第一目标对象的连续图像获取去除背景的第一目标图像，包括：

步骤S1041，根据当前帧图像中第一目标对象的颜色值在多帧连续图像中的权重值得到当前帧图像的权重值分布图像，其中，权重值用于表征第一目标对象的颜色值占当前帧图像中所有颜色值的权重值。

具体的，由于权重分布图用于确定第一目标对象在图像中的权重，因此背景图像的权重几乎为零，而第一目标对象的权重在图中较大，因此可以通过权重分布图得到去除背景的第一目标图像。在一种可选的实施例中，图4是根据本发明实施例的一种可选的权重分布图的示意图，第一目标对象的轮廓具有较大的权重，而且其余位置的权重较小，或为零。

步骤S1043，在权重值分布图像中确定包括第一目标对象的方圈。

具体的，上述方圈用于确定第一目标对象在图像中的具体位置。

步骤S1045，根据第一目标对象的方圈获取去除背景的第一目标图像。

由于方圈指示了第一目标对象的位置，因此去除方圈外的图像，则得到去除背景的第一目标图像。

由上可知，根据本申请上述步骤能够从视频的连续图像中快速的得到了去除背景的第一目标对象，解决了收集图像速度慢的技术问题，从而达到了快速收集图像的技术效果。

可选的，根据本申请上述实施例，步骤S1041，根据当前帧图像中第一目标对象的颜色值在多帧连续图像中的权重值得到图像的权重值分布图像，包括：

步骤S10411，获取第一目标对象的颜色值在多帧图像中的权重值。

步骤S10413，对第一目标对象的颜色值在多帧图像中的权重值进行混合和过滤，得到当前帧图像的权重值分布图。

可选的，根据本申请上述实施例，步骤S10411，获取第一目标对象的颜色值在多帧图像中的权重值的步骤包括：

步骤S10411a，保存获取的第一张包括第一目标对象的图像，并根据第一张包括第一目标对象的图像获取第一目标对象的背景图像和梯度背景图像。

在该步骤之前，为了简化计算过程，还可以更改视频的颜色值，由256色变成256/step色(如64色)，将颜色差量值减少，以方便比较不同影片的颜色差值。

具体的，保存连续图像中第一张帧的资料，以便计算比较用的图像。

在一种可选的实施例中，仍以用户在摄像头前挥动手臂获取的图像为例，可以通过如下方式计算第一目标对象的背景图像和梯度背景图像。

生成一个背景图像，在保存第一张图像之后，每获得一张新图时，更新背景图像：

在该示例中，rate用于表示当前图像与上一张图像的变化率，本方法中将rate设定为0.9。

由于要计算梯度(gradient)差，所以同时生成一个梯度背景图像文件，梯度背景文件的计算方法为：

其中，保存楼梯背景图像文件一开始为第一张图像的梯度，之后每获得一张新图时，就将背景梯度图像文件更新为：

其中，仍取rate为0.9。

步骤S10411b，通过当前帧图像的颜色值减去上一帧图像的背景图像得到第一权重值。

在一种可选的实施例中，仍在上述示例中，首先输入最新一帧的图像。将新帧减去之前得到的楼梯图像文件的绝对值，成为第一个权重值。

步骤S10411c，通过当前帧图像的颜色值减去上一帧图像的梯度背景图像得到第二权重值。

在一种可选的实施例中，仍在上述示例中，计算当前帧图像的颜色值减上一帧的背景图像的梯度，得到第二个权重值。

步骤S10411d，通过当前帧图像的颜色梯度值减去上一帧图像的背景图像得到第三权重值。

在一种可选的实施例中，仍在上述示例中，计算当前帧图像的颜色值减上一帧的梯度背景图像，得到第三个权重值。

步骤S10411e，通过当前帧图像的颜色值减去上一帧图像的背景图像的梯度中的预设梯度，得到第四权重值。

在一种可选的实施例中，仍在上述示例中，预设梯度可以是背景图像中梯度较大的前10％的梯度，例如，将当前帧图像的颜色值减上一帧图像的背景图像的梯度值由大至小排列，提取其中较大的10％-15％，其他清零。

步骤S10411f，通过当前帧图像的颜色值减去第一目标对象的主颜色值，得到第五权重值。

在一种可选的实施例中，仍在上述示例中，第一目标对象的主颜色为肉色，计算当前帧图像中的颜色值和肉色之间的差，得到第五个权重值。肉色的颜色值可以通过自定义确定，例如：

将当前帧图像的颜色值减去肉色的颜色值，负数清零，即成为第五个权重值。

此处需要说明的是，如果第一目标对象具有多种颜色，难以确定主颜色，则忽略此步骤。

可选的，根据本申请上述实施例，步骤S10413，对第一目标对象的颜色值在多帧图像中的权重值进行混合和过滤，得到当前帧图像的权重值分布图，包括：

步骤S10413a，将第一权重值、第二权重值、第三权重值、第四权重值和第五权重值按照预设的比例进行加权，得到混合权重值。

仍在上述示例中，对多个权重值进行加权，预设权重比例：

总混合值＝α₁·帧颜色值减之前的楼梯图像+

α₂·帧颜色值减之前的楼梯图像的梯度+

α₃·帧颜色值梯度减之前的梯度楼梯图像+

α₄·帧颜色值减之前的楼梯图像的梯度的最大头百分比的梯度-

β₅·帧颜色值和肉颜色之间的距离

运算方便，考虑到将颜色值差的影响平均化，加入log元素至计算权重值之内：

权重值＝α₁·log₂(帧颜色值减之前的楼梯图像)+

α₂·log₂(帧颜色值减之前的楼梯图像的梯度)+

α₃·log₂(帧颜色值梯度减之前的梯度楼梯图像)+

α₄·log₂(帧颜色值减之前的楼梯图像的梯度的最大头百分比的梯度)-

β₁·log₂(帧颜色值和肉颜色之间的距离)

步骤S10413b，对图像的混合权重值进行权值处理，其中，用于进行权值处理的权重值由当前帧图像中心至当前帧图像的边界呈由大变小的趋势。

在一种可选的实施例中，仍在上述示例中，可以通过如下步骤对图像的混合权重值进行权值处理：

原本混合值是由三种颜色(RGB)组成，先将三种颜色的数值合而为一，将RGB三个值相加。

将颜色合而为一的权重值在周边位置的数值依照比率下降。

权重值会乘以下列矩阵：

位置在中间的像素点的权重值是不变的，但由中间至左右两旁就会下降(线性下降)，到两旁边缘就乘以0.7，上下边缘又会乘以0.7，即四个角位就乘以0.49。结果就是：中间地区的权重值会比较高，边缘地区的权重值会比较低。

如果第一目标对象较容易确定主颜色(例如本实施例中较容易确定主颜色为肉色)，在主颜色不接近于黑色和白色的情况下，取消接近黑色和白色的地方的权重值。所以如果影片颜色接近黑色和白色的地方，权重值会被清零。黑色颜色值为(0，0，0)，白色颜色值为(255，255，255)，当影片中颜色值三色总和低于150，或高于675时，该位置的权重值会被清零。由于本程式是针对手的移动。

步骤S10413c，对进行过权值处理的图像与上一帧图像的权重分布图中的权重值相加，并进行均值处理，从进行均值处理后的权重值中提取预设数量的权重值，并将进行均值处理后的权重值减所述预设数量的权重值，得到所述图像的权重值分布图。

具体的，将权重值加上旧的权重值，旧的权重值即为上一帧图像的权重分布图中的权重值。

在一种可选的实施例中，仍在上述示例中，可以通过如下步骤进行均值处理：

将权重值原本的点改为周边25点(或9点或其他，今次是25点)的平均值。

例如：

也就是说，不考虑最边缘两行，每点权重值会被周边25点平均化。

再按照权重值将由大至小排列，提取最大的10％(处于10％-15％的范围内均可)，其他清零。即选择10％的数值，之后将权重值减此值，负数清零。也就是说，最小的90％数据会消失。此处需要注意的是，最终得到的权重值即构成权重分布图，当前帧的权重分布图中的权重值为下一帧图像的旧权重值数据。

可选的，根据本申请上述实施例，步骤S1043，在权重值分布图像中确定包括第一目标对象的方圈，包括：

步骤S10431，根据权重值分布图像中的颜色值确定多个方圈，并从多个方圈中筛选出满足预设条件的方圈，其中，预设条件包括：

方圈内的权重值高于预设目标值；

方圈的面积处于第一预设范围内；

方圈在第一维度上的长度与方圈在第二维度上的长度处于第二预设范围内，其中，第一维度与第二维度垂直；

当前帧图像的方圈的权重总值与之前预设数量的图像的平均权重总值的差处于第三预设范围内。

在确定多个方圈后，可以通过上述预设条件来确定是否接收方圈，接收的方圈即为包括第一目标对象的方圈。

仍在上述实施例中，决定是否接收方圈的条件可以包括：

1、当方圈内的权重低于目标时，不接受方圈。

2、当方圈面积不在目标范围内时，不接受方圈。

3、当方圈x轴长度比y轴多(或少)R倍时，不接受方圈。

4、当方圈x轴(或y轴)边长度高于目标时，不接受方圈。

5、当新方圈内的权重总值低于过去10个有效方圈的平均权重总值的85％时，不接受方圈。

可选的，根据本申请上述实施例，步骤S10431，根据权重值分布图像中的颜色值确定多个方圈，包括：

步骤A，确定权重值分布图中权重值最大的点。

图5是根据本发明实施例的一种可选的确定权重值分布图中权重值的最大的点的示意图，该示意图中位于食指和拇指之前的点为权重值最大的点。

步骤B，以权重值最大的点为第二中心点，向外扩张方圈至第四预设范围。

由最大值坐标开始扩张至一个特定的范围，当扩张范围之中，发现权重大于零的地方时，方圈范围会向外扩张至权重大于零的地方。仍在上述实施例中，扩张方圈的示意图可以如图6所示，在该示例中，第二中心点仍为食指与拇指之前的点，图中的矩形框即为方圈扩张后确定的第一预设范围。

步骤C，在将方圈扩张至第四预设范围后，向内缩小方圈，直至方圈边缘颜色值的平均至小于预设比例与图像颜色值之和的平均值。

具体的，当方圈范围向外扩张之后，就会进行收宿，当方圈范围的边沿平均值低于比例值乘以整体平均值时，该边沿位置就会取消；整体平均值为图像中现有有效像素灰度值(灰度值大于预设的数值)的平均值。仍在上述实施例中，收缩方圈的示意图可以如图7所示，围绕手掌的矩形框即为缩小后的方圈。

步骤D，将方圈确定的范围内的颜色值清零。

仍在上述实施例中，将方圈确定的范围内的颜色值清零可以如图8所示，方圈所包含的范围内的颜色值已经清零。

步骤E，重复步骤A至步骤D，以得到多个方圈。

仍在上述实施例中，得到的多个方圈可以如图9所示，图中的每个矩形都为一个方圈。

可选的，根据本申请上述实施例，步骤S1045，根据第一目标对象的方圈获取去除背景的第一目标图像，包括：

步骤S10451，确定第一目标对象的主颜色，并确定主颜色的相近色，其中，相近色为与主颜色的色差值在预设色差范围内的颜色。

在上述步骤之前，还可以将低精度的图坐标还原为原来的图坐标，在原来的图像范围中查找出现次数最多的相近色，仍在上述实施例中，主颜色为手的颜色，即肉色。

可以通过如下方法计算手的颜色：先将颜色的数值数目减少，颜色值原本是：[0,1,2,3,...,254,255,256]变成：[0,4,8,12,...,248,252,256]将颜色值0,1归类为0，颜色值2,3,4,5归类为4，颜色值6,7,8,9归类为8，颜色值10,11,12,13归类为12，如此类推。之后，在图中出现次数最多的颜色值就是手的颜色。

还可以通过如下方法确定主眼色的相近色：由于任何颜色都是由三种颜色(红绿蓝)组成的，在电脑中数值是由0至256，(0，0，0)为全黑，(256，256，256)为全白，颜色差就是二个颜色中红绿蓝的数值差总和。例如，一种颜色数值是(200，120，80)，另一种颜色数值是(160，90，20)，他们的颜色差就是40+30+60＝130。因此如果该点颜色值和手颜色的数值差低于或等于70时，该点设定为手相近颜色，如果颜色数值差大于70就设定为不是手相近颜色。

步骤S10453，在相近色所处的坐标中确定第一中心点，其中，第一中心点的坐标在所有相近色中距离第二中心点最近。

步骤S10455，以第一中心点为中心向外以预设方向取预设数量的点，在任意一个点为主颜色的相近色的情况下，将为主颜色的相近色的点相连，并向外扩张重新取点，直至取得的点中没有相近色。

仍在上述实施例中，可以通过如下方式根据相近色获取去除背景的手(去除背景的第一目标图像)：图10是根据本发明实施例的一种可选的获取去除背景的手时取点的示意图，由手相近颜色的中心点开始，当中心点旁边的12点是手相近颜色时，加入相连的手，直至没有其他相连的点为止，并将不相连的部份删除。

可选的，根据本申请上述实施例，步骤S106，根据第一目标图像的第一中心点至共同边界的距离获取第二目标对象处于第一目标图像中的位置，包括：

步骤S1061，根据第一中心点至共同边界的最远距离确定第而目标对象的上限和下限。

步骤S1063，去除位置在上限以上和下限以下的点，得到第二目标对象。

图11是根据本发明实施例的一种确定目标上下限的示意图，仍在上述实施例中，以第一中心点至手上限的距离，去计算出手掌的范围，方法如下：先假设中心点至手上限的距离(即至共同边界的最远距离)为L，那么手掌下限的地方就是在手上限减去L。计算出手掌的下限之后，我们会将手掌下限以下的地方删除，余下的地方就是最后手掌方圈的范围。

可选的，根据本申请上述实施例，在得到第二目标对象之后，方法还包括：

获取并以预设格式保存第二目标对象的图像信息，其中，图像信息包括：方圈的坐标以及第二目标对象的尺寸。

仍在上述实施例中，用户只需要在摄像头前摆动我们的手，系统就可以自动记录手掌方圈的范围，及用另一个文件记录图片名称/手掌方圈的x轴坐标/y轴坐标/宽度/高度。保存的图片分为两种：一种是没有方圈的原图，可以输入至其他智能设备，用于机械学习识别手势或人工智能。另一种是包括方圈的图，用于判断收集的图片是否合适使用。记录的方式可以如下：

实施例2

根据本发明实施例，提供了一种获取目标对象的装置的实施例，图12是根据本发明实施例的一种可选的获取目标对象的装置的示意图，结合图12所示，该装置包括：

第一获取模块120，用于获取视频图像中的多帧连续图像，其中，每帧图像包括第一目标对象。

第二获取模块122，用于根据包括第一目标对象的连续图像获取去除背景的第一目标图像。

第三获取模块124，用于根据第一目标图像的第一中心点至共同边界的距离获取第二目标对象处于第一目标图像中的位置，其中，第一中心点根据第二目标对象的颜色确定，共同边界为第二目标对象与第一目标对象重合的边界，第二目标对象包含于第一目标对象。

提取模块126，用于根据第二目标对象处于第一目标图像中的位置提取第二目标对象。

由上可知，本申请上述实施例通过第一获取模块获取视频图像中多帧包括第一目标对象的连续图像，通过第二获取模块根据包括第一目标对象的连续图像获取去除背景的第一目标图像，通过第三获取模块根据第一目标图像的第一中心点至共同边界的距离获取第二目标对象处于第一目标图像中的位置，通过提取模块根据第二目标对象处于第一目标图像中的位置提取第二目标对象。上述方案跟踪视频图像中的动态图像，并收集去除背景的第一目标图像，从而达到了快速收集目标图像的效果，并根据第一中心点和第一目标对象以及第二目标对象的共同边界确定第二目标对象的位置，使得能够从原图像中提取出第二目标对象，从而解决了现有技术中收集的图像中包括与目标对象相似的内容，导致后续处理过程复杂的技术问题。

可选的，根据本申请上述实施例，第二获取模块包括：

第一获取子模块，用于根据当前帧图像中第一目标对象的颜色值在多帧连续图像中的权重值得到当前帧图像的权重值分布图像，其中，权重值用于表征第一目标对象的颜色值占当前帧图像中所有颜色值的权重值。

第一确定子模块，用于在权重值分布图像中确定包括第一目标对象的方圈。

第二获取子模块，用于根据第一目标对象的方圈获取去除背景的第一目标图像。

可选的，根据本申请上述实施例，第一获取子模块包括：

获取权重值单元，用于获取第一目标对象的颜色值在多帧图像中的权重值。

混合过滤单元，用于对第一目标对象的颜色值在多帧图像中的权重值进行混合和过滤，得到当前帧图像的权重值分布图。

可选的，根据本申请上述实施例，获取权重值单元包括：

保存子单元，用于保存获取的第一张包括第一目标对象的图像，并根据第一张包括第一目标对象的图像获取第一目标对象的背景图像和梯度背景图像。

第一计算子单元，用于通过当前帧图像的颜色值减去上一帧图像的背景图像得到第一权重值。

第二计算子单元，用于通过当前帧图像的颜色值减去上一帧图像的梯度背景图像得到第二权重值。

第三计算子单元，用于通过当前帧图像的颜色梯度值减去上一帧图像的背景图像得到第三权重值。

第四计算子单元，用于通过当前帧图像的颜色值减去上一帧图像的背景图像的梯度中的预设梯度，得到第四权重值。

第五计算子单元，用于通过当前帧图像的颜色值减去第一目标对象的主颜色值，得到第五个权重值。

可选的，根据本申请上述实施例，混合过滤单元包括：

加权子单元，用于将第一权重值、第二权重值、第三权重值、第四权重值和第五权重值按照预设的比例进行加权，得到混合权重值。

处理子单元，用于对图像的混合权重值进行权值处理，其中，用于进行权值处理的权重值由图像中心至图像的边界呈由大变小的趋势。

加法计算子单元，用于对进行过权值处理的图像与上一帧图像的权重分布图中的权重值相加，并进行均值处理。

提取子单元，用于从进行均值处理后的权重值中提取预设数量的权重值，并采用进行均值处理后的权重值减预设数量的权重值，得到图像的权重值分布图。

可选的，根据本申请上述实施例，第一确定子模块包括：

确定单元，用于根据权重值分布图像中的颜色值确定多个方圈，并从多个方圈中筛选出满足预设条件的方圈，其中，预设条件包括：

方圈内的权重值高于预设目标值。

方圈的面积处于第二预设范围内。

方圈在第一维度上的长度与方圈在第二维度上的长度处于第三预设范围内，其中，第一维度与第二维度垂直。

当前图像的方圈的权重总值与之前预设数量的图像的平均权重总至的差处于第四预设范围内。

可选的，根据本申请上述实施例，确定单元包括：

第一确定子单元，用于确定权重值分布图中权重值最大的点。

扩张子单元，用于以权重值最大的点为第二中心点，向外扩张方圈至第一预设范围。

缩小子单元，用于在将方圈扩张至第一预设范围后，向内缩小方圈，直至方圈边缘颜色值的平均至小于预设比例与图像颜色值的平均值。

第二确定子单元，用于将方圈确定的范围内的颜色值清零。

循环子单元，用于重复第一确定子单元至第二确定子单元的功能，以得到多个方圈。

可选的，根据本申请上述实施例，第一获取子模块包括：

获取单元，用于获取第一目标对象的颜色值在多帧图像中的权重值。

混合过滤单元，用于对第一目标对象的颜色值在多帧图像中的权重值进行混合和过滤，得到图像的权重值分布图。

可选的，根据本申请上述实施例，第三获取模块包括：

第二确定子模块，用于根据第一中心点至共同边界的最远距离确定第而目标对象的上限和下限。

去除子模块，用于去除位置在上限以上和下限以下的点，得到第二目标对象。

可选的，根据本申请上述实施例，上述装置还包括：

保存模块，用于获取并以预设格式保存第二目标对象的图像信息，其中，图像信息包括：方圈的坐标以及第二目标对象的尺寸。

实施例2

根据本发明实施例，提供了一种机器人的实施例，包括实施例2中的任意一种获取目标对象的装置。

上述实施例的机器人包括的获取目标对象的装置通过第一获取模块获取视频图像中多帧包括第一目标对象的连续图像，通过第二获取模块根据包括第一目标对象的连续图像获取去除背景的第一目标图像，通过第三获取模块根据第一目标图像的第一中心点至共同边界的距离获取第二目标对象处于第一目标图像中的位置，通过提取模块根据第二目标对象处于第一目标图像中的位置提取第二目标对象。上述方案跟踪视频图像中的动态图像，并收集去除背景的第一目标图像，从而达到了快速收集目标图像的效果，并根据第一中心点和第一目标对象以及第二目标对象的共同边界确定第二目标对象的位置，使得能够从原图像中提取出第二目标对象，从而解决了现有技术中收集的图像中包括与目标对象相似的内容，导致后续处理过程复杂的技术问题。

上述本发明实施例序号仅仅为了描述，不代表实施例的优劣。

在本发明的上述实施例中，对各个实施例的描述都各有侧重，某个实施例中没有详述的部分，可以参见其他实施例的相关描述。

在本申请所提供的几个实施例中，应该理解到，所揭露的技术内容，可通过其它的方式实现。其中，以上所描述的装置实施例仅仅是示意性的，例如所述单元的划分，可以为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，单元或模块的间接耦合或通信连接，可以是电性或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本发明各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。

所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述仅是本发明的优选实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本发明原理的前提下，还可以做出若干改进和润饰，这些改进和润饰也应视为本发明的保护范围。

Claims

1.一种获取目标对象的方法，其特征在于，包括：

获取视频图像中的多帧连续图像，其中，每帧图像包括第一目标对象；

根据包括所述第一目标对象的连续图像获取去除背景的第一目标图像；

根据所述第一目标图像的第一中心点至共同边界的距离获取第二目标对象处于所述第一目标图像中的位置，其中，所述第一中心点根据所述第二目标对象的颜色确定，所述共同边界为所述第二目标对象与所述第一目标对象重合的边界，所述第二目标对象包含于所述第一目标对象；

根据所述第二目标对象处于所述第一目标图像中的位置提取所述第二目标对象；

其中，所述第一中心点通过如下方式确定：

确定所述第一目标对象的主颜色，并确定所述主颜色的相近色，其中，所述相近色为与所述主颜色的色差值在预设色差范围内的颜色；

在所述相近色所处的坐标中确定所述第一中心点。

2.根据权利要求1所述的方法，其特征在于，根据包括所述第一目标对象的连续图像获取去除背景的第一目标图像，包括：

根据当前帧图像中第一目标对象的颜色值在多帧所述连续图像中的权重值得到所述当前帧图像的权重值分布图像，其中，所述权重值用于表征所述第一目标对象的颜色值占所述当前帧图像中所有颜色值的权重值；

在所述权重值分布图像中确定包括所述第一目标对象的方圈；

根据所述第一目标对象的方圈获取去除背景的第一目标图像。

3.根据权利要求2所述的方法，其特征在于，根据当前帧图像中第一目标对象的颜色值在多帧所述连续图像中的权重值得到所述当前帧图像的权重值分布图像，包括：

获取所述第一目标对象的颜色值在所述多帧图像中的权重值；

对所述第一目标对象的颜色值在所述多帧图像中的权重值进行混合和过滤，得到所述当前帧图像的权重值分布图。

4.根据权利要求3所述的方法，其特征在于，获取所述第一目标对象的颜色值在所述多帧图像中的权重值，包括：

保存获取的第一张包括所述第一目标对象的图像，并根据第一张包括所述第一目标对象的图像获取所述第一目标对象的背景图像和梯度背景图像；

通过当前帧图像的颜色值减去上一帧图像的背景图像得到第一权重值；

通过所述当前帧图像的颜色值减去上一帧图像的梯度背景图像得到第二权重值；

通过所述当前帧图像的颜色梯度值减去上一帧图像的背景图像得到第三权重值；

通过所述当前帧图像的颜色值减去所述上一帧图像的背景图像的梯度中的预设梯度，得到第四权重值；

通过所述当前帧图像的颜色值减去所述第一目标对象的主颜色值，得到第五权重值。

5.根据权利要求4所述的方法，其特征在于，对所述第一目标对象的颜色值在所述多帧图像中的权重值进行混合和过滤，得到所述当前帧图像的权重值分布图，包括：

将第一权重值、第二权重值、第三权重值、第四权重值和第五权重值按照预设的比例进行加权，得到混合权重值；

对所述混合权重值进行权值处理，其中，用于进行所述权值处理的权重值由所述当前帧图像中心至所述当前帧图像的边界呈由大变小的趋势；

对进行过权值处理的图像与上一帧图像的权重分布图中的权重值相加，并进行均值处理；

从进行均值处理后的权重值中提取预设数量的权重值，并将进行均值处理后的权重值减所述预设数量的权重值，得到所述当前帧图像的权重值分布图。

6.根据权利要求2所述的方法，其特征在于，在所述权重值分布图像中确定包括所述第一目标对象的方圈，包括：

根据所述权重值分布图像中的颜色值确定多个方圈，并从所述多个方圈中筛选出满足预设条件的方圈，其中，所述预设条件包括：

所述方圈内的权重值高于预设目标值；

所述方圈的面积处于第一预设范围内；

所述方圈在第一维度上的长度与所述方圈在第二维度上的长度处于第二预设范围内，其中，所述第一维度与所述第二维度垂直；

7.根据权利要求6所述的方法，其特征在于，根据所述权重值分布图像中的颜色值确定多个方圈，包括：

步骤A，确定所述权重值分布图中权重值最大的点；

步骤B，以所述权重值最大的点为第二中心点，向外扩张方圈至第四预设范围；

步骤C，在将所述方圈扩张至所述第四预设范围后，向内缩小所述方圈，直至所述方圈边缘颜色值的平均值小于预设比例与所述图像颜色值之和的平均值；

步骤D，将所述方圈确定的范围内的颜色值清零；

步骤E，重复所述步骤A至所述步骤D，以得到多个方圈。

8.根据权利要求7所述的方法，其特征在于，根据所述第一目标对象的方圈获取去除背景的第一目标图像，包括：

所述第一中心点的坐标在所有所述相近色中距离所述第二中心点最近；

以所述第一中心点为中心向外以预设方向取预设数量的点，在任意一个点为所述主颜色的相近色的情况下，将为所述主颜色的相近色的点相连，并向外扩张重新取点，直至取得的点中没有所述相近色。

9.根据权利要求1至8中任意一项所述的方法，其特征在于，根据所述第一目标图像的第一中心点至共同边界的距离获取第二目标对象处于所述第一目标图像中的位置，包括：

根据所述第一中心点至所述共同边界的最远距离确定所述第二目标对象的上限和下限；

去除位置在所述上限以上和所述下限以下的点，得到所述第二目标对象。

10.根据权利要求9所述的方法，其特征在于，在得到所述第二目标对象之后，所述方法还包括：

获取并以预设格式保存所述第二目标对象的图像信息，其中，所述图像信息包括：方圈的坐标以及所述第二目标对象的尺寸。

11.一种获取目标对象的装置，其特征在于，包括：

第一获取模块，用于获取视频图像中的多帧连续图像，其中，每帧图像包括第一目标对象；

第二获取模块，用于根据包括所述第一目标对象的连续图像获取去除背景的第一目标图像；

第三获取模块，用于根据所述第一目标图像的第一中心点至共同边界的距离获取第二目标对象处于所述第一目标图像中的位置，其中，所述第一中心点根据所述第二目标对象的颜色确定，所述共同边界为所述第二目标对象与所述第一目标对象重合的边界，所述第二目标对象包含于所述第一目标对象；

提取模块，用于根据所述第二目标对象处于所述第一目标图像中的位置提取所述第二目标对象；

其中，所述装置通过如下方式确定所述第一中心点：

在所述相近色所处的坐标中确定所述第一中心点。

12.根据权利要求11所述的装置，其特征在于，所述第二获取模块包括：

第一获取子模块，用于根据当前帧图像中第一目标对象的颜色值在多帧所述连续图像中的权重值得到所述当前帧图像的权重值分布图像，其中，所述权重值用于表征所述第一目标对象的颜色值占所述当前帧图像中所有颜色值的权重值；

第一确定子模块，用于在所述权重值分布图像中确定包括所述第一目标对象的方圈；

第二获取子模块，用于根据所述第一目标对象的方圈获取去除背景的第一目标图像。

13.根据权利要求12所述的装置，其特征在于，所述第一获取子模块包括：

获取单元，用于获取所述第一目标对象的颜色值在所述多帧图像中的权重值；

混合过滤单元，用于对所述第一目标对象的颜色值在所述多帧图像中的权重值进行混合和过滤，得到所述当前帧图像的权重值分布图。

14.根据权利要求11至13中任意一项所述的装置，其特征在于，所述第三获取模块包括：

第二确定子模块，用于根据所述第一中心点至所述共同边界的最远距离确定所述第二目标对象的上限和下限；

去除子模块，用于去除位置在所述上限以上和所述下限以下的点，得到所述第二目标对象。

15.根据权利要求14所述的装置，其特征在于，所述装置还包括：

保存模块，用于获取并以预设格式保存所述第二目标对象的图像信息，其中，所述图像信息包括：方圈的坐标以及所述第二目标对象的尺寸。

16.一种机器人，其特征在于，包括权利要求11至15中任意一种获取目标对象的装置。