WO2019061713A1

WO2019061713A1 - 一种基于机器人的目标图像显示处理方法及系统

Info

Publication number: WO2019061713A1
Application number: PCT/CN2017/110287
Authority: WO
Inventors: 谢阳阳; 郭昌野
Original assignee: 南京阿凡达机器人科技有限公司
Priority date: 2017-09-29
Filing date: 2017-11-09
Publication date: 2019-04-04
Also published as: CN107742303B; CN107742303A

Abstract

本发明公开了一种基于机器人的目标图像显示处理方法和系统，包括：S10对视频帧图像进行连续采集；S20在采集到的第k帧图片中检测到跟随目标时，检测所述跟随目标在所述第k帧图片的位置信息；S30在时间轴第k+N+1帧处显示所述第k帧图片，并标记出所述跟随目标在所述第k帧图片的位置；N为一个检测周期内所采集的图片数量；S40根据所述跟随目标在所述第k帧图片的位置信息，依次预测在采集到的第k+N+1至第k+2N-1帧图片中跟随目标的位置；S50在时间轴第k+N+2至k+2N帧处依次显示所述k+N+1至k+2N-1帧图片以及所述预测的跟随目标的位置。通过本发明能够更加流畅地显示图像。

Description

一种基于机器人的目标图像显示处理方法及系统

本申请要求2017年09月29日提交的申请号为：201710911965.X、发明名称为“一种基于机器人的目标图像显示处理方法及系统”的中国专利申请的优先权，其全部内容合并在此。

技术领域

本发明涉及机器人领域，特别是一种基于机器人的目标图像显示处理方法及系统。

背景技术

随着人工智能的逐渐发展，机器人必将融入人们的工作与生活之中，如何提高机器人与人之间的交互智能性，成为了目前研究的热点。

人体跟随作为人机交互的一种方式，具有方便，自动化程度高等优点，被广泛应用在具有行走能力的机器人中。具体的，机器人在实现人体跟随技术时，首先通过内置的摄像机等采集设备采集图像信号，当在采集到的图像信号中检测到人体目标时，在机器人的显示屏幕上显示包含该人体图像并标注人体的位置，并跟随人体的移动而移动。

但是，目前的技术中，机器人对图像的采集速度远远高于对图像的处理速度，如图8所示，假设当检测模块处理完第1帧后，采集模块已经采集完第n帧的图像，系统会把检测结果显示到时间轴上n+1帧的位置。为了避免跟踪丢失目标，检测模块跳过对第2～n-1帧的检测、开始检测第n帧的内容，当处理完第n帧时，采集模块已经采集完第2n-1帧，系统把该检测结果显示在时间轴上2n帧的位置。因此，时间轴上n+1至2n-1帧之间显示模块一直显示的是第一帧的检测结果，时间轴上2n至3n-2帧之间显示的是第n帧的检测结果。从中可以看出，虽然目标在视场内不断的移动，而显示模块并不能及时跟随到目标，将连续显示n-1个相同的帧然后跳到之后的第n帧，因此在时间轴上第n+1帧到2n-1帧之间存在卡顿(始终显示第1帧)，在2n-1帧和2n帧之间存在跳变(从显示第1帧突然变为显示第n帧)，这样会给用户带来不好的使用体验。

因此，需要设计一种能够能加流畅地显示图像的方法，使显示时能够避免卡顿和跳变，给用户带来更好的体验感。

发明内容

本发明的目的是提供一种基于机器人的目标图像显示处理方法及系统，能够解决机器人显示目标图像时存在卡顿、跳变的问题，使显示更为流畅，提高用户的体验感，技术方案如下：

一种基于机器人的目标图像显示处理方法，包括步骤：S10对视频帧图像进行连续采集；S20在采集到的第k帧图片中检测到跟随目标时，检测所述跟随目标在所述第k帧图片的位置信息；S30在时间轴第k+N+1帧图片处显示所述第k帧图片，并标记出所述跟随目标在所述第k帧图片的位置；N为一个检测周期内所采集的帧图片数量；S40根据所述跟随目标在所述第k帧图片的位置信息，依次预测在采集到的第k+N+1至第k+2N-1帧图片中跟随目标的位置；S50在时间轴第k+N+2至k+2N帧图片处依次显示所述k+N+1至k+2N-1帧图片以及所述预测的跟随目标的位置。

通过本发明，能够在检测跟随目标在图片中位置的同时预测跟随目标在图片中的位置，避免了因为检测速度慢而导致显示出来的跟随目标图像出现卡顿的现象，通过预测跟随目标在图像中的位置信息还能够避免检测出来的目标位置变化过大而出现图片跳变的现象，使显示出来的含有跟随目标的图像更具连贯性。

优选的，步骤S40中根据所述跟随目标在所述第k帧图片的位置信息，依次预测在采集到的第k+N+1至第k+2N-1帧图片中跟随目标的位置具体为：根据所述跟随目标在所述第k帧图片的位置信息，预测在第k+N+1帧中跟随目标的位置，以及根据第k+N+i帧中跟随目标的位置，预测k+N+i+1帧中跟随目标的位置；其中i分别为1～N-2的正整数。

根据递归的方法，能够通过第k帧图片的位置信息预测得到第k+N+1帧图片的位置信息，再通过第k+N+1帧图片的位置信息预测得到第k+N+2 帧图片的位置信息，然后通过递归思想，能够预测出第k+N+1至第k+2N-1帧图片中跟随目标的位置。通过预测能够避免在时间轴上第k+N+2帧到第k+2N帧的位置一直显示检测之后的第k帧图像以及目标图像的位置，使显示的图像更加流畅，不会出现卡顿的现象。

优选的，该方法进一步包括：在步骤S30中显示所述第k帧图片的同时，对采集到的第k+N帧图片进行检测，以及在步骤S50之后，在时间轴第k+2N+1帧图片处显示所述k+N帧图片以及所述检测到的跟随目标的位置。

由于预测的速度快于检测的速度，因此，在预测第k+N+2帧跟随目标位置时，对采集到的第k+N帧图片进行检测，在时间轴第k+2N+1帧图片处显示所述k+N帧图片以及所述检测到的跟随目标的位置，这样及时纠正预测出现的偏差，使得显示的图像符合跟随目标的运动轨迹。

优选的，根据所述跟随目标在所述第k帧图片的位置信息，预测在第k+N+1帧中跟随目标的位置具体为：S41分别计算出所述第k帧图片跟随目标对应的第k特征点信息和采集到的第k+N+1帧图片跟随目标对应的第k+N+1特征点信息；S42对所述第k特征点信息和所述第k+N+1特征点信息进行匹配，分别得到第k特征点集、第k+N+1特征点集；S43根据所述第k特征点集计算出所述第k特征点集的第k质心信息，以及根据所述第k+N+1特征点集计算出所述第k+N+1特征点集的第k+N+1质心信息；S44根据所述第k质心信息、所述第k+N+1质心信息以及所述第k帧目标图片信息的中心位置信息，预测得到第k+1帧目标预测图片信息。

通过对每一帧图片中跟随目标的特征点的采集，并计算每个有效特征点的位置坐标、图片中心位置的坐标以及跟随目标质心坐标，能够准确地预测出跟随目标在图片中的位置，达到预测的目的。

优选的，S42中对所述第k特征点信息和所述第k+N+1特征点信息进行匹配的步骤具体包括：S421根据K邻近一致性算法计算所述第k特征点信息和所述第k+N+1特征点信息的相似度，得到对应的匹配点；S422根据Ransac随机采样一致算法滤除错误匹配点，得到所述第k特征点集和所述第k+N+1特征点集。

根据K邻近一致性算法能够计算出每张图片的特征点，并根据Ransac随机采样一致算法滤除错误匹配点，使最终得到的特征点的有效程度更高，使预测时的计算更加准确，预测得到的跟随目标位置更准确。

优选的，步骤S43中计算所述第k+N+1特征点集的第k+N+1质心信息具体包括：S431根据所述第k特征点集计算得到第k帧目标图片信息内所有特征点的像素坐标，以及根据所述第k+N+1特征点集计算得到第k+N+1帧图片信息内所有特征点的像素坐标；S432根据所述第k帧目标图片信息内所有特征点的像素坐标计算得到所述第k质心像素坐标作为第k质心信息，以及根据所述第k+N+1帧图片信息内所有特征点的像素坐标计算得到所述第k+N+1像素坐标信息作为第k+N+1质心信息。

所述步骤S432中所述的第k质心像素坐标的计算公式如下：

其中，P(k)(j)表示第k帧目标图片信息对应的第k特征点集中第j个特征点的像素坐标，C(k)表示所述第k质心像素坐标；

所述步骤S432中所述的第k+N+1质心像素坐标的计算公式如下；

其中，P(k+N+1)(j)表示第k+N+1帧图片信息对应的第k+N+1特征点集中第j个特征点的像素坐标，C(k+N+1)表示所述第k+N+1质心像素坐标。

通过上述公式，根据检测跟随目标的有效特征点在图片中的像素坐标，可以计算得到跟随目标的质心坐标，使预测得到跟随目标在图片中的位置更为准确。

优选的，步骤S44中预测得到第k+N+1帧图片中跟随目标的位置具体为：S441计算得到所述第k帧目标图片信息的中心位置像素坐标作为中心位置信息；S442根据所述第k质心像素坐标、所述第k+N+1质心像素坐标、所述第k帧图片信息的中心位置像素坐标，计算得到所述第k+N+1帧图片信息的中心位置像素坐标，其计算公式如下：

R(k+N+1)＝R(k)-C(k)+C(k+N+1)

其中，R(k+N+1)表示所述第k+N+1帧图片信息的中心位置像素坐标，R(k)表示所述第k帧目标图片信息的中心位置像素坐标，C(k)表示所述第k质心像素坐标，C(k+N+1)所述第k+N+1质心像素坐标。

通过跟随目标的质心位置和图片中心坐标位置的相对位置，能够预测出跟随目标在下一帧图片中的具体位置，使预测更加准确。

一种基于机器人的目标图像显示处理系统，包括：采集模块，用于对视频帧图像进行连续采集；检测模块，与采集模块电连接，在采集到的第k帧图片中检测到跟随目标时，检测所述跟随目标在所述第k帧图片的位置信息；显示模块，与所述检测模块电连接，用于在时间轴第k+N+1帧图片处显示所述第k帧图片，并标记出所述跟随目标在所述第k帧图片的位置；N为一个检测周期内所采集的帧图片数量；预测模块，与所述检测模块电连接，用于根据所述跟随目标在所述第k帧图片的位置信息，依次预测在采集到的第k+N+1至第k+2N-1帧图片中跟随目标的位置；所述显示模块，还用于在时间轴第k+N+2至k+2N帧图片处依次显示所述k+N+1至k+2N-1帧图片以及所述预测的跟随目标的位置。

优选的，所述预测模块还用于根据所述跟随目标在所述第k帧图片的位置信息，预测在第k+N+1帧中跟随目标的位置，以及根据第k+N+i帧中跟随目标的位置，预测k+N+i+1帧中跟随目标的位置；其中i分别为1～N-2的正整数。

根据递归的方法，能够通过第k帧图片的位置信息预测得到第k+N+1 帧图片的位置信息，再通过第k+N+1帧图片的位置信息预测得到第k+N+2帧图片的位置信息，然后通过递归思想，能够预测出第k+N+1至第k+2N-1帧图片中跟随目标的位置。通过预测能够避免在时间轴上第k+N+2帧到第k+2N帧的位置一直显示检测之后的第k帧图像以及目标图像的位置，使显示的图像更加流畅，不会出现卡顿的现象。

优选的，所述检测模块还用于显示所述第k帧图片的同时，对采集到的第k+N帧图片进行检测；所述显示模块还用于在时间轴第k+2N+1帧图片处显示所述k+N帧图片以及所述检测到的跟随目标的位置。

优选的，所述预测模块还包括：计算子模块，用于分别计算出所述第k帧图片跟随目标对应的第k特征点信息和采集到的第k+N+1帧图片跟随目标对应的第k+N+1特征点信息；匹配子模块，与所述计算子模块电连接，对所述第k特征点信息和所述第k+N+1特征点信息进行匹配，分别得到第k特征点集、第k+N+1特征点集；所述计算子模块，还用于根据所述第k特征点集计算出所述第k特征点集的第k质心信息，以及根据所述第k+N+1特征点集计算出所述第k+N+1特征点集的第k+N+1质心信息；预测子模块，用于根据所述第k质心信息、所述第k+N+1质心信息以及所述第k帧目标图片信息的中心位置信息，预测得到第k+1帧目标预测图片信息。

优选的，所述匹配子模块还包括：图片处理单元，用于根据K邻近一致性算法计算所述第k特征点信息和所述第k+N+1特征点信息的相似度，得到对应的匹配点；所述图片处理单元，还用于根据Ransac随机采样一致算法滤除错误匹配点，得到所述第k特征点集和所述第k+N+1特征点集。

优选的，所述计算子模块，还用于根据所述第k特征点集计算得到第k帧目标图片信息内所有特征点的像素坐标，以及根据所述第k+N+1特征点集计算得到第k+N+1帧图片信息内所有特征点的像素坐标；所述计算子模块，还用于根据所述第k帧目标图片信息内所有特征点的像素坐标计算得到所述第k质心像素坐标作为第k质心信息，以及根据所述第k+N+1帧图片信息内所有特征点的像素坐标计算得到所述第k+N像素坐标信息作为第k+N+1质心信息。

所述计算子模块，还用于计算所述第k质心像素坐标，计算公式如下：

其中，P(k)(j)表示第k帧目标图片对应的第k特征点集中第j个特征点的像素坐标，C(k)表示所述第k质心像素坐标；

所述计算子模块，还用于计算所述第k+N+1质心像素坐标，计算公式如下；

优选的，所述计算子模块，还用于计算得到所述第k帧目标图片信息的中心位置像素坐标作为中心位置信息；

所述计算子模块，还用于根据所述第k质心像素坐标、所述第k+N+1质心像素坐标、所述第k帧图片信息的中心位置像素坐标，计算得到所述第k+N+1帧图片信息的中心位置像素坐标，其计算公式如下：

R(k+N+1)＝R(k)-C(k)+C(k+N+1)

根据本发明提供的一种基于机器人的目标图像显示处理方法和系统，能够带来以下有益效果：

能够解决成跟随系统显示卡顿的情况。在以往技术中，由于受到机器人自身硬件条件的限制，使得机器人的检测速度远不及采集的速度，导致机器人显示跟随目标的图片时，常出现卡顿，或者图像跳变的情况，通过本发明提供的预测功能，能够在检测期间预测得到显示图片，使得显示出来的画面流畅，避免了卡顿的现象。

附图说明

下面将以明确易懂的方式，结合附图说明优选实施方式，对一种基于机器人的目标图像显示处理方法及系统的上述特性、技术特征、优点及其实现方式予以进一步说明。

图1是本发明一种基于机器人的目标图像显示处理方法的实施例流程图；

图2是本发明一种基于机器人的目标图像显示处理方法的另一个实施例流程图；

图3是本发明一种基于机器人的目标图像显示处理方法的另一个实施例流程图；

图4是本发明一种基于机器人的目标图像显示处理方法的另一个实施例流程图；

图5是本发明一种基于机器人的目标图像显示处理系统的一个结构示意图；

图6是本发明一种基于机器人的目标图像显示处理系统的另一个结构示意图；

图7是本发明一种基于机器人的目标图像显示处理系统的另一个结构示意图；

图8是现有技术中机器人的目标图像显示处理方法的时序流程图；

图9是本发明一种基于机器人的目标图像显示处理方法的时序流程图；

图10是图4对应的基于机器人的目标图像显示处理方法实施例中的预测步骤流程图；

图11是图4对应的基于机器人的目标图像显示处理方法实施例中的图像匹配关系图。

附图标号说明：

1-采集模块、2-检测模块、3-预测模块、4-显示模块、31-计算子模块、32-匹配子模块、33-预测子模块、321-图片处理单元。

具体实施方式

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对照附图说明本发明的具体实施方式。显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图，并获得其他的实施方式。

为使图面简洁，各图中只示意性地表示出了与本发明相关的部分，它们并不代表其作为产品的实际结构。另外，以使图面简洁便于理解，在有些图中具有相同结构或功能的部件，仅示意性地绘示了其中的一个，或仅标出了其中的一个。在本文中，“一个”不仅表示“仅此一个”，也可以表示“多于一个”的情形。

如图1所示，本发明提供了一种基于机器人的目标图像显示处理方法的一个实施例，包括步骤：

S10对视频帧图像进行连续采集；

S20在采集到的第k帧图片中检测到跟随目标时，检测所述跟随目标在所述第k帧图片的位置信息；

S30在时间轴第k+N+1帧处显示所述第k帧图片，并标记出所述跟随目标在所述第k帧图片的位置；N为一个检测周期内所采集的图片数量；

S40根据所述跟随目标在所述第k帧图片的位置信息，依次预测在采集到的第k+N+1至第k+2N-1帧图片中跟随目标的位置；

S50在时间轴第k+N+2至k+2N帧处依次显示所述k+N+1至k+2N-1帧图片以及所述预测的跟随目标的位置。

本实施例可以运用在具有跟随目标功能的机器上，比如具有人体跟随功能的机器人。为了方便理解，本实施例中将k值取1，即从第k帧图片开始检测。由于不同机器人的性能有所不同，在一个检测周期内采集到的图片信息的数量也有不同，在一个检测周期内所采集的图片数量N的值会有所变化，也就是说N可以是一个检测周期内所采集的图片数量。为了方便区分，本实施例中，将采集到的图片称为图片信息，将处理过后再显示的图片称为目标图片信息，

在本实施例中，取k＝1，代表从检测到含有跟随目标的第一帧图片开始检测。具体的，在机器人身上会安装有摄像头，用于采集跟随目标的图像，当跟随目标出现在机器人视野范围内时，机器人开始连续采集含有跟随目标的图片；在采集到第1帧图片信息时，将对第1帧图片信息进行检测，由于检测的速度远不及采集图片的速度，因此，当检测完第1帧图片信息的时候，机器人已经采集到了第N+2帧图片了，这时候，机器人会在时间轴上第N+2帧的位置显示已经检测完毕的第1帧图片信息。

如图8所示，通常在此时，以往的技术就是继续检测采集到的第n帧图片，然后在第2n处显示，在显示器上第n+1帧～第2n-1帧的图片就一直保持第1帧的图片，这样就会造成显示器出现卡顿的情况，到第2n帧的时候又突然出现新的图片，会出现图像跳变的情况，非常影响用户的视觉体验。

因此，本实施例提供了一种预测功能，由于机器人在连续采集图片信息，当检测完第1帧图片信息并显示后，即步骤S30结束，开始执行步骤S40；根据检测得到的第1帧目标图片信息及跟随目标的位置和采集到的第N+1帧图片信息，预测得到第2帧目标图片信息及跟随目标的位置，并在时间轴第N+2帧的位置显示预测出来的第2帧目标图片信息及跟随目标的位置。重复执行上述预测功能，可以得到第3帧目标图片信息，直到预测出并显示出第2N-1帧目标预测图片信息及跟随目标的位置。

如图9所示，在采集到第k帧含有跟随目标的图片时，检测第k帧图片中跟随目标图像的位置，检测完毕之后，在时间轴第k+N+1帧处显示第k帧图片及跟随目标的位置，并根据所述跟随目标在所述第k帧图片的位置信息及跟随目标的位置，依次预测在采集到的第k+N+1至第k+2N-1帧图片中跟随目标的位置，并在时间轴第k+N+2至k+2N帧处依次显示所述k+N+1至k+2N-1帧图片以及所述预测的跟随目标的位置，通过本实施例提供的预测功能，能够弥补现有技术出现跳频和卡顿的现象。

具体的，假设检测处理每一帧需要的周期为N，从第k帧开始检测到跟随目标；则在第k+N帧位置检测完第k帧，在第k+N+1位置显示第k帧；然后在k+N+2～k+2N帧位置依次显示k+N+1～k+2N-1帧的图片，并且根据第k帧中跟随目标的位置预测k+N+1帧中跟随目标的位置，根据预测后k+N+1帧中目标的位置来预测第k+N+2帧中跟随目标的位置，直到预测出第k+2N-1帧中跟随目标的位置；随后正好第k+N帧检测结束，在k+2N+1位置处显示该第k+N帧图片和跟随目标的位置。

如图2所示，本发明提供了一种基于机器人的目标图像显示处理方法的另一个实施例，包括步骤：

S10对视频帧图像进行连续采集；

S41分别计算出所述第k帧图片跟随目标对应的第k特征点信息和采集到的第k+N+1帧图片跟随目标对应的第k+N+1特征点信息；

S42对所述第k特征点信息和所述第k+N+1特征点信息进行匹配，分别得到第k特征点集、第k+N+1特征点集；

S43根据所述第k特征点集计算出所述第k特征点集的第k质心信息，以及根据所述第k+N+1特征点集计算出所述第k+N+1特征点集的第k+N+1质心信息；

S44根据所述第k质心信息、所述第k+N+1质心信息以及所述第k帧目标图片信息的中心位置信息，预测得到第k+N+1帧图片中跟随目标的位置。

在本实施例中，对如何根据检测得到的第k帧目标图片信息及跟随目标的位置，预测得到在采集到的第k+N+1帧图片中跟随目标的位置进行了具体的阐述。首先，运用现有的一些对图片中特征点的处理方法，分别计算出所述第k帧目标图片中跟随目标的位置对应的第k特征点信息和采集到的第k+N+1帧图片中跟随目标的位置对应的第k+N+1特征点信息，如每个特征点在图片中的像素坐标；其次对所述第k特征点信息和所述第k+N+1特征点信息进行匹配，分别得到第k特征点集、第k+N+1特征点集，这两个特征点集中的特征点都是两两对应的关系；再次，根据所述第k特征点集、所述第k+N+1特征点集，分别计算出所述第k特征点集的第k质心信息、第k+N+1特征点集的第k+N+1质心信息，所述的特征信息包括质心在图片中的像素坐标；最后，根据所述第k质心信息、所述第k+N+1质心信息以及所述第k帧目标图片信息的中心位置信息，预测得到第k+N+1帧目标预测图片信息及跟随目标的位置。

如图3所示，本发明提供了一种基于机器人的目标图像显示处理方法的另一个实施例，包括步骤：

S10对视频帧图像进行连续采集；

S421根据K邻近一致性算法计算所述第k特征点信息和所述第k+N+1特征点信息的相似度，得到对应的匹配点；

S422根据Ransac随机采样一致算法滤除错误匹配点，得到所述第k特征点集和所述第k+N+1特征点集。

S431根据所述第k特征点集计算得到第k帧目标图片信息内所有特征点的像素坐标，以及根据所述第k+N+1特征点集计算得到第k+N+1帧图片信息内所有特征点的像素坐标；

S432根据所述第k帧目标图片信息内所有特征点的像素坐标计算得到所述第k质心像素坐标作为第k质心信息，以及根据所述第k+N+1帧图片信息内所有特征点的像素坐标计算得到所述第k+N+1像素坐标信息作为第k+N+1质心信息。

具体的，在上个实施例的基础上，本实施例主要阐述了如何对所述第k特征点信息和所述第k+N+1特征点信息进行匹配，分别得到第k特征点集、第k+N+1特征点集的过程；以及如何根据所述第k特征点集、所述第k+N+1特征点集，分别计算出所述第k特征点集的第k质心信息、第k+N+1特征点集的第k+N+1质心信息的过程：

首先，可以通过特征点检测方法分别计算出所述第k帧目标图片信息对应的第k特征点信息和采集到的第k+N帧图片信息对应的第k+N特征点信息，如用FAST特征点检测方法得到第k帧目标图片信息对应的第k特征点信息和采集到的第k+N+1帧图片信息对应的第k+N+1特征点信息；

其次，根据K邻近一致性算法计算所述第k特征点信息和所述第k+N+1特征点信息的相似度，得到对应的匹配点。在实际情况中，两张图片不一样，计算得到的特征点也不全是相同的，因此，需要根据K邻近一致性算法计算第k特征点信息和所述第k+N+1特征点信息的相似度，当两个对应的特征点达到一定相似度时，判断此两个对应的特征点为有效特征点，以此得到两张图片对应的匹配点。比如第k帧目标图片里有A1、B1、C1三个特征点，第k+N+1帧图片中有A2、B2、D2三个特征点，通过K邻近一致性算法得到A1和A2、B1和B2的特征点相似度满足判断要求，因此可以判断为对应的匹配点，C1和D2的特征点相似度不符合判断要求，则此两个特征点就判断为不是对应的匹配点；

再次，根据Ransac随机采样一致算法滤除错误匹配点，得到所述第k特征点集和所述第k+N+1特征点集。在实际情况中，图片计算出来的特征点除了跟随目标的特征点以外，还有其他背景图片中的一些特征点，这些特征点其实并不是检测和预测所需要的特征点，所以需要根据Ransac随机采样一致算法滤除错误匹配点，得到正确的特征点，得到所述第k特征点集和所述第k+N+1特征点集。

之后，根据所述第k特征点集、所述第k+N+1特征点集分别计算得到第k帧目标图片信息内所有特征点的像素坐标、第k+N+1帧图片信息内所有特征点的像素坐标；所述的像素坐标可以以图片的一个角为顶点建立坐标系，然后通过计算每个特征点在坐标系中的位置得到每个特征点对应的像素坐标。

最后，根据所述第k帧目标图片信息内所有特征点的像素坐标、所述第k+N+1帧图片信息内所有特征点的像素坐标，计算得到所述第k质心像素坐标、所述第k+N+1像素坐标信息；

如图4所示，本发明提供了一种基于机器人的目标图像显示处理方法的另一个实施例，包括步骤：

S10对视频帧图像进行连续采集；

S432根据所述第k帧目标图片信息内所有特征点的像素坐标计算得到所述第k质心像素坐标作为第k质心信息，以及根据所述第k+N+1帧图片信息内所有特征点的像素坐标计算得到所述第k+N+1像素坐标信息作为第k+N+1质心信息；

所述步骤S432中所述的第k质心像素坐标的计算公式如下：

所述步骤S432中所述的第k+N+1质心像素坐标的计算公式如下；

其中，P(k+N+1)(j)表示第k+N+1帧图片信息对应的第k+N+1特征点集中第j个特征点的像素坐标，C(k+N+1)表示所述第k+N+1质心像素坐标；

S441计算得到所述第k帧目标图片信息的中心位置像素坐标作为中心位置信息；

S442根据所述第k质心像素坐标、所述第k+N+1质心像素坐标、所述第k帧图片信息的中心位置像素坐标，计算得到所述第k+N+1帧图片信息的中心位置像素坐标，其计算公式如下：

R(k+N+1)＝R(k)-C(k)+C(k+N+1)

具体的，本实施例具体阐述了如何计算得到所述第k质心像素坐标、所述第k+N+1像素坐标信息以及如何根据所述第k质心像素坐标、所述第k+N+1质心像素坐标、所述第k帧图片信息的中心位置像素坐标，计算得到所述第k+N+1帧图片信息的中心位置像素坐标。

首先，根据上个实施例所述的，在计算得到第k帧目标图片信息所有特征点像素坐标之后，可以根据步骤S433的公式，计算得到第k帧图片信息的质心坐标；比如计算得到第k帧目标图片信息有3个特征点，他们的像素坐标分别是(2,5)、(1,6)、(3,7)，可通过步骤S433的公式，计算得到质心坐标为(2,6)。同理，也可以根据步骤S434中的公式计算得到第k+N+1帧图片信息的质心坐标。

其次，计算得到所述第k帧目标图片信息的中心位置的像素坐标，由于在预测过程中，图片信息的中心坐标位置和该图片中的质心坐标位置总是呈近似的相对距离，这里为了方便，取相等距离，因此可以推出步骤S450中的公式。

根据步骤S450中所述的公式，计算得到第k+N+1帧图片信息的中心位置像素坐标。根据第k+N+1帧图片信息的中心位置像素坐标以及跟随目标的质心坐标，可以计算得到第k+N+1帧图片中跟随目标的位置具体在哪个地方，从而预测得到第k+N+1帧图片信息。通过上述方法，依次预测在采集到的第k+N+1至第k+2N-1帧图片中跟随目标的位置。

最后，在预测之后，机器人可以判断跟随目标具体是如何移动，根据检测的结果调整自身的位置。

如图10，11所示，以通过第一帧frame 1检测结果rect 1(即frame 1中包含人体上半身的部分，如图11中左侧的小矩形框)和采集的第n+1帧预测显示的第2帧为例。

首先，分别计算rect 1中的特征点和第n+1帧整张图的特征点，例如，FAST特征点。

其次，对这两个图片的特征点进行匹配。具体匹配方法为：通过K近邻一致性算法计算两张图的特征点相似度，并基于Ransac随机采样一致算法滤除错误匹配点，最终得到分别属于frame 1的内点集P(1)和frame n+1的内点集P(n+1)，这两组点集是一一对应匹配的。

再次，假设点集个数为n，则通过步骤S432中的公式分别计算P(1)和P(n+1)的质心；之后：预测第2帧图像中，人体上半身的位置；根据相邻帧中，目标关键点中心位置和该目标的矩形框中心位置总是呈近似的相对距离，这里为了方便，取相等距离。因此可以得到步骤S442中的公式，并且rect n+1的矩形框大小等于rect 1。如图11右边所示，预测的结果为虚线矩形框rect n+1，以便于显示模块可以将采集到的第n+1帧图片和预测的虚线矩形框rect n+1作为第2帧展示的图像。

最后，当采集模块采集到下一帧时，重复上述操作，即可不断的展示预测的上半身目标的位置。

预测模块的处理过程中，耗时部分在于计算特征点，而计算特征点只需要依次对图像中各个点及邻域3*3内的像素灰度进行比较，处理速度快(比较算法简单)；检测模块的处理过程中，需要对图片进行大量的卷积操作以提取特征点，其卷积核的参数高达几百万个，大量浮点型运算比较耗时。所以预测模块的处理速度要远远高于检测模块的检测速度。

如图5所示，本发明提供了一种基于机器人的目标图像显示处理系统的一个实施例，包括：

采集模块1，用于对视频帧图像进行连续采集；

检测模块2，与采集模块1电连接，在采集到的第k帧图片中检测到跟随目标时，检测所述跟随目标在所述第k帧图片的位置信息；

显示模块4，与所述检测模块2电连接，用于在时间轴第k+N+1帧图片处显示所述第k帧图片，并标记出所述跟随目标在所述第k帧图片的位置；N为一个检测周期内所采集的帧图片数量；

预测模块3，与所述检测模块电连接，用于根据所述跟随目标在所述第k帧图片的位置信息，依次预测在采集到的第k+N+1至第k+2N-1帧图片中跟随目标的位置；

所述显示模块4，还用于在时间轴第k+N+2至k+2N帧图片处依次显示所述k+N+1至k+2N-1帧图片以及所述预测的跟随目标的位置。

具体的，采集模块可以由机器人上安装的摄像头构成，用于采集跟随目标的图像，当跟随目标出现在机器人视野范围内时，机器人开始连续采集含有跟随目标的图片；在采集到第N帧图片信息时，机器人的检测模块刚好检测完第1帧图片信息得到第1帧目标图片信息，并通过显示模块在时间轴上第N+1帧的位置显示检测完的第1帧目标图片。之后，机器人跳过对第N+2帧图片信息到第2N帧图片信息的检测，直接对第N+1帧图片信息进行检测，并在时间轴第2N帧的位置显示检测之后的第N+1帧目标图片信息。

由于机器人在连续采集图片信息，当检测完第1帧图片信息并显示后，根据检测得到的第1帧目标图片信息和采集到的第N+1帧图片信息，预测得到第2帧目标图片信息，并在时间轴第N+2的位置显示预测出来的第2帧目标图片信息。重复执行上述预测功能，可以得到第3帧目标图片信息，直到预测出并显示出第2N-1帧目标预测图片信息通过本实施例提供的预测功能，能够弥补现有技术出现跳频和卡顿的现象。

如图6所示，本发明提供了一种基于机器人的目标图像显示处理系统的另一个实施例，包括：

采集模块1，用于对视频帧图像进行连续采集；

预测模块3，与所述检测模块2电连接，用于根据所述跟随目标在所述第k帧图片的位置信息，依次预测在采集到的第k+N+1至第k+2N-1帧图片中跟随目标的位置；

所述显示模块4，还用于在时间轴第k+N+2至k+2N帧图片处依次显示所述k+N+1至k+2N-1帧图片以及所述预测的跟随目标的位置；

预测模块3包括：

计算子模块31，用于分别计算出所述第k帧图片跟随目标对应的第k特征点信息和采集到的第k+N+1帧图片跟随目标对应的第k+N+1特征点信息；

匹配子模块32，与所述计算子模块31电连接，对所述第k特征点信息和所述第k+N+1特征点信息进行匹配，分别得到第k特征点集、第k+N+1特征点集；

所述计算子模块31，还用于根据所述第k特征点集计算出所述第k特征点集的第k质心信息，以及根据所述第k+N+1特征点集计算出所述第k+N+1特征点集的第k+N+1质心信息；

预测子模块33，用于根据所述第k质心信息、所述第k+N+1质心信息以及所述第k帧目标图片信息的中心位置信息，预测得到第k+1帧目标预测图片信息。

在本实施例中，对如何根据检测得到的第k帧目标图片信息，和采集到的第k+N+1帧图片信息，预测得到第k+N+1帧图片跟随目标的位置进行了具体的阐述。首先，图像处理模块运用现有的一些对图片中特征点的处理方法，分别得到所述第k帧目标图片信息对应的第k特征点信息和采集到的第k+N+1帧图片信息对应的第k+N+1特征点信息，如每个特征点在图片中的像素坐标；其次对所述第k特征点信息和所述第k+N+1特征点信息进行匹配，分别得到第k特征点集、第k+N+1特征点集，这两个特征点集中的特征点都是两两对应的关系；再次，根据所述第k特征点集、所述第k+N+1特征点集，计算模块分别计算出所述第k特征点集的第k质心信息、第k+N+1特征点集的第k+N+1质心信息，所述的特征信息包括质心在图片中的像素坐标；最后，根据所述第k质心信息、所述第k+N+1质心信息以及所述第k帧目标图片信息的中心位置信息，预测得到第k+N+1帧目标预测图片信息。

如图7所示，本发明提供了一种基于机器人的目标图像显示处理系统的另一个实施例，包括：

采集模块1，用于对视频帧图像进行连续采集；

预测模块3包括：

预测子模块33，用于根据所述第k质心信息、所述第k+N+1质心信息以及所述第k帧目标图片信息的中心位置信息，预测得到第k+1帧目标预测图片信息；

匹配子模块32包括：

图片处理单元321，用于根据K邻近一致性算法计算所述第k特征点信息和所述第k+N+1特征点信息的相似度，得到对应的匹配点；

所述图片处理单元321，还用于根据Ransac随机采样一致算法滤除错误匹配点，得到所述第k特征点集和所述第k+N+1特征点集；

所述计算子模块31，还用于根据所述第k特征点集计算得到第k帧目标图片信息内所有特征点的像素坐标，以及根据所述第k+N+1特征点集计算得到第k+N+1帧图片信息内所有特征点的像素坐标；

所述计算子模块31，还用于根据所述第k帧目标图片信息内所有特征点的像素坐标计算得到所述第k质心像素坐标作为第k质心信息，以及根据所述第k+N+1帧图片信息内所有特征点的像素坐标计算得到所述第k+N像素坐标信息作为第k+N+1质心信息。

所述计算子模块31，还用于计算得到所述第k帧目标图片信息的中心位置像素坐标作为中心位置信息；

所述计算子模块31，还用于根据所述第k质心像素坐标、所述第k+N+1质心像素坐标、所述第k帧图片信息的中心位置像素坐标，计算得到所述第k+N+1帧图片信息的中心位置像素坐标，其计算公式如下：

R(k+N+1)＝R(k)-C(k)+C(k+N+1)

具体的，本实施例主要阐述了如何对所述第k特征点信息和所述第k+N+1特征点信息进行匹配，分别得到第k特征点集、第k+N+1特征点集的过程；以及如何根据所述第k特征点集、所述第k+N+1特征点集，分别计算出所述第k特征点集的第k质心信息、第k+N+1特征点集的第k+N+1质心信息的过程。

首先，匹配子模块可以通过特征点检测方法分别得到所述第k帧目标图片信息对应的第k特征点信息和采集到的第k+N+1帧图片信息对应的第k+N+1特征点信息，如用FAST特征点检测方法得到第k帧目标图片信息对应的第k特征点信息和采集到的第k+N+1帧图片信息对应的第k+N+1特征点信息；

其次，根据K邻近一致性算法计算所述第k特征点信息和所述第k+N+1 特征点信息的相似度，图片处理模块可以得到对应的匹配点。在实际情况中，两张图片不一样，计算得到的特征点也不全是相同的，因此，需要根据K邻近一致性算法计算第k特征点信息和所述第k+N+1特征点信息的相似度，得到两张图片对应的匹配点。

再次，根据Ransac随机采样一致算法滤除错误匹配点，得到所述第k特征点集和所述第k+N+1特征点集。在实际情况中，图片计算出来的特征点除了跟随目标的特征点以外，还有其他背景图片中的一些特征点，这些特征点其实并不是检测和预测所需要的特征点，所以需要根据Ransac随机采样一致算法滤除错误匹配点，得到正确的特征点，也就是所述的第k特征点集和所述的第k+N+1特征点集。

本实施例中，在计算得到第k帧目标图片信息所有特征点像素坐标之后，可以根据步骤S433的公式，计算得到第k帧图片信息的质心坐标；比如计算得到第k帧目标图片信息有3个特征点，他们的像素坐标分别是(2,5)、(1,6)、(3,7)，可通过公式，计算得到质心坐标为(2,6)。同理，也可以根据步骤S434中的公式计算得到第k+N帧图片信息的质心坐标。

之后，可以计算得到所述第k帧目标图片信息的中心位置的像素坐标，由于在预测过程中，图片信息的中心坐标位置和该图片中的质心坐标位置总是呈近似的相对距离，这里为了方便，取相等距离，因此可以得到公式：R(k)-C(k)＝R(k+N+1)-C(k+N+1)，从而可以推到出公式：R(k+N+1)＝R(k)-C(k)-C(k+N+1)。

根据步骤S450中所述的公式，计算得到第k+N+1帧图片信息的中心位置像素坐标。根据第k+N+1帧图片信息的中心位置像素坐标，就可以计算得到第k+N+1帧图片信息的位置具体在哪个位置，从而预测得到第k+N+1帧图片中跟随目标的位置。通过上述方法，还可以预测得到第k+N+2帧目标预测图片信息～第k+2N-1帧目标预测图片信息。

应当说明的是，上述实施例均可根据需要自由组合。以上所述仅是本发明的优选实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本发明原理的前提下，还可以做出若干改进和润饰，这些改进和润饰也应视为本发明的保护范围。

Claims

一种基于机器人的目标图像显示处理方法，其特征在于，包括步骤：

S10对视频帧图像进行连续采集；

S20在采集到的第k帧图片中检测到跟随目标时，检测所述跟随目标在所述第k帧图片的位置信息；

S30在时间轴第k+N+1帧处显示所述第k帧图片，并标记出所述跟随目标在所述第k帧图片的位置，N为一个检测周期内所采集的图片数量；

S40根据所述跟随目标在所述第k帧图片的位置信息，依次预测在采集到的第k+N+1至第k+2N-1帧图片中跟随目标的位置；

S50在时间轴第k+N+2至k+2N帧处依次显示所述k+N+1至k+2N-1帧图片以及所述预测的跟随目标的位置。
如权利要求1所述的一种基于机器人的目标图像显示处理方法，其特征在于，步骤S40中根据所述跟随目标在所述第k帧图片的位置信息，依次预测在采集到的第k+N+1至第k+2N-1帧图片中跟随目标的位置具体为：

根据所述跟随目标在所述第k帧图片的位置信息，预测在第k+N+1帧图片中跟随目标的位置，以及根据第k+N+i帧图片中跟随目标的位置，预测k+N+i+1帧图片中跟随目标的位置；其中i分别为1～N-2的正整数。
如权利要求1所述的一种基于机器人的目标图像显示处理方法，其特征在于，该方法进一步包括：

在步骤S30中显示所述第k帧图片的同时，对采集到的第k+N帧图片进行检测，以及在步骤S50之后，在时间轴第k+2N+1帧图片处显示所述k+N帧图片以及所述检测到的跟随目标的位置。
如权利要求1或2所述的一种基于机器人的目标图像显示处理方法，其特征在于，根据所述跟随目标在所述第k帧图片的位置信息，预测在第k+N+1帧中跟随目标的位置具体为：

S41分别计算出所述第k帧图片跟随目标对应的第k特征点信息和采集到的第k+N+1帧图片跟随目标对应的第k+N+1特征点信息；

S42对所述第k特征点信息和所述第k+N+1特征点信息进行匹配，分别得到第k特征点集、第k+N+1特征点集；

S43根据所述第k特征点集计算出所述第k特征点集的第k质心信息，以及根据所述第k+N+1特征点集计算出所述第k+N+1特征点集的第k+N+1质心信息；

S44根据所述第k质心信息、所述第k+N+1质心信息以及所述第k帧目标图片信息的中心位置信息，预测得到第k+N+1帧图片中所述跟随目标的位置。
如权利要求4所述的一种基于机器人的目标图像显示处理方法，其特征在于，S42中对所述第k特征点信息和所述第k+N+1特征点信息进行匹配的步骤具体包括：

S421根据K邻近一致性算法计算所述第k特征点信息和所述第k+N+1特征点信息的相似度，得到对应的匹配点；

S422根据Ransac随机采样一致算法滤除错误匹配点，得到所述第k特征点集和所述第k+N+1特征点集。
如权利要求4所述的一种基于机器人的目标图像显示处理方法，其特征在于，步骤S43中计算所述第k+N+1特征点集的第k+N+1质心信息具体包括：

S431根据所述第k特征点集计算得到第k帧目标图片信息内所有特征点的像素坐标，以及根据所述第k+N+1特征点集计算得到第k+N+1帧图片信息内所有特征点的像素坐标；

S432根据所述第k帧目标图片信息内所有特征点的像素坐标计算得到所述第k质心像素坐标作为第k质心信息，以及根据所述第k+N+1帧图片信息内所有特征点的像素坐标计算得到所述第k+N+1像素坐标信息作为第k+N+1质心信息。
如权利要求6所述的一种基于机器人的目标图像显示处理方法，其特征在于：

所述步骤S432中所述的第k质心像素坐标的计算公式如下：

其中，P(k)(j)表示第k帧目标图片信息对应的第k特征点集中第j个特征点的像素坐标，C(k)表示所述第k质心像素坐标；

所述步骤S432中所述的第k+N+1质心像素坐标的计算公式如下；

其中，P(k+N+1)(j)表示第k+N+1帧图片信息对应的第k+N+1特征点集中第j个特征点的像素坐标，C(k+N+1)表示所述第k+N+1质心像素坐标。
如权利要求7所述的一种基于机器人的目标图像显示处理方法，其特征在于，步骤S44中预测得到第k+N+1帧图片中跟随目标的位置具体为：

S441计算得到所述第k帧目标图片信息的中心位置像素坐标作为中心位置信息；

S442根据所述第k质心像素坐标、所述第k+N+1质心像素坐标、所述第k帧图片信息的中心位置像素坐标，计算得到所述第k+N+1帧图片信息的中心位置像素坐标，其计算公式如下：

R(k+N+1)＝R(k)-C(k)+C(k+N+1)

其中，R(k+N+1)表示所述第k+N+1帧图片信息的中心位置像素坐标，R(k)表示所述第k帧目标图片信息的中心位置像素坐标，C(k)表示所述第k质心像素坐标，C(k+N+1)所述第k+N+1质心像素坐标。
一种基于机器人的目标图像显示处理系统，其特征在于，包括：

采集模块，用于对视频帧图像进行连续采集；

检测模块，与采集模块电连接，在采集到的第k帧图片中检测到跟随目标时，检测所述跟随目标在所述第k帧图片的位置信息；

显示模块，与所述检测模块电连接，用于在时间轴第k+N+1帧图片处显示所述第k帧图片，并标记出所述跟随目标在所述第k帧图片的位置，N为一个检测周期内所采集的帧图片数量；

预测模块，与所述检测模块电连接，用于根据所述跟随目标在所述第k帧图片的位置信息，依次预测在采集到的第k+N+1至第k+2N-1帧图片中跟随目标的位置；

所述显示模块，还用于在时间轴第k+N+2至k+2N帧图片处依次显示所述k+N+1至k+2N-1帧图片以及所述预测的跟随目标的位置。
如权利要求9所述的一种基于机器人的目标图像显示处理系统，其特征在于：

所述预测模块还用于根据所述跟随目标在所述第k帧图片的位置信息，预测在第k+N+1帧中跟随目标的位置，以及根据第k+N+i帧中跟随目标的位置，预测k+N+i+1帧中跟随目标的位置；其中i分别为1～N-2的正整数。
如权利要求9所述的一种基于机器人的目标图像显示处理系统，其特征在于：

所述检测模块还用于显示所述第k帧图片的同时，对采集到的第k+N帧图片进行检测；

所述显示模块还用于在时间轴第k+2N+1帧图片处显示所述k+N帧图片以及所述检测到的跟随目标的位置。
如权利要求9或10所述的一种基于机器人的目标图像显示处理系统，其特征在于，所述预测模块还包括：

计算子模块，用于分别计算出所述第k帧图片跟随目标对应的第k特征点信息和采集到的第k+N+1帧图片跟随目标对应的第k+N+1特征点信息；

匹配子模块，与所述计算子模块电连接，对所述第k特征点信息和所述第k+N+1特征点信息进行匹配，分别得到第k特征点集、第k+N+1特征点集；

所述计算子模块，还用于根据所述第k特征点集计算出所述第k特征点集的第k质心信息，以及根据所述第k+N+1特征点集计算出所述第k+N+1特征点集的第k+N+1质心信息；

预测子模块，用于根据所述第k质心信息、所述第k+N+1质心信息以及所述第k帧目标图片信息的中心位置信息，预测得到第k+1帧目标预测图片信息。
如权利要求12所述的一种基于机器人的目标图像显示处理系统，其特征在于，所述匹配子模块还包括：

图片处理单元，用于根据K邻近一致性算法计算所述第k特征点信息和所述第k+N+1特征点信息的相似度，得到对应的匹配点；

所述图片处理单元，还用于根据Ransac随机采样一致算法滤除错误匹配点，得到所述第k特征点集和所述第k+N+1特征点集。
如权利要求12所述的一种基于机器人的目标图像显示处理系统，其特征在于：

所述计算子模块，还用于根据所述第k特征点集计算得到第k帧目标图片信息内所有特征点的像素坐标，以及根据所述第k+N+1特征点集计算得到第k+N+1帧图片信息内所有特征点的像素坐标；

所述计算子模块，还用于根据所述第k帧目标图片信息内所有特征点的像素坐标计算得到所述第k质心像素坐标作为第k质心信息，以及根据所述第k+N+1帧图片信息内所有特征点的像素坐标计算得到所述第k+N像素坐标信息作为第k+N+1质心信息。
如权利要求14所述的一种基于机器人的目标图像显示处理系统，其特征在于：

所述计算子模块，还用于计算所述第k质心像素坐标，计算公式如下：

其中，P(k)(j)表示第k帧目标图片对应的第k特征点集中第j个特征点的像素坐标，C(k)表示所述第k质心像素坐标；

所述计算子模块，还用于计算所述第k+N+1质心像素坐标，计算公式如下；

其中，P(k+N+1)(j)表示第k+N+1帧图片信息对应的第k+N+1特征点集中第j个特征点的像素坐标，C(k+N+1)表示所述第k+N+1质心像素坐标。
如权利要求15所述的一种基于机器人的目标图像显示处理系统，其特征在于：

所述计算子模块，还用于计算得到所述第k帧目标图片信息的中心位置像素坐标作为中心位置信息；

所述计算子模块，还用于根据所述第k质心像素坐标、所述第k+N+1 质心像素坐标、所述第k帧图片信息的中心位置像素坐标，计算得到所述第k+N+1帧图片信息的中心位置像素坐标，其计算公式如下：

R(k+N+1)＝R(k)-C(k)+C(k+N+1)

其中，R(k+N+1)表示所述第k+N+1帧图片信息的中心位置像素坐标，R(k)表示所述第k帧目标图片信息的中心位置像素坐标，C(k)表示所述第k质心像素坐标，C(k+N+1)所述第k+N+1质心像素坐标。