WO2019228196A1

WO2019228196A1 - 一种全景视频的目标跟踪方法和全景相机

Info

Publication number: WO2019228196A1
Application number: PCT/CN2019/087274
Authority: WO
Inventors: 蔡锦霖; 姜文杰; 陈聪
Original assignee: 深圳岚锋创视网络科技有限公司
Priority date: 2018-05-30
Filing date: 2019-05-16
Publication date: 2019-12-05
Also published as: JP2021527865A; US20210227132A1; US11509824B2; CN108848304A; JP7048764B2; EP3817360A1; JP7048764B6; EP3817360A4; CN108848304B

Abstract

本发明适用于全景相机领域，提供了一种全景视频的目标跟踪方法和全景相机。所述方法基于多尺度相关滤波器对全景视频的目标进行跟踪，并采用自动电子云台技术。本发明跟踪的鲁棒性更高，可以应对更多的跟踪场景，而且处理速度更快，且可以使跟踪目标始终处于画面中心。

Description

一种全景视频的目标跟踪方法和全景相机

技术领域

本发明属于全景相机领域，尤其涉及一种全景视频的目标跟踪方法和全景相机。

背景技术

目标跟踪是计算机视觉研究中的经典问题，是指计算机、摄像机等根据某种算法对目标进行跟踪和定位，并根据目标的位置和动向采取相应的策略。近些年来，目标跟踪被广泛应用于视频监控、视频编码以及军事工程等各种领域。现有技术的全景相机可以捕获到周围360°视频信息，也有一些技术方案能实现在全景视频中进行目标跟踪，例如申请公布号为CN107315992A公开的“一种基于电子云台的跟踪方法及装置”。然而，该方法是基于特征点的跟踪，无法对一些纹理区域色彩单一，特征点不丰富的场景进行跟踪。

技术问题

本发明的目的在于提供一种全景视频的目标跟踪方法、计算机可读存储介质和全景相机，旨在解决现有技术的全景相机无法对一些纹理区域色彩单一，特征点不丰富的场景进行跟踪的问题。

技术解决方案

第一方面，本发明提供了一种全景视频的目标跟踪方法，所述方法包括：

S201、初始化跟踪目标在球面坐标系的位置及尺度，计算电子云台参数，将全景图像映射到当前电子云台视角图像；

S202、在当前电子云台视角图像上基于多尺度相关滤波器进行目标跟踪，并得到新的跟踪目标的位置以及尺度；

S203、将新的跟踪目标的位置映射回全景球面方位坐标；

S204、根据全景球面方位坐标和尺度计算电子云台的参数，映射到当前的电子云台视角图像，得到新的视频帧，然后返回S201，直至全景视频结束。

第二方面，本发明提供了一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，所述计算机程序被处理器执行时实现如上述的全景视频的目标跟踪方法的步骤。

第三方面，本发明提供了一种全景相机，包括：

一个或多个处理器；

存储器；以及

一个或多个计算机程序，其中所述一个或多个计算机程序被存储在所述存储器中，并且被配置成由所述一个或多个处理器执行，其特征在于，所述处理器执行所述计算机程序时实现如上述的全景视频的目标跟踪方法的步骤。

有益效果

在本发明中，由于是基于多尺度相关滤波器对全景视频的目标进行跟踪，跟踪的鲁棒性更高，可以应对更多的跟踪场景，而且处理速度更快；另外，由于通过自动电子云台技术，因此可以使跟踪目标始终处于画面中心。

附图说明

图1是本发明实施例一提供的全景视频的目标跟踪方法的流程图。

图2是本发明实施例三提供的全景相机的具体结构框图。

本发明的实施方式

为了使本发明的目的、技术方案及有益效果更加清楚明白，以下结合附图及实施例，对本发明进行进一步详细说明。应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。

为了说明本发明所述的技术方案，下面通过具体实施例来进行说明。

实施例一：

请参阅图1，本发明实施例一提供的全景视频的目标跟踪方法包括以下步骤：需注意的是，若有实质上相同的结果，本发明的全景视频的目标跟踪方法并不以图1所示的流程顺序为限。

S201、初始化跟踪目标在球面坐标系的位置及尺度，计算电子云台参数，将全景图像映射到当前电子云台视角图像，即当前局部的透视视图；

S203、将新的跟踪目标的位置映射回全景球面方位坐标；

在本发明实施例一中，得到新的视频帧之后，所述方法还可以包括以下步骤：

S205、用卡尔曼滤波器对视频帧的中心的坐标点进行平滑，使得输出的全景视频更平稳。

在本发明实施例一中，S201具体可以包括以下步骤：

S2011、初始化跟踪目标在球面坐标系的位置及尺度。

S2012、通过电子云台(ePTZ)旋转虚拟相机到跟踪目标所在视角，调整虚拟相机的焦距，得到初始的电子云台参数

初始的电子云台参数使虚拟相机中心对准初始化的跟踪目标的位置，其中，

用于控制虚拟相机上下倾斜，

用于控制虚拟相机左右移动，

用于控制虚拟相机缩放。

电子云台技术是指通过程序设置，在摄像机内部控制镜头的视角和变焦的技术。电子云台技术可以模拟PTZ相机，实现相机的左右移动、上下倾斜以及缩放。电子云台技术包括对跟踪位置的相机运动的平滑和预测。

S2013、根据初始的电子云台参数对全景图像进行重投影变换到当前电子云台视角图像。

在本发明实施例一中，S2013具体可以为：

由

公式(1)对全景图像进行重投影变换到当前电子云台视角图像，其中，

是

映射到电子云台视角图像中的坐标位置，

是全景图像坐标转化为单位圆上三维坐标，

公式(2)，K _k是虚拟相机透视矩阵，R _k是世界坐标系到虚拟相机的坐标系，

θ＝||q||，

为世界坐标系归一化球面坐标，

为P _u,v在虚拟相机成像面坐标，

用于控制虚拟相机缩放，c _x，c _y为虚拟相机投影中心，u和v是全景图像的二维坐标，分别归一化到[0,2π],[0,π]，P _u,v代表这个二维坐标映射到三维坐标上的点，q _x、q _y和q _z是q的三个分量；这里只是为了简化公式R _k，用

和

替代q，可以推导其公式。θ只是参数表示，此处，θ＝||q||，没有具体含义，用

替代Φ(q)中的q可以得到此处相机旋转量R _k计算推导方法。

S2014、在当前电子云台视角图像中，接收用户手动选择的跟踪目标的位置。

在本发明实施例一中，所述跟踪目标的位置具体可以是跟踪目标的矩形框

其中，

表示初始化的跟踪目标的矩形框中心，w ₀,h ₀分别表示跟踪目标的矩形框的宽和高，x ₀和y ₀是跟踪目标的矩形框的中心坐标；

S2015、根据在当前电子云台视角图像中的跟踪目标的位置计算跟踪目标在球面坐标系的位置及尺度。

在本发明实施例一中，S2015具体可以为：

由

计算跟踪目标在球面坐标系的位置及尺度

其中，

其中，s ₀是当前检测的跟踪目标的尺度，可以用跟踪目标的宽度表示，f ₀是虚拟相机的焦距，h ₀是矩形框的高，

用于控制虚拟相机上下倾斜，

用于控制虚拟相机左右移动，

用于控制虚拟相机缩放。

和

分别是初始计算的虚拟相机上下倾角和左右移动量。θ _k、

是计算的跟踪目标所在的球面坐标位置，

是卡尔曼滤波器平滑的视点坐标位置。θ ₀、

为初始位置，

即初始时虚拟相机以跟踪目标为中心。

在本发明实施例一中，S202具体可以包括以下步骤：

S2021、选取跟踪目标邻域范围内平移跟踪目标的矩形框得到预定数量训练样本来训练位置跟踪模型。

在本发明实施例一中，S2021具体包括以下步骤：

将位置跟踪模型的代价函数(代价函数是指用于衡量预测值和真实值之前的差异的函数)

公式(3)转换到傅里叶域：

公式(4)采用梯度下降法可以求解公式(4)的解为

其中，

分别表示k时刻跟踪目标第l个训练样本的Hog(Histogram of Oriented Gradient)特征和相应的傅里叶域的特征，g _k、G _k分别表示高斯回归矩阵特征和相应的傅里叶域的特征，d表示样本的个数，

表示卷积，

分别表示k时刻的相关滤波系数和相应的傅里叶域的特征，λ(λ≥0)表示正则项系数，

表示G _k的复数共轭，

表示

的复数共轭。

S2022、根据位置跟踪模型的解

来迭代更新位置跟踪模型的参数。

在本发明实施例一中，S2022具体包括以下步骤：

根据位置跟踪模型的解

来更新位置跟踪模型的参数如下：

其中，

表示第0帧位置跟踪模型的参数，

表示k-1时刻的位置跟踪模型的参数，

表示k时刻的位置跟踪模型的参数，η表示学习率，表示模型更新快慢，

S2023、根据当前电子云台输出位置和尺寸以及位置跟踪模型的参数预测跟踪目标的平移位置。

在本发明实施例一中，S2023具体包括以下步骤：

由k-1的跟踪目标的位置预测后一帧的电子云台参数，并由S2014计算跟踪目标在当前电子云台参数下的跟踪目标的平面位置

以及尺寸

公式(10)，其中，λ表示正则化参数(一般取值0.01)，B _k、

都表示跟踪模型在k时刻的模型参数(在S2022计算)，d表示样本数量，F ^-1表示逆傅里叶变换，

表示在k时刻电子云台输出位置和尺寸所确定的跟踪目标区域Hog特征的傅里叶变换，response _k表示K时刻跟踪目标的响应图，即该响应图中每个点的值等于样本与跟踪目标的相似度，找到响应图中像素值最大位置就是找到跟跟踪目标最相似的位置。即：跟踪目标的平移位置p _k＝findMax(response _k)。

S2024、根据由尺度变化增大或缩小跟踪目标的矩形框大小获得尺度跟踪模型的训练样本，重复S2021至S2023得到相关滤波的尺度s _k。

在本发明实施例一中，S2024具体包括以下步骤：

通过公式

中

获得方式，即由尺度变化增大或缩小跟踪目标的矩形框大小获得尺度跟踪模型的训练样本，重复S2021至S2023得到相关滤波的尺度s _k。

尺度变化是指在保持跟踪目标的平移位置p _k不变，跟踪目标的矩形框的宽和高都乘以一个系数，得到一个新的矩形区域，作为新的样本。尺度变化由下面公式给出：

s _i＝a ⁱw+a ⁱh

其中，w是指跟踪目标的矩形框的宽，h指跟踪目标的矩形框的高，S表示尺度的个数，这里取33。a＝1.01表示尺度因子。在每个尺度上都可以计算出一个最大相似度，比较找到最大相似度的尺度作为当前跟踪目标的尺度s _k。

S2025、根据由跟踪目标的平移位置p _k和尺度s _k，得到新的跟踪目标的矩形框。

新的跟踪目标的矩形框表示为

其中w _k-1,h _k-1表示第k-1帧的跟踪目标的矩形框的宽和高。

S2026、计算新的跟踪目标的矩形框rect _k在球面坐标系的位置及尺度。

实施例二：

本发明实施例二提供了一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，所述计算机程序被处理器执行时实现如本发明实施例一提供的全景视频的目标跟踪方法的步骤。

实施例三：

图2示出了本发明实施例三提供的全景相机的具体结构框图，一种全景相机100包括：一个或多个处理器101、存储器102、以及一个或多个计算机程序，其中所述处理器101和所述存储器102通过总线连接，所述一个或多个计算机程序被存储在所述存储器102中，并且被配置成由所述一个或多个处理器101执行，所述处理器101执行所述计算机程序时实现如本发明实施例一提供的全景视频的目标跟踪方法的步骤。

本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成，该程序可以存储于一计算机可读存储介质中，存储介质可以包括：只读存储器(ROM，Read Only Memory)、随机存取记忆体(RAM，Random Access Memory)、磁盘或光盘等。

以上所述仅为本发明的较佳实施例而已，并不用以限制本发明，凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等，均应包含在本发明的保护范围之内。

Claims

一种全景视频的目标跟踪方法，其特征在于，所述方法包括：

S201、初始化跟踪目标在球面坐标系的位置及尺度，计算电子云台参数，将全景图像映射到当前电子云台视角图像；

S202、在当前电子云台视角图像上基于多尺度相关滤波器进行目标跟踪，并得到新的跟踪目标的位置以及尺度；

S203、将新的跟踪目标的位置映射回全景球面方位坐标；

S204、根据全景球面方位坐标和尺度计算电子云台的参数，映射到当前的电子云台视角图像，得到新的视频帧，然后返回S201，直至全景视频结束。
如权利要求1所述的方法，其特征在于，所述得到新的视频帧之后，所述方法还包括以下步骤：

S205、用卡尔曼滤波器对视频帧的中心的坐标点进行平滑，使得输出的全景视频更平稳。
如权利要求1或2所述的方法，其特征在于，S201具体包括：

S2011、初始化跟踪目标在球面坐标系的位置及尺度；

S2012、通过电子云台旋转虚拟相机到跟踪目标所在视角，调整虚拟相机的焦距，得到初始的电子云台参数
初始的电子云台参数使虚拟相机中心对准初始化的跟踪目标的位置，其中，
用于控制虚拟相机上下倾斜，
用于控制虚拟相机左右移动，
用于控制虚拟相机缩放；

S2013、根据初始的电子云台参数对全景图像进行重投影变换到当前电子云台视角图像；

S2014、在当前电子云台视角图像中，接收用户手动选择的跟踪目标的位置；

S2015、根据在当前电子云台视角图像中的跟踪目标的位置计算跟踪目标在球面坐标系的位置及尺度。
如权利要求3所述的方法，其特征在于，S202具体包括：

S2021、选取跟踪目标邻域范围内平移跟踪目标的矩形框得到预定数量训练样本来训练位置跟踪模型；

S2022、根据位置跟踪模型的解来迭代更新位置跟踪模型的参数；

S2023、根据当前电子云台输出位置和尺寸以及位置跟踪模型的参数预测跟踪目标的平移位置；

S2024、根据由尺度变化增大或缩小跟踪目标的矩形框大小获得尺度跟踪模型的训练样本，重复S2021至S2023得到相关滤波的尺度；

S2025、根据由跟踪目标的平移位置和尺度，得到新的跟踪目标的矩形框；

S2026、计算新的跟踪目标的矩形框在球面坐标系的位置及尺度。
如权利要求4所述的方法，其特征在于，所述S2013具体为：

由
公式(1)对全景图像进行重投影变换到当前电子云台视角图像，其中，
是
映射到电子云台视角图像中的坐标位置，
是全景图像坐标转化为单位圆上三维坐标，
公式(2)，K _k是虚拟相机透视矩阵，R _k是世界坐标系到虚拟相机的坐标系，

θ＝||q||，

为世界坐标系归一化球面坐标，
为P _u,v在虚拟相机成像面坐标，
用于控制虚拟相机缩放，c _x，c _y为虚拟相机投影中心，u和v 是全景图像的二维坐标，分别归一化到[0,2π],[0,π]，P _u,v代表这个二维坐标映射到三维坐标上的点，q _x、q _y和q _z是q的三个分量；为了简化公式R _k，用
和
替代q，θ是参数表示，θ＝||q||，没有具体含义，用
替代Φ(q)中的q得到相机旋转量R _k计算推导方法；

所述跟踪目标的位置具体是跟踪目标的矩形框
其中，
表示初始化的跟踪目标的矩形框中心，w ₀,h ₀分别表示跟踪目标的矩形框的宽和高，x ₀和y ₀是跟踪目标的矩形框的中心坐标；

所述S2015具体为：

由
计算跟踪目标在球面坐标系的位置及尺度
其中，
其中，s ₀是当前检测的跟踪目标的尺度，用跟踪目标的宽度表示，f ₀是虚拟相机的焦距，h ₀是矩形框的高，
用于控制虚拟相机上下倾斜，
用于控制虚拟相机左右移动，
用于控制虚拟相机缩放，
和
分别是初始计算的虚拟相机上下倾角和左右移动量，θ _k、
是计算的跟踪目标所在的球面坐标位置，
是卡尔曼滤波器平滑的视点坐标位置，θ ₀、
为初始位置，
即初始时虚拟相机以跟踪目标为中心。
如权利要求5所述的方法，其特征在于，所述S2021具体包括：

将位置跟踪模型的代价函数
公式(3)转换到傅里叶域：
公式(4)采用梯度下降法求解公式(4)的解为
其中，
分别表示k时刻跟踪目标第l个训练样本的Hog特征和相应的傅里叶域的特征，g _k、G _k分别表示高斯回归矩阵特征和相应的傅里叶域的特征，d表示样本的个数，
表示卷积，
分别表示k时刻的相关滤波系数和相应的傅里叶域的特征，λ(λ≥0)表示正则项系数，
表示G _k的复数共轭，
表示
的复数共轭。
如权利要求6所述的方法，其特征在于，所述S2022具体包括：

根据位置跟踪模型的解
来更新位置跟踪模型的参数如下：

其中，
表示第0帧位置跟踪模型的参数，
表示k-1时刻的位置跟踪模型的参数，
表示k时刻的位置跟踪模型的参数，η表示学习率，表示模型更新快慢。
如权利要求7所述的方法，其特征在于，所述S2023具体包括：

由k-1的跟踪目标的位置预测后一帧的电子云台参数，并由S1013计算跟踪目标在当前电子云台参数下的跟踪目标的平面位置
以及尺寸

公式(10)，其中，λ表示正则化参数，B _k、
都表示跟踪模型在k时刻的模型参数，d表示样本数量，F ^-1表示逆傅里叶变换，
表示在k时刻电子云台输出位置和尺寸所确定的跟踪目标区域Hog特征的傅里叶变换，response _k表示K时刻跟踪目标的响应图，即该响应图中每个点的值等于样本与跟踪目标的相似度，找到响应图中像素值最大位置就是找到跟跟踪目标最相似的位置，即：跟踪目标的平移位置p _k＝findMax(response _k)。
如权利要求8所述的方法，其特征在于，所述S2024具体包括：

通过公式
中
获得方式，即由尺度变化增大或缩小跟踪目标的矩形框大小获得尺度跟踪模型的训练样本，重复S2021至S2023得到相关滤波的尺度s _k；

尺度变化是指在保持跟踪目标的平移位置p _k不变，跟踪目标的矩形框的宽和高都乘以一个系数，得到一个新的矩形区域，作为新的样本；尺度变化由下面公式给出：s _i＝a ⁱw+a ⁱh
其中，w是指跟踪目标的矩形框的宽，h指跟踪目标的矩形框的高，S表示尺度的个数，a＝1.01表示尺度因子，在每个尺度上都可以计算出一个最大相似度，比较找到最大相似度的尺度作为当前跟踪目标的尺度s _k。
一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1至9任一项所述的全景视频的目标跟踪方法的步骤。
一种全景相机，包括：

一个或多个处理器；

存储器；以及

一个或多个计算机程序，其中所述一个或多个计算机程序被存储在所述存储器中，并且被配置成由所述一个或多个处理器执行，其特征在于，所述处理器执行所述计算机程序时实现如权利要求1至9任一项所述的全景视频的目标跟踪方法的步骤。