CN116385496A

CN116385496A - 一种基于图像处理的游泳运动实时测速方法及系统

Info

Publication number: CN116385496A
Application number: CN202310565833.1A
Authority: CN
Inventors: 张超超; 孟祥涛; 向政; 黄磊; 赵合; 葛宏升; 付尧顺; 褚天琪
Original assignee: Beijing Aerospace Times Optical Electronic Technology Co Ltd
Current assignee: Beijing Aerospace Times Optical Electronic Technology Co Ltd
Priority date: 2023-05-19
Filing date: 2023-05-19
Publication date: 2023-07-04

Abstract

本发明公开了一种基于图像处理的游泳运动实时测速方法及系统，属于运动测量领域。通过架设在游泳馆顶部的摄像机实时采集画面后，首先使用YOLOv5对游泳运动员的泳帽进行目标检测，然后通过ISORT对YOLOv5中检测到的目标进行跟踪，得到运动员的图像坐标，最后通过外参标定得到世界坐标与图像坐标转换矩阵，进而得出运动员在泳道内的世界坐标和其速度。本发明根据游泳运动特点对SORT的损失函数进行改进，提出了ISORT跟踪算法，大幅提高匹配准确度。同时本发明能够解决惯导方法精度容易发散无法实时高精度反馈的问题。

Description

一种基于图像处理的游泳运动实时测速方法及系统

技术领域

本发明属于运动测量领域，涉及一种基于图像处理的游泳运动实时测速方法及系统。

背景技术

近年来，随着“科技助力体育” 口号的提出，通过科技手段实现运动指标的精准量化对提升运动员的水平至关重要。在游泳竞技中，速度量化是运动员水平和能力的直观体现。而由于在水下环境中进行测试的特定限制，速度测量一直是困扰业界人士的难题。当前传统的游泳运动测速方法精度容易发散，且无法实时高精度反馈结果。

采用图像信息跟踪的方法在游泳测速领域有较好的实用性，能根据视频帧率实时高精度反馈测速信息。但由于水对光线的吸收、散射、漫射等作用，水下拍摄的图像往往存在清晰度差，边缘锐度低等问题，且被测运动员在图片中呈不同尺度大小，对跟踪算法的特征提取能力和尺度适应能力有一定要求。

发明内容

本发明的技术解决问题是：提供一种基于图像处理的游泳运动实时测速方法及系统，解决现有游泳运动速度量化方法无法试试高精度反馈结果的问题，同时针对游泳运动特点，通过ISORT跟踪算法，大幅提高匹配准确度。

本发明的技术解决方案为：

一种基于图像处理的游泳运动实时测速方法，包括：

通过架设在游泳馆内的摄像机采集运动员日常训练视频，逐帧打标，完成训练数据集构建；

构建基于YOLOv5的目标检测模型；

使用训练数据集对基于YOLOv5的目标检测模型进行端到端训练；

获取经过内参校正的游泳馆实时图像；

通过基于YOLOv5的目标检测模型检测游泳馆实时图像中的所有运动员；

通过ISORT跟踪算法对检测的运动员进行实时跟踪，用于对当前帧的识别结果和之前帧跟踪轨迹进行匹配，获得相邻帧之间的位置差和时间差；

将游泳馆实时图像坐标转化为世界坐标，根据相邻帧之间的位置差和时间差实现游泳运动员的定位和测速。

优选的，所述的训练数据集构建过程为：

步骤11：将含有运动员的视频逐帧转化为图片，并将运动员泳帽定义为打标样本；

步骤12：对于首帧图片，由人工选择目标框；

步骤13：将步骤12中选择的目标框作为模板，输入至孪生结构的单目标跟踪器SiamBAN中，实现对首帧之后图片的该单目标持续性自动打标，获得训练目标检测网络的数据集。

优选的，步骤13的实现方式为：

所述孪生结构的单目标跟踪器SiamBAN包括两个分支：模板分支和搜索分支；将模板补丁输入模板分支的3层金字塔卷积模块，获得模板补丁的三层特征矩阵；将搜索补丁输入搜索分支的3层金字塔卷积模块，获得搜索补丁的三层特征矩阵；

将模板补丁的三层特征矩阵和搜索补丁的三层特征矩阵进行逐层互相关操作，获得两块补丁的三份互相关特征图；

将三份互相关特征图合并为一张，合并时同一位置的三个值取平均数，最后得到一份互相关特征图；

互相关特征图中与模板最相似区域即是跟踪目标，从而实现对首帧之后图片的单目标持续性自动打标，获得训练目标检测网络的数据集。

优选的，所述的基于YOLOv5的目标检测模型包括输入端、骨干网络、脖子网络与检测头，分别负责图像预处理、图像特征提取、特征多样化处理和预测目标的种类和包络框；

输入端输入运动员游泳场景图像，通过预处理将输入图像缩放到需要的尺寸，并使用自适应锚框计算进行图片自适应缩放；

骨干网络对图像进行多尺度特征提取；

脖子网络对多尺度特征进行融合，提升特征的多样性和模型的鲁棒性；

检测头输出目标检测结果的输出，用于预测运动员泳帽和对应包络框。

优选的，通过ISORT跟踪算法对检测的运动员进行实时跟踪，获得相邻帧之间的位置差和时间差，具体实现方式如下：

对第一帧图像经过YOLOv5检测到的所有目标，初始化并创建新的跟踪轨迹，标注ID；

第一帧后的任意一帧经过YOLOv5目标检测模型后，利用ISORT跟踪算法对检测的运动员进行实时跟踪，具体过程如下：

通过卡尔曼滤波获得之前轨迹所有目标的位置预测；

计算所述的位置预测和当前帧的目标检测框匹配损失矩阵；

通过匈牙利算法获得轨迹与当前帧的目标检测框相似度最大的唯一匹配，并更新该轨迹目标位置；对于未匹配到的目标检测框，则初始化并创建新的跟踪轨迹，标注ID；

根据匹配结果，对所有目标的跟踪轨迹更新并更新目标状态，获得相邻帧之间的位置差和时间差。

优选的，匹配损失矩阵计算方法为：

ISORT跟踪算法使用目标检测框与预测框之间的欧氏距离来描述运动关联程度：

其中，

和/>

表示第j个目标检测框的中心点位置横纵坐标，/>

和/>

表示第i个轨迹预测框的中心点位置横纵坐标，/>

为第j个目标检测框与第i个轨迹预测框之间的欧氏距离；

其中，匹配损失矩阵的第i行第j列元素为

表示第i个轨迹预测框与第j个目标检测框匹配的损失值； gate表示门控矩阵的阈值。

一种基于图像处理的游泳运动实时测速系统，包括摄像机采集模块、内参校正模块、训练数据集构建模块、目标识别模块、目标训练模块、目标跟踪模块、外参标定模块；

摄像机采集模块：用于采集运动员日常训练视频和游泳馆实时图像；

内参校正模块：对摄像机进行内参校正，以校正图片径向畸变和切向畸变；

训练数据集构建模块：用于逐帧识别运动员日常训练视频中的游泳运动员，进行逐帧打标；

目标训练模块：使用训练数据集对基于YOLOv5的目标检测模型进行端到端训练；

目标识别模块：通过基于YOLOv5的目标检测模型实时检测识别游泳馆实时图像中的所有运动员；

目标跟踪模块：通过ISORT跟踪算法对检测的运动员进行实时跟踪，用于对当前帧的识别结果和之前帧跟踪轨迹进行匹配，获得相邻帧之间的位置差和时间差；

外参标定模块：将游泳馆实时图像坐标转化为世界坐标，根据相邻帧之间的位置差和时间差实现游泳运动员的定位和测速。

优选的，训练数据集构建模块构建训练数据集过程为：

将含有运动员的视频逐帧转化为图片，并将运动员泳帽定义为打标样本；

对于首帧图片，由人工选择目标框；

将选择的目标框作为模板，输入至孪生结构的单目标跟踪器SiamBAN中，实现对首帧之后图片的该单目标持续性自动打标，获得训练目标检测网络的数据集。

优选的，目标跟踪模块实现方式如下：

通过卡尔曼滤波获得之前轨迹所有目标的位置预测；

计算所述的位置预测和当前帧的目标检测框匹配损失矩阵；

通过匈牙利算法获得轨迹与目标检测框相似度最大的唯一匹配，并更新该轨迹目标位置；对于未匹配到的目标检测框，则初始化并创建新的跟踪轨迹，标注ID；

优选的，匹配损失矩阵计算方法为：

其中，

和/>

表示第j个目标检测框的中心点位置横纵坐标，/>

和/>

表示第i个轨迹预测框的中心点位置横纵坐标，/>

为第j个目标检测框与第i个轨迹预测框之间的欧氏距离；

其中，匹配损失矩阵的第i行第j列元素为

表示第i个轨迹预测框与第j个目标检测框匹配的损失值；gate表示门控矩阵的阈值。

与现有技术相比，本发明具有如下有益效果：

（1）本发明采用目标跟踪的方法对游泳馆内所有运动员测速，对运动员检测精度高和跟踪速度快，有效解决了传统游泳运动测速方法精度容易发散，且无法实时高精度反馈结果的问题。

（2）本发明采用ISORT目标跟踪算法，提高了数据关联的准确性，有效的降低了不同泳道运动员在跟踪过程中的干扰，提高了跟踪准确率。

附图说明

图1为基于YOLOv5的目标检测模型示意图。

图2为ISORT多目标跟踪算法流程图；

图3为本发明流程图。

具体实施方式

下面结合附图和技术方案，进一步说明本发明的具体实施方式。

针对使用图像信息实现水下目标跟踪的难题，深度学习图像处理方法可以使用深度卷积计算提取图像的抽象特征，充分利用像素信息，以此来提高检测器的性能，其中YOLOv5是一种多目标、多尺度深度学习检测器，具有计算量小、识别速度快、低延时、高精度等优点，相较于单目标跟踪算法，更适合对游泳馆内多名运动员的检测和跟踪。作为常与YOLOv5检测器结合使用的SORT跟踪器，可以有效地关联目标，并提升跟踪的实时性。SORT的核心主要是卡尔曼滤波和匈牙利算法的结合版，可以达到较好的跟踪效果，本发明进一步根据游泳运动瞬时移动距离有限和不同运动员处于不同泳道的特点，对SORT的损失函数进行改进，提出了ISORT算法。该算法有效减少不同泳道间运动员ID互换的情况，大幅提高提高算法有效性和实用性。

本发明一种基于图像处理的游泳运动实时测速方法，如图3所示，步骤如下：

构建基于YOLOv5的目标检测模型，具体YOLOv5模型可见附图1；

获取经过内参校正的游泳馆实时图像；

通过基于YOLOv5的目标检测模型实时检测游泳馆实时图像中的所有运动员；

通过摄像机内参校正和外参标定，将游泳馆实时图像坐标转化为世界坐标，根据相邻帧之间的位置差和时间差实现游泳运动员的定位和测速。

1.数据集构建过程：

步骤12：对于首帧图片，由人工选择目标框；

所述的数据集构建过程中所用的SiamBAN跟踪器，该跟踪器分为两个分支：模板分支和搜索分支。SiamBAN的整体网络结构为：

（1）将模板补丁输入模板分支的3层金字塔卷积模块，获得模板补丁的三层特征矩阵；将搜索补丁输入搜索分支的3层金字塔卷积模块，获得搜索补丁的三层特征矩阵；

（2）将模板补丁的三层特征矩阵和搜索补丁的三层特征矩阵进行逐层互相关操作，获得两块补丁的三份互相关特征图；

（3）将三份互相关特征图合并为一张，合并时同一位置的三个值取平均数，最后得到一份互相关特征图；

（4）互相关特征图中与模板最相似区域即是跟踪目标，从而实现对首帧之后图片的单目标持续性自动打标，获得训练目标检测网络的数据集。；

2. YOLOv5目标检测模型

数据集构建结束后，用打标获得的数据训练目标检测模型，所述的目标检测模型为：

YOLOv5为当前最优秀的单阶段目标识别算法之一，依靠其快速的检测速度兼具高精度和适应各类复杂场景的特点被广泛应用于目标检测领域。对游泳运动员的识别采用端到端的方式，直接从输入图片中检测到目标泳帽和与其对应的包络框。图1为YOLOv5检测器结构示意图。YOLOv5主要由四个部分组成，输入端、骨干网络、脖子网络与检测头，分别负责图像预处理、图像特征提取、特征多样化处理和预测目标的种类和包络框。

输入端表示输入的运动员游泳场景图片，该网络的输入图像大小为608

608，该阶段采用预处理将输入图像缩放到网络需要的尺寸，并使用自适应锚框计算进行图片自适应缩放。骨干网络提取图片中的多尺度深层次特征。脖子网络对多尺度特征进行融合，利用它可以进一步提升特征的多样性和模型的鲁棒性。检测头用来完成目标检测结果的输出，用于预测运动员泳帽和对应包络框。

3. ISORT目标跟踪算法

目标检测完成后，将YOLOv5检测目标框输入至ISORT匹配算法中，实现目标持续性跟踪，图2为ISORT多目标跟踪算法流程图，整体算法流程为：

(1)对第一帧图像经过YOLOv5检测到的所有目标，初始化并创建新的跟踪轨迹，标注ID；

(2)第一帧后的任意一帧经过YOLOv5目标检测模型后，利用ISORT跟踪算法对检测的运动员进行实时跟踪，具体过程如下：

通过卡尔曼滤波获得之前轨迹所有目标的位置预测；

计算所述的位置预测和当前帧的目标检测框匹配损失矩阵；

通过匈牙利算法获得轨迹与目标框相似度最大的唯一匹配，并更新该轨迹目标位置；

对于未匹配到的目标框，则初始化并创建新的跟踪轨迹，标注ID；

(3)根据匹配结果，对所有目标的跟踪轨迹更新并更新目标框状态，获得相邻帧之间的位置差和时间差。

上述流程中涉及的卡尔曼滤波对目标预测过程为：

使用具有良好抗噪声干扰能力的卡尔曼滤波预测运动员泳帽位置。设待跟踪泳帽上一帧状态为

，/>

表示上一帧图像，/>

和/>

分别表示上一帧图像的位置状态和速度状态。考虑到运动员速度不平均和水面等干扰，给予一定的噪声协方差矩阵Q，状态预测方程如式（1）和（2）所示。

（1）

（2）

为保证跟踪的实时性和准确性，模型中的一些参数需要更新。

（3）

（4）

（5）

其中，

是状态转移矩阵，/>

是状态控制向量，/>

是控制变量矩阵；/>

和/>

分别为k-1时刻与k时刻的后验状态估计，为更新后的结果；/>

表示k时刻的先验状态估计，即根据k-1时刻的最优估计预测k时刻的状态；/>

和/>

分别为k-1时刻与k时刻的后验估计协方差；/>

为k时刻的先验估计协方差；/>

为测量状态；/>

为卡尔曼滤波器增益。/>

为状态变量到预测测量值的转换矩阵。R和Q分别是是测量噪声和系统噪声的协方差矩阵。为

所述的ISORT算法流程中的损失矩阵计算方法为：

针对运动员游泳运动运动特征：不同运动员分布在不同泳道（以泳道长作为横坐标），运动员运动过程中距离不会发生突变以及不会换泳道。

因此，ISORT使用检测框与预测框之间的欧氏距离来描述运动关联程度：

（6）

其中，

和/>

表示第j个目标检测框的中心点位置横纵坐标，/>

和/>

表示第i个轨迹预测框的中心点位置横纵坐标，/>

为第j个目标检测框与第i个轨迹预测框之间的欧氏距离；

然后，为了进一步保证匹配的质量，使用门控矩阵对损失矩阵进行修正，结合实际应用场景下泳道呈纵向分布，相同泳道的图像像素点纵坐标值相近的特征，提出了将运动员泳帽中心点的像素纵坐标值坐标作为门控矩阵，用于限制处于不同泳道的轨迹和目标间的匹配：

（7）

其中，

表示第i个轨迹与第j个检测目标匹配的损失值；gate表示门控矩阵的阈值。

4.外参标定

最后，根据目标跟踪算法获得的轨迹位置，将实时跟踪的运动员图像坐标位置通过外参标定法转换为世界坐标，获取摆放在泳池两岸的6个标定板中心点的图像坐标和其对应的世界坐标，直接计算标定转换矩阵，计算公式如式（8）所示：

（8）

其中，

表示摄像机拍摄的图像中的任意一点，/>

为该点对应的实际泳道世界坐标点。a、b、c和/>

、/>

、/>

为待解参数。将已知的6组标定板中心点图像坐标和世界坐标代入，解上式可得转换矩阵T，具体可见公式（9）。

（9）

可根据转换矩阵T和图片泳帽像素点，计算得到运动员的世界坐标。

本发明同时提供一种基于图像处理的游泳运动实时测速系统，包括图像采集模块、训练数据集构建模块、目标识别模块、目标训练模块、目标跟踪模块、外参标定模块。

摄像机采集模块：用于采集运动员日常训练视频和游泳馆实时图像。

内参校正模块，对摄像机的内参校正采用张正友标定法，可校正图片径向畸变和切向畸变。

训练数据集构建模块：用于逐帧识别运动员日常训练视频中的游泳运动员，进行逐帧打标。

目标训练模块：使用训练数据集对基于YOLOv5的目标检测模型进行端到端训练。

目标识别模块：通过基于YOLOv5的目标检测模型实时检测识别游泳馆实时图像中的所有运动员。

目标跟踪模块，通过ISORT跟踪算法对检测的运动员进行实时跟踪，用于对当前帧的识别结果和之前帧跟踪轨迹进行匹配，获得相邻帧之间的位置差和时间差。外参标定模块，将游泳馆实时图像坐标转化为世界坐标，根据相邻帧之间的位置差和时间差实现游泳运动员的定位和测速。

训练数据集构建模块构建训练数据集过程为：

对于首帧图片，由人工选择目标框；

目标跟踪模块实现方式如下：

通过卡尔曼滤波获得之前轨迹所有目标的位置预测；

计算所述的位置预测和当前帧的目标检测框匹配损失矩阵；

ISORT匹配损失矩阵计算方法为：

其中，

和/>

表示第j个目标检测框的中心点位置横纵坐标，/>

和/>

表示第i个轨迹预测框的中心点位置横纵坐标，/>

为第j个目标检测框与第i个轨迹预测框之间的欧氏距离；

其中，

表示第i个轨迹与第j个检测目标匹配的损失值; gate表示门控矩阵的阈值。

本发明公开了一种基于图像处理的游泳运动实时测速方法及系统，涉及摄像机采集、内参校正、目标识别、目标跟踪以及外参标定；针对多名游泳运动员的实时高精度定位和测速需求，基于YOLOv5的目标检测模型具有全视野低延时高精度多目标识别的优点，在游泳运动测速领域有较强的应用性； SORT依靠其强大的精准匹配能力，与基于YOLOv5的目标检测模型结合可实现多目标实时精准跟踪，在本发明中根据游泳运动特点对SORT的损失函数进行改进，提出了ISORT跟踪算法。本发明流程为通过架设在游泳馆顶部的摄像机实时采集画面后，首先使用基于YOLOv5的目标检测模型对游泳运动员的泳帽进行目标检测，然后通过ISORT跟踪算法对YOLOv5中检测到的目标进行跟踪，得到运动员的图像坐标，最后通过外参标定得到世界坐标与图像坐标转换矩阵，进而得出运动员在泳道内的世界坐标和其速度。本发明能够解决惯导方法精度容易发散长时间无法保证的问题。

本发明未详细说明部分属于本领域技术人员公知常识。