CN109460724A - 基于对象检测的停球事件的分离方法和系统 - Google Patents

基于对象检测的停球事件的分离方法和系统 Download PDF

Info

Publication number
CN109460724A
CN109460724A CN201811264286.9A CN201811264286A CN109460724A CN 109460724 A CN109460724 A CN 109460724A CN 201811264286 A CN201811264286 A CN 201811264286A CN 109460724 A CN109460724 A CN 109460724A
Authority
CN
China
Prior art keywords
frame
image
football
sportsman
trapping event
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201811264286.9A
Other languages
English (en)
Other versions
CN109460724B (zh
Inventor
熊健
路丽果
解晓波
桂冠
杨洁
范山岗
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing Post and Telecommunication University
Nanjing University of Posts and Telecommunications
Original Assignee
Nanjing Post and Telecommunication University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing Post and Telecommunication University filed Critical Nanjing Post and Telecommunication University
Priority to CN201811264286.9A priority Critical patent/CN109460724B/zh
Publication of CN109460724A publication Critical patent/CN109460724A/zh
Application granted granted Critical
Publication of CN109460724B publication Critical patent/CN109460724B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/20Movements or behaviour, e.g. gesture recognition
    • G06V40/23Recognition of whole body movements, e.g. for sport training
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2413Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/40Scenes; Scene-specific elements in video content
    • G06V20/41Higher-level, semantic clustering, classification or understanding of video scenes, e.g. detection, labelling or Markovian modelling of sport events or news items
    • G06V20/42Higher-level, semantic clustering, classification or understanding of video scenes, e.g. detection, labelling or Markovian modelling of sport events or news items of sport video content

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Multimedia (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Software Systems (AREA)
  • Evolutionary Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Psychiatry (AREA)
  • Social Psychology (AREA)
  • Human Computer Interaction (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了基于对象检测的停球事件的分离方法和系统,其中方法包括:采用图像标注工具对原始训练集图像中的球员和足球进行标注,标注时将球员和足球用一个矩形框框出其在图像中的位置并输入相应的标签,得到标注后的训练集图像;根据训练集中的图像训练神经网络并输出图像中目标检测框的边界和目标的类别;采用训练好的神经网络对待检测的训练视频进行检测确定图像的帧数并输出球员和足球的坐标;将同时检测到足球和球员的前后两帧图像的帧数相减,差值大于预设阈值时则确定停球事件。本发明基于神经网络的检测的结果,对检测数据不断分析,找到停球事件的特点来对停球事件进行分离,具有很好的稳定性以及鲁棒性。

Description

基于对象检测的停球事件的分离方法和系统
技术领域
本发明属于计算机视觉图像处理领域,涉及一种基于对象检测的停球事件的分离技术。
背景技术
在智能足球室内训练场训练和评估过程中,球员会在场地内进行高强度的接球训练,需要学习如何控制从八个不同的角度的来球并将足球踢进不同的目标框,教练员则可以通过移动终端自行启动个性化的训练评估方案,以及查看数据。与此同时,场地设有的传感器也会自动记录球员的命中率,在训练结束后,集成数据和训练视频会上传到云端系统,形成球员命中率的趋势和视频存档,供教练员参考回放。
当然衡量一个选手的踢球水平,最重要的一个因素就是看这个选手的基本功是否扎实。但是现阶段的设备只能根据传感来记录球员的命中率,而基本功中另外一个很重要的指标就是球员的停球成功率,教练员只能通过观看上传的云端视频数据来人工对各个球员的停球成功率作一个简单的统计,这种方法耗时耗力。
目前的事件分离的方法大多基于时间间隔,这种方法适用于事件的时间间隔相同的情况,但是在室内足球训练场中,发球之间的间隔取决于将球员将球踢进指定区域的速度,只有在足球踢进指定区域后才会有第二次发球,所以在实际应用中,这种基于时间间隔的方法并不适用于对停球事件的分离。
发明内容
本发明所要解决的技术问题是克服现有技术的缺陷,提供本发明提出一种基于对象检测的停球事件的分离方法.
为解决上述技术问题,本发明采用以下技术方案:
在一个方面,本发明提供了基于对象检测的停球事件的分离方法,包括以下步骤:
(1)对原始训练集图像中的球员和足球进行标注,标注时将球员和足球用一个矩形框框出其在图像中的位置并输入相应的标签,得到标注后的训练集图像;
(2)根据训练集中的图像训练神经网络并输出图像中目标检测框的边界和目标的类别;
(3)采用训练好的神经网络对待检测的训练视频进行检测并记录图像的帧数和同时检测到一个足球和一个球员的图像中球员和足球的坐标;
(4)将记录的前后两帧图像的帧数相减,差值大于预设阈值时则确定停球事件。
进一步地,确定训练图像时将全部训练视频的20%视频转化为一帧帧图像,并筛选画面清晰的图像作为原始训练集图像。
进一步优选地,所述图像标注工具为LabelImage标注工具。
进一步优选地,所述神经网络采用YOLOv3且采用YOLOv3对标注后的训练集图像进行训练得到Darknet-53各层网络的权重。
进一步地,所述标签包括球员的标签、足球的标签。
进一步地,所述目标检测框的坐标为(x,y,w,h),其中x,y表示框的右下角的坐标,w表示框的宽,h表示框的高度。
或者进一步优化的,所述目标检测框的坐标简化为(x-w/2,y),其中x,y表示框的右下角的坐标,w表示框的宽。
进一步地,步骤(3)具体包括:
选取球员和足球的边界框坐标长度都为2时,将同时检测到一个足球和一个球员的当前图像的帧数、球员和足球的坐标记录在列表中,列表的数据形式如下:
[[frame[1],[],[]],[frame[2],[],[]],……,[frame[n],[],[]]]。
在另一方面,本发明提供了基于对象检测的停球事件的分离系统,其特征是,包括:
足球和球员标注模块,用于对原始训练集图像中的球员和足球进行标注,标注时将球员和足球用一个矩形框框出其在图像中的位置并输入相应的标签,得到标注后的训练集图像;
神经网络训练模块,用于根据训练集中的图像,训练神经网络中并输出图像中目标检测框的边界和目标的类别;
神经网络检测模块,采用训练好的神经网络对待检测的训练视频进行检测并记录图像的帧数和能同时检测到一个足球和一个球员的图像中球员和足球的坐标;
停球事件分离模块,用于将记录的前后帧图像的帧数相减,差值大于预设阈值时,确定停球事件。
进一步所述系统还包括:
帧信息存储模块,用于选取球员和足球的边界框坐标长度都为2时,将同时检测到一个足球和一个球员的当前图像的帧数、球员和足球的坐标记录在列表中,列表的数据形式如下:
[[frame[1],[],[]],[frame[2],[],[]],……,[frame[n],[],[]]]。
本发明所达到的有益效果:本发明通过神经网络不断迭代训练,得出球员以及运动的球的特征并能准确检测出球员和球的具体位置;基于神经网络的检测的结果,对检测数据不断分析,找到停球事件的特点来对停球事件进行分离,具有很好的稳定性以及鲁棒性。
附图说明
图1是本发明具体实施基于对象检测的停球事件的分离方法流程示意图;
图2是本发明具体实例中将一个视频划分为不同停球事件效果示意图。
具体实施方式
下面结合附图对本发明作进一步描述。以下实施例仅用于更加清楚地说明本发明的技术方案,而不能以此来限制本发明的保护范围。
本发明采用如下技术方案,提出一种基于对象检测的停球事件分离方法,本发明在主要包括两个阶段,神经网络模型的训练阶段与停球事件的分离阶段,具体步骤如下:
神经网络训练阶段:
步骤一:
第1步:足球因为快速运动而产生明显的形变,需要重新标注训练集中运动的足球和球员数据集,在选择训练集时具体实施例中优选地,将球员的训练视频分为训练集和测试集,使训练集和测试集各占合适的比例,在实施例中优选地,选择训练集占全部视频的20%。基于获取的球员训练视频,将视频转化为一帧帧图,(由于视频压缩等原因造成视频中的某些画面解码错误),对这些图像进行选择,可以采用现有技术中图像识别算法选出画面清晰的图像作为训练图像。
然后采用图形标注工具对图像中的球员和足球进行标注,在本实施例中优选地采用LabelImage(即目标检测标注工具labelImg)。目标检测中,原始图像的标注过程非常重要,它的作用是在原始图像中标注目标物体位置并对每张图片生成相应的xml文件表示目标标准框的位置。
对图像进行标注时将球员和足球用一个矩形框框出其在图像中的位置,并输入相应的标签,在本实施例中球员的标签为person,足球的标签为soccer,完成后数据会保存图像的名字,球员和足球所对应框的左上角坐标和对应矩形框的宽和高。
第2步:将训练集数据投入到YOLOv3神经网络进行训练,通过卷积层提取图像的特征,通过维度聚类产生候选框,经过逻辑回归预测每一个边界框的类别;
YOLO是目前比较流行的目标检测算法(object detection)算法,YOLO v3是YOLO的第3个版本,检测算法更快更准。
第3步:通过反向传播算法修改各个隐藏层的权重,直到损失值小于一定的阈值,达到最终的神经网络模型。
停球事件的分离阶段:
步骤二:
第1步:利用上述神经网络预测出球员以及足球的位置;
第2步:获得所检测视频图像的帧数(frame),以及检测中出现的球员的位置信息()以及球的坐标(),其中(),()分别表示第i帧图像预测到的球员的位置和球所处的位置。
第3步:经过对视频数据的观察分析,将获取的检测数据进行如下处理:选取神经网络检测到球员的边界框坐标长度为2并且检测到足球边界框坐标长度为2时,将各帧图像的帧数,球员和足球的坐标记录在列表1中;由于在检测的过程中会出现两个球员或者两个足球的情况,而这些检测数据对评价单个球员训练水平和停球事件的分离是有一定干扰的;所以在具体实施例中对实时检测的数据进行处理时只选取能同时检测到一个球员和一个足球的图像进行记录。
当新一帧满足上述条件时,将新的图像帧数添加到列表1中,测试集中某一训练视频(一般一个训练视频会发出30个球)的记录的数据形式列表1如下:
[[frame[1],[],[]],[frame[2],[],[]],……[frame[n],[],[]]]
其中frame[1]表示检测到的第一帧图像的帧数,[]表示球员的位置信息,[]表示在此帧图像中足球的位置。
第4步:在上述记录的检测数据上停球事件就体现为检测到的前后两帧图像的帧数差值很大,以此为依据划分不同的停球事件,选取合理的阈值,当检测到前后两帧图像的帧数差值大于指定阈值时,即判断为另外一个停球事件,即
frame[i+1]-frame[i]>阈值,则frame[i+1]为另一停球事件的开始帧。
在具体实施例中可以在发明方法实施后将分离的停球事件在原视频上播放,查看划分的停球事件的准确率。
本发明对测试视频的检测结果作一个简单的处理,根据处理后的检测的结果对不同的停球事件进行划分。基于停球事件是一连串动作,经历一定的时间,根据检测到的图像帧数差值划分停球事件,为智能足球训练场的数据处理提供了一种可供参考的方案,节省了大量的人力资源,具有很好的鲁棒性。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
以上结合附图对本发明的实施例进行了描述,但是本发明并不局限于上述的具体实施方式,上述的具体实施方式仅仅是示意性的,而不是限制性的,本领域的普通技术人员在本发明的启示下,在不脱离本发明宗旨和权利要求所保护的范围情况下,还可做出很多形式,这些均属于本发明的保护之内。

Claims (10)

1.基于对象检测的停球事件的分离方法,其特征是,包括以下步骤:
(1)对原始训练集图像中的球员和足球进行标注,标注时将球员和足球用一个矩形框框出其在图像中的位置并输入相应的标签,得到标注后的训练集图像;
(2)根据训练集中的图像训练神经网络并输出图像中目标检测框的边界和目标的类别;
(3)采用训练好的神经网络对待检测的训练视频进行检测并记录图像的帧数和同时检测到一个足球和一个球员的图像中球员和足球的坐标;
(4)将记录的前后两帧图像的帧数相减,差值大于预设阈值时则确定停球事件。
2.根据权利要求1所述的停球事件的分离方法,其特征是,确定训练图像时将全部训练视频的20%视频转化为一帧帧图像,并筛选画面清晰的图像作为原始训练集图像。
3.根据权利要求1所述的停球事件的分离方法,其特征是,所述图像标注工具为LabelImage标注工具。
4.根据权利要求1所述的停球事件的分离方法,其特征是,所述神经网络采用YOLOv3。
5.根据权利要求1所述的停球事件的分离方法,其特征是,所述标签包括球员的标签、足球的标签。
6.根据权利要求1所述的停球事件的分离方法,其特征是,所述目标检测框的坐标为(x,y,w,h),其中x,y表示框的右下角的坐标,w表示框的宽,h表示框的高度。
7.根据权利要求1所述的停球事件的分离方法,其特征是,所述目标检测框的坐标为(x-w/2,y),其中x,y表示框的右下角的坐标,w表示框的宽。
8.根据权利要求1所述的停球事件的分离方法,其特征是,步骤(3)具体包括:
选取球员和足球的边界框坐标长度都为2时,将同时检测到一个足球和一个球员的当前图像的帧数、球员和足球的坐标记录在列表中,列表的数据形式如下:
[[frame[1],[],[]],[frame[2],[],[]],……,[frame[n],[],[]]]。
9.基于对象检测的停球事件的分离系统,其特征是,包括:
足球和球员标注模块,用于对原始训练集图像中的球员和足球进行标注,标注时将球员和足球用一个矩形框框出其在图像中的位置并输入相应的标签,得到标注后的训练集图像;
神经网络训练模块,用于根据训练集中的图像训练神经网络并输出图像中目标检测框的边界和目标的类别;
神经网络检测模块,用于采用训练好的神经网络对待检测的训练视频进行检测并记录图像的帧数和同时检测到一个足球和一个球员的图像中球员和足球的坐标;
停球事件分离模块,用于将记录的前后帧图像的帧数相减,差值大于预设阈值时,确定停球事件。
10.根据权利要求9所述的停球事件的分离系统,其特征是,包括:
帧信息存储模块,用于选取球员和足球的边界框坐标长度都为2时,将同时检测到一个足球和一个球员的当前图像的帧数、球员和足球的坐标记录在列表中,列表的数据形式如下:
[[frame[1],[],[]],[frame[2],[],[]],……,[frame[n],[],[]]]。
CN201811264286.9A 2018-10-29 2018-10-29 基于对象检测的停球事件的分离方法和系统 Active CN109460724B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811264286.9A CN109460724B (zh) 2018-10-29 2018-10-29 基于对象检测的停球事件的分离方法和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811264286.9A CN109460724B (zh) 2018-10-29 2018-10-29 基于对象检测的停球事件的分离方法和系统

Publications (2)

Publication Number Publication Date
CN109460724A true CN109460724A (zh) 2019-03-12
CN109460724B CN109460724B (zh) 2021-09-28

Family

ID=65608665

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811264286.9A Active CN109460724B (zh) 2018-10-29 2018-10-29 基于对象检测的停球事件的分离方法和系统

Country Status (1)

Country Link
CN (1) CN109460724B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110472562A (zh) * 2019-08-13 2019-11-19 新华智云科技有限公司 定位球视频片段检测方法、装置、系统及存储介质
CN110532843A (zh) * 2019-04-25 2019-12-03 南京邮电大学 一种基于对象级轨迹的细粒度运动行为识别方法
CN110942005A (zh) * 2019-11-21 2020-03-31 网易(杭州)网络有限公司 物体识别方法及装置

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102142194A (zh) * 2010-12-30 2011-08-03 杭州海康威视数字技术股份有限公司 视频检测方法及其系统
CN108197570A (zh) * 2017-12-28 2018-06-22 珠海市君天电子科技有限公司 一种人数统计方法、装置、电子设备及存储介质

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102142194A (zh) * 2010-12-30 2011-08-03 杭州海康威视数字技术股份有限公司 视频检测方法及其系统
CN108197570A (zh) * 2017-12-28 2018-06-22 珠海市君天电子科技有限公司 一种人数统计方法、装置、电子设备及存储介质

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
KEYU LU 等: "Lightweight convolutional neural networks for player detection and classification", 《COMPUTER VISION AND IMAGE UNDERSTANDING》 *
SHANGANG FAN 等: "Robust Adaptive Beamforming Signal Techniques for Drone Surveillance", 《2018 IEEE 10TH SENSOR ARRAY AND MULTICHANNEL SIGNAL PROCESSING WORKSHOP (SAM)》 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110532843A (zh) * 2019-04-25 2019-12-03 南京邮电大学 一种基于对象级轨迹的细粒度运动行为识别方法
CN110532843B (zh) * 2019-04-25 2022-08-05 南京邮电大学 一种基于对象级轨迹的细粒度运动行为识别方法
CN110472562A (zh) * 2019-08-13 2019-11-19 新华智云科技有限公司 定位球视频片段检测方法、装置、系统及存储介质
CN110942005A (zh) * 2019-11-21 2020-03-31 网易(杭州)网络有限公司 物体识别方法及装置

Also Published As

Publication number Publication date
CN109460724B (zh) 2021-09-28

Similar Documents

Publication Publication Date Title
CN102981604B (zh) 图像处理设备和图像处理方法
CN109903312B (zh) 一种基于视频多目标跟踪的足球球员跑动距离统计方法
CN108810620A (zh) 识别视频中的关键时间点的方法、计算机设备及存储介质
CN106096577B (zh) 一种摄像头分布地图中的目标追踪方法
CN101639354B (zh) 对象跟踪的设备和方法
CN102890781B (zh) 一种针对羽毛球比赛视频的精彩镜头识别方法
CN109145708B (zh) 一种基于rgb和d信息融合的人流量统计方法
US20210264636A1 (en) Video analysis apparatus, person retrieval system, and person retrieval method
CN104637058B (zh) 一种基于图像信息的客流量识别统计方法
CN107798272A (zh) 快速多目标检测与跟踪系统
CN104298964B (zh) 一种人体行为动作快速识别方法及装置
CN109460724A (zh) 基于对象检测的停球事件的分离方法和系统
CN109684919B (zh) 一种基于机器视觉的羽毛球发球违例判别方法
CN105512618B (zh) 视频跟踪方法
CN103413149B (zh) 复杂背景中实现静态目标检测和识别的方法
Mustamo Object detection in sports: TensorFlow Object Detection API case study
CN104680188A (zh) 一种人体姿态基准图像库的构建方法
US20220207266A1 (en) Methods, devices, electronic apparatuses and storage media of image processing
CN109409294A (zh) 基于对象运动轨迹的停球事件的分类方法和系统
KR102102164B1 (ko) 영상 전처리 방법, 장치 및 컴퓨터 프로그램
Sangüesa et al. Identifying basketball plays from sensor data; towards a low-cost automatic extraction of advanced statistics
CN104079798B (zh) 图像检测方法、装置及一种视频监控系统
Hsu et al. Coachai: A project for microscopic badminton match data collection and tactical analysis
KR101124560B1 (ko) 동영상 내의 자동 객체화 방법 및 객체 서비스 저작 장치
CN108388883A (zh) 一种基于hog+svm的视频人数统计方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant