CN109697387B - 运动方向预测方法、装置、电子设备及存储介质 - Google Patents

运动方向预测方法、装置、电子设备及存储介质 Download PDF

Info

Publication number
CN109697387B
CN109697387B CN201710994357.XA CN201710994357A CN109697387B CN 109697387 B CN109697387 B CN 109697387B CN 201710994357 A CN201710994357 A CN 201710994357A CN 109697387 B CN109697387 B CN 109697387B
Authority
CN
China
Prior art keywords
optical flow
video
sample
motion direction
frame sequence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710994357.XA
Other languages
English (en)
Other versions
CN109697387A (zh
Inventor
黄志标
安山
麻晓珍
车广富
陈宇
翁志
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Jingdong Century Trading Co Ltd
Beijing Jingdong Shangke Information Technology Co Ltd
Original Assignee
Beijing Jingdong Century Trading Co Ltd
Beijing Jingdong Shangke Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Jingdong Century Trading Co Ltd, Beijing Jingdong Shangke Information Technology Co Ltd filed Critical Beijing Jingdong Century Trading Co Ltd
Priority to CN201710994357.XA priority Critical patent/CN109697387B/zh
Publication of CN109697387A publication Critical patent/CN109697387A/zh
Application granted granted Critical
Publication of CN109697387B publication Critical patent/CN109697387B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/40Scenes; Scene-specific elements in video content
    • G06V20/41Higher-level, semantic clustering, classification or understanding of video scenes, e.g. detection, labelling or Markovian modelling of sport events or news items
    • G06V20/42Higher-level, semantic clustering, classification or understanding of video scenes, e.g. detection, labelling or Markovian modelling of sport events or news items of sport video content
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2411Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/50Extraction of image or video features by performing operations within image blocks; by using histograms, e.g. histogram of oriented gradients [HoG]; by summing image-intensity values; Projection analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/40Scenes; Scene-specific elements in video content
    • G06V20/46Extracting features or characteristics from the video content, e.g. video fingerprints, representative shots or key frames

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Multimedia (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computational Linguistics (AREA)
  • Software Systems (AREA)
  • Image Analysis (AREA)

Abstract

本发明的实施例提供了一种运动方向预测方法、装置、电子设备及存储介质,涉及计算机视觉技术领域。该方法包括:将与待预测视频对应的样本视频转换为样本帧序列;提取所述样本帧序列的各帧中目标像素点的光流直方图特征;基于所述光流直方图特征对方向预测模型进行训练;通过训练后的所述方向预测模型预测所述待预测视频中的目标对象的运动方向。本发明实施例的技术方案能够提高视频中目标对象的运动方向预测的鲁棒性和准确性。

Description

运动方向预测方法、装置、电子设备及存储介质
技术领域
本发明涉及计算机视觉技术领域,具体而言,涉及一种运动方向预测方法、运动方向预测装置、电子设备以及计算机可读存储介质。
背景技术
在电商平台上,商家会上传大量的内容丰富的视频素材用来展示商品。在展示商品时,用户可以通过旋转商品的方式与展示画面进行交互,因此,电商平台需要根据展示视频中商品的旋转方向,对展示视频的帧进行截取,然后以合理的方式从不同角度展示商品。此外,在智能监控、自动驾驶等应用场景中,也需要判断出视频中人物、物体的运动方向,以便于进行跟踪、报警等操作。
在一种技术方案中,采用光流法对视频中物体的运动方向进行判断。该技术方案通过找出视频序列的相邻帧之间像素的对应关系,根据这种对应关系计算帧之间的所有像素之间的位移量,即得到各帧的光流图,然后根据各帧的光流图对物体的运动方向进行判断。这种技术方案中的光流计算方法只是在相邻两帧之间计算光流,对尺度变化比较敏感,对视频中较小或较大物体的运动方向的预测结果具有差异,鲁棒性较差。
因此,需要提供一种能够解决上述问题中的一个或多个问题的运动方向预测方法、运动方向预测装置、电子设备以及计算机可读存储介质
需要说明的是,在上述背景技术部分公开的信息仅用于加强对本发明背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
发明内容
本发明的目的在于提供一种运动方向预测方法、运动方向预测装置、电子设备以及计算机可读存储介质,进而至少在一定程度上克服由于相关技术的限制和缺陷而导致的一个或者多个问题。
根据本发明实施例的第一方面,提供了一种运动方向预测方法,其特征在于,包括:
将与待预测视频对应的样本视频转换为样本帧序列;
提取所述样本帧序列的各帧中目标像素点的光流直方图特征;
基于所述光流直方图特征对方向预测模型进行训练;
通过训练后的所述方向预测模型预测所述待预测视频中的目标对象的运动方向。
在本发明的一种示例性实施例中,提取所述样本帧序列的各帧中目标像素点的光流直方图特征,包括:
构建所述样本帧序列中各帧的具有预设层数的图像金字塔;
提取各层图像金字塔中目标像素点的光流直方图特征。
在本发明的一种示例性实施例中,提取各层图像金字塔中目标像素点的光流直方图特征,包括:
提取各层图像金字塔中包含目标像素点的预定区域的光流特征;
对所述光流特征进行编码,生成所述预定区域的光流直方图特征。
在本发明的一种示例性实施例中,构建所述样本帧序列中各帧的具有预设层数的图像金字塔,包括:
构建所述样本帧序列中所有帧的具有预设层数的图像金字塔;
对相邻两帧的图像金字塔分别进行多项式扩展,基于所述多项式扩展计算所述相邻两帧的图像金字塔的光流金字塔。
在本发明的一种示例性实施例中,所述运动方向包括上移方向和下移方向。
在本发明的一种示例性实施例中,基于所述光流直方图特征对方向预测模型进行训练,包括:
将所述光流直方图特征按预定比例分为训练集以及验证集;
基于所述训练集对支持向量机模型进行训练;
基于所述验证集对经训练的所述支持向量机模型进行验证;
基于所述验证结果对所述支持向量机模型进行调整。
在本发明的一种示例性实施例中,将与待预测视频对应的样本视频转换为样本帧序列,包括:
将与待预测视频对应的样本视频转换为连续的帧序列;
对所述连续的帧序列进行采样获取所述样本视频的样本帧序列。
根据本发明实施例的第二方面,提供了一种运动方向预测装置,其特征在于,包括:
转换单元,用于将与待预测视频对应的样本视频转换为样本帧序列;
特征提取单元,用于提取所述样本帧序列的各帧中目标像素点的光流直方图特征;
训练单元,用于基于所述光流直方图特征对方向预测模型进行训练;
预测单元,用于通过训练后的所述方向预测模型预测所述待预测视频中的目标对象的运动方向。
根据本发明实施例的第三方面,提供了一种电子设备,其特征在于,包括:
处理器;以及
存储器,所述存储器上存储有计算机可读指令,所述计算机可读指令被所述处理器执行时实现如上述第一方面所述的运动方向预测方法。
根据本发明实施例的第四方面,提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如上述第一方面所述的运动方向预测方法。
在本发明的一些实施例所提供的技术方案中,基于样本视频的帧序列的光流直方图特征对方向预测模型进行训练,通过训练后的方向预测模型预测待预测视频中的目标对象的运动方向。一方面,基于样本视频的帧序列的光流直方图特征对方向预测模型进行训练,由于光流直方图特征对目标对象的尺寸不敏感,能够提高运动方向预测的鲁棒性;另一方面,通过训练后的方向预测模型预测待预测视频中的目标对象的运动方向,由于可以通过监督的方式对方向预测模型进行训练,从而能够提高运动方向预测的准确性。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本发明。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并与说明书一起用于解释本发明的原理。显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。在附图中:
图1示出了根据本发明的第一个示例性实施例的运动方向预测方法的流程示意图;
图2示出了根据本发明的第二个示例性实施例的运动方向预测方法的流程示意图;
图3示出了根据本发明的一示例性实施例的运动方向预测装置的示意框图;
图4示出了适于用来实现本发明实施例的电子设备的计算机系统的结构示意图;
图5示出了根据本发明的一示例性实施例的计算机可读存储介质的示意图。
具体实施方式
现在将参考附图更全面地描述示例实施例。然而,示例实施例能够以多种形式实施,且不应被理解为限于在此阐述的实施例;相反,提供这些实施例使得本发明将全面和完整,并将示例实施例的构思全面地传达给本领域的技术人员。在图中相同的附图标记表示相同或类似的部分,因而将省略对它们的重复描述。
此外,所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施例中。在下面的描述中,提供许多具体细节从而给出对本发明的实施例的充分理解。然而,本领域技术人员将意识到,可以实践本发明的技术方案而没有特定细节中的一个或更多,或者可以采用其它的方法、组元、装置、步骤等。在其它情况下,不详细示出或描述公知方法、装置、实现或者操作以避免模糊本发明的各方面。
附图中所示的方框图仅仅是功能实体,不一定必须与物理上独立的实体相对应。即,可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。
附图中所示的流程图仅是示例性说明,不是必须包括所有的内容和操作/步骤,也不是必须按所描述的顺序执行。例如,有的操作/步骤还可以分解,而有的操作/步骤可以合并或部分合并,因此实际执行的顺序有可能根据实际情况改变。
在旋转运动模式下,视频中物体的运动形式主要包含3类,即从上往下看视频中物体顺时针自转、逆时针自转以及物体做非旋转运动。在这3类运动中,可以将运动方向规定为物体左转、右转及不转。在电商平台上的视频处理应用场景下,针对该3类似运动方向进行简单处理暂时可以满足要求,如电商平台上的全景图中商品的展示方式主要包括顺时针自转、逆时针自转和其他非自转运动。
在一种技术方案中,在上述3类运动方式下,对视频中目标对象的运动方向的判断可以分为以下几个步骤:(1)将视频转换为连续的帧;(2)计算相邻两帧之间的光流;(3)统计光流中像素在各个运动方向上的位移总量;(4)比较各方向的运动总量,给出目标对象的运动方向分类。
然而,这种技术方案也只是在相邻两帧之间计算光流,因此光流计算的鲁棒性也较差。
基于上述内容,在本示例实施例中,提出了一种运动方向预测方法。参照图1所示,该运动方向预测方法可以包括以下步骤:
步骤S110,将与待预测视频对应的样本视频转换为样本帧序列;
步骤S120,提取所述样本帧序列的各帧中目标像素点的光流直方图特征;
步骤S130,基于所述光流直方图特征对方向预测模型进行训练;
步骤S140,通过训练后的所述方向预测模型预测所述待预测视频中的目标对象的运动方向。
根据本示例实施例的运动方向预测方法,一方面,基于样本视频的帧序列的光流直方图特征对方向预测模型进行训练,由于光流直方图特征对目标对象的尺寸不敏感,能够提高运动方向预测的鲁棒性;另一方面,通过训练后的方向预测模型预测待预测视频中的目标对象的运动方向,由于可以基于大量样本通过监督的方式对方向预测模型进行训练,从而能够提高运动方向预测的准确性。
下面,将结合附图对本示例实施例中的运动方向预测方法进行详细的描述。
在步骤S110中,将与待预测视频对应的样本视频转换为样本帧序列。
在本示例实施例中,可以收集目标对象向左移动、向右移动、向上移动、向下移动以及不移动的大量视频素材例如各个方向1000个样本视频。可以采用FFmpeg(FastForward mpeg,快进mpeg)将样本视频转化为图像帧序列,仅保留图像数据而不保留音频数据。将生成的图像帧序列命名为xxx.jpg,其中xxx为该帧图像对应于原始视频中的帧的序号,序号可以从000开始。
进一步地,在本示例实施例中,可以对图像帧序列进行采样,设定采样参数为w,即每个隔w帧保留一帧,采样后得到新的图像序列。由于新图像序列中每张图片都是彩色图像,因此需要将每张图像转化为灰度图像,转化公式为:
灰度值=(R*30+G*59+B*11+50)/100 (1)
其中R、G、B为原图像中像素点的RGB各分量值,灰度值为该像素点灰度化后的值。
接下来,在步骤S120中,提取所述样本帧序列的各帧中目标像素点的光流直方图特征。
在本示例实施例中,为了降低光流计算方法对尺度变化的影响,可以提取各帧中目标像素点的光流直方图特征。提取样本帧序列的各帧中目标像素点的光流直方图特征可以包括:构建所述样本帧序列中各帧的具有预设层数的图像金字塔;提取各层图像金字塔中目标像素点的光流直方图特征。进一步地,构建样本帧序列中各帧的具有预设层数的图像金字塔可以包括:构建所述样本帧序列中所有帧的具有预设层数的图像金字塔;对相邻两帧的图像金字塔分别进行多项式扩展,基于所述多项式扩展计算所述相邻两帧的光流金字塔。
具体而言,构建样本帧中各帧的光流金字塔需要构建以下内容:当前图片的图像金字塔,该图片前一张图片的图像金字塔,前一个图像金字塔的多项式扩展,当前图像金字塔的多项式扩展和光流图像金字塔。设定图像金字塔的层数为L,设定采用步长为
Figure BDA0001442137300000071
图像金字塔最底层图像的大小为原图大小,即W×H,第二层的大小为
Figure BDA0001442137300000072
即上一层图像的大小为下一层图像的大小除以
Figure BDA0001442137300000073
依此类推,得到层数为L的图像金字塔。例如,输入当前图片,得到当前图片对应的图像金字塔,输入前一张图片,得到前一张图片对应的图像金字塔。然后,可以采用Farneback方法对当前图像金字塔和前一个图像金字塔分别进行多项式扩展,得到当前图像金字塔的多项式扩展和前一个图像金字塔的多项式扩展,为计算光流金字塔做准备。输入当前图像金字塔的多项式扩展和前一个图像金字塔的多项式扩展,可以采用Farneback光流计算方法计算这两个图像金字塔所对应的光流金字塔。
进一步地,在本示例实施例中,提取各层图像金字塔中目标像素点的光流直方图特征可以包括:提取各层图像金字塔中包含目标像素点的预定区域的光流特征;对所述光流特征进行编码,生成所述预定区域的光流直方图特征。例如,可以在图像金字塔的每一层检测并得到需要跟踪的目标对象的特征点即目标像素点,计算该目标像素点周围小区域的光流特征,对光流特征采用BoW(Bag of Words,词袋)方式进行编码,生成光流直方图。例如,在检测目标像素点时,可以计算每个像素点周围3×3区域内的协方差矩阵及其特征值,只保留最大特征值超过阈值h的点,h的值可设为图像中每个点的最大值特征值的千分之一,同时对于待跟踪的目标像素点之间可以设置最小距离为5个像素。
此外,在计算出光流金字塔对应的光流直方图后,设直方图的维数为54维,可以在此基础上将所有图像序列的光流直方图进行相加,得到样本视频所对应的光流直方图特征,最终的结果仍为54维。
接下来,在步骤S130中,基于所述光流直方图特征对方向预测模型进行训练。
在本示例实施例中,按照步骤S110至步骤S130进行操作,可以得到样本视频的多个光流直方图特征。可以将得到的光流直方图特征按照一定比例分为训练集及验证集。训练集和验证集中每个样本的内容格式为“光流直方图特征1”、“光流直方图特征0”、“光流直方图特征-1”、“光流直方图特征2”、“光流直方图特征-2”等等,其中1,0,-1,2,-2表示该视频中物体向右移动、不移动、向左移动、向上移动和向下移动。此外,还可以将所有样本放入一个文件中例如train_val.txt文件中,每个样本占一行,然后将样本进行随机打乱,并按8:2的比例将样本划分为训练集和测试集。
进一步地,在本示例实施例中,可以基于所述训练集对支持向量机模型进行训练;基于所述验证集对经训练的所述支持向量机模型进行验证;基于所述验证结果对所述支持向量机模型进行调整。例如,可以将训练集和验证集输入SVM(Support Vector Machine,支持向量机)模型进行训练,迭代N次,每次迭代之后使用现有的模型在验证集上进行验证,将支持向量机模型的输出结果与验证集中物体的旋转方向进行比较,计算得到错误率。在本示例实施例中,支持向量机模型在训练集上的错误率是一个振荡下降的曲线,在验证集上的错误率是一个近似U形曲线,选择该U形曲线的最低点,将该点对应的支持向量机模型作为最终的方向预测模型。
需要说明的是,在本示例实施例中,虽然方向预测模型示出了SVM模型,但是本发明的示例实施例中的方向预测模型不限于此,例如方向预测模型还可以为贝叶斯模型以及决策树模型等模型,这同样在本公开的保护范围内。
接下来,在步骤S140中,通过训练后的所述方向预测模型预测所述待预测视频中的目标对象的运动方向。
在本示例实施例中,可以按照前述步骤S110至步骤S130得到待预测视频的帧序列的光流直方图特征,将光流直方图特征输入训练后的方向预测模型进行预测,可以得到待预测视频中的目标对象的运动方向。
图2示出了根据本发明的第二个示例性实施例的运动方向预测方法的流程示意图。参照图2所示,该运动方向预测方法可以包括以下步骤:在步骤S210中,将样本视频截取为连续的帧序列;在步骤S220中,构建在步骤S210中得到的帧序列中的所有帧的图像金字塔,以及计算相邻帧的图像金字塔之间的光流金字塔;在步骤S230中,提取每层光流金字塔的光流直方图;在步骤S240中,对所有光流直方图进行压缩编码,得到各层光流金字塔的光流直方图特征;在步骤S250中,将步骤S240中得到的光流直方图特征分为训练集和测试集,通过训练集以及测试集训练SVM分类器;在步骤S260中,基于SVM分类器对待测视频中目标对象的运动方向进行预测,输出预测的目标对象的运动方法。由于本示例实施例中的运动方向预测方法与上述第一个示例实施例中的运动方向预测方法的各步骤类似,在此将不赘述。
此外,在本发明的实施例中,还提供了一种运动方向预测装置。参照图3所示,该运动方向预测装置300可以包括:转换单元310、特征提取单元320、训练单元330以及预测单元340。其中,转换单元310用于将与待预测视频对应的样本视频转换为样本帧序列;特征提取单元320用于提取所述样本帧序列的各帧中目标像素点的光流直方图特征;训练单元330用于基于所述光流直方图特征对方向预测模型进行训练;预测单元340用于通过训练后的所述方向预测模型预测所述待预测视频中的目标对象的运动方向。
根据本发明的示例性实施例,特征提取单元320可以被配置为:图像金字塔构建单元,用于构建所述样本帧序列中各帧的具有预设层数的图像金字塔;提取单元,用于提取各层图像金字塔中目标像素点的光流直方图特征。
根据本发明的示例性实施例,特征提取单元320可以被配置为:提取各层图像金字塔中包含目标像素点的预定区域的光流特征;对所述光流特征进行编码,生成所述预定区域的光流直方图特征。
根据本发明的示例性实施例,图像金字塔构建单元可以被配置为:构建所述样本帧序列中所有帧的具有预设层数的图像金字塔;对相邻两帧的图像金字塔分别进行多项式扩展,基于所述多项式扩展计算所述相邻两帧的图像金字塔的光流金字塔。
根据本发明的示例性实施例,所述运动方向包括上移方向和下移方向。
根据本发明的示例性实施例,训练单元330可以被配置为:将所述光流直方图特征按预定比例分为训练集以及验证集;基于所述训练集对支持向量机模型进行训练;基于所述验证集对经训练的所述支持向量机模型进行验证;基于所述验证结果对所述支持向量机模型进行调整。
根据本发明的示例性实施例,转换单元310可以被配置为:将与待预测视频对应的样本视频转换为连续的帧序列;对所述连续的帧序列进行采样获取所述样本视频的样本帧序列。
由于本发明的示例实施例的运动方向预测装置300的各个功能模块与上述运动方向预测方法的示例实施例的步骤对应,因此在此不再赘述。
在本发明的示例性实施例中,还提供了一种能够实现上述方法的电子设备。
下面参考图4,其示出了适于用来实现本发明实施例的电子设备的计算机系统400的结构示意图。图4示出的电子设备的计算机系统400仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图4所示,计算机系统400包括中央处理单元(CPU)401,其可以根据存储在只读存储器(ROM)402中的程序或者从存储部分408加载到随机访问存储器(RAM)403中的程序而执行各种适当的动作和处理。在RAM 403中,还存储有系统操作所需的各种程序和数据。CPU401、ROM 402以及RAM 403通过总线404彼此相连。输入/输出(I/O)接口405也连接至总线404。
以下部件连接至I/O接口405:包括键盘、鼠标等的输入部分406;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分407;包括硬盘等的存储部分408;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分409。通信部分409经由诸如因特网的网络执行通信处理。驱动器410也根据需要连接至I/O接口405。可拆卸介质411,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器410上,以便于从其上读出的计算机程序根据需要被安装入存储部分408。
特别地,根据本发明的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本发明的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分409从网络上被下载和安装,和/或从可拆卸介质411被安装。在该计算机程序被中央处理单元(CPU)401执行时,执行本申请的系统中限定的上述功能。
需要说明的是,本发明所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本发明中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本发明中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、RF等等,或者上述的任意合适的组合。
附图中的流程图和框图,图示了按照本发明各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本发明实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现,所描述的单元也可以设置在处理器中。其中,这些单元的名称在某种情况下并不构成对该单元本身的限定。
作为另一方面,参照图5所示,本申请还提供了一种计算机可读介质500,该计算机可读介质500可以是上述实施例中描述的电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被一个该电子设备执行时,使得该电子设备实现如上述实施例中所述的运动方向预测方法。
例如,所述电子设备可以实现如图1中所示的:步骤S110,将与待预测视频对应的样本视频转换为样本帧序列;步骤S120,提取所述样本帧序列的各帧中目标像素点的光流直方图特征;步骤S130,基于所述光流直方图特征对方向预测模型进行训练;步骤S140,通过训练后的所述方向预测模型预测所述待预测视频中的目标对象的运动方向。
应当注意,尽管在上文详细描述中提及了用于动作执行的设备或装置的若干模块或者单元,但是这种划分并非强制性的。实际上,根据本发明的实施方式,上文描述的两个或更多模块或者单元的特征和功能可以在一个模块或者单元中具体化。反之,上文描述的一个模块或者单元的特征和功能可以进一步划分为由多个模块或者单元来具体化。
通过以上的实施方式的描述,本领域的技术人员易于理解,这里描述的示例实施方式可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。因此,根据本发明实施方式的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中或网络上,包括若干指令以使得一台计算设备(可以是个人计算机、服务器、触控终端、或者网络设备等)执行根据本发明实施方式的方法。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本发明的其它实施方案。本申请旨在涵盖本发明的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本发明的一般性原理并包括本发明未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本发明的真正范围和精神由下面的权利要求指出。
应当理解的是,本发明并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本发明的范围仅由所附的权利要求来限制。

Claims (8)

1.一种运动方向预测方法,其特征在于,包括:
将与待预测视频对应的样本视频转换为样本帧序列;
提取所述样本帧序列的各帧中目标像素点的光流直方图特征;
基于所述光流直方图特征对方向预测模型进行训练;
通过训练后的所述方向预测模型预测所述待预测视频中的目标对象的运动方向;
提取所述样本帧序列的各帧中目标像素点的光流直方图特征,包括:
构建所述样本帧序列中各帧的具有预设层数的图像金字塔;
对相邻两帧的图像金字塔分别进行多项式扩展,基于所述多项式扩展计算所述相邻两帧的图像金字塔的光流金字塔;
提取各层光流金字塔中目标像素点的光流直方图特征。
2.根据权利要求1所述的运动方向预测方法,其特征在于,提取各层图像金字塔中目标像素点的光流直方图特征,包括:
提取各层图像金字塔中包含目标像素点的预定区域的光流特征;
对所述光流特征进行编码,生成所述预定区域的光流直方图特征。
3.根据权利要求1所述的运动方向预测方法,其特征在于,所述运动方向包括上移方向和下移方向。
4.根据权利要求1所述的运动方向预测方法,其特征在于,基于所述光流直方图特征对方向预测模型进行训练,包括:
将所述光流直方图特征按预定比例分为训练集以及验证集;
基于所述训练集对支持向量机模型进行训练;
基于所述验证集对经训练的所述支持向量机模型进行验证;
基于所述验证结果对所述支持向量机模型进行调整。
5.根据权利要求1至4中任一项所述的运动方向预测方法,将与待预测视频对应的样本视频转换为样本帧序列,包括:
将与待预测视频对应的样本视频转换为连续的帧序列;
对所述连续的帧序列进行采样获取所述样本视频的样本帧序列。
6.一种运动方向预测装置,其特征在于,包括:
转换单元,用于将与待预测视频对应的样本视频转换为样本帧序列;
特征提取单元,用于提取所述样本帧序列的各帧中目标像素点的光流直方图特征;
训练单元,用于基于所述光流直方图特征对方向预测模型进行训练;
预测单元,用于通过训练后的所述方向预测模型预测所述待预测视频中的目标对象的运动方向;
特征提取单元被配置为:图像金字塔构建单元,用于构建所述样本帧序列中各帧的具有预设层数的图像金字塔;对相邻两帧的图像金字塔分别进行多项式扩展,基于所述多项式扩展计算所述相邻两帧的图像金字塔的光流金字塔;提取单元,用于提取各层光流金字塔中目标像素点的光流直方图特征。
7.一种电子设备,其特征在于,包括:
处理器;以及
存储器,所述存储器上存储有计算机可读指令,所述计算机可读指令被所述处理器执行时实现如权利要求1至5中任一项所述的运动方向预测方法。
8.一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至5中任一项所述的运动方向预测方法。
CN201710994357.XA 2017-10-23 2017-10-23 运动方向预测方法、装置、电子设备及存储介质 Active CN109697387B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710994357.XA CN109697387B (zh) 2017-10-23 2017-10-23 运动方向预测方法、装置、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710994357.XA CN109697387B (zh) 2017-10-23 2017-10-23 运动方向预测方法、装置、电子设备及存储介质

Publications (2)

Publication Number Publication Date
CN109697387A CN109697387A (zh) 2019-04-30
CN109697387B true CN109697387B (zh) 2021-07-30

Family

ID=66225961

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710994357.XA Active CN109697387B (zh) 2017-10-23 2017-10-23 运动方向预测方法、装置、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN109697387B (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111027482B (zh) * 2019-12-10 2023-04-14 浩云科技股份有限公司 基于运动向量分段分析的行为分析方法及装置
CN112307872A (zh) * 2020-06-12 2021-02-02 北京京东尚科信息技术有限公司 用于检测目标对象的方法的和装置
CN111833320A (zh) * 2020-07-06 2020-10-27 涵古观智能科技(苏州)有限公司 一种钢带运行状态的检测方法、装置、设备及存储介质
CN112492196B (zh) * 2020-10-29 2022-01-07 贝壳技术有限公司 一种直播进行中主播跟踪方法、装置及系统
CN112347996A (zh) * 2020-11-30 2021-02-09 上海眼控科技股份有限公司 一种场景状态判断方法、装置、设备及存储介质
CN112734795A (zh) * 2020-12-31 2021-04-30 北京深睿博联科技有限责任公司 一种判断物体运动趋势及方向的方法和设备
CN115061770B (zh) * 2022-08-10 2023-01-13 荣耀终端有限公司 显示动态壁纸的方法和电子设备

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104036287A (zh) * 2014-05-16 2014-09-10 同济大学 一种基于人类运动显著轨迹的视频分类方法
CN105389567A (zh) * 2015-11-16 2016-03-09 上海交通大学 基于稠密光流直方图的群体异常检测方法
CN105488519A (zh) * 2015-11-13 2016-04-13 同济大学 一种基于视频尺度信息的视频分类方法
CN106022229A (zh) * 2016-05-11 2016-10-12 北京航空航天大学 基于视频运动信息特征提取与自适应增强算法的误差反向传播网络的异常行为识别方法
CN106204640A (zh) * 2016-06-29 2016-12-07 长沙慧联智能科技有限公司 一种运动目标检测系统及方法
CN106228129A (zh) * 2016-07-18 2016-12-14 中山大学 一种基于matv特征的人脸活体检测方法
CN106846372A (zh) * 2017-02-13 2017-06-13 南京升渡智能科技有限公司 人体运动质量视觉分析与评价系统及其方法

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104331151B (zh) * 2014-10-11 2018-02-23 中国传媒大学 基于光流法的手势运动方向识别方法
CN104463191A (zh) * 2014-10-30 2015-03-25 华南理工大学 一种基于注意机制的机器人视觉处理方法
KR101575857B1 (ko) * 2014-12-23 2015-12-08 영남대학교 산학협력단 다중시점의 동작의 세기와 방향에 대한 히스토그램을 이용한 행동패턴 인식방법
CN107123128B (zh) * 2017-04-24 2019-07-16 南京邮电大学 一种保证准确性的车辆运动状态估计方法
CN111179301B (zh) * 2019-12-23 2023-06-30 北京中广上洋科技股份有限公司 一种基于计算机视频的运动趋势分析方法
CN112132869A (zh) * 2020-11-02 2020-12-25 中远海运科技股份有限公司 一种车辆目标轨迹跟踪方法和装置

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104036287A (zh) * 2014-05-16 2014-09-10 同济大学 一种基于人类运动显著轨迹的视频分类方法
CN105488519A (zh) * 2015-11-13 2016-04-13 同济大学 一种基于视频尺度信息的视频分类方法
CN105389567A (zh) * 2015-11-16 2016-03-09 上海交通大学 基于稠密光流直方图的群体异常检测方法
CN106022229A (zh) * 2016-05-11 2016-10-12 北京航空航天大学 基于视频运动信息特征提取与自适应增强算法的误差反向传播网络的异常行为识别方法
CN106204640A (zh) * 2016-06-29 2016-12-07 长沙慧联智能科技有限公司 一种运动目标检测系统及方法
CN106228129A (zh) * 2016-07-18 2016-12-14 中山大学 一种基于matv特征的人脸活体检测方法
CN106846372A (zh) * 2017-02-13 2017-06-13 南京升渡智能科技有限公司 人体运动质量视觉分析与评价系统及其方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
Event Detection from Video Surveillance Data Based on Optical Flow Histogram and High-level Feature Extraction;Ali Wali等;《2009 20th International Workshop on Database and Expert Systems Application》;20091117;第221-225页 *
Histograms of oriented optical flow and Binet-Cauchy kernels on nonlinear dynamical systems for the recognition of human actions;Rizwan Chaudhry等;《2009 IEEE Conference on Computer Vision and Pattern Recognition》;20090818;第1932-1939页 *
Two-Frame Motion Estimation Based on Polynomial Expansion;Gunnar Farneback;《Scandinavian Conference on Image Analysis》;20030624;第363-370页 *
基于光流直方图的云背景下低帧频小目标探测方法;曾志强等;《光学学报》;20080831;第28卷(第8期);第1496-1501页 *

Also Published As

Publication number Publication date
CN109697387A (zh) 2019-04-30

Similar Documents

Publication Publication Date Title
CN109697387B (zh) 运动方向预测方法、装置、电子设备及存储介质
US10817714B2 (en) Method and apparatus for predicting walking behaviors, data processing apparatus, and electronic device
KR102292559B1 (ko) 단안 이미지 깊이 추정 방법 및 장치, 기기, 프로그램 및 저장 매체
US10412462B2 (en) Video frame rate conversion using streamed metadata
CN112990191A (zh) 一种基于字幕视频的镜头边界检测与关键帧提取方法
CN110287891B (zh) 基于人体关键点的手势控制方法、装置及电子设备
US9743062B2 (en) Method and device for retargeting a 3D content
CN110991310B (zh) 人像检测方法、装置、电子设备及计算机可读介质
CN110177295B (zh) 字幕越界的处理方法、装置和电子设备
CN109472811A (zh) 非感兴趣客体的掩膜处理方法
US8995755B2 (en) Two-dimensional to stereoscopic conversion systems and methods
CN105979283A (zh) 视频转码方法和装置
CN114494942A (zh) 视频分类方法及装置、存储介质及电子设备
CN112200817A (zh) 基于图像的天空区域分割和特效处理方法、装置及设备
CN114419322B (zh) 一种图像实例分割方法、装置、电子设备及存储介质
CN110796003A (zh) 车道线检测方法、装置及电子设备
JP2007201975A (ja) 符号量推定方法、フレームレート推定方法、符号量推定装置、フレームレート推定装置、符号量推定プログラム、フレームレート推定プログラムおよびそれらのプログラムを記録したコンピュータ読み取り可能な記録媒体
KR101777776B1 (ko) 표본 프로파일 정보 기반 움직임 추정장치 및 방법
CN111010606B (zh) 视频处理方法和装置
CN116137671A (zh) 一种封面生成方法、装置、设备及介质
CN111539420B (zh) 基于注意力感知特征的全景图像显著性预测方法及系统
Guo et al. Speeding uplow rank matrix recovery for foreground separation in surveillance videos
KR101359351B1 (ko) 연산 스킵 기법에 의한 고속 스테레오 영상 정합 방법
KR101787004B1 (ko) 표본 픽셀 기반 움직임 추정장치 및 방법
CN116091984B (zh) 视频目标分割方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant