CN110705510A - 一种动作确定方法、装置、服务器和存储介质 - Google Patents

一种动作确定方法、装置、服务器和存储介质 Download PDF

Info

Publication number
CN110705510A
CN110705510A CN201910983619.1A CN201910983619A CN110705510A CN 110705510 A CN110705510 A CN 110705510A CN 201910983619 A CN201910983619 A CN 201910983619A CN 110705510 A CN110705510 A CN 110705510A
Authority
CN
China
Prior art keywords
image
position information
target object
determining
identification
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910983619.1A
Other languages
English (en)
Other versions
CN110705510B (zh
Inventor
倪光一
金明
董慧智
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Youpin Technology Co ltd
Original Assignee
Shanghai Jilian Network Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Jilian Network Technology Co Ltd filed Critical Shanghai Jilian Network Technology Co Ltd
Priority to CN201910983619.1A priority Critical patent/CN110705510B/zh
Publication of CN110705510A publication Critical patent/CN110705510A/zh
Application granted granted Critical
Publication of CN110705510B publication Critical patent/CN110705510B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/20Movements or behaviour, e.g. gesture recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Software Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Psychiatry (AREA)
  • Social Psychology (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)

Abstract

本发明实施例公开了一种动作确定方法、装置、计算机设备和存储介质,其中,动作确定方法包括:将第一图像输入位置检测器中,得到第一图像中的标识物体和目标物体的第一位置信息;基于第一位置信息,对第二图像进行跟踪,得到第二图像中的标识物体和目标物体的第二位置信息,其中,第二图像为相邻两个第一图像之间的图像;根据预设动作确定逻辑,基于前后两帧图像的位置信息,确定标识物体所在的目标部位的第一相对动作。本发明实施例的技术方案能够简单快速的确定出目标部位的动作。

Description

一种动作确定方法、装置、服务器和存储介质
技术领域
本发明实施例涉及计算机视觉技术领域,尤其涉及一种动作确定方法、装置、服务器和存储介质。
背景技术
近年来,随着人工智能领域的技术发展尤其是深度学习技术的迅猛发展,计算机视觉领域取得很大的突破,使用计算机对数字图像进行计算分析的技术被广泛应用到各个领域。
以对图像中目标部位的动作检测为例,现有的利用计算机视觉检测动作的方法多是基于光流技术、关键点检测或者单纯利用人物动作图像的特征来实现的,这些实施方法过程比较复杂,计算量大较为耗时。
发明内容
本发明实施例提供一种动作确定方法、装置、服务器和存储介质,能够简单快速的确定出目标部位的动作。
第一方面,本发明实施例提供了一种动作确定方法,所述动作确定方法包括:
将第一图像输入位置检测器中,得到所述第一图像中的标识物体和目标物体的第一位置信息;
基于所述第一位置信息,对第二图像进行跟踪,得到所述第二图像中的所述标识物体和目标物体的第二位置信息,其中,所述第二图像为相邻两个第一图像之间的图像;
根据预设动作确定逻辑,基于前后两帧图像的位置信息,确定所述标识物体所在的目标部位的第一相对动作。
第二方面,本发明实施例还提供了一种动作确定装置,所述动作确定装置包括:
第一位置信息确定模块,用于将第一图像输入位置检测器中,得到所述第一图像中的标识物体和目标物体的第一位置信息;
第二位置信息确定模块,用于基于所述第一位置信息,对第二图像进行跟踪,得到所述第二图像中的所述标识物体和目标物体的第二位置信息,其中,所述第二图像为相邻两个第一图像之间的图像;
第一相对动作确定模块,用于根据预设动作确定逻辑,基于前后两帧图像的位置信息,确定所述标识物体所在的目标部位的第一相对动作。
第三方面,本发明实施例还提供了一种计算机设备,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如上所述的动作确定方法。
第四方面,本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上所述的动作确定方法。
本发明实施例通过将第一图像输入位置检测器中,得到第一图像中的标识物体和目标物体的第一位置信息;基于第一位置信息,对第二图像进行跟踪,得到第二图像中的标识物体和目标物体的第二位置信息,其中,第二图像为相邻两个第一图像之间的图像;根据预设动作确定逻辑,基于前后两帧图像的位置信息,确定标识物体所在的目标部位的第一相对动作。通过位置检测器预测位置信息,并基于位置信息确定相应的动作,克服了现有利用光流技术等方法确定目标部位的过程复杂,计算量大,且较为耗时的不足,能够达到简单快速的确定出目标部位的动作的效果。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图做一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例一中的动作确定方法的流程图;
图2是本发明实施例二中的动作确定方法的流程图;
图3是本发明实施例三中的动作确定装置的结构示意图;
图4是本发明实施例四中的计算机设备的结构示意图。
具体实施方式
下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。
实施例一
图1为本发明实施例一提供的动作确定方法的流程图,本实施例可适用于基于图像确定目标部位动作的情况,该方法可以由动作确定装置来执行,该装置可以采用软件和/或硬件的方式实现,该装置可以配置于计算机设备中。如图1所示,该方法可以包括如下步骤:
S110、将第一图像输入位置检测器中,得到第一图像中的标识物体和目标物体的第一位置信息。
其中,第一图像可以是图像序列中的每一帧图像,也可以是图像序列中的关键帧图像,还可以是图像序列中基于预设采样间隔采样得到的图像。第一图像还可以是对上述任意一种图像进行裁剪或压缩后的图像,上述选择关键帧图像或者采样图像以及对相应图像进行裁剪或压缩处理的目的是减少计算量,提升动作确定的速度。上述图像序列可以是通过图像采集设备采集到的图像,也可以是从现有的图像集中选取的图像,还可以是从现有视频中提取出来的图像,在此不做特殊限定。
本实施例中,位置检测器是预先训练的,且用于获取图像中物体位置信息的模型,其中,该模型可以是深度学习网路模型,例如可以是卷积神经网络模型,该模型还可以是基于传统特征的分类型模型。
标识物体优选可以位于目标物体中的目标部位上,示例性的,目标物体可以是人体也可以是其他物体;以人体为例,目标部位可以是手臂或腿部;一手臂为例,标识物体可以是手部所持有的预设物体,也可以是设置在手臂上的预设图标等。第一位置信息优选可以包括标识物体对应选择框的坐标信息(或像素点信息)和目标物体对应选择框的坐标信息(或像素点信息)等。其中,选择框优选可以是即能够完整包括标识物体或目标物体的信息,又能够足够少的引入除标识物体或目标物体之外的信息的选择框。选择框的形状可以是任意的,其对应的坐标信息的个数也是任意的,示例性的,选择框的形状可以是矩形,选择框对应的坐标信息可以是矩形的四个顶点的坐标信息。优选的,标识物体对应的选择框与相应目标物体对应的选择框有重叠,且相较于与其他目标物体对应的选择框的距离而言,标识物体对应的选择框与相应目标物体对应的选择框的距离最短。第一位置信息优选还可以包括标识物体对应特征点的坐标信息和目标物体对应特征点的坐标信息等。
S120、基于第一位置信息,对第二图像进行跟踪,得到第二图像中的标识物体和目标物体的第二位置信息,其中,第二图像为相邻两个第一图像之间的图像。
其中,若第一图像为关键帧图像,则第二图像为相邻两个关键帧之间的图像,若第一图像为采样图像,则第二图像为相邻两个采样图像之间的图像。第二图像的数目可以是一个也可以是多个,其对应的第二位置信息可以是一个也可以是多个。在此需要说明的是,若第一图像为图像序列中的每一帧图像,相邻两个第一图像之间没有第二图像,此时,可以无需对第二图像进行跟踪。
根据第一位置信息,可以确定第一图像中标识物体和目标物体所在的具体位置。基于此,可以利用目标跟踪算法对相邻两个图像之间的图像进行跟踪,得到第二图像中标识物体和目标物体的第二位置信息。具体的,目标跟踪算法可以是对选择框中的标识物体和目标物体进行跟踪的算法。优选的,目标跟踪算法优选可以是基于主动轮廓的跟踪算法。其中,第二位置信息与第一位置信息在本质上相同,包含相同的参数,但是每个参数对应的具体数值可能不同。
上述对相邻两个第一图像之间的第二图像进行跟踪,以获取第二位置信息的目的是为了减少图像处理的计算量,以提升动作确定的速率。
S130、根据预设动作确定逻辑,基于前后两帧图像的位置信息,确定标识物体所在的目标部位的第一相对动作。
其中,若第一图像为关键帧或采样图像,则前后两帧图像可以是关键帧图像(或采样图像)和关键帧图像(或采样图像)之后的第一帧图像,或关键帧图像(或采样图像)之前的一帧图像和关键帧图像(或采用图像),相应的,前后两帧图像的位置信息可以包括第一位置信息和第二位置信息。前后两帧图像还可以是相邻两个关键帧图像(或相邻两个采样图像)之间的任意相邻两帧图像,相应的,前后两帧图像的位置信息可以包括第二位置信息。若第一图像为图像序列中的每一帧图像,则前后两帧图像的位置信息可以包括第一位置信息。
优选的,预设动作确定逻辑为根据前后两帧图像的位置信息,确定目标部位相对动作的逻辑。根据预设动作确定逻辑可以确定后一帧图像中目标部位相对前一帧图像中目标部位的动作,也可以确定前一帧图像中目标部位相对后一帧图像中目标部位的动作,还可以确定后一帧图像中目标部位相对后一帧图像中目标物体的动作等。
本实施例提供的动作确定方法,通过将第一图像输入位置检测器中,得到第一图像中的标识物体和目标物体的第一位置信息;基于第一位置信息,对第二图像进行跟踪,得到第二图像中的标识物体和目标物体的第二位置信息,其中,第二图像为相邻两个第一图像之间的图像;根据预设动作确定逻辑,基于前后两帧图像的位置信息,确定标识物体所在的目标部位的第一相对动作。通过位置检测器预测位置信息,并基于位置信息确定相应的动作,克服了现有利用光流技术等方法确定目标部位的过程复杂,计算量大,且较为耗时的不足,能够达到简单快速的确定出目标部位的动作的效果。
在上述各实施例的基础上,进一步的,在将第一图像输入位置检测器中,得到第一图像中的标识物体和目标物体的第一位置信息之后,还包括:
根据标识物体和目标物体的第一位置信息,确定标识物体对应的标识物体图像和目标物体对应的目标物体图像;
将标识物体图像输入标识物体二分类器中,根据输出结果确定标识物体图像对应的第一类别;
将目标物体图像输入目标物体二分类器中,根据输出结果确定目标物体图像对应的第二类别;
若第一类别为标识物体且第二类别为目标物体,则基于第一位置信息,对第二图像进行跟踪。
示例性的,第一位置信息可以包括标识物体对应选择框的坐标信息和目标物体对应选择框的坐标信息,基于上述坐标信息,可以确定出包括标识物体的选择框和包括目标物体的选择框。将相应选择框对应的图像作为标识物体图像和目标物体图像。
本实施例中的标识物体二分类器和目标物体二分类器可以是对标识物体和目标物体的第一位置信息进行二分类(是或不是)的算法,上述二分类器可以有多种形式,在此不做特殊限定。上述分类器优选可以是基于支持向量机((SVM,support vector machine))的二分类器,其分类结果可以为正或负,也可以为正确或错误,还可以为是或否等。
将标识物体图像输入到标识物体二分类器中,对位置检测器输出的第一位置信息进行判断,以确定位置检测器的输出信息是否正确。下面以二分类器的输出为正或者负为例进行说明。若标识物体二分类器的输出结果为正,则说明利用第一位置信息确定的标识物体图像所对应的物体的第一类别为标识物体,即确定位置检测器的标识物体输出结果正确,此时,保留位置检测器确定的与标识物体对应的第一位置信息。若标识物体二分类器的输出结果为负,则说明利用第一位置信息确定的标识物体图像所对应的物体的第一类别不是标识物体,即确定位置检测器的标识物体输出结果不正确,此时,丢弃位置检测器确定的第一位置信息。
将目标物体图像输入到目标物体二分类器中,对位置检测器输出的第一位置信息进行判断,以确定位置检测器的输出信息是否正确。若目标物体二分类器的输出结果为正,则说明利用第一位置信息确定的目标物体图像所对应的物体的第二类别为目标物体,即确定位置检测器的目标物体输出结果正确,此时,保留位置检测器确定的与目标物体对应的第一位置信息。若目标物体二分类器的输出结果为负,则说明利用第一位置信息确定的目标物体图像所对应的物体的第二类别不是目标物体,即确定位置检测器的目标物体输出结果不正确,此时,丢弃位置检测器确定的第一位置信息。
上述当第一类别为标识物体且第二类别为目标物体,则说明位置检测器确定的第一位置信息为确定目标部位相对动作的有效信息。此时可以基于第一位置信息,对第二图像进行跟踪,以得到第二位置信息。
在上述各实施例的基础上,进一步的,在将第一图像输入位置检测器中,得到第一图像中的标识物体和目标物体的第一位置信息之前,还包括:
将标注有标识物体和目标物体的样本图像,输入预先建立的位置检测器中,得到标识物体和目标物体的输出位置信息;
根据标识物体和目标物体的实际位置信息和输出位置信息,对位置检测器的参数进行调整。
其中,标注有标识物体和目标物体的样本图像可以由原始样本图像序列和相应的标注文件确定。其中,原始样本图像序列可以是通过图像采集设备采集到的样本图像,也可以是从现有的图像集中选取的样本图像,还可以是从现有视频中提取出来的样本图像,在此不做特殊限定。优选的,为了使得训练得到的位置检测器更准确,在选择样本图像时可以选择多种情况下的样本图像,使样本更具代表性、广泛性。在此需要说明的是,在训练样本的过程中,除了包括正样本图像之外,还可以包括负样本图像。
标注文件可以通过标注工具制作生成,也可以是从现有的标注文件中获得,在此不做特殊限定。示例性的,所标注的目标物体的区域为样本图像中能覆盖目标物体最小矩形区域,所标注的标识物体的区域为样本图像中能覆盖标识物体的最小矩形区域。以目标物体为人体为例,所标注的目标物体的区域为样本图像中能覆盖人物身体及四肢的最小矩形区域。
优选的,位置检测器输出的位置信息可以包括样本图像中目标物体和标识物体所在区域的位置信息,例如可以是目标物体和标识物体在图像中的坐标信息或像素点信息等。还可以包括样本图像中目标物体和标识物体所在区域的分类信息,例如可以是目标物体和标识物体对应的第一类别和第二类别的编号或字段;还可以包括样本图像中目标物体和标识物体所在区域的可信度信息,例如预测的各位置信息的置信度得分等。
本实施例中,位置检测器可以为基于深度学习网络模型的位置检测器,优选的,其可以是卷积神经网络,其可以包括输入层、特征提取层和分类层。其中,输入层用于输入样本图像,特征提取层用于对样本图像进行特征提取,分类层用于根据提取得到的特征进行分类,得到相应目标物体和标识物体的位置信息。优选的,对位置检测器的参数进行调整的方法可以包括梯度下降法或反向传播算法。
在上述各实施例的基础上,进一步的,位置检测器还可以包括级联分类器;
优选的,训练级联分类器所用的样本图像可以与训练上述位置检测器的样本图像相同,不同点在于,每个样本图像需要转换为灰度图。
在本实施例中,级联分类器可以是基于LBP特征的级联分类器,也可以是基于Haar特征的级联分类器。
在上述各实施例的基础上,进一步的,在将标识物体图像输入标识物体二分类器中,根据输出结果确定标识物体图像对应的第一类别;将目标物体图像输入目标物体二分类器中,根据输出结果确定目标物体图像对应的第二类别之前,还包括:
将标识物体正样本图像或标识物体负样本图像,输入预先建立的标识物体二分类器中,得到输出标识物体类别;
根据样本图像对应的实际标识物体类别和输出标识物体类别,对标识物体二分类器的参数进行调整;
将目标物体正样本图像或目标物体负样本图像,输入预先建立的目标物体二分类器中,得到输出目标物体类别;
根据样本图像对应的实际目标物体类别和输出目标物体类别,对目标物体二分类器的参数进行调整。
其中,标识物体正样本图像可以由标注有标识物体的样本图像裁切得到,裁切区域为所标注的标识物体区域。目标物体正样本图像可以由标注有目标物体的样本图像裁切得到,裁切区域为所标注的目标物体区域。
本实施例中的负样本图像可以是背景图片,负样本图像中不包含目标物体、标识物体以及目标物体和标识物体上的部分特征,负样本图像优选可以为满足上述条件的任何内容的图片。
标识物体二分类器和目标物体二分类器的输出结果可以是正负信息,输出结果为正则说明相应图像属于其对应的类别,输出结果为负则说明相应图像不属于其对应的类别。标识物体二分类器和目标物体二分类器的输出结果还可以是可信度信息,例如置信度得分,输出的置信度得分越高,则说明相应图像属于其对应的类别的可能性越大,输出的置信度得分越低,则说明相应图像属于其对应的类别的可能性越小。
实施例二
图2为本发明实施例二提供的一种动作确定方法的流程图。本实施例可以与上述一个或者多个实施例中各个可选方案结合,在本实施例中,根据预设动作确定逻辑,基于前后两帧图像的位置信息,确定所述标识物体所在的目标部位的第一相对动作,包括:根据前一帧图像中所述标识物体与目标物体之间的第一相对位置信息和后一帧图像中所述标识物体与目标物体之间的第二相对位置信息,确定所述标识物体的相对移动距离和相对移动方向;根据所述相对移动距离和相对移动方向,确定所述标识物体第二相对动作,并将所述第二相对动作作为所述第一相对动作。
如图2a所示,该方法可以包括如下步骤:
S210、将第一图像输入位置检测器中,得到第一图像中的标识物体和目标物体的第一位置信息。
S220、基于第一位置信息,对第二图像进行跟踪,得到第二图像中的标识物体和目标物体的第二位置信息,其中,第二图像为相邻两个第一图像之间的图像。
S230、根据前一帧图像中标识物体与目标物体之间的第一相对位置信息和后一帧图像中标识物体与目标物体之间的第二相对位置信息,确定标识物体的相对移动距离和相对移动方向。
S240、根据相对移动距离和相对移动方向,确定标识物体第二相对动作,并将第二相对动作作为第一相对动作。
以目标物体为人体,标识物体为右手部所持有的物体,对上述确定第一相对动作的步骤进行详细说明:
如图2b所示,前一帧图像中标识物体选择框为21,前一帧图像中目标物体选择框为22,前一帧图像中标识物体与目标物体之间的第一相对位置为标识物体选择框位于人体选择框内左侧中偏上的位置,将此时的标识物体选择框所处的位置及其附近预设范围设定为初始位置区域。如图2c所示,后一帧图像中标识物体选择框为23,后一帧图像中目标物体选择框为24,后一帧图像中标识物体与目标物体之间的第一相对位置为标识物体选择框位于人体选择框内顶部偏左的位置。根据第一相对位置信息和第二相对位置信息,可以计算标识物体选择框相较初始位置区域的移动(直线)距离及移动方向,分别是移动距离大于预设移动距离阈值,且移动方向为向上。根据移动距离和移动方向可以判定人体发生的动作为向上举臂。同理,还可以根据标识物体选择框相对人体选择框的位置信息,确定人体发生的向左挥臂、向右挥臂、向下挥臂等动作。在此需要说明的是,上述预设动作确定逻辑只是作为一个实例,在具体实施过程中,可以根据实际情况设计以及调整动作确定的具体逻辑。
重复上述动作确定步骤,直至图像序列中每相邻两帧图像之间的相对动作确定完成为止。
本实施例提供的动作确定方法,通过将第一图像输入位置检测器中,得到第一图像中的标识物体和目标物体的第一位置信息;基于第一位置信息,对第二图像进行跟踪,得到第二图像中的标识物体和目标物体的第二位置信息,其中,第二图像为相邻两个第一图像之间的图像;根据前一帧图像中标识物体与目标物体之间的第一相对位置信息和后一帧图像中标识物体与目标物体之间的第二相对位置信息,确定标识物体的相对移动距离和相对移动方向;根据相对移动距离和相对移动方向,确定标识物体第二相对动作,并将第二相对动作作为第一相对动作。通过位置检测器预测位置信息,并基于相对位置信息确定相应的动作,克服了现有利用光流技术等方法确定目标部位的过程复杂,计算量大,且较为耗时的不足,能够达到简单快速且相对精确的确定出目标部位的动作的效果。
实施例三
图3是本发明实施例三中的动作确定装置的结构示意图。如图3所示,动作确定装置包括:
第一位置信息确定模块310,用于将第一图像输入位置检测器中,得到第一图像中的标识物体和目标物体的第一位置信息;
第二位置信息确定模块320,用于基于第一位置信息,对第二图像进行跟踪,得到第二图像中的标识物体和目标物体的第二位置信息,其中,第二图像为相邻两个第一图像之间的图像;
第一相对动作确定模块330,用于根据预设动作确定逻辑,基于前后两帧图像的位置信息,确定标识物体所在的目标部位的第一相对动作。
本实施例提供的动作确定装置,通过利用第一位置信息确定模块将第一图像输入位置检测器中,得到第一图像中的标识物体和目标物体的第一位置信息;基于第一位置信息,利用第二位置信息确定模块对第二图像进行跟踪,得到第二图像中的标识物体和目标物体的第二位置信息,其中,第二图像为相邻两个第一图像之间的图像;根据前一帧图像中标识物体与目标物体之间的第一相对位置信息和后一帧图像中标识物体与目标物体之间的第二相对位置信息,利用第一相对动作确定模块确定标识物体的相对移动距离和相对移动方向;根据相对移动距离和相对移动方向,确定标识物体第二相对动作,并将第二相对动作作为第一相对动作。通过位置检测器预测位置信息,并基于位置信息确定相应的动作,克服了现有利用光流技术等方法确定目标部位的过程复杂,计算量大,且较为耗时的不足,能够达到简单快速的确定出目标部位的动作的效果。
在上述技术方案的基础上,进一步的,动作确定装置还可以包括:
图像确定模块,用于在将第一图像输入位置检测器中,得到第一图像中的标识物体和目标物体的第一位置信息之后,根据标识物体和目标物体的第一位置信息,确定标识物体对应的标识物体图像目标物体对应的目标物体图像;
第一类别确定模块,用于将标识物体图像输入标识物体二分类器中,根据输出结果确定标识物体图像对应的第一类别;
第二类别确定模块,用于将目标物体图像输入目标物体二分类器中,根据输出结果确定目标物体图像对应的第二类别;
跟踪模块,用于若第一类别为标识物体且第二类别为目标物体,则基于第一位置信息,对第二图像进行跟踪。
在上述技术方案的基础上,进一步的,第一相对动作确定模块330具体可以包括:
相对移动参数确定单元,用于根据前一帧图像中标识物体与目标物体之间的第一相对位置信息和后一帧图像中标识物体与目标物体之间的第二相对位置信息,确定标识物体的相对移动距离和相对移动方向;
第一相对动作确定单元,用于根据相对移动距离和相对移动方向,确定标识物体第二相对动作,并将第二相对动作作为第一相对动作。
在上述技术方案的基础上,进一步的,动作确定装置还可以包括位置检测器训练模块,用于在将第一图像输入位置检测器中,得到第一图像中的标识物体和目标物体的第一位置信息之前,将标注有标识物体和目标物体的样本图像,输入预先建立的位置检测器中,得到标识物体和目标物体的输出位置信息;
根据标识物体和目标物体的实际位置信息和输出位置信息,对位置检测器的参数进行调整。
在上述技术方案的基础上,进一步的,位置检测器为基于深度学习网络模型的位置检测器或者级联分类器;
位置检测器训练模块具体可以用于:
采用梯度下降法或反向传播算法对位置检测器的参数进行调整。
在上述技术方案的基础上,进一步的,动作确定装置还可以包括二分类器训练模块,用于在将标识物体图像输入标识物体二分类器中,根据输出结果确定标识物体图像对应的第一类别;将目标物体图像输入目标物体二分类器中,根据输出结果确定目标物体图像对应的第二类别之前,将标识物体正样本图像或标识物体负样本图像,输入预先建立的标识物体二分类器中,得到输出标识物体类别;
根据样本图像对应的实际标识物体类别和输出标识物体类别,对标识物体二分类器的参数进行调整;
将目标物体正样本图像或目标物体负样本图像,输入预先建立的目标物体二分类器中,得到输出目标物体类别;
根据样本图像对应的实际目标物体类别和输出目标物体类别,对目标物体二分类器的参数进行调整。
在上述技术方案的基础上,进一步的,标识物体二分类器和目标物体二分类器为基于支持向量机的二分类器。
本发明实施例所提供的动作确定装置可执行本发明任意实施例所提供的动作确定方法,具备执行方法相应的功能模块和有益效果。
实施例四
图4为本发明实施例四提供的计算机设备的结构示意图。图4示出了适于用来实现本发明实施方式的示例性计算机设备412的框图。图4显示的计算机设备412仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图4所示,计算机设备412以通用计算设备的形式表现。计算机设备412的组件可以包括但不限于:一个或者多个处理器416,存储器428,连接不同系统组件(包括存储器428和处理器416)的总线418。除此之外,计算机设备412还包括激光发射器(图4中未示出),激光发射器设置于参考坐标系内的参考点处,用于发射出射激光。
总线418表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器,外围总线,图形加速端口,处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构(ISA)总线,微通道体系结构(MAC)总线,增强型ISA总线、视频电子标准协会(VESA)局域总线以及外围组件互连(PCI)总线。
计算机设备412典型地包括多种计算机系统可读介质。这些介质可以是任何能够被计算机设备412访问的可用介质,包括易失性和非易失性介质,可移动的和不可移动的介质。
存储器428可以包括易失性存储器形式的计算机系统可读介质,例如随机存取存储器(RAM)430和/或高速缓存存储器432。计算机设备412可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机系统存储介质。仅作为举例,存储装置434可以用于读写不可移动的、非易失性磁介质(图4未显示,通常称为“硬盘驱动器”)。尽管图4中未示出,可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘(例如CD-ROM,DVD-ROM或者其它光介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据介质接口与总线418相连。存储器428可以包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块,这些程序模块被配置以执行本发明各实施例的功能。
具有一组(至少一个)程序模块442的程序/实用工具440,可以存储在例如存储器428中,这样的程序模块442包括但不限于操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块442通常执行本发明所描述的实施例中的功能和/或方法。
计算机设备412也可以与一个或多个外部设备414(例如键盘、指向设备、显示器424等,其中,显示器424可根据实际需要决定是否配置)通信,还可与一个或者多个使得用户能与该计算机设备412交互的设备通信,和/或与使得该计算机设备412能与一个或多个其它计算设备进行通信的任何设备(例如网卡,调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口422进行。并且,计算机设备412还可以通过网络适配器420与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图所示,网络适配器420通过总线418与计算机设备412的其它模块通信。应当明白,尽管图4中未示出,可以结合计算机设备412使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储装置等。
处理器416通过运行存储在存储器428中的程序,从而执行各种功能应用以及数据处理,例如实现本发明实施例所提供的动作确定方法。
实施例五
本发明实施例五提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本发明实施例所提供的动作确定方法,包括:
将第一图像输入位置检测器中,得到第一图像中的标识物体和目标物体的第一位置信息;
基于第一位置信息,对第二图像进行跟踪,得到第二图像中的标识物体和目标物体的第二位置信息,其中,第二图像为相邻两个第一图像之间的图像;
根据预设动作确定逻辑,基于前后两帧图像的位置信息,确定标识物体所在的目标部位的第一相对动作。
当然,本发明实施例所提供的计算机可读存储介质,其上存储的计算机程序不限于执行如上所述的方法操作,还可以执行本发明任意实施例所提供的基于计算机设备的动作确定方法中的相关操作。
本发明实施例的计算机存储介质,可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括——但不限于无线、电线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言或其组合来编写用于执行本发明操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如”C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。

Claims (10)

1.一种动作确定方法,其特征在于,包括:
将第一图像输入位置检测器中,得到所述第一图像中的标识物体和目标物体的第一位置信息;
基于所述第一位置信息,对第二图像进行跟踪,得到所述第二图像中的所述标识物体和目标物体的第二位置信息,其中,所述第二图像为相邻两个第一图像之间的图像;
根据预设动作确定逻辑,基于前后两帧图像的位置信息,确定所述标识物体所在的目标部位的第一相对动作。
2.根据权利要求1所述的方法,其特征在于,在将第一图像输入位置检测器中,得到所述第一图像中的标识物体和目标物体的第一位置信息之后,还包括:
根据所述标识物体和目标物体的第一位置信息,确定所述标识物体对应的标识物体图像和所述目标物体对应的目标物体图像;
将所述标识物体图像输入标识物体二分类器中,根据输出结果确定所述标识物体图像对应的第一类别;
将所述目标物体图像输入目标物体二分类器中,根据输出结果确定所述目标物体图像对应的第二类别;
若所述第一类别为标识物体且所述第二类别为目标物体,则基于所述第一位置信息,对第二图像进行跟踪。
3.根据权利要求1或2所述的方法,其特征在于,根据预设动作确定逻辑,基于前后两帧图像的位置信息,确定所述标识物体所在的目标部位的第一相对动作,包括:
根据前一帧图像中所述标识物体与目标物体之间的第一相对位置信息和后一帧图像中所述标识物体与目标物体之间的第二相对位置信息,确定所述标识物体的相对移动距离和相对移动方向;
根据所述相对移动距离和相对移动方向,确定所述标识物体第二相对动作,并将所述第二相对动作作为所述第一相对动作。
4.根据权利要求1或2所述的方法,其特征在于,在将第一图像输入位置检测器中,得到所述第一图像中的标识物体和目标物体的第一位置信息之前,还包括:
将标注有所述标识物体和所述目标物体的样本图像,输入预先建立的位置检测器中,得到所述标识物体和所述目标物体的输出位置信息;
根据所述标识物体和所述目标物体的实际位置信息和所述输出位置信息,对所述位置检测器的参数进行调整。
5.根据权利要求4所述的方法,其特征在于,所述位置检测器为基于深度学习网络模型的位置检测器或者级联分类器;
对所述位置检测器的参数进行调整,包括:
采用梯度下降法或反向传播算法对所述位置检测器的参数进行调整。
6.根据权利要求2所述的方法,其特征在于,在将所述标识物体图像输入标识物体二分类器中,根据输出结果确定所述标识物体图像对应的第一类别;将所述目标物体图像输入目标物体二分类器中,根据输出结果确定所述目标物体图像对应的第二类别之前,还包括:
将标识物体正样本图像或标识物体负样本图像,输入预先建立的标识物体二分类器中,得到输出标识物体类别;
根据样本图像对应的实际标识物体类别和所述输出标识物体类别,对所述标识物体二分类器的参数进行调整;
将目标物体正样本图像或目标物体负样本图像,输入预先建立的目标物体二分类器中,得到输出目标物体类别;
根据样本图像对应的实际目标物体类别和所述输出目标物体类别,对所述目标物体二分类器的参数进行调整。
7.根据权利要求6所述的方法,其特征在于,所述标识物体二分类器和所述目标物体二分类器为基于支持向量机的二分类器。
8.一种动作确定装置,其特征在于,包括:
第一位置信息确定模块,用于将第一图像输入位置检测器中,得到所述第一图像中的标识物体和目标物体的第一位置信息;
第二位置信息确定模块,用于基于所述第一位置信息,对第二图像进行跟踪,得到所述第二图像中的所述标识物体和目标物体的第二位置信息,其中,所述第二图像为相邻两个第一图像之间的图像;
第一相对动作确定模块,用于根据预设动作确定逻辑,基于前后两帧图像的位置信息,确定所述标识物体所在的目标部位的第一相对动作。
9.一种计算机设备,其特征在于,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-7中任一所述的动作确定方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-7中任一所述的动作确定方法。
CN201910983619.1A 2019-10-16 2019-10-16 一种动作确定方法、装置、服务器和存储介质 Active CN110705510B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910983619.1A CN110705510B (zh) 2019-10-16 2019-10-16 一种动作确定方法、装置、服务器和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910983619.1A CN110705510B (zh) 2019-10-16 2019-10-16 一种动作确定方法、装置、服务器和存储介质

Publications (2)

Publication Number Publication Date
CN110705510A true CN110705510A (zh) 2020-01-17
CN110705510B CN110705510B (zh) 2023-09-05

Family

ID=69199836

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910983619.1A Active CN110705510B (zh) 2019-10-16 2019-10-16 一种动作确定方法、装置、服务器和存储介质

Country Status (1)

Country Link
CN (1) CN110705510B (zh)

Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130273937A1 (en) * 2011-01-14 2013-10-17 Nec Corporation Action pattern analysis device, action pattern analysis method, and action pattern analysis program
JP2014112348A (ja) * 2012-11-06 2014-06-19 Daimler Ag 動作解析装置、動作解析システム、および動作解析方法
CN104850219A (zh) * 2014-02-19 2015-08-19 北京三星通信技术研究有限公司 估计附着物体的人体姿势的设备和方法
CN105989328A (zh) * 2014-12-11 2016-10-05 由田新技股份有限公司 检测人员使用手持装置的方法及装置
CN108154118A (zh) * 2017-12-25 2018-06-12 北京航空航天大学 一种基于自适应组合滤波与多级检测的目标探测系统及方法
CN108596056A (zh) * 2018-04-10 2018-09-28 武汉斑马快跑科技有限公司 一种出租车运营行为动作识别方法及系统
CN109224437A (zh) * 2018-08-28 2019-01-18 腾讯科技(深圳)有限公司 一种应用场景的交互方法和终端以及存储介质
CN109409277A (zh) * 2018-10-18 2019-03-01 北京旷视科技有限公司 手势识别方法、装置、智能终端及计算机存储介质
CN110069137A (zh) * 2019-04-30 2019-07-30 徐州重型机械有限公司 手势控制方法、控制装置和控制系统
CN110110787A (zh) * 2019-05-06 2019-08-09 腾讯科技(深圳)有限公司 目标的位置获取方法、装置、计算机设备及存储介质
EP3531341A2 (en) * 2018-07-03 2019-08-28 Baidu Online Network Technology (Beijing) Co., Ltd. Method for human motion analysis, apparatus for human motion analysis, device and storage medium
CN110223322A (zh) * 2019-05-31 2019-09-10 腾讯科技(深圳)有限公司 图像识别方法、装置、计算机设备和存储介质

Patent Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130273937A1 (en) * 2011-01-14 2013-10-17 Nec Corporation Action pattern analysis device, action pattern analysis method, and action pattern analysis program
JP2014112348A (ja) * 2012-11-06 2014-06-19 Daimler Ag 動作解析装置、動作解析システム、および動作解析方法
CN104850219A (zh) * 2014-02-19 2015-08-19 北京三星通信技术研究有限公司 估计附着物体的人体姿势的设备和方法
CN105989328A (zh) * 2014-12-11 2016-10-05 由田新技股份有限公司 检测人员使用手持装置的方法及装置
CN108154118A (zh) * 2017-12-25 2018-06-12 北京航空航天大学 一种基于自适应组合滤波与多级检测的目标探测系统及方法
CN108596056A (zh) * 2018-04-10 2018-09-28 武汉斑马快跑科技有限公司 一种出租车运营行为动作识别方法及系统
EP3531341A2 (en) * 2018-07-03 2019-08-28 Baidu Online Network Technology (Beijing) Co., Ltd. Method for human motion analysis, apparatus for human motion analysis, device and storage medium
CN109224437A (zh) * 2018-08-28 2019-01-18 腾讯科技(深圳)有限公司 一种应用场景的交互方法和终端以及存储介质
CN109409277A (zh) * 2018-10-18 2019-03-01 北京旷视科技有限公司 手势识别方法、装置、智能终端及计算机存储介质
CN110069137A (zh) * 2019-04-30 2019-07-30 徐州重型机械有限公司 手势控制方法、控制装置和控制系统
CN110110787A (zh) * 2019-05-06 2019-08-09 腾讯科技(深圳)有限公司 目标的位置获取方法、装置、计算机设备及存储介质
CN110223322A (zh) * 2019-05-31 2019-09-10 腾讯科技(深圳)有限公司 图像识别方法、装置、计算机设备和存储介质

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
VENKATA PRASAD V 等: "Object’s Action Detection using GMM Algorithm for Smart Visual Surveillance System", 《PROCEDIA COMPUTER SCIENCE》, vol. 133, pages 276 - 283 *
雷廷升: "虚拟环境下的人体动作识别与交互技术研究", 《中国优秀硕士学位论文全文数据库信息科技辑》, no. 07, pages 138 - 1225 *

Also Published As

Publication number Publication date
CN110705510B (zh) 2023-09-05

Similar Documents

Publication Publication Date Title
CN109117831B (zh) 物体检测网络的训练方法和装置
CN109145680B (zh) 一种获取障碍物信息的方法、装置、设备和计算机存储介质
WO2018108129A1 (zh) 用于识别物体类别的方法及装置、电子设备
CN106845412B (zh) 障碍物识别方法及装置、计算机设备及可读介质
US10762644B1 (en) Multiple object tracking in video by combining neural networks within a bayesian framework
CN110175528B (zh) 人体跟踪方法及装置、计算机设备及可读介质
CN111783626B (zh) 图像识别方法、装置、电子设备及存储介质
CN113378712B (zh) 物体检测模型的训练方法、图像检测方法及其装置
CN113012200B (zh) 一种运动物体的定位方法、装置、电子设备及存储介质
CN111079638A (zh) 基于卷积神经网络的目标检测模型训练方法、设备和介质
CN112749695A (zh) 文本识别的方法和装置
CN109345460B (zh) 用于矫正图像的方法和装置
CN114549557A (zh) 一种人像分割网络训练方法、装置、设备及介质
CN110472673B (zh) 参数调整方法、眼底图像处理方法、装置、介质及设备
CN109242882B (zh) 视觉跟踪方法、装置、介质及设备
CN114049674A (zh) 一种三维人脸重建方法、装置及存储介质
CN114219936A (zh) 目标检测方法、电子设备、存储介质和计算机程序产品
CN111428567B (zh) 一种基于仿射多任务回归的行人跟踪系统及方法
CN116152576B (zh) 图像处理方法、装置、设备及存储介质
CN112857746A (zh) 一种灯光检测仪的追踪方法、装置、电子设备及存储介质
CN111753736A (zh) 基于分组卷积的人体姿态识别方法、装置、设备和介质
CN113780040A (zh) 唇部关键点的定位方法及装置、存储介质、电子设备
CN113762455A (zh) 检测模型训练方法、单字检测方法、装置、设备及介质
CN114429631B (zh) 三维对象检测方法、装置、设备以及存储介质
CN110705510B (zh) 一种动作确定方法、装置、服务器和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information
CB02 Change of applicant information

Address after: Room 1103, Building 21, 39 Jibang Road, Zhongming Town, Shanghai 202163

Applicant after: Shanghai Extreme Chain Technology Development Group Co.,Ltd.

Address before: Room 1103, Building 21, 39 Jibang Road, Zhongming Town, Shanghai 202163

Applicant before: SHANGHAI JILIAN NETWORK TECHNOLOGY Co.,Ltd.

TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20230808

Address after: Room 3-17, Building 3, No. 999 Jingxing Road, Cangqian Street, Yuhang District, Hangzhou City, Zhejiang Province, 310000

Applicant after: Hangzhou YOUPIN Technology Co.,Ltd.

Address before: Room 1103, Building 21, 39 Jibang Road, Zhongming Town, Shanghai 202163

Applicant before: Shanghai Extreme Chain Technology Development Group Co.,Ltd.

GR01 Patent grant
GR01 Patent grant