CN116152299A - 一种运动状态的检测方法、装置、存储介质及电子设备 - Google Patents

一种运动状态的检测方法、装置、存储介质及电子设备 Download PDF

Info

Publication number
CN116152299A
CN116152299A CN202310433919.9A CN202310433919A CN116152299A CN 116152299 A CN116152299 A CN 116152299A CN 202310433919 A CN202310433919 A CN 202310433919A CN 116152299 A CN116152299 A CN 116152299A
Authority
CN
China
Prior art keywords
image
target object
motion state
frame
feature
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202310433919.9A
Other languages
English (en)
Other versions
CN116152299B (zh
Inventor
林峰
王宏升
陈�光
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang Lab
Original Assignee
Zhejiang Lab
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang Lab filed Critical Zhejiang Lab
Priority to CN202310433919.9A priority Critical patent/CN116152299B/zh
Publication of CN116152299A publication Critical patent/CN116152299A/zh
Application granted granted Critical
Publication of CN116152299B publication Critical patent/CN116152299B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/20Analysis of motion
    • G06T7/246Analysis of motion using feature-based methods, e.g. the tracking of corners or segments
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/0002Inspection of images, e.g. flaw detection
    • G06T7/0012Biomedical image inspection
    • G06T7/0014Biomedical image inspection using an image reference approach
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/44Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
    • G06V10/443Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components by matching or filtering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/74Image or video pattern matching; Proximity measures in feature spaces
    • G06V10/761Proximity, similarity or dissimilarity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/7715Feature extraction, e.g. by transforming the feature space, e.g. multi-dimensional scaling [MDS]; Mappings, e.g. subspace methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/40Scenes; Scene-specific elements in video content
    • G06V20/41Higher-level, semantic clustering, classification or understanding of video scenes, e.g. detection, labelling or Markovian modelling of sport events or news items
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/40Scenes; Scene-specific elements in video content
    • G06V20/46Extracting features or characteristics from the video content, e.g. video fingerprints, representative shots or key frames
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/20Movements or behaviour, e.g. gesture recognition
    • G06V40/23Recognition of whole body movements, e.g. for sport training
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H20/00ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance
    • G16H20/30ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance relating to physical therapies or activities, e.g. physiotherapy, acupressure or exercising
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10016Video; Image sequence
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30196Human being; Person

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Evolutionary Computation (AREA)
  • Databases & Information Systems (AREA)
  • Computing Systems (AREA)
  • Artificial Intelligence (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Social Psychology (AREA)
  • Psychiatry (AREA)
  • Quality & Reliability (AREA)
  • Radiology & Medical Imaging (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biophysics (AREA)
  • Physical Education & Sports Medicine (AREA)
  • Epidemiology (AREA)
  • Primary Health Care (AREA)
  • Public Health (AREA)
  • Image Analysis (AREA)

Abstract

本说明书公开了一种运动状态的检测方法、装置、存储介质及电子设备。所述运动状态的检测方法包括:针对待检测视频的每帧图像,确定该帧图像对应的全局图像特征,对全局图像特征进行处理,确定目标对象在该帧图像中所对应的局部图像特征,基于所述局部图像特征与目标对象在其他各帧图像中所对应的局部图像特征之间的相似度,根据各帧图像对应的时间信息以及目标对象在各帧图像中的空间信息,确定目标对象在该帧图像中的运动状态特征,根据目标对象在每帧图像中的运动状态特征,确定目标对象对应的运动状态轨迹,并基于运动状态轨迹对目标对象的运动状态进行检测。

Description

一种运动状态的检测方法、装置、存储介质及电子设备
技术领域
本说明书涉及计算机技术领域,尤其涉及一种运动状态的检测方法、装置、存储介质及电子设备。
背景技术
智能康复训练中的视频动作识别技术可以实时的对训练者的运动状态进行检测,从而及时反馈训练者执行的规范动作或错误动作,帮助训练者继续执行正确动作或是及时地纠正错误动作,从而提高康复效果。
然而,传统的图像识别技术通常利用白噪声反应目标对象(如训练者肢体)的运动状态特征,但是目标对象的运动状态会随时间而不断发生改变,视频中每帧图像背景的动态变化所产生的干扰噪声会对捕捉目标对象的运动状态特征造成巨大挑战,导致运动状态的检测效果较差,无法准确的对目标对象的错误动作进行纠正。
因此,如何准确的对目标对象的运动状态进行检测,是一个亟待解决的问题。
发明内容
本说明书提供一种运动状态的检测方法、装置、存储介质及电子设备,以部分的解决现有技术存在的上述问题。
本说明书采用下述技术方案:
本说明书提供了一种运动状态的检测方法,包括:
获取待检测视频;
针对所述待检测视频的每帧图像,对该帧图像进行特征提取,确定该帧图像对应的全局图像特征;
对所述全局图像特征进行处理,确定目标对象在该帧图像中所对应的局部图像特征;
基于所述目标对象在该帧图像中所对应的局部图像特征与所述目标对象在其他各帧图像中所对应的局部图像特征之间的相似度,根据所述各帧图像对应的时间信息以及所述目标对象在所述各帧图像中的空间信息,确定所述目标对象在该帧图像中的运动状态特征;
根据所述目标对象在每帧图像中的运动状态特征,确定所述目标对象对应的运动状态轨迹,并基于所述运动状态轨迹对所述目标对象的运动状态进行检测。
可选地,对所述全局图像特征进行处理,确定目标对象在该帧图像中所对应的局部图像特征,具体包括:
对所述全局图像特征进行降维处理,确定所述局部图像特征。
可选地,对所述全局图像特征进行降维处理,确定所述局部图像特征,具体包括:
以最小化所述全局图像特征对应的成对相似度与所述局部图像特征对应的成对相似度之间的偏差为目标,对所述全局图像特征进行降维处理,得到降维后特征;
根据所述降维后特征,确定所述局部图像特征。
可选地,根据所述降维后特征,确定所述局部图像特征,具体包括:
对所述降维后特征进行平滑处理,得到平滑嵌入特征;
将所述平滑嵌入特征在指定维度的特征空间中进行投影,得到所述局部图像特征,其中,所述指定维度小于所述全局图像特征对应的维度。
可选地,基于所述目标对象在该帧图像中所对应的局部图像特征与所述目标对象在其他各帧图像中所对应的局部图像特征之间的相似度,根据所述各帧图像对应的时间信息以及所述目标对象在所述各帧图像中的空间信息,确定所述目标对象在该帧图像中的运动状态特征,具体包括:
根据所述目标对象在该帧图像中所对应的局部图像特征与所述目标对象在其他各帧图像中所对应的局部图像特征之间的相似度,确定所述各帧图像对应的权重;
根据所述权重、所述各帧图像对应的时间信息以及所述目标对象在所述各帧图像中的空间信息,确定所述目标对象在该帧图像中的运动状态特征。
可选地,根据所述权重、所述各帧图像对应的时间信息以及所述目标对象在所述各帧图像中的空间信息,确定所述目标对象在该帧图像中的运动状态特征,具体包括:
根据所述权重、所述各帧图像对应的时间信息以及所述目标对象在所述各帧图像中的空间信息,确定所述目标对象在该帧图像中的运动状态为每种运动状态的概率;
基于所述概率,确定所述运动状态特征。
可选地,根据所述目标对象在每帧图像中的运动状态特征,确定所述目标对象对应的运动状态轨迹,具体包括:
根据所述目标对象在每帧图像中的运动状态特征,以及所述运动状态特征所对应运动状态的概率,确定所述运动状态轨迹。
可选地,基于所述运动状态轨迹对所述目标对象的运动状态进行检测之前,所述方法还包括:
根据所述运动状态轨迹,对所述目标图像在各帧图像中的运动状态特征进行更新,得到更新后运动状态特征;
根据所述更新后运动状态特征,确定所述目标对象在所述待检测视频中的运动特征。
可选地,所述方法应用于对康复训练视频中的训练人员的运动状态进行检测。
本说明书提供了一种运动状态的检测装置,包括:
获取模块,获取待检测视频;
提取模块,针对所述待检测视频的每帧图像,对该帧图像进行特征提取,确定该帧图像对应的全局图像特征;
处理模块,对所述全局图像特征进行处理,确定目标对象在该帧图像中所对应的局部图像特征;
确定模块,基于所述目标对象在该帧图像中所对应的局部图像特征与所述目标对象在其他各帧图像中所对应的局部图像特征之间的相似度,根据所述各帧图像对应的时间信息以及所述目标对象在所述各帧图像中的空间信息,确定所述目标对象在该帧图像中的运动状态特征;
检测模块,根据所述目标对象在每帧图像中的运动状态特征,确定所述目标对象对应的运动状态轨迹,并基于所述运动状态轨迹对所述目标对象的运动状态进行检测。
可选地,所述处理模块具体用于,对所述全局图像特征进行降维处理,确定所述局部图像特征。
可选地,所述处理模块具体用于,以最小化所述全局图像特征对应的成对相似度与所述局部图像特征对应的成对相似度之间的偏差为目标,对所述全局图像特征进行降维处理,得到降维后特征;根据所述降维后特征,确定所述局部图像特征。
可选地,所述处理模块具体用于,对所述降维后特征进行平滑处理,得到平滑嵌入特征;将所述平滑嵌入特征在指定维度的特征空间中进行投影,得到所述局部图像特征,其中,所述指定维度小于所述全局图像特征对应的维度。
本说明书提供了一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述运动状态的检测方法。
本说明书提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述运动状态的检测方法。
本说明书采用的上述至少一个技术方案能够达到以下有益效果:
在本说明书提供的运动状态的检测方法中,针对待检测视频的每帧图像,确定该帧图像对应的全局图像特征,对全局图像特征进行处理,确定目标对象在该帧图像中所对应的局部图像特征,基于所述局部图像特征与目标对象在其他各帧图像中所对应的局部图像特征之间的相似度,根据各帧图像对应的时间信息以及目标对象在各帧图像中的空间信息,确定目标对象在该帧图像中的运动状态特征,根据目标对象在每帧图像中的运动状态特征,确定目标对象对应的运动状态轨迹,并基于运动状态轨迹对目标对象的运动状态进行检测。
从上述方法可以看出,本方案能够将视频中每帧图像的全局特征处理为只关注目标对象的局部特征,并基于其他帧图像对应局部特征的相似度以及各帧图像的时间信息和空间信息确定出当前帧图像的运动状态特征,这样一来,可以避免干扰噪声对处于运动状态的目标对象的影响,更加精确地捕捉目标对象在不同时刻的运动状态。
附图说明
此处所说明的附图用来提供对本说明书的进一步理解,构成本说明书的一部分,本说明书的示意性实施例及其说明用于解释本说明书,并不构成对本说明书的不当限定。在附图中:
图1为本说明书中提供的一种运动状态的检测方法的流程示意图;
图2为本说明书中提供的一种运动状态轨迹的确定过程示意图;
图3为本说明书中提供的一种运动状态特征的更新过程示意图;
图4为本说明书提供的一种运动状态的检测装置的示意图;
图5为本说明书提供的一种对应于图1的电子设备示意图。
具体实施方式
为使本说明书的目的、技术方案和优点更加清楚,下面将结合本说明书具体实施例及相应的附图对本说明书技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本说明书一部分实施例,而不是全部的实施例。基于本说明书中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本说明书保护的范围。
以下结合附图,详细说明本说明书各实施例提供的技术方案。
图1为本说明书中提供的一种运动状态的检测方法的流程示意图,包括以下步骤:
S101:获取待检测视频。
S102:针对所述待检测视频的每帧图像,对该帧图像进行特征提取,确定该帧图像对应的全局图像特征。
由于传统图像识别技术通常利用白噪声反应目标对象的特征,这种技术能够对单帧图像中的目标物进行准确的识别,但是在康复训练场景下,训练者的肢体往往处于运动状态,当动作幅度比较大时,引起视频图像跨帧间的同一位置的内容完全不相关,难以对康复训练场景中的运动状态进行准确的捕捉。
基于此,本说明书提供了一种运动状态的检测方法,利用隐分布特征关注目标对象的运动状态特征。将物理空间中同一类目标对象聚集成同一个团簇,并且只关注这个团簇的运动。在智能康复训练中,这种方法可以将整个肢体生的特征作为一个特征团簇,并且只关注这个团簇的运动,从而解决传统技术在捕捉处于运动状态的目标对象时所面临的挑战。
在本说明书中,用于实现运动状态的检测方法的执行主体可以是诸如服务器等指定设备,为了便于理解,本说明书仅以服务器作为执行主体为例,对本说明书中提供的一种运动状态的检测方法进行说明。
其中,服务器需要获取待检测视频,该待检测视频可以通过诸如摄像头等传感器采集到的训练者的康复运动视频,当然,该待检测视频也可以为其他场景下的目标物的运动视频,本说明书对此不做具体限定。
获取待检测视频后,服务器可以通过相应的特征提取模型,对该待检测视频的每帧图像的整体进行特征提取,从而得到每帧图像对应的图像特征,作为全局图像特征。
S103:对所述全局图像特征进行处理,确定目标对象在该帧图像中所对应的局部图像特征。
具体的,服务器可以以最小化所述全局图像特征对应的成对相似度与局部图像特征对应的成对相似度之间的偏差为目标,对全局图像特征进行降维处理,从而优化低维嵌入特征,得到降维后特征。而后可以通过平滑函数进一步对降维后特征进行平滑处理,精炼低维嵌入特征并消除任何剩余的伪影,得到平滑嵌入特征。之后服务器可以将平滑嵌入特征投影到较低维度空间进行可视化或进一步分析,从而得到目标对象在各帧图像中对应的局部特征。
这样一来,服务器可以充分捕捉变量之间的线性和非线性关系,降低全局图像特征的维度,同时保留数据的局部结构,得到用于表征目标对象在该帧图像中对应信息的局部图像特征。
在康复训练场景中,上述目标对象可以为训练者,相应的,目标对象在该帧图像中的局部图像特征可以为训练者(用户)的肢体所对应的图像特征。
另外,在确定局部图像的过程中,服务器可以基于全局图像特征构建加权图,加权图中每个像素点由一个节点表示,节点之间的边可以是各像素点的之间的相似性加权。
S104:基于所述目标对象在该帧图像中所对应的局部图像特征与所述目标对象在其他各帧图像中所对应的局部图像特征之间的相似度,根据所述各帧图像对应的时间信息以及所述目标对象在所述各帧图像中的空间信息,确定所述目标对象在该帧图像中的运动状态特征。
具体的,服务器可以将每一帧图像作为一个标记(token),而对于当前需要确定运动状态特征的图像,可以将其作为一个查询(query)。
对于每帧图像(query),服务器可以基于目标对象在该帧图像中所对应的局部图像特征与目标对象在其他各帧图像(token)中所对应的局部图像特征之间的相似度,确定各帧图像对应的权重,而后根据确定出的权重对各帧图像对应的时间信息以及目标对象在各帧图像中的空间信息进行加权,根据加权后结果确定目标对象在该帧图像中的运动状态为每种运动状态的概率,进而根据该概率确定目标对象在该帧图像中的运动状态所对应的运动状态特征。
在确定目标对象在各帧图像中对应的运动状态特征之前,服务器可以先确定特征参考点,该特征参考点可以为目标对象在初始帧图像中的初始运动状态所对应的运动状态特征,表示目标对象的初始时空位置,该时空位置可以由一组坐标进行表示,包括目标对象在初始帧图像中的空间信息(x,y,z)以及时间信息t,当然,上述空间信息中还可以包含有目标对象的姿态信息(如肢体关节角度等),从而对目标对象的初始运动状态进行准确的描述。
在本说明书中,目标对象的运动状态可以为目标对象肢体的位姿信息,包括目标对象的空间位置、朝向、肢体关节角度等。
具体的,运动状态特征可以通过聚合来自视频序列中不同图像汇集而来的时间信息和空间信息进行确定,这有助于更全面地捕捉该特定时刻场景的信息,该信息可以基于query与各token之间的相关性进行确定。针对每帧图像(query),目标对象在该帧图像中的运动状态特征可表示为:
Figure SMS_1
Figure SMS_2
其中 q表示当前需要确定运动状态特征的图像帧,并作为查询(query),
Figure SMS_6
表示第/>
Figure SMS_10
帧的时间信息,/>
Figure SMS_14
标识第/>
Figure SMS_5
帧的空间信息,/>
Figure SMS_7
表示点积运算。/>
Figure SMS_12
表示在/>
Figure SMS_15
时的运动状态特征。针对每个query,除该query以外的其他帧图像可以作为键(key),/>
Figure SMS_3
表示query的局部图像特征与所有键/>
Figure SMS_8
的局部图像特征进行点积比较,并使用/>
Figure SMS_13
运算符对结果进行归一化,利用归一化所得结果作为对应于键值的权重。对于每个查询q,
Figure SMS_16
通过计算它与所有键/>
Figure SMS_4
之间的点积来衡量它们之间的相似度。在计算完点积之后,使用/>
Figure SMS_9
运算符将其归一化。/>
Figure SMS_11
函数将实数向量映射到总和为1的概率分布中,这确保了从点积中获得的权重是正数且总和为1。
服务器可以使用从点积和
Figure SMS_17
归一化中获得的权重来计算与键对应的键值的加权平均值。与键对应的键值代表了与query相关的时间信息和空间信息。通过计算这些值的加权平均值,我们可以获得所有与query相关键中有关信息的摘要。这些权重根据它们与query之间的相似度来确定每个键值对此摘要所做出贡献的程度。
在此过程中,服务器可以捕捉所有与query相关的键中有关信息的全局表示,而不是专注于单个值。当处理复杂视频数据时,可能会涉及许多不同特征或对象与给定查询相关联。
通过上述公式中的注意力操作可以将空间维度信息独立地应用于每个帧。注意力操作用于比较query与
Figure SMS_18
的键/>
Figure SMS_19
。将注意力操作沿着空间维度/>
Figure SMS_20
应用于视频帧的不同区域。具体地,将query与/>
Figure SMS_21
的键/>
Figure SMS_22
进行比较,根据query对应局部图像特征与
Figure SMS_23
对应局部图像特征之间的相似度,确定/>
Figure SMS_24
(其他帧图像)对应时间信息和目标对象在其他帧图像中所对应空间信息的权重,而后根据确定出的权重对各帧图像对应的时间信息以及目标对象在各帧图像中的空间信息进行加权,根据加权后结果确定目标对象在该帧图像中的运动状态为每种运动状态的概率,进而根据该概率确定目标对象在该帧图像中的运动状态所对应的运动状态特征(如将概率最大的运动状态对应的特征向量作为目标对象在该帧图像中的运动状态特征)。
这种汇集操作可以隐含地推断出目标对象在特定时间
Figure SMS_25
所对应的运动状态(如位姿)。通过比较query的局部图像特征与/>
Figure SMS_26
时的键/>
Figure SMS_27
对应的局部图像特征,隐含地推断出目标对象在某个特定时间处于何种运动状态。
S105:根据所述目标对象在每帧图像中的运动状态特征,确定所述目标对象对应的运动状态轨迹,并基于所述运动状态轨迹对所述目标对象的运动状态进行检测。
服务器可以根据目标对象在每帧图像中的运动状态特征,以及运动状态特征所对应运动状态的概率,确定运动状态轨迹。
在本说明书中,一旦计算出目标对象在各帧图像中的运动状态特征,服务器可以进一步将各帧的运动状态特征跨时间汇集起来,从而捕捉目标对象随时间移动和变化的情况,并利用这些信息来推断其整体运动状态是否标准。为了便于理解,本说明书提供了一种运动状态轨迹的确定过程示意图,如图2所示。
图2为本说明书中提供的一种运动状态轨迹的确定过程示意图。
其中,服务器获取待检测视频后,对其进行特征提取,得到全局图像特征,进而对全局图像特征进行降维处理,得到局部图像特征(隐分布特征),通过帧内注意力操作和跨帧间注意力操作,输出运动状态轨迹。
基于整个视频序列的每帧的信息构建运动状态特征,进而构建出整个视频序列的运动状态轨迹,以捕捉目标对象随时间移动的情况。这使得服务器能够推断其运动特性,并且对相机运动不太敏感。这里的运动状态轨迹是指跨帧间的概率路径。对于每帧图像,构建一个运动状态特征的集合,作为运动状态轨迹,表示由运动状态概率加权所得的汇集信息。
而后服务器可以根据运动状态轨迹,对目标图像在各帧图像中的运动状态特征进行更新,得到更新后运动状态特征,根据更新后运动状态特征,确定目标对象在待检测视频中的运动特征。为了便于理解,本说明书提供了一种运动状态特征的更新过程示意图,如图3所示。
图3为本说明书中提供的一种运动状态特征的更新过程示意图。
其中,服务器可以先提取待检测视频中每帧图像的全局图像特征,进而对其进行降维处理,得到隐分布的局部图像特征,通过帧内注意力确定每帧图像的运动状态特征,通过跨帧间注意力确定在整个视频中的运动状态轨迹,通过运动状态轨迹对各帧图像的运动状态特征进行更新。
具体的,服务器可以将运动状态特征投影到一组新的查询(query)、键和键值中,该投影过程可以表示为:
Figure SMS_28
Figure SMS_29
Figure SMS_30
其中,
Figure SMS_31
表示特征参考点,/>
Figure SMS_32
表示更新后的与特征参考点/>
Figure SMS_33
相关的查询,更新后的查询/>
Figure SMS_34
包含从视频序列中同一帧不同位置汇集而来的信息,这有助于更全面地捕捉该特定时刻和特定空间的信息。
利用上述所得的新查询通过注意力操作在新的时间轨迹维度上汇总信息,所述查询聚焦于理解视频中的运动状态路径相关的特定部分,以创建更全面的视频数据表示。
Figure SMS_35
其中,将注意力操作沿着时间维度
Figure SMS_36
应用于跨帧的图像中,将新的轨迹查询/>
Figure SMS_37
Figure SMS_38
的新的键/>
Figure SMS_39
进行比较,所得的标记的跨帧间的轨迹特征/>
Figure SMS_40
隐含地推断出目标对象在整个视频中的运动特征。
确定目标对象在整个视频中的运动特征后,服务器可以基于该运动特征与标准的运动特征进行比较,从而对当前视频的运动状态进行检测,判断该运动状态是否标准。
例如,在康复训练场景下,服务器可以将确定出的运动特征与标准训练动作对应的模板运动特征进行比较,判断训练者在训练过程中的动作是否标准,如若不标准则对其进行纠正,若标准则提示训练者继续按照该动作进行训练。
从上述方法可以看出,本方案不仅可以减少干扰噪声对目标对象运动状态特征的影响,还可以更加精确地捕捉目标对象的运动状态特征。此外,这种方法还可以提高肢体动作识别的准确性和稳定性。相比传统技术,这种新方法具有更高的准确性和稳定性,并且可以更好地反映肢体动作的整体特征和变化规律。因此,在智能康复训练中具有广泛应用前景。
以上为本说明书的一个或多个实施运动状态的检测方法,基于同样的思路,本说明书还提供了相应的运动状态的检测装置,如图4所示。
图4为本说明书提供的一种运动状态的检测装置的示意图,包括:
获取模块401,用于获取待检测视频;
提取模块402,用于针对所述待检测视频的每帧图像,对该帧图像进行特征提取,确定该帧图像对应的全局图像特征;
处理模块403,用于对所述全局图像特征进行处理,确定目标对象在该帧图像中所对应的局部图像特征;
确定模块404,用于基于所述目标对象在该帧图像中所对应的局部图像特征与所述目标对象在其他各帧图像中所对应的局部图像特征之间的相似度,根据所述各帧图像对应的时间信息以及所述目标对象在所述各帧图像中的空间信息,确定所述目标对象在该帧图像中的运动状态特征;
检测模块405,用于根据所述目标对象在每帧图像中的运动状态特征,确定所述目标对象对应的运动状态轨迹,并基于所述运动状态轨迹对所述目标对象的运动状态进行检测。
可选地,所述处理模块403具体用于,对所述全局图像特征进行降维处理,确定所述局部图像特征。
可选地,所述处理模块403具体用于,以最小化所述全局图像特征对应的成对相似度与所述局部图像特征对应的成对相似度之间的偏差为目标,对所述全局图像特征进行降维处理,得到降维后特征;根据所述降维后特征,确定所述局部图像特征。
可选地,所述处理模块403具体用于,对所述降维后特征进行平滑处理,得到平滑嵌入特征;将所述平滑嵌入特征在指定维度的特征空间中进行投影,得到所述局部图像特征,其中,所述指定维度小于所述全局图像特征对应的维度。
可选地,所述确定模块404具体用于,根据所述目标对象在该帧图像中所对应的局部图像特征与所述目标对象在其他各帧图像中所对应的局部图像特征之间的相似度,确定所述各帧图像对应的权重;根据所述权重、所述各帧图像对应的时间信息以及所述目标对象在所述各帧图像中的空间信息,确定所述目标对象在该帧图像中的运动状态特征。
可选地,所述确定模块404具体用于,根据所述权重、所述各帧图像对应的时间信息以及所述目标对象在所述各帧图像中的空间信息,确定所述目标对象在该帧图像中的运动状态为每种运动状态的概率;基于所述概率,确定所述运动状态特征。
可选地,所述确定模块404具体用于,根据所述目标对象在每帧图像中的运动状态特征,以及所述运动状态特征所对应运动状态的概率,确定所述运动状态轨迹。
可选地,基于所述运动状态轨迹对所述目标对象的运动状态进行检测之前,所述检测模块405还用于,根据所述运动状态轨迹,对所述目标图像在各帧图像中的运动状态特征进行更新,得到更新后运动状态特征;根据所述更新后运动状态特征,确定所述目标对象在所述待检测视频中的运动特征。
可选地,所述方法应用于对康复训练视频中的训练人员的运动状态进行检测。
本说明书还提供了一种计算机可读存储介质,该存储介质存储有计算机程序,计算机程序可用于执行上述图1提供的一种运动状态的检测方法。
本说明书还提供了图5所示的一种对应于图1的电子设备的示意结构图。如图5所述,在硬件层面,该电子设备包括处理器、内部总线、网络接口、内存以及非易失性存储器,当然还可能包括其他业务所需要的硬件。处理器从非易失性存储器中读取对应的计算机程序到内存中然后运行,以实现上述图1所述的运动状态的检测方法。当然,除了软件实现方式之外,本说明书并不排除其他实现方式,比如逻辑器件抑或软硬件结合的方式等等,也就是说以下处理流程的执行主体并不限定于各个逻辑单元,也可以是硬件或逻辑器件。
对于一个技术的改进可以很明显地区分是硬件上的改进(例如,对二极管、晶体管、开关等电路结构的改进)还是软件上的改进(对于方法流程的改进)。然而,随着技术的发展,当今的很多方法流程的改进已经可以视为硬件电路结构的直接改进。设计人员几乎都通过将改进的方法流程编程到硬件电路中来得到相应的硬件电路结构。因此,不能说一个方法流程的改进就不能用硬件实体模块来实现。例如,可编程逻辑器件(ProgrammableLogic Device, PLD)(例如现场可编程门阵列(Field Programmable Gate Array,FPGA))就是这样一种集成电路,其逻辑功能由用户对器件编程来确定。由设计人员自行编程来把一个数字系统“集成”在一片PLD上,而不需要请芯片制造厂商来设计和制作专用的集成电路芯片。而且,如今,取代手工地制作集成电路芯片,这种编程也多半改用“逻辑编译器(logic compiler)”软件来实现,它与程序开发撰写时所用的软件编译器相类似,而要编译之前的原始代码也得用特定的编程语言来撰写,此称之为硬件描述语言(HardwareDescription Language,HDL),而HDL也并非仅有一种,而是有许多种,如ABEL(AdvancedBoolean Expression Language)、AHDL(Altera Hardware Description Language)、Confluence、CUPL(Cornell University Programming Language)、HDCal、JHDL(JavaHardware Description Language)、Lava、Lola、MyHDL、PALASM、RHDL(Ruby HardwareDescription Language)等,目前最普遍使用的是VHDL(Very-High-Speed IntegratedCircuit Hardware Description Language)与Verilog。本领域技术人员也应该清楚,只需要将方法流程用上述几种硬件描述语言稍作逻辑编程并编程到集成电路中,就可以很容易得到实现该逻辑方法流程的硬件电路。
控制器可以按任何适当的方式实现,例如,控制器可以采取例如微处理器或处理器以及存储可由该(微)处理器执行的计算机可读程序代码(例如软件或固件)的计算机可读介质、逻辑门、开关、专用集成电路(Application Specific Integrated Circuit,ASIC)、可编程逻辑控制器和嵌入微控制器的形式,控制器的例子包括但不限于以下微控制器:ARC 625D、Atmel AT91SAM、Microchip PIC18F26K20 以及Silicone Labs C8051F320,存储器控制器还可以被实现为存储器的控制逻辑的一部分。本领域技术人员也知道,除了以纯计算机可读程序代码方式实现控制器以外,完全可以通过将方法步骤进行逻辑编程来使得控制器以逻辑门、开关、专用集成电路、可编程逻辑控制器和嵌入微控制器等的形式来实现相同功能。因此这种控制器可以被认为是一种硬件部件,而对其内包括的用于实现各种功能的装置也可以视为硬件部件内的结构。或者甚至,可以将用于实现各种功能的装置视为既可以是实现方法的软件模块又可以是硬件部件内的结构。
上述实施例阐明的系统、装置、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为计算机。具体的,计算机例如可以为个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。
为了描述的方便,描述以上装置时以功能分为各种单元分别描述。当然,在实施本说明书时可以把各单元的功能在同一个或多个软件和/或硬件中实现。
本领域内的技术人员应明白,本说明书的实施例可提供为方法、系统、或计算机程序产品。因此,本说明书可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本说明书可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本说明书是参照根据本说明书实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
本领域技术人员应明白,本说明书的实施例可提供为方法、系统或计算机程序产品。因此,本说明书可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本说明书可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本说明书可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本说明书,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述仅为本说明书的实施例而已,并不用于限制本说明书。对于本领域技术人员来说,本说明书可以有各种更改和变化。凡在本说明书的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本说明书的权利要求范围之内。

Claims (15)

1.一种运动状态的检测方法,其特征在于,包括:
获取待检测视频;
针对所述待检测视频的每帧图像,对该帧图像进行特征提取,确定该帧图像对应的全局图像特征;
对所述全局图像特征进行处理,确定目标对象在该帧图像中所对应的局部图像特征;
基于所述目标对象在该帧图像中所对应的局部图像特征与所述目标对象在其他各帧图像中所对应的局部图像特征之间的相似度,根据所述各帧图像对应的时间信息以及所述目标对象在所述各帧图像中的空间信息,确定所述目标对象在该帧图像中的运动状态特征;
根据所述目标对象在每帧图像中的运动状态特征,确定所述目标对象对应的运动状态轨迹,并基于所述运动状态轨迹对所述目标对象的运动状态进行检测。
2.如权利要求1所述的方法,其特征在于,对所述全局图像特征进行处理,确定目标对象在该帧图像中所对应的局部图像特征,具体包括:
对所述全局图像特征进行降维处理,确定所述局部图像特征。
3.如权利要求2所述的方法,其特征在于,对所述全局图像特征进行降维处理,确定所述局部图像特征,具体包括:
以最小化所述全局图像特征对应的成对相似度与所述局部图像特征对应的成对相似度之间的偏差为目标,对所述全局图像特征进行降维处理,得到降维后特征;
根据所述降维后特征,确定所述局部图像特征。
4.如权利要求3所述的方法,其特征在于,根据所述降维后特征,确定所述局部图像特征,具体包括:
对所述降维后特征进行平滑处理,得到平滑嵌入特征;
将所述平滑嵌入特征在指定维度的特征空间中进行投影,得到所述局部图像特征,其中,所述指定维度小于所述全局图像特征对应的维度。
5.如权利要求1所述的方法,其特征在于,基于所述目标对象在该帧图像中所对应的局部图像特征与所述目标对象在其他各帧图像中所对应的局部图像特征之间的相似度,根据所述各帧图像对应的时间信息以及所述目标对象在所述各帧图像中的空间信息,确定所述目标对象在该帧图像中的运动状态特征,具体包括:
根据所述目标对象在该帧图像中所对应的局部图像特征与所述目标对象在其他各帧图像中所对应的局部图像特征之间的相似度,确定所述各帧图像对应的权重;
根据所述权重、所述各帧图像对应的时间信息以及所述目标对象在所述各帧图像中的空间信息,确定所述目标对象在该帧图像中的运动状态特征。
6.如权利要求5所述的方法,其特征在于,根据所述权重、所述各帧图像对应的时间信息以及所述目标对象在所述各帧图像中的空间信息,确定所述目标对象在该帧图像中的运动状态特征,具体包括:
根据所述权重、所述各帧图像对应的时间信息以及所述目标对象在所述各帧图像中的空间信息,确定所述目标对象在该帧图像中的运动状态为每种运动状态的概率;
基于所述概率,确定所述运动状态特征。
7.如权利要求6所述的方法,其特征在于,根据所述目标对象在每帧图像中的运动状态特征,确定所述目标对象对应的运动状态轨迹,具体包括:
根据所述目标对象在每帧图像中的运动状态特征,以及所述运动状态特征所对应运动状态的概率,确定所述运动状态轨迹。
8.如权利要求1所述的方法,其特征在于,基于所述运动状态轨迹对所述目标对象的运动状态进行检测之前,所述方法还包括:
根据所述运动状态轨迹,对所述目标图像在各帧图像中的运动状态特征进行更新,得到更新后运动状态特征;
根据所述更新后运动状态特征,确定所述目标对象在所述待检测视频中的运动特征。
9.如权利要求1所述的方法,其特征在于,所述方法应用于对康复训练视频中的训练人员的运动状态进行检测。
10.一种运动状态的检测装置,其特征在于,包括:
获取模块,获取待检测视频;
提取模块,针对所述待检测视频的每帧图像,对该帧图像进行特征提取,确定该帧图像对应的全局图像特征;
处理模块,对所述全局图像特征进行处理,确定目标对象在该帧图像中所对应的局部图像特征;
确定模块,基于所述目标对象在该帧图像中所对应的局部图像特征与所述目标对象在其他各帧图像中所对应的局部图像特征之间的相似度,根据所述各帧图像对应的时间信息以及所述目标对象在所述各帧图像中的空间信息,确定所述目标对象在该帧图像中的运动状态特征;
检测模块,根据所述目标对象在每帧图像中的运动状态特征,确定所述目标对象对应的运动状态轨迹,并基于所述运动状态轨迹对所述目标对象的运动状态进行检测。
11.如权利要求10所述的装置,其特征在于,所述处理模块具体用于,对所述全局图像特征进行降维处理,确定所述局部图像特征。
12.如权利要求11所述的装置,其特征在于,所述处理模块具体用于,以最小化所述全局图像特征对应的成对相似度与所述局部图像特征对应的成对相似度之间的偏差为目标,对所述全局图像特征进行降维处理,得到降维后特征;根据所述降维后特征,确定所述局部图像特征。
13.如权利要求12所述的装置,其特征在于,所述处理模块具体用于,对所述降维后特征进行平滑处理,得到平滑嵌入特征;将所述平滑嵌入特征在指定维度的特征空间中进行投影,得到所述局部图像特征,其中,所述指定维度小于所述全局图像特征对应的维度。
14.一种计算机可读存储介质,其特征在于,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述权利要求1~9任一项所述的方法。
15.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现上述权利要求1~9任一项所述的方法。
CN202310433919.9A 2023-04-21 2023-04-21 一种运动状态的检测方法、装置、存储介质及电子设备 Active CN116152299B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310433919.9A CN116152299B (zh) 2023-04-21 2023-04-21 一种运动状态的检测方法、装置、存储介质及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310433919.9A CN116152299B (zh) 2023-04-21 2023-04-21 一种运动状态的检测方法、装置、存储介质及电子设备

Publications (2)

Publication Number Publication Date
CN116152299A true CN116152299A (zh) 2023-05-23
CN116152299B CN116152299B (zh) 2023-07-11

Family

ID=86356545

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310433919.9A Active CN116152299B (zh) 2023-04-21 2023-04-21 一种运动状态的检测方法、装置、存储介质及电子设备

Country Status (1)

Country Link
CN (1) CN116152299B (zh)

Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108320296A (zh) * 2017-12-28 2018-07-24 新智数字科技有限公司 一种视频中目标对象的检测跟踪方法、装置及设备
US20190220992A1 (en) * 2018-01-15 2019-07-18 Samsung Electronics Co., Ltd. Object pose estimating method and apparatus
CN110298306A (zh) * 2019-06-27 2019-10-01 北京百度网讯科技有限公司 目标对象运动信息的确定方法、装置及设备
CN112488071A (zh) * 2020-12-21 2021-03-12 重庆紫光华山智安科技有限公司 提取行人特征的方法、装置、电子设备和存储介质
CN113486777A (zh) * 2021-07-02 2021-10-08 北京一维大成科技有限公司 一种目标对象的行为分析方法、装置、电子设备及存储介质
US20220020158A1 (en) * 2020-07-15 2022-01-20 Jingdong Digits Technology Holding Co., Ltd. System and method for 3d object detection and tracking with monocular surveillance cameras
CN114565882A (zh) * 2022-04-29 2022-05-31 深圳航天信息有限公司 基于多视频摄像头智能联动的异常行为分析方法及装置
CN114973422A (zh) * 2022-07-19 2022-08-30 南京应用数学中心 一种基于三维人体建模点云特征编码的步态识别方法
CN115393948A (zh) * 2022-07-13 2022-11-25 河北大学 基于改进Transformer模型的手语视频生成方法
CN115526935A (zh) * 2022-09-28 2022-12-27 山东大学 基于全局和局部信息的像素级抓取位姿检测方法及系统
CN115861891A (zh) * 2022-12-16 2023-03-28 北京多维视通技术有限公司 视频目标检测方法、装置、设备及介质
CN115862130A (zh) * 2022-11-16 2023-03-28 之江实验室 基于人体姿态及其躯干运动场的行为识别方法

Patent Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108320296A (zh) * 2017-12-28 2018-07-24 新智数字科技有限公司 一种视频中目标对象的检测跟踪方法、装置及设备
US20190220992A1 (en) * 2018-01-15 2019-07-18 Samsung Electronics Co., Ltd. Object pose estimating method and apparatus
CN110298306A (zh) * 2019-06-27 2019-10-01 北京百度网讯科技有限公司 目标对象运动信息的确定方法、装置及设备
US20220020158A1 (en) * 2020-07-15 2022-01-20 Jingdong Digits Technology Holding Co., Ltd. System and method for 3d object detection and tracking with monocular surveillance cameras
CN112488071A (zh) * 2020-12-21 2021-03-12 重庆紫光华山智安科技有限公司 提取行人特征的方法、装置、电子设备和存储介质
CN113486777A (zh) * 2021-07-02 2021-10-08 北京一维大成科技有限公司 一种目标对象的行为分析方法、装置、电子设备及存储介质
CN114565882A (zh) * 2022-04-29 2022-05-31 深圳航天信息有限公司 基于多视频摄像头智能联动的异常行为分析方法及装置
CN115393948A (zh) * 2022-07-13 2022-11-25 河北大学 基于改进Transformer模型的手语视频生成方法
CN114973422A (zh) * 2022-07-19 2022-08-30 南京应用数学中心 一种基于三维人体建模点云特征编码的步态识别方法
CN115526935A (zh) * 2022-09-28 2022-12-27 山东大学 基于全局和局部信息的像素级抓取位姿检测方法及系统
CN115862130A (zh) * 2022-11-16 2023-03-28 之江实验室 基于人体姿态及其躯干运动场的行为识别方法
CN115861891A (zh) * 2022-12-16 2023-03-28 北京多维视通技术有限公司 视频目标检测方法、装置、设备及介质

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
QINGXUAN SHI等: "Video pose estimation with global motion cues", 《NEUROCOMPUTING》 *
史青宣;王谦;田学东;: "基于层叠的部件轨迹片段模型的视频人体姿态估计", 山东大学学报(工学版), no. 02 *
张春华;陈标;周晓东;: "运动背景星空图像中小目标的运动轨迹提取算法", 光学精密工程, no. 03 *

Also Published As

Publication number Publication date
CN116152299B (zh) 2023-07-11

Similar Documents

Publication Publication Date Title
Gao et al. Highly efficient salient object detection with 100k parameters
CN108320296B (zh) 一种视频中目标对象的检测跟踪方法、装置及设备
RU2708027C1 (ru) Способ передачи движения субъекта из видео на анимированного персонажа
CN111260726A (zh) 一种视觉定位方法及装置
CN111311634B (zh) 一种人脸图像检测方法、装置及设备
CN109034183A (zh) 一种目标检测方法、装置及设备
CN111027507A (zh) 基于视频数据识别的训练数据集生成方法及装置
CN112912889B (zh) 图像模板的更新方法、设备及存储介质
CN114494381A (zh) 模型训练及深度估计方法、装置、存储介质及电子设备
CN116152299B (zh) 一种运动状态的检测方法、装置、存储介质及电子设备
CN112861808A (zh) 动态手势识别方法、装置、计算机设备及可读存储介质
CN115830633B (zh) 基于多任务学习残差神经网络的行人重识别方法和系统
CN115131570B (zh) 图像特征提取模型的训练方法、图像检索方法及相关设备
CN111753583A (zh) 一种识别方法及装置
CN113706606A (zh) 确定隔空手势位置坐标的方法及装置
CN116069229A (zh) 显示装置及其控制方法
CN112734851A (zh) 一种位姿确定的方法以及装置
CN117893696B (zh) 一种三维人体数据生成方法、装置、存储介质及电子设备
CN113887326B (zh) 一种人脸图像处理方法及装置
CN117726907B (zh) 一种建模模型的训练方法、三维人体建模的方法以及装置
CN115862668B (zh) 机器人基于声源定位判断交互对象的方法和系统
CN114528923B (zh) 基于时域上下文的视频目标检测方法、装置、设备及介质
CN115623317B (zh) 一种对焦的方法、设备及存储介质
CN117726760B (zh) 一种用于视频的三维人体重建模型的训练方法及装置
CN117911630B (zh) 一种三维人体建模的方法、装置、存储介质及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant