CN105224669A - 一种基于gmm语义特征的运动检索方法 - Google Patents
一种基于gmm语义特征的运动检索方法 Download PDFInfo
- Publication number
- CN105224669A CN105224669A CN201510653832.8A CN201510653832A CN105224669A CN 105224669 A CN105224669 A CN 105224669A CN 201510653832 A CN201510653832 A CN 201510653832A CN 105224669 A CN105224669 A CN 105224669A
- Authority
- CN
- China
- Prior art keywords
- theta
- motion
- sigma
- motion sequence
- sequence
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/70—Information retrieval; Database structures therefor; File system structures therefor of video data
- G06F16/78—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/783—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
- G06F16/7837—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using objects detected or recognised in the video content
- G06F16/784—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using objects detected or recognised in the video content the detected or recognised objects being people
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Library & Information Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Processing Or Creating Images (AREA)
Abstract
本发明公开了一种基于GMM语义特征的运动检索方法。首先,对训练数据进行关键帧提取,并基于关键帧利用高斯混合模型建立“关键姿态”模型,用来对所有运动数据的姿态计算语义特征。接着,姿态粒度的语义特征通过统计合并生成序列粒度的语义特征,用于运动序列的比较。最后,给定待检索运动序列及其特征,采用了稀疏编码方法代替传统的K近邻方法对数据库进行相似运动检索,按相似度列出检索结果。本方法检索效果准确,计算高效,满足了动画师制作动画时快速检索近似运动的需求。
Description
技术领域
本发明涉及三维人体运动数据检索技术,高斯混合模型和稀疏编码算法,尤其涉及采用GMM语义特征进行运动检索方法。
背景技术
随着运动捕获技术的发展以及诸如多目摄像机和微软Kinect深度摄像机这样的运动捕获设备的商业化普及,人体运动数据被越来越广泛的应用于多种领域。在最近几年的相关研究中,学者们往往把目光集中在运动数据的应用,而不断增长的运动数据本身却往往被忽略。因此,目前的现状是,动画师在制作动画时会采集或合成大量的人体运动数据,却很少合理的把已有的运动重用到新的电影或游戏制作中去。而造成这种资源浪费的主要原因,正是缺乏这样一种可以有效的从海量数据库中检索运动数据的搜索引擎。
在动画领域中,最常见的数据检索方法是文本标签的检索,例如给定“跳”、“打架”这样的标签,查找数据库中被标为相同标签的运动。尽管这种方式只需要进行简单的文本匹配和检索因而十分高效,但单纯的文本标签无法完整的描述一整段运动,并且对运动数据库的分割和标注需要投入大量的人工成本。近年来流行的一种检索方式是基于手绘草图或轨迹线的检索,通过动画师手工绘制的运动草图来检索数据库得到想要的运动。但是这类方法需要对动画师进行大量的专业技能训练,才能保证手绘图的准确性;此外,不同动画师绘画风格的差异也会对检索结果产生很大影响,这在领域内是一个十分棘手的问题。因此,目前主流的检索均以样本运动作为输入。
我们知道,一段运动中往往存在若干个姿态,它们组合在一起可以表示整段运动,我们称这样的一些姿态为“关键姿态”。不同组“关键姿态”可以描述不同种类的运动,即同类运动可共享同一组“关键姿态”。基于这样的观察结果,我们采用了高斯混合模型(GMM)来对“关键姿态”进行建模,并生成基于这些关键姿态的概率特征来描述一段运动。该特征可在语义层面描述运动,可以在运动检索过程中更容易匹配到近似的运动。
发明内容
本发明的目的是为了解决动画师在制作动画时无法快速准确的检索需要的运动这一问题,提供一种基于GMM语义特征的运动检索方法包括如下步骤:
一种基于GMM语义特征的运动检索方法包括如下步骤:
1)对任意给定的三维人体运动数据集进行类别标注与训练样本集划分,对数据集中全部运动序列中的每个姿态进行旋转、平移对齐处理,使其中心点固定为坐标原点,身体平面前方朝向统一;
2)对数据集中的运动序列提取关键帧,其方法为:对给定运动序列s={f1,f2,...,fn},其中fi为运动序列中的某一帧,n为运动序列总帧数,先用k-means聚类算法中全部帧进行聚类,根据类别编号对整段运动序列进行分割,同一连续聚类编号的为一段;然后从分割后的每一个子片段中选取最靠近该片段平均位置的一帧作为关键帧,则运动序列的关键帧集合其中为提取的关键帧,ns为该序列中提取的关键帧总数;
3)假设每个运动类别Cj,j=1,2,...,m包含L个“关键姿态”,m为运动类别总数,每个关键姿态可用一个正态分布来描述:qk=N(μk,σk),k=1,2,...,L,利用高斯混合模型为类别Cj包含的全部关键帧建模,设Θ为高斯混合模型中的参数集合,初始化每个正态分布的权重p(qk|Θ)=1/L,则对每个关键帧,其中为Cj包含的关键帧总数,xi属于qk的概率为:
每个正态分布参数组可迭代优化更新如下:
迭代重复公式(2)至(5)直到收敛;
4)对给定姿态f,可由步骤3)得到的模型计算出一系列概率值pjk,j=1,2,...,m,k=1,2,...L,表示该姿态属于类别Cj中第k个关键姿态的概率,可由对应的正态分布N(μk,σk)计算得出,pjk可拼接为f对应的姿态粒度语义特征:
t={p11,...,p1L,...,pjk,...,pmL}(6)
对于一段给定的运动序列s={f1,f2,...,fn},先按公式(6)计算其每一帧fi的姿态特征t(i),再求平均,得到运动序列特征:
5)利用稀疏编码对给定运动序列特征进行重建,得到选择向量:
其中,λ为正则化参数,D是一个d×N的字典矩阵,包含了数据库中所有运动序列
特征;d表示特征的维数,N为数据库中运动序列的个数,公式(8)可用l1-ls算法求解;
6)取选择向量v中最大的K个系数,K为需要返回的相似运动段数,其所对应的运动序列为重建过程中贡献度最大的运动,也即作为最终检索结果。
本发明所提出的方法与传统运动检索方法相比,具有以下优势:
1.提取的特征为基于GMM的语义特征,可以对运动序列在“关键姿态”层面进行统计概率上的语义描述,在相似度匹配过程中可以获得更好的效果。
2.检索方法用稀疏编码(SparseCoding)代替传统的K近邻方法,以稀疏重建的思想进行检索,按重建系数大小进行相似度排序,使检索结果更加准确。
附图说明
图1是提取关键帧步骤示意图。
具体实施方式
如图1所示,一种基于GMM语义特征的运动检索方法包括如下步骤:
1)对任意给定的三维人体运动数据集进行类别标注与训练样本集划分,对数据集中全部运动序列中的每个姿态进行旋转、平移对齐处理,使其中心点固定为坐标原点,身体平面前方朝向统一;
2)对数据集中的运动序列提取关键帧,其方法为:对给定运动序列s={f1,f2,...,fn},其中fi为运动序列中的某一帧,n为运动序列总帧数,先用k-means聚类算法中全部帧进行聚类,根据类别编号对整段运动序列进行分割,同一连续聚类编号的为一段;然后从分割后的每一个子片段中选取最靠近该片段平均位置的一帧作为关键帧,则运动序列的关键帧集合其中为提取的关键帧,ns为该序列中提取的关键帧总数;
3)假设每个运动类别Cj,j=1,2,...,m包含L个“关键姿态”,m为运动类别总数,每个关键姿态可用一个正态分布来描述:qk=N(μk,σk),k=1,2,...,L利用高斯混合模型为类别Cj包含的全部关键帧建模,设Θ为高斯混合模型中的参数集合,初始化每个正态分布的权重p(qk|Θ)=1/L,则对每个关键帧其中为Cj包含的关键帧总数,xi属于qk的概率为:
每个正态分布参数组可迭代优化更新如下:
迭代重复公式(2)至(5)直到收敛;
4)对给定姿态f,可由步骤3)得到的模型计算出一系列概率值pjk,j=1,2,...,m,k=1,2,...L,表示该姿态属于类别Cj中第k个关键姿态的概率,可由对应的正态分布N(μk,σk)计算得出,pjk可拼接为f对应的姿态粒度语义特征:
t={p11,...,p1L,...,pjk,...,pmL}(6)
对于一段给定的运动序列s={f1,f2,...,fn},先按公式(6)计算其每一帧fi的姿态特征t(i),再求平均,得到运动序列特征:
5)利用稀疏编码对给定运动序列特征进行重建,得到选择向量:
其中,λ为正则化参数,D是一个d×N的字典矩阵,包含了数据库中所有运动序列
特征;d表示特征的维数,N为数据库中运动序列的个数,公式(8)可用l1-ls算法求解;
6)取选择向量v中最大的K个系数,K为需要返回的相似运动段数,其所对应的运动序列为重建过程中贡献度最大的运动,也即作为最终检索结果。
Claims (1)
1.一种基于GMM语义特征的运动检索方法,其特征在于包括如下步骤:
1)对任意给定的三维人体运动数据集进行类别标注与训练样本集划分,对数据集中全部运动序列中的每个姿态进行旋转、平移对齐处理,使其中心点固定为坐标原点,身体平面前方朝向统一;
2)对数据集中的运动序列提取关键帧,其方法为:对给定运动序列s={f1,f2,...,fn},其中fi为运动序列中的某一帧,n为运动序列总帧数,先用k-means聚类算法中全部帧进行聚类,根据类别编号对整段运动序列进行分割,同一连续聚类编号的为一段;然后从分割后的每一个子片段中选取最靠近该片段平均位置的一帧作为关键帧,则运动序列的关键帧集合其中为提取的关键帧,ns为该序列中提取的关键帧总数;
3)假设每个运动类别Cj,j=1,2,...,m包含L个“关键姿态”,m为运动类别总数,每个关键姿态可用一个正态分布来描述:qk=N(μk,σk),k=1,2,...,L,利用高斯混合模型为类别Cj包含的全部关键帧建模,设Θ为高斯混合模型中的参数集合,初始化每个正态分布的权重p(qk|Θ)=1/L,则对每个关键帧其中为Cj包含的关键帧总数,xi属于qk的概率为:
每个正态分布参数组可迭代优化更新如下:
迭代重复公式(2)至(5)直到收敛;
4)对给定姿态f,可由步骤3)得到的模型计算出一系列概率值pjk,j=1,2,...,m,k=1,2,...L,表示该姿态属于类别Cj中第k个关键姿态的概率,可由对应的正态分布N(μk,σk)计算得出,pjk可拼接为f对应的姿态粒度语义特征:
t={p11,...,p1L,...,pjk,...,pmL}(6)
对于一段给定的运动序列s={f1,f2,...,fn},先按公式(6)计算其每一帧fi的姿态特征t(i),再求平均,得到运动序列特征:
5)利用稀疏编码对给定运动序列特征进行重建,得到选择向量:
其中,λ为正则化参数,D是一个d×N的字典矩阵,包含了数据库中所有运动序列特征;d表示特征的维数,N为数据库中运动序列的个数,公式(8)可用l1-ls算法求解;
6)取选择向量v中最大的K个系数,K为需要返回的相似运动段数,其所对应的运动序列为重建过程中贡献度最大的运动,也即作为最终检索结果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510653832.8A CN105224669B (zh) | 2015-10-10 | 2015-10-10 | 一种基于gmm语义特征的运动检索方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510653832.8A CN105224669B (zh) | 2015-10-10 | 2015-10-10 | 一种基于gmm语义特征的运动检索方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN105224669A true CN105224669A (zh) | 2016-01-06 |
CN105224669B CN105224669B (zh) | 2018-11-30 |
Family
ID=54993637
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510653832.8A Active CN105224669B (zh) | 2015-10-10 | 2015-10-10 | 一种基于gmm语义特征的运动检索方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN105224669B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106528586A (zh) * | 2016-05-13 | 2017-03-22 | 上海理工大学 | 一种人体行为视频识别方法 |
CN108363724B (zh) * | 2018-01-04 | 2021-12-10 | 浙江大学 | 一种利用图像正则化及数据重建解决特征提取任务的方法 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1967525A (zh) * | 2006-09-14 | 2007-05-23 | 浙江大学 | 三维人体运动数据关键帧提取方法 |
CN1997114A (zh) * | 2006-09-14 | 2007-07-11 | 浙江大学 | 一种基于轮廓时空特征的视频对象标注方法 |
CN101216949A (zh) * | 2008-01-14 | 2008-07-09 | 浙江大学 | 一种基于区域分割和分段学习的三维人脸动画制作的方法 |
CN101276370A (zh) * | 2008-01-14 | 2008-10-01 | 浙江大学 | 基于关键帧的三维人体运动数据检索方法 |
CN103023510A (zh) * | 2012-11-16 | 2013-04-03 | 浙江大学 | 一种基于稀疏表达的运动数据压缩方法 |
CN104156980A (zh) * | 2014-07-26 | 2014-11-19 | 佳都新太科技股份有限公司 | 一种基于颜色和区域协方差矩阵的运动目标检索方法 |
-
2015
- 2015-10-10 CN CN201510653832.8A patent/CN105224669B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1967525A (zh) * | 2006-09-14 | 2007-05-23 | 浙江大学 | 三维人体运动数据关键帧提取方法 |
CN1997114A (zh) * | 2006-09-14 | 2007-07-11 | 浙江大学 | 一种基于轮廓时空特征的视频对象标注方法 |
CN101216949A (zh) * | 2008-01-14 | 2008-07-09 | 浙江大学 | 一种基于区域分割和分段学习的三维人脸动画制作的方法 |
CN101276370A (zh) * | 2008-01-14 | 2008-10-01 | 浙江大学 | 基于关键帧的三维人体运动数据检索方法 |
CN103023510A (zh) * | 2012-11-16 | 2013-04-03 | 浙江大学 | 一种基于稀疏表达的运动数据压缩方法 |
CN104156980A (zh) * | 2014-07-26 | 2014-11-19 | 佳都新太科技股份有限公司 | 一种基于颜色和区域协方差矩阵的运动目标检索方法 |
Non-Patent Citations (2)
Title |
---|
肖俊等: "human motion retrieval based on freehand sketch", 《COMPUTER ANIMATION AND VIRTUAL WORLDS》 * |
齐天等: "a human motion feature based on semi-supervised learning og GMM", 《MULTIMEDIA SYSTEMS》 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106528586A (zh) * | 2016-05-13 | 2017-03-22 | 上海理工大学 | 一种人体行为视频识别方法 |
CN108363724B (zh) * | 2018-01-04 | 2021-12-10 | 浙江大学 | 一种利用图像正则化及数据重建解决特征提取任务的方法 |
Also Published As
Publication number | Publication date |
---|---|
CN105224669B (zh) | 2018-11-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110516085B (zh) | 基于双向注意力的图像文本互检索方法 | |
CN103810299B (zh) | 基于多特征融合的图像检索方法 | |
Gkioxari et al. | Actions and attributes from wholes and parts | |
AU2024200779A1 (en) | System For Interactive Sports Analytics Using Multi-Template Alignment And Discriminative Clustering | |
CN110362715B (zh) | 一种基于图卷积网络的未剪辑视频动作时序定位方法 | |
CN100485713C (zh) | 基于集成隐马尔可夫模型学习方法的人体运动数据的识别方法 | |
CN109543713A (zh) | 训练集的修正方法及装置 | |
CN103390063B (zh) | 一种基于蚁群算法和概率超图的相关反馈图像检索方法 | |
Wulamu et al. | Multiscale road extraction in remote sensing images | |
CN105205475A (zh) | 一种动态手势识别方法 | |
CN103942568A (zh) | 一种基于无监督特征选择的分类方法 | |
CN106776856A (zh) | 一种融合颜色特征与词汇树的车辆图像检索方法 | |
CN103914527B (zh) | 一种基于新编码方式的遗传规划算法的图形图像识别与匹配方法 | |
CN110210462A (zh) | 一种基于卷积神经网络的仿生海马认知地图构建方法 | |
CN103400160A (zh) | 一种零训练样本行为识别方法 | |
CN104156464A (zh) | 基于微视频特征数据库的微视频检索方法及装置 | |
CN111881716A (zh) | 一种基于多视角生成对抗网络的行人重识别方法 | |
CN105931271A (zh) | 一种基于变分bp-hmm的人的行为轨迹识别方法 | |
CN104318271B (zh) | 一种基于适应性编码和几何平滑汇合的图像分类方法 | |
CN101276370B (zh) | 基于关键帧的三维人体运动数据检索方法 | |
CN103984746A (zh) | 基于半监督分类与区域距离测度的sar图像识别方法 | |
CN108921850A (zh) | 一种基于图像分割技术的图像局部特征的提取方法 | |
CN103136540A (zh) | 一种基于隐结构推理的行为识别方法 | |
CN107220597B (zh) | 一种基于局部特征和词袋模型人体动作识别过程的关键帧选取方法 | |
CN109740672A (zh) | 多流特征距离融合系统与融合方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |