CN103023510B - 一种基于稀疏表达的运动数据压缩方法 - Google Patents
一种基于稀疏表达的运动数据压缩方法 Download PDFInfo
- Publication number
- CN103023510B CN103023510B CN201210466612.0A CN201210466612A CN103023510B CN 103023510 B CN103023510 B CN 103023510B CN 201210466612 A CN201210466612 A CN 201210466612A CN 103023510 B CN103023510 B CN 103023510B
- Authority
- CN
- China
- Prior art keywords
- exercise data
- data
- dictionary
- sparse expression
- compression
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明为一种基于稀疏表达的运动数据压缩方法,该方法首先对输入的运动数据进行分析生成稀疏表达字典;然后基于稀疏表达字典对运动数据中的每一帧进行稀疏线性表达;最后用K-SVD算法对字典和稀疏表示进行迭代优化。本方法在将重建误差控制在合理范围的前提下,可以达到较高的压缩比,特别适用于对较短运动数据的压缩。
Description
技术领域
本发明涉及动画制作、运动捕获以及机器学习领域,特别涉及一种对运动数据进行压缩的方法。
背景技术
随着动画产业的发展,动画制作中越来越多的用到运动数据(其格式以bvh、trc等为主),这些数据多来源于运动捕获系统。运动数据文件中一般包括角色模型信息、运动片段总帧数、采样率等基础信息以及大量的运动数据信息(角色模型每个关节点的三维坐标或旋转角度,依文件格式而不同)。由于运动数据的采样率普遍较高,因此运动数据中冗余度也相对较高,重复性较强,在需要大量运动数据时会消耗过多的磁盘空间。因此,对运动数据的压缩成为了一个有意义的实际问题。
随着人体运动数据在科研和生产应用中的普及以及用于科研与商用目的的大型三维人体运动数据库的出现,对运动数据的高效压缩与存储正逐渐被大家所重视。2008年在EURASIP Journal on Image and Video Processing发表的《Compression of Human Motion Animation Using the Reduction of InterjointCorrelation》,该方法公开了一种通过正向和反向运动学对运动序列中的关节点进行表示,基于反向运动学的预测对运动数据进行压缩的方法。与之类似,在2009年的Computer Graphics上发表的《Motion compression using principalgeodesics analysis》,公开了一种基于PGA(Principal Geodesics Analysis)构建的简化骨骼模型,并通过储存人体骨骼根结点和所有末端节点轨迹代替原始数据,从而实现运动数据压缩效果的方法。此外,数据降维的方法也被引入到运动数据压缩中,例如基于PCA和CPCA的运动数据压缩方法。此外,另一类减少数据重复性的思路是信号处理方法,例如小波变换等。然而实验表明,仅用一些简单的数据降维和信号处理方法对运动数据进行压缩,其效果并不理想。
随着可用运动数据的不断增加,采用数据驱动方法实现运动数据压缩成为一个可行的思路。2008年在Computer Graphics上发表的《Compression of humanmotion capture data using motion pattern indexing》,该方法先将三维人体运动数据进行结构化处理,并在数据库中识别具有相似特征的数据,然后将结构化人体运动数据用数据库中已有的样本进行表达,用数据库索引替代原始数据以实现压缩目的。这种运动特征索引的思路也在其他一些方法中有所体现,如2007年在IEEE Transaction on Visualization and Computer Graphics上发表的《Humanmotion capture data compression by model-based indexing:A power awareapproach》。基于数据驱动的运动数据压缩方法确实能达到较好的压缩效果,但从大量训练数据中提取特征和生成模型是计算复杂且耗时的过程。此外,数据驱动的压缩过程还需要一定规模的数据库支持,且在很大程度其重建效果还依赖于所选择的训练样本,这与数据压缩的目的相悖。
在以上这些运动数据压缩方法中,大多数只适用于较长运动序列,或需要对数据库中所有运动数据片段拼接形成一个超长运动序列后再对其进行压缩。然而,如前文所述,由于运动捕获流程中采集的运动片段一般都不超过几分钟,短时长的运动序列应用更为广泛,且拼接成的整段超长运动序列不利于对增量数据库和数据变更的处理。遗憾的是,目前仍没有一种适用于短时长运动序列的压缩方法。
发明内容
本发明的目的在于针对现有技术的不足,提供了一种基于稀疏表达的运动数据压缩方法。
本发明的目的是通过以下技术方案来实现的:一种基于稀疏表达的运动数据压缩方法,该方法包括如下步骤:
(1)运动数据采集:采集人体运动时的关节点运动轨迹,并存为bvh或trc格式的运动数据文件;
(2)解析运动数据文件:将文件中运动数据Y和其他数据H(包括模型信息、帧数、采样率等)进行区分;
(3)运动数据字典生成:通过K-means聚类算法聚为K类,生成初始化的运动数据字典D(0),其中,K为字典大小;
(4)稀疏表达求解:对运动数据Y中每一帧的信息用步骤3中生成的初始化的运动数据字典D(0)进行线性表达,并用Sparse方法求解运动数据Y的稀疏表达矩阵A,该稀疏表达矩阵A即为运动数据Y的压缩形式;
(5)应用K-SVD优化方法对步骤3生成的初始化的运动数据字典D(0)和步骤4生成的稀疏表达矩阵A进行迭代优化,得到优化后的运动数据字典D优化和优化后的稀疏表达矩阵A优化,减小步骤4带来的数据重建误差;
(6)后续无损编码压缩:该步骤对步骤2中抽取的其他数据H、步骤5中生成的优化后的运动数据字典D优化和优化后的稀疏表达矩阵A优化进行无损数学编码压缩,压缩过程采用Huffman编码,得到最终压缩后的二进制数据文件,压缩过程完成。
本发明的有益效果是,本发明公开了一种针对运动数据的压缩方法,利用生成字典的线性组合来表达每一帧的运动数据,实现了高效的运动数据压缩。本方法可以达到较高的压缩比,同时保证恢复后的重建误差控制在一个相对很低的水平。此外,这一方法对较短运动数据效果良好,解决了该领域其他方法对于较短运动数据无法有效压缩的难题;因此还可有效支持增量式的运动数据库,为动画制作等相关应用领域提供了极大的方便,在实际生产中具有重大意义。
具体实施方式
下面对本方法具体步骤及涉及的预备知识进行详细描述,本发明的内容将变得更加易于理解。
一、K-means聚类算法
K-means聚类算法将给定的n个数据对象自动划分为k个聚类(k为输入量),使得每个数据对象被分配到欧氏距离最近的聚类中。具体实现步骤如下:
1)从n个数据对象随机选择k个对象作为初始聚类中心(默认为随机选择,也可以指定k个对象或指定k个初始聚类中心点坐标,在本方法中由于自动化流程的需要,只能随机选择k个对象,因此聚类结果会存在较小的误差)。
2)根据每个聚类对象的均值(中心对象),计算每个对象与这些中心对象的距离,并根据最小距离重新对相应对象进行划分。
3)重新计算每个聚类的均值(中心对象)。
4)循环2)到3)直到每个聚类不再发生变化为止。
二、Sparse方法
对于给定原始数据列向量b,字典L/K=K/n(L≥2),Sparse方法旨在求解下面方程:
其中,L是指定的参数,用来约束每一组字典的线性组合b中非零元素的个数上限,是约束表达式x稀疏性的参数。
解决Sparse问题的算法有很多,本方法中用到的是OMP算法,具体方法如下:
输入:矩阵φ,向量b,稀疏度m。
初始化:定义余向量r0=b。
循环执行下列步骤,循环变量t=1~m
A.在φ中找出与余向量最相关的列向量ωt:
B.解下列最小二乘问题并更新余向量rt:
yt=arg min||b-Φty||2,
rt=b-Φtyt,
其中,
输出:系数表达向量
本发明基于稀疏表达的运动数据压缩方法,包括如下步骤:
1、运动数据采集
运动数据是逐帧存储的人体骨骼关节点信息的数据,在动画制作、3D游戏、交互娱乐、运动仿真等领域都有广泛应用。运动数据的采集一般通过对演员关节部位贴标记点,并通过多视角的专业运动捕获设备,在专门的场景中采集演员运动时的关节点运动轨迹,并存为通用格式(包括bvh、trc等)的运动数据文件。
本发明中所用的运动数据通过运动捕获系统采集得到。使用Vicon运动捕获系统(http://www.vicon.com/),对贴于人体关节处的marker点的轨迹信息进行捕捉,为了与数据库中的数据保持一致,我们也使用CMU(Carnegie MellonUniversity,卡耐基梅隆大学)的marker点集配置方案(参考http://mocap.cs.cmu.edu/markerPlacementGuide.pdf)。这样可以保证数据库与待处理数据具有相同维度和关节对应关系。
2、解析运动数据文件
这一步为预处理步骤。一般运动数据文件格式包括bvh、trc等。对运动数据文件的解析是将文件中运动数据Y(数据矩阵形式)和其他数据H(包括模型信息、帧数、采样率等)进行区分,以方便后续处理。
3、运动数据字典生成
本步骤对步骤2中抽取的运动数据Y进行处理,通过K-means聚类算法聚为K类,生成初始化的运动数据字典D(0),其中,K为字典大小。
4、稀疏表达(Sparse Coding)求解
对运动数据中每一帧的信息用步骤3中生成初始化的运动数据字典D(0)进行线性表达,并用Sparse方法(OMP算法)求解运动数据Y的稀疏表达矩阵A,该稀疏表达矩阵A即为运动数据Y的压缩形式。
这一步的求解过程是有损的,但步骤5的优化过程可使得数据重建误差控制在很低的范围内。
5、应用K-SVD优化方法对步骤3生成的初始化的运动数据字典D(0)和步骤4生成的稀疏表达矩阵A进行迭代优化,优化后的运动数据字典D优化和优化后的稀疏表达矩阵A优化,减小步骤4带来的数据重建误差。
本步骤基于Sparse理论及其求解方法,并用K-means和K-SVD方法对字典生成过程进行处理和优化,具体如下:
输入:运动数据Y,字典大小K,稀疏表达上限L,循环次数J。
输出:优化后的运动数据字典D优化,优化后的稀疏表达矩阵A优化。
初始化:
用K-means算法将运动数据Y聚类为K类,令D(0)为每类中心位置向量的集合。对D(0)做归一化处理。
循环执行下列步骤,循环变量j=1~J;
(1)用Sparse方法(OMP算法)求解下列方程,计算稀疏表达矩阵A(j):
其中,ai为A(j)的第i列,yi为Y的第i列。
(2)循环执行下列步骤,循环变量k=1~K;
(a)定义其中是矩阵A的第k行;
(b)定义Ωk为一个n×|ωk|矩阵,其中第(ωk(i),i)个元素为1,其余均为0;
(c)计算全局误差矩阵
(d)计算全局误差表达矩阵
(e)对进行SVD分解:
(f)更新D(j)的第k行,
(g)更新A(j)的参数向量,
返回D优化=D(j),A优化=A(j),算法结束。
关于本方法步骤中的参数选取,经过大量实验,得到经验数据如下:L为循环迭代次数,一般取值5;K和L均为Sparse方法约束参数,取值越大压缩精度越高,但压缩率越低,反之亦然。K和L存在相关性,其经验公式为:
L/K=K/n(L≥2)。
其中,n为运动数据总帧数。
6、后续无损编码压缩
该步骤对步骤2中抽取的其他数据H、步骤5中生成的优化后的运动数据字典D优化和优化后的稀疏表达矩阵A优化进行无损数学编码压缩,压缩过程采用Huffman编码,得到最终压缩后的二进制数据文件,压缩过程完成。
对应用本发明的方法压缩后的二进制数据文件进行解压的过程如下:先解码Huffman编码,得到运动数据文件的其他数据、运动数据字典和稀疏表达矩阵。再利用运动数据字典和稀疏表达矩阵计算得到运动数据。最后将解压后的运动数据和原运动数据文件中的其他数据按照运动数据文件格式进行重建,得到重建恢复后的运动数据文件,解压过程完成。
本文提出了一种基于稀疏表达的方法有效解决背景技术中存在的问题。字典的生成只源于运动序列本身,无需额外数据库的支持;而稀疏线性表达和优化方法可保证压缩的有效性。这一轻量级的方法对运动数据的压缩十分有效,尤其适用于短时长的运动序列。
Claims (1)
1.一种面向运动数据的压缩方法,其特征在于,该方法包括如下步骤:
(1)运动数据采集:采集人体运动时的关节点运动轨迹,并存为bvh或trc格式的运动数据文件;
(2)解析运动数据文件:将运动数据文件中的运动数据Y和其他数据H进行区分;所述其他数据H包括模型信息、帧数和采样率;
(3)运动数据字典生成:通过K-means聚类算法将运动数据Y聚为K类,生成初始化的运动数据字典D(0),其中,K为字典大小;
(4)稀疏表达求解:对运动数据Y中每一帧的信息用步骤(3)中生成的初始化的运动数据字典D(0)进行线性表达,并用Sparse方法求解运动数据Y的稀疏表达矩阵A,该稀疏表达矩阵A即为运动数据Y的压缩形式;
(5)应用K-SVD优化方法对步骤(3)生成的初始化的运动数据字典D(0)和步骤
(4)生成的稀疏表达矩阵A进行迭代优化,得到优化后的运动数据字典D优化和优化后的稀疏表达矩阵A优化,减小步骤(4)带来的数据重建误差;
(6)后续无损编码压缩:该步骤对步骤(2)中抽取的其他数据H、步骤(5)中生成的优化后的运动数据字典D优化和优化后的稀疏表达矩阵A优化进行Huffman编码压缩,得到最终压缩后的二进制数据文件,压缩过程完成。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201210466612.0A CN103023510B (zh) | 2012-11-16 | 2012-11-16 | 一种基于稀疏表达的运动数据压缩方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201210466612.0A CN103023510B (zh) | 2012-11-16 | 2012-11-16 | 一种基于稀疏表达的运动数据压缩方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN103023510A CN103023510A (zh) | 2013-04-03 |
CN103023510B true CN103023510B (zh) | 2015-10-07 |
Family
ID=47971689
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201210466612.0A Active CN103023510B (zh) | 2012-11-16 | 2012-11-16 | 一种基于稀疏表达的运动数据压缩方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN103023510B (zh) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104851116A (zh) * | 2015-05-21 | 2015-08-19 | 广东中烟工业有限责任公司 | 一种近红外光谱数据压缩方法、装置及系统 |
CN105224669B (zh) * | 2015-10-10 | 2018-11-30 | 浙江大学 | 一种基于gmm语义特征的运动检索方法 |
CN107591191A (zh) * | 2017-09-29 | 2018-01-16 | 广州市香港科大霍英东研究院 | 运动数据的分析存储方法及系统 |
CN109740023B (zh) * | 2019-01-03 | 2020-09-29 | 中国人民解放军国防科技大学 | 基于双向位图的稀疏矩阵压缩存储方法 |
CN110197576B (zh) * | 2019-05-30 | 2021-04-20 | 北京理工大学 | 一种大规模实时人体动作采集重构系统 |
CN110517336B (zh) * | 2019-08-28 | 2021-02-05 | 北京理工大学 | 一种基于主发力关节点的人体运动数据压缩方法及设备 |
CN110830044B (zh) * | 2019-11-01 | 2023-04-18 | 四川大学 | 基于稀疏最小二乘优化的数据压缩方法 |
CN111191520B (zh) * | 2019-12-10 | 2023-02-07 | 北京大学 | 用于动作识别的人体骨架压缩方法、装置以及设备 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102651072A (zh) * | 2012-04-06 | 2012-08-29 | 浙江大学 | 一种面向三维人体运动数据的分类方法 |
CN102688032A (zh) * | 2012-05-11 | 2012-09-26 | 东华大学 | 基于精简公共字典库的心电信号稀疏分解压缩系统 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20070071331A1 (en) * | 2005-09-24 | 2007-03-29 | Xiteng Liu | Image compression by economical quaternary reaching method |
-
2012
- 2012-11-16 CN CN201210466612.0A patent/CN103023510B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102651072A (zh) * | 2012-04-06 | 2012-08-29 | 浙江大学 | 一种面向三维人体运动数据的分类方法 |
CN102688032A (zh) * | 2012-05-11 | 2012-09-26 | 东华大学 | 基于精简公共字典库的心电信号稀疏分解压缩系统 |
Non-Patent Citations (2)
Title |
---|
Chattopadhyay S,Bhandarkar S M,Li K.Human motion capture data compression by model-based indexing:A power aware approach.《IEEE Transaction on Visualization and Computer Graphics》.2007, * |
Gu Q,Peng J,Deng Z.Compression of human motion capture data using motion pattern indexing.《Computer Graphics Forum》.2008, * |
Also Published As
Publication number | Publication date |
---|---|
CN103023510A (zh) | 2013-04-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103023510B (zh) | 一种基于稀疏表达的运动数据压缩方法 | |
Xiao et al. | Scene classification with improved AlexNet model | |
CN109389661B (zh) | 一种动画文件转化方法及装置 | |
Liu et al. | Optimization-based key frame extraction for motion capture animation | |
CN102682452A (zh) | 基于产生式和判别式结合的人体运动跟踪方法 | |
CN110543895B (zh) | 一种基于VGGNet和ResNet的图像分类方法 | |
CN111160568A (zh) | 机器阅读理解模型训练方法、装置、电子设备和存储介质 | |
Hou et al. | Human motion capture data tailored transform coding | |
CN104899896B (zh) | 一种基于子空间特征的多任务学习目标跟踪方法 | |
CN106934458A (zh) | 基于深度学习的多层自动编码方法及系统 | |
CN102855639B (zh) | 一种运动捕捉数据的关键帧提取方法 | |
CN103116903A (zh) | 二维动画角色动作的重定向方法 | |
CN116740223A (zh) | 基于文本生成图像的方法 | |
CN105260736A (zh) | 基于归一化非负稀疏编码器的图像快速特征表示方法 | |
CN112417752A (zh) | 基于卷积lstm神经网络的云层轨迹预测方法及系统 | |
CN104331911A (zh) | 基于改进二阶振荡粒子群优化算法的关键帧提取方法 | |
CN114170353B (zh) | 一种基于神经网络的多条件控制的舞蹈生成方法及系统 | |
Xuanye et al. | Human action recognition method based on multi-attention mechanism and spatiotemporal graph convolution networks | |
CN102930573B (zh) | 一种基于二维分析稀疏模型及其训练字典的图像重建方法 | |
Qin et al. | Virtual reality video image classification based on texture features | |
CN105469601B (zh) | 一种基于lzw编码的道路交通空间数据压缩方法 | |
Zheng et al. | CFA-GAN: Cross fusion attention and frequency loss for image style transfer | |
CN115482353A (zh) | 重建网络的训练方法、重建方法、装置、设备和介质 | |
CN102510486B (zh) | 一种几何图像的处理方法及其装置 | |
Li et al. | An attention-seq2seq model based on CRNN encoding for automatic Labanotation generation from motion capture data |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant |