CN102364470A - 一种基于图像序列的三维动画检索方法 - Google Patents
一种基于图像序列的三维动画检索方法 Download PDFInfo
- Publication number
- CN102364470A CN102364470A CN2011103115605A CN201110311560A CN102364470A CN 102364470 A CN102364470 A CN 102364470A CN 2011103115605 A CN2011103115605 A CN 2011103115605A CN 201110311560 A CN201110311560 A CN 201110311560A CN 102364470 A CN102364470 A CN 102364470A
- Authority
- CN
- China
- Prior art keywords
- model
- animation
- frame
- image
- img
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Processing Or Creating Images (AREA)
Abstract
Description
技术领域:
本发明属于多媒体信息检索领域,特别是一种基于图像序列的三维模型动画检索方法。
背景技术:
三维模型动画检索是多媒体信息检索领域的热点问题,特别是三维动画影视和游戏的发展,具有广阔的应用前景,国内外许多机构正致力于这一方面的研究。近年来3D影视的兴起,需要为所建动画角色添加一系列的动画,这会耗费大量时间,人们就需要一种快速有效的模型动画检索方法。在国外公开的文献中,Jackie Assa. “Human Motion Retrieval from Hand-Draw Sketch”In ” IEEE Trans Vis Comput Graph. 2011 Mar 2 ”,提出了人基于运动轨迹的动作识别方法,关于现行的三维模型动画检索机制,总体来说分为2大类:基于特定对象的比对时间帧的检索方法,和基于特定对象的比对轨迹的检索方法。
但上述检索方法有几点不足:
(1)逐帧比较容易受到诸如速度快慢因素的影响,影响最终检索效果,就是基于动态时间弯曲法,虽然克服了速度因素,但该方法是检索最优路径,需要添加带宽约束,不同的约束检索效果不同,而且这种检索方法是基于局部特征的运动比对,缺少整体特征的描述,从而影响检索结果;再者对于数据处理需要大量的存储空间,数据检索也会耗费大量时间。
(2)两种方法都是基于特定对象的,是在对象已知的情况下进行检索,而实际中需要对各种模型动画进行检索。因此现有技术存在着适用范围窄的问题。
下面对与本发明有关的技术进行简单介绍:
(1)主成分分析法:它是一种对数据进行分析的技术,最重要的应用是对原有数据进行简化,可以有效地找出数据中最主要的元素和结构,去除噪声和冗余,将复杂数据降维,揭示隐藏在背后的简单结构,具有广泛应用,本发明中用来进行图像数据的融合。
(2)光流法:光流是空间运动物体在成像面上的像素运动的瞬时速度,利用图像序列中的像素强度数据的时域变化和相关性来确定各自像素位置的运动,目前,光流计算大致分为三类:基于匹配的、频域的和梯度的方法,本发明中用的是基于区域匹配的计算方法。
发明内容:
本发明要提供一种基于图像序列的三维模型动画检索方法,以克服现有技术存在的容易受到起始动作的影响、耗费时间多和适用范围窄的问题。
为了克服现有技术存在的问题,本发明提供的技术方案是:一种基于图像序列的三维动画检索方法,依次包括下述步骤:
一、服务器端三维模型的图像阵列的获取:在三维模型动画数据库中设置n个摄像机,编写脚本使得模型成正n面体分布,使模型处于摄像机中心,并使得每个摄像头视轴线指向模型质心,获得模型各个视角图像,组成图像阵列;
三、在服务器端生成特征数据库:
(1)将得到的每一帧模型图像组成图像序列
,然后对图像序列的第一帧和第二帧提取光流光流特征,接着对第二帧和第三帧提取光流特征,以此类推直至最后一帧;
(2)对得到的每个模型动画的光流描述取均值,得到的结果作为整个模型动画的描述,从而生成特征数据库;
四、在服务器端生成客户端提供的图像序列的特征:将客户端图像序列,按照特征数据库生成的方法,来生成客户端图像序列动画的特征描述;
五、服务器端返回给客户端检索得到的模型动画:将得到的客户端动画特征与特征数据库中的特征进行比较,用用Fleet and Jepson提出的角误差测量方法作为量度,取其中误差较小的作为返回动画的索引并返回给客户检索结果。
上述的步骤三(1)中,具体包括以下步骤:
(a)运用运动中基于区域的匹配方法来描述物体的运动,首先建立运动模型:
(b)提出假设:a.图像中点的亮度是不变的;b.临近点以相同速度移动
(d)为消除噪声影响,考虑第二个假设,可得:
根据相关方法实现平方误差最小化,解得动画光流描述。
本发明与现有技术相比的优点在于:
(1)克服了动态时间弯曲法适用于较短动画检索的缺点,不依赖于动画序列的长短;由于动态时间弯曲随着动画序列的增加,距离矩阵也在增加,而再在距离矩阵之上找寻比较路径,无疑增加了算法的复杂度,而本发明运用PCA融合算法,将所有特征降维,大大减小了对于存储空间的要求,也加快了算法运行速度;
(2)可用于非静态的、突变动作模型的检索,而相对于以往的检索方法(如欧式距离、动态时间弯曲等),这些检索算法是基于静态、平稳的运动模型这个假设之上的,也就是马尔科夫过程,无法解决动作突变等情况;
(3)可以充分利用模型的多视角信息进行模型的识别;先前提到的检索算法,是针对某个特定对象动作过程的检索,就是说检索算法中并没有包含识别的过程,本发明中通过在多视角图像中提取模型特征,来进行目标的识别;
(4)可以进行整体动作的检索,也可比对具体某个动作的获取;该算法依用户输入图像序列而定,如果输入较少的图像序列,也就是某个动作(如踢腿),那么就可以进行特定动作的检索,如果输入较多的图像序列(如跳舞),即可进行整个动作过程的检索。
附图说明:
图1是本发明的整体框架;
图2为本发明方法步骤(1)的流程图;
图3为本发明方法步骤(2)(3)的流程图;
图4为根据本发明方法步骤(1)所做结果显示;
图5为根据本发明方法步骤(2)所做结果显示;
图6~图7为根据本发明方法步骤(3)所做结果显示;
图8为本发明方法的检索效果(用PR曲线来描述);
具体实施方式:
下面将结合附图及具体实施例对本发明进行详细的说明。
参见图1~图3,本发明提供的一种基于图像序列的三维动画检索方法,依次包括下述步骤:
一、服务器端对三维模型动画数据库中的每一帧模型进行n个视角的采样,获取三维模型的图像阵列:参见图1~图2,共有num个模型动画,分别在各个三维模型动画中设置n个摄像机,编写脚本使得模型成正n面体分布,使模型处于摄像机中心,并使得每个摄像头视轴线指向模型质心,获得模型各个视角图像,组成图像阵列,所得结果如图4所示;
二、服务器端将获得的图像阵列用主成分分析法进行图像融合,获得每一帧模型图像:参见图2,对每个模型的每一帧的n幅图像组成的图形阵列 ,用主成分分析法(PCA)进行图像融合,从而得到一帧的模型图像 ,所得结果如图5所示;
三、服务器端对每个模型的图像序列提取光流描述子,生成三维模型动画的特征数据库(参见图1~图2):
(a)运用运动中基于区域的匹配方法来描述物体的运动,首先建立运动模型:
(b)提出假设:a.图像中点的亮度是不变的;b.临近点以相同速度移动
(d)为消除噪声影响,考虑第二个假设,可得:
根据相关方法实现平方误差最小化,解得动画光流描述。
(2)对得到的每个模型动画的光流描述取均值,得到的结果作为整个模型动画的描述,从而生成特征数据库,所得结果如图7所示;
四、服务器端计算客户端提供的图像序列的特征:参见图3,对客户端图像序列进行PCA图像融合之后,提取图像序列动画的光流描述子,作为客户模型动画的特征描述;
五、服务器端将获得的特征与数据库特征库进行比对,并返回给客户端相应的模型动画(参见图1、图3):将得到的客户端动画特征与特征数据库中的特征进行比较,用用Fleet and Jepson提出的角误差测量方法作为量度,取其中误差较小的作为返回动画的索引并返回客户检索结果,就对于检索精度,可用返回结果来验证,参见图8。
Claims (2)
1.一种基于图像序列的三维动画检索方法,依次包括下述步骤:
一、服务器端三维模型的图像阵列的获取:在三维模型动画数据库中设置n个摄像机,编写脚本使得模型成正n面体分布,使模型处于摄像机中心,并使得每个摄像头视轴线指向模型质心,获得模型各个视角图像,组成图像阵列;
三、在服务器端生成特征数据库:
(2)对得到的每个模型动画的光流描述取均值,得到的结果作为整个模型动画的描述,从而生成特征数据库;
四、在服务器端生成客户端提供的图像序列的特征:将客户端图像序列,按照特征数据库生成的方法,来生成客户端图像序列动画的特征描述;
五、服务器端返回给客户端检索得到的模型动画:将得到的客户端动画特征与特征数据库中的特征进行比较,用用Fleet and Jepson提出的角误差测量方法作为量度,取其中误差较小的作为返回动画的索引并返回给客户检索结果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 201110311560 CN102364470B (zh) | 2011-10-14 | 2011-10-14 | 一种基于图像序列的三维动画检索方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 201110311560 CN102364470B (zh) | 2011-10-14 | 2011-10-14 | 一种基于图像序列的三维动画检索方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN102364470A true CN102364470A (zh) | 2012-02-29 |
CN102364470B CN102364470B (zh) | 2013-05-15 |
Family
ID=45691036
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN 201110311560 Expired - Fee Related CN102364470B (zh) | 2011-10-14 | 2011-10-14 | 一种基于图像序列的三维动画检索方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN102364470B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104462365A (zh) * | 2014-12-08 | 2015-03-25 | 天津大学 | 一种基于概率模型的多视角目标检索方法 |
CN109446363A (zh) * | 2018-10-22 | 2019-03-08 | 镇江悦乐网络科技有限公司 | 一种基于三维cg动画的快速检索方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101281545A (zh) * | 2008-05-30 | 2008-10-08 | 清华大学 | 一种基于多特征相关反馈的三维模型检索方法 |
CN101382934A (zh) * | 2007-09-06 | 2009-03-11 | 华为技术有限公司 | 多媒体模型检索方法、装置及系统 |
US20100066860A1 (en) * | 2007-08-24 | 2010-03-18 | Sony Corporation | Image processing device, dynamic image reproduction device, and processing method and program in them |
CN101976461A (zh) * | 2010-10-25 | 2011-02-16 | 北京理工大学 | 一种新的户外增强现实无标跟踪注册算法 |
CN102004795A (zh) * | 2010-12-08 | 2011-04-06 | 中国科学院自动化研究所 | 一种手语检索的方法 |
-
2011
- 2011-10-14 CN CN 201110311560 patent/CN102364470B/zh not_active Expired - Fee Related
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20100066860A1 (en) * | 2007-08-24 | 2010-03-18 | Sony Corporation | Image processing device, dynamic image reproduction device, and processing method and program in them |
CN101382934A (zh) * | 2007-09-06 | 2009-03-11 | 华为技术有限公司 | 多媒体模型检索方法、装置及系统 |
CN101281545A (zh) * | 2008-05-30 | 2008-10-08 | 清华大学 | 一种基于多特征相关反馈的三维模型检索方法 |
CN101976461A (zh) * | 2010-10-25 | 2011-02-16 | 北京理工大学 | 一种新的户外增强现实无标跟踪注册算法 |
CN102004795A (zh) * | 2010-12-08 | 2011-04-06 | 中国科学院自动化研究所 | 一种手语检索的方法 |
Non-Patent Citations (1)
Title |
---|
肖秦琨 等: "基于相关反馈学习的三维目标检索算法", 《系统工程与电子技术》 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104462365A (zh) * | 2014-12-08 | 2015-03-25 | 天津大学 | 一种基于概率模型的多视角目标检索方法 |
CN109446363A (zh) * | 2018-10-22 | 2019-03-08 | 镇江悦乐网络科技有限公司 | 一种基于三维cg动画的快速检索方法 |
Also Published As
Publication number | Publication date |
---|---|
CN102364470B (zh) | 2013-05-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Wang et al. | Dense trajectories and motion boundary descriptors for action recognition | |
Senst et al. | Crowd violence detection using global motion-compensated lagrangian features and scale-sensitive video-level representation | |
CN103593464B (zh) | 基于视觉特征的视频指纹检测及视频序列匹配方法及系统 | |
Elhayek et al. | MARCOnI—ConvNet-based MARker-less motion capture in outdoor and indoor scenes | |
Chen et al. | City-scale landmark identification on mobile devices | |
Guo et al. | Action recognition from video using feature covariance matrices | |
Holte et al. | 3D human action recognition for multi-view camera systems | |
Choi et al. | Depth analogy: Data-driven approach for single image depth estimation using gradient samples | |
Singh et al. | Human activity recognition in video benchmarks: A survey | |
Chun et al. | Human action recognition using histogram of motion intensity and direction from multiple views | |
Da Silva et al. | Human action recognition in videos based on spatiotemporal features and bag-of-poses | |
Yi et al. | Motion keypoint trajectory and covariance descriptor for human action recognition | |
Liang et al. | 3D human action recognition using a single depth feature and locality-constrained affine subspace coding | |
Chu et al. | Housecraft: Building houses from rental ads and street views | |
Li et al. | Occlusion aware unsupervised learning of optical flow from video | |
CN102364470B (zh) | 一种基于图像序列的三维动画检索方法 | |
Liu et al. | Energy-based global ternary image for action recognition using sole depth sequences | |
Tran et al. | An effective fusion scheme of spatio-temporal features for human action recognition in RGB-D video | |
Barhoumi | Detection of highly articulated moving objects by using co-segmentation with application to athletic video sequences | |
Mizher et al. | Action key frames extraction using l1-norm and accumulative optical flow for compact video shot summarisation | |
Nie et al. | Effective 3D object detection based on detector and tracker | |
Liu et al. | Better dense trajectories by motion in videos | |
Li et al. | Spatiotemporal interest point detector exploiting appearance and motion-variation information | |
Hu et al. | Video driven pedestrian visualization with characteristic appearances | |
Bhutta et al. | Selective subtraction for handheld cameras |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
C17 | Cessation of patent right | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20130515 Termination date: 20131014 |