CN100426329C

CN100426329C - 人物缩图序列产生系统与方法

Info

Publication number: CN100426329C
Application number: CNB011415444A
Authority: CN
Inventors: 吴昌隆; 黄维仁
Original assignee: LIXIN INTERNATIONAL SCIENCE AND TECHNOLOGY Co Ltd
Current assignee: LIXIN INTERNATIONAL SCIENCE AND TECHNOLOGY Co Ltd
Priority date: 2001-10-12
Filing date: 2001-10-12
Publication date: 2008-10-15
Anticipated expiration: 2021-10-12
Also published as: CN1412719A

Abstract

本发明提供一种人物缩图序列产生系统，其包括一视频接收装置、一译码装置、一视频撷取装置以及一人物缩图序列产生装置。在本发明中，视频接收装置接收一原视频数据；译码装置将原视频数据译码成为一视频数据；视频撷取装置则依据一人物图象撷取方法自视频数据中撷取至少一关键画面；人物缩图序列产生装置依据所撷取的关键画面产生一缩图序列。本发明亦公开一种依据上述系统实施的人物缩图序列产生方法。

Description

人物缩图序列产生系统与方法

技术领域

本发明是关于一种人物缩图序列产生系统与方法，特别关于一种利用一计算机软件来分析一视频(Video)内容以自动产生人物缩图序列(Thumbnail Sequence)的系统与方法。

背景技术

一般而言，视频是连续输出的单张图象，例如，在NTSC标准中，其播放一秒钟可能是包含29.97张图象的连续切换，而在PAL标准中，其播放一秒钟可能是包含25张图象的连续切换，当使用者检视该图象时，最大的问题就是该图象的数量实在太多，以NTSC标准为例，一分钟的视频就包括了将近1800张图象，以此类推，使用者必须检视将近二万张的图象，才能检视完10分钟的视频中的所有图象，因此，当使用计算机软件来编辑视频内容时，常常仅就视频内容的第一张图象代表该视频，部份计算机软件为了方便使用者更容易对该视频内容有所了解，以利视频编辑的进行，常会以缩图序列的方式显示该视频的部份图象，然而其挑选该视频中部份图象的方法，目前有挑选拍摄日期不同或时间不连续的第一张图象，或每隔一时间间隔后挑选一张图象，或分析视频内容挑选镜头变换不同的第一张图象，以及以人工方式挑选图象等方法。

当视频内容为一生活剪影、MTV、戏剧、影片或影集时，人物通常为该视频内容的主角，因此以人物角色缩图序列来代表视频，能够提供使用者快速检视于生活剪影、MTV、戏剧、影片或影集中的人物角色的图象，尤其该图象对使用者来说是有意义且具代表性的。然而，目前并未有就视频内容的人物角色挑选视频的部份图象产生缩图序列，因此，如何自动挑选该视频中有意义且具代表性的人物图象画面并产生缩图序列以代表该视频正是当前一个重要的课题。

发明内容

针对上述问题，本发明的目的是提供一种能够有效率地分析视频，并且产生所需的人物缩图序列的人物缩图序列产生系统与方法。

为达上述目的，本发明的人物缩图序列产生系统包括一视频接收装置、一译码装置、一视频撷取装置以及一人物缩图序列产生装置。在本发明中，视频接收装置接收一原视频数据，而译码装置将原视频数据译码成为一视频数据，然后视频撷取装置依据一人物图象撷取方法自视频数据中撷取至少一关键画面(key frame)，最后由人物缩图序列产生装置依据所撷取的关键画面产生一人物缩图序列。

换言之，本发明的人物缩图序列产生系统，包含：一视频接收装置，其接收一原视频数据；一译码装置，其译码该原视频数据以取得一视频数据；一视频撷取装置，其依据一人物图象撷取方法自该视频数据中撷取一关键画面；一图象处理装置，其于撷取该关键画面后，针对所撷取的该关键画面进行图象处理；以及一人物缩图序列产生装置，其依据所撷取并图像处理后的该关键画面产生一人物缩图序列。

承上所述，依本发明的人物缩图序列产生系统还包含一图象处理装置，其于撷取关键画面后，针对所撷取的关键画面进行图象处理。

本发明的人物缩图序列产生系统还包含一撷取方法选择装置，其接受一使用者的选择以提供人物图象撷取方法。

本发明亦提供一种人物缩图序列产生方法，其包括一视频接收步骤、一译码步骤、一视频撷取步骤以及一人物缩图序列产生步骤。在本发明中，视频接收步骤先接收原视频数据，接着译码步骤译码原视频数据以取得视频数据，然后视频撷取步骤依据人物图象撷取方法撷取关键画面，最后人物缩图序列产生步骤依据关键画面产生人物缩图序列。

换言之，本发明的人物缩图序列产生方法，包含：一视频接收步骤，其接收一视频数据；一译码步骤，其译码该原视频数据以取得一视频数据；一视频撷取步骤，其依据一人物图象撷取方法自该视频数据中撷取一关键画面；一图象处理步骤，其在撷取该关键画面后，针对所撷取的该关键画面进行图象处理；以及一缩图序列产生步骤，其依据所撷取并图像处理后的该关键画面产生一缩图序列。

另外，本发明的人物缩图序列产生方法还包括一图象处理步骤，图象处理步骤于撷取关键画面后，针对所撷取的关键画面进行图象处理。

由于本发明的人物缩图序列产生系统与方法能够自动分析视频，并自动撷取符合需求的图象，因此能够有效率地产生所需的人物缩图序列。

附图说明

以下将参照相关附图，说明本发明较佳实施例的人物缩图序列产生系统与方法，其中相同的组件将以相同的参照符号加以说明。

图1为一示意图，显示依本发明较佳实施例的人物缩图序列产生系统的结构；

图2为一流程图，显示依本发明较佳实施例的人物缩图序列产生方法的流程；

图3为一示意图，显示于本发明较佳实施例的人物缩图序列产生方法中撷取关键画面的示意图；

图4为一示意图，显示依本发明较佳实施例的相异脸孔图象馆的数据储存结构的示意图。

图中符号说明：

101 视频接收装置

102 译码装置

103 视频撷取装置

104 图象处理装置

105 人物缩图序列产生装置

106 撷取方法选择装置

2 人物缩图序列产生方法

201～207 人物缩图序列产生方法的流程

301 单张图象

302 关键画面

40 原视频数据

41 视频数据

411 音频数据

412 图象数据

50 人物图象撷取方法

501 音频分析算法则

502 镜头变换分析算法则

503 脸孔检测分析算法则

60 计算机设备

601 信号源接口

602 内存

603 中央处理单元

604 输入装置

605 储存装置

70 人物缩图序列

8 相异脸孔图象馆

80 数据表格

81 第一图象信息

811 第一脸部特征组合

812 第一位置信息

813 第一指针

82 第二图象信息

821 第二脸部特征组合

822 第二位置信息

823 第二指针

A 指针A

B 指针B

C 指针C

D 指针D

具体实施方式

请参照图1所示，本发明较佳实施例的人物缩图序列产生系统包括一视频接收装置101、一译码装置102、一视频撷取装置103、一图象处理装置104、一人物缩图序列产生装置105以及一撷取方法选择装置106。

在本实施例中，人物缩图序列产生系统可以应用于一计算机设备60中，而计算机设备60可以是现有的计算机装置，其包括一信号源接口601、一内存602、一中央处理单元(CPU)603、一输入装置604以及一储存装置605。其中，信号源接口601与一信号源输出装置或是一信号源纪录装置连接，例如是光驱、FireWire(IEEE 1394 Interface)、通用串行端口(USB)等接口装置，而信号源输出装置例如是数字摄影机，信号源纪录装置例如是VCD、DVD等。内存602可以是DRAM或EEPROM等任何一种或多种设置于计算机装置中的暂存内存。中央处理单元603则可采用任何一种现有的中央处理器架构，例如，包括ALU、缓存器与控制器等，以进行各种数据的处理与运算，以及控制计算机设备60中各组件的工作。输入装置604可以是鼠标、键盘等能够由使用者自行输入讯息，或是操作各软件装置的装置。储存装置605可以是硬盘机、软盘机等任何一种或多种计算机可读取的数据储存装置。

本实施例中的各装置是指储存于储存装置605中或是一纪录媒体中的软件装置。中央处理单元603在读取各装置之后，即可经由计算机设备60中的各组件来实现各装置的功能。然而需注意的是，本领域技术人员亦可将本实施例中所公开的软件装置制作成硬件，如ASIC(application-specific integrated circuit)芯片等，而不违反本发明的精神与范畴。

以下详细说明本实施例中各装置的功能。

在本实施例中，视频接收装置101接收一原视频数据40，译码装置102译码原视频数据40以取得一视频数据41，撷取方法选择装置106提供给一使用者选取所需的一人物图象撷取方法50，视频撷取装置103则依据人物图象撷取方法50自视频数据41中撷取至少一关键画面302，然后，图象处理装置104针对视频撷取装置103所撷取的关键画面302进行图象处理；最后，人物缩图序列产生装置105依据经过图象处理的关键画面302产生一人物缩图序列70。

如上所述，视频接收装置101与信号源接口601配合，例如，视频接收装置101可以通过FireWire(IEEE 1394 Interface)取得储存于数字摄影机中的原视频数据40，或是通过光驱取得记录于VCD、DVD中的原视频数据40。原视频数据40是由各种视频撷取装置或接收装置如数字摄影机、电视卡、机上盒等，以及各种视频储存装置如DVD、VCD所储存、传送、广播(Broadcasting)或接收的视频，且其能够以各种视频数据格式(如MPEG-1，MPEG-2，MPEG-4，AVI，ASF，MOV等)储存、传送、广播或接收。

译码装置102能够针对输入的原视频数据40的视频格式、编码方式、或压缩方式进行译码转换还原为编码前的数据或近似于编码前的数据，例如，若编码方式采用失真压缩方式(Lossy Compression)，则译码后只能够取得近似于编码前的数据，以便产生一视频数据41。在本实施例中，视频数据41包括一音频数据411以及一图象数据412。音频数据411为视频数据41中所播放的声音；图象数据412为视频数据41所显示的所有单张图象，通常每秒钟的视频数据41是由25张单张图象或29.97张单张图象连续播放所构成。本实施例中以小时:分:秒:画面，来表示每一画面相对于视频数据41的位置信息；例如，01:11:20:25为视频数据41第1小时第11分20秒的第25个画面。

撷取方法选择装置106与输入装置604配合，以便使用者能够利用输入装置604于撷取方法选择装置106中选取所需的人物图象撷取方法50。依本实施例所提供的人物图象撷取方法50会依据使用者输入的选项设定信息(Preference)，决定是否要利用音频分析算法则501与镜头变换分析算法则502，作为视频数据进行脸孔检测分析算法则503的前处理程序。音频分析算法则501与镜头变换分析算法则502的处理程序会精简并减少进行脸孔检测分析算法则503的视频数据量。

音频分析算法则501是分析视频数据41的音频数据411，以筛选音频数据411中具有人声的音频数据片段及其对应图象数据片段。因此能将非人声的音频数据片段(如噪音、静音)及其对应图象数据片段，分离不进行脸孔检测分析算法则的处理。

音频分析算法则501利用特征抽取(Features Extraction)与特征匹配(Features Matching)方式进行分析，将人物角色的声音区分并分类。音频数据411的特征包括如频谱特征(Spectral Features)、音量(Volume)、零轴交会率(Zero Crossing Rate)、音调(Pitch)等。如上所述，当抽取频谱特征(Spectral Features)后，其经由杂音衰减(Noise Reduction)、分段(Segmentation)，并利用快速傅利叶转换(Fast Fourier Transform)将音频数据411转至频率域(Frequency)，然后由一组频率滤波器(Filters)进行特征值抽取，这组特征值组成一个频谱特征向量(Spectral FeatureVector)。音量是容易测量的一种特征，其可利用均方根值(RMS，RootMean Square)代表其特征值，然后由音量(Volume)分析可辅助分段(Segmentation)的进行，亦即通过静音检测(Silence Detection)帮助音频数据411段落边界(Boundaries)的决定。零轴交会率(Zero Crossing Rate)为计算每段(Clips)声音波形(Waveform)与零轴(Zero Axis)交会的次数。音调(Pitch)为声音波形(Waveform)的基频(Fundamental Frequency)。因此，音频数据411可利用上述的音频特征及其特征值所组成的特征向量(Feature Vector)与人声音频样本(Audio templates)的特征进行分析比对，进行分析比对，以便取得所需具有人声的音频数据片段及其对应图象数据片段。

镜头变换分析算法则502是分析视频数据41中图象数据412的镜头变换，并筛选视频数据41中图象数据412中每个镜头变换后的第一个画面，作为进行脸孔检测分析算法则503的图象数据。镜头变换分析算法则502所分析的图象数据412可为经过音频分析算法则501筛选后具有人声的音频数据所对应的图象数据412或未经音频分析算法则501处理的视频数据41中的图象数据412。

一般而言，视频数据41为一视频串行(Video Sequence)，其通常由许多场景(Scenes)所组成，而每一场景又由多个镜头变换(Shots)所组成。在影片中的最小单位是一个镜头变换，而影片便是由许多的镜头变换所堆砌起来的。通常，一个镜头由多个视觉特性(如色彩(Color)、纹理(Texture)、形状(Shape)、动作(Motion))具一致性的画面(Frames)所组成，并且，其是依据摄影机运动方向(Camera Direction)与摄影取景角度(ViewAngle)的改变而有变化，例如，当摄影机以不同的摄影取景角度来拍摄同一场景时，会产生不同的镜头变换，或以相同的摄影取景角度但拍摄不同的区域时，亦会产生不同的镜头变换。由于镜头变换可由一些基本视觉特性而区分，因此将视频数据41分割成多个连续的镜头变换是相当容易达成的，此技术主要由分析一些基本视觉特性的统计数据如视觉特性柱状图(Histogram)，因此，当一画面的视觉特性与前一画面的视觉特性差异达到某一程度时，就可在此画面与前一画面间作一分割并视作为镜头变换，在本实施例中，可以挑选此镜头变换后的第一个画面作为进行脸孔检测分析算法则503的图象数据。

脸孔检测分析算法则503利用脸孔检测(Face Detection)，脸孔辨识(Face Recognition)技术寻找视频数据41中具有相异脸孔特征的视频画面以作为关键画面302。脸孔检测分析算法则503所分析的图象数据412可为经过音频分析算法则501或镜头变换分析算法则502筛选后的图象数据412，或未经过音频分析算法则501或镜头变换分析算法则502筛选后的图象数据412。

在本实施例中，利用相异脸孔图象馆8以数据表格80储存具有相异脸孔的图象信息、该相异脸孔图象的脸部特征组合及图象的位置信息，并以数据链接串行储存与该相异脸孔图象具有相同脸部特征的图象的位置信息。如图4所示，其显示于相异脸孔图象馆8中所储存的数据，例如，在数据表格80的第一列中，储存具有一第一脸孔的一第一图象信息81、表示第一脸孔的一第一脸部特征组合811、第一图象的一第一位置信息812，以及链接至具有第一脸孔的其它图象的多个第一指针(pointer)813，例如指针A、指针B、指针C、指针D等等。依此类推，在数据表格8的第二列中，储存具有一第二脸孔的一第二图象信息82、表示第二脸孔的一第二脸部特征组合821、第二图象的一第二位置信息822，以及链接至具有第二脸孔的其它图象的多个第二指针823。

在本实施例中，先将输入的图象数据412，经脸孔检测(FaceDetection)技术筛选具有脸孔画面的图象后，针对具有脸孔画面的图象，检测脸部特征，将第一张具有脸孔画面的图象、及其脸部特征组合与图象的位置信息存入“相异脸孔图象馆”，当再检视其它具有脸孔画面的图象时，将其图象中脸部特征组合与“相异脸孔图象馆”中存盘的脸部特征组合进行比对，若该张图象的脸部特征组合与已存入“相异脸孔图象馆”中存盘的脸部特征组合相同则该张图象被淘汰，并将此被淘汰的图象的位置信息储存于“相异脸孔图象馆”中特征组合相同的图象所对应的数据链接串行中，若该张图象的脸部特征组合与所有已存入“相异脸孔图象馆”中存盘的脸部特征组合相异，则该张图象及其脸部特征组合与图象的位置信息存入“相异脸孔图象馆”，如此将输入的图象数据412一一完成脸孔辨识比对。最后存于“相异脸孔图象馆”的图象则为本实施例中所筛选的关键画面302。目前最常被用来做脸孔辨识的方法的一就是主要元素分析(Principal Component Analysis，PCA)，以此方法所建立的脸孔辨识器通常称为特征脸(Eigenface)辨识系统。

视频撷取装置103可以是储存在储存装置605的一软件装置，并配合中央处理单元603的运算，依据本实施例所提供的人物图象撷取方法50，分析比对视频数据41中的图象，进而撷取合乎人物图象撷取方法50的关键画面302。

图象处理装置104可以是储存在储存装置605的一软件装置，并通过中央处理单元603的运算，以便针对所撷取的关键画面302进行图象处理，例如调整图象大小(Rescaling)等图象处理(Image processing)功能。

人物缩图序列产生装置105可以是储存在储存装置605的一软件装置，并通过中央处理单元603的运算，将经过图象处理的关键画面302整合汇出，以产生人物缩图序列70。

另外，所产生的人物缩图序列70可以储存在储存装置605中，而所储存的数据包括人物缩图序列70的串行头(Head)、各关键画面302(或缩图)的链接串行(Linked List)或指针(Pointer)等。

为使本发明的内容更容易理解，以下将举一实例，以说明依本发明较佳实施例的人物缩图序列产生方法的流程。

请参照图2所示，在依本发明较佳实施例的人物缩图序列产生方法2中，步骤201接收原视频数据40，例如，可以将数字摄影机中纪录的数据经由传输线送至信号源接口601，以提供作为产生人物缩图序列70的画面与内容。

在步骤202中，译码装置102辨识原视频数据40的格式并译码原视频数据40以产生经过译码的视频数据41，例如，原视频数据40为Interlaced MPEG-2格式，亦即是，一个讯框是由两个讯场(field)所组成，所以，在此步骤中，可以先进行MPEG-2格式的译码，然后利用内插法(Interpolation)解交错以得到视频数据41。

在步骤203中，视频撷取装置103依据使用者由输入装置604输入的选项设定信息，执行于撷取方法选择装置106中选取的人物图象撷取方法50来撷取关键画面302，亦即，由使用者决定是否要利用音频分析算法则501与镜头变换分析算法则502，作为视频数据进行人物角色的脸孔检测分析算法则503的前处理程序。针对视频数据41的每一视频画面与内容(包含音频内容)，进行分析搜寻并筛选取得符合人物图象撷取方法50的关键画面302。需注意的是，本实施例可以撷取出多张的关键画面302。如图3所示，原视频数据40经过译码后会得到视频数据41，其包括多张单张图象301(每秒25张或29.97张)，而经过依据人物图象撷取方法50的分析搜寻后会从该单张图象301中撷取出至少一关键画面302。

步骤204是判断是否已经完成视频数据41中所有内容的分析比对，当未完成视频数据41中所有内容的分析比对时，重复进行步骤203；当完成视频数据41中所有内容的分析比对时，进行步骤205。

在步骤205中，图象处理装置104依据于步骤203中取得的关键画面302，针对缩图图框的分辨率(Resolution)、大小(Size)来进行图象处理(Image Processing)，例如调整图象大小的处理程序。

在步骤206中，人物缩图序列产生装置105整合经过图象处理的关键画面302以产生人物缩图序列70。例如，所撷取出的关键画面302经过调整大小之后，人物缩图序列产生装置105将其依序排列于一窗口中，并且，当图象数超过一窗口所能够显示的数量时，利用滚动条(Scroll bar)方式提供给使用者进行人物缩图序列70的浏览。

又，关键画面302可以是如图4所示的第一图象信息81、第二图象信息82等等，因此，所产生的人物缩图序列70显示在视频数据41中所有相异脸孔的图象，其可以代表视频数据41中所有出场人物的缩图序列。另外，关键画面302可以是如图4所示的第一图象信息81及具有第一脸孔的其它图象，因此，所产生的人物缩图序列70显示在视频数据41中所有具有第一脸孔的图象，其可以代表视频数据41中具有第一脸孔的人物的缩图序列。除此之外，具有第一脸孔的图象的关键画面302还可以汇整为一特定人物的专辑视频数据，其可以视作为具有第一脸孔的特定人物的个人专辑。

最后，步骤207是在储存装置605中储存人物缩图序列70，并且以程序定义的数据结构如链接串行来储存。其中，链接串行的串行头将包含人物缩图序列70的文件名称等信息，每一节点将包含一人物缩图的信息(人物缩图图象数据或人物缩图图象的指针)以及与前(后)节点的链接(Link)信息。

综上所述，由于依本发明较佳实施例的人物缩图序列产生系统与方法能够自动分析视频数据，并针对视频数据的音频数据及图象数据，来整合视频内容分析、音频分析、脸孔检测、脸孔辨识等技术，以产生人物缩图序列，所以能够有效率地利用视频数据来产生所需的人物缩图序列。

另外，在利用本发明实施例中人物缩图序列产生系统与方法时，若使用者产生人物缩图序列的选项设定(Preference)未选择音频分析算法则501及镜头变换分析算法则502进行筛选，则使用者可挑选人物缩图序列中的缩图，并由“相异脸孔图象馆”中该缩图对应的相异脸孔的图象及其对应的数据链接串行(其储存与该人物缩图图象具有相同脸部特征的图象的位置信息)取得视频中具有相同脸部特征的图象，进行批次(Batch)的视频编辑或图象编辑，删除或取代所有该相同脸部特征的图象，图象强化(Enhancement)加入视频特效(Effect)、亮度、色彩调整等处理工作。

若使用者产生人物缩图序列的选项设定有选择音频分析算法5501或镜头变换分析算法则502进行筛选，则使用者可挑选人物缩图序列中的缩图，并由“相异脸孔图象馆”中该缩图对应的相异脸孔的图象及其对应的数据链接串行取得被音频分析算法则501或镜头变换分析算法则502筛选后具有相同脸部特征的图象，进行批次的视频编辑或图象编辑，删除或取代所有该相同脸部特征的图象，图象强化、加入视频特效、亮度、色彩调整等处理工作。

例如，可以依批次的方式将所有具有相同脸部特征的图象合并为此特定人物的个人视频剪辑，而且可以由使用者手动通过图象处理装置104对所选取出的个人视频剪辑作视频编辑或图象编辑，如删除或取代所有该相同脸部特征的图象、进行图象强化、加入视频特效、或调整图象亮度、色彩等处理工作。

以上所述仅为举例性，而非为限制性。任何未脱离本发明的精神与范畴，而对其进行的等效修改或变更，均应包含本专利的保护范围中。

Claims

1、一种人物缩图序列产生系统，包含：

一视频接收装置，其接收一原视频数据；

一译码装置，其译码该原视频数据以取得一视频数据；

一视频撷取装置，其依据一人物图象撷取方法自该视频数据中撷取一关键画面；

一图象处理装置，其于撷取该关键画面后，针对所撷取的该关键画面进行图象处理；以及

一人物缩图序列产生装置，其依据所撷取并图像处理后的该关键画面产生一人物缩图序列。

2、根据权利要求1所述的人物缩图序列产生系统，其特征在于：还包含：

一撷取方法选择装置，其接受一使用者的选择以提供该人物图象撷取方法。

3、根据权利要求1所述的人物缩图序列产生系统，其特征在于：该人物图象撷取方法包含一脸孔检测分析算法则，其分析该视频数据中具有脸孔特征的一图象数据，该视频撷取装置依据该脸孔检测分析算法则从该图象数据中撷取该关键画面。

4、根据权利要求3所述的人物缩图序列产生系统，其特征在于：该视频撷取装置是依据该脸孔检测分析算法则撷取具有相同的脸孔特征的该图象数据以作为该关键画面。

5、根据权利要求4所述的人物缩图序列产生系统，其特征在于：该人物缩图序列为一特定人物的缩图序列。

6、根据权利要求5所述的人物缩图序列产生系统，其特征在于：还依据该特定人物的缩图序列产生该特定人物的专辑视频数据。

7、根据权利要求3所述的人物缩图序列产生系统，其特征在于：该视频撷取装置是依据该脸孔检测分析算法则撷取具有相异的脸孔特征的该图象数据以作为该关键画面。

8、根据权利要求3所述的人物缩图序列产生系统，其特征在于：该人物图象撷取方法还包含一音频分析算法则，其分析该视频数据中的一音频数据，该视频撷取装置是依据该音频分析算法则筛选具有人声的该音频数据所对应的该图象数据，然后依据该脸孔检测分析算法则从该图象数据中撷取该关键画面。

9、根据权利要求3所述的人物缩图序列产生系统，其特征在于：该人物图象撷取方法还包含一镜头变换分析算法则，其是分析该视频数据中一图象数据的镜头变换，该视频撷取装置是依据该镜头变换分析算法则筛选该图象数据，然后依据该脸孔检测分析算法则从该图象数据中撷取该关键画面。

10、一种人物缩图序列产生方法，包含：

一视频接收步骤，其接收一视频数据；

一译码步骤，其译码该原视频数据以取得一视频数据；

一视频撷取步骤，其依据一人物图象撷取方法自该视频数据中撷取一关键画面；

一图象处理步骤，其在撷取该关键画面后，针对所撷取的该关键画面进行图象处理；以及

一缩图序列产生步骤，其依据所撷取并图像处理后的该关键画面产生一缩图序列。

11、根据权利要求10所述的人物缩图序列产生方法，其特征在于：还包含：

一撷取方法选择步骤，其接受一使用者的选择以提供该人物图象撷取方法。

12、根据权利要求10所述的人物缩图序列产生方法，其特征在于：该人物图象撷取方法包含一脸孔检测分析算法则，其分析该视频数据中具有脸孔特征的一图象数据，该视频撷取步骤依据该脸孔检测分析算法则从该图象数据中撷取该关键画面。

13、根据权利要求12所述的人物缩图序列产生方法，其特征在于：该视频撷取步骤是依据该脸孔检测分析算法则撷取具有相同的脸孔特征的该图象数据以作为该关键画面。

14、根据权利要求13所述的人物缩图序列产生方法，其特征在于：该人物缩图序列为一特定人物的缩图序列。

15、根据权利要求14所述的人物缩图序列产生方法，其特征在于：还依据该特定人物的缩图序列产生该特定人物的专辑视频数据。

16、根据权利要求12所述的人物缩图序列产生方法，其特征在于：该视频撷取步骤是依据该脸孔检测分析算法则撷取具有相异的脸孔特征的该图象数据以作为该关键画面。

17、根据权利要求12所述的人物缩图序列产生方法，其特征在于：该人物图象撷取方法还包含一音频分析算法则，其分析该视频数据中的一音频数据，该视频撷取步骤是依据该音频分析算法则先筛选具有人声的该音频数据所对应的该图象数据，然后依据该脸孔检测分析算法则从该图象数据中撷取该关键画面。

18、根据权利要求12所述的人物缩图序列产生方法，其特征在于：该人物图象撷取方法还包含一镜头变换分析算法则，其是分析该视频数据中一图象数据的镜头变换，该视频撷取步骤是依据该镜头变换分析算法则筛选该图象数据，然后依据该脸孔检测分析算法则从该图象数据中撷取该关键画面。