TW544634B

TW544634B - Thumbnail sequence generation system and method

Info

Publication number: TW544634B
Application number: TW090124776A
Authority: TW
Inventors: Watson Wu; Ray Huang
Original assignee: Newsoft Technology Corp
Priority date: 2001-10-05
Filing date: 2001-10-05
Publication date: 2003-08-01
Also published as: US20030068087A1

Description

544634 五、發明說明α) 【發明領域】本發明係關於一種人物縮圖序列產生系統與方法，特別關於一種利用一電腦軟體來分析一視訊（V i deo )内容以自動產生人物縮圖序列（T h u in b n a i 1 S e q u e n c e )的系統與方法。【習知技術】一般而言，視訊是連續輸出的單張影像，例如，在 NTSC標準中，其撥放一秒鐘可能是包含2 9. 9 7張影像的連續切換，而在PAL標準中，其撥放一秒鐘可能是包含25張影像的連續切換，當使用者檢視該等影像時，最大的問題就是該等影像的數量實在太多，以NTSC標準為例，一分鐘的視訊就包括了將近1 8 0 0張影像，以此類推，使用者必須檢視將近二萬張的影像，才能檢視完1 0分鐘的視訊中的所有影像，因此，當使用電腦軟體來編輯視訊内容時，常常僅就視訊内容之第一張影像代表該視訊，部份電腦軟體為了方便使用者更容易對該視訊内容有所了解，以利視訊編輯之進行，常會以縮圖序列的方式顯示該視訊之部份影像，然而其挑選該視訊中部份影像之方法，目前有挑選拍攝曰期不同或時間不連續之第一張影像，或每隔一時間間隔後挑選一張影像，或分析視訊内容挑選鏡頭變換不同之第一張影像，以及以人工方式挑選影像等方法。當視訊内容為一生活剪影、MTV、戲劇、影片或影集時，人物通常為該視訊内容之主角，因此以人物角色縮圖

544634 五、發明說明（2) 序列來代表視訊’能夠知:供使用者快速檢視於生活剪景；、 MTV、戲劇、影片或影集中之人物角色之影像，尤其該~等影像對使用者來說是有意義且具代表性的。麸而a …、叩，目月丨j並未有就視訊内容之人物角色挑選視訊之部份影像產生縮圖序列，因此，如何自動挑選該視訊中有意義且具代表=: 人物影像晝面並產生縮圖序列以代表該視訊正是當前一個重要的課題。田，【發明概要】針對上述問題’本發明之目的為提供一種能夠有效率地分析視訊，並且產生所需之人物縮圖序列的人物縮圖列產生系統與方法。為達上述目的，依本發明之人物縮圖序列產生系統包括一視訊接收模組、一解碼模組、一視訊擷取模組以及2 人物縮圖序列產生模組。在本發明中，視訊接收模組接收一原視訊資料，而解碼模組將原視訊資料解碼成為一視气 ^料，然後視訊擷取模組依據一人物影像擷取方針自視^ 資料中操取至少一關鍵晝面（key frame)，最後由人物縮圖序列產生模組依據所擷取之關鍵畫面產生一人物縮 /承上所述，依本發明之人物縮圖序列產生系統更包人一影像處理模組，其於擷取關鍵晝面後，針對所擷取二鍵晝面進行影像處理。符本發明之人物縮圖序列產生系統更包含一擷取方針選

第5頁 544634 五、發明說明（3) 擇板組’其接受一使用者之選擇以提供人物影像擷取方針。本發明亦提供一種人物縮圖序列產生方法，其包括一視訊接收步驟、一解碼步驟、一視訊擷取步驟以及一人物备百圖序列產生步驟。在本發明中，視訊接收步驟先接收原視訊資料，接著解碼步驟解碼原視訊資料以取得視訊資料’然後視訊擷取步驟依據人物影像擷取方針擷取關鍵晝面’最後人物縮圖序列產生步驟依據關鍵晝面產生人物縮圖序列。另外，依本發明之人物縮圖序列產生方法更包括一影像處理步驟，影像處理步驟於擷取關鍵晝面後，針對所擷取之關鍵晝面進行影像處理。由於依本發明之人物縮圖序列產生系統與方法能夠自動分析視訊，並自動擷取符合需求之影像，因此能夠有效率地產生所需之人物縮圖序列。【較佳實施例之詳細說明】以下將參照相關圖式，說明依本發明較佳實施例之人物縮圖序列產生系統與方法，其中相同的元件將以相同的參照符號加以說明。請參照圖1所示，依本發明較佳實施例之人物縮圖序列產生系統包括一視訊接收模組丨Q 1、一解碼模組1 〇 2、一視訊擷取模組103、一影像處理模組1〇4、一人物縮圖序列產生模組1 0 5以及一擷取方針選擇模組1 〇 6。

544634 五、發明說明（4) 在本實施例中，人物縮圖序列產生系統可以應用於一電腦设備6 0中’而電腦設備β 〇可以是習知的電腦裝置，豆包括一訊號源介面6 〇 1、一記憶體6 〇 2、一中央處理單元八 (CPU) 603、一輸入裝置6〇4以及一儲存裝置6〇5。其中，訊號源介面601係與一訊號源輸出裝置或是一訊號源紀錄裝置連接，例如是光碟機、FireWire (IEEE 1394

Interface )、通用序列埠（USB )等介面裝置，而訊號源輸出裝置例如是數位攝影機，訊號源紀錄裝置例如是 ▽ 00、0¥0等。記憶體6〇2可以是])1^^1或££?1^(^等任何一種或數種設置於電腦裝置中的暫存記憶體。中央處理單元 6 0 3則可採用任何一種習知之中央處理器架構，例如， MLU、暫存器與控制器等，以進行各種資料之處理與運异，以及控制電腦設備60中各元件的作動。輸入裝置6〇4 可以是滑鼠、鍵盤等能夠由使用者自行輸入訊息，作各軟體模組的裝置。儲存裝置6〇5可以是硬碟貞、軟卞機等任何一種或數種電腦可讀取之資料儲存裝置。 ” 本實施例中的各模組係指儲存於儲存裝置6〇5中或一紀錄媒體中的軟體模組。中央處理單元6〇3於讀取組之後，即可經由電腦設備6 〇巾的夂一从七— 供姑二兩、★立& ▲ 1有bU中的各兀件來實現各模組的 ^“ ^二思，，熟習該項技術者亦可將本實施例中所揭路之軟體模組製作成硬體，如Μ I〔 ^PPllcation-speciflc lntegrated 士…㈠晶片荨，而不違反本發明之精神與範脅。以下詳細說明本實施例中各模組之功能。

544634 五、發明說明（5) 在本實施例中，視訊接收模組1 0 1接收一原視訊資料 40，解碼模組1 02解碼原視訊資料4〇以取得一視訊資料 4 1 ’擷取方針選擇模組1 〇 6提供給一使用者選取所需之一人物影像擷.取方針50，視訊擷取模組丨03則依據人物影像擷取方針5 0自視訊資料4 1中擷取至少一關鍵晝面3 〇 2，然後’影像處理模組1 〇 4針對視訊擷取模組丨〇 3所擷取的關鍵晝面3 0 2進行影像處理；最後，人物縮圖序列產生模組1 〇 5 依據經過影像處理的關鍵晝面3 〇 2產生一人物縮圖序列 70。 ' 視訊接收模組1 01與訊號源介面6〇 1配合如上所述例如，視訊接收模組1〇1可以透過FireWire(IEEE 13以 Interface)取得儲存於數位攝影機中的原視訊資料4〇，或是透過光碟機取得記錄於VCD、DVD中的原視訊資料4〇。原視訊資料40係由各種視訊擷取裝置或接收裝置如數位攝影機電視卡、機上盒等，以及各種視訊儲存裝置如D V D、 vC=儲存、傳送、廣播（Br〇adeasting)或接收的視訊， ”月b夠以各種視訊資料格式（如評肋—丨，評eg —2 MPEG= AVI’ ASF，謂等）儲存、傳送、廣播或接收。式、=Γ02能夠針對輸入的原視訊資料4°之視訊格 m !縮方式進行解碼轉換還原為編碼前之壓縮；气(:於編：刖之資料，例^，若編碼方式採用失真 ^ 細方式（Lossy Compressi〇n)，則解似於編石馬前之資料，以# “ J解碼後”月匕夠取得近中，視訊二咖1。在本實施例貝付匕括曰訊貧料411以及一影像資料。五、發明說明（6) 音訊資料41 1為視訊資料41中所撥放為視訊資料41所顯示的所有單涤曰，影像資料412 資料41係由25張單張影像或2 9 9丫 ’通旦常每秒鐘的視訊構成。本實施例中以小時：分:7/早查張景“象麵^ 面相對於視訊資料41之位置資m广:面’來表示每一晝 ^ 貝 σΚ ’例如，0 1 : 1 1 · 9 η . 9 g 為視訊資料41第1小時第U分2〇秒的第25個 .. :取方針選擇模組106與輸入裝置6〇4配-合，以便使用者肖b夠利用輸入裝置6 〇 4於擷取方釙撰煜y f ^ A ^ ^ 5 0 〇 1 ° 6 ^ ^ ^ 擷取方針5 0會依據使用者輸入之選項設定笊的人物衫像 (pre”rence)，決定是否要利用音訊‘析演S 鏡分析演算法則5 0 2’作為視訊資料進行臉孔偵測二析々鼻法則50 3的前處理程序。音訊分析演算法則5〇1血鏡頭變換分析演算法則5 〇 2的處理程序會精簡並減少進行' 臉孔偵測分析演算法則5 0 3的視訊資料量。曰汛为析廣异法則5 〇 1係分析視訊資料4丨的音訊資料 411，以篩選音訊資料411中具有人聲之、對應影像資料片段。因此能將非人聲之音訊資料片段（如、 _ °喿音、靜音）及其對應影像資料片段，分離不進行臉孔偵測分析演算法則之處理。、音訊分析演算法則501利用特徵抽取（Features Extraction)與特徵匹配（Features Matching)方式進行分析’將人物角色之聲音區分並分類。音訊資料4 1 1之特徵包括如頻譜特徵（Spectral Features)、音量（Volume)、

544634 五、發明說明（7) 零軸交會率（Zero Crossing Rate)、音調（Pitch)等。如上所述，當抽取頻譜特徵（S p e c t r a 1 F e a t u r e s )後，其經由雜音衰減（Noise Reduction)、分段（Segmentation)，

並利用快速傅利葉轉換（Fast Four ier Transform)將音訊資料411轉至頻率域（Frequency)，然後由一組頻率濾波器 (Fi Iters)進行特徵值抽取，這組特徵值組成一個頻譜特徵向量（Spectral Feature Vector)。音量是容易量測之一種特欲’其可利用均方根值（RMS，Root Mean Square) 代表其特徵值，然後藉由音量（Volume)分析可輔助分段 (Segmentation)之進行，亦即透過靜音债測（silence Detection)幫助音訊資料411段落邊界（B〇undaries)之決疋。零軸父會率（Zero Crossing Rate)為計算每段 (Clips)聲音波形（Waveform)與零軸（Zero Axis)交會之次數。a ό周（Pitch)為聲音波形（Waveform)的基頻 (Fundamental Frequency)。因此，音訊資料411可利用上述之音訊特徵及其特徵值所組成之特徵向量（1^31：111^ Vector)與人聲音訊樣本（Audi〇 templates)之特徵進行分析比對’進行分析比對，以便取得所需具有人聲之音訊資料片段及其對應影像資料片段。

—鏡頭變換分析演算法則5 〇 2係分析視訊資料4丨中影像貢料412的鏡頭變換，並篩選視訊資料41中影像資料41 2中，個鏡頭變換後的第一個晝面，作為進行臉孔偵測分析演异法則5 0 3的影像資料。鏡頭變換分析演算法則5 〇 2所分析的影像資料4 1 2可為經過音訊分析演算法則5 〇 1篩選後具有

第10頁 544634

士聲之音訊資料所對應的影像資料412或未經音訊分析演异法則5 0 1處理之視訊資料4丨中之影像資料4丨2。一般而言，視訊資料41為一視訊串列（Vide〇 Sequence)，其通常由許多場景（Scenes)所組成，而每一場景又由複數個鏡頭變換（Sh〇ts)所組成。在影片中的最小單位是一個鏡頭變換，而影片便是由許多的鏡頭變換所堆砌起來的。通常，一個鏡頭由複數個視覺特性（如色彩 (Color)、紋理（Texture)、形狀（Shape)、動作（M〇ti〇^)

馨具一致性之晝面（Frames)所組成，並且，其係依據攝影機運動方向（Camera Directi on)與攝影取景角度（view Ang 1 e)的改變而有變化，例如，當攝影機以不同之攝影取景角度來拍攝同一場景時，會產生不同之鏡頭變換，或以相同之攝影取景角度但拍攝不同之區域時，亦會產，生不门之鏡頭變換。由於鏡頭變換可由一些基本視覺特性而區分，因此將視訊資料4 1分割成複數個連續的鏡頭變換是相當容易達成的，此技術主要藉由分析一些基本視覺特性之統計資料如視覺特性柱狀圖（Histogram)，因此，當—查面之視覺特性與前一晝面之視覺特性差異達到某一裎度$ 時，就可在此畫面與前一晝面間作一分割並視作為鏡^變換’在本實施例中，可以挑選此鏡頭變換後的第一個貪= 作為進行臉孔偵測分析演算法則5 0 3的影像資料。〜臉孔偵測分析演算法則5 0 3利用臉孔偵測（Faee Detection)，臉？L 辨識（Face Recognition) ^ ^ ^ ^ 資料4 1中具有相異臉孔特徵的視訊晝面以作為關鍵晝面°

第11頁 544634 五、發明說明（9) . 3 〇 2。臉孔偵測分析演算法則5 0 3所分析之影像資料4丨2可為經過音訊分析演算法則501或鏡頭變換分析演算法則5〇2 4選後之影像資料4 1 2 ’或未經過音訊分析演算法則5 }或鏡頭變換分析演异法則5 0 2師選後之影像資料4 1 2。' 在本實施例中’利用相異臉孔影像館8以資料表格8〇儲存具有相異臉孔之影像資訊、該相異臉孔影像的臉°部特徵組合及影像的位置資訊，並以資料鍊結串列儲存與該相異臉孔景> 像具有相同臉部特徵之影像的位置資訊。如圖4 所示，其顯示於相異臉孔影像館8中所儲存的資°料，口回如，於資料表格80的第一列中，.儲存具有一第 3^一 7資:二、表：第-臉孔的-第-臉部“組合 811、弟一衫像的一苐一位置資訊812，以及鍊社 -臉，之其他影像的複數個第一指標（ρ〇ιη。川有：如才曰Μ、指標B、指標C、指標D等等。依此類推，於表格8的第二列中’儲存具有一第二臉孔之像、:：第二！:。的一第二臉部特徵組合他影像的複指22標82^ ^ 對具有臉孔晝面之影像，伯、二有臉孔旦面之影像後，針丨孔畫面之影像、及其：部==，將第-張具有臉I·-”相異臉孔影像館”，告再扒、、σ /、衫像的位置資訊存入時，將其影像中臉有面之影像〃相異臉孔影像館”中存檔第12頁 544634 五、發明說明（l〇)

的臉邛特徵組合進行比對，若該A 已存入"相異臉孔影像館”中存：：：：：臉部特徵組合與張影像被淘汰，並將此被淘汰:=特徵組合相同則該相異臉孔影像館"中特徵組合相同~之马、位置資訊儲存於|，結串列中，若該張影像之臉部特且：所對應的資料鍊 ^ ^ ^ ^" t # ^ ^ ^ ^ ^ ^ 及其臉部特徵組合與影像的位^ 張影像館"，如此將輸入之影像資料412IlK = :異臉孔影像最後存於”相異臉孔影像館"之影 =:?辨識比對。之關鍵書面302。目tt a、<t象貝為本只鈿例中所篩選舒〜：别取常被用來做臉孔辨識的方法之— t 分析（Μη—1 —卿邮—Ws，— (Ε· /方法所建立的臉孔辨識器通常稱為特徵臉 (Eigenface)辨識系統。視訊擷取模組103可以是儲存在儲存裝置6〇5之一軟提：的f : ΐ中央處理單元6 〇3的運算，依據本實施例所― 物影像擷取方針5 0，分析比對視訊資料4 1中的与，進而擷取合乎人物影像擷取方針5 〇的關鍵晝面3 〇 2。^ 影·像處理模組1 〇4可以是儲存在儲存裝置6〇5之一軟· 杈組，並透過中央處理單元6〇3之運算，以便針對所擷取的關鍵畫面3 0 2進行影像處理，例如調整影像大小 (Rescaling)專影像處理（Image processing)功能。人物縮圖序列產生模組1〇5可以是儲存在儲存裝置6〇5 之一軟體模組，並透過中央處理單元6〇3之運算，將經過影像處理的關鍵晝面3 〇 2整合匯出，以產生人物縮圖序列 ΙΓί 第13頁 544634 五、發明說明（π) 70 〇另外，所產生的人物縮圖序列7 0可以儲存在儲存裝置 6 0 5中，而所儲存的資料包括人物縮圖序列7 〇之串列頭 (Head )、各關鍵晝面3 0 2 (或縮圖）之鍊結串列（Linked List)或指標（p〇inter)等。為使本發明之内容更容易理解，以下將舉一實例，以說明依本發明較佳實施例之人物縮圖序列產生方法的流程。請參照圖2所示，在依本發明較佳實施例之人物縮圖序列產生方法2中，步驟201接收原視訊資料4〇，例如，可以將數位攝影機中紀錄的資料經由傳輸線送至訊號源介面 6〇1 ’以提供作為產生人物縮圖序列7〇的晝面與内容。在步驟2 0 2中，解碼模組1〇2辨識原視訊資料4〇之格式並解碼原視訊資料4 〇以產生經過解碼之視訊資料4丨，例如’原視訊資料4 〇為I n t e r 1 a c e d Μ P E G - 2格式，亦即是，一個訊框係由兩個訊場（field )所組成，所以，在^步驟中，可以先進行MPEG-2格式的解碼，然後利用内插法/ (Interp〇latiori )解交錯以得到視訊資料41。彳梦罢ϋ驟203、中，視訊榻取模組103依據使用者藉由輸入 1^6中$ =入之選項設定訊息，執行於擷取方針選擇模組取的人物影像擷取方針5〇來擷 :變者決定是否要利用音訊分析演算法―:二一奐刀析决算法則5 0 2，作為視訊資料進行人物角色之臉孔债測分析演算法則5 0 3的前處理程序。針對視訊資料

第14頁 544634 五、發明說明（12) 41的每一視訊晝面與内容（包含音訊内容），進行分析搜尋並篩選取得符合人物影像擷取方針5〇的關鍵畫面30 2。需注意者，本實施例可以擷取出複數張的關鍵晝面3 0 2。如圖3所示，原視訊資料40經過解碼後會得到視訊資料4 1，其包括複數張單張影像301 (每秒25張或2 9.9 7張），而經過依據人物影像擷取方針5 〇的分析搜尋後會從該等單張影像3 0 1中擷取出至少一關鍵晝面3 〇 2。步驟204係判斷是否已經完成視訊資料41中所有内容的分析比對，當未完成視訊資料4 1中所有内容的分析比對時’重複進行步驟2 0 3 ;當完成視訊資料4 1中所有内容的分析比對時，進行步驟2 〇 5。在步驟2 0 5中，影像處理模組1〇4依據於步驟20 3中取得之關鍵晝面30 2，針對縮圖圖框的解析度（Res〇iuti〇n ) 大小（Size)來進行影像處理（image Processing )’例如調整影像大小之處理程序。在步驟2 0 6中’人物縮圖序列產生模組1 〇 5整合經過影像處理的關鍵晝面3 0 2以產生人物縮圖序列7 〇。例如，所掘取出的關鍵晝面3 02經過調整大小之後，人物縮圖序列產生模組1 0 5將其依序排列於一視窗中，並且，當影像數超過一視窗所能夠顯示的數量時，利用捲軸（Scr〇1丨bar )方式提供給使用者進行人物縮圖序列7 〇之瀏覽。又，關鍵畫面302可以是如圖4所示的第一影像資兮孔 81、第二影像資訊82等f ’因此，所產生的人物縮圖序列 70顯示在視訊資料4 1中所有相異臉孔的影像，其可以代表

第15頁 544634 五、發明說明（13) 視訊資料41中所有出場人物的縮 302可以是如圖4所示的第—影 :另外，關鍵晝面謝所有具有第縮；，顯示在視訊資中具有第-臉孔之人物的縮；：列其視訊卿臉孔之影像的關鍵晝面3 〇 2更敫' 卜，具有第一輯視訊資料，其可以視作為且第一正為一特定人物之專人專輯。，、有第一臉孔之特定人物的個最後’步驟2〇7係於儲存穿 70，並且以程式定義之資+ 中儲存人物縮圖序列中，鍊結串列如鍊結串列來餘存。其等資訊，备—Μ科故A I 3人物細圖序列7 0之檔案名稱像資料或人物:：L含一人物縮圖之資訊（人物縮圖影 =^ ί 0圖影像之指標）以及與前（後）節點的鍊結 (L1 n k)資訊。 :上所述，由於依本發明較佳實施例之人物縮圖序列生糸統與方法能夠自動分析視訊資料，並針對視訊資料之音訊資料及影像資料，來整合視訊内容分析、音訊分析、臉孔偵測、臉孔辨識等技術，以產生人物縮圖序列，所以此夠有效率地利用視訊資料來產生所需的人物縮圖序列0

另外’於利用本發明實施例中人物縮圖序列產生系統與方法時’若使用者產生人物縮圖序列之選項設定 (Preference)未選擇音訊分析演算法則5〇1及鏡頭變換分析演异法則5 0 2進行篩選，則使用者可挑選人物縮圖序列

第16頁 544634 五、發明說明（14) :之縮3 ’並藉由"相異臉孔影像館"中該縮圖對應的相显 =孔之衫像及其對應的賣料鍊結串列（其儲存與肖人物縮圖影像具有相同臉部特徵之影像的位置資訊）取得視吒中具有相同臉部特徵之影像，進行批次（Batch)的視訊編或影像編輯，刪除或取代所有該相同臉部特徵之影像，与像強化（Enhancement)加入視訊特效（Effect)、哀々彩調整等處理工作。〜又已、若使用者產生人物縮圖序列之選項設定有選析演算法則501或鏡頭變換分析演算法則5〇2進行篩‘：二，用者可挑選人物縮圖序列中之縮圖，並藉由"相昱孔衫像館"中該縮圖對應的相異臉孔二鍊結串列取得被音訊分析演算法則二頭= 二法則5G2筛選後具有相同臉部特徵之影像，進行視讯編輯或影像編輯，刪除或取^^ ^ ^ ^ ^ ^ ^ ^ 、影像，影像強化、加入視訊特效代；目，臉部特徵之工作。行双冗度、色彩調整等處理 f像=彳如泉Τ以依批次的方式將所有具有相同臉部特徵之二像δ併為此特定人物之個人視訊剪輯，而且者手動透過影像處理模組丨04對所選取由一使用作视訊編輯或影像編輯，如個人硯訊剪輯徵之影像、推；r旦/撞改儿 A取代所有該相同臉部特度、色彩等處理工作。 /周正衫像71：以上所述僅為舉例性，而非為限制性去本發明之精神與範疇，而對其 Y任何未脫離、^仃义寺效修改或變更，均第17頁 544634 五、發明說明（15) 應包含於後附之申請專利範圍中。

第18頁 544634 圖式簡單說明【圖式簡單說明】圖1為一示意圖，顯示依本發明較佳實施例之人物縮圖序列產生系統之結構。圖2為一流程圖，顯示依本發明較佳實施例之人物縮圖序列產生方法的流程。圖3為一示意圖，顯示於本發明較佳實施例之人物縮圖序列產生方法中擷取關鍵晝面的示意圖。

圖4為一示意圖，顯示依本發明較佳實施例之相異臉孔影像館之資料儲存結構的示意圖。【圖式符號說明】

101 視訊接收模組 102 解碼模組 103 視訊 #1 取模組 104 影像處理模組 105 人物縮圖序列產生模組 106 操取方針選擇模組 2 人物縮圖序列產生方法 201 〜207 人物縮圖序列產生方法之流程 301 單張影像 302 關鍵晝面 40 原視訊資料 41 視訊資料 411 音訊資料

第19頁 544634

第20頁

圖式簡單說明 412 影像資料 50 人物影像擷取方針 501 音訊分析演算法則 502 鏡頭變換分析演算法則 503 臉孔偵測分析演算法則 60 電腦設備 601 訊號源介面 602 記憶體 603 中央處理單元 604 輸入裝置 605 儲存裝置 70 人物縮圖序列 8 相異臉孔影像館 80 資料表格 81 第一影像資訊 811 第一臉部特徵組合 812 第一位置資訊 813 第一指標 82 第二影像資訊 821 第二臉部特徵組合 822 第二位置資訊 823 第二指標 A 指標A B 指標B 544634 圖式簡單說明 c 指標c

D 指標D

1_圓II 第21頁

Claims

544634 六、申請專利範圍 ---- 1、一種人物縮圖序列產生系統，包含：一視訊接收模組，其接收一原視訊資料；一解碼模組，其解碼該原視訊資料以取得一視气次料； °貝一視訊操取模組，其依據一人物影像擷取方針自7 訊資料中擷取一關鍵晝面（key frame );以及 ~視一人物縮圖序列產生模組，其依據所擷取之該面產生一人物縮圖序列。 f、旦 2、如申請專利範圍第1項所述之人物縮圖序列產味二人· 上恭統，更包含· 一影像處理模組，其於擷取該關鍵晝面後，針斜取之該關鍵晝面進行影像處理。 σ 3、如申請專利範圍第1項所述之人物縮圖序列產生系統，更包含：一擷取方針選擇模組，其接受一使用者之選擇以提供該人物影像操取方針。 4、如申請專利範圍第1項所述之人物縮圖序列產生系統，其中該人物影像擷取方針包含一臉孔偵測分析演算法則，其分析该視訊資料中具有臉孔特徵的一影像資料，該視訊擷取模組依據該臉孔偵測分析演算法則從該影像資料中擷取該關鍵晝面。

544634 六、申請專利範圍 5、如申請專利範圍第4項所述之人物縮圖序列產生系統，其中該視訊擷取模組係依據該臉孔偵測分析演算法則擷取具有相同之臉孔特徵的該影像資料以作為該關鍵晝面。‘ 6、如申請專利範圍第5項所述之人物縮圖序列產生系統，其中該人物縮圖序列為一特定人物之縮圖序列。 7、如申請專利範圍第6項所述之人物縮圖序列產生系統，更依據該特定人物之縮圖序列產生該特定人物之專輯視訊資料。 σ 8、如申請專利範圍第4項所述之人物縮圖序列產生系統，其中該視訊擷取模組係依據該臉孔偵測分析演算法則掏取具有相異之臉孔特徵的該影像資料以作為該關鍵畫面。 9、如申請專利範圍第4項所述之人物縮圖序列產生系統，其中該人物影像擷取方針更包含一音訊（aud i 〇 )分析演鼻法則，其分析該視訊資料中的一音訊資料，該視訊擷取模組係依據該音訊分析演算法則篩選具有人聲之該音訊資料所對應之該影像資料，然後依據該臉孔偵測分析演算法貝J k該影像資料中操取該關鍵晝面。 1 〇、如申請專利範圍第4項所述之人物縮圖序列產生系

第23頁 544634

統’其中該人物影像擷取方針p 、土則 ^ T更包含一鏡頭變換分析演算法則，其係分析該視訊資料中— 六、申請專利範圍 ^ τ ~影像資料的鏡頭變換，該視a掏取模組係依據該鏡頭變 -欠卜丨文狹分析演异法則篩選該影像貝料，然後依據該臉孔偵測分析、、# ’ 擷取該關鍵晝面。刀析决异法則以影像資料中種人物縮圖序列產生方法，包含·· 視汛接收步驟，其接收一視訊資料；解碼步驟，其解碼該原視訊資料以取得一視气資一視訊擷取步驟，其依據一人物影像擷取訊資料中擷取一關鍵晝面；以及万針自该視一縮圖序列產生步驟，其依據所擷取之該生一縮圖序列。刚鍵晝面產 1 2、如申請專利範圍第丨丨項所述之人物縮圖序法，更包含：」座生方一影像處理步驟，其於擷取該關鍵晝面後，取之孩關鍵晝面進行影像處理。、、口 13、如申請專利範圍第11項所述之人物縮圖序列產生法，更包含：力人物=㈡步驟’其操受一使用者之選擇犧

544634 六、申請專利範圍 1 4、如申請專利範圍第1 1項所述之人物縮圖序列產生方法，其中該人物影像擷取方針包含一臉孔偵測分析演算法則，其分析該視訊資料中具有臉孔特徵的一影像資料了兮視訊擷取步驟依據該臉孔偵測分析演算法則從該影像資料中榻取該關鍵晝面。 ' 1 5、如申請專利範圍第1 4項所述之人物縮圖序列產生方法’其中該視訊擷取步驟係依據該臉孔偵測分析演算法則擷取具有相同之臉孔特徵的該影像資料以作為該關鍵晝面。 1 6、如申請專利範圍第1 5項所述之人物縮圖序列產生方法，其中該人物縮圖序列為一特定人物之縮圖序列。 1 7、如申請專利範圍第丨6項所述之人物縮圖序列產生方法，更依據該特定人物之縮圖序列產生該特定人物之專輯視訊資料。 1 8、如申请專利範圍第1 4項所述之人物縮圖序列產生方法，其中該視訊擷取步驟係依據該臉孔偵測分析演算法則擷取具有相異之臉孔特徵的該影像資料以作為該關鍵晝面。

第25頁 544634 六、申請專利範圍 1 9、如申請專利範圍第1 4項所述之人物縮圖序列產生方法，其中該人物影像擷取方針更包含一音訊分析演算法則，其分析該視訊資料中的一音訊資料，該視訊擷取步驟係依據該音訊分析演算法則先篩選具有人聲之該音訊資料所對應之該影像資料，然後依據該臉孔偵測分析演算法則從該影像資料中擷取該關鍵晝面。 2 0、如申請專利範圍第1 4項所述之人物縮圖序列產生方法，其中該人物影像擷取方針更包含一鏡頭變換分析演算法則，其係分析該視訊資料中一影像資料的鏡頭變換，該視訊操取步驟係依據該鏡頭變換分析演算法則篩選該影像資料’然後依據該臉孔偵測分析演算法則從該影像資料中擷取該關鍵晝面。、 21、一種記錄媒體，其係記錄用以使電腦達成—人物序列產生，法之程式，該人物縮圖序列產生方法包含：β 視汛接收步驟，其接收一視訊資料；、、·解碼步驟，其解碼該原視訊資料以取得一視訊次人物影像擷取方針其依據所擷取之該自該视關鍵書一視訊擷取步驟，其依據一汛^料中梅取一關鍵畫面；以及一人物縮圖序列產生步驟，面產生一人物縮圖序列。

第26頁六、申請專利範圍 2 2、如申請真刹々斤該人物對所擷該人物以提供該人物析該視步驟依關鍵畫該視訊相同之該人物縮圖序列產ί方:第21項所述之記錄媒體，其々法更包含：一影像處理牛跟 ^ 取之該關鍵晝“=取該關鍵晝面後， 23、如申請專利範圍縮圖序列產生方法更一擷取方針選擇該人物影像掏取方針第2 1項所述之記錄媒體，其中包含：步驟’其接受一使用者之選擇 24、如申請專利範圍第21項所述之記錄媒體，其中影，擷取方針包含一臉孔偵測分析演算法則，其分 Λ資料中具有臉孔特徵的一影像資料，該視訊擷取據該臉孔偵測分析演算法則從該影像資料中擷取該面。 2 5、如申請專利範圍第2 4項所述之記錄媒體，其中擷取步驟係依據該臉孔偵測分析演算法則擷取具有臉孔特徵的該影像資料以作為該關鍵畫面。 2 6、如申請專利範圍第2 5項所述之記錄媒體，其中縮圖序列為一特定人物之縮圖序歹】 2 7、如申請專利範圍第2 6項所述之記錄媒體，更依據該特 544634 六、申請專利範圍定人物之縮圖序列產生該特定人物之專輯視訊資料。 2 8、如申請專利範圍第2 4項所述之記錄媒體，其中該視訊擷取步驟係依據該臉孔偵測分析演算法則擷取具有相異之臉孔特徵的該影像資料以作為該關鍵晝面。 29、如申請專利範圍第24項所述之記錄媒體，其中該人物影像擷取方針更包含一音訊分析演算法則，其分析該視訊資料中的一音訊資料，該視訊擷取步驟係依據該音訊分析演算法則先篩選具有人聲之該音訊資料所對應之該影像資料’然後依據該臉孔偵測分析演算法則從該影像資料中擷取該關鍵晝面。 3^0、如申請專利範圍第24項所述之記錄媒體，其中該人物於像擷取方針更包含一鏡頭變換分析演算法則，其係分析該視訊資料Φ 以你吹，， 1 T 一影像資料的鏡頭變換，該視訊擷取步驟係演算法則筛選該影像資料’雜品。刀析、;貝鼻法則從該影像資料中擷取該關鍵晝