TW544634B - Thumbnail sequence generation system and method - Google Patents
Thumbnail sequence generation system and method Download PDFInfo
- Publication number
- TW544634B TW544634B TW090124776A TW90124776A TW544634B TW 544634 B TW544634 B TW 544634B TW 090124776 A TW090124776 A TW 090124776A TW 90124776 A TW90124776 A TW 90124776A TW 544634 B TW544634 B TW 544634B
- Authority
- TW
- Taiwan
- Prior art keywords
- video
- character
- image
- patent application
- scope
- Prior art date
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/70—Information retrieval; Database structures therefor; File system structures therefor of video data
- G06F16/73—Querying
- G06F16/738—Presentation of query results
- G06F16/739—Presentation of query results in form of a video summary, e.g. the video summary being a video sequence, a composite still image or having synthesized frames
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Television Signal Processing For Recording (AREA)
Description
544634 五、發明說明α) 【發明領域】 本發明係關於一種人物縮圖序列產生系統與方法,特 別關於一種利用一電腦軟體來分析一視訊(V i deo )内容 以自動產生人物縮圖序列(T h u in b n a i 1 S e q u e n c e )的系統 與方法。 【習知技術】 一般而言,視訊是連續輸出的單張影像,例如,在 NTSC標準中,其撥放一秒鐘可能是包含2 9. 9 7張影像的連 續切換,而在PAL標準中,其撥放一秒鐘可能是包含25張 影像的連續切換,當使用者檢視該等影像時,最大的問題 就是該等影像的數量實在太多,以NTSC標準為例,一分鐘 的視訊就包括了將近1 8 0 0張影像,以此類推,使用者必須 檢視將近二萬張的影像,才能檢視完1 0分鐘的視訊中的所 有影像,因此,當使用電腦軟體來編輯視訊内容時,常常 僅就視訊内容之第一張影像代表該視訊,部份電腦軟體為 了方便使用者更容易對該視訊内容有所了解,以利視訊編 輯之進行,常會以縮圖序列的方式顯示該視訊之部份影 像,然而其挑選該視訊中部份影像之方法,目前有挑選拍 攝曰期不同或時間不連續之第一張影像,或每隔一時間間 隔後挑選一張影像,或分析視訊内容挑選鏡頭變換不同之 第一張影像,以及以人工方式挑選影像等方法。 當視訊内容為一生活剪影、MTV、戲劇、影片或影集 時,人物通常為該視訊内容之主角,因此以人物角色縮圖
544634 五、發明說明(2) 序列來代表視訊’能夠知:供使用者快速檢視於生活剪景;、 MTV、戲劇、影片或影集中之人物角色之影像,尤其該~等 影像對使用者來說是有意義且具代表性的。麸而a …、叩,目月丨j並 未有就視訊内容之人物角色挑選視訊之部份影像產生縮圖 序列,因此,如何自動挑選該視訊中有意義且具代表=: 人物影像晝面並產生縮圖序列以代表該視訊正是當前一個 重要的課題。 田, 【發明概要】 針對上述問題’本發明之目的為提供一種能夠有效率 地分析視訊,並且產生所需之人物縮圖序列的人物縮圖 列產生系統與方法。 為達上述目的,依本發明之人物縮圖序列產生系統包 括一視訊接收模組、一解碼模組、一視訊擷取模組以及2 人物縮圖序列產生模組。在本發明中,視訊接收模組接收 一原視訊資料,而解碼模組將原視訊資料解碼成為一視气 ^料,然後視訊擷取模組依據一人物影像擷取方針自視^ 資料中操取至少一關鍵晝面(key frame),最後由人物 縮圖序列產生模組依據所擷取之關鍵畫面產生一人物縮 /承上所述,依本發明之人物縮圖序列產生系統更包人 一影像處理模組,其於擷取關鍵晝面後,針對所擷取二 鍵晝面進行影像處理。 符 本發明之人物縮圖序列產生系統更包含一擷取方針選
第5頁 544634 五、發明說明(3) 擇板組’其接受一使用者之選擇以提供人物影像擷取方 針。 本發明亦提供一種人物縮圖序列產生方法,其包括一 視訊接收步驟、一解碼步驟、一視訊擷取步驟以及一人物 备百圖序列產生步驟。在本發明中,視訊接收步驟先接收原 視訊資料,接著解碼步驟解碼原視訊資料以取得視訊資 料’然後視訊擷取步驟依據人物影像擷取方針擷取關鍵晝 面’最後人物縮圖序列產生步驟依據關鍵晝面產生人物縮 圖序列。 另外,依本發明之人物縮圖序列產生方法更包括一影 像處理步驟,影像處理步驟於擷取關鍵晝面後,針對所擷 取之關鍵晝面進行影像處理。 由於依本發明之人物縮圖序列產生系統與方法能夠自 動分析視訊,並自動擷取符合需求之影像,因此能夠有效 率地產生所需之人物縮圖序列。 【較佳實施例之詳細說明】 以下將參照相關圖式,說明依本發明較佳實施例之人 物縮圖序列產生系統與方法,其中相同的元件將以相同的 參照符號加以說明。 請參照圖1所示,依本發明較佳實施例之人物縮圖序 列產生系統包括一視訊接收模組丨Q 1、一解碼模組1 〇 2、一 視訊擷取模組103、一影像處理模組1〇4、一人物縮圖序列 產生模組1 0 5以及一擷取方針選擇模組1 〇 6。
544634 五、發明說明(4) 在本實施例中,人物縮圖序列產生系統可以應用於一 電腦设備6 0中’而電腦設備β 〇可以是習知的電腦裝置,豆 包括一訊號源介面6 〇 1、一記憶體6 〇 2、一中央處理單元八 (CPU) 603、一輸入裝置6〇4以及一儲存裝置6〇5。其中, 訊號源介面601係與一訊號源輸出裝置或是一訊號源紀錄 裝置連接,例如是光碟機、FireWire (IEEE 1394
Interface )、通用序列埠(USB )等介面裝置,而訊號源 輸出裝置例如是數位攝影機,訊號源紀錄裝置例如是 ▽ 00、0¥0等。記憶體6〇2可以是])1^^1或££?1^(^等任何一種 或數種設置於電腦裝置中的暫存記憶體。中央處理單元 6 0 3則可採用任何一種習知之中央處理器架構,例如, MLU、暫存器與控制器等,以進行各種資料之處理與運 异,以及控制電腦設備60中各元件的作動。輸入裝置6〇4 可以是滑鼠、鍵盤等能夠由使用者自行輸入訊息, 作各軟體模組的裝置。儲存裝置6〇5可以是硬碟貞、軟卞 機等任何一種或數種電腦可讀取之資料儲存裝置。 ” 本實施例中的各模組係指儲存於儲存裝置6〇5中或 一紀錄媒體中的軟體模組。中央處理單元6〇3於讀取 組之後,即可經由電腦設備6 〇巾的夂一从七— 供 姑二兩、★立& ▲ 1有bU中的各兀件來實現各模組的 ^“ ^二思,,熟習該項技術者亦可將本實施例中 所揭路之軟體模組製作成硬體,如Μ I〔 ^PPllcation-speciflc lntegrated 士…㈠晶片 荨,而不違反本發明之精神與範脅。 以下詳細說明本實施例中各模組之功能。
544634 五、發明說明(5) 在本實施例中,視訊接收模組1 0 1接收一原視訊資料 40,解碼模組1 02解碼原視訊資料4〇以取得一視訊資料 4 1 ’擷取方針選擇模組1 〇 6提供給一使用者選取所需之一 人物影像擷.取方針50,視訊擷取模組丨03則依據人物影像 擷取方針5 0自視訊資料4 1中擷取至少一關鍵晝面3 〇 2,然 後’影像處理模組1 〇 4針對視訊擷取模組丨〇 3所擷取的關鍵 晝面3 0 2進行影像處理;最後,人物縮圖序列產生模組1 〇 5 依據經過影像處理的關鍵晝面3 〇 2產生一人物縮圖序列 70。 ' 視訊接收模組1 01與訊號源介面6〇 1配合 如上所述 例如,視訊接收模組1〇1可以透過FireWire(IEEE 13以 Interface)取得儲存於數位攝影機中的原視訊資料4〇,或 是透過光碟機取得記錄於VCD、DVD中的原視訊資料4〇。原 視訊資料40係由各種視訊擷取裝置或接收裝置如數位攝影 機電視卡、機上盒等,以及各種視訊儲存裝置如D V D、 vC=儲存、傳送、廣播(Br〇adeasting)或接收的視訊, ”月b夠以各種視訊資料格式(如評肋—丨,評eg —2 MPEG= AVI’ ASF,謂等)儲存、傳送、廣播或接收。 式、=Γ02能夠針對輸入的原視訊資料4°之視訊格 m !縮方式進行解碼轉換還原為編碼前之 壓縮;气(:於編:刖之資料,例^,若編碼方式採用失真 ^ 細方式(Lossy Compressi〇n),則解 似於編石馬前之資料,以# “ J解碼後”月匕夠取得近 中,視訊二咖1。在本實施例 貝付匕括曰訊貧料411以及一影像資料。 五、發明說明(6) 音訊資料41 1為視訊資料41中所撥放 為視訊資料41所顯示的所有單 涤曰,影像資料412 資料41係由25張單張影像或2 9 9丫 ’通旦常每秒鐘的視訊 構成。本實施例中以小時:分:7/早查張景“象麵^ 面相對於視訊資料41之位置資m广:面’來表示每一晝 ^ 貝 σΚ ’例如,0 1 : 1 1 · 9 η . 9 g 為視訊資料41第1小時第U分2〇秒的第25個 .. :取方針選擇模組106與輸入裝置6〇4配-合,以便使用 者肖b夠利用輸入裝置6 〇 4於擷取方釙撰煜y f ^ A ^ ^ 5 0 〇 1 ° 6 ^ ^ ^ 擷取方針5 0會依據使用者輸入之選項設定笊的人物衫像 (pre”rence),決定是否要利用音訊‘析演S 鏡分析演算法則5 0 2’作為視訊資料進行臉孔偵測 二析々鼻法則50 3的前處理程序。音訊分析演算法則5〇1血 鏡頭變換分析演算法則5 〇 2的處理程序會精簡並減少進行' 臉孔偵測分析演算法則5 0 3的視訊資料量。 曰汛为析廣异法則5 〇 1係分析視訊資料4丨的音訊資料 411,以篩選音訊資料411中具有人聲之 、 對應影像資料片段。因此能將非人聲之音訊資料片段(如、 _ °喿音、靜音)及其對應影像資料片段,分離不進行臉孔偵 測分析演算法則之處理。 、 音訊分析演算法則501利用特徵抽取(Features Extraction)與特徵匹配(Features Matching)方式進行分 析’將人物角色之聲音區分並分類。音訊資料4 1 1之特徵 包括如頻譜特徵(Spectral Features)、音量(Volume)、
544634 五、發明說明(7) 零軸交會率(Zero Crossing Rate)、音調(Pitch)等。如 上所述,當抽取頻譜特徵(S p e c t r a 1 F e a t u r e s )後,其經 由雜音衰減(Noise Reduction)、分段(Segmentation),
並利用快速傅利葉轉換(Fast Four ier Transform)將音訊 資料411轉至頻率域(Frequency),然後由一組頻率濾波器 (Fi Iters)進行特徵值抽取,這組特徵值組成一個頻譜特 徵向量(Spectral Feature Vector)。音量是容易量測之 一種特欲’其可利用均方根值(RMS,Root Mean Square) 代表其特徵值,然後藉由音量(Volume)分析可輔助分段 (Segmentation)之進行,亦即透過靜音债測(silence Detection)幫助音訊資料411段落邊界(B〇undaries)之決 疋。零軸父會率(Zero Crossing Rate)為計算每段 (Clips)聲音波形(Waveform)與零軸(Zero Axis)交會之次 數。a ό周(Pitch)為聲音波形(Waveform)的基頻 (Fundamental Frequency)。因此,音訊資料411可利用上 述之音訊特徵及其特徵值所組成之特徵向量(1^31:111^ Vector)與人聲音訊樣本(Audi〇 templates)之特徵進行 分析比對’進行分析比對,以便取得所需具有人聲之音訊 資料片段及其對應影像資料片段。
—鏡頭變換分析演算法則5 〇 2係分析視訊資料4丨中影像 貢料412的鏡頭變換,並篩選視訊資料41中影像資料41 2中 ,個鏡頭變換後的第一個晝面,作為進行臉孔偵測分析演 异法則5 0 3的影像資料。鏡頭變換分析演算法則5 〇 2所分析 的影像資料4 1 2可為經過音訊分析演算法則5 〇 1篩選後具有
第10頁 544634
士聲之音訊資料所對應的影像資料412或未經音訊分析演 异法則5 0 1處理之視訊資料4丨中之影像資料4丨2。 一般而言,視訊資料41為一視訊串列(Vide〇 Sequence),其通常由許多場景(Scenes)所組成,而每一 場景又由複數個鏡頭變換(Sh〇ts)所組成。在影片中的最 小單位是一個鏡頭變換,而影片便是由許多的鏡頭變換所 堆砌起來的。通常,一個鏡頭由複數個視覺特性(如色彩 (Color)、紋理(Texture)、形狀(Shape)、動作(M〇ti〇^)
馨 具一致性之晝面(Frames)所組成,並且,其係依據攝影機 運動方向(Camera Directi on)與攝影取景角度(view Ang 1 e)的改變而有變化,例如,當攝影機以不同之攝影取 景角度來拍攝同一場景時,會產生不同之鏡頭變換,或以 相同之攝影取景角度但拍攝不同之區域時,亦會產,生不门 之鏡頭變換。由於鏡頭變換可由一些基本視覺特性而區 分,因此將視訊資料4 1分割成複數個連續的鏡頭變換是相 當容易達成的,此技術主要藉由分析一些基本視覺特性之 統計資料如視覺特性柱狀圖(Histogram),因此,當—查 面之視覺特性與前一晝面之視覺特性差異達到某一裎度$ 時,就可在此畫面與前一晝面間作一分割並視作為鏡^變 換’在本實施例中,可以挑選此鏡頭變換後的第一個貪= 作為進行臉孔偵測分析演算法則5 0 3的影像資料。 〜 臉孔偵測分析演算法則5 0 3利用臉孔偵測(Faee Detection),臉?L 辨識(Face Recognition) ^ ^ ^ ^ 資料4 1中具有相異臉孔特徵的視訊晝面以作為關鍵晝面°
第11頁 544634 五、發明說明(9) . 3 〇 2。臉孔偵測分析演算法則5 0 3所分析之影像資料4丨2可 為經過音訊分析演算法則501或鏡頭變換分析演算法則5〇2 4選後之影像資料4 1 2 ’或未經過音訊分析演算法則5 }或 鏡頭變換分析演异法則5 0 2師選後之影像資料4 1 2。' 在本實施例中’利用相異臉孔影像館8以資料表格8〇 儲存具有相異臉孔之影像資訊、該相異臉孔影像的臉°部特 徵組合及影像的位置資訊,並以資料鍊結串列儲存與該相 異臉孔景> 像具有相同臉部特徵之影像的位置資訊。如圖4 所示,其顯示於相異臉孔影像館8中所儲存的資°料,口回 如,於資料表格80的第一列中,.儲存具有一第 3^一 7資:二、表:第-臉孔的-第-臉部“組合 811、弟一衫像的一苐一位置資訊812,以及鍊社 -臉,之其他影像的複數個第一指標(ρ〇ιη。川有: 如才曰Μ、指標B、指標C、指標D等等。依此類推,於 表格8的第二列中’儲存具有一第二臉孔之 像、:: 第二!:。的一第二臉部特徵組合 他影像的複指22標82^ ^ 對具有臉孔晝面之影像,伯、二有臉孔旦面之影像後,針丨 孔畫面之影像、及其:部==,將第-張具有臉I·-”相異臉孔影像館”,告再扒、、σ /、衫像的位置資訊存入 時,將其影像中臉有面之影像 〃相異臉孔影像館”中存檔 第12頁 544634 五、發明說明(l〇)
的臉邛特徵組合進行比對,若該A 已存入"相異臉孔影像館”中存:::::臉部特徵組合與 張影像被淘汰,並將此被淘汰:=特徵組合相同則該 相異臉孔影像館"中特徵組合相同~之马、位置資訊儲存於|, 結串列中,若該張影像之臉部特且:所對應的資料鍊 ^ ^ ^ ^" t # ^ ^ ^ ^ ^ ^ 及其臉部特徵組合與影像的位^ 張影像 館",如此將輸入之影像資料412IlK = :異臉孔影像 最後存於”相異臉孔影像館"之影 =:?辨識比對。 之關鍵書面302。目tt a、<t象貝為本只鈿例中所篩選 舒〜:别取常被用來做臉孔辨識的方法之— t 分析(Μη—1 —卿邮—Ws,— (Ε· /方法所建立的臉孔辨識器通常稱為特徵臉 (Eigenface)辨識系統。 視訊擷取模組103可以是儲存在儲存裝置6〇5之一軟 提:的f : ΐ中央處理單元6 〇3的運算,依據本實施例所― 物影像擷取方針5 0,分析比對視訊資料4 1中的与 ,進而擷取合乎人物影像擷取方針5 〇的關鍵晝面3 〇 2。^ 影·像處理模組1 〇4可以是儲存在儲存裝置6〇5之一軟· 杈組,並透過中央處理單元6〇3之運算,以便針對所擷取 的關鍵畫面3 0 2進行影像處理,例如調整影像大小 (Rescaling)專影像處理(Image processing)功能。 人物縮圖序列產生模組1〇5可以是儲存在儲存裝置6〇5 之一軟體模組,並透過中央處理單元6〇3之運算,將經過 影像處理的關鍵晝面3 〇 2整合匯出,以產生人物縮圖序列 ΙΓί 第13頁 544634 五、發明說明(π) 70 〇 另外,所產生的人物縮圖序列7 0可以儲存在儲存裝置 6 0 5中,而所儲存的資料包括人物縮圖序列7 〇之串列頭 (Head )、各關鍵晝面3 0 2 (或縮圖)之鍊結串列(Linked List)或指標(p〇inter)等。 為使本發明之内容更容易理解,以下將舉一實例,以 說明依本發明較佳實施例之人物縮圖序列產生方法的流 程。 請參照圖2所示,在依本發明較佳實施例之人物縮圖 序列產生方法2中,步驟201接收原視訊資料4〇,例如,可 以將數位攝影機中紀錄的資料經由傳輸線送至訊號源介面 6〇1 ’以提供作為產生人物縮圖序列7〇的晝面與内容。 在步驟2 0 2中,解碼模組1〇2辨識原視訊資料4〇之格式 並解碼原視訊資料4 〇以產生經過解碼之視訊資料4丨,例 如’原視訊資料4 〇為I n t e r 1 a c e d Μ P E G - 2格式,亦即是, 一個訊框係由兩個訊場(field )所組成,所以,在^步 驟中,可以先進行MPEG-2格式的解碼,然後利用内插法/ (Interp〇latiori )解交錯以得到視訊資料41。 彳 梦罢ϋ驟203、中,視訊榻取模組103依據使用者藉由輸入 1^6中$ =入之選項設定訊息,執行於擷取方針選擇模組 取的人物影像擷取方針5〇來擷 :變者決定是否要利用音訊分析演算法―:二 一奐刀析决算法則5 0 2,作為視訊資料進行人物角色之 臉孔债測分析演算法則5 0 3的前處理程序。針對視訊資料
第14頁 544634 五、發明說明(12) 41的每一視訊晝面與内容(包含音訊内容),進行分析搜尋 並篩選取得符合人物影像擷取方針5〇的關鍵畫面30 2。需 注意者,本實施例可以擷取出複數張的關鍵晝面3 0 2。如 圖3所示,原視訊資料40經過解碼後會得到視訊資料4 1, 其包括複數張單張影像301 (每秒25張或2 9.9 7張),而經 過依據人物影像擷取方針5 〇的分析搜尋後會從該等單張影 像3 0 1中擷取出至少一關鍵晝面3 〇 2。 步驟204係判斷是否已經完成視訊資料41中所有内容 的分析比對,當未完成視訊資料4 1中所有内容的分析比對 時’重複進行步驟2 0 3 ;當完成視訊資料4 1中所有内容的 分析比對時,進行步驟2 〇 5。 在步驟2 0 5中,影像處理模組1〇4依據於步驟20 3中取 得之關鍵晝面30 2,針對縮圖圖框的解析度(Res〇iuti〇n ) 大小(Size)來進行影像處理(image Processing )’例如調整影像大小之處理程序。 在步驟2 0 6中’人物縮圖序列產生模組1 〇 5整合經過影 像處理的關鍵晝面3 0 2以產生人物縮圖序列7 〇。例如,所 掘取出的關鍵晝面3 02經過調整大小之後,人物縮圖序列 產生模組1 0 5將其依序排列於一視窗中,並且,當影像數 超過一視窗所能夠顯示的數量時,利用捲軸(Scr〇1丨bar )方式提供給使用者進行人物縮圖序列7 〇之瀏覽。 又,關鍵畫面302可以是如圖4所示的第一影像資兮孔 81、第二影像資訊82等f ’因此,所產生的人物縮圖序列 70顯示在視訊資料4 1中所有相異臉孔的影像,其可以代表
第15頁 544634 五、發明說明(13) 視訊資料41中所有出場人物的縮 302可以是如圖4所示的第—影 :另外,關鍵晝面 謝所有具有第縮;,顯示在視訊資 中具有第-臉孔之人物的縮;:列其視訊卿 臉孔之影像的關鍵晝面3 〇 2更敫' 卜,具有第一 輯視訊資料,其可以視作為且第一正為一特定人物之專 人專輯。 ,、有第一臉孔之特定人物的個 最後’步驟2〇7係於儲存穿 70,並且以程式定義之資+ 中儲存人物縮圖序列 中,鍊結串列如鍊結串列來餘存。其 等資訊,备—Μ科故A I 3人物細圖序列7 0之檔案名稱 像資料或人物::L含一人物縮圖之資訊(人物縮圖影 =^ ί 0圖影像之指標)以及與前(後)節點的鍊結 (L1 n k)資訊。 :上所述,由於依本發明較佳實施例之人物縮圖序列 生糸統與方法能夠自動分析視訊資料,並針對視訊資料 之音訊資料及影像資料,來整合視訊内容分析、音訊分 析、臉孔偵測、臉孔辨識等技術,以產生人物縮圖序列, 所以此夠有效率地利用視訊資料來產生所需的人物縮圖序 列0
另外’於利用本發明實施例中人物縮圖序列產生系統 與方法時’若使用者產生人物縮圖序列之選項設定 (Preference)未選擇音訊分析演算法則5〇1及鏡頭變換分 析演异法則5 0 2進行篩選,則使用者可挑選人物縮圖序列
第16頁 544634 五、發明說明(14) :之縮3 ’並藉由"相異臉孔影像館"中該縮圖對應的相显 =孔之衫像及其對應的賣料鍊結串列(其儲存與肖人物縮 圖影像具有相同臉部特徵之影像的位置資訊)取得視吒中 具有相同臉部特徵之影像,進行批次(Batch)的視訊編 或影像編輯,刪除或取代所有該相同臉部特徵之影像,与 像強化(Enhancement)加入視訊特效(Effect)、哀 々 彩調整等處理工作。 〜又已 、若使用者產生人物縮圖序列之選項設定有選 析演算法則501或鏡頭變換分析演算法則5〇2進行篩‘:二 ,用者可挑選人物縮圖序列中之縮圖,並藉由"相昱孔 衫像館"中該縮圖對應的相異臉孔二 鍊結串列取得被音訊分析演算法則二頭= 二法則5G2筛選後具有相同臉部特徵之影像,進行 視讯編輯或影像編輯,刪除或取^^ ^ ^ ^ ^ ^ ^ ^ 、 影像,影像強化、加入視訊特效代;目,臉部特徵之 工作。 行双冗度、色彩調整等處理 f像=彳如泉Τ以依批次的方式將所有具有相同臉部特徵之 二像δ併為此特定人物之個人視訊剪輯,而且 者手動透過影像處理模組丨04對所選取 由一使用 作视訊編輯或影像編輯,如 個人硯訊剪輯 徵之影像、推;r旦/撞改儿 A取代所有該相同臉部特 度、色彩等處理工作。 /周正衫像71: 以上所述僅為舉例性,而非為限制性去 本發明之精神與範疇,而對其 Y任何未脫離 、^仃义寺效修改或變更,均 第17頁 544634 五、發明說明(15) 應包含於後附之申請專利範圍中。
第18頁 544634 圖式簡單說明 【圖式簡單說明】 圖1為一示意圖,顯示依本發明較佳實施例之人物縮 圖序列產生系統之結構。 圖2為一流程圖,顯示依本發明較佳實施例之人物縮 圖序列產生方法的流程。 圖3為一示意圖,顯示於本發明較佳實施例之人物縮 圖序列產生方法中擷取關鍵晝面的示意圖。
圖4為一示意圖,顯示依本發明較佳實施例之相異臉 孔影像館之資料儲存結構的示意圖。 【圖式符號說明】
101 視 訊 接 收 模 組 102 解 碼 模 組 103 視 訊 #1 取 模 組 104 影 像 處 理 模 組 105 人 物 縮 圖 序 列 產 生 模 組 106 操 取 方 針 選 擇 模 組 2 人 物 縮 圖 序 列 產 生 方 法 201 〜207 人 物 縮 圖 序 列 產 生 方 法之流程 301 單 張 影 像 302 關 鍵 晝 面 40 原 視 訊 資 料 41 視 訊 資 料 411 音 訊 資 料
第19頁 544634
第20頁
圖式簡單說明 412 影像資料 50 人物影像擷取方針 501 音訊分析演算法則 502 鏡頭變換分析演算法則 503 臉孔偵測分析演算法則 60 電腦設備 601 訊號源介面 602 記憶體 603 中央處理單元 604 輸入裝置 605 儲存裝置 70 人物縮圖序列 8 相異臉孔影像館 80 資料表格 81 第一影像資訊 811 第一臉部特徵組合 812 第一位置資訊 813 第一指標 82 第二影像資訊 821 第二臉部特徵組合 822 第二位置資訊 823 第二指標 A 指標A B 指標B 544634 圖式簡單說明 c 指標c
D 指標D
1_圓II 第21頁
Claims (1)
- 544634 六、申請專利範圍 ---- 1、 一種人物縮圖序列產生系統,包含: 一視訊接收模組,其接收一原視訊資料; 一解碼模組,其解碼該原視訊資料以取得一視气次 料; °貝 一視訊操取模組,其依據一人物影像擷取方針自7 訊資料中擷取一關鍵晝面(key frame );以及 ~視 一人物縮圖序列產生模組,其依據所擷取之該 面產生一人物縮圖序列。 f、旦 2、 如申請專利範圍第1項所述之人物縮圖序列產味 二人· 上恭統, 更包含· 一影像處理模組,其於擷取該關鍵晝面後,針斜 取之該關鍵晝面進行影像處理。 σ 3、 如申請專利範圍第1項所述之人物縮圖序列產生系統, 更包含: 一擷取方針選擇模組,其接受一使用者之選擇以提供 該人物影像操取方針。 4、 如申請專利範圍第1項所述之人物縮圖序列產生系統, 其中該人物影像擷取方針包含一臉孔偵測分析演算法則, 其分析该視訊資料中具有臉孔特徵的一影像資料,該視訊 擷取模組依據該臉孔偵測分析演算法則從該影像資料中擷 取該關鍵晝面。544634 六、申請專利範圍 5、 如申請專利範圍第4項所述之人物縮圖序列產生系統, 其中該視訊擷取模組係依據該臉孔偵測分析演算法則擷取 具有相同之臉孔特徵的該影像資料以作為該關鍵晝面。‘ 6、 如申請專利範圍第5項所述之人物縮圖序列產生系統, 其中該人物縮圖序列為一特定人物之縮圖序列。 7、 如申請專利範圍第6項所述之人物縮圖序列產生系統, 更依據該特定人物之縮圖序列產生該特定人物之專輯視訊 資料。 σ 8、 如申請專利範圍第4項所述之人物縮圖序列產生系統, 其中該視訊擷取模組係依據該臉孔偵測分析演算法則掏取 具有相異之臉孔特徵的該影像資料以作為該關鍵畫面。 9、 如申請專利範圍第4項所述之人物縮圖序列產生系統, 其中該人物影像擷取方針更包含一音訊(aud i 〇 )分析演 鼻法則,其分析該視訊資料中的一音訊資料,該視訊擷取 模組係依據該音訊分析演算法則篩選具有人聲之該音訊資 料所對應之該影像資料,然後依據該臉孔偵測分析演算法 貝J k該影像資料中操取該關鍵晝面。 1 〇、如申請專利範圍第4項所述之人物縮圖序列產生系第23頁 544634統’其中該人物影像擷取方針p 、土則 ^ T更包含一鏡頭變換分析演算 法則,其係分析該視訊資料中— 六、申請專利範圍 ^ τ ~影像資料的鏡頭變換,該 視a掏取模組係依據該鏡頭變 -欠卜丨 文狹分析演异法則篩選該影像 貝料,然後依據該臉孔偵測分析、、# ’ 擷取該關鍵晝面。 刀析决异法則以影像資料中 種人物縮圖序列產生方法,包含·· 視汛接收步驟,其接收一視訊資料; 解碼步驟,其解碼該原視訊資料以取得一視气資 一視訊擷取步驟,其依據一人物影像擷取 訊資料中擷取一關鍵晝面;以及 万針自该視 一縮圖序列產生步驟,其依據所擷取之該 生一縮圖序列。 刚鍵晝面產 1 2、如申請專利範圍第丨丨項所述之人物縮圖序 法,更包含: 」座生方 一影像處理步驟,其於擷取該關鍵晝面後, 取之孩關鍵晝面進行影像處理。 、、口 13、如申請專利範圍第11項所述之人物縮圖序列產生 法,更包含: 力 人物=㈡步驟’其操受一使用者之選擇犧544634 六、申請專利範圍 1 4、如申請專利範圍第1 1項所述之人物縮圖序列產生方 法,其中該人物影像擷取方針包含一臉孔偵測分析演算法 則,其分析該視訊資料中具有臉孔特徵的一影像資料了兮 視訊擷取步驟依據該臉孔偵測分析演算法則從該影像資料 中榻取該關鍵晝面。 ' 1 5、如申請專利範圍第1 4項所述之人物縮圖序列產生方 法’其中該視訊擷取步驟係依據該臉孔偵測分析演算法則 擷取具有相同之臉孔特徵的該影像資料以作為該關鍵晝 面。 1 6、如申請專利範圍第1 5項所述之人物縮圖序列產生方 法,其中該人物縮圖序列為一特定人物之縮圖序列。 1 7、如申請專利範圍第丨6項所述之人物縮圖序列產生方 法,更依據該特定人物之縮圖序列產生該特定人物之專輯 視訊資料。 1 8、如申请專利範圍第1 4項所述之人物縮圖序列產生方 法,其中該視訊擷取步驟係依據該臉孔偵測分析演算法則 擷取具有相異之臉孔特徵的該影像資料以作為該關鍵晝 面。第25頁 544634 六、申請專利範圍 1 9、如申請專利範圍第1 4項所述之人物縮圖序列產生方 法,其中該人物影像擷取方針更包含一音訊分析演算法 則,其分析該視訊資料中的一音訊資料,該視訊擷取步驟 係依據該音訊分析演算法則先篩選具有人聲之該音訊資料 所對應之該影像資料,然後依據該臉孔偵測分析演算法則 從該影像資料中擷取該關鍵晝面。 2 0、如申請專利範圍第1 4項所述之人物縮圖序列產生方 法,其中該人物影像擷取方針更包含一鏡頭變換分析演算 法則,其係分析該視訊資料中一影像資料的鏡頭變換,該 視訊操取步驟係依據該鏡頭變換分析演算法則篩選該影像 資料’然後依據該臉孔偵測分析演算法則從該影像資料中 擷取該關鍵晝面。 、 21、一種記錄媒體,其係記錄用以使電腦達成—人物 序列產生,法之程式,該人物縮圖序列產生方法包含:β 視汛接收步驟,其接收一視訊資料; 、、·解碼步驟,其解碼該原視訊資料以取得一視訊次 人物影像擷取方針 其依據所擷取之該 自該视 關鍵書 一視訊擷取步驟,其依據一 汛^料中梅取一關鍵畫面;以及 一人物縮圖序列產生步驟, 面產生一人物縮圖序列。第26頁 六、申請專利範圍 2 2、如申請真刹々斤 該人物 對所擷 該人物 以提供 該人物 析該視 步驟依 關鍵畫 該視訊 相同之 該人物 縮圖序列產ί方:第21項所述之記錄媒體,其 々法更包含: 一影像處理牛跟 ^ 取之該關鍵晝“=取該關鍵晝面後, 23、如申請專利範圍 縮圖序列產生方法更 一擷取方針選擇 該人物影像掏取方針 第2 1項所述之記錄媒體,其中 包含: 步驟’其接受一使用者之選擇 24、如申請專利範圍第21項所述之記錄媒體,其中 影,擷取方針包含一臉孔偵測分析演算法則,其分 Λ資料中具有臉孔特徵的一影像資料,該視訊擷取 據該臉孔偵測分析演算法則從該影像資料中擷取該 面。 2 5、如申請專利範圍第2 4項所述之記錄媒體,其中 擷取步驟係依據該臉孔偵測分析演算法則擷取具有 臉孔特徵的該影像資料以作為該關鍵畫面。 2 6、如申請專利範圍第2 5項所述之記錄媒體,其中 縮圖序列為一特定人物之縮圖序歹】 2 7、如申請專利範圍第2 6項所述之記錄媒體,更依據該特 544634 六、申請專利範圍 定人物之縮圖序列產生該特定人物之專輯視訊資料。 2 8、如申請專利範圍第2 4項所述之記錄媒體,其中該視訊 擷取步驟係依據該臉孔偵測分析演算法則擷取具有相異之 臉孔特徵的該影像資料以作為該關鍵晝面。 29、如申請專利範圍第24項所述之記錄媒體,其中該人物 影像擷取方針更包含一音訊分析演算法則,其分析該視訊 資料中的一音訊資料,該視訊擷取步驟係依據該音訊分析 演算法則先篩選具有人聲之該音訊資料所對應之該影像資 料’然後依據該臉孔偵測分析演算法則從該影像資料中擷 取該關鍵晝面。 3^0、如申請專利範圍第24項所述之記錄媒體,其中該人物 於像擷取方針更包含一鏡頭變換分析演算法則,其係分析 該視訊資料Φ 以你吹,, 1 T 一影像資料的鏡頭變換,該視訊擷取步驟係 演算法則筛選該影像資料’雜 品。 刀析、;貝鼻法則從該影像資料中擷取該關鍵晝
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
TW090124776A TW544634B (en) | 2001-10-05 | 2001-10-05 | Thumbnail sequence generation system and method |
US10/033,782 US20030068087A1 (en) | 2001-10-05 | 2002-01-03 | System and method for generating a character thumbnail sequence |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
TW090124776A TW544634B (en) | 2001-10-05 | 2001-10-05 | Thumbnail sequence generation system and method |
Publications (1)
Publication Number | Publication Date |
---|---|
TW544634B true TW544634B (en) | 2003-08-01 |
Family
ID=29212717
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW090124776A TW544634B (en) | 2001-10-05 | 2001-10-05 | Thumbnail sequence generation system and method |
Country Status (2)
Country | Link |
---|---|
US (1) | US20030068087A1 (zh) |
TW (1) | TW544634B (zh) |
Families Citing this family (39)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100453966B1 (ko) * | 2002-01-09 | 2004-10-20 | 엘지전자 주식회사 | 방송 프로그램의 대표화면 표시방법 |
US20050058431A1 (en) * | 2003-09-12 | 2005-03-17 | Charles Jia | Generating animated image file from video data file frames |
US20050228849A1 (en) * | 2004-03-24 | 2005-10-13 | Tong Zhang | Intelligent key-frame extraction from a video |
US8411902B2 (en) * | 2004-04-07 | 2013-04-02 | Hewlett-Packard Development Company, L.P. | Providing a visual indication of the content of a video by analyzing a likely user intent |
US9053754B2 (en) | 2004-07-28 | 2015-06-09 | Microsoft Technology Licensing, Llc | Thumbnail generation and presentation for recorded TV programs |
KR101114110B1 (ko) | 2005-02-01 | 2012-02-21 | 엘지전자 주식회사 | 압축률을 이용한 애니메이션 파일의 썸네일 생성 방법 |
US7760956B2 (en) * | 2005-05-12 | 2010-07-20 | Hewlett-Packard Development Company, L.P. | System and method for producing a page using frames of a video stream |
JP2007189473A (ja) * | 2006-01-13 | 2007-07-26 | Hitachi Ltd | 動画再生装置 |
JP5025217B2 (ja) * | 2006-10-02 | 2012-09-12 | 京セラ株式会社 | 情報処理装置、情報処理方法および情報処理プログラム |
US7707224B2 (en) | 2006-11-03 | 2010-04-27 | Google Inc. | Blocking of unlicensed audio content in video files on a video hosting website |
CA2667782A1 (en) * | 2006-11-03 | 2008-05-15 | Google Inc. | Content management system |
JP4998026B2 (ja) | 2007-03-15 | 2012-08-15 | ソニー株式会社 | 画像処理装置、撮像装置、および画像表示制御方法、並びにコンピュータ・プログラム |
CN101730902A (zh) | 2007-05-03 | 2010-06-09 | 谷歌公司 | 数字内容贡献的货币化 |
US8094202B2 (en) * | 2007-05-17 | 2012-01-10 | Canon Kabushiki Kaisha | Moving image capture apparatus and moving image capture method |
US8611422B1 (en) * | 2007-06-19 | 2013-12-17 | Google Inc. | Endpoint based video fingerprinting |
US7596471B1 (en) | 2007-08-16 | 2009-09-29 | Young Electric Sign Company | Methods of monitoring electronic displays within a display network |
JP4683103B2 (ja) | 2008-09-22 | 2011-05-11 | ソニー株式会社 | 表示制御装置、表示制御方法、およびプログラム |
EP2378917B1 (en) * | 2009-01-16 | 2012-12-05 | The Procter & Gamble Company | Apparatus for modifying keratinous surfaces |
US20100281371A1 (en) * | 2009-04-30 | 2010-11-04 | Peter Warner | Navigation Tool for Video Presentations |
US8359537B2 (en) | 2009-04-30 | 2013-01-22 | Apple Inc. | Tool for navigating a composite presentation |
US8897603B2 (en) * | 2009-08-20 | 2014-11-25 | Nikon Corporation | Image processing apparatus that selects a plurality of video frames and creates an image based on a plurality of images extracted and selected from the frames |
US8582834B2 (en) | 2010-08-30 | 2013-11-12 | Apple Inc. | Multi-image face-based image processing |
US10291597B2 (en) | 2014-08-14 | 2019-05-14 | Cisco Technology, Inc. | Sharing resources across multiple devices in online meetings |
US10034038B2 (en) | 2014-09-10 | 2018-07-24 | Cisco Technology, Inc. | Video channel selection |
US10542126B2 (en) | 2014-12-22 | 2020-01-21 | Cisco Technology, Inc. | Offline virtual participation in an online conference meeting |
US9948786B2 (en) | 2015-04-17 | 2018-04-17 | Cisco Technology, Inc. | Handling conferences using highly-distributed agents |
US10460196B2 (en) * | 2016-08-09 | 2019-10-29 | Adobe Inc. | Salient video frame establishment |
US10592867B2 (en) | 2016-11-11 | 2020-03-17 | Cisco Technology, Inc. | In-meeting graphical user interface display using calendar information and system |
US10516707B2 (en) | 2016-12-15 | 2019-12-24 | Cisco Technology, Inc. | Initiating a conferencing meeting using a conference room device |
US10440073B2 (en) | 2017-04-11 | 2019-10-08 | Cisco Technology, Inc. | User interface for proximity based teleconference transfer |
US10375125B2 (en) | 2017-04-27 | 2019-08-06 | Cisco Technology, Inc. | Automatically joining devices to a video conference |
US10375474B2 (en) | 2017-06-12 | 2019-08-06 | Cisco Technology, Inc. | Hybrid horn microphone |
US10477148B2 (en) | 2017-06-23 | 2019-11-12 | Cisco Technology, Inc. | Speaker anticipation |
US10516709B2 (en) | 2017-06-29 | 2019-12-24 | Cisco Technology, Inc. | Files automatically shared at conference initiation |
US10706391B2 (en) | 2017-07-13 | 2020-07-07 | Cisco Technology, Inc. | Protecting scheduled meeting in physical room |
US10091348B1 (en) | 2017-07-25 | 2018-10-02 | Cisco Technology, Inc. | Predictive model for voice/video over IP calls |
CN107948646B (zh) * | 2017-09-26 | 2019-02-05 | 北京字节跳动网络技术有限公司 | 一种视频摘要生成方法与视频再编码方法 |
CN108256466B (zh) * | 2018-01-12 | 2020-06-23 | Oppo广东移动通信有限公司 | 数据处理方法、装置、电子设备及计算机可读存储介质 |
KR102656963B1 (ko) | 2019-04-03 | 2024-04-16 | 삼성전자 주식회사 | 전자 장치 및 전자 장치의 제어 방법 |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5164831A (en) * | 1990-03-15 | 1992-11-17 | Eastman Kodak Company | Electronic still camera providing multi-format storage of full and reduced resolution images |
US5191645A (en) * | 1991-02-28 | 1993-03-02 | Sony Corporation Of America | Digital signal processing system employing icon displays |
KR970000761B1 (ko) * | 1992-10-07 | 1997-01-18 | 대우전자 주식회사 | 소형 디지탈 방식 고선명 텔레비젼 |
US5553221A (en) * | 1995-03-20 | 1996-09-03 | International Business Machine Corporation | System and method for enabling the creation of personalized movie presentations and personalized movie collections |
US5847703A (en) * | 1997-07-03 | 1998-12-08 | Vsoft Ltd. | Browsing system method and apparatus for video motion pictures |
JP4227241B2 (ja) * | 1999-04-13 | 2009-02-18 | キヤノン株式会社 | 画像処理装置及び方法 |
US6751776B1 (en) * | 1999-08-06 | 2004-06-15 | Nec Corporation | Method and apparatus for personalized multimedia summarization based upon user specified theme |
JP4051841B2 (ja) * | 1999-12-01 | 2008-02-27 | ソニー株式会社 | 画像記録装置および方法 |
US6807290B2 (en) * | 2000-03-09 | 2004-10-19 | Microsoft Corporation | Rapid computer modeling of faces for animation |
US6813618B1 (en) * | 2000-08-18 | 2004-11-02 | Alexander C. Loui | System and method for acquisition of related graphical material in a digital graphics album |
-
2001
- 2001-10-05 TW TW090124776A patent/TW544634B/zh not_active IP Right Cessation
-
2002
- 2002-01-03 US US10/033,782 patent/US20030068087A1/en not_active Abandoned
Also Published As
Publication number | Publication date |
---|---|
US20030068087A1 (en) | 2003-04-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TW544634B (en) | Thumbnail sequence generation system and method | |
JP4228320B2 (ja) | 画像処理装置および方法、並びにプログラム | |
US9208226B2 (en) | Apparatus and method for generating evidence video | |
TWI253860B (en) | Method for generating a slide show of an image | |
CN103024607B (zh) | 用于显示摘要视频的方法和设备 | |
JP4973098B2 (ja) | 画像処理装置、画像処理方法およびプログラム | |
US9628673B2 (en) | Near-lossless video summarization | |
JP4269849B2 (ja) | マルチメディアプレゼンテーションを自動的に生成する方法、及びそのコンピュータプログラム | |
US7020351B1 (en) | Method and apparatus for enhancing and indexing video and audio signals | |
US11604935B2 (en) | Scene and shot detection and characterization | |
CN107430780B (zh) | 用于基于视频内容特性的输出创建的方法 | |
US20120082378A1 (en) | method and apparatus for selecting a representative image | |
US20060008152A1 (en) | Method and apparatus for enhancing and indexing video and audio signals | |
US20050058431A1 (en) | Generating animated image file from video data file frames | |
JP4490214B2 (ja) | 電子アルバム表示システム、電子アルバム表示方法、及び電子アルバム表示プログラム | |
CN101287089A (zh) | 摄像设备、图像处理设备及其控制方法 | |
US20080320046A1 (en) | Video data management apparatus | |
JP3649468B2 (ja) | 撮影機能付き電子アルバムシステム | |
JP2006081021A (ja) | 電子アルバム表示システム、電子アルバム表示方法、電子アルバム表示プログラム、画像分類装置、画像分類方法、及び画像分類プログラム | |
KR20130031179A (ko) | 요약 동영상 디스플레이 방법 및 장치 | |
TWI244005B (en) | Book producing system and method and computer readable recording medium thereof | |
Teodosio et al. | Salient stills | |
JP2008067334A (ja) | 画像処理装置および方法、並びにプログラム | |
Aner-Wolf et al. | Video summaries and cross-referencing through mosaic-based representation | |
JP2010219607A (ja) | ターゲットフレーム抽出装置、撮像装置およびデジタルカメラ |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
GD4A | Issue of patent certificate for granted invention patent | ||
MM4A | Annulment or lapse of patent due to non-payment of fees |