TW544634B - Thumbnail sequence generation system and method - Google Patents

Thumbnail sequence generation system and method Download PDF

Info

Publication number
TW544634B
TW544634B TW090124776A TW90124776A TW544634B TW 544634 B TW544634 B TW 544634B TW 090124776 A TW090124776 A TW 090124776A TW 90124776 A TW90124776 A TW 90124776A TW 544634 B TW544634 B TW 544634B
Authority
TW
Taiwan
Prior art keywords
video
character
image
patent application
scope
Prior art date
Application number
TW090124776A
Other languages
English (en)
Inventor
Watson Wu
Ray Huang
Original Assignee
Newsoft Technology Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Newsoft Technology Corp filed Critical Newsoft Technology Corp
Priority to TW090124776A priority Critical patent/TW544634B/zh
Priority to US10/033,782 priority patent/US20030068087A1/en
Application granted granted Critical
Publication of TW544634B publication Critical patent/TW544634B/zh

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/73Querying
    • G06F16/738Presentation of query results
    • G06F16/739Presentation of query results in form of a video summary, e.g. the video summary being a video sequence, a composite still image or having synthesized frames

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Television Signal Processing For Recording (AREA)

Description

544634 五、發明說明α) 【發明領域】 本發明係關於一種人物縮圖序列產生系統與方法,特 別關於一種利用一電腦軟體來分析一視訊(V i deo )内容 以自動產生人物縮圖序列(T h u in b n a i 1 S e q u e n c e )的系統 與方法。 【習知技術】 一般而言,視訊是連續輸出的單張影像,例如,在 NTSC標準中,其撥放一秒鐘可能是包含2 9. 9 7張影像的連 續切換,而在PAL標準中,其撥放一秒鐘可能是包含25張 影像的連續切換,當使用者檢視該等影像時,最大的問題 就是該等影像的數量實在太多,以NTSC標準為例,一分鐘 的視訊就包括了將近1 8 0 0張影像,以此類推,使用者必須 檢視將近二萬張的影像,才能檢視完1 0分鐘的視訊中的所 有影像,因此,當使用電腦軟體來編輯視訊内容時,常常 僅就視訊内容之第一張影像代表該視訊,部份電腦軟體為 了方便使用者更容易對該視訊内容有所了解,以利視訊編 輯之進行,常會以縮圖序列的方式顯示該視訊之部份影 像,然而其挑選該視訊中部份影像之方法,目前有挑選拍 攝曰期不同或時間不連續之第一張影像,或每隔一時間間 隔後挑選一張影像,或分析視訊内容挑選鏡頭變換不同之 第一張影像,以及以人工方式挑選影像等方法。 當視訊内容為一生活剪影、MTV、戲劇、影片或影集 時,人物通常為該視訊内容之主角,因此以人物角色縮圖
544634 五、發明說明(2) 序列來代表視訊’能夠知:供使用者快速檢視於生活剪景;、 MTV、戲劇、影片或影集中之人物角色之影像,尤其該~等 影像對使用者來說是有意義且具代表性的。麸而a …、叩,目月丨j並 未有就視訊内容之人物角色挑選視訊之部份影像產生縮圖 序列,因此,如何自動挑選該視訊中有意義且具代表=: 人物影像晝面並產生縮圖序列以代表該視訊正是當前一個 重要的課題。 田, 【發明概要】 針對上述問題’本發明之目的為提供一種能夠有效率 地分析視訊,並且產生所需之人物縮圖序列的人物縮圖 列產生系統與方法。 為達上述目的,依本發明之人物縮圖序列產生系統包 括一視訊接收模組、一解碼模組、一視訊擷取模組以及2 人物縮圖序列產生模組。在本發明中,視訊接收模組接收 一原視訊資料,而解碼模組將原視訊資料解碼成為一視气 ^料,然後視訊擷取模組依據一人物影像擷取方針自視^ 資料中操取至少一關鍵晝面(key frame),最後由人物 縮圖序列產生模組依據所擷取之關鍵畫面產生一人物縮 /承上所述,依本發明之人物縮圖序列產生系統更包人 一影像處理模組,其於擷取關鍵晝面後,針對所擷取二 鍵晝面進行影像處理。 符 本發明之人物縮圖序列產生系統更包含一擷取方針選
第5頁 544634 五、發明說明(3) 擇板組’其接受一使用者之選擇以提供人物影像擷取方 針。 本發明亦提供一種人物縮圖序列產生方法,其包括一 視訊接收步驟、一解碼步驟、一視訊擷取步驟以及一人物 备百圖序列產生步驟。在本發明中,視訊接收步驟先接收原 視訊資料,接著解碼步驟解碼原視訊資料以取得視訊資 料’然後視訊擷取步驟依據人物影像擷取方針擷取關鍵晝 面’最後人物縮圖序列產生步驟依據關鍵晝面產生人物縮 圖序列。 另外,依本發明之人物縮圖序列產生方法更包括一影 像處理步驟,影像處理步驟於擷取關鍵晝面後,針對所擷 取之關鍵晝面進行影像處理。 由於依本發明之人物縮圖序列產生系統與方法能夠自 動分析視訊,並自動擷取符合需求之影像,因此能夠有效 率地產生所需之人物縮圖序列。 【較佳實施例之詳細說明】 以下將參照相關圖式,說明依本發明較佳實施例之人 物縮圖序列產生系統與方法,其中相同的元件將以相同的 參照符號加以說明。 請參照圖1所示,依本發明較佳實施例之人物縮圖序 列產生系統包括一視訊接收模組丨Q 1、一解碼模組1 〇 2、一 視訊擷取模組103、一影像處理模組1〇4、一人物縮圖序列 產生模組1 0 5以及一擷取方針選擇模組1 〇 6。
544634 五、發明說明(4) 在本實施例中,人物縮圖序列產生系統可以應用於一 電腦设備6 0中’而電腦設備β 〇可以是習知的電腦裝置,豆 包括一訊號源介面6 〇 1、一記憶體6 〇 2、一中央處理單元八 (CPU) 603、一輸入裝置6〇4以及一儲存裝置6〇5。其中, 訊號源介面601係與一訊號源輸出裝置或是一訊號源紀錄 裝置連接,例如是光碟機、FireWire (IEEE 1394
Interface )、通用序列埠(USB )等介面裝置,而訊號源 輸出裝置例如是數位攝影機,訊號源紀錄裝置例如是 ▽ 00、0¥0等。記憶體6〇2可以是])1^^1或££?1^(^等任何一種 或數種設置於電腦裝置中的暫存記憶體。中央處理單元 6 0 3則可採用任何一種習知之中央處理器架構,例如, MLU、暫存器與控制器等,以進行各種資料之處理與運 异,以及控制電腦設備60中各元件的作動。輸入裝置6〇4 可以是滑鼠、鍵盤等能夠由使用者自行輸入訊息, 作各軟體模組的裝置。儲存裝置6〇5可以是硬碟貞、軟卞 機等任何一種或數種電腦可讀取之資料儲存裝置。 ” 本實施例中的各模組係指儲存於儲存裝置6〇5中或 一紀錄媒體中的軟體模組。中央處理單元6〇3於讀取 組之後,即可經由電腦設備6 〇巾的夂一从七— 供 姑二兩、★立& ▲ 1有bU中的各兀件來實現各模組的 ^“ ^二思,,熟習該項技術者亦可將本實施例中 所揭路之軟體模組製作成硬體,如Μ I〔 ^PPllcation-speciflc lntegrated 士…㈠晶片 荨,而不違反本發明之精神與範脅。 以下詳細說明本實施例中各模組之功能。
544634 五、發明說明(5) 在本實施例中,視訊接收模組1 0 1接收一原視訊資料 40,解碼模組1 02解碼原視訊資料4〇以取得一視訊資料 4 1 ’擷取方針選擇模組1 〇 6提供給一使用者選取所需之一 人物影像擷.取方針50,視訊擷取模組丨03則依據人物影像 擷取方針5 0自視訊資料4 1中擷取至少一關鍵晝面3 〇 2,然 後’影像處理模組1 〇 4針對視訊擷取模組丨〇 3所擷取的關鍵 晝面3 0 2進行影像處理;最後,人物縮圖序列產生模組1 〇 5 依據經過影像處理的關鍵晝面3 〇 2產生一人物縮圖序列 70。 ' 視訊接收模組1 01與訊號源介面6〇 1配合 如上所述 例如,視訊接收模組1〇1可以透過FireWire(IEEE 13以 Interface)取得儲存於數位攝影機中的原視訊資料4〇,或 是透過光碟機取得記錄於VCD、DVD中的原視訊資料4〇。原 視訊資料40係由各種視訊擷取裝置或接收裝置如數位攝影 機電視卡、機上盒等,以及各種視訊儲存裝置如D V D、 vC=儲存、傳送、廣播(Br〇adeasting)或接收的視訊, ”月b夠以各種視訊資料格式(如評肋—丨,評eg —2 MPEG= AVI’ ASF,謂等)儲存、傳送、廣播或接收。 式、=Γ02能夠針對輸入的原視訊資料4°之視訊格 m !縮方式進行解碼轉換還原為編碼前之 壓縮;气(:於編:刖之資料,例^,若編碼方式採用失真 ^ 細方式(Lossy Compressi〇n),則解 似於編石馬前之資料,以# “ J解碼後”月匕夠取得近 中,視訊二咖1。在本實施例 貝付匕括曰訊貧料411以及一影像資料。 五、發明說明(6) 音訊資料41 1為視訊資料41中所撥放 為視訊資料41所顯示的所有單 涤曰,影像資料412 資料41係由25張單張影像或2 9 9丫 ’通旦常每秒鐘的視訊 構成。本實施例中以小時:分:7/早查張景“象麵^ 面相對於視訊資料41之位置資m广:面’來表示每一晝 ^ 貝 σΚ ’例如,0 1 : 1 1 · 9 η . 9 g 為視訊資料41第1小時第U分2〇秒的第25個 .. :取方針選擇模組106與輸入裝置6〇4配-合,以便使用 者肖b夠利用輸入裝置6 〇 4於擷取方釙撰煜y f ^ A ^ ^ 5 0 〇 1 ° 6 ^ ^ ^ 擷取方針5 0會依據使用者輸入之選項設定笊的人物衫像 (pre”rence),決定是否要利用音訊‘析演S 鏡分析演算法則5 0 2’作為視訊資料進行臉孔偵測 二析々鼻法則50 3的前處理程序。音訊分析演算法則5〇1血 鏡頭變換分析演算法則5 〇 2的處理程序會精簡並減少進行' 臉孔偵測分析演算法則5 0 3的視訊資料量。 曰汛为析廣异法則5 〇 1係分析視訊資料4丨的音訊資料 411,以篩選音訊資料411中具有人聲之 、 對應影像資料片段。因此能將非人聲之音訊資料片段(如、 _ °喿音、靜音)及其對應影像資料片段,分離不進行臉孔偵 測分析演算法則之處理。 、 音訊分析演算法則501利用特徵抽取(Features Extraction)與特徵匹配(Features Matching)方式進行分 析’將人物角色之聲音區分並分類。音訊資料4 1 1之特徵 包括如頻譜特徵(Spectral Features)、音量(Volume)、
544634 五、發明說明(7) 零軸交會率(Zero Crossing Rate)、音調(Pitch)等。如 上所述,當抽取頻譜特徵(S p e c t r a 1 F e a t u r e s )後,其經 由雜音衰減(Noise Reduction)、分段(Segmentation),
並利用快速傅利葉轉換(Fast Four ier Transform)將音訊 資料411轉至頻率域(Frequency),然後由一組頻率濾波器 (Fi Iters)進行特徵值抽取,這組特徵值組成一個頻譜特 徵向量(Spectral Feature Vector)。音量是容易量測之 一種特欲’其可利用均方根值(RMS,Root Mean Square) 代表其特徵值,然後藉由音量(Volume)分析可輔助分段 (Segmentation)之進行,亦即透過靜音债測(silence Detection)幫助音訊資料411段落邊界(B〇undaries)之決 疋。零軸父會率(Zero Crossing Rate)為計算每段 (Clips)聲音波形(Waveform)與零軸(Zero Axis)交會之次 數。a ό周(Pitch)為聲音波形(Waveform)的基頻 (Fundamental Frequency)。因此,音訊資料411可利用上 述之音訊特徵及其特徵值所組成之特徵向量(1^31:111^ Vector)與人聲音訊樣本(Audi〇 templates)之特徵進行 分析比對’進行分析比對,以便取得所需具有人聲之音訊 資料片段及其對應影像資料片段。
—鏡頭變換分析演算法則5 〇 2係分析視訊資料4丨中影像 貢料412的鏡頭變換,並篩選視訊資料41中影像資料41 2中 ,個鏡頭變換後的第一個晝面,作為進行臉孔偵測分析演 异法則5 0 3的影像資料。鏡頭變換分析演算法則5 〇 2所分析 的影像資料4 1 2可為經過音訊分析演算法則5 〇 1篩選後具有
第10頁 544634
士聲之音訊資料所對應的影像資料412或未經音訊分析演 异法則5 0 1處理之視訊資料4丨中之影像資料4丨2。 一般而言,視訊資料41為一視訊串列(Vide〇 Sequence),其通常由許多場景(Scenes)所組成,而每一 場景又由複數個鏡頭變換(Sh〇ts)所組成。在影片中的最 小單位是一個鏡頭變換,而影片便是由許多的鏡頭變換所 堆砌起來的。通常,一個鏡頭由複數個視覺特性(如色彩 (Color)、紋理(Texture)、形狀(Shape)、動作(M〇ti〇^)
馨 具一致性之晝面(Frames)所組成,並且,其係依據攝影機 運動方向(Camera Directi on)與攝影取景角度(view Ang 1 e)的改變而有變化,例如,當攝影機以不同之攝影取 景角度來拍攝同一場景時,會產生不同之鏡頭變換,或以 相同之攝影取景角度但拍攝不同之區域時,亦會產,生不门 之鏡頭變換。由於鏡頭變換可由一些基本視覺特性而區 分,因此將視訊資料4 1分割成複數個連續的鏡頭變換是相 當容易達成的,此技術主要藉由分析一些基本視覺特性之 統計資料如視覺特性柱狀圖(Histogram),因此,當—查 面之視覺特性與前一晝面之視覺特性差異達到某一裎度$ 時,就可在此畫面與前一晝面間作一分割並視作為鏡^變 換’在本實施例中,可以挑選此鏡頭變換後的第一個貪= 作為進行臉孔偵測分析演算法則5 0 3的影像資料。 〜 臉孔偵測分析演算法則5 0 3利用臉孔偵測(Faee Detection),臉?L 辨識(Face Recognition) ^ ^ ^ ^ 資料4 1中具有相異臉孔特徵的視訊晝面以作為關鍵晝面°
第11頁 544634 五、發明說明(9) . 3 〇 2。臉孔偵測分析演算法則5 0 3所分析之影像資料4丨2可 為經過音訊分析演算法則501或鏡頭變換分析演算法則5〇2 4選後之影像資料4 1 2 ’或未經過音訊分析演算法則5 }或 鏡頭變換分析演异法則5 0 2師選後之影像資料4 1 2。' 在本實施例中’利用相異臉孔影像館8以資料表格8〇 儲存具有相異臉孔之影像資訊、該相異臉孔影像的臉°部特 徵組合及影像的位置資訊,並以資料鍊結串列儲存與該相 異臉孔景> 像具有相同臉部特徵之影像的位置資訊。如圖4 所示,其顯示於相異臉孔影像館8中所儲存的資°料,口回 如,於資料表格80的第一列中,.儲存具有一第 3^一 7資:二、表:第-臉孔的-第-臉部“組合 811、弟一衫像的一苐一位置資訊812,以及鍊社 -臉,之其他影像的複數個第一指標(ρ〇ιη。川有: 如才曰Μ、指標B、指標C、指標D等等。依此類推,於 表格8的第二列中’儲存具有一第二臉孔之 像、:: 第二!:。的一第二臉部特徵組合 他影像的複指22標82^ ^ 對具有臉孔晝面之影像,伯、二有臉孔旦面之影像後,針丨 孔畫面之影像、及其:部==,將第-張具有臉I·-”相異臉孔影像館”,告再扒、、σ /、衫像的位置資訊存入 時,將其影像中臉有面之影像 〃相異臉孔影像館”中存檔 第12頁 544634 五、發明說明(l〇)
的臉邛特徵組合進行比對,若該A 已存入"相異臉孔影像館”中存:::::臉部特徵組合與 張影像被淘汰,並將此被淘汰:=特徵組合相同則該 相異臉孔影像館"中特徵組合相同~之马、位置資訊儲存於|, 結串列中,若該張影像之臉部特且:所對應的資料鍊 ^ ^ ^ ^" t # ^ ^ ^ ^ ^ ^ 及其臉部特徵組合與影像的位^ 張影像 館",如此將輸入之影像資料412IlK = :異臉孔影像 最後存於”相異臉孔影像館"之影 =:?辨識比對。 之關鍵書面302。目tt a、<t象貝為本只鈿例中所篩選 舒〜:别取常被用來做臉孔辨識的方法之— t 分析(Μη—1 —卿邮—Ws,— (Ε· /方法所建立的臉孔辨識器通常稱為特徵臉 (Eigenface)辨識系統。 視訊擷取模組103可以是儲存在儲存裝置6〇5之一軟 提:的f : ΐ中央處理單元6 〇3的運算,依據本實施例所― 物影像擷取方針5 0,分析比對視訊資料4 1中的与 ,進而擷取合乎人物影像擷取方針5 〇的關鍵晝面3 〇 2。^ 影·像處理模組1 〇4可以是儲存在儲存裝置6〇5之一軟· 杈組,並透過中央處理單元6〇3之運算,以便針對所擷取 的關鍵畫面3 0 2進行影像處理,例如調整影像大小 (Rescaling)專影像處理(Image processing)功能。 人物縮圖序列產生模組1〇5可以是儲存在儲存裝置6〇5 之一軟體模組,並透過中央處理單元6〇3之運算,將經過 影像處理的關鍵晝面3 〇 2整合匯出,以產生人物縮圖序列 ΙΓί 第13頁 544634 五、發明說明(π) 70 〇 另外,所產生的人物縮圖序列7 0可以儲存在儲存裝置 6 0 5中,而所儲存的資料包括人物縮圖序列7 〇之串列頭 (Head )、各關鍵晝面3 0 2 (或縮圖)之鍊結串列(Linked List)或指標(p〇inter)等。 為使本發明之内容更容易理解,以下將舉一實例,以 說明依本發明較佳實施例之人物縮圖序列產生方法的流 程。 請參照圖2所示,在依本發明較佳實施例之人物縮圖 序列產生方法2中,步驟201接收原視訊資料4〇,例如,可 以將數位攝影機中紀錄的資料經由傳輸線送至訊號源介面 6〇1 ’以提供作為產生人物縮圖序列7〇的晝面與内容。 在步驟2 0 2中,解碼模組1〇2辨識原視訊資料4〇之格式 並解碼原視訊資料4 〇以產生經過解碼之視訊資料4丨,例 如’原視訊資料4 〇為I n t e r 1 a c e d Μ P E G - 2格式,亦即是, 一個訊框係由兩個訊場(field )所組成,所以,在^步 驟中,可以先進行MPEG-2格式的解碼,然後利用内插法/ (Interp〇latiori )解交錯以得到視訊資料41。 彳 梦罢ϋ驟203、中,視訊榻取模組103依據使用者藉由輸入 1^6中$ =入之選項設定訊息,執行於擷取方針選擇模組 取的人物影像擷取方針5〇來擷 :變者決定是否要利用音訊分析演算法―:二 一奐刀析决算法則5 0 2,作為視訊資料進行人物角色之 臉孔债測分析演算法則5 0 3的前處理程序。針對視訊資料
第14頁 544634 五、發明說明(12) 41的每一視訊晝面與内容(包含音訊内容),進行分析搜尋 並篩選取得符合人物影像擷取方針5〇的關鍵畫面30 2。需 注意者,本實施例可以擷取出複數張的關鍵晝面3 0 2。如 圖3所示,原視訊資料40經過解碼後會得到視訊資料4 1, 其包括複數張單張影像301 (每秒25張或2 9.9 7張),而經 過依據人物影像擷取方針5 〇的分析搜尋後會從該等單張影 像3 0 1中擷取出至少一關鍵晝面3 〇 2。 步驟204係判斷是否已經完成視訊資料41中所有内容 的分析比對,當未完成視訊資料4 1中所有内容的分析比對 時’重複進行步驟2 0 3 ;當完成視訊資料4 1中所有内容的 分析比對時,進行步驟2 〇 5。 在步驟2 0 5中,影像處理模組1〇4依據於步驟20 3中取 得之關鍵晝面30 2,針對縮圖圖框的解析度(Res〇iuti〇n ) 大小(Size)來進行影像處理(image Processing )’例如調整影像大小之處理程序。 在步驟2 0 6中’人物縮圖序列產生模組1 〇 5整合經過影 像處理的關鍵晝面3 0 2以產生人物縮圖序列7 〇。例如,所 掘取出的關鍵晝面3 02經過調整大小之後,人物縮圖序列 產生模組1 0 5將其依序排列於一視窗中,並且,當影像數 超過一視窗所能夠顯示的數量時,利用捲軸(Scr〇1丨bar )方式提供給使用者進行人物縮圖序列7 〇之瀏覽。 又,關鍵畫面302可以是如圖4所示的第一影像資兮孔 81、第二影像資訊82等f ’因此,所產生的人物縮圖序列 70顯示在視訊資料4 1中所有相異臉孔的影像,其可以代表
第15頁 544634 五、發明說明(13) 視訊資料41中所有出場人物的縮 302可以是如圖4所示的第—影 :另外,關鍵晝面 謝所有具有第縮;,顯示在視訊資 中具有第-臉孔之人物的縮;:列其視訊卿 臉孔之影像的關鍵晝面3 〇 2更敫' 卜,具有第一 輯視訊資料,其可以視作為且第一正為一特定人物之專 人專輯。 ,、有第一臉孔之特定人物的個 最後’步驟2〇7係於儲存穿 70,並且以程式定義之資+ 中儲存人物縮圖序列 中,鍊結串列如鍊結串列來餘存。其 等資訊,备—Μ科故A I 3人物細圖序列7 0之檔案名稱 像資料或人物::L含一人物縮圖之資訊(人物縮圖影 =^ ί 0圖影像之指標)以及與前(後)節點的鍊結 (L1 n k)資訊。 :上所述,由於依本發明較佳實施例之人物縮圖序列 生糸統與方法能夠自動分析視訊資料,並針對視訊資料 之音訊資料及影像資料,來整合視訊内容分析、音訊分 析、臉孔偵測、臉孔辨識等技術,以產生人物縮圖序列, 所以此夠有效率地利用視訊資料來產生所需的人物縮圖序 列0
另外’於利用本發明實施例中人物縮圖序列產生系統 與方法時’若使用者產生人物縮圖序列之選項設定 (Preference)未選擇音訊分析演算法則5〇1及鏡頭變換分 析演异法則5 0 2進行篩選,則使用者可挑選人物縮圖序列
第16頁 544634 五、發明說明(14) :之縮3 ’並藉由"相異臉孔影像館"中該縮圖對應的相显 =孔之衫像及其對應的賣料鍊結串列(其儲存與肖人物縮 圖影像具有相同臉部特徵之影像的位置資訊)取得視吒中 具有相同臉部特徵之影像,進行批次(Batch)的視訊編 或影像編輯,刪除或取代所有該相同臉部特徵之影像,与 像強化(Enhancement)加入視訊特效(Effect)、哀 々 彩調整等處理工作。 〜又已 、若使用者產生人物縮圖序列之選項設定有選 析演算法則501或鏡頭變換分析演算法則5〇2進行篩‘:二 ,用者可挑選人物縮圖序列中之縮圖,並藉由"相昱孔 衫像館"中該縮圖對應的相異臉孔二 鍊結串列取得被音訊分析演算法則二頭= 二法則5G2筛選後具有相同臉部特徵之影像,進行 視讯編輯或影像編輯,刪除或取^^ ^ ^ ^ ^ ^ ^ ^ 、 影像,影像強化、加入視訊特效代;目,臉部特徵之 工作。 行双冗度、色彩調整等處理 f像=彳如泉Τ以依批次的方式將所有具有相同臉部特徵之 二像δ併為此特定人物之個人視訊剪輯,而且 者手動透過影像處理模組丨04對所選取 由一使用 作视訊編輯或影像編輯,如 個人硯訊剪輯 徵之影像、推;r旦/撞改儿 A取代所有該相同臉部特 度、色彩等處理工作。 /周正衫像71: 以上所述僅為舉例性,而非為限制性去 本發明之精神與範疇,而對其 Y任何未脫離 、^仃义寺效修改或變更,均 第17頁 544634 五、發明說明(15) 應包含於後附之申請專利範圍中。
第18頁 544634 圖式簡單說明 【圖式簡單說明】 圖1為一示意圖,顯示依本發明較佳實施例之人物縮 圖序列產生系統之結構。 圖2為一流程圖,顯示依本發明較佳實施例之人物縮 圖序列產生方法的流程。 圖3為一示意圖,顯示於本發明較佳實施例之人物縮 圖序列產生方法中擷取關鍵晝面的示意圖。
圖4為一示意圖,顯示依本發明較佳實施例之相異臉 孔影像館之資料儲存結構的示意圖。 【圖式符號說明】
101 視 訊 接 收 模 組 102 解 碼 模 組 103 視 訊 #1 取 模 組 104 影 像 處 理 模 組 105 人 物 縮 圖 序 列 產 生 模 組 106 操 取 方 針 選 擇 模 組 2 人 物 縮 圖 序 列 產 生 方 法 201 〜207 人 物 縮 圖 序 列 產 生 方 法之流程 301 單 張 影 像 302 關 鍵 晝 面 40 原 視 訊 資 料 41 視 訊 資 料 411 音 訊 資 料
第19頁 544634
第20頁
圖式簡單說明 412 影像資料 50 人物影像擷取方針 501 音訊分析演算法則 502 鏡頭變換分析演算法則 503 臉孔偵測分析演算法則 60 電腦設備 601 訊號源介面 602 記憶體 603 中央處理單元 604 輸入裝置 605 儲存裝置 70 人物縮圖序列 8 相異臉孔影像館 80 資料表格 81 第一影像資訊 811 第一臉部特徵組合 812 第一位置資訊 813 第一指標 82 第二影像資訊 821 第二臉部特徵組合 822 第二位置資訊 823 第二指標 A 指標A B 指標B 544634 圖式簡單說明 c 指標c
D 指標D
1_圓II 第21頁

Claims (1)

  1. 544634 六、申請專利範圍 ---- 1、 一種人物縮圖序列產生系統,包含: 一視訊接收模組,其接收一原視訊資料; 一解碼模組,其解碼該原視訊資料以取得一視气次 料; °貝 一視訊操取模組,其依據一人物影像擷取方針自7 訊資料中擷取一關鍵晝面(key frame );以及 ~視 一人物縮圖序列產生模組,其依據所擷取之該 面產生一人物縮圖序列。 f、旦 2、 如申請專利範圍第1項所述之人物縮圖序列產味 二人· 上恭統, 更包含· 一影像處理模組,其於擷取該關鍵晝面後,針斜 取之該關鍵晝面進行影像處理。 σ 3、 如申請專利範圍第1項所述之人物縮圖序列產生系統, 更包含: 一擷取方針選擇模組,其接受一使用者之選擇以提供 該人物影像操取方針。 4、 如申請專利範圍第1項所述之人物縮圖序列產生系統, 其中該人物影像擷取方針包含一臉孔偵測分析演算法則, 其分析该視訊資料中具有臉孔特徵的一影像資料,該視訊 擷取模組依據該臉孔偵測分析演算法則從該影像資料中擷 取該關鍵晝面。
    544634 六、申請專利範圍 5、 如申請專利範圍第4項所述之人物縮圖序列產生系統, 其中該視訊擷取模組係依據該臉孔偵測分析演算法則擷取 具有相同之臉孔特徵的該影像資料以作為該關鍵晝面。‘ 6、 如申請專利範圍第5項所述之人物縮圖序列產生系統, 其中該人物縮圖序列為一特定人物之縮圖序列。 7、 如申請專利範圍第6項所述之人物縮圖序列產生系統, 更依據該特定人物之縮圖序列產生該特定人物之專輯視訊 資料。 σ 8、 如申請專利範圍第4項所述之人物縮圖序列產生系統, 其中該視訊擷取模組係依據該臉孔偵測分析演算法則掏取 具有相異之臉孔特徵的該影像資料以作為該關鍵畫面。 9、 如申請專利範圍第4項所述之人物縮圖序列產生系統, 其中該人物影像擷取方針更包含一音訊(aud i 〇 )分析演 鼻法則,其分析該視訊資料中的一音訊資料,該視訊擷取 模組係依據該音訊分析演算法則篩選具有人聲之該音訊資 料所對應之該影像資料,然後依據該臉孔偵測分析演算法 貝J k該影像資料中操取該關鍵晝面。 1 〇、如申請專利範圍第4項所述之人物縮圖序列產生系
    第23頁 544634
    統’其中該人物影像擷取方針p 、土則 ^ T更包含一鏡頭變換分析演算 法則,其係分析該視訊資料中— 六、申請專利範圍 ^ τ ~影像資料的鏡頭變換,該 視a掏取模組係依據該鏡頭變 -欠卜丨 文狹分析演异法則篩選該影像 貝料,然後依據該臉孔偵測分析、、# ’ 擷取該關鍵晝面。 刀析决异法則以影像資料中 種人物縮圖序列產生方法,包含·· 視汛接收步驟,其接收一視訊資料; 解碼步驟,其解碼該原視訊資料以取得一視气資 一視訊擷取步驟,其依據一人物影像擷取 訊資料中擷取一關鍵晝面;以及 万針自该視 一縮圖序列產生步驟,其依據所擷取之該 生一縮圖序列。 刚鍵晝面產 1 2、如申請專利範圍第丨丨項所述之人物縮圖序 法,更包含: 」座生方 一影像處理步驟,其於擷取該關鍵晝面後, 取之孩關鍵晝面進行影像處理。 、、口 13、如申請專利範圍第11項所述之人物縮圖序列產生 法,更包含: 力 人物=㈡步驟’其操受一使用者之選擇犧
    544634 六、申請專利範圍 1 4、如申請專利範圍第1 1項所述之人物縮圖序列產生方 法,其中該人物影像擷取方針包含一臉孔偵測分析演算法 則,其分析該視訊資料中具有臉孔特徵的一影像資料了兮 視訊擷取步驟依據該臉孔偵測分析演算法則從該影像資料 中榻取該關鍵晝面。 ' 1 5、如申請專利範圍第1 4項所述之人物縮圖序列產生方 法’其中該視訊擷取步驟係依據該臉孔偵測分析演算法則 擷取具有相同之臉孔特徵的該影像資料以作為該關鍵晝 面。 1 6、如申請專利範圍第1 5項所述之人物縮圖序列產生方 法,其中該人物縮圖序列為一特定人物之縮圖序列。 1 7、如申請專利範圍第丨6項所述之人物縮圖序列產生方 法,更依據該特定人物之縮圖序列產生該特定人物之專輯 視訊資料。 1 8、如申请專利範圍第1 4項所述之人物縮圖序列產生方 法,其中該視訊擷取步驟係依據該臉孔偵測分析演算法則 擷取具有相異之臉孔特徵的該影像資料以作為該關鍵晝 面。
    第25頁 544634 六、申請專利範圍 1 9、如申請專利範圍第1 4項所述之人物縮圖序列產生方 法,其中該人物影像擷取方針更包含一音訊分析演算法 則,其分析該視訊資料中的一音訊資料,該視訊擷取步驟 係依據該音訊分析演算法則先篩選具有人聲之該音訊資料 所對應之該影像資料,然後依據該臉孔偵測分析演算法則 從該影像資料中擷取該關鍵晝面。 2 0、如申請專利範圍第1 4項所述之人物縮圖序列產生方 法,其中該人物影像擷取方針更包含一鏡頭變換分析演算 法則,其係分析該視訊資料中一影像資料的鏡頭變換,該 視訊操取步驟係依據該鏡頭變換分析演算法則篩選該影像 資料’然後依據該臉孔偵測分析演算法則從該影像資料中 擷取該關鍵晝面。 、 21、一種記錄媒體,其係記錄用以使電腦達成—人物 序列產生,法之程式,該人物縮圖序列產生方法包含:β 視汛接收步驟,其接收一視訊資料; 、、·解碼步驟,其解碼該原視訊資料以取得一視訊次 人物影像擷取方針 其依據所擷取之該 自該视 關鍵書 一視訊擷取步驟,其依據一 汛^料中梅取一關鍵畫面;以及 一人物縮圖序列產生步驟, 面產生一人物縮圖序列。
    第26頁 六、申請專利範圍 2 2、如申請真刹々斤 該人物 對所擷 該人物 以提供 該人物 析該視 步驟依 關鍵畫 該視訊 相同之 該人物 縮圖序列產ί方:第21項所述之記錄媒體,其 々法更包含: 一影像處理牛跟 ^ 取之該關鍵晝“=取該關鍵晝面後, 23、如申請專利範圍 縮圖序列產生方法更 一擷取方針選擇 該人物影像掏取方針 第2 1項所述之記錄媒體,其中 包含: 步驟’其接受一使用者之選擇 24、如申請專利範圍第21項所述之記錄媒體,其中 影,擷取方針包含一臉孔偵測分析演算法則,其分 Λ資料中具有臉孔特徵的一影像資料,該視訊擷取 據該臉孔偵測分析演算法則從該影像資料中擷取該 面。 2 5、如申請專利範圍第2 4項所述之記錄媒體,其中 擷取步驟係依據該臉孔偵測分析演算法則擷取具有 臉孔特徵的該影像資料以作為該關鍵畫面。 2 6、如申請專利範圍第2 5項所述之記錄媒體,其中 縮圖序列為一特定人物之縮圖序歹】 2 7、如申請專利範圍第2 6項所述之記錄媒體,更依據該特 544634 六、申請專利範圍 定人物之縮圖序列產生該特定人物之專輯視訊資料。 2 8、如申請專利範圍第2 4項所述之記錄媒體,其中該視訊 擷取步驟係依據該臉孔偵測分析演算法則擷取具有相異之 臉孔特徵的該影像資料以作為該關鍵晝面。 29、如申請專利範圍第24項所述之記錄媒體,其中該人物 影像擷取方針更包含一音訊分析演算法則,其分析該視訊 資料中的一音訊資料,該視訊擷取步驟係依據該音訊分析 演算法則先篩選具有人聲之該音訊資料所對應之該影像資 料’然後依據該臉孔偵測分析演算法則從該影像資料中擷 取該關鍵晝面。 3^0、如申請專利範圍第24項所述之記錄媒體,其中該人物 於像擷取方針更包含一鏡頭變換分析演算法則,其係分析 該視訊資料Φ 以你吹,, 1 T 一影像資料的鏡頭變換,該視訊擷取步驟係 演算法則筛選該影像資料’雜 品。 刀析、;貝鼻法則從該影像資料中擷取該關鍵晝
TW090124776A 2001-10-05 2001-10-05 Thumbnail sequence generation system and method TW544634B (en)

Priority Applications (2)

Application Number Priority Date Filing Date Title
TW090124776A TW544634B (en) 2001-10-05 2001-10-05 Thumbnail sequence generation system and method
US10/033,782 US20030068087A1 (en) 2001-10-05 2002-01-03 System and method for generating a character thumbnail sequence

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
TW090124776A TW544634B (en) 2001-10-05 2001-10-05 Thumbnail sequence generation system and method

Publications (1)

Publication Number Publication Date
TW544634B true TW544634B (en) 2003-08-01

Family

ID=29212717

Family Applications (1)

Application Number Title Priority Date Filing Date
TW090124776A TW544634B (en) 2001-10-05 2001-10-05 Thumbnail sequence generation system and method

Country Status (2)

Country Link
US (1) US20030068087A1 (zh)
TW (1) TW544634B (zh)

Families Citing this family (39)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100453966B1 (ko) * 2002-01-09 2004-10-20 엘지전자 주식회사 방송 프로그램의 대표화면 표시방법
US20050058431A1 (en) * 2003-09-12 2005-03-17 Charles Jia Generating animated image file from video data file frames
US20050228849A1 (en) * 2004-03-24 2005-10-13 Tong Zhang Intelligent key-frame extraction from a video
US8411902B2 (en) * 2004-04-07 2013-04-02 Hewlett-Packard Development Company, L.P. Providing a visual indication of the content of a video by analyzing a likely user intent
US9053754B2 (en) 2004-07-28 2015-06-09 Microsoft Technology Licensing, Llc Thumbnail generation and presentation for recorded TV programs
KR101114110B1 (ko) 2005-02-01 2012-02-21 엘지전자 주식회사 압축률을 이용한 애니메이션 파일의 썸네일 생성 방법
US7760956B2 (en) * 2005-05-12 2010-07-20 Hewlett-Packard Development Company, L.P. System and method for producing a page using frames of a video stream
JP2007189473A (ja) * 2006-01-13 2007-07-26 Hitachi Ltd 動画再生装置
JP5025217B2 (ja) * 2006-10-02 2012-09-12 京セラ株式会社 情報処理装置、情報処理方法および情報処理プログラム
US7707224B2 (en) 2006-11-03 2010-04-27 Google Inc. Blocking of unlicensed audio content in video files on a video hosting website
CA2667782A1 (en) * 2006-11-03 2008-05-15 Google Inc. Content management system
JP4998026B2 (ja) 2007-03-15 2012-08-15 ソニー株式会社 画像処理装置、撮像装置、および画像表示制御方法、並びにコンピュータ・プログラム
CN101730902A (zh) 2007-05-03 2010-06-09 谷歌公司 数字内容贡献的货币化
US8094202B2 (en) * 2007-05-17 2012-01-10 Canon Kabushiki Kaisha Moving image capture apparatus and moving image capture method
US8611422B1 (en) * 2007-06-19 2013-12-17 Google Inc. Endpoint based video fingerprinting
US7596471B1 (en) 2007-08-16 2009-09-29 Young Electric Sign Company Methods of monitoring electronic displays within a display network
JP4683103B2 (ja) 2008-09-22 2011-05-11 ソニー株式会社 表示制御装置、表示制御方法、およびプログラム
EP2378917B1 (en) * 2009-01-16 2012-12-05 The Procter & Gamble Company Apparatus for modifying keratinous surfaces
US20100281371A1 (en) * 2009-04-30 2010-11-04 Peter Warner Navigation Tool for Video Presentations
US8359537B2 (en) 2009-04-30 2013-01-22 Apple Inc. Tool for navigating a composite presentation
US8897603B2 (en) * 2009-08-20 2014-11-25 Nikon Corporation Image processing apparatus that selects a plurality of video frames and creates an image based on a plurality of images extracted and selected from the frames
US8582834B2 (en) 2010-08-30 2013-11-12 Apple Inc. Multi-image face-based image processing
US10291597B2 (en) 2014-08-14 2019-05-14 Cisco Technology, Inc. Sharing resources across multiple devices in online meetings
US10034038B2 (en) 2014-09-10 2018-07-24 Cisco Technology, Inc. Video channel selection
US10542126B2 (en) 2014-12-22 2020-01-21 Cisco Technology, Inc. Offline virtual participation in an online conference meeting
US9948786B2 (en) 2015-04-17 2018-04-17 Cisco Technology, Inc. Handling conferences using highly-distributed agents
US10460196B2 (en) * 2016-08-09 2019-10-29 Adobe Inc. Salient video frame establishment
US10592867B2 (en) 2016-11-11 2020-03-17 Cisco Technology, Inc. In-meeting graphical user interface display using calendar information and system
US10516707B2 (en) 2016-12-15 2019-12-24 Cisco Technology, Inc. Initiating a conferencing meeting using a conference room device
US10440073B2 (en) 2017-04-11 2019-10-08 Cisco Technology, Inc. User interface for proximity based teleconference transfer
US10375125B2 (en) 2017-04-27 2019-08-06 Cisco Technology, Inc. Automatically joining devices to a video conference
US10375474B2 (en) 2017-06-12 2019-08-06 Cisco Technology, Inc. Hybrid horn microphone
US10477148B2 (en) 2017-06-23 2019-11-12 Cisco Technology, Inc. Speaker anticipation
US10516709B2 (en) 2017-06-29 2019-12-24 Cisco Technology, Inc. Files automatically shared at conference initiation
US10706391B2 (en) 2017-07-13 2020-07-07 Cisco Technology, Inc. Protecting scheduled meeting in physical room
US10091348B1 (en) 2017-07-25 2018-10-02 Cisco Technology, Inc. Predictive model for voice/video over IP calls
CN107948646B (zh) * 2017-09-26 2019-02-05 北京字节跳动网络技术有限公司 一种视频摘要生成方法与视频再编码方法
CN108256466B (zh) * 2018-01-12 2020-06-23 Oppo广东移动通信有限公司 数据处理方法、装置、电子设备及计算机可读存储介质
KR102656963B1 (ko) 2019-04-03 2024-04-16 삼성전자 주식회사 전자 장치 및 전자 장치의 제어 방법

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5164831A (en) * 1990-03-15 1992-11-17 Eastman Kodak Company Electronic still camera providing multi-format storage of full and reduced resolution images
US5191645A (en) * 1991-02-28 1993-03-02 Sony Corporation Of America Digital signal processing system employing icon displays
KR970000761B1 (ko) * 1992-10-07 1997-01-18 대우전자 주식회사 소형 디지탈 방식 고선명 텔레비젼
US5553221A (en) * 1995-03-20 1996-09-03 International Business Machine Corporation System and method for enabling the creation of personalized movie presentations and personalized movie collections
US5847703A (en) * 1997-07-03 1998-12-08 Vsoft Ltd. Browsing system method and apparatus for video motion pictures
JP4227241B2 (ja) * 1999-04-13 2009-02-18 キヤノン株式会社 画像処理装置及び方法
US6751776B1 (en) * 1999-08-06 2004-06-15 Nec Corporation Method and apparatus for personalized multimedia summarization based upon user specified theme
JP4051841B2 (ja) * 1999-12-01 2008-02-27 ソニー株式会社 画像記録装置および方法
US6807290B2 (en) * 2000-03-09 2004-10-19 Microsoft Corporation Rapid computer modeling of faces for animation
US6813618B1 (en) * 2000-08-18 2004-11-02 Alexander C. Loui System and method for acquisition of related graphical material in a digital graphics album

Also Published As

Publication number Publication date
US20030068087A1 (en) 2003-04-10

Similar Documents

Publication Publication Date Title
TW544634B (en) Thumbnail sequence generation system and method
JP4228320B2 (ja) 画像処理装置および方法、並びにプログラム
US9208226B2 (en) Apparatus and method for generating evidence video
TWI253860B (en) Method for generating a slide show of an image
CN103024607B (zh) 用于显示摘要视频的方法和设备
JP4973098B2 (ja) 画像処理装置、画像処理方法およびプログラム
US9628673B2 (en) Near-lossless video summarization
JP4269849B2 (ja) マルチメディアプレゼンテーションを自動的に生成する方法、及びそのコンピュータプログラム
US7020351B1 (en) Method and apparatus for enhancing and indexing video and audio signals
US11604935B2 (en) Scene and shot detection and characterization
CN107430780B (zh) 用于基于视频内容特性的输出创建的方法
US20120082378A1 (en) method and apparatus for selecting a representative image
US20060008152A1 (en) Method and apparatus for enhancing and indexing video and audio signals
US20050058431A1 (en) Generating animated image file from video data file frames
JP4490214B2 (ja) 電子アルバム表示システム、電子アルバム表示方法、及び電子アルバム表示プログラム
CN101287089A (zh) 摄像设备、图像处理设备及其控制方法
US20080320046A1 (en) Video data management apparatus
JP3649468B2 (ja) 撮影機能付き電子アルバムシステム
JP2006081021A (ja) 電子アルバム表示システム、電子アルバム表示方法、電子アルバム表示プログラム、画像分類装置、画像分類方法、及び画像分類プログラム
KR20130031179A (ko) 요약 동영상 디스플레이 방법 및 장치
TWI244005B (en) Book producing system and method and computer readable recording medium thereof
Teodosio et al. Salient stills
JP2008067334A (ja) 画像処理装置および方法、並びにプログラム
Aner-Wolf et al. Video summaries and cross-referencing through mosaic-based representation
JP2010219607A (ja) ターゲットフレーム抽出装置、撮像装置およびデジタルカメラ

Legal Events

Date Code Title Description
GD4A Issue of patent certificate for granted invention patent
MM4A Annulment or lapse of patent due to non-payment of fees