TW201211799A

TW201211799A - Keyword automation of video content

Info

Publication number: TW201211799A
Application number: TW100106767A
Authority: TW
Inventors: Christopher E Holladay; William P Shaouy
Original assignee: Ibm
Priority date: 2010-03-05
Filing date: 2011-03-01
Publication date: 2012-03-16
Also published as: US20110218994A1; WO2011107526A1

Description

201211799 六、發明說明：【發明所屬之技術領域】本發明揭示一種用於自動產生及關聯針對視訊内容之搜尋關鍵字的系統及相關方法。【先前技術】在習知方法中，手動產生針對視訊内容之搜尋關鍵字且將其}曰派給S亥視訊内容，從而使在網站中登錄該視訊内容的效率低下。又，因為手動產生之搜尋關鍵字與該視訊内容任意相關聯，所以習知方法令之搜尋關鍵字並不有助於使用者搜尋該視訊内容。【發明内容】根據本發明之一實施例，一種用於自動處理針對視訊内容之關鍵字的方法包含：藉由一電腦系統之一處理器載入該視訊内容，該視訊内容包含至少一影像圖框及一音訊串流，自該至少一影像圖框產生一影像型樣表，其中該影像型樣表之一項目包含影像型樣識別符、影像型樣名稱、影像型樣計數及影像型樣權重屬性，其中該影像型樣識別符識別該至少-影像圖框中之一影像型樣，其中該影像型樣名稱為表示該影像型樣之一文數字式（alphanumeric)文字 (text) ’其中該影像型樣計數表示該至少—影像圖框中之該影像型樣的出現次數，且其中該影像型樣權重表示該至少-影像圖框内《該影像型樣之一相對頻帛；自該音訊串流產生-字型樣表，其中該字型樣表之一項目包含字型樣識別符、字型樣名稱、字型樣計數及字型樣權重屬性，其 154433.doc 201211799 中5亥子型樣識別符識別該音訊串流中之一字型樣，其中該子型樣名稱為表示該字型樣之一文數字式文字，其中該字型樣計數表示該音訊串流中之該字型樣的出現次數，且其中邊字型樣權重表#該音m串流内之言亥字型樣的—相對頻率；針對該影像型樣表及該字型樣表中之所有項目 (entries)來什算該各別權重，其中該各別權重選自由該影像型樣權重及該字型樣權重組成之群組；基於該計算出之權重自該影像型樣表及該字型樣表產生一關鍵字清單，其中該關鍵字清單之一項目選自由該影像型樣表之項目及該子型樣表之項目組成之群組，且其中該關鍵字清單之該項目包含泛型（generic)型樣識別符、泛型型樣名稱、泛型型樣計數及泛型型樣權重等屬性；及將該所產生之關鍵字清單整合於與該視訊内容相關聯之一網頁的元資料 (metadata)中，以使得在使用該元資料進行的web搜尋中利用該關鍵字清單。根據本發明之一實施例，一種電腦程式產品包含體現一電腦可讀程式碼之一電腦可讀記憶體單元。該電腦可讀程式碼含有在由一電腦系統之一處理器執行時實施一種用於自動處理針對視訊内容之關鍵字的方法之指令。根據本發明之一實施例，一種電腦系統包含一處理器及编接至該處理器之一電腦可讀記憶體單元，其中該電腦可讀記憶體單元含有在由該處理器執行時實施一種用於自動處理針對視訊内容之關鍵字的方法之指令。根據本發明之一實施例，一種用於支援電腦架構之程序’該程序包含提供針對以下操作中之至少一者的至少一 154433.doc 201211799 支援服務：在一計算系統中產生、整合、主控'維護及部署電月®可讀程式碼’其中該程式碼結合該計算系統能夠執行一種用於自動處理針對視訊内容之關鍵字的方法。【實施方式】圖1說明根據本發明之實施例之用於自動產生及關聯針對視訊内容之搜尋關鍵字的系統丨〇。系統ίο包含一web伺服器n及一資料庫3〇。web伺服器η 為執行一影像辨識工具12、一話語辨識工具13、一搜尋引擎14及一關鍵字自動化程序2〇之一電腦系統。資料庫3〇包含至少一視訊内容及分別與該至少一視訊内容之視訊内容 3 1相關聯之一關鍵字清單40。視訊内容3丨包含至少一影像圖框及一音訊串流。資料庫30亦儲存與已由web伺服器J i 產生之視訊内容3 1相關聯之一影像型樣表3 2及一字型樣表 33 »影像型樣表32包含影像型樣識別符、影像型樣名稱、影像型樣計數及影像型樣權重四（4)個屬性。影像型樣表32 追縱視訊内容3 1之每一影像型樣的頻率。字型樣表33亦包含字型樣識別符、字型樣名稱、字型樣計數及字型樣權重四（4)個屬性。字型樣表33追蹤視訊内容31之每一字型樣的頻率。關鍵字自動化程序20採用視訊内容3丨作為輸入且藉由使用影像型樣表32及字型樣表33來產生與視訊内容31相關聯之關鍵字清單40。關鍵字自動化程序2〇調用影像辨識工具 12且產生針對視訊内容31之影像型樣表32。關鍵字自動化程序20调用活έ吾辨識工具13且產生針對視訊内容η之字型 154433.doc 201211799 樣表33。因為關鍵字清單4〇係藉由將影像型樣表32及字型樣表33 s併而產生’所以關鍵字清單包含泛型型樣識別符、泛型型樣名稱、泛型型樣計數及泛型型樣權重四⑷個屬性。取決於—項目選自哪—型樣表，該泛型型樣識別符才木用該影像型樣識別符或該字型樣識別符之值❶將所選擇項目中之相應屬性複製至關鍵字清單4〇之項目中。舉例而言’若選擇將影像型樣表32中之一項目合併至關鍵字清單 4〇中，則该泛型型樣識別符、該泛型型樣名稱、該泛型型樣計數及該泛型型樣權重分別複製影像型樣表32之所選擇項目的这影像型樣識別符、該影像型樣名稱、該影像型樣計數及該影像型樣權重。若選擇將字型樣表33之項目合併至關鍵字清單4G中，則該泛型型樣識別符、該泛型型樣名稱、該泛型型樣計數及該泛型型樣權重分別複製字型樣表 33之所選擇項目的該字型樣識別符、該字型樣名稱、該字型樣計數及該字型樣權重。web伺服器丨i之管理員判定在關鍵字清單40中將保留多少項目1鍵字自動化程序職習知視訊内容處置方法之手動關鍵字產生及指派自動化。搜尋引擎14存取關鍵字清單40以服務於針對視訊内容” 之搜尋凊求。該搜尋請求係自想要藉由在關鍵字清單4〇中作為’乏型型樣名稱所列出&一關鍵字來搜尋視訊内容3工的終端使用者接收到。圖2及圖2A為描繪根據本發明之實施例之用於自動產生及關聯針對視訊内容之搜尋關鍵字的方法之流程圖。在步驟100中，關鍵字自動化程序自資料庫擷取視訊内 I54433.doc 201211799 容。接著’關鍵字自動化程序繼續進行步驟2〇〇。在步驟200中，關鍵字自動化程序藉由執行一影像型樣表產生程式來產生針對所擷取之視訊内容的影像圖框之一影像型樣表。參見以下針對由該影像型樣表產生程式執行之步驟的圖3之描述❶該影像型樣表產生程式為關鍵字自動化程序之子概念但未必為關鍵字自動化程序之單獨的子模組。接著，關鍵字自動化程序繼續進行步驟3 〇〇。在步驟300中，關鍵字自動化程序藉由執行一字型樣表產生程式來產生針對所擷取之視訊内容的音訊争流之一字型樣表。參見以下針對由該字型樣表產生程式執行之步驟的圖4之描$。接著，關鍵字自動化程序繼續進行步驟 400 〇如在圓2Α中所展示，可同時執行步驟2〇〇及步驟3〇〇。因為該影像型樣表產生程式及該字型樣表產生程式在產生該衫像型樣表及該字型樣表的過程中僅共用書亥視訊内容作為輸入但彼此不具有任何循序相依性，所以同時執行步驟 2〇〇及步驟遍產生㈣像型樣表及字型樣表之集合與循序地執行步驟200及步驟300時產生的集合相同。在步驟彻巾，騎字自純程序藉由執行_型樣權重計算程式來計算每—影像型樣及字型樣之一相對權重。每影像型樣及字型樣之該相對權重表示—特定型樣相對於影像型樣或字型樣之總數目的出現頻率。參見以下針對由 -亥型樣權重計算程式執行之步驟的圖5之描述。接著，關鍵字自動化程序繼續進行步驟5〇〇。 J54433.doc 201211799 在步驟500中，關鍵字自動化程序藉由執行一關鍵字清單產生程式來產生一關鍵字清單。參見以下針對由該關鍵字清單產生程式執行之步驟的圖6之描述。接著，關鍵字自動化程序繼續進行步驟600。在步驟600中’關鍵字自動化程序更新與該視訊内容相關聯之一網頁的元資料以整合該所產生之關鍵字清單，以使得在使用該元資料服務於至web伺服器之針對視訊内容之web搜尋請求的過程中利用該關鍵字清單。接著，關鍵字自動化程序結束。圖3為描繪根據本發明之實施例之以上圖2的用於產生針對視訊内容之影像型樣表之方法的流程圖，該方法由影像型樣表產生程式執行。該影像型樣表產生程式針對㈣鍵字自動化程序已在以上圖2之步驟100中接收到之視訊内容中之每一影像圖框反覆步驟2G5至步驟225。當該影像型樣表產生程式完成處理在該視訊内容令之所有影像圖框時，該影像型樣表產生程式終止且該關鍵字自動化程序重新開始操作。在步驟205中，影像型樣表產 —1 ®别聆1豕圓榧獒父至影像辨識工具。回應於步驟2〇5，影像辨識工具產生對應於該當前影像圖框之一當前影像圖框名稱且將” 前影像圖框名稱發送至影像型樣表產生程式。接著，= 型樣表產生程式繼續進行步驟2〗〇。 " 154433.doc 201211799 像型樣表產生程式繼續進行步驟2丨5 β 在步驟215中，影像型樣表產生程式判定該當前影像型樣名稱是否為新的。若影像型樣表產生程式判定該當前影像型樣名稱為新的，則影像型樣表產生程式繼續進行步驟 220。若影像型樣表產生程式判定該當前影像型樣名稱已存在於影像型樣表中，則影像型樣表產生程式繼續進行步驟 225 〇在步驟220中，影像型樣表產生程式在影像型樣表中針對忒當則影像型樣名稱登錄一新項目且初始化該新項目之所有屬性。影像型樣表產生程式將唯一的整數值指派給該新項目之影像型樣識別符IDj。影像型樣表產生程式將該新衫像型樣名稱指派給該新項目之影像型樣名稱。影像型樣表產生程式將該新項目之影像型樣計數c〇unt(id_i)及該新項目之影像型樣權重㈣GHT(ID一I)分別初始化為零 ()接著，影像型樣表產生程式繼續進行步驟225。步驟225中，影像型樣表產生程式增加在該影像型樣表中的對應於該當前影像圖框之一項目之影像型樣計數， =項目為在步驟215中判定之已存在之項目或在步驟22〇中 A錄之新項目。接著’影像型樣表迴圈回至步驟205來處理來自該視訊内容之下一影像圖框。圖為描繪根據本發明之實施例之以上圖2的用於產生針對視訊内容之字型樣表之方法的流程圖該方法由字型樣表產生程式執行。在步驟305中，字型樣表產生程式接收由於對該視訊内 154433.doc 201211799 容之一音訊串流執行該話語辨識工具而產生之字型樣。字型樣表產生程式繼續進行步驟31〇。該字型樣表產生程式針對該關鍵字自動化程序已在以上圖2之步驟1〇〇中接收到之該視訊内容之該音訊串流中之每一子型樣反覆步驟310至步驟325。當該字型樣表產生程式完成處理在該視訊内容之該音訊串流中之所有字型樣時， s亥字型樣表產生程式終止且該關鍵字自動化程序重新開始操作。在步驟310中，字型樣表產生程式接收由話語辨識工具產生之一當别子型樣名稱。接著，字型樣表產生程式繼續進行步驟3 1 5。在步驟3 15中，子型樣表產生程式判定該當前字型樣名稱是否為新的。若字型樣表產生程式判定該當前字型樣名稱為新的，則字型樣表產生程式繼續進行步驟32〇。若字型樣表產生程式判定該當前字型樣名稱已存在於該字型樣表中，則字型樣表產生程式繼續進行步驟3 2 5。在步驟320中，字型樣表產生程式在該字型樣表中針對 6亥當刖字型樣名稱登錄一新項目且初始化該新項目之所有屬性。字型樣表產生程式將唯一的整數值指派給該新項目之字型樣識別符ID_W。字型樣表產生程式將該新字型樣名稱指派給該新項目之字型樣名稱。字型樣表產生程式將該新項目之字型樣計數COUNT(ID_W)及該新項目之字型樣權重WEIGHT(ID_W)分別初始化為零（〇) 〇接著，字型樣表產生程式繼續進行步驟325。 154433.doc 201211799 在步驟325中’予型樣表產生程式增加在該字型樣表中的對應於該當前字_讀之-項目之字型樣計數，該項目為在步驟315中判之已存在之項目或在步驟32g中登錄之新項目n，字型樣表迴圈回至步驟31〇來處理該視訊内容之該音訊串流之下一字型樣名稱。圖5及圖5A為描繪根據本發明之實施例之用於計算影像型樣表的影像型樣名稱之相對權重及字型樣表的字型樣名稱之相對權重的方法之流㈣’該方法由型樣權重計算程式執行。在步驟4G5中’型樣權重計算程式自資料庫擷取影像型樣表及字型樣表。接著，型樣權重計算程式繼續進行步驟 410。在步驟410中，型樣權重計算程式計算且儲存針對在該影像型樣表中的所有影像型樣之影像型樣計數的一總和 SUM j »接著，型樣權重計算程式繼續進行步驟* 1 $。型樣權重計算程式針對由該影像型樣表之每一影像型樣識別符IDj所唯一識別之所有影像型樣項目執行步驟 415。在步驟415中，型樣權重計算程式將一當前影像型樣項目之權重計算為該當前f彡㈣樣項目之影像型樣計數除以來自步驟410的影像型樣計數之總和，亦即， WEIGHT(ID一I)=C0UNT(ID_I)/SUM—j。在針對在該影像型樣表中之所有影像型樣項目完成步驟41 $之後，型樣權重計算程式繼續進行步驟42〇。 154433.doc 12 201211799 、在步驟42G中，型樣權重計算程式計算且儲存針對在該字型樣表令的所有字型樣項目之字型樣計數的一總和 SUM_W。接著，型樣權重計算程式繼續進行步驟425。型樣權重計算程式針對由該字型樣表之字型樣識別符 ID—W所唯一識別之所有字型樣項目執行步驟425 ^ ，步驟425中’型樣權重計算程式將—當前字型樣項目之子型樣權重計算為該當前字型樣項目之字型樣計數除以來自步驟420的字型樣計數之總和SUM—W ,亦即， WEIGHTED一W)=C0UNT(ID_W)/SUM W。纟針對在該字型樣表中之所有字型樣項目完成步驟425之後，型樣權重計算程式終止1上圖2及圖2A之關鍵字自動化程序在步驟500中繼續進行關鍵字清單產生程式。在圖5A中所描繪之實施例中，因為影像型樣表與字型樣表彼此獨立，所以型樣權重計算程式同時執行包含步驟 410及步驟415之第-分支及包含步驟42〇及步驟似之第二分支。一圖6為描繪根據本發明之實施例之以上圖2的用於產生針對視訊内容之關鍵字清單之方法的流程圖，該方法由關鍵字清單產生程式執行。在步驟505中，關鍵字清單產生程式將影像型樣表與字型樣表聯結。結果，關鍵字清單產生程式產生包含來自影像型樣表及字型樣表之所有項目的一已聯結表。該已聯結表之每一項目具有泛型型樣識別符、泛型型樣名稱、泛型型樣計數及泛型型樣權重四個屬性。根據影像型樣表之影 154433.doc 13 201211799 象3L樣識別符ID—Ι或字型樣表之字型樣識別符ID—w來指派每一項目之泛型型樣識別符ID。根據影像型樣表之影像 3L樣名稱或予型樣表之字型樣名稱（亦即，NAMEyDj)或 name(id_w))來指派每一項目之泛型型樣名稱name。根據影像型樣表之影像型樣計數或字型樣表之字型樣計數 (亦即’ C〇UNT(ID_I)或COUNT(ID_W))來指派每—項目之 ’乏尘！樣计數COUNT。根據影像型樣表之影像型樣權重或字型樣表之字型樣權重（亦即，WEIGHT(ID_I)或 WEIGHT(ID_w))來指派每一項目之泛型型樣權重 EIGHT。接著，關鍵字清單產生程式繼續進行步驟 510 〇在步驟510中，關鍵字清單產生程式將來自步驟5〇5的該已聯、，。表之項目按該等項目之泛型型樣權重WEIGHT的值進行排序。接著，關鍵字清單產生程式繼續進行步驟 515。在步驟515中，關鍵字清單產生程式根據一使用者輸入或一基於權重值範圍之預定義值等來判定在該關鍵字清單中的記錄之一數目NUM_K。接著，關鍵字清單產生程式繼續進行步驟520。在步驟520中，關鍵字清單產生程式自步驟5〇5之該已聯、、、》表選擇具有最大權重值之NUM—K個項目且將該個所選擇項目添加至該關鍵字清單。接著，該關鍵字清單產生程式終止且該關鍵字自動化程序繼續進行以上圖2及圖2A之步驟6〇〇。 154433.doc •14· 201211799 圖7說明根據本發明之實施例之用於自動化針對視訊内容之關鍵字的電腦系統。電腦系統90包含一處理器91、耦接至處理器91之一輸入器件92、耦接至處理器91之一輸出器件93及包含記憶體器件94及95的電腦可讀記憶體單元，記憶體器件94及％各自柄接至處理器91。其中輸入器件92可為鍵盤、滑鼠、小鍵盤、觸控式螢幕、語音辨識器件、感測器、網路介面卡 (NIC)、網際網路語音/視訊通訊協定（v〇Ip)配接器、無線配接器、電話配接器、專用電路配接器等。其中輸出器件 93可為印表機、繪圖機、電腦螢幕、磁帶、可抽換式硬碟、軟碟、NIC、VOIP配接器、無線配接器、電話配接器、專用電路配接器、音訊及/或視覺信號產生器、發光二極體（LED)等。其中記憶體器件94及95可為快取記憶體、動態隨機存取記憶體（DRAM)、唯讀記憶體（rom)、硬碟、軟碟、磁帶、諸如光碟（CD)或數位視訊光碟（DVD) 之光學儲存器等。記憶體器件95包括電腦程式碼97，電腦程式碼97為包含電腦可執行指令之電腦程式碼。其中電腦程式碼97包括根據本發明之用於自動化針對才見訊内容之關鍵子的演算法。處理器91執行電腦程式碼97。記憶體器件 94包括輸入資料96。輸入資料96包括電腦程式碼”所需要之輸入。輸出器件93顯示來自電腦程式碼97之輸出。可使用記憶體器件94及95t之任-者或兩者（或圖7中未展示之 -或多個額外記憶體器件）作為—電腦可讀儲存媒體（或電腦可用儲存媒體或㈣儲存时），該電腦可讀儲存媒體 154433.doc •15- 201211799 具有體現於其中之電腦可讀程式碼及/或具有儲存於其中的其他資料，其中該電腦可讀程式碼包含電腦程式碼97。 -般而"T，電腦系統90之電腦帛式產品(或者製造物件)可包含該電腦可讀儲存媒體（或該程式儲存器件可由一服務提供者部署、管理、服務（等）本發明之組件中之任一者，該服務提供者試圖關於本發明之用於針對每種資料收集規則㈣態構建web介面之一程序而部署或整合計算架構。因而，本發明揭示用於支援電腦架構之一程序-亥程序包含在一計算系統（例如，計算系統列）中整合、主控、維護及部署電腦可讀程式碼，其中該程式碼結合該計算系統能夠執行用於自動化針對視訊内容之關鍵字的一方法。在另一實施射，本發明提供一&於訂用、廣告及/或付費來執行本發明之程序步驟的商業方法。亦即，一服務提供者（諸如解決方案整合者）可試圖產生、維護、支援 (等）本發明之用於自動化針對視訊内容之關鍵字的一程序。在此狀況下，該服務提供者可產生、維護、支援（等）針對-或多個客戶而執行本發明之程序步驟的電腦架構。作為回報，該服務提供者可按照訂用及/或付費協議自客戶收取付款，及/或該服務提供者可自出售廣告内容給一或多個第三方收取付款。儘管圖7將電腦系統90展示為硬體及軟體之特定組態，但可利用一般熟習此項技術者所熟知之硬體及軟體之任何組態來達成以上結合圖7之特定電腦系統9 〇所陳述之目 154433.doc -16 - 201211799 的。舉例而言，記憶體器件94及95可為單一記憶體器件之部分而非單獨的記憶體器件。如熟習此項技術者應瞭解，本發明可體現為系統、方法或電腦程式產品。相應地，本發明可採用完全硬體實施例、完全軟體實施例（包括韌體、常駐軟體、微碼等）或組合軟體與硬體態樣之實施例的形式，該等實施例在本文中均可通稱為「電路」'「模組」或「系統另外，本發明可採用體現於任何有形表達媒體中之電腦程式產品的形式，該有形表達媒體具有體現於該媒體中之電腦可用程式碼。可利用一或多個電腦可用或電腦可讀媒體9 4、9 5之任何組合。術語「電腦可用媒體」或「電腦可讀媒體」共同指代電腦可用/可讀儲存媒體94、95。電腦可用或電腦可讀媒體94、95可為(舉例而言但不限於)：電子、磁性、光學、電磁、紅外線或半導體系統、裝置、器件，或前述各者之任何適宜組合。電腦可讀媒體94、95之更特定實例 =:·單)包括以下各者：具有一或多條導線之電連 $電腦碟片、硬碟、隨機存取記憶體（ram)、唯璜目己憶體（ROM)、i & A j ,.3 ^ 未除式可程式化唯讀記憶體（EPROM或光風2體）、光纖、攜帶型光碟唯讀記憶體（CD-ROM)、二 :！器件、磁性儲存器件或前述各者之任何適宜組電腦可讀媒體94、95甚至可為列印對^/張或另―適宜媒體，此係因為可經由（舉例而。）對錢光學掃描來以電子方式操取該 154433.doc 201211799 程式’接著編譯、解譯或以適宜方式另外處理該程式（若有必要），且接著將該程式儲存於電腦記憶體中。在本文件之上下文中，電腦可用或電腦可讀媒體94、％可為可含有或儲存供—執行指令之系統、裝置或器件使用或結合：系統、裝置或器件而使用之程式的任何媒體。可以一或多種程式化語言之任何組合撰寫用於執行本發明之操作的電腦程式碼97，該一或多種程式化語言包括諸如Java、SmaUtalk、c++或其類似者之物件導向式程式化語言及諸如「C」程式化語言或類似程式化語言之習知程序性程式化語言。電腦程式碼97可完全在使用者電腦上執行，部分在使用者電腦上執行，作為獨立套裝軟體執行，部分在使用者電腦上執行及部分在遠端電腦上執行或完全在遠端電腦或伺服器上執行。在完全在遠端電腦或伺服器上執行的情形中，遠端電腦可經由任何類型之網路（包括區域網路（LAN)或廣域網路（WAN))連接至使用者電腦，或可連接至外部電腦（舉例而言，使用網際網路服務提供者’經由網際網路）。參考根據本發明之實施例之方法、裝置（系統）及電腦程式產品之流程圖說明及/或方塊圖來描述本發明。應理解’可藉由電腦程式指令來實施該等流程圖說明及/或方塊圖之每一方塊及該等流程圖說明及/或方塊圖_之方塊的組合。在本說明書中，術語「電腦程式指令」可與術語「電腦程式碼97」互換。可將此等電腦程式指令提供至通用電腦、專用電腦或其他可程式化資料處理裝置之一處理 154433.doc 201211799 盗以產生-機器，以使得經由該電腦或其他可程式化處理裴置之該處理器而執行之1 ’、哲亥料令產生用於實施在該或違等w程圖及/或方塊圖方塊中 _力塊f所扣疋之功能/動作的件0 亦可將此等電腦程式指令儲存於電腦可讀媒體％、％中，電腦可讀媒體94、95可命令電腦或其他可程式化資料處理裝置以特定方式發揮作用，以使得在該電腦可讀媒體中儲存之該等指令產生—製造物件，該製造物件包括實施在該或該等流程圖及/或方塊圖方塊中所指定之功能/動作的指令構件。亦可將該等電腦程式指令載人至電腦或其他可程式化資料裝置上’以使一系列操作步驟執行於該電腦或其他可程式化裝置上以產生-電腦實施程序，以使得在該電腦或其他可程式化裝置上執行之指令提供用於實施在該或該等流程圖及/或方塊圖方塊中所指定之功能/動作的程序。諸圖中之流程圖及方塊圖說明根據本發明之各種實施例之系統、方法及電腦程式產品的可能實施之架構、功能性及操作。就此而言，流程圖或方塊圖中之每一方塊可表示程式碼之一模組、區段或部分，其包含用於實施所指定之邏輯功能的一或多個可執行指令。亦應注意，在一些替代實施中，方塊中所述之功能可不按圖中所述之次序發生。舉例而言，實際上，取決於所涉及之功能性，連續展示之兩個方塊可大體上同時執行，或有時可按相反次序執行。亦應注意，可藉由執行所指定之功能或動作之基於專用硬 154433.doc •19- 201211799 體的系統或專用硬體與電腦指令之組合來實施方塊圖及/ 或流程圖說明之每一方塊及方塊圖及/或流程圖說明中之方塊的組合。在申請專利範圍中之所有構件或步驟附加功能元件之相應結構、材料、動作及等效物意欲包括用於結合如具體主張的其他所主張元件而執行功能之任何結構、材料或動作。為達成說明及描述之目的而呈現本發明之描述，但該描述並不意欲為詳盡的或受限於所揭示之形式的本發明。在不背離本發明之範疇及精神的情況下，一般熟習此項技術者將顯而易見許多修改及變化。選擇且描述該實施例以便.最佳地解釋本發明之原理及實際應用，且使得其他一般熟習此項技術者能夠理解本發明之具有適合於所涵蓋之特定用途的各種修改之各種實施例。【圖式簡單說明】圖1說明根據本發明之實施例之用於自動產生及關聯針對視訊内容之搜尋關鍵字的系統10。圖2及圖2 A為描繪根據本發明之實施例之用於自動產生及關聯針對視訊内容之搜尋關鍵字的方法之流程圖。圖3為描繪根據本發明之實施例之圖2的用於產生針對視 Λ内谷之衫像型樣表之方法的流程圖，該方法由影像型樣表產生程式執行。圖4為描繪根據本發明之實施例之圖2的用於產生針對視訊内容之字型樣表之方法的流程圖，該方法由字型樣表產生程式執行。 154433.doc 201211799 圖5及圖5A為描繪根據本發明之實施例之用於計算影像里樣表及字型樣表之型樣名稱的各別權重之方法的流程圖，該方法由型樣權重計算程式執行。圖6為爲繪根據本發明之實施例之圖2的用於產生針對視訊内容的關鍵字清單之方㈣流程圖，該方法㈣鍵字清單產生程式執行。 —圖7說明根據本發明之實施例之用於自動化針對視訊内容之關鍵字的電腦系統。【主要元件符號說明】 10 系統 11 web伺服器 12 影像辨識工具 13 話語辨識工具 14 搜尋引擎 20 關鍵字自動化程序 30 資料庫 32 影像型樣表 33 字型樣表 40 關鍵字清單 90 電腦系統/計算系統 91 處理器 92 輸入器件 93 輸出器件 94 記憶體器件 154433.doc 21 201211799 95 記憶體器件 96 輸入資料 97 電腦程式碼 100 自資料庫擷取視訊内容 200 影像型樣表產生程式 300 字型樣表產生程式 400 型樣權重計算程式 500 關鍵字清單產生程式 600 藉由關鍵字清單更新視訊内容元資料 154433.doc -22-

Claims

201211799 七、申請專利範圍：内谷之關鍵字的方法，該方 i · 一種用於自動處理針對視訊法包含：一電腦系統之一虛採哭器載入5亥視訊内容，該視訊内容包含至少一影像圖框及一音訊串流；該處理器自該至少—影像圖框產生一影像型樣表，其中垓衫像型樣表之一項目包含影像型樣識別符、影像型樣名稱、影像型樣計數⑽NT(ID」)及影像型樣權重WEIGHT(ID—I)屬性，其中該影像型樣識別符⑴」識別該至少—影像圖框中之—影像型樣，其中該影像型樣名稱為表示該影像型樣之-文數字式文字，其中該影像型樣計數COUNT(ID_I)表㈣至少-影像圖財之該影像罜樣的出現次數，且其中該影像型樣權重 WEIGHT(ID—I)表示該至少一影像圖框内之該影像型樣之一相對頻率；該處理器自該音訊串流產生一字型樣表，其中該字型樣表之一項目包含字型樣識別符ID—W、字型樣名稱、字型樣計數COUNT(ID一W)及字型樣權重WEIGHT(ID—w)屬性，其中該字型樣識別符ID一W識別該音訊串流中之一字型樣’其中該字型樣名稱為表示該字型樣之一文數字式文字’其中該字型樣計數C0IJNT(ID—W)表示該音訊串流中之該字型樣的一出現次數’且其中該字型樣權重 WEIGHT(ID_W)表示該音訊串流内之該字型樣的一相對頻率； 154433.doc 201211799 該處理器針對該影像型樣表及該字型樣表中之所有項目來汁算該各別權重，其中該各別權重選自由該影像型樣權重WEIGHT(ID—I)及該字型樣權重WEIGHT(ID_w)組成之群組；遠處理$基於該計算出之權重自該影像型樣表及該字型樣表產生-關鍵字清單，其中該關鍵字清單之一項目選自由該影像型樣表之項目及該字型樣表之項目組成之群組’且其t該關鍵字清單之該項目包含泛型型樣識別符泛5L型樣名稱、泛型型樣計數及泛型型樣權重等屑性；及該處理器將該所產生之關鍵字清單整合於與該視訊内容相關聯之-網頁的元資料中，以使得在使用該元資料進行之web搜尋中利用該關鍵字清單。 2.如請求項1之方法，該產生該影像型樣表包含：產生唯一地識別該視訊内容的每一影像圖框之該影像型樣識別符ID_I ;及指派該影像型樣名稱，該影像型樣名稱已由一影像辨識工具由於分析該視訊内容的該至少一影像圖框中之每一影像圖框而提供，其中該影像辨識工具將具有一相同影像型樣名稱之相似影像型樣予以邏輯分組。 3·如請求項1之方法，該產生該字型樣表包含：產生唯一地識別在該視訊内容之該音訊串流中的每一字型樣之該字型樣識別符ID_W ;及指派該字型樣名稱，該字型樣名稱已由一話語辨識工 154433.doc -2- 201211799 具由於分析該音訊串流之每一字型樣而提供，其中該話 5吾辨識工具將具有一相同字型樣名稱之相似字型樣予以邏輯分組。 4 ·如睛求項1之方法，該計算該各別權重包含：經由 WEIGHT(ID_I)=COUNT(ID_I)/SUM」針對該影像型樣表中的每一項目來計算該影像型樣權重 WEIGHT(ID_I) ’其中SUM一I為該影像型樣表中之所有影像型樣計數之總和；及經由 WEIGHT(ID一W)=COUNT(ID—W)/SUM_W 針對該字型樣表中的每一項目來計算該字型樣權重 WEIGHT(ID一W)，其中SUM—W為該字型樣表中之所有字型樣計數之總和。 5.如請求項4之方法，該產生該關鍵字清單包含：藉由針對該影像型樣表中之每一項目而將該影像型樣表中之該每一項目之該影像型樣識別符、該影像型樣名稱、該影像型樣計數及該影像型樣權重屬性分別映射至該關鍵字清單中之-相應項目之該泛型型樣識別符、該泛型型樣名稱、該泛型型樣計數及該泛型型樣權重屬性，及藉由針對該字型樣表中之每一項目而將該字型樣表中之該每一項目之該字型樣識別符、該字型樣名稱、 =字型樣計數及該字型樣權重屬性分別映射至該關鍵字清早中之另一相應項目之該泛型型樣識別符、該泛型型樣名稱、該泛型型樣計數及該泛型型樣權重屬性，將該影像型樣表與該字型樣表聯結成該關鍵字清單； 154433.doc 201211799 選擇該關鍵字清單之具有該泛型型樣權重的最大值之 κ個項目，其中κ為一正整數；及將所選擇的K個項目之泛型型樣名稱作為該關鍵字清單儲存至一耦接至該處理器之電腦可讀儲存媒體。一種電腦程式產品，其包含：一電腦可讀儲存媒體，其具有體現於其中之一電腦可讀程式碼，該電腦可讀程式碼含有指令，當藉由用於自動處理針對視訊内容之關鍵字的一電腦系統之一處理器執行該等指令時，該等指令執行如請求項1至5中任— 的方法。一口 π α M久柄设主該處理器之一 8· 電腦可讀記憶體單元，該電腦可讀記憶體單元含有，處理器執行時實施如請求項⑴中任—項的用於處理針對視訊内容之關鍵字的方法之指令。 -種用於支援電腦架構之程序，：下操作中之至少一, 供針對以卞中之至夕者的至少—支援服務器之-計算系統中產生、整人…〜處理了 4程式碼’其中該程式碼結电月句請求項1至5中任―項的 ° #系統能夠執行如鍵字的方法。 :处理針對視訊内容之關 I54433.doc