TW201339867A

TW201339867A - 視頻檔檢索系統及檢索方法

Info

Publication number: TW201339867A
Application number: TW101111591A
Authority: TW
Inventors: Jie Liu
Original assignee: Hon Hai Prec Ind Co Ltd
Priority date: 2012-03-28
Filing date: 2012-03-30
Publication date: 2013-10-01
Also published as: US20130258198A1; CN103365854A

Abstract

一種視頻檔檢索系統及檢索方法。該視頻檢索系統包括一輸入接收模組，該輸入接收模組包括圖像獲取子模組、模型構建子模組及控制子模組，該控制子模組回應用戶輸入在該圖像獲取子模組及模型構建子模組中選擇一個作為輸入檢索內容的視窗，其中，該圖像獲取子模組用於接收用戶上傳的圖片作為檢索內容，該模型構建子模組用於接收用戶輸入的能夠表徵檢索內容的特徵參數並根據該接收到的特徵參數類比構建出相應的圖像模型作為檢索內容；一分析處理模組提取和分析該檢索內容中的特徵資訊；一視頻檢索模組根據該特征資訊確定與該檢索內容相匹配的視頻文件。

Description

視頻檔檢索系統及檢索方法

本發明涉及一種檔檢索系統及檢索方法，特別涉及一種視頻檔檢索系統及檢索方法。

隨著網路技術的發展，人們通過搜索引擎可以迅速在網路中找到所需要的文字和圖片內容。然而，針對視頻檔，目前通常只能通過視頻檔的名稱等關鍵字進行搜索，搜索到的結果往往是該關鍵字對應的一整段視頻，而無法對一個視頻檔中的特定內容進行搜索，例如，現在公路、住宅、商場等各種場合中都安裝有監控攝像頭，當用戶需要在一段監控攝像頭拍攝到的監控錄影中尋找一個特定的人物或場景，只能在眾多冗長的視頻錄影中通過連續觀看來找出所需內容，面對海量的視頻檔，查找任務很難完成。

針對上述問題，本發明提供一種視頻檔檢索系統及檢索方法，用於對視頻檔中的內容進行檢索。

一種視頻檔檢索系統包括輸入接收模組、分析處理模組、視頻檢索模組以及輸出模組。該輸入接收模組包括一圖像獲取子模組、一模型構建子模組以及一控制子模組，該控制子模組回應用戶的輸入在該圖像獲取子模組及模型構建子模組中選擇一個作為輸入檢索內容的視窗，其中，該圖像獲取子模組用於接收用戶上傳的圖片作為檢索內容，該模型構建子模組用於接收用戶輸入的能夠表徵檢索內容的特徵參數並根據該接收到的特徵參數類比構建出相應的圖像模型作為檢索內容；該分析處理模組用於由該輸入接收模組獲取該檢索內容，並提取和分析該檢索內容中的特徵資訊；該視頻檢索模組用於獲取該分析處理模組提取出的該檢索內容對應的特徵資訊，將該特徵資訊與視頻檔中每一個圖像幀對應的特徵資訊相比對，並將與該檢索內容的相似度超過一預先設定的閾值的圖像幀做為與該檢索內容相匹配的圖像幀，其中，所述的相似度以視頻檔中圖像幀的特徵資訊與檢索內容對應的特徵資訊的重複程度來表徵。該輸出模組用於將該視頻檢索模組獲取到的視頻檔輸出給用戶。

本發明還提供一種視頻檔檢索方法，該方法包括步驟：回應用戶的輸入操作，確定用戶輸入的檢索內容，該檢索內容為二維圖像，其中，該檢索內容可以是用戶上傳的圖片，也可是是根據用戶輸入的能夠表徵檢索內容的特徵參數並根據該接收到的特徵參數類比構建出相應的圖像模型；獲取該檢索內容，並提取和分析該檢索內容中的特徵資訊，其中，該特徵資訊包括顏色特徵、輪廓特徵、場景特徵以及文字特徵；將該特徵資訊與視頻檔中每一個圖像幀對應的特徵資訊相比對，並將與該檢索內容的相似度超過一預先設定的閾值的圖像幀做為與該檢索內容相匹配的圖像幀；對與該檢索內容相匹配的圖像幀對應的視頻檔進行獲取；以及將該獲取到的視頻檔輸出給用戶。

本發明中的視頻檔檢索系統及檢索方法，實現了基於內容的視頻檔檢索，提高了視頻檢索的準確率，提升了用戶的視頻檢索體驗。

下面結合附圖，對本發明中的視頻檔檢索系統及檢索方法作進一步的詳細描述。

請參考圖1，在本發明一較佳實施方式中，該視頻檔檢索系統100用於實現基於內容的視頻檢索。該視頻檔檢索系統100包括輸入接收模組10、分析處理模組20、視頻檢索模組30以及輸出模組40。

該輸入接收模組10用於回應用戶通過鍵盤等輸入裝置進行的輸入操作，確定用戶輸入的檢索內容，其中，該檢索內容為二維圖像。在本實施方式中，該輸入接收模組10包括一圖像獲取子模組101、一模型構建子模組102以及一控制子模組103。

該控制子模組103回應用戶通過鍵盤、滑鼠等輸入裝置的輸入操作，在該圖像獲取子模組101及模型構建子模組102中選擇一個進行輸入檢索內容的操作。其中，該圖像獲取子模組101用於接收用戶上傳的圖片作為檢索內容，該用戶上傳的圖片可以是來自本地上傳的圖片、互聯網中獲取的圖片、或是通過攝像機及掃描器等獲取的圖片。例如，當用戶需要搜索有某一影視明星出鏡的視頻時，若用戶已經預先通過互聯網等手段獲取了一張該影視明星的照片，則用戶可通過鍵盤等輸入裝置選擇該圖像獲取子模組101後，通過該圖像獲取子模組101上傳該影視明星的照片作為檢索內容。該模型構建子模組102用於接收用戶輸入的能夠表徵檢索內容的特徵參數並根據該接收到的特徵參數類比構建出相應的圖像模型作為檢索內容，其中，該特徵參數可以是人物的面部特徵參數，如臉型和髮型、身高、體態特徵，如駝背、以及著裝顏色等。例如，當用戶需要在多個路段的監控視頻錄影中尋找一走失的兒童時，用戶可以先通過鍵盤選擇該模型構建子模組102，然後通過該模型構建子模組102輸入能夠表徵該兒童特徵的特徵參數，如身高120CM，短髮，紅色上衣等，該模型構建子模組102在根據該些特徵參數類比構建該兒童的二維圖像模型。

該分析處理模組20由該輸入接收模組10獲取該檢索內容，並提取和分析該檢索內容中的特徵資訊，其中該特徵資訊包括圖像的顏色特徵、輪廓特徵、場景特徵、文字特徵。

該視頻檢索模組30獲取該分析處理模組20提取出的該檢索內容對應的特徵資訊，將該特徵資訊與視頻檔中每一個圖像幀對應的特徵資訊相比對，並將與該檢索內容的相似度超過一預先設定的閾值的圖像幀做為與該檢索內容相匹配的圖像幀，其中，所述的相似度以視頻檔中圖像幀的特徵資訊與檢索內容對應的特徵資訊的重複程度來表徵。該視頻檢索模組30將與該檢索內容相匹配的圖像幀對應的視頻檔進行獲取。在本實施方式中，所述與該檢索內容相匹配的圖像幀對應的視頻檔包括兩種模式：第一種模式為與該檢索內容相匹配的圖像幀所在的整個視頻檔；第二種模式為與該檢索內容相匹配的圖像幀所組成的視頻片段，即僅有與檢索內容相匹配的圖像幀出現的視頻片段。該視頻檢索模組根據用戶選擇輸出該兩種模式的視頻檔中的一種。例如，當用戶以某一影視明星的照片作為搜索內容想要搜索出該影視明星參演過的所有電視與電影，則用戶可以通過該輸入接收模組10選擇第一種模式；若用戶以走失的兒童的照片為檢索內容，想要在多個路段的監控視頻中找出與該兒童相關的視頻片段，則用戶可以通過該輸入接收模組10選擇第二種模式。

該輸出模組40將該視頻檢索模組30獲取到的視頻檔通過顯示器等顯示裝置輸出給用戶。在其他實施方式中，該輸出模組40還可以將視頻檢索模組30獲取到的視頻檔生成一超鏈結，並將該超鏈結輸出給用戶，用戶通過連接至該超鏈結即可獲取該視頻檔。

請參閱圖2，為本發明一實施方式中視頻檔檢索方法的流程圖。該視頻檔檢索方法包括步驟：

S201：該輸入接收模組10用於回應用戶通過鍵盤等輸入裝置進行的輸入操作，確定用戶輸入的檢索內容，其中，該檢索內容為二維圖像。在本實施方式中，該輸入接收模組10包括一圖像獲取子模組101、一模型構建子模組102以及一控制子模組103，該控制子模組103回應用戶通過鍵盤、滑鼠等輸入裝置的輸入操作，在該圖像獲取子模組101及模型構建子模組102中選擇一個作為輸入檢索內容的視窗。其中，該圖像獲取子模組101用於接收用戶上傳的圖片作為檢索內容，該模型構建子模組102用於接收用戶輸入的能夠表徵檢索內容的特徵參數並根據該接收到的特徵參數類比構建出相應的圖像模型作為檢索內容，其中，該特徵參數可以是人物的面部特徵參數，如臉型和髮型、身高、體態特徵，如駝背、以及著裝顏色，也可以是某一種汽車的車型、顏色等。

S202：該分析處理模組20由該輸入接收模組10獲取該檢索內容，並提取和分析該檢索內容中的特徵資訊，其中該特徵資訊包括圖像的顏色特徵、輪廓特徵、場景特徵、文字特徵。

S203：該視頻檢索模組30獲取該分析處理模組20提取出的該檢索內容對應的特徵資訊，將該特徵資訊與視頻檔中每一個圖像幀對應的特徵資訊相比對，並將與該檢索內容的相似度超過一預先設定的閾值的圖像幀做為與該檢索內容相匹配的圖像幀，其中，所述的相似度以視頻檔中圖像幀的特徵資訊與檢索內容對應的特徵資訊的重複程度來表徵。

S204：該視頻檢索模組30對與該檢索內容相匹配的圖像幀對應的視頻檔進行獲取。在本實施方式中，所述與該檢索內容相匹配的圖像幀對應的視頻檔包括兩種模式：第一種模式為與該檢索內容相匹配的圖像幀所在的整個視頻檔；第二種模式為與該檢索內容相匹配的圖像幀所組成的視頻片段，即僅有該與檢索內容相匹配的圖像幀出現的視頻片段。用戶可以通過該輸入接收模組10選擇輸出該兩種模式的視頻檔中的一種，該視頻檢索模組30根據用戶選擇輸出相應模式的視頻檔。

S205：該輸出模組40將該視頻檢索模組30獲取到的視頻檔通過顯示器等顯示裝置直接輸出給用戶。在其他實施方式中，該輸出模組40還可以將視頻檢索模組30獲取到的視頻檔生成一超鏈結，並將該超鏈結輸出給用戶，用戶通過連接至該超鏈結即可獲取該視頻檔。

100．．．視頻檔檢索系統

10．．．輸入接收模組

101．．．圖像獲取子模組

102．．．模型構建子模組

103．．．控制子模組

20．．．分析處理模組

30．．．視頻檢索模組

40．．．輸出模組

圖1係本發明一實施方式中視頻檔檢索系統功能模組示意圖。

圖2係本發明一實施方式中視頻檔檢索方法流程圖。