TW201339867A - 視頻檔檢索系統及檢索方法 - Google Patents

視頻檔檢索系統及檢索方法 Download PDF

Info

Publication number
TW201339867A
TW201339867A TW101111591A TW101111591A TW201339867A TW 201339867 A TW201339867 A TW 201339867A TW 101111591 A TW101111591 A TW 101111591A TW 101111591 A TW101111591 A TW 101111591A TW 201339867 A TW201339867 A TW 201339867A
Authority
TW
Taiwan
Prior art keywords
module
video file
video
user
content
Prior art date
Application number
TW101111591A
Other languages
English (en)
Inventor
Jie Liu
Original Assignee
Hon Hai Prec Ind Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hon Hai Prec Ind Co Ltd filed Critical Hon Hai Prec Ind Co Ltd
Publication of TW201339867A publication Critical patent/TW201339867A/zh

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/73Querying
    • G06F16/732Query formulation
    • G06F16/7328Query by example, e.g. a complete video frame or video sequence

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Processing Or Creating Images (AREA)
  • Television Signal Processing For Recording (AREA)

Abstract

一種視頻檔檢索系統及檢索方法。該視頻檢索系統包括一輸入接收模組,該輸入接收模組包括圖像獲取子模組、模型構建子模組及控制子模組,該控制子模組回應用戶輸入在該圖像獲取子模組及模型構建子模組中選擇一個作為輸入檢索內容的視窗,其中,該圖像獲取子模組用於接收用戶上傳的圖片作為檢索內容,該模型構建子模組用於接收用戶輸入的能夠表徵檢索內容的特徵參數並根據該接收到的特徵參數類比構建出相應的圖像模型作為檢索內容;一分析處理模組提取和分析該檢索內容中的特徵資訊;一視頻檢索模組根據該特征資訊確定與該檢索內容相匹配的視頻文件。

Description

視頻檔檢索系統及檢索方法
本發明涉及一種檔檢索系統及檢索方法,特別涉及一種視頻檔檢索系統及檢索方法。
隨著網路技術的發展,人們通過搜索引擎可以迅速在網路中找到所需要的文字和圖片內容。然而,針對視頻檔,目前通常只能通過視頻檔的名稱等關鍵字進行搜索,搜索到的結果往往是該關鍵字對應的一整段視頻,而無法對一個視頻檔中的特定內容進行搜索,例如,現在公路、住宅、商場等各種場合中都安裝有監控攝像頭,當用戶需要在一段監控攝像頭拍攝到的監控錄影中尋找一個特定的人物或場景,只能在眾多冗長的視頻錄影中通過連續觀看來找出所需內容,面對海量的視頻檔,查找任務很難完成。
針對上述問題,本發明提供一種視頻檔檢索系統及檢索方法,用於對視頻檔中的內容進行檢索。
一種視頻檔檢索系統包括輸入接收模組、分析處理模組、視頻檢索模組以及輸出模組。該輸入接收模組包括一圖像獲取子模組、一模型構建子模組以及一控制子模組,該控制子模組回應用戶的輸入在該圖像獲取子模組及模型構建子模組中選擇一個作為輸入檢索內容的視窗,其中,該圖像獲取子模組用於接收用戶上傳的圖片作為檢索內容,該模型構建子模組用於接收用戶輸入的能夠表徵檢索內容的特徵參數並根據該接收到的特徵參數類比構建出相應的圖像模型作為檢索內容;該分析處理模組用於由該輸入接收模組獲取該檢索內容,並提取和分析該檢索內容中的特徵資訊;該視頻檢索模組用於獲取該分析處理模組提取出的該檢索內容對應的特徵資訊,將該特徵資訊與視頻檔中每一個圖像幀對應的特徵資訊相比對,並將與該檢索內容的相似度超過一預先設定的閾值的圖像幀做為與該檢索內容相匹配的圖像幀,其中,所述的相似度以視頻檔中圖像幀的特徵資訊與檢索內容對應的特徵資訊的重複程度來表徵。該輸出模組用於將該視頻檢索模組獲取到的視頻檔輸出給用戶。
本發明還提供一種視頻檔檢索方法,該方法包括步驟:回應用戶的輸入操作,確定用戶輸入的檢索內容,該檢索內容為二維圖像,其中,該檢索內容可以是用戶上傳的圖片,也可是是根據用戶輸入的能夠表徵檢索內容的特徵參數並根據該接收到的特徵參數類比構建出相應的圖像模型;獲取該檢索內容,並提取和分析該檢索內容中的特徵資訊,其中,該特徵資訊包括顏色特徵、輪廓特徵、場景特徵以及文字特徵;將該特徵資訊與視頻檔中每一個圖像幀對應的特徵資訊相比對,並將與該檢索內容的相似度超過一預先設定的閾值的圖像幀做為與該檢索內容相匹配的圖像幀;對與該檢索內容相匹配的圖像幀對應的視頻檔進行獲取;以及將該獲取到的視頻檔輸出給用戶。
本發明中的視頻檔檢索系統及檢索方法,實現了基於內容的視頻檔檢索,提高了視頻檢索的準確率,提升了用戶的視頻檢索體驗。
下面結合附圖,對本發明中的視頻檔檢索系統及檢索方法作進一步的詳細描述。
請參考圖1,在本發明一較佳實施方式中,該視頻檔檢索系統100用於實現基於內容的視頻檢索。該視頻檔檢索系統100包括輸入接收模組10、分析處理模組20、視頻檢索模組30以及輸出模組40。
該輸入接收模組10用於回應用戶通過鍵盤等輸入裝置進行的輸入操作,確定用戶輸入的檢索內容,其中,該檢索內容為二維圖像。在本實施方式中,該輸入接收模組10包括一圖像獲取子模組101、一模型構建子模組102以及一控制子模組103。
該控制子模組103回應用戶通過鍵盤、滑鼠等輸入裝置的輸入操作,在該圖像獲取子模組101及模型構建子模組102中選擇一個進行輸入檢索內容的操作。其中,該圖像獲取子模組101用於接收用戶上傳的圖片作為檢索內容,該用戶上傳的圖片可以是來自本地上傳的圖片、互聯網中獲取的圖片、或是通過攝像機及掃描器等獲取的圖片。例如,當用戶需要搜索有某一影視明星出鏡的視頻時,若用戶已經預先通過互聯網等手段獲取了一張該影視明星的照片,則用戶可通過鍵盤等輸入裝置選擇該圖像獲取子模組101後,通過該圖像獲取子模組101上傳該影視明星的照片作為檢索內容。該模型構建子模組102用於接收用戶輸入的能夠表徵檢索內容的特徵參數並根據該接收到的特徵參數類比構建出相應的圖像模型作為檢索內容,其中,該特徵參數可以是人物的面部特徵參數,如臉型和髮型、身高、體態特徵,如駝背、以及著裝顏色等。例如,當用戶需要在多個路段的監控視頻錄影中尋找一走失的兒童時,用戶可以先通過鍵盤選擇該模型構建子模組102,然後通過該模型構建子模組102輸入能夠表徵該兒童特徵的特徵參數,如身高120CM,短髮,紅色上衣等,該模型構建子模組102在根據該些特徵參數類比構建該兒童的二維圖像模型。
該分析處理模組20由該輸入接收模組10獲取該檢索內容,並提取和分析該檢索內容中的特徵資訊,其中該特徵資訊包括圖像的顏色特徵、輪廓特徵、場景特徵、文字特徵。
該視頻檢索模組30獲取該分析處理模組20提取出的該檢索內容對應的特徵資訊,將該特徵資訊與視頻檔中每一個圖像幀對應的特徵資訊相比對,並將與該檢索內容的相似度超過一預先設定的閾值的圖像幀做為與該檢索內容相匹配的圖像幀,其中,所述的相似度以視頻檔中圖像幀的特徵資訊與檢索內容對應的特徵資訊的重複程度來表徵。該視頻檢索模組30將與該檢索內容相匹配的圖像幀對應的視頻檔進行獲取。在本實施方式中,所述與該檢索內容相匹配的圖像幀對應的視頻檔包括兩種模式:第一種模式為與該檢索內容相匹配的圖像幀所在的整個視頻檔;第二種模式為與該檢索內容相匹配的圖像幀所組成的視頻片段,即僅有與檢索內容相匹配的圖像幀出現的視頻片段。該視頻檢索模組根據用戶選擇輸出該兩種模式的視頻檔中的一種。例如,當用戶以某一影視明星的照片作為搜索內容想要搜索出該影視明星參演過的所有電視與電影,則用戶可以通過該輸入接收模組10選擇第一種模式;若用戶以走失的兒童的照片為檢索內容,想要在多個路段的監控視頻中找出與該兒童相關的視頻片段,則用戶可以通過該輸入接收模組10選擇第二種模式。
該輸出模組40將該視頻檢索模組30獲取到的視頻檔通過顯示器等顯示裝置輸出給用戶。在其他實施方式中,該輸出模組40還可以將視頻檢索模組30獲取到的視頻檔生成一超鏈結,並將該超鏈結輸出給用戶,用戶通過連接至該超鏈結即可獲取該視頻檔。
請參閱圖2,為本發明一實施方式中視頻檔檢索方法的流程圖。該視頻檔檢索方法包括步驟:
S201:該輸入接收模組10用於回應用戶通過鍵盤等輸入裝置進行的輸入操作,確定用戶輸入的檢索內容,其中,該檢索內容為二維圖像。在本實施方式中,該輸入接收模組10包括一圖像獲取子模組101、一模型構建子模組102以及一控制子模組103,該控制子模組103回應用戶通過鍵盤、滑鼠等輸入裝置的輸入操作,在該圖像獲取子模組101及模型構建子模組102中選擇一個作為輸入檢索內容的視窗。其中,該圖像獲取子模組101用於接收用戶上傳的圖片作為檢索內容,該模型構建子模組102用於接收用戶輸入的能夠表徵檢索內容的特徵參數並根據該接收到的特徵參數類比構建出相應的圖像模型作為檢索內容,其中,該特徵參數可以是人物的面部特徵參數,如臉型和髮型、身高、體態特徵,如駝背、以及著裝顏色,也可以是某一種汽車的車型、顏色等。
S202:該分析處理模組20由該輸入接收模組10獲取該檢索內容,並提取和分析該檢索內容中的特徵資訊,其中該特徵資訊包括圖像的顏色特徵、輪廓特徵、場景特徵、文字特徵。
S203:該視頻檢索模組30獲取該分析處理模組20提取出的該檢索內容對應的特徵資訊,將該特徵資訊與視頻檔中每一個圖像幀對應的特徵資訊相比對,並將與該檢索內容的相似度超過一預先設定的閾值的圖像幀做為與該檢索內容相匹配的圖像幀,其中,所述的相似度以視頻檔中圖像幀的特徵資訊與檢索內容對應的特徵資訊的重複程度來表徵。
S204:該視頻檢索模組30對與該檢索內容相匹配的圖像幀對應的視頻檔進行獲取。在本實施方式中,所述與該檢索內容相匹配的圖像幀對應的視頻檔包括兩種模式:第一種模式為與該檢索內容相匹配的圖像幀所在的整個視頻檔;第二種模式為與該檢索內容相匹配的圖像幀所組成的視頻片段,即僅有該與檢索內容相匹配的圖像幀出現的視頻片段。用戶可以通過該輸入接收模組10選擇輸出該兩種模式的視頻檔中的一種,該視頻檢索模組30根據用戶選擇輸出相應模式的視頻檔。
S205:該輸出模組40將該視頻檢索模組30獲取到的視頻檔通過顯示器等顯示裝置直接輸出給用戶。在其他實施方式中,該輸出模組40還可以將視頻檢索模組30獲取到的視頻檔生成一超鏈結,並將該超鏈結輸出給用戶,用戶通過連接至該超鏈結即可獲取該視頻檔。
100...視頻檔檢索系統
10...輸入接收模組
101...圖像獲取子模組
102...模型構建子模組
103...控制子模組
20...分析處理模組
30...視頻檢索模組
40...輸出模組
圖1係本發明一實施方式中視頻檔檢索系統功能模組示意圖。
圖2係本發明一實施方式中視頻檔檢索方法流程圖。
100...視頻檔檢索系統
10...輸入接收模組
101...圖像獲取子模組
102...模型構建子模組
103...控制子模組
20...分析處理模組
30...視頻檢索模組
40...輸出模組

Claims (9)

  1. 一種視頻檔檢索系統,用於實現基於內容的視頻檔檢索,其改良在於,該視頻檔檢索系統包括:
    輸入接收模組,該輸入接收模組包括一圖像獲取子模組、一模型構建子模組以及一控制子模組,該控制子模組回應用戶的輸入在該圖像獲取子模組及模型構建子模組中選擇一個作為輸入檢索內容的視窗,其中,該圖像獲取子模組用於接收用戶上傳的圖片作為檢索內容,該模型構建子模組用於接收用戶輸入的能夠表徵檢索內容的特徵參數並根據該接收到的特徵參數類比構建出相應的圖像模型作為檢索內容;
    分析處理模組,用於由該輸入接收模組獲取該檢索內容,並提取和分析該檢索內容中的特徵資訊;
    視頻檢索模組,用於獲取該分析處理模組提取出的該檢索內容對應的特徵資訊,將該特徵資訊與視頻檔中每一個圖像幀對應的特徵資訊相比對,並將與該檢索內容的相似度超過一預先設定的閾值的圖像幀做為與該檢索內容相匹配的圖像幀,其中,所述的相似度以視頻檔中圖像幀的特徵資訊與檢索內容對應的特徵資訊的重複程度來表徵;以及
    輸出模組,用於將該視頻檢索模組獲取到的視頻檔輸出給用戶。
  2. 根據申請專利範圍第1項所述的視頻檔檢索系統,其中,該用戶上傳的圖片為來自本地上傳的圖片、互聯網中獲取的圖片、通過攝像機及掃描器等獲取的圖片。
  3. 根據申請專利範圍第1項所述的視頻檔檢索系統,其中,能夠表徵檢索內容的特徵參數為人物的面部特徵參數、身高、體態特徵、以及著裝顏色,或是一種汽車的車型、顏色。
  4. 根據申請專利範圍第1項所述的視頻檔檢索系統,其中,該分析處理模組提取出的檢索內容的特徵資訊包括圖像的顏色特徵、輪廓特徵、場景特徵以及文字特徵。
  5. 根據申請專利範圍第1項所述的視頻檔檢索系統,其中,所述與該檢索內容相匹配的圖像幀對應的視頻檔包括兩種模式:第一種模式為與該檢索內容相匹配的圖像幀所在的整個視頻檔;第二種模式為與該檢索內容相匹配的圖像幀所組成的視頻片段,該視頻檢索模組根據用戶選擇輸出該兩種模式的視頻檔中的一種。
  6. 根據申請專利範圍第5項所述的視頻檔檢索系統,其中,該輸出模組將該視頻檢索模組獲取到的視頻檔直接通過一顯示裝置進行播放。
  7. 根據申請專利範圍第5項所述的視頻檔檢索系統,其中,該輸出模組將視頻檢索模組獲取到的視頻檔生成一超鏈結,並將該超鏈結輸出給用戶,用戶通過連接至該超鏈結即可獲取該視頻檔。
  8. 一種視頻檔檢索方法,該視頻檔檢索方法包括步驟:
    回應用戶的輸入操作,確定用戶輸入的檢索內容,該檢索內容為二維圖像,其中,該檢索內容可以是用戶上傳的圖片,或是根據用戶輸入的能夠表徵檢索內容的特徵參數類比構建出的圖像模型;
    獲取該檢索內容,並提取和分析該檢索內容中的特徵資訊,其中,該特徵資訊包括顏色特徵、輪廓特徵、場景特徵以及文字特徵;
    將該特徵資訊與視頻檔中每一個圖像幀對應的特徵資訊相比對,並將與該檢索內容的相似度超過一預先設定的閾值的圖像幀做為與該檢索內容相匹配的圖像幀;
    對與該檢索內容相匹配的圖像幀對應的視頻檔進行獲取;以及
    將該獲取到的視頻檔輸出給用戶。
  9. 根據申請專利範圍8所述之視頻檔檢索方法,其中,所述與該檢索內容相匹配的圖像幀對應的視頻檔包括兩種模式:第一種模式為與該檢索內容相匹配的圖像幀所在的整個視頻檔;第二種模式為與該檢索內容相匹配的圖像幀所組成的視頻片段,即僅有該與檢索內容相匹配的圖像幀出現的視頻片段,該視頻檢索模組根據用戶選擇輸出該兩種模式的視頻檔中的一種。
TW101111591A 2012-03-28 2012-03-30 視頻檔檢索系統及檢索方法 TW201339867A (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2012100853537A CN103365854A (zh) 2012-03-28 2012-03-28 视频文件检索系统及检索方法

Publications (1)

Publication Number Publication Date
TW201339867A true TW201339867A (zh) 2013-10-01

Family

ID=49234514

Family Applications (1)

Application Number Title Priority Date Filing Date
TW101111591A TW201339867A (zh) 2012-03-28 2012-03-30 視頻檔檢索系統及檢索方法

Country Status (3)

Country Link
US (1) US20130258198A1 (zh)
CN (1) CN103365854A (zh)
TW (1) TW201339867A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI749441B (zh) * 2019-09-29 2021-12-11 大陸商北京市商湯科技開發有限公司 檢索方法及裝置、儲存介質

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103823898A (zh) * 2014-03-14 2014-05-28 联想(北京)有限公司 一种数据处理方法、装置及电子设备
CN103888812A (zh) * 2014-04-02 2014-06-25 深圳创维-Rgb电子有限公司 基于云电视的信息处理方法及云电视系统
CN103942337B (zh) * 2014-05-08 2017-08-18 北京航空航天大学 一种基于图像识别与匹配的视频搜索系统
CN105808548A (zh) * 2014-12-30 2016-07-27 深圳富泰宏精密工业有限公司 影像片段搜寻方法及系统
CN105989132A (zh) * 2015-02-17 2016-10-05 上海触趣网络科技有限公司 图像文件处理及语音控制方法
JP2016181808A (ja) * 2015-03-24 2016-10-13 富士フイルム株式会社 画像処理装置、画像処理方法、プログラムおよび記録媒体
CN106257447B (zh) * 2015-06-17 2019-11-26 杭州海康威视系统技术有限公司 云存储服务器的视频存储及检索方法、视频云存储系统
CN105118082B (zh) * 2015-07-30 2019-05-28 科大讯飞股份有限公司 个性化视频生成方法及系统
CN106484891A (zh) * 2016-10-18 2017-03-08 网易(杭州)网络有限公司 游戏回放数据检索方法及系统
CN106529456A (zh) * 2016-11-04 2017-03-22 北京锐安科技有限公司 信息匹配和信息收发方法、装置及目标对象找寻系统
CN106980640B (zh) * 2017-02-08 2020-04-24 网易(杭州)网络有限公司 针对照片的交互方法、设备和计算机可读存储介质
CN107404661A (zh) * 2017-08-23 2017-11-28 韩城黄河指尖影院有限公司 一种微电影视频获取方法及装置
CN110545443A (zh) * 2018-05-29 2019-12-06 优酷网络技术(北京)有限公司 视频片段的获取方法及装置
CN112749297B (zh) * 2020-03-03 2023-07-21 腾讯科技(深圳)有限公司 视频推荐方法、装置、计算机设备和计算机可读存储介质
CN111787348B (zh) * 2020-07-28 2022-10-04 中国联合网络通信集团有限公司 基于直播的视频推送方法、推送装置及终端设备
CN112423062B (zh) * 2020-10-30 2023-11-10 深圳Tcl新技术有限公司 视频人物信息显示方法、装置、终端设备及存储介质

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3738631B2 (ja) * 1999-09-27 2006-01-25 三菱電機株式会社 画像検索システムおよび画像検索方法
US7336841B2 (en) * 2004-03-25 2008-02-26 Intel Corporation Fingerprinting digital video for rights management in networks
US7839933B2 (en) * 2004-10-06 2010-11-23 Microsoft Corporation Adaptive vertical macroblock alignment for mixed frame video sequences
CN101216833B (zh) * 2007-12-28 2012-02-22 深圳市迅雷网络技术有限公司 一种搜索并提供视频文件的方法、服务器和系统
CN102314916B (zh) * 2010-07-07 2014-08-27 成都神州数码索贝科技有限公司 一种视频处理方法和系统
CN102207966B (zh) * 2011-06-01 2013-07-10 华南理工大学 基于对象标签的视频内容快速检索方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI749441B (zh) * 2019-09-29 2021-12-11 大陸商北京市商湯科技開發有限公司 檢索方法及裝置、儲存介質

Also Published As

Publication number Publication date
US20130258198A1 (en) 2013-10-03
CN103365854A (zh) 2013-10-23

Similar Documents

Publication Publication Date Title
TW201339867A (zh) 視頻檔檢索系統及檢索方法
CN110119711B (zh) 一种获取视频数据人物片段的方法、装置及电子设备
JP6785305B2 (ja) 顔認識及びコンテキストビデオストリームで個人を識別するためのビデオ解析技術のための装置及び方法
CN109284729B (zh) 基于视频获取人脸识别模型训练数据的方法、装置和介质
US11908238B2 (en) Methods and systems for facial point-of-recognition (POR) provisioning
US9563623B2 (en) Method and apparatus for correlating and viewing disparate data
KR102206184B1 (ko) 동영상 내 객체 관련 정보 검색 방법 및 동영상 재생 장치
WO2016173443A1 (zh) 账户信息获取的方法、终端、服务器和系统
US9652534B1 (en) Video-based search engine
US20150310012A1 (en) Object-based image search system and search method thereof
US9881084B1 (en) Image match based video search
US20130243249A1 (en) Electronic device and method for recognizing image and searching for concerning information
KR20190069920A (ko) 동영상 콘텐츠 내의 인물을 인식하는 장치 및 방법
WO2020108234A1 (zh) 图像索引生成方法、图像搜索方法、装置、终端及介质
WO2020044099A1 (zh) 一种基于对象识别的业务处理方法和装置
CN103119595A (zh) 通过快门按击的自动媒体共享
JP7224442B2 (ja) 顔認識において偽陽性を低減するための方法および装置
KR101782590B1 (ko) 이미지 분석기반의 관계형 태그생성 및 추천 방법
CN106372068A (zh) 一种图像查找方法及装置、终端
US20140233811A1 (en) Summarizing a photo album
KR101715708B1 (ko) 이미지 분석기반의 자동화된 관계형 태그 생성 시스템과 이를 이용한 서비스 제공방법
US20140286624A1 (en) Method and apparatus for personalized media editing
JP2020095615A (ja) 生成装置、生成方法および生成プログラム
WO2019244276A1 (ja) 検索システム、検索方法、及びプログラム
Park et al. A study on the design and implementation of facial recognition application system