TW201828109A - 圖像檢索、獲取圖像資訊及圖像識別方法、裝置及系統 - Google Patents

圖像檢索、獲取圖像資訊及圖像識別方法、裝置及系統 Download PDF

Info

Publication number
TW201828109A
TW201828109A TW106101917A TW106101917A TW201828109A TW 201828109 A TW201828109 A TW 201828109A TW 106101917 A TW106101917 A TW 106101917A TW 106101917 A TW106101917 A TW 106101917A TW 201828109 A TW201828109 A TW 201828109A
Authority
TW
Taiwan
Prior art keywords
image
feature
feature value
matching
local
Prior art date
Application number
TW106101917A
Other languages
English (en)
Inventor
楊川
張倫
楚汝峰
Original Assignee
阿里巴巴集團服務有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 阿里巴巴集團服務有限公司 filed Critical 阿里巴巴集團服務有限公司
Priority to TW106101917A priority Critical patent/TW201828109A/zh
Publication of TW201828109A publication Critical patent/TW201828109A/zh

Links

Landscapes

  • Image Analysis (AREA)
  • Processing Or Creating Images (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本發明公開了一種圖像檢索方法及裝置,一種獲取圖像資訊的方法及裝置、一種圖像識別方法及裝置、一種圖像識別系統、一種用於計算圖像特徵值的方法及裝置、以及一種電子設備。其中,所述圖像檢索方法包括:提取待檢索圖像的局部特徵;採用預先訓練的深度自編碼網路模型計算所述局部特徵的特徵值;將所述特徵值與圖像檢索資料庫中註冊圖像的特徵值進行匹配;根據匹配結果選擇滿足預設條件的註冊圖像作為所述待檢索圖像的檢索結果。採用上述方法,由於深度自編碼網路在對局部特徵進行壓縮表示的過程中,可以有效保持特徵值之間的距離資訊和辨別能力,從而能夠有效提升圖像檢索的精確度,減少重排過濾的工作量,提高檢索效率。

Description

圖像檢索、獲取圖像資訊及圖像識別方法、裝置及系統
本發明涉及圖像檢索技術,具體涉及一種圖像檢索方法及裝置。本發明同時提供一種獲取圖像資訊的方法及裝置、一種圖像識別方法及裝置、一種圖像識別系統、一種用於計算圖像特徵值的方法及裝置、以及一種電子設備。
物體識別和視覺化搜索技術可以極大的縮短物理世界同資料世界的距離,說明使用者快速便捷的獲取資訊。在目前備受關注的網際網路領域,對於經由攝像頭拍照獲取的、或者從網際網路下載獲取的待識別圖像,採用圖像檢索技術可以從預先註冊的圖像中找到與之匹配的圖像,並進一步獲知待識別圖像的相關資訊(該過程通常也稱為圖像識別過程),例如:藉由對圖書封面圖像的檢索,可以獲知圖書的名稱、作者等資訊。
圖像檢索可以藉由局部特徵匹配實現,由於圖像的局部特徵通常含有較多的冗餘和雜訊,從儲存和檢索性能上考慮,為了滿足實用需求,通常需要對局部特徵採用更為 精簡、有效的表達方式。在目前常用的圖像檢索技術詞包模型(Bag of word)中,藉由“詞”來表徵圖像的局部特徵。
基於詞包模型的圖像檢索技術包括為圖像檢索資料庫建立索引、以及特徵匹配兩個流程。在建立索引階段,通常隨機採集一部分圖像的局部特徵作為訓練樣本,利用Kmeans聚類演算法對訓練樣本進行聚類,將聚類中心作為“詞”,然後,針對圖像檢索資料庫中註冊圖像的局部特徵,查找與其歐氏距離最近的“詞”,並用該詞的索引作為該局部特徵的量化表示,並在此基礎上建立倒排表的索引結構;在特徵匹配(檢索)階段,查找與待識別圖像局部特徵的歐式距離最近的“詞”,並用該詞的索引查找對應的註冊圖像,最後採用統計投票的方式,得到與待識別圖像對應的檢索結果。
藉由上面的描述可以看出,由於詞包模型在建立索引和特徵匹配階段,都是藉由“詞”來表徵圖像的局部特徵,而不同的圖像特徵可能對應於同一個“詞”,即,詞索引之間的距離並不能表示特徵的真實距離,例如,三個特徵量化以後的索引分別為1、5、100,而1和5對應的局部特徵並不一定比100對應的局部特徵更相似。基於上述原因,現有的圖像檢索技術實現圖像之間匹配的精確低,可能會出現大量的誤匹配,從而進一步導致需要對大量圖像和誤匹配特徵對進行過濾和重排,影響檢索性能。
本發明實施例提供一種圖像檢索方法和裝置,相對於現有圖像檢索技術實現匹配的精度低的問題,提供了一種提高圖像檢索匹配精度的方案。本發明實施例還提供一種獲取圖像資訊的方法及裝置、一種圖像識別方法及裝置、一種圖像識別系統、一種用於計算圖像特徵值的方法及裝置、以及一種電子設備。
本發明提供一種圖像檢索方法,包括:提取待檢索圖像的局部特徵;採用預先訓練的深度自編碼網路模型計算所述局部特徵的特徵值;將所述特徵值與圖像檢索資料庫中註冊圖像的特徵值進行匹配;根據匹配結果選擇滿足預設條件的註冊圖像作為所述待檢索圖像的檢索結果。
可選的,所述特徵值包括二值化特徵值。
可選的,所述將所述特徵值與圖像檢索資料庫中註冊圖像的特徵值進行匹配包括:採用基於漢明距離的方式進行匹配,並將漢明距離小於預設閾值的特徵值對作為匹配成功的特徵值對。
可選的,所述採用基於漢明距離的方式進行匹配包括:採用計算漢明距離的線性查詢方式進行匹配;或者,採用以二值化特徵值為索引查詢雜湊表的方式進行匹 配。
可選的,預先訓練所述深度自編碼網路模型,包括:選擇樣本圖像集;提取所述樣本圖像集中的樣本圖像的局部特徵;以所述局部特徵作為輸入,以深度自編碼網路模型對輸入資料進行編解碼後的重建誤差最小為目標,進行反覆運算訓練直至所述深度自編碼網路模型收斂。
可選的,所述圖像檢索資料庫是採用如下步驟預先建立的:選取用於構建所述圖像檢索資料庫的註冊圖像;提取所述註冊圖像的局部特徵;利用所述深度自編碼網路模型計算所述局部特徵的特徵值;將所述特徵值儲存在圖像檢索資料庫中,並建立所述特徵值與註冊圖像之間的對應關係。
可選的,在所述提取所述註冊圖像的局部特徵之前,執行下述操作:按照預設的方式對所述註冊圖像的尺寸進行正規化。
可選的,在利用所述深度自編碼網路模型計算所述局部特徵的特徵值之後,執行下述步驟:按照計算得到的特徵值的分佈,對特徵值進行篩選;所述將所述特徵值儲存在圖像檢索資料庫中包括:將篩選後的特徵值儲存在圖像檢索資料庫中。
可選的,所述按照計算得到的特徵值的分佈,對特徵 值進行篩選包括:選擇在註冊圖像中出現頻率低於預設閾值的特徵值;和/或,按照特徵值在註冊圖像中的位置分佈選擇特徵值。
可選的,在所述提取待檢索圖像的局部特徵之後,執行下述操作:計算所述局部特徵對應的關鍵點到所述待檢索圖像中心的距離;剔除所述距離大於預設閾值的關鍵點對應的局部特徵;所述採用預先訓練的深度自編碼網路模型計算所述局部特徵的特徵值包括:採用所述深度自編碼網路模型計算執行上述剔除操作後的局部特徵的特徵值。
可選的,所述將所述特徵值與圖像檢索資料庫中註冊圖像的特徵值進行匹配包括:將所述特徵值與圖像檢索資料庫中註冊圖像的特徵值,採用如下方式逐一進行兩兩匹配:計算表徵待匹配特徵值對的差異程度的指標值,並當所述指標值小於預先設定的閾值時判定所述特徵值對匹配成功。
可選的,所述滿足預設條件的註冊圖像包括:按照特徵值匹配成功的個數從大到小排序靠前的註冊圖像;或者,特徵值匹配成功的個數大於預設閾值的註冊圖像;或者, 按照特徵值匹配成功所得累計分值從大到小排序靠前的註冊圖像;或者,特徵值匹配成功所得累計分值大於預設閾值的註冊圖像。
可選的,在所述根據匹配結果選擇滿足預設條件的註冊圖像後,執行下述重排操作:針對每個所選註冊圖像,將所述待檢索圖像的特徵值與從圖像檢索資料庫中提取的註冊圖像特徵值進行兩兩匹配,並記錄滿足預設重排匹配條件的特徵值對的個數;根據滿足預設重排匹配條件的特徵值對的個數對所選註冊圖像進行排序,並從中選擇排序靠前的註冊圖像;所述根據匹配結果選擇滿足預設條件的註冊圖像作為所述待檢索圖像的檢索結果包括:將執行上述重排操作後所選註冊圖像作為所述待檢索圖像的檢索結果。
可選的,在所述記錄滿足預設重排匹配條件的特徵值對的個數後,執行下述操作:藉由利用變換模型進行空間關係一致性校驗,從所述滿足預設重排匹配條件的特徵值對中剔除誤匹配的特徵值對;所述根據滿足預設重排序匹配條件的特徵值對的個數對所選註冊圖像進行排序包括:根據執行上述剔除操作後的、滿足預設重排匹配條件的特徵值對的個數對所選註冊圖像進行排序。
可選的,藉由如下方式提取圖像的局部特徵:採用 SIFT演算法、採用LBP演算法或者利用卷積神經網路。
可選的,所述提取待檢索圖像的局部特徵、以及所述採用預先訓練的深度自編碼網路模型計算所述局部特徵的特徵值的步驟在用戶端設備上執行;所述將所述特徵值與圖像檢索資料庫中圖像的特徵值進行匹配、以及所述根據匹配結果選擇滿足預設條件的註冊圖像作為所述待檢索圖像的檢索結果的步驟在服務端設備上執行。
相應的,本發明還提供一種圖像檢索裝置,包括:局部特徵提取單元,用於提取待檢索圖像的局部特徵;特徵值計算單元,用於採用預先訓練的深度自編碼網路模型計算所述局部特徵提取單元輸出的局部特徵的特徵值;特徵值匹配單元,用於將所述特徵值計算單元輸出的特徵值與圖像檢索資料庫中註冊圖像的特徵值進行匹配;檢索結果產生單元,用於根據所述特徵值匹配單元輸出的匹配結果選擇滿足預設條件的註冊圖像作為所述待檢索圖像的檢索結果。
可選的,當所述特徵值為二值化特徵值時,所述特徵值匹配單元具體用於,採用基於漢明距離的方式進行匹配,並將漢明距離小於預設閾值的特徵值對作為匹配成功的特徵值對。
可選的,所述裝置包括:模型訓練單元,用於預先訓 練所述深度自編碼網路模型;所述模型訓練單元包括:樣本選擇子單元,用於選擇樣本圖像集;樣本特徵提取子單元,用於提取所述樣本圖像集中的樣本圖像的局部特徵;反覆運算訓練子單元,用於以所述局部特徵作為輸入,以深度自編碼網路模型對輸入資料進行編解碼後的重建誤差最小為目標,進行反覆運算訓練直至所述深度自編碼網路模型收斂。
可選的,所述裝置包括:資料庫建立單元,用於預先建立所述圖像檢索資料庫;所述資料庫建立單元包括:註冊圖像選擇子單元,用於選取用於構建所述圖像檢索資料庫的註冊圖像;註冊圖像特徵提取子單元,用於提取所述註冊圖像的局部特徵;註冊圖像特徵值計算子單元,用於利用所述深度自編碼網路模型計算所述局部特徵的特徵值;特徵值註冊子單元,用於將所述特徵值儲存在圖像檢索資料庫中,並建立所述特徵值與註冊圖像之間的對應關係。
可選的,所述資料庫建立單元還包括:特徵值篩選子單元,用於根據特徵值的分佈,對所述註冊圖像特徵值計算子單元計算得到的特徵值進行篩選; 所述特徵值註冊子單元具體用於,將所述特徵值篩選子單元篩選後的特徵值儲存在圖像檢索資料庫中,並建立所述特徵值與註冊圖像之間的對應關係。
可選的,所述裝置包括:距離計算單元,用於計算所述局部特徵對應的關鍵點到所述待檢索圖像中心的距離;局部特徵剔除單元,用於剔除所述距離計算單元計算得到的距離大於預設閾值的關鍵點對應的局部特徵;所述特徵值計算單元具體用於,採用所述深度自編碼網路模型計算由所述局部特徵剔除單元執行剔除操作後的局部特徵的特徵值。
可選的,所述檢索結果產生單元包括:註冊圖像初選子單元,用於根據所述特徵值匹配單元輸出的匹配結果選擇滿足預設條件的註冊圖像;重排匹配子單元,用於針對所述註冊圖像初選子單元所選的每個註冊圖像,將所述待檢索圖像的特徵值與從圖像檢索資料庫中提取的註冊圖像特徵值進行兩兩匹配,並記錄滿足預設重排匹配條件的特徵值對的個數;重排篩選子單元,用於根據所述重排匹配子單元記錄的特徵值對的個數對所選註冊圖像進行排序,並從中選擇排序靠前的註冊圖像,作為所述待檢索圖像的檢索結果。
可選的,所述檢索結果產生單元還包括:空間一致性校驗子單元,用於藉由利用變換模型進行空間關係一致性校驗,從所述重排匹配子單元得到的特徵 值對中剔除誤匹配的特徵值對;所述重排篩選子單元具體用於,根據所述空間一致性校驗子單元執行剔除操作後的、滿足預設重排匹配條件的特徵值對的個數對所選註冊圖像進行排序。
可選的,所述局部特徵提取單元以及所述特徵值計算單元部署於用戶端設備上;所述特徵值匹配單元以及所述檢索結果產生單元部署於服務端設備上。
此外,本發明還提供一種獲取圖像資訊的方法,包括:提取待識別圖像的局部特徵;採用預先訓練的深度自編碼網路模型計算所述局部特徵的特徵值;將所述特徵值發送給提供圖像識別服務的服務端;接收所述服務端返回的所述待識別圖像的相關資訊。
可選的,所述特徵值包括二值化特徵值。
可選的,在所述提取待識別圖像的局部特徵之後,執行下述操作:計算所述局部特徵對應的關鍵點到所述待識別圖像中心的距離;剔除所述距離大於預設閾值的關鍵點對應的局部特徵;所述採用預先訓練的深度自編碼網路模型計算所述局部特徵的特徵值包括:採用所述深度自編碼網路模型計算 執行上述剔除操作後的局部特徵的特徵值。
可選的,藉由如下方式提取待識別圖像的局部特徵:採用SIFT演算法、採用LBP演算法或者利用卷積神經網路。
可選的,所述方法在移動終端設備上實施。
相應的,本發明還提供一種獲取圖像資訊的裝置,包括:局部特徵提取單元,用於提取待識別圖像的局部特徵;特徵值計算單元,用於採用預先訓練的深度自編碼網路模型計算所述局部特徵提取單元輸出的局部特徵的特徵值;特徵值發送單元,用於將所述特徵值計算單元輸出的特徵值發送給提供圖像識別服務的服務端;圖像資訊接收單元,用於接收所述服務端返回的所述待識別圖像的相關資訊。
此外,本發明還提供一種圖像識別方法,包括:接收用戶端上傳的待識別圖像的特徵值,所述特徵值是以所述待識別圖像的局部特徵為輸入,利用預先訓練的深度自編碼網路模型計算得到的;將所述特徵值與圖像檢索資料庫中註冊圖像的特徵值進行匹配;根據匹配結果選擇滿足預設條件的註冊圖像;獲取與所選註冊圖像對應的註冊資訊,並返回給所述 用戶端。
可選的,所述特徵值包括:二值化特徵值。
可選的,所述將所述特徵值與圖像檢索資料庫中註冊圖像的特徵值進行匹配包括:採用基於漢明距離的方式進行匹配,並將漢明距離小於預設閾值的特徵值對作為匹配成功的特徵值對。
可選的,所述圖像檢索資料庫是採用如下步驟預先建立的:選取用於構建所述圖像檢索資料庫的註冊圖像;提取所述註冊圖像的局部特徵;利用所述深度自編碼網路模型計算所述局部特徵的特徵值;將所述特徵值儲存在圖像檢索資料庫中,並建立所述特徵值與註冊圖像之間的對應關係。
可選的,在利用所述深度自編碼網路模型計算所述局部特徵的特徵值之後,執行下述步驟:按照計算得到的特徵值的分佈,對特徵值進行篩選;所述將所述特徵值儲存在圖像檢索資料庫中包括:將篩選後的特徵值儲存在圖像檢索資料庫中。
可選的,所述按照計算得到的特徵值的分佈,對特徵值進行篩選包括:選擇在註冊圖像中出現頻率低於預設閾值的特徵值;和/或,按照特徵值在註冊圖像中的位置分佈選擇特徵值。
可選的,在所述根據匹配結果選擇滿足預設條件的註冊圖像後,執行下述重排操作:針對每個所選註冊圖像,將所述待識別圖像的特徵值與從圖像檢索資料庫中提取的註冊圖像特徵值進行兩兩匹配,並記錄滿足預設重排匹配條件的特徵值對的個數;根據滿足預設重排匹配條件的特徵值對的個數對所選註冊圖像進行排序,並從中選擇排序靠前的註冊圖像;所述根據匹配結果選擇滿足預設條件的註冊圖像作為所述待檢索圖像的檢索結果包括:將執行上述重排操作後所選註冊圖像作為所述待檢索圖像的檢索結果。
相應的,本發明還提供一種圖像識別裝置,包括:特徵值接收單元,用於接收用戶端上傳的待識別圖像的特徵值,所述特徵值是以所述待識別圖像的局部特徵為輸入,利用預先訓練的深度自編碼網路模型計算得到的;特徵值匹配單元,用於將所述特徵值接收單元接收到的特徵值與圖像檢索資料庫中註冊圖像的特徵值進行匹配;註冊圖像選擇單元,用於根據匹配結果選擇滿足預設條件的註冊圖像;圖像資訊發送單元,用於獲取與所選註冊圖像對應的註冊資訊,並返回給所述用戶端。
此外,本發明還提供一種圖像識別系統,包括:根據上述任意一項所述的獲取圖像資訊的裝置,以及根據上述任意一項所述的圖像識別裝置。
此外,本發明還提供一種用於計算圖像特徵值的方法,包括:提取待計算特徵值圖像的局部特徵;採用預先訓練的深度自編碼網路模型計算所述局部特徵的特徵值。
可選的,所述特徵值包括:二值化特徵值。
可選的,預先訓練所述深度自編碼網路模型,包括:選擇樣本圖像集;提取所述樣本圖像集中的樣本圖像的局部特徵;以所述局部特徵作為輸入,以深度自編碼網路模型對輸入資料進行編解碼後的重建誤差最小為目標,進行反覆運算訓練直至所述深度自編碼網路模型收斂。
可選的,藉由如下方式提取待計算特徵值圖像的局部特徵:採用SIFT演算法、採用LBP演算法或者利用卷積神經網路。
相應的,本發明還提供一種用於計算圖像特徵值的裝置,包括:局部特徵提取單元,用於提取待計算特徵值圖像的局部特徵;特徵值計算單元,用於採用預先訓練的深度自編碼網路模型計算所述局部特徵提取單元輸出的局部特徵的特徵值。
此外,本發明還提供一種電子設備,包括:顯示器; 處理器;記憶體,用於儲存獲取圖像資訊的程式,所述程式在被所述處理器讀取執行時,執行如下操作:提取待識別圖像的局部特徵;採用預先訓練的深度自編碼網路模型計算所述局部特徵的二值化特徵值;將所述二值化特徵值發送給提供圖像識別服務的服務端;接收所述服務端返回的關於所述待識別圖像的相關資訊。
與現有技術相比,本發明具有以下優點:本發明提供的技術方案,藉由提取待檢索圖像的局部特徵,並採用預先訓練的深度自編碼網路模型計算所述局部特徵的特徵值,然後將所述特徵值與圖像檢索資料庫中註冊圖像的特徵值進行匹配,根據匹配結果選擇滿足預設條件的註冊圖像作為所述待檢索圖像的檢索結果。本發明提供的上述方法,將圖像的局部特徵和深度自編碼網路模型結合起來,由於深度自編碼網路在對局部特徵進行壓縮表示的過程中,可以有效保持特徵值之間的距離資訊和辨別能力,從而能夠有效提升圖像檢索的精確度,減少重排過濾的工作量,提高檢索效率。
而且與詞包模型相比較,由於將待檢索圖像的局部特徵轉換為“詞”的過程是一個百萬級的最近鄰問題,無法在普通的移動終端設備上實現;而本發明的技術方案由於採用深度自編碼網路模型計算圖像局部特徵的特徵值,通常只需要執行幾個矩陣乘法,對儲存空間的要求小,可以在移動終端設備上實現,從而使得移動終端直接向服務端 上傳圖像特徵值成為可能,可以減輕服務端的工作壓力。
進一步地,深度自編碼網路模型輸出的特徵值可以為量化的二值化特徵值,從而實現圖像特徵的進一步壓縮表示,例如,可以壓縮為只有幾K大小的二進制碼序列。一方面,可以將圖像檢索資料庫擴展到百萬級甚至億級的規模,而且可以方便的利用雜湊等技術加速檢索過程;另一方面,能夠有效減少用戶端向服務端上傳的資料量,節省對網路頻寬的佔用、以及減少資料傳輸時間,從而可以在移動終端設備上實現直接對圖像特徵進行量化、並向伺服器上傳量化特徵資料的功能。
501‧‧‧局部特徵提取單元
502‧‧‧特徵值計算單元
503‧‧‧特徵值匹配單元
504‧‧‧檢索結果產生單元
701‧‧‧局部特徵提取單元
702‧‧‧特徵值計算單元
703‧‧‧特徵值發送單元
704‧‧‧圖像資訊接收單元
901‧‧‧特徵值接收單元
902‧‧‧特徵值匹配單元
903‧‧‧註冊圖像選擇單元
904‧‧‧圖像資訊發送單元
1001‧‧‧獲取圖像資訊的裝置
1002‧‧‧圖像識別裝置
1201‧‧‧局部特徵提取單元
1202‧‧‧特徵值計算單元
1301‧‧‧顯示器
1302‧‧‧處理器
1303‧‧‧儲存器
圖1是本發明提供的一種圖像檢索方法的實施例的流程圖;圖2是本發明實施例提供的深度自編碼網路的示意圖;圖3是本發明實施例提供的構建圖像檢索資料庫的處理流程圖;圖4是本發明實施例提供的根據匹配結果選擇註冊圖像的處理流程圖;圖5是本發明提供的一種圖像檢索裝置的實施例的示意圖;圖6是本發明提供的一種獲取圖像資訊的方法實施例的流程圖; 圖7是本發明提供的一種獲取圖像資訊的裝置實施例的示意圖;圖8是本發明提供的一種圖像識別方法的實施例的流程圖;圖9是本發明提供的一種圖像識別裝置的實施例的示意圖;圖10是本發明提供的一種圖像識別系統的實施例的示意圖;圖11是本發明提供的一種用於計算圖像特徵值的方法實施例的流程圖;圖12是本發明提供的一種用於計算圖像特徵值的裝置實施例的示意圖;圖13是本發明提供的一種電子設備的實施例的示意圖。
在下面的描述中闡述了很多具體細節以便於充分理解本發明。但是,本發明能夠以很多不同於在此描述的其它方式來實施,本領域技術人員可以在不違背本發明內涵的情況下做類似推廣,因此,本發明不受下面公開的具體實施的限制。
在本發明中,分別提供了一種圖像檢索方法及裝置、一種獲取圖像資訊的方法及裝置、一種圖像識別方法及裝置、一種圖像識別系統、一種用於計算圖像特徵值的方法 及裝置、以及一種電子設備,在下面的實施例中逐一進行詳細說明。
本發明的技術方案藉由將局部特徵與深度自編碼網路相結合,提高了圖像檢索的精確度。在執行圖像檢索操作之前,可以預先訓練深度自編碼網路模型,並利用訓練好的深度自編碼網路模型構建圖像檢索資料庫,下面對這兩部依次進行說明。
1)訓練深度自編碼網路模型。
深度自編碼網路是一種深度神經網路,請參看圖2,其為本實施例提供的深度自編碼網路的示意圖,該網路由5層神經元組成,包含多個隱藏層,由於居於最中間的隱藏層,即本圖中的第3層(通常稱為編碼層)的神經元個數少於輸入層神經元個數,因此編碼層的輸出通常是對輸入資料的壓縮表示。其中第一層是輸入層,第2層以及第3層各自輸出的是輸入信號的一種表示(也稱為編碼過程),第4層和第5層用於對輸入資料進行重建(也稱為解碼過程),深度自編碼網路的訓練過程,就是以對輸入資料進行逐層編解碼後的重建誤差最小為目標,採用梯度下降等演算法藉由反覆運算方式調整各層參數的過程。
具體到本實施例中,採用如下方式訓練深度自編碼網路模型:隨機選取樣本圖像集,提取所述樣本圖像集中的樣本圖像的局部特徵,以所述局部特徵作為輸入,以深度自編碼網路模型對輸入資料進行編解碼後的重建誤差最小為目標,進行反覆運算訓練直至所述深度自編碼網路模型 收斂,則所述深度自編碼網路模型訓練完畢,該模型編碼層的輸出就是對輸入局部特徵進行壓縮後的特徵值,例如輸入是128維的實數向量,輸出為16維的實數向量。在具體實施時,對於訓練好的深度自編碼網路模型,藉由執行幾個矩陣乘法即可在編碼層得到輸入特徵的壓縮表示,例如在圖2所示的深度自編碼網路中,上述壓縮過程可以藉由兩個矩陣乘法實現。
由於採用了深度自編碼網路模型,在去除原始特徵冗餘資訊達到降維目的的同時,編碼層輸出的特徵值通常可以良好地代表輸入特徵,即,能夠以少量的儲存形式來表示原本較複雜的但資訊冗餘較大的表示形式,並且有效保持特徵值之間的距離資訊和辨別能力,從而為提高檢索精度提供保障。
在本實施例的一個具體例子中,隨機選取了60萬個圖像,並從每個圖像中提取200個局部特徵,然後以200x60萬=12000萬個局部特徵作為輸入進行反覆運算訓練,最終得到訓練好的深度自編碼網路模型。
較佳地,為了實現進一步的資料壓縮和量化表示,可以在上述訓練過程中加入約束條件,從而將編碼層的輸出限定為二值化資料。例如,在前向傳播過程中對編碼層輸出的取值範圍在[0,1]區間的實數值進行四捨五入,從而得到二進位的表達,作為下一層的輸入,在反向傳播採用梯度下降法調整參數的過程中,所採用的編碼層輸出資料仍然是沒有經過量化的實數結果。採用上述方式經過多次 反覆運算,網路收斂以後,即得到訓練好的深度自編碼網路模型,在後續使用該模型計算局部特徵的特徵值時,編碼層在輸出結果時進行四捨五入得到由0、1組成的二進位序列,即本發明所述的二值化特徵值,也稱為量化二進制碼或者量化後的特徵值。
需要說明的是,圖2是本實施例給出的深度自編碼網路的示意圖,該圖中示出的網路層數以及神經元個數都僅僅是示意性的,在具體實施中,可以根據需要設置並調整深度自編碼網路的層數、以及每一層的神經元的數目等,本發明對此並不作具體的限定。
2)構建圖像檢索資料庫。
所述圖像檢索資料庫也稱為特徵資料庫,用於儲存大量圖像特徵,從而在進行圖像檢索時,可以藉由將待檢索圖像與該庫中的圖像特徵的匹配,找到與待檢索圖像相匹配的註冊圖像。在本發明技術方案中,可以採用預先訓練好的深度自編碼網路模型構建所述圖像檢索資料庫。具體實現可以包括以下步驟101-1至101-4,下面結合附圖3進行說明。
步驟101-1、選取用於構建所述圖像檢索資料庫的註冊圖像。
具體實施時,可以從網際網路、各種資原始伺服器、各種應用對外提供的圖像素材中獲取所述圖像,也可以藉由拍照等方式獲取所述圖像。之所以將這些圖像稱為註冊圖像,是指所述圖像的特徵值將被儲存在圖像檢索資料庫 中以供檢索匹配,而所述圖像自身可能成為與待檢索圖像相匹配的圖像。
步驟101-2、提取所述註冊圖像的局部特徵。
為了提高圖像檢索的精確度,在提取所述註冊圖像的局部特徵之前,可以按照預設的方式對註冊圖像的尺寸進行正規化,例如可以藉由對註冊圖像的尺寸進行等比例縮放,使所有註冊圖像達到長度值為300圖元的統一規格。
針對每一個註冊圖像,提取其局部特徵,具體可以採用SIFT(Scale-Invariant feature Transform-尺度不變特徵轉換)演算法、LBP(Local Binary Patterns-局部二進制模式)演算法或者是利用卷積神經網路提取。例如,針對每一個註冊圖像可以採用SIFT演算法提取200個128維的特徵向量。
步驟101-3、利用所述深度自編碼網路模型計算所述局部特徵的特徵值。
利用預先訓練好的深度自編碼網路模型,以步驟101-2獲取的每個局部特徵作為輸入,計算所述局部特徵的特徵值,深度自編碼網路模型的編碼層的輸出即為所述局部特徵的特徵值,例如,可以是降維後的實數向量,如果在訓練深度自編碼網路模型時加入了與二值化相關的限制條件,那麼本步驟得到的就是每個局部特徵的二值化特徵值。
由於註冊圖像的數量通常比較多,經常是百萬、千萬甚至更多,因此本步驟計算得到的特徵值相應也很多,為 了提高檢索效率,可以按照計算得到的特徵值的分佈,對特徵值進行篩選,並且僅對篩選出來的特徵值進行註冊(即儲存在圖像檢索資料庫中以供匹配檢索)。篩選的方式可以有多種,此處列舉兩種,這兩種方式可以各自獨立使用也可以結合使用:
1)選擇在註冊圖像中出現頻率低於預設閾值的特徵值。具體實施時,可以統計特徵值在全部或者選定部分註冊圖像中出現的頻率,通常出現頻率越低的特徵值,所攜帶的信息量越大,區別於其他圖像的能力越強,因此可以篩選出現頻率低於預設閾值的特徵值。
2)按照特徵值在註冊圖像中的位置分佈選擇特徵值。為了減少註冊特徵值的數量,也可以將註冊圖像均勻劃分為一系列的圖像塊,然後在每個圖像塊中選擇預定數量的特徵值作為代表。
步驟101-4、將所述特徵值儲存在圖像檢索資料庫中,並建立所述特徵值與註冊圖像之間的對應關係。
藉由步驟101-3計算(以及篩選過程)後,每個註冊圖像都與多個特徵值相對應,本步驟將所述特徵值儲存在圖像檢索資料庫中,並建立特徵值與註冊圖像的對應關係,該過程也稱為特徵值的註冊過程。
如果預先訓練的深度自編碼網路模型的輸出為二值化特徵值,那麼在構建圖像檢索資料庫時,可以有效減少每個註冊圖像的註冊特徵值所需的儲存空間,從而可以將圖像檢索資料庫擴展到百萬級甚至億級的規模;此外還可以 將二值化特徵值轉換為索引,並構建雜湊表,在每個註冊的二值化特徵值對應的雜湊表項中可以記錄相應的註冊圖像標識,從而在特徵匹配階段能夠採用雜湊技術進行快速檢索。
至此,描述了深度自編碼網路的訓練過程以及圖像檢索資料庫的構建過程。在此基礎上就可以進行圖像檢索。
請參考圖1,其為本發明的一種圖像檢索方法的實施例的流程圖。所述方法包括如下步驟:
步驟101、提取待檢索圖像的局部特徵。
對於待檢索圖像,通常先提取局部特徵,之所以提取局部特徵,是因為在利用局部特徵對圖像描述時,每幅圖像被分解成很多部分,每個部分對應一個特徵向量,採用這樣的局部特徵可以有效的利用圖像的結構資訊進行圖像匹配識別,而且能在一定程度上對角度變化、尺度變化具備較為穩定的特徵匹配能力。具體實施時,可以採用SIFT演算法、LBP演算法或者卷積神經網路等方式提取圖像的局部特徵,即,得到能夠表徵所述圖像主要特徵的特徵向量。
需要說明的是,在訓練深度自編碼網路模型、構建圖像檢索資料庫以及本步驟提取待檢索圖像的局部特徵時,應該採用相同的局部特徵提取方法,例如,都採用SIFT演算法,這樣才能有效實施本發明提供的圖像檢索方法。
步驟102、採用預先訓練的深度自編碼網路模型計算所述局部特徵的特徵值。
因為位置、尺度、濾波器參數等變化,在提取局部特徵的過程中往往把待檢索圖像轉化為維度比較高的特徵空間,而且通常會得到數量比較多的特徵向量。為了提高檢索效率,可以在計算局部特徵的特徵值之前,從局部特徵空間中選擇最能表徵該圖像的特徵子集。
考慮到圖像的主要資訊通常分佈在圖像中心附近,本實施例提供一種較佳實施方式:以到待檢索圖像中心的距離遠近作為局部特徵選擇的一個標準。具體實施時,由於每個局部特徵通常與待檢索圖像中的一個關鍵點相對應,而每個關鍵點都有其在待檢索圖像中的座標值,因此可以計算與局部特徵對應的關鍵點到所述待檢索圖像中心的距離,如果所述距離大於預設閾值,說明關鍵點遠離圖像中心,可以剔除該關鍵點對應的局部特徵,否則保留該關鍵點對應的局部特徵。採用上述方式可以減少待檢索圖像的局部特徵數量,提高檢索效率。
在步驟101提取待檢索圖像的局部特徵(以及執行上述剔除操作)後,可以用每個局部特徵作為輸入,利用預先訓練好的深度自編碼神經網路模型計算每個局部特徵的特徵值。深度自編碼網路模型輸出的特徵值是輸入局部特徵的壓縮表示,例如,可以是降維後的實數向量;如果在訓練深度自編碼網路模型時加入了與二值化相關的限制條件,那麼本步驟得到的就是每個局部特徵的量化二進制碼。
步驟103、將所述特徵值與圖像檢索資料庫中註冊圖 像的特徵值進行匹配。
待檢索圖像藉由深度自編碼網路模型轉換為特徵值後,本步驟可以將所述特徵值與圖像檢索資料庫中的註冊特徵值逐一進行兩兩匹配,對於進行匹配的每個特徵值對,可以計算表徵該特徵值對差異程度的指標值,並當所述指標值小於預先設定的閾值時判定所述特徵值對匹配成功。
在具體實施時,所述表徵特徵值對差異程度的指標可以為特徵值對之間的歐氏距離。進一步地,如果所述深度自編碼網路模型輸出的特徵值為二值化特徵值,那麼所述表徵特徵值對差異程度的指標也可以為特徵值對之間的漢明距離。
對於基於漢明距離的特徵值對的匹配,在具體實施時,可以採用計算漢明距離的線性查詢方式、或者採用雜湊技術進行匹配,這兩種方式都能夠有效提高檢索效率。下面對這兩種方式作進一步說明。
1)採用計算漢明距離的線性查詢方式進行匹配。
所述漢明距離通常是指,兩個相同長度字串對應位元不同的數量,對於由0、1組成的量化二進制碼表示的特徵值對,可以藉由異或運算並統計結果為1的個數,從而得到所述漢明距離,例如,1011101與1001001的漢明距離為2。
在具體實施時,考慮到圖像特徵表達的複雜性,可以結合具體應用需求,為基於漢明距離的線性查詢匹配過程 預先設定閾值,然後對待檢索圖像的特徵值與圖像檢索資料庫中註冊圖像的特徵值逐一進行兩兩匹配,如果當前進行匹配的特徵值對的漢明距離小於所述閾值則認為所述特徵值對匹配成功。例如,在本實施例的一個具體例子中,量化二進制碼的長度為62位元,預設的漢明距離閾值為4,如果進行匹配的特徵值對的漢明距離小於等於3,即漢明距離屬於[0,3]區間內,則可以判定所述特徵值對匹配成功。
2)採用以二值化特徵值為索引查詢雜湊表的方式進行匹配。
如果採用雜湊技術進行匹配,通常在構建圖像檢索資料庫時,已經建立了以二值化特徵值為索引的雜湊表,因此在本步驟中,可以用二值化特徵值為索引,直接在雜湊表中進行查詢。
在具體實施時,與上述基於漢明距離的線性查詢方式類似,可以預先設定漢明距離的閾值,然後產生所有與待檢索圖像的二值化特徵值(以下簡稱待檢索二進制碼)的漢明距離小於所述閾值的二進制碼,並分別將這些二進制碼轉換為索引,直接在雜湊表中進行查詢,如果與某索引對應的雜湊表項中記錄了註冊圖像標識,則通常說明找到了與所述待檢索二進制碼相匹配的註冊特徵值。
對於找到的匹配成功的特徵值對,可以為對應的註冊圖像記錄匹配結果。例如,可以記錄所述註冊圖像的特徵值匹配成功的數目,每當所述註冊圖像的某一註冊特徵值 匹配成功,則將所述數目加一;也可以記錄所述註冊圖像的匹配分值,每當所述註冊圖像的某一註冊特徵值匹配成功,則累加所述分值,具體實施時,還可以細化分值累加策略,可以根據特徵值對的匹配程度累加不同的分值,例如對於匹配成功的二值化特徵值對,如果漢明距離為0或者1,則可以累加預設的較高分值,如果漢明距離為2或者3,則可以累加預設的較低分值。上述列舉了一些記錄匹配結果的方式以及策略,在具體實施時,可以根據具體需求採取所需的方式。
步驟104、根據匹配結果選擇滿足預設條件的註冊圖像作為所述待檢索圖像的檢索結果。
本步驟根據步驟103執行匹配操作的結果,選擇滿足預設條件的註冊圖像作為所述待檢索圖像的檢索結果。較佳地,為了進一步提高圖像檢索的精確度,本實施例還提供對滿足預設條件的註冊圖像進行重排的較佳實施方式。整個處理過程包括步驟104-1至104-3,下面結合附圖4進行說明。
步驟104-1、根據匹配結果選擇滿足預設條件的註冊圖像。
如果在步驟103中針對註冊圖像記錄的是特徵值匹配成功的個數,那麼本步驟可以選擇滿足如下條件的註冊圖像:按照特徵值匹配成功的個數從大到小排序靠前的註冊圖像,或者,特徵值匹配成功的個數大於預設閾值的註冊圖像;如果在步驟103中針對註冊圖像記錄的是累積分 值,那麼本步驟可以選擇滿足如下條件的註冊圖像:按照特徵值匹配成功所得累計分值從大到小排序靠前的註冊圖像,或者,特徵值匹配成功所得累計分值大於預設閾值的註冊圖像。
步驟104-2、針對每個所選註冊圖像,將所述待檢索圖像的特徵值與從圖像檢索資料庫中提取的註冊圖像特徵值進行兩兩匹配,並記錄滿足預設重排匹配條件的特徵值對的個數。
由於採用深度自編碼網路模型得到的特徵值能夠保持圖像的原始特徵距離資訊,為了進一步提高圖像檢索的精確度,本步驟對待檢索圖像與步驟104-1中選取的註冊圖像進行圖與圖之間的一對一匹配,從而實現對所選註冊圖像的重排篩選。
具體實施時,可以採用如下方式進行待檢索圖像與註冊圖像之間的一對一匹配:針對待檢索圖像的某一特徵值,計算表徵該特徵值與所述註冊圖像的每個註冊特徵值之間的差異程度的指標值,判斷上述指標值是否滿足預先設定的重排匹配條件:將所述指標值按照從小到大的順序排序後,如果第一位的指標值小於預先設定的第一閾值,並且第二位與第一位的指標值的差異大於預先設定的第二閾值,則可以認為待檢索圖像的該特徵值與第一位對應的註冊特徵值是滿足預設重排匹配條件的特徵值對,針對所述註冊圖像累計滿足預設重排匹配條件的特徵值對的個數;然後採用上述方式,依次匹配待檢索圖像的其他各特 徵值,直至將待檢索圖像的特徵值處理完畢。
在上述處理過程中,所述第二位與第一位的指標值的差異可以用求解兩者差值或者比值的方式計算;上面列舉了一種具體的重排匹配條件,在具體實施中也可以預先設定其他的重排匹配條件,只要能夠對步驟104-1所選註冊圖像進行重排篩選,提高圖像檢索精確度就都是可以的。
針對待檢索圖像與步驟104-1所選的每個註冊圖像,依次執行上述的一對一匹配過程,從而可以得到關於每個所選註冊圖像的、滿足預設重排匹配條件的特徵值對的個數。
較佳地,本步驟還可以在上述處理的基礎上,利用空間關係一致性校驗,對每個所選註冊圖像的、滿足預設重排匹配條件的特徵值對進行篩選,從而進一步提高圖像檢索精度。由於匹配成功的特徵值對中可能存在因為雜訊等原因引起的誤匹配,而對於兩幅同源圖像之間的相互對應的特徵值對,是可以藉由一個變換模型相互變換得到的,本實施例正是利用這一特點消除誤匹配對(也稱雜訊匹配對)。
具體實施時,可以針對步驟104-1所選的每個註冊圖像,執行下述操作:從滿足預設重排匹配條件的特徵值對(以下簡稱匹配特徵值對)中任意選擇3對或者4對特徵值對,採用RANSAC演算法估算出變換模型,藉由迴圈選擇不同的特徵值對,可以估算出不同的變換模型,並從這些變換模型中選擇與所有匹配特徵值對擬合程度最好的 變換模型(也稱變換矩陣),作為所述待檢索圖像與所述註冊圖像之間的變換模型,然後依次判斷每個匹配特徵值對對所述變換模型的擬合程度,對於擬合程度不滿足預設條件的匹配特徵值對可以認為是雜訊匹配對,因此將這樣的特徵值對從所述滿足預設重排匹配條件的特徵值對中剔除。
步驟104-3、根據滿足預設重排匹配條件的特徵值對的個數對所選註冊圖像進行排序,並從中選擇排序靠前的註冊圖像作為所述待檢索圖像的檢索結果。
對步驟104-1所選的各註冊圖像,根據在步驟104-2中得到的未被剔除的、滿足預設重排匹配條件的特徵值對的個數,按照從大到小的順序再次進行排序,並從中選擇排序靠前的註冊圖像作為所述待檢索圖像的檢索結果。由於對步驟104-1選取的註冊圖像與待檢索圖像再次進行了一對一匹配,並且剔除了誤匹配的特徵值對,因此經過上述重排操作後得到的檢索結果通常會更為精確。
需要說明的是,上述一對一匹配的重排過程,以及利用變換模型剔除雜訊匹配對的機制是本實施例提供的較佳實施方式,在其他實施方式中,也可以不採用這兩種實施方式,或者僅採用其中之一,同樣可以實現本發明的技術方案。
至此,經由上述步驟101至步驟104完成了圖像檢索過程,獲取了待檢索圖像的檢索結果。需要說明的是,本實施例提供的技術方案既可以在單一的設備上實施,也可 以在基於C/S(用戶端/伺服器)架構的系統中實施。對於第二種方式,本實施例中描述的步驟101和102,即提取待檢索圖像的局部特徵以及計算特徵值的步驟可以在用戶端設備上執行,並且由用戶端設備將計算得到的特徵值發送給服務端設備,而步驟103和步驟104,即進行特徵值匹配以及選擇檢索結果的步驟可以由服務端設備在接收到所述特徵值後執行。
藉由上面的描述可以看出,本發明提供的圖像檢索方法,將圖像的局部特徵和深度自編碼網路模型結合起來,由於深度自編碼網路模型在對局部特徵進行壓縮表示的過程中,可以有效保持特徵值之間的距離資訊和辨別能力,從而能夠有效提升圖像檢索的精確度,減少重排過濾的工作量,提高檢索效率。
在上述的實施例中,提供了一種圖像檢索方法,與之相對應的,本發明還提供一種圖像檢索裝置。請參看圖5,其為本發明的一種圖像檢索裝置的實施例示意圖。由於裝置實施例基本相似於方法實施例,所以描述得比較簡單,相關之處參見方法實施例的部分說明即可。下述描述的裝置實施例僅僅是示意性的。
本實施例的一種圖像檢索裝置,包括:局部特徵提取單元501,用於提取待檢索圖像的局部特徵;特徵值計算單元502,用於採用預先訓練的深度自編碼網路模型計算所述局部特徵提取單元輸出的局部特徵的特徵值;特徵值匹配單元503,用於將所述特徵值計算單元輸出的特徵值 與圖像檢索資料庫中註冊圖像的特徵值進行匹配;檢索結果產生單元504,用於根據所述特徵值匹配單元輸出的匹配結果選擇滿足預設條件的註冊圖像作為所述待檢索圖像的檢索結果。
可選的,當所述特徵值為二值化特徵值時,所述特徵值匹配單元具體用於,採用基於漢明距離的方式進行匹配,並將漢明距離小於預設閾值的特徵值對作為匹配成功的特徵值對。
可選的,所述裝置包括:模型訓練單元,用於預先訓練所述深度自編碼網路模型;所述模型訓練單元包括:樣本選擇子單元,用於選擇樣本圖像集;樣本特徵提取子單元,用於提取所述樣本圖像集中的樣本圖像的局部特徵;反覆運算訓練子單元,用於以所述局部特徵作為輸入,以深度自編碼網路模型對輸入資料進行編解碼後的重建誤差最小為目標,進行反覆運算訓練直至所述深度自編碼網路模型收斂。
可選的,所述裝置包括:資料庫建立單元,用於預先建立所述圖像檢索資料庫;所述資料庫建立單元包括:註冊圖像選擇子單元,用於選取用於構建所述圖像檢索資料庫的註冊圖像;註冊圖像特徵提取子單元,用於提取所述註冊圖像的 局部特徵;註冊圖像特徵值計算子單元,用於利用所述深度自編碼網路模型計算所述局部特徵的特徵值;特徵值註冊子單元,用於將所述特徵值儲存在圖像檢索資料庫中,並建立所述特徵值與註冊圖像之間的對應關係。
可選的,所述資料庫建立單元還包括:特徵值篩選子單元,用於根據特徵值的分佈,對所述註冊圖像特徵值計算子單元計算得到的特徵值進行篩選;所述特徵值註冊子單元具體用於,將所述特徵值篩選子單元篩選後的特徵值儲存在圖像檢索資料庫中,並建立所述特徵值與註冊圖像之間的對應關係。
可選的,所述特徵值篩選子單元具體用於,選擇在註冊圖像中出現頻率低於預設閾值的特徵值;和/或,按照特徵值在註冊圖像中的位置分佈選擇特徵值。
可選的,所述裝置包括:距離計算單元,用於計算所述局部特徵對應的關鍵點到所述待檢索圖像中心的距離;局部特徵剔除單元,用於剔除所述距離計算單元計算得到的距離大於預設閾值的關鍵點對應的局部特徵;所述特徵值計算單元具體用於,採用所述深度自編碼網路模型計算由所述局部特徵剔除單元執行剔除操作後的局部特徵的特徵值。
可選的,所述檢索結果產生單元包括: 註冊圖像初選子單元,用於根據所述特徵值匹配單元輸出的匹配結果選擇滿足預設條件的註冊圖像;重排匹配子單元,用於針對所述註冊圖像初選子單元所選的每個註冊圖像,將所述待檢索圖像的特徵值與從圖像檢索資料庫中提取的註冊圖像特徵值進行兩兩匹配,並記錄滿足預設重排匹配條件的特徵值對的個數;重排篩選子單元,用於根據所述重排匹配子單元記錄的特徵值對的個數對所選註冊圖像進行排序,並從中選擇排序靠前的註冊圖像,作為所述待檢索圖像的檢索結果。
可選的,所述檢索結果產生單元還包括:空間一致性校驗子單元,用於藉由利用變換模型進行空間關係一致性校驗,從所述重排匹配子單元得到的特徵值對中剔除誤匹配的特徵值對;所述重排篩選子單元具體用於,根據所述空間一致性校驗子單元執行剔除操作後的、滿足預設重排匹配條件的特徵值對的個數對所選註冊圖像進行排序。
可選的,所述局部特徵提取單元以及所述特徵值計算單元部署於用戶端設備上;所述特徵值批匹配單元以及所述檢索結果產生單元部署於服務端設備上。
此外,本發明還提供一種獲取圖像資訊的方法,請參考圖6,其為本發明提供的一種獲取圖像資訊的方法的實施例的流程圖,本實施例與之前提供的各實施例內容相同的部分不再贅述,下面重點描述不同之處。本發明提供的 一種獲取圖像資訊的方法包括:
步驟601、提取待識別圖像的局部特徵。
所述待識別圖像可以包括:CD、圖書或者海報等封面圖像,本步驟提取所述待識別圖像的局部特徵。
具體實施時,可以藉由如下方式提取待識別圖像的局部特徵:採用SIFT演算法、採用LBP演算法或者利用卷積神經網路。
步驟602、採用預先訓練的深度自編碼網路模型計算所述局部特徵的特徵值。
在採用預先訓練的深度自編碼網路模型計算所述局部特徵的特徵值之前,可以先計算所述局部特徵對應的關鍵點到所述待識別圖像中心的距離,並剔除所述距離大於預設閾值的關鍵點對應的局部特徵,然後再採用所述深度自編碼網路模型計算執行上述剔除操作後的局部特徵的特徵值。
藉由在訓練所述深度自編碼網路模型的過程中添加關於二值化的約束條件,所述深度自編碼網路模型計算輸出的特徵值可以為二值化特徵值,從而實現進一步的特徵壓縮和量化表示。
步驟603、將所述特徵值發送給提供圖像識別服務的服務端。
步驟604、接收所述服務端返回的所述待識別圖像的相關資訊。
所述服務端可以採用本發明提供的圖像檢索方法找到 與所述待識別圖像相匹配的註冊圖像、並返回對應的註冊資訊,本步驟就會接收到所述資訊,例如,待識別圖像是圖書封面圖像,那麼本步驟可以接收到以下資訊:書名、作者姓名、價格、書評、線上購買網址等。
下面對本發明提供的獲取圖像資訊的方法與現有基於詞包模型的圖像檢索技術進行比較。現有基於詞包模型的圖像檢索技術中,一方面由於作為聚類中心的“詞”(也稱中心特徵向量)的數量通常在百萬級,需要非常大的儲存空間進行儲存,另一方面,將圖像的局部特徵轉換為“詞”的過程是一個百萬級的最近鄰問題,上述對儲存空間的要求以及對性能的要求,導致計算待識別圖像特徵值的過程無法在普通的移動終端設備上實現,要進行圖像識別的移動終端設備只能向服務端上傳待識別圖像或者待識別圖像的壓縮版本,前者由於上傳流量大導致速度慢,後者不僅會引入額外的編解碼時間,而且由於資訊損失會導致圖像識別結果不準確。
而本發明提供的獲取圖像資訊的方法,由於採用深度自編碼網路模型計算待識別圖像局部特徵的特徵值,通常只需要執行幾個矩陣乘法,對儲存空間和計算性能的要求都相對較低,可以在移動終端設備上實現,從而使得移動終端設備直接向服務端上傳待識別圖像的特徵值成為可能,可以減輕服務端的工作壓力。
進一步地,深度自編碼網路模型輸出的特徵值可以為量化的二值化特徵值,從而實現待識別圖像特徵的進一步 壓縮表示,能夠有效減少用戶端向服務端上傳的資料量,節省對網路頻寬的佔用、以及減少資料傳輸時間。在本實施例的一個具體例子中,所述深度自編碼網路模型輸出的二值化特徵值的長度為62位元,對於包含200個局部特徵的待識別圖像來說,藉由所述深度自編碼網路模型的壓縮量化,該圖像可以用大小為200 x 62位元=12400位元=1550位元組,即大約1.5KB的二進制碼序列來表徵。從而可以在移動終端設備上實現直接對待識別圖像特徵進行量化、並向伺服器上傳量化特徵資料的功能。
在上述的實施例中,提供了一種獲取圖像資訊的方法,與之相對應的,本發明還提供一種獲取圖像資訊的裝置。請參看圖7,其為本發明的一種獲取圖像資訊的裝置實施例的示意圖。由於裝置實施例基本相似於方法實施例,所以描述得比較簡單,相關之處參見方法實施例的部分說明即可。下述描述的裝置實施例僅僅是示意性的。
本實施例的一種獲取圖像資訊的裝置,包括:局部特徵提取單元701,用於提取待識別圖像的局部特徵;特徵值計算單元702,用於採用預先訓練的深度自編碼網路模型計算所述局部特徵提取單元輸出的局部特徵的特徵值;特徵值發送單元703,用於將所述特徵值計算單元輸出的特徵值發送給提供圖像識別服務的服務端;圖像資訊接收單元704,用於接收所述服務端返回的所述待識別圖像的相關資訊。
可選的,所述裝置包括: 距離計算單元,用於計算所述局部特徵對應的關鍵點到所述待檢索圖像中心的距離;局部特徵剔除單元,用於剔除所述距離計算單元計算得到的距離大於預設閾值的關鍵點對應的局部特徵;所述特徵值計算單元具體用於,採用所述深度自編碼網路模型計算由所述局部特徵剔除單元執行剔除操作後的局部特徵的特徵值。
可選的,所述局部特徵提取單元具體用於,採用SIFT演算法、LBP演算法或者利用卷積神經網路,提取所述待識別圖像的局部特徵。
此外,本發明還提供一種圖像識別方法,請參考圖8,其為本發明提供的一種圖像識別方法的實施例的流程圖,本實施例與之前提供的各實施例內容相同的部分不再贅述,下面重點描述不同之處。本發明提供的一種圖像識別方法包括:
步驟801、接收用戶端上傳的待識別圖像的特徵值,所述特徵值是以所述待識別圖像的局部特徵為輸入,利用預先訓練的深度自編碼網路模型計算得到的。
步驟802、將所述特徵值與圖像檢索資料庫中註冊圖像的特徵值進行匹配。
所述圖像檢索資料庫是採用如下步驟預先建立的:選取用於構建所述圖像檢索資料庫的註冊圖像;提取所述註冊圖像的局部特徵;利用所述深度自編碼網路模型計算所述局部特徵的特徵值;將所述特徵值儲存在圖像檢索資料 庫中,並建立所述特徵值與註冊圖像之間的對應關係。
在上述利用所述深度自編碼網路模型計算註冊圖像局部特徵的特徵值之後,還可以按照計算得到的特徵值的分佈,對特徵值進行篩選,例如,可以選擇在註冊圖像中出現頻率低於預設閾值的特徵值,也可以按照特徵值在註冊圖像中的位置分佈選擇特徵值,並將篩選後的特徵值儲存在圖像檢索資料庫中。
用戶端上傳的特徵值以及圖像檢索資料庫中註冊圖像的特徵值可以為:二值化特徵值,本步驟可以採用基於漢明距離的方式進行匹配,並將漢明距離小於預設閾值的特徵值對作為匹配成功的特徵值對。
步驟803、根據匹配結果選擇滿足預設條件的註冊圖像。
本步驟選擇與待識別圖像相匹配的註冊圖像。所述與待識別圖像相匹配的註冊圖像通常是指,與待識別圖像匹配程度比較高的註冊圖像,例如,與所述待識別圖像屬於相同圖像。所述相同圖像通常是指同一幅圖像經過一系列變化後得到的圖像(即near-duplicate圖像),所述一系列變化可以包括調整解析度、調整拍攝角度、調整亮度、添加浮水印等。
在具體實施時,可以採用與之前提供的圖像檢索方法實施例相同的方式,先選擇滿足預設條件的一組註冊圖像,然後再藉由重排的方式進行進一步篩選,從而找到與待識別圖像相匹配的註冊圖像。所述重排操作包括:針對 每個所選註冊圖像,將所述待識別圖像的特徵值與從圖像檢索資料庫中提取的註冊圖像特徵值進行兩兩匹配,並記錄滿足預設重排匹配條件的特徵值對的個數;根據滿足預設重排匹配條件的特徵值對的個數對所選註冊圖像進行排序,並從中選擇排序靠前的註冊圖像;為了提高識別的準確度,還可以添加一些選取註冊圖像的條件,例如:選擇按照特徵值匹配成功所得累計分值排序處於第一位、且與第二位的累計分值差大於預設閾值的註冊圖像;或者,選擇匹配成功的特徵值個數大於預設閾值的註冊圖像(例如,對於包含200個註冊特徵值的註冊圖像,至少有50個特徵值匹配成功)等。此處列舉了一些選取方式,在具體實施時,可以根據需要進行相應調整。
由於用戶端上傳的待識別圖像的特徵值、以及圖像檢索資料庫中儲存的註冊特徵值都能夠保持原始圖像特徵的分辨力,因此圖像檢索精確度高,在圖像檢索資料庫中註冊圖像規模足夠大的情況下,本步驟通常能夠準確找到與所述待識別圖像相匹配的註冊圖像。
步驟804、獲取與所選註冊圖像對應的註冊資訊,並返回給所述用戶端。
為了提供圖像識別功能,在構建所述圖像檢索資料庫時,通常也會儲存與註冊圖像對應的資訊,即本發明所述的註冊資訊。所述註冊資訊通常包括與圖像內容有關的資訊,例如對於圖書封面圖像,其註冊資訊可以包括與圖像 中圖書相關的資訊,例如書名、作者姓名、價格、書評、線上購買網址等。
具體實施時,本步驟可以根據步驟803選擇的註冊圖像,從資料庫中提取對應的註冊資訊。例如,可以根據註冊圖像標識,讀取對應的註冊資訊記錄,並將其中的註冊資訊發送給所述用戶端。
本發明提供的圖像識別方法,採用了將圖像的局部特徵和深度自編碼網路相結合的圖像檢索技術,由於深度自編碼網路在對局部特徵進行壓縮表示的過程中,可以有效保持特徵值之間的距離資訊和辨別能力,從而能夠有效提升圖像檢索的精確度,因此通常可以準確地檢索到所需的註冊圖像,並將所述註冊圖像的註冊資訊返回給用戶端。
進一步地,用戶端上傳的特徵值與圖像檢索資料庫儲存的特徵值可以為二值化特徵值,由於二值化特徵值是圖像特徵的進一步量化壓縮表示,使得本發明提供的圖像識別方法具有良好的可擴展性:一方面,可以將圖像檢索資料庫擴展到百萬級甚至億級的規模,另一方面,可以方便的利用雜湊等技術加速檢索過程,提高檢索性能。
在上述的實施例中,提供了一種圖像識別方法,與之相對應的,本發明還提供一種圖像識別裝置。請參看圖9,其為本發明提供的一種圖像識別裝置的實施例的示意圖。由於裝置實施例基本相似於方法實施例,所以描述得比較簡單,相關之處參見方法實施例的部分說明即可。下述描述的裝置實施例僅僅是示意性的。
本實施例的一種圖像識別裝置,包括:特徵值接收單元901,用於接收用戶端上傳的待識別圖像的特徵值,所述特徵值是以所述待識別圖像的局部特徵為輸入,利用預先訓練的深度自編碼網路模型計算得到的;特徵值匹配單元902,用於將所述特徵值接收單元接收到的特徵值與圖像檢索資料庫中註冊圖像的特徵值進行匹配;註冊圖像選擇單元903,用於根據匹配結果選擇滿足預設條件的註冊圖像;圖像資訊發送單元904,用於獲取與所選註冊圖像對應的註冊資訊,並返回給所述用戶端。
可選的,所述特徵值匹配單元具體用於,採用基於漢明距離的方式進行匹配,並將漢明距離小於預設閾值的特徵值對作為匹配成功的特徵值對。
可選的,所述裝置包括:資料庫建立單元,用於預先建立所述圖像檢索資料庫;所述資料庫建立單元包括:註冊圖像選擇子單元,用於選取用於構建所述圖像檢索資料庫的註冊圖像;註冊圖像特徵提取子單元,用於提取所述註冊圖像的局部特徵;註冊圖像特徵值計算子單元,用於利用所述深度自編碼網路模型計算所述局部特徵的特徵值;特徵值註冊子單元,用於將所述特徵值儲存在圖像檢索資料庫中,並建立所述特徵值與註冊圖像之間的對應關係。
可選的,所述資料庫建立單元還包括:特徵值篩選子單元,用於根據特徵值的分佈,對所述註冊圖像特徵值計算子單元計算得到的特徵值進行篩選;所述特徵值註冊子單元具體用於,將所述特徵值篩選子單元篩選後的特徵值儲存在圖像檢索資料庫中,並建立所述特徵值與註冊圖像之間的對應關係。
可選的,所述特徵值篩選子單元具體用於,選擇在註冊圖像中出現頻率低於預設閾值的特徵值;和/或,按照特徵值在註冊圖像中的位置分佈選擇特徵值。
可選的,所述註冊圖像選擇單元包括:註冊圖像初選子單元,用於根據所述特徵值匹配單元輸出的匹配結果選擇滿足預設條件的註冊圖像;重排匹配子單元,用於針對所述註冊圖像初選子單元所選的每個註冊圖像,將所述待識別圖像的特徵值與從圖像檢索資料庫中提取的註冊圖像特徵值進行兩兩匹配,並記錄滿足預設重排匹配條件的特徵值對的個數;重排篩選子單元,用於根據所述重排匹配子單元記錄的特徵值對的個數對所選註冊圖像進行排序,並從中選擇排序靠前的註冊圖像,作為所述待識別圖像的檢索結果。
此外,本發明還提供一種圖像識別系統,請參考圖10,其為本發明提供的一種圖像識別系統的實施例的示意圖。本實施例與之前提供的各實施例內容相同的部分不再贅述,下面重點描述不同之處。
本發明提供的圖像識別系統包括:獲取圖像資訊的裝 置1001和圖像識別裝置1002。所述獲取圖像資訊的裝置,可以部署於台式電腦,也可以部署於移動終端設備,但並不局限於此處列舉的上述設備,可以是能夠實現本發明所提供的獲取圖像資訊方法的任何設備;所述圖像識別裝置,通常部署於伺服器上,也可以是其他能夠實現本發明所提供的圖像識別方法的任何設備。
此外,本發明還提供一種用於計算圖像特徵值的方法,請參考圖11,其為本發明提供的一種用於計算圖像特徵值的方法實施例的流程圖,本實施例與之前提供的各實施例內容相同的部分不再贅述,下面重點描述不同之處。本發明提供的一種用於計算圖像特徵值的方法包括:
步驟1101、提取待計算特徵值圖像的局部特徵。
在執行本步驟之前,可以預先訓練所述深度自編碼網路模型,訓練過程包括:選擇樣本圖像集;提取所述樣本圖像集中的樣本圖像的局部特徵;以所述局部特徵作為輸入,以深度自編碼網路模型對輸入資料進行編解碼後的重建誤差最小為目標,進行反覆運算訓練直至所述深度自編碼網路模型收斂。
具體實施時,本步驟可以藉由如下方式提取待計算特徵值圖像的局部特徵:採用SIFT演算法、採用LBP演算法或者利用卷積神經網路。
步驟1102、採用預先訓練的深度自編碼網路模型計算所述局部特徵的特徵值。所述特徵值包括:二值化特徵值。
從服務端的角度,由於上述計算圖像特徵值的方法採用了深度自編碼網路模型,不僅實現了局部特徵的降維壓縮,而且可以有效保持特徵值之間的距離資訊和辨別能力,從而為提高圖像檢索的精確度提供保障。特別地,當所述深度自編碼網路模型輸出的特徵值為二值化特徵值時,還可以為提高圖像檢索資料庫的可擴展性和提高檢索效率提供條件。
從用戶端的角度,由於採用深度自編碼網路模型計算特徵值,降低了對儲存空間和計算性能的要求,可以在移動終端設備上完成對待識別圖像特徵值的計算過程,有助於減輕服務端的工作壓力;特別地,當深度自編碼網路模型計算輸出的特徵值為二值化特徵值時,可以有效減少移動終端設備上傳的資料量,減少上傳時間,改善用戶的使用體驗。
在上述的實施例中,提供了一種用於計算圖像特徵值的方法,與之相對應的,本發明還提供一種用於計算圖像特徵值的裝置。請參看圖12,其為本發明的一種用於計算圖像特徵值的裝置實施例的示意圖。由於裝置實施例基本相似於方法實施例,所以描述得比較簡單,相關之處參見方法實施例的部分說明即可。下述描述的裝置實施例僅僅是示意性的。
本實施例的一種用於計算圖像特徵值的裝置,包括:局部特徵提取單元1201,用於提取待計算特徵值圖像的局部特徵;特徵值計算單元1202,用於採用預先訓練的 深度自編碼網路模型計算所述局部特徵提取單元輸出的局部特徵的特徵值。
可選的,所述裝置包括:模型訓練單元,用於預先訓練所述深度自編碼網路模型;所述模型訓練單元包括:樣本選擇子單元,用於選擇樣本圖像集;樣本特徵提取子單元,用於提取所述樣本圖像集中的樣本圖像的局部特徵;反覆運算訓練子單元,用於以所述局部特徵作為輸入,以深度自編碼網路模型對輸入資料進行編解碼後的重建誤差最小為目標,進行反覆運算訓練直至所述深度自編碼網路模型收斂。
可選的,所述局部特徵提取單元具體用於,採用SIFT演算法、LBP演算法或者利用卷積神經網路,提取待計算特徵值圖像的局部特徵。
此外,本發明還提供了一種電子設備,所述電子設備實施例如下。請參考圖13,其示出了本發明的一種電子設備的實施例的示意圖。
所述電子設備,包括:顯示器1301;處理器1302;記憶體1303;所述記憶體1303用於儲存獲取圖像資訊的程式,所述程式在被所述處理器讀取執行時,執行如下操作:提取待識別圖像的局部特徵;採用預先訓練的深度自編碼網路模型計算所述局部特徵的二值化特徵值;將所述二值化特 徵值發送給提供圖像識別服務的服務端;接收所述服務端返回的所述待識別圖像的相關資訊。
本發明雖然以較佳實施例公開如上,但其並不是用來限定本發明,任何本領域技術人員在不脫離本發明的精神和範圍內,都可以做出可能的變動和修改,因此本發明的保護範圍應當以本發明申請專利範圍所界定的範圍為准。
在一個典型的配置中,計算設備包括一個或多個處理器(CPU)、輸入/輸出介面、網路介面和記憶體。
記憶體可能包括電腦可讀媒體中的非永久性記憶體,隨機存取記憶體(RAM)和/或非易失性記憶體等形式,如唯讀記憶體(ROM)或快閃記憶體(flash RAM)。記憶體是電腦可讀媒體的示例。
1、電腦可讀媒體包括永久性和非永久性、可移動和非可移動媒體可以由任何方法或技術來實現資訊儲存。資訊可以是電腦可讀指令、資料結構、程式的模組或其他資料。電腦的儲存媒體的例子包括,但不限於相變記憶體(PRAM)、靜態隨機存取記憶體(SRAM)、動態隨機存取記憶體(DRAM)、其他類型的隨機存取記憶體(RAM)、唯讀記憶體(ROM)、電可抹除可程式唯讀記憶體(EEPROM)、快閃記憶體或其他記憶體技術、唯讀光碟唯讀記憶體(CD-ROM)、數位多功能光碟(DVD)或其他光學儲存、磁盒式磁帶,磁帶磁片儲存或其他磁性存放裝置或任何其他非傳輸媒體,可用於儲存可以被計算設備存取的資訊。按照本文中的界定,電腦可讀媒體不包括非暫存 電腦可讀媒體(transitory media),如調變的資料信號和載波。
2、本領域技術人員應明白,本發明的實施例可提供為方法、系統或電腦程式產品。因此,本發明可採用完全硬體實施例、完全軟體實施例或結合軟體和硬體方面的實施例的形式。而且,本發明可採用在一個或多個其中包含有電腦可用程式碼的電腦可用儲存媒體(包括但不限於磁碟記憶體、CD-ROM、光學記憶體等)上實施的電腦程式產品的形式。

Claims (46)

  1. 一種圖像檢索方法,其特徵在於,包括:提取待檢索圖像的局部特徵;採用預先訓練的深度自編碼網路模型計算所述局部特徵的特徵值;將所述特徵值與圖像檢索資料庫中註冊圖像的特徵值進行匹配;根據匹配結果選擇滿足預設條件的註冊圖像作為所述待檢索圖像的檢索結果。
  2. 根據申請專利範圍第1項所述的圖像檢索方法,其中,所述特徵值包括二值化特徵值。
  3. 根據申請專利範圍第2項所述的圖像檢索方法,其中,所述將所述特徵值與圖像檢索資料庫中註冊圖像的特徵值進行匹配包括:採用基於漢明距離的方式進行匹配,並將漢明距離小於預設閾值的特徵值對作為匹配成功的特徵值對。
  4. 根據申請專利範圍第3項所述的圖像檢索方法,其中,所述採用基於漢明距離的方式進行匹配包括:採用計算漢明距離的線性查詢方式進行匹配;或者,採用以二值化特徵值為索引查詢雜湊表的方式進行匹配。
  5. 根據申請專利範圍第1項所述的圖像檢索方法,其中,預先訓練所述深度自編碼網路模型,包括:選擇樣本圖像集; 提取所述樣本圖像集中的樣本圖像的局部特徵;以所述局部特徵作為輸入,以深度自編碼網路模型對輸入資料進行編解碼後的重建誤差最小為目標,進行反覆運算訓練直至所述深度自編碼網路模型收斂。
  6. 根據申請專利範圍第1項所述的圖像檢索方法,其中,所述圖像檢索資料庫是採用如下步驟預先建立的:選取用於構建所述圖像檢索資料庫的註冊圖像;提取所述註冊圖像的局部特徵;利用所述深度自編碼網路模型計算所述局部特徵的特徵值;將所述特徵值儲存在圖像檢索資料庫中,並建立所述特徵值與註冊圖像之間的對應關係。
  7. 根據申請專利範圍第6項所述的圖像檢索方法,其中,在所述提取所述註冊圖像的局部特徵之前,執行下述操作:按照預設的方式對所述註冊圖像的尺寸進行正規化。
  8. 根據申請專利範圍第6項所述的圖像檢索方法,其中,在利用所述深度自編碼網路模型計算所述局部特徵的特徵值之後,執行下述步驟:按照計算得到的特徵值的分佈,對特徵值進行篩選;所述將所述特徵值儲存在圖像檢索資料庫中包括:將篩選後的特徵值儲存在圖像檢索資料庫中。
  9. 根據申請專利範圍第8項所述的圖像檢索方法,其中,所述按照計算得到的特徵值的分佈,對特徵值進行 篩選包括:選擇在註冊圖像中出現頻率低於預設閾值的特徵值;和/或,按照特徵值在註冊圖像中的位置分佈選擇特徵值。
  10. 根據申請專利範圍第1項所述的圖像檢索方法,其中,在所述提取待檢索圖像的局部特徵之後,執行下述操作:計算所述局部特徵對應的關鍵點到所述待檢索圖像中心的距離;剔除所述距離大於預設閾值的關鍵點對應的局部特徵;所述採用預先訓練的深度自編碼網路模型計算所述局部特徵的特徵值包括:採用所述深度自編碼網路模型計算執行上述剔除操作後的局部特徵的特徵值。
  11. 根據申請專利範圍第1項所述的圖像檢索方法,其中,所述將所述特徵值與圖像檢索資料庫中註冊圖像的特徵值進行匹配包括:將所述特徵值與圖像檢索資料庫中註冊圖像的特徵值,採用如下方式逐一進行兩兩匹配:計算表徵待匹配特徵值對的差異程度的指標值,並當所述指標值小於預先設定的閾值時判定所述特徵值對匹配成功。
  12. 根據申請專利範圍第1項所述的圖像檢索方法,其中,所述滿足預設條件的註冊圖像包括:按照特徵值匹配成功的個數從大到小排序靠前的註冊 圖像;或者,特徵值匹配成功的個數大於預設閾值的註冊圖像;或者,按照特徵值匹配成功所得累計分值從大到小排序靠前的註冊圖像;或者,特徵值匹配成功所得累計分值大於預設閾值的註冊圖像。
  13. 根據申請專利範圍第1項所述的圖像檢索方法,其中,在所述根據匹配結果選擇滿足預設條件的註冊圖像後,執行下述重排操作:針對每個所選註冊圖像,將所述待檢索圖像的特徵值與從圖像檢索資料庫中提取的註冊圖像特徵值進行兩兩匹配,並記錄滿足預設重排匹配條件的特徵值對的個數;根據滿足預設重排匹配條件的特徵值對的個數對所選註冊圖像進行排序,並從中選擇排序靠前的註冊圖像;所述根據匹配結果選擇滿足預設條件的註冊圖像作為所述待檢索圖像的檢索結果包括:將執行上述重排操作後所選註冊圖像作為所述待檢索圖像的檢索結果。
  14. 根據申請專利範圍第13項所述的圖像檢索方法,其中,在所述記錄滿足預設重排匹配條件的特徵值對的個數後,執行下述操作:藉由利用變換模型進行空間關係一致性校驗,從所述滿足預設重排匹配條件的特徵值對中剔除誤匹配的特徵值對; 所述根據滿足預設重排序匹配條件的特徵值對的個數對所選註冊圖像進行排序包括:根據執行上述剔除操作後的、滿足預設重排匹配條件的特徵值對的個數對所選註冊圖像進行排序。
  15. 根據申請專利範圍第1-14項之任一項所述的圖像檢索方法,其中,藉由如下方式提取圖像的局部特徵:採用SIFT演算法、採用LBP演算法或者利用卷積神經網路。
  16. 根據申請專利範圍第1項所述的圖像檢索方法,其中,所述提取待檢索圖像的局部特徵、以及所述採用預先訓練的深度自編碼網路模型計算所述局部特徵的特徵值的步驟在用戶端設備上執行;所述將所述特徵值與圖像檢索資料庫中圖像的特徵值進行匹配、以及所述根據匹配結果選擇滿足預設條件的註冊圖像作為所述待檢索圖像的檢索結果的步驟在服務端設備上執行。
  17. 一種圖像檢索裝置,其特徵在於,包括:局部特徵提取單元,用於提取待檢索圖像的局部特徵;特徵值計算單元,用於採用預先訓練的深度自編碼網路模型計算所述局部特徵提取單元輸出的局部特徵的特徵值;特徵值匹配單元,用於將所述特徵值計算單元輸出的特徵值與圖像檢索資料庫中註冊圖像的特徵值進行匹配; 檢索結果產生單元,用於根據所述特徵值匹配單元輸出的匹配結果選擇滿足預設條件的註冊圖像作為所述待檢索圖像的檢索結果。
  18. 根據申請專利範圍第17項所述的圖像檢索裝置,其中,當所述特徵值為二值化特徵值時,所述特徵值匹配單元具體用於,採用基於漢明距離的方式進行匹配,並將漢明距離小於預設閾值的特徵值對作為匹配成功的特徵值對。
  19. 根據申請專利範圍第17項所述的圖像檢索裝置,其中,包括:模型訓練單元,用於預先訓練所述深度自編碼網路模型;所述模型訓練單元包括:樣本選擇子單元,用於選擇樣本圖像集;樣本特徵提取子單元,用於提取所述樣本圖像集中的樣本圖像的局部特徵;反覆運算訓練子單元,用於以所述局部特徵作為輸入,以深度自編碼網路模型對輸入資料進行編解碼後的重建誤差最小為目標,進行反覆運算訓練直至所述深度自編碼網路模型收斂。
  20. 根據申請專利範圍第17項所述的圖像檢索裝置,其中,包括:資料庫建立單元,用於預先建立所述圖像檢索資料庫;所述資料庫建立單元包括:註冊圖像選擇子單元,用於選取用於構建所述圖像檢 索資料庫的註冊圖像;註冊圖像特徵提取子單元,用於提取所述註冊圖像的局部特徵;註冊圖像特徵值計算子單元,用於利用所述深度自編碼網路模型計算所述局部特徵的特徵值;特徵值註冊子單元,用於將所述特徵值儲存在圖像檢索資料庫中,並建立所述特徵值與註冊圖像之間的對應關係。
  21. 根據申請專利範圍第20項所述的圖像檢索裝置,其中,所述資料庫建立單元還包括:特徵值篩選子單元,用於根據特徵值的分佈,對所述註冊圖像特徵值計算子單元計算得到的特徵值進行篩選;所述特徵值註冊子單元具體用於,將所述特徵值篩選子單元篩選後的特徵值儲存在圖像檢索資料庫中,並建立所述特徵值與註冊圖像之間的對應關係。
  22. 根據申請專利範圍第17項所述的圖像檢索裝置,其中,所述裝置包括:距離計算單元,用於計算所述局部特徵對應的關鍵點到所述待檢索圖像中心的距離;局部特徵剔除單元,用於剔除所述距離計算單元計算得到的距離大於預設閾值的關鍵點對應的局部特徵;所述特徵值計算單元具體用於,採用所述深度自編碼網路模型計算由所述局部特徵剔除單元執行剔除操作後的局部特徵的特徵值。
  23. 根據申請專利範圍第17項所述的圖像檢索裝置,其中,所述檢索結果產生單元包括:註冊圖像初選子單元,用於根據所述特徵值匹配單元輸出的匹配結果選擇滿足預設條件的註冊圖像;重排匹配子單元,用於針對所述註冊圖像初選子單元所選的每個註冊圖像,將所述待檢索圖像的特徵值與從圖像檢索資料庫中提取的註冊圖像特徵值進行兩兩匹配,並記錄滿足預設重排匹配條件的特徵值對的個數;重排篩選子單元,用於根據所述重排匹配子單元記錄的特徵值對的個數對所選註冊圖像進行排序,並從中選擇排序靠前的註冊圖像,作為所述待檢索圖像的檢索結果。
  24. 根據申請專利範圍第23項所述的圖像檢索裝置,其中,所述檢索結果產生單元還包括:空間一致性校驗子單元,用於藉由利用變換模型進行空間關係一致性校驗,從所述重排匹配子單元得到的特徵值對中剔除誤匹配的特徵值對;所述重排篩選子單元具體用於,根據所述空間一致性校驗子單元執行剔除操作後的、滿足預設重排匹配條件的特徵值對的個數對所選註冊圖像進行排序。
  25. 根據申請專利範圍第17項所述的圖像檢索裝置,其中,所述局部特徵提取單元以及所述特徵值計算單元部署於用戶端設備上;所述特徵值匹配單元以及所述檢索結果產生單元部署於服務端設備上。
  26. 一種獲取圖像資訊的方法,其特徵在於,包括:提取待識別圖像的局部特徵;採用預先訓練的深度自編碼網路模型計算所述局部特徵的特徵值;將所述特徵值發送給提供圖像識別服務的服務端;接收所述服務端返回的所述待識別圖像的相關資訊。
  27. 根據申請專利範圍第26項所述的獲取圖像資訊的方法,其中,所述特徵值包括二值化特徵值。
  28. 根據申請專利範圍第26項所述的獲取圖像資訊的方法,其中,在所述提取待識別圖像的局部特徵之後,執行下述操作:計算所述局部特徵對應的關鍵點到所述待識別圖像中心的距離;剔除所述距離大於預設閾值的關鍵點對應的局部特徵;所述採用預先訓練的深度自編碼網路模型計算所述局部特徵的特徵值包括:採用所述深度自編碼網路模型計算執行上述剔除操作後的局部特徵的特徵值。
  29. 根據申請專利範圍第26-28項中任一項所述的圖像檢索方法,其中,藉由如下方式提取待識別圖像的局部特徵:採用SIFT演算法、採用LBP演算法或者利用卷積神經網路。
  30. 根據申請專利範圍第26項所述的獲取圖像資訊的方法,其中,所述方法在移動終端設備上實施。
  31. 一種獲取圖像資訊的裝置,其特徵在於,包括:局部特徵提取單元,用於提取待識別圖像的局部特徵;特徵值計算單元,用於採用預先訓練的深度自編碼網路模型計算所述局部特徵提取單元輸出的局部特徵的特徵值;特徵值發送單元,用於將所述特徵值計算單元輸出的特徵值發送給提供圖像識別服務的服務端;圖像資訊接收單元,用於接收所述服務端返回的所述待識別圖像的相關資訊。
  32. 一種圖像識別方法,其特徵在於,包括:接收用戶端上傳的待識別圖像的特徵值,所述特徵值是以所述待識別圖像的局部特徵為輸入,利用預先訓練的深度自編碼網路模型計算得到的;將所述特徵值與圖像檢索資料庫中註冊圖像的特徵值進行匹配;根據匹配結果選擇滿足預設條件的註冊圖像;獲取與所選註冊圖像對應的註冊資訊,並返回給所述用戶端。
  33. 根據申請專利範圍第32項所述的圖像識別方法,其中,所述特徵值包括:二值化特徵值。
  34. 根據申請專利範圍第33項所述的圖像識別方法,其中,所述將所述特徵值與圖像檢索資料庫中註冊圖像的特徵值進行匹配包括:採用基於漢明距離的方式進行 匹配,並將漢明距離小於預設閾值的特徵值對作為匹配成功的特徵值對。
  35. 根據申請專利範圍第32項所述的圖像識別方法,其中,所述圖像檢索資料庫是採用如下步驟預先建立的:選取用於構建所述圖像檢索資料庫的註冊圖像;提取所述註冊圖像的局部特徵;利用所述深度自編碼網路模型計算所述局部特徵的特徵值;將所述特徵值儲存在圖像檢索資料庫中,並建立所述特徵值與註冊圖像之間的對應關係。
  36. 根據申請專利範圍第35項所述的圖像識別方法,其中,在利用所述深度自編碼網路模型計算所述局部特徵的特徵值之後,執行下述步驟:按照計算得到的特徵值的分佈,對特徵值進行篩選;所述將所述特徵值儲存在圖像檢索資料庫中包括:將篩選後的特徵值儲存在圖像檢索資料庫中。
  37. 根據申請專利範圍第36項所述的圖像識別方法,其中,所述按照計算得到的特徵值的分佈,對特徵值進行篩選包括:選擇在註冊圖像中出現頻率低於預設閾值的特徵值;和/或,按照特徵值在註冊圖像中的位置分佈選擇特徵值。
  38. 根據申請專利範圍第32項所述的圖像識別方 法,其中,在所述根據匹配結果選擇滿足預設條件的註冊圖像後,執行下述重排操作:針對每個所選註冊圖像,將所述待識別圖像的特徵值與從圖像檢索資料庫中提取的註冊圖像特徵值進行兩兩匹配,並記錄滿足預設重排匹配條件的特徵值對的個數;根據滿足預設重排匹配條件的特徵值對的個數對所選註冊圖像進行排序,並從中選擇排序靠前的註冊圖像;所述根據匹配結果選擇滿足預設條件的註冊圖像作為所述待檢索圖像的檢索結果包括:將執行上述重排操作後所選註冊圖像作為所述待檢索圖像的檢索結果。
  39. 一種圖像識別裝置,其特徵在於,包括:特徵值接收單元,用於接收用戶端上傳的待識別圖像的特徵值,所述特徵值是以所述待識別圖像的局部特徵為輸入,利用預先訓練的深度自編碼網路模型計算得到的;特徵值匹配單元,用於將所述特徵值接收單元接收到的特徵值與圖像檢索資料庫中註冊圖像的特徵值進行匹配;註冊圖像選擇單元,用於根據匹配結果選擇滿足預設條件的註冊圖像;圖像資訊發送單元,用於獲取與所選註冊圖像對應的註冊資訊,並返回給所述用戶端。
  40. 一種圖像識別系統,其特徵在於,包括:根據申請專利範圍第27項所述的獲取圖像資訊的裝置,以及根據申請專利範圍第30項所述的圖像識別裝置。
  41. 一種用於計算圖像特徵值的方法,其特徵在於,包括:提取待計算特徵值圖像的局部特徵;採用預先訓練的深度自編碼網路模型計算所述局部特徵的特徵值。
  42. 根據申請專利範圍第41項所述的用於計算圖像特徵值的方法,其特徵在於,所述特徵值包括:二值化特徵值。
  43. 根據申請專利範圍第41項所述的用於計算圖像特徵值的方法,其特徵在於,預先訓練所述深度自編碼網路模型,包括:選擇樣本圖像集;提取所述樣本圖像集中的樣本圖像的局部特徵;以所述局部特徵作為輸入,以深度自編碼網路模型對輸入資料進行編解碼後的重建誤差最小為目標,進行反覆運算訓練直至所述深度自編碼網路模型收斂。
  44. 根據申請專利範圍第41-43項中任一項所述的用於計算圖像特徵值的方法,其特徵在於,藉由如下方式提取待計算特徵值圖像的局部特徵:採用SIFT演算法、採用LBP演算法或者利用卷積神經網路。
  45. 一種用於計算圖像特徵值的裝置,其特徵在於,包括:局部特徵提取單元,用於提取待計算特徵值圖像的局部特徵; 特徵值計算單元,用於採用預先訓練的深度自編碼網路模型計算所述局部特徵提取單元輸出的局部特徵的特徵值。
  46. 一種電子設備,其特徵在於,包括:顯示器;處理器;記憶體,用於儲存獲取圖像資訊的程式,所述程式在被所述處理器讀取執行時,執行如下操作:提取待識別圖像的局部特徵;採用預先訓練的深度自編碼網路模型計算所述局部特徵的二值化特徵值;將所述二值化特徵值發送給提供圖像識別服務的服務端;接收所述服務端返回的關於所述待識別圖像的相關資訊。
TW106101917A 2017-01-19 2017-01-19 圖像檢索、獲取圖像資訊及圖像識別方法、裝置及系統 TW201828109A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
TW106101917A TW201828109A (zh) 2017-01-19 2017-01-19 圖像檢索、獲取圖像資訊及圖像識別方法、裝置及系統

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
TW106101917A TW201828109A (zh) 2017-01-19 2017-01-19 圖像檢索、獲取圖像資訊及圖像識別方法、裝置及系統

Publications (1)

Publication Number Publication Date
TW201828109A true TW201828109A (zh) 2018-08-01

Family

ID=63960230

Family Applications (1)

Application Number Title Priority Date Filing Date
TW106101917A TW201828109A (zh) 2017-01-19 2017-01-19 圖像檢索、獲取圖像資訊及圖像識別方法、裝置及系統

Country Status (1)

Country Link
TW (1) TW201828109A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110009052A (zh) * 2019-04-11 2019-07-12 腾讯科技(深圳)有限公司 一种图像识别的方法、图像识别模型训练的方法及装置
TWI761151B (zh) * 2020-05-06 2022-04-11 大陸商支付寶(杭州)信息技術有限公司 基於差分隱私的資料生成系統的訓練方法及裝置
TWI770542B (zh) * 2019-08-28 2022-07-11 大陸商北京市商湯科技開發有限公司 人臉圖像處理方法、圖像設備及儲存介質
TWI776668B (zh) * 2021-09-07 2022-09-01 台達電子工業股份有限公司 影像處理方法及影像處理系統
TWI781554B (zh) * 2020-04-16 2022-10-21 大陸商騰訊科技(深圳)有限公司 物品名稱確定方法、裝置、電腦設備及儲存媒體

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110009052A (zh) * 2019-04-11 2019-07-12 腾讯科技(深圳)有限公司 一种图像识别的方法、图像识别模型训练的方法及装置
CN110009052B (zh) * 2019-04-11 2022-11-18 腾讯科技(深圳)有限公司 一种图像识别的方法、图像识别模型训练的方法及装置
TWI770542B (zh) * 2019-08-28 2022-07-11 大陸商北京市商湯科技開發有限公司 人臉圖像處理方法、圖像設備及儲存介質
US11941854B2 (en) 2019-08-28 2024-03-26 Beijing Sensetime Technology Development Co., Ltd. Face image processing method and apparatus, image device, and storage medium
TWI781554B (zh) * 2020-04-16 2022-10-21 大陸商騰訊科技(深圳)有限公司 物品名稱確定方法、裝置、電腦設備及儲存媒體
TWI761151B (zh) * 2020-05-06 2022-04-11 大陸商支付寶(杭州)信息技術有限公司 基於差分隱私的資料生成系統的訓練方法及裝置
TWI776668B (zh) * 2021-09-07 2022-09-01 台達電子工業股份有限公司 影像處理方法及影像處理系統

Similar Documents

Publication Publication Date Title
WO2017020741A1 (zh) 图像检索、获取图像信息及图像识别方法、装置及系统
US10977307B2 (en) Method and apparatus for multi-dimensional content search and video identification
JP5926291B2 (ja) 類似画像を識別する方法および装置
Tolias et al. Image search with selective match kernels: aggregation across single and multiple images
TW201828109A (zh) 圖像檢索、獲取圖像資訊及圖像識別方法、裝置及系統
Guo et al. Content-based image retrieval using features extracted from halftoning-based block truncation coding
JP5749394B2 (ja) 視覚探索のための堅牢な特徴マッチング
Chen et al. Tree histogram coding for mobile image matching
Amato et al. Large-scale instance-level image retrieval
CN105095435A (zh) 一种图像高维特征的相似比较方法及装置
CN112307239B (zh) 一种图像检索方法、装置、介质和设备
WO2023108995A1 (zh) 向量相似度计算方法、装置、设备及存储介质
Zhou et al. Multiple distance-based coding: toward scalable feature matching for large-scale web image search
CN108182256A (zh) 一种基于离散局部线性嵌入哈希的高效图像检索方法
CN110442749B (zh) 视频帧处理方法及装置
Zhang et al. Large‐scale video retrieval via deep local convolutional features
CN109446408B (zh) 检索相似数据的方法、装置、设备及计算机可读存储介质
Springer et al. Forest hashing: Expediting large scale image retrieval
JP6317715B2 (ja) 画像認識装置、方法、及びプログラム
CN111143619B (zh) 视频指纹生成方法、检索方法、电子设备及介质
CN113515662A (zh) 一种相似歌曲检索方法、装置、设备以及存储介质
CN115129915A (zh) 重复图像检索方法、装置、设备及存储介质
Wu et al. Self-Supervised Consistent Quantization for Fully Unsupervised Image Retrieval
Wadhwa et al. Distributed locality sensitivity hashing
Janet et al. Incremental codebook generation for vector quantization in large scale content based image retrieval