TWI528196B

TWI528196B - Similar image recognition method and apparatus

Info

Publication number: TWI528196B
Application number: TW100116696A
Authority: TW
Inventors: Hui Xue
Original assignee: Alibaba Group Holding Ltd
Priority date: 2011-01-28
Filing date: 2011-05-12
Publication date: 2016-04-01
Also published as: TW201232302A; JP2014505313A; EP2668619A4; CN102622366A; WO2012102926A1; US9053386B2; US20130301935A1; HK1168919A1; EP2668619A1; JP5926291B2; CN102622366B

Description

相似圖像的識別方法和裝置

本申請涉及多媒體圖像識別技術領域，具體而言，涉及一種相似圖像的識別方法和裝置。

相似圖像檢索是近幾年興起的技術，屬於多媒體識別的一種，其主要包含特徵提取、索引構建、查詢、相似度排序等主要步驟。如圖1所示，在建立圖像索引庫時，用戶A向圖像伺服器10上傳待儲存的圖像，圖像伺服器10為該圖像生成圖像簽名，並以該圖像簽名作為索引，以便於後續的檢索查詢。當需要識別相似圖像時，用戶B向圖像伺服器10請求相似圖像檢索，圖像伺服器10根據該圖像的索引查詢與該圖像索引對應的相似圖像。在圖像伺服器10查找到與用戶B輸入的圖像相似的圖像之後，向用戶B返回相似的圖像列表。

目前在生成圖像的圖像簽名時，常用的方法是在圖像伺服器10中對圖片內容的二進位流進行散列編碼(hash coding)，作為唯一標識該圖像的圖像簽名，然後將該圖像簽名常駐記憶體或儲存在圖像伺服器10中的資料庫或檔系統中。

然而，上述現有技術的相似圖像檢索存在以下缺點：

1)通用性較差

對於同一副圖片，即使不做任何修改，以不同的格式(bmp、jpeg、png、gif等等)保存，得到的圖像簽名值也有很大的差異；然而大部分情況下，從用戶期望的角度來看，希望將兩幅僅僅格式不同的圖片作為相似圖片。

2)容錯性問題

由於衝突的原因，圖像的二進位流的散列編碼不可能是唯一的，即存在這種情況，即便是兩張完全不同的圖片，也有可能會因為圖像簽名相同而被做為相同的圖片提供給圖像查詢者。

3)不適合用作近似檢索

傳統的基於散列編碼的圖片簽名方式，由於沒有利用圖片本身的資訊，因此只能用於精確檢索，即查找和目標圖片完全一樣的圖片，不適用作相似圖片檢索。

針對相關技術中所存在的問題，目前尚未發現有效的解決方案。

本申請旨在提供一種相似圖像的識別方法和裝置，以解決現有技術中的圖像識別方法所存在的容錯性的問題。

根據本申請的一個態樣，提供了一種相似圖像的識別方法，其包括：獲取與輸入圖像的內容資訊對應的圖像簽名；對該圖像簽名進行散列操作；在預先儲存的散列表中查詢與該散列操作的結果相對應的表項；在與查詢得到的該表項對應的候選圖像中識別與該輸入圖像相似的圖像。

進一步地，透過以下步驟獲取與輸入圖像的內容資訊對應的圖像簽名：將輸入圖像轉化為灰度圖像；將灰度圖像分成N×N的子圖像，並對每個子圖像分別從M個方向上計算邊緣直方圖，得到N×N×M個計算結果，其中，N和M均為自然數；將灰度圖像對應的N×N×M個計算結果組合成作為圖像簽名的N×N×M維向量。

進一步地，對圖像簽名進行散列操作的步驟包括；分別使用L個局部散列函數對該圖像簽名進行散列操作，得到L個第一散列值，其中，L為自然數；使用一個全局散列函數分別對L個第一散列值進行散列操作，得到L個第二散列值。

進一步地，在預先儲存的散列表中查詢與散列操作的結果相對應的表項的步驟包括：在每個第二散列值對應的散列表中查找是否存在記錄有該第二散列值的表項，其中，該散列表中的每個表項記錄了一個圖像的散列值和圖像標識，或者，該每個表項記錄了一個圖像的散列值、該圖像的圖像標識以及圖像簽名。

進一步地，第二散列值與散列表的對應關係包括：第i個第二散列值對應於第i個散列表，i=1,...L。

進一步地，分別使用L個局部散列函數對圖像簽名進行散列操作的步驟包括：將圖像簽名轉換成R維二進位向量，其中，R為自然數；使用R維二進位向量生成L個局部散列函數，其中，每個局部散列函數由R維二進位向量中的一維或多維二進位向量生成；使用L個局部散列函數對R維二進位向量進行散列操作。

進一步地，使用R維二進位向量中的一維或多維二進位向量生成一個局部散列函數的步驟包括：設置局部散列函數的輸入參數為K；隨機從R維二進位向量中選取K維二進位向量，將K維二進位向量進行拼接作為局部散列函數的返回值，其中，K<R。

進一步地，在與查詢得到的表項對應的候選圖像中識別與輸入圖像相似的圖像的步驟包括：計算輸入圖像的圖像簽名與每個候選圖像的圖像簽名之間的空間距離；按照空間距離的大小來識別候選圖像與輸入圖像的相似度，其中，空間距離越小的候選圖像與輸入圖像的相似度越高。

進一步地，按照空間距離的大小來識別候選圖像與輸入圖像的相似度之後，還包括：按照空間距離的大小輸出候選圖像。

進一步地，在分別使用L個局部散列函數對圖像簽名進行散列操作之前，透過以下步驟預先建立L個散列表：分別使用L個局部散列函數對與每個待儲存的圖像的內容對應的圖像簽名進行散列操作，得到L個第三散列值，其中，L為自然數；使用一個全局散列函數分別對L個第三散列值進行散列操作，得到L個第四散列值；將第j個第四散列值以及該第四散列值對應的圖像標識和圖像簽名記錄到第j個散列表中，其中，j=1,...L。

根據本申請的另一態樣，提供了一種相似圖像的識別裝置，位於圖片伺服器上，其包括：獲取單元，用於獲取與輸入圖像的內容資訊對應的圖像簽名；散列操作單元，用於對圖像簽名進行散列操作；查詢單元，用於在預先儲存的散列表中查詢與散列操作的結果相對應的表項；識別單元，用於在與查詢得到的表項對應的候選圖像中識別與輸入圖像相似的圖像。

進一步地，獲取單元包括：轉化模組，用於將輸入圖像轉化為灰度圖像；計算模組，用於將灰度圖像分成N×N的子圖像，並對每個子圖像分別從M個方向上計算邊緣直方圖，得到N×N×M個計算結果，其中，N和M均為自然數；生成模組，用於將灰度圖像對應的N×N×M個計算結果組合成作為圖像簽名的N×N×M維向量。

進一步地，散列操作單元包括：第一散列處理模組，用於分別使用L個局部散列函數對圖像簽名進行散列操作，得到L個第一散列值，其中，L為自然數；第二散列處理模組，用於使用一個全局散列函數分別對L個第一散列值進行散列操作，得到L個第二散列值。

進一步地，查詢單元包括：查找模組，用於在每個第二散列值對應的散列表中查找是否存在記錄有該第二散列值的表項，其中，該散列表中的每個表項記錄了一個圖像的散列值和圖像標識，或者，該每個表項記錄了一個圖像的散列值、該圖像的圖像標識以及圖像簽名；添加模組，用於在存在記錄有該第二散列值的表項時，將查找到的表項所記錄的圖像添加到候選圖像中。

進一步地，第一散列處理模組包括：轉換子模組，用於將圖像簽名轉換成R維二進位向量，其中，R為自然數；生成子模組，用於使用R維二進位向量生成L個局部散列函數，其中，每個局部散列函數由R維二進位向量中的一維或多維二進位向量生成；散列操作子模組，用於使用L個局部散列函數對R維二進位向量進行散列操作。

進一步地，生成子模組包括：設置子模組，用於設置局部散列函數的輸入參數為K；處理子模組，用於隨機從R維二進位向量中選取K維二進位向量，將K維二進位向量進行拼接作為局部散列函數的返回值，其中，K<R。

進一步地，識別單元包括：計算模組，用於計算輸入圖像的圖像簽名與每個候選圖像的圖像簽名之間的空間距離；識別模組，用於按照空間距離的大小來識別候選圖像與輸入圖像的相似度，其中，空間距離越小的候選圖像與輸入圖像的相似度越高。

進一步地，還包括：輸出單元，用於在按照空間距離的大小來識別該候選圖像與輸入圖像的相似度之後，按照空間距離的大小輸出候選圖像。

進一步地，還包括：散列表建立單元，用於在第一散列操作模組分別使用L個局部散列函數對與輸入圖像的內容對應的圖像簽名進行散列操作之前，分別使用L個局部散列函數對與每個待儲存的圖像的內容資訊對應的圖像簽名進行散列操作，得到L個第三散列值，其中，L為自然數；使用一個全局散列函數分別對L個第三散列值進行散列操作，得到L個第四散列值；將第j個第四散列值以及第四散列值對應的圖像標識和圖像簽名記錄到第j個散列表中，其中，j=1,...L。

在本申請中，利用圖像本身的內容作為圖像簽名，其簽名的相似度取決於圖像本身的相似度，即越是相似的圖像，其簽名的相似度也越大，或者說對應的空間距離(漢明距離(hamming distance)或歐氏距離(Euclidean distance)越短，這樣，僅僅是儲存格式不同的圖像具有完全相同圖像簽名值，從而解決了現有技術中的圖像識別方法所存在的容錯性的問題，使得能夠準確地識別出所需的相似圖像。在此基礎上，本申請還提出了基於局部敏感散列技術的海量相似圖像索引方案，將檢索的時間複雜度降低到亞線性級別，並且能將結果按照相似程度進行排序輸出。此外，採用邊緣直方圖的統計值作為圖像簽名的基礎特徵，配合圖像分割和基於人眼視覺敏感程度的非均勻量化技術，對不同顏色、不同縮放比例、局部模糊以及失真均有很好的適應性。

下文中將參考附圖並結合實施例來詳細說明本申請。需要說明的是，在不衝突的情況下，本申請中的實施例及實施例中的特徵可以相互組合。

實施例1

如圖2所示，本較佳的實施例提供了一種相似圖像的識別系統，其包括如下：上傳伺服器202、圖像資料庫裝置204、索引伺服器206、圖像計算伺服器208、以及圖像檢索前臺伺服器210。

在建立圖像索引庫時，用戶A向上傳伺服器202上傳待儲存的圖像，上傳伺服器202計算該圖像的圖像簽名，並將該圖像的圖像簽名發送給圖像資料庫裝置204。本申請實施例也可以透過爬蟲系統從網路中抓取圖像後儲存於上傳伺服器202中，本申請對此並不作限定。較佳的，上傳伺服器202利用圖像自身的內容資訊(例如，圖像的元資料，比如色彩、紋理等，而非位元組流)來計算該圖像的圖像簽名，從而大大降低了發生衝突的機率。

圖像資料庫裝置204在接收到該圖像的圖像簽名之後，利用局部散列函數對該圖像簽名進行散列操作，將結果作為索引資訊發送給索引伺服器。

當需要識別相似圖像時，用戶B向圖像檢索前臺伺服器210請求相似圖像檢索，圖像檢索前臺伺服器210將用戶B輸入的圖像發送給圖像計算伺服器208，以請求返回相似的圖像或圖像列表。圖像計算伺服器208在接收到用戶B輸入的圖像之後，向索引伺服器206查詢與該輸入的圖像相似的圖像的標識(ID)，其中，相似的圖像的散列值與輸入圖像的散列值相同。具體的查找方法可以為：利用用戶B輸入的圖像自身的內容資訊來構建用於查詢的圖像簽名，在索引伺服器206中查詢與該圖像簽名對應的相似圖像。

在圖像計算伺服器208查找到與用戶B輸入的圖像相似的圖像之後，向圖像檢索前臺伺服器210返回相似的圖像或圖像列表，以便顯示給用戶B。

作為一種替代的實施方式，各個伺服器所執行的功能可以在一個伺服器上實現，例如，如圖3所示的相似圖像的識別裝置，其位於圖像伺服器上，其包括：獲取單元302，用於獲取與輸入圖像的內容資訊對應的圖像簽名；散列操作單元304，用於對該圖像簽名進行散列操作；查詢單元306，用於在預先儲存的散列表中查詢與散列操作的結果相對應的表項；識別單元308，用於在與查詢得到的表項對應的候選圖像中識別與輸入圖像相似的圖像。

在本較佳的實施例中，識別裝置利用圖像本身的內容作為圖像簽名，其簽名的相似度取決於圖像本身的相似度，即越是相似的圖像，其簽名的相似度也越大，或者說對應的空間距離(漢明距離或歐氏距離)越短，這樣，僅僅是儲存格式不同的圖像具有完全相同圖像簽名值，從而解決了現有技術中的圖像識別方法所存在的容錯性的問題，使得能夠準確地識別出所需的相似圖像。

較佳的，如圖4所示，獲取單元302包括：轉化模組3021，用於將輸入圖像轉化為灰度圖像；計算模組3022，用於將灰度圖像分成N×N的子圖像，並對每個子圖像分別從M個方向上計算邊緣直方圖，得到N×N×M個計算結果，其中，N和M均為自然數；生成模組3023，用於將灰度圖像對應的N×N×M個計算結果組合成作為圖像簽名的N×N×M維向量。較佳的，還可以對N×N×M維向量採用基於人眼視覺敏感程度的非均勻量化技術。在本較佳的實施例中，利用圖像自身的內容資訊來計算圖像的圖像簽名，從而大大降低了發生衝突的機率。此外，採用邊緣直方圖的統計值作為圖像簽名的基礎特徵，配合圖像分割以及基於人眼視覺敏感程度的非均勻量化技術，對不同顏色、不同縮放比例、局部模糊以及失真均有很好的適應性。需要注意的是，分割的方式僅是一種示例，本申請不僅限於此，例如，將灰度圖像分成N×P的子圖像。作為一種最佳的方式，M可以等於5。

較佳的，計算模組3022對每個子圖像分別從5個方向上計算邊緣直方圖的步驟包括：對於每個子圖像中的每個圖像塊而言，計算該圖像塊五個方向上的梯度值，選取梯度值最大的方向作為該圖像塊的待統計方向，在一個子圖像中統計上述五個方向作為待統計方向的次數，並將得到的統計值作為該子圖像的邊緣直方圖。

舉例來說，假設一個子圖像具有1000個圖像塊，五個方向分別為：A，B，C，D，E，其中，100個圖像塊的待統計方向為A，200個圖像塊的待統計方向為B，300個圖像塊的待統計方向為C，400個圖像塊的待統計方向為D，0個圖像塊的待統計方向為E，則該子圖像的統計值(或對應的邊緣直方圖)為向量(100，200，300，400，0)。

較佳的，散列操作單元304包括：第一散列處理模組3041，用於分別使用L個局部散列函數對該圖像簽名進行散列操作，得到L個第一散列值，其中，L為自然數；第二散列處理模組3042，用於使用一個全局散列函數分別對L個第一散列值進行散列操作，得到L個第二散列值。在本較佳的實施例中，採用了基於局部敏感散列技術的海量相似圖像索引方案，將檢索的時間複雜度降低到亞線性級別。

較佳的，查詢單元306包括：查找模組3061，用於在每個第二散列值對應的散列表中查找是否存在記錄有該第二散列值的表項，其中，上述散列表中的每個表項記錄了一個圖像的散列值和圖像標識，或者，該每個表項記錄了一個圖像的散列值、該圖像的圖像標識以及圖像簽名；添加模組3062，用於在存在記錄有第二散列值的表項時，將查找到的表項所記錄的圖像添加到候選圖像中。在本較佳的實施例中，採用了查找方式來查找對應的候選圖像，提高了查找的準確性和效率。

較佳的，第二散列值與散列表的對應關係包括但不限於：第i個第二散列值對應於第i個散列表，i=1,...L。例如，第二散列值與散列表的對應關係還可以為：第i個第二散列值對應於第L-i+1個散列表，i=1,...L。

較佳的，第一散列處理模組3041包括：轉換子模組，用於將圖像簽名轉換成R維二進位向量，其中，R為自然數；生成子模組，用於使用R維二進位向量生成L個局部散列函數，其中，每個局部散列函數由R維二進位向量中的一維或多維二進位向量生成；散列操作子模組，用於使用L個局部散列函數對R維二進位向量進行散列操作。在本較佳的實施例中，採用特定的方式來進行散列操作，大大降低了發生衝突的機率。需要注意的是，第一散列處理模組的處理過程只是一種示例，本申請不僅限於此。

較佳的，生成子模組包括：設置子模組，用於設置局部散列函數的輸入參數為K；處理子模組，用於隨機從R維二進位向量中選取K維二進位向量，將K維二進位向量進行拼接作為局部散列函數的返回值，其中，K<R。在本較佳的實施例中，採用特定的方式來生成局部散列函數，進一步降低了發生衝突的機率。需要注意的是，生成子模組的處理過程只是一種示例，本申請不僅限於此。

較佳的，識別單元308包括：計算模組3081，用於計算輸入圖像的圖像簽名與每個候選圖像的圖像簽名之間的空間距離；識別模組3082，用於按照空間距離的大小來識別候選圖像與輸入圖像的相似度，其中，空間距離越小的候選圖像與輸入圖像的相似度越高。在本較佳的實施例中，透過採用空間距離來識別相似圖像，大大提高了識別的準備性。較佳的，本實施例中的空間距離可以包括但不限於：漢明距離和歐式距離。

較佳的，如圖3所示的相似圖像的識別裝置還包括：輸出單元310，用於在按照空間距離的大小來識別候選圖像與輸入圖像的相似度之後，按照空間距離的大小輸出候選圖像。在本較佳的實施例中，透過按照相似度來輸出相似圖像，大大提高了用戶的體驗度。

較佳的，如圖3所示的互聯網相似圖像的識別裝置還包括：散列表建立單元312，用於在第一散列操作模組分別使用L個局部散列函數對與輸入圖像的內容對應的圖像簽名進行散列操作之前，分別使用L個局部散列函數對與每個待儲存的圖像的內容資訊對應的圖像簽名進行散列操作，得到L個第三散列值，其中，L為自然數；使用一個全局散列函數分別對L個第三散列值進行散列操作，得到L個第四散列值；將第j個第四散列值以及第四散列值對應的圖像標識和圖像簽名記錄到第j個散列表中，其中，j=1,...L。在本較佳的實施例中，採用了方式來建立儲存圖像索引的散列表，提高了查找的準確性和效率。

實施例2

基於圖2所示的識別系統以及圖3和圖4所示的識別裝置，本較佳的實施例還提供了一種相似圖像的識別方法，如圖5所示，識別方法包括如下步驟：S502，獲取與輸入圖像的內容資訊對應的圖像簽名；較佳的，在圖2所示的識別系統中，可以由圖像檢索前臺伺服器210獲取用戶B輸入的輸入圖像的內容資訊，並將其發送給圖像計算伺服器208，圖像計算伺服器208獲取與輸入圖像的內容資訊對應的圖像簽名。較佳的，在圖3所示的識別裝置中，由獲取單元302獲取與輸入圖像的內容資訊對應的圖像簽名。

在本較佳的實施例中，圖像檢索前臺伺服器210或獲取單元302可以包括用於接收用戶輸入的圖像的接收模組(例如，USB傳輸介面，藍牙傳輸介面，或者，乙太網傳輸介面等)，以及，圖像計算伺服器208或獲取單元302可以包括用於計算輸入圖像的內容資訊對應的圖像簽名的處理模組(例如，微處理器MCU，或FPGA等)。可以理解的是，關於執行“獲取與輸入圖像的內容資訊對應的圖像簽名”的主體並不僅限於此，可以根據實際需求來靈活配置。

S504，對圖像簽名進行散列操作；較佳的，在圖2所示的識別系統中，可以由圖像計算伺服器208對圖像簽名進行散列操作。較佳的，在圖3所示的識別裝置中，可以由散列操作單元304對圖像簽名進行散列操作。在本較佳的實施例中，散列操作單元304可以為微處理器MCU，或FPGA等，作為一種較佳的方式，散列操作單元304與獲取單元302所執行的功能可以由同一個處理器來實現。可以理解的是，關於執行“對圖像簽名進行散列操作”的主體並不僅限於此，還可以根據實際需求來靈活配置。

S506，在預先儲存的散列表中查詢與散列操作的結果相對應的表項；較佳的，在圖2所示的識別系統中，可以由圖像計算伺服器208向索引伺服器206中儲存的散列表中查詢與散列操作的結果相對應的表項。較佳的，在圖3所示的識別裝置中，可以由查詢單元306向儲存由散列表的資料庫查詢與散列操作的結果相對應的表項。可以理解的是，關於執行“在預先儲存的散列表中查詢與散列操作的結果相對應的表項”的主體並不僅限於此，還可以根據實際需求來靈活配置。

在本較佳的實施例中，圖像計算伺服器208可以但不限於按照預定的區域網路傳輸協定與索引伺服器206通信，查詢單元306可以但不限於透過內部匯流排與資料庫進行通信。

S508，在與查詢得到的表項對應的候選圖像中識別與輸入圖像相似的圖像。較佳的，在圖2所示的識別系統中，圖像計算伺服器208可以根據索引伺服器206返回的相似圖像的ID獲取對應的候選圖像(可以在本地獲取，也可以從第三方設備上獲取)，並在與查詢得到的表項對應的候選圖像中識別與輸入圖像相似的圖像。較佳的，在圖3所示的識別裝置中，識別單元308可以根據查詢單元306返回的相似圖像的ID獲取對應的候選圖像(可以在本地獲取，也可以從第三方設備上獲取)，並在與查詢得到的表項對應的候選圖像中識別與輸入圖像相似的圖像。可以理解的是，關於執行“在與查詢得到的表項對應的候選圖像中識別與輸入圖像相似的圖像”的主體並不僅限於此，還可以根據實際需求來靈活配置。

較佳的，透過以下步驟獲取與輸入圖像的內容資訊對應的圖像簽名：可以但不限於由圖4所示的轉化模組3021將輸入圖像轉化為灰度圖像；可以但不限於由圖4所示的計算模組3022將灰度圖像分成N×N的子圖像，並對每個子圖像分別從M個方向上計算邊緣直方圖，得到N×N×M個計算結果，其中，N和M均為自然數；可以但不限於由圖4所示的生成模組3023將灰度圖像對應的N×N×M個計算結果組合成作為圖像簽名的N×N×M維向量。較佳的，還可以對N×N×M維向量採用基於人眼視覺敏感程度的非均勻量化技術。在本較佳的實施例中，利用圖像自身的內容資訊來計算圖像的圖像簽名，從而大大降低了發生衝突的機率。此外，本較佳的實施例採用邊緣直方圖的統計值作為圖像簽名的基礎特徵，配合圖像分割以及基於人眼視覺敏感程度的非均勻量化技術，對不同顏色、不同縮放比例、局部模糊以及失真均有很好的適應性。需要注意的是，分割的方式僅是一種示例，本申請不僅限於此，例如，將灰度圖像分成N×P的子圖像。作為一種最佳的方式，M可以等於5。

較佳的，計算模組3022對每個子圖像分別從5個方向上計算邊緣直方圖的步驟包括：對於每個子圖像中的每個圖像塊而言，計算該圖像塊五個方向上的梯度值，選取梯度值最大的方向進行作為該圖像塊的待統計方向，在一個子圖像中統計上述五個方向作為待統計方向的次數，並將得到的統計值作為該子圖像的邊緣直方圖。

在本較佳的實施例中，轉化模組3021、計算模組3022以及生成模組3023可以但不限於由同一個微處理器MCU來實現。

較佳的，對圖像簽名進行散列操作的步驟包括：可以但不限於由圖4所示的第一散列處理模組3041分別使用L個局部散列函數對圖像簽名進行散列操作，得到L個第一散列值，其中，L為自然數；可以但不限於由圖4所示的第二散列處理模組3042使用一個全局散列函數分別對L個第一散列值進行散列操作，得到L個第二散列值。在本較佳的實施例中，採用了基於局部敏感散列技術的海量相似圖像索引方案，將檢索的時間複雜度降低到亞線性級別。

在本較佳的實施例中，第一散列處理模組3041和第二散列處理模組3042可以但不限於由同一個編碼晶片或微處理器MCU來實現。

較佳的，在預先儲存的散列表中查詢與散列操作的結果相對應的表項的步驟包括：可以但不限於由圖4所示的查找模組3061在每個第二散列值對應的散列表中查找是否存在記錄有第二散列值的表項，其中，該散列表中的每個表項記錄了一個圖像的散列值和圖像標識，或者，該每個表項記錄了一個圖像的散列值、該圖像的圖像標識以及圖像簽名；若存在，則可以但不限於由圖4所示的添加模組3062將查找到的表項所記錄的圖像添加到候選圖像中。在本較佳的實施例中，採用了查找方式來查找對應的候選圖像，提高了查找的準確性和效率。

在本較佳的實施例中，查找模組3061和添加模組3062可以但不限於由同一個微處理器MCU來實現。

較佳的，分別使用L個局部散列函數對圖像簽名進行散列操作的步驟包括：可以但不限於由圖4所示的第一散列處理模組3041將圖像簽名轉換成R維二進位向量，其中，R為自然數；可以但不限於由圖4所示的第一散列處理模組3041使用R維二進位向量生成L個局部散列函數，其中，每個局部散列函數由R維二進位向量中的一維或多維二進位向量生成；可以但不限於由圖4所示的第一散列處理模組3041使用L個局部散列函數對R維二進位向量進散列操作。在本較佳的實施例中，採用特定的方式來進行散列操作，大大降低了發生衝突的機率。需要注意的是，散列操作的過程只是一種示例，本申請不僅限於此。

較佳的，使用R維二進位向量中的一維或多維二進位向量生成一個局部散列函數的步驟包括：可以但不限於由圖4所示的第一散列處理模組3041設置局部散列函數的輸入參數為K；可以但不限於由圖4所示的第一散列處理模組3041隨機從R維二進位向量中選取K維二進位向量，將K維二進位向量進行拼接作為局部散列函數的返回值，其中，K<R。在本較佳的實施例中，採用特定的方式來生成局部散列函數，進一步降低了發生衝突的機率。需要注意的是，生成一個局部散列函數的步驟只是一種示例，本申請不僅限於此。

較佳的，在與查詢得到的表項對應的候選圖像中識別與輸入圖像相似的圖像的步驟包括：可以但不限於由圖4所示的計算模組3081計算輸入圖像的圖像簽名與每個候選圖像的圖像簽名之間的空間距離；可以但不限於由圖4所示的識別模組3082按照空間距離的大小來識別候選圖像與輸入圖像的相似度，其中，空間距離越小的候選圖像與輸入圖像的相似度越高。在本較佳的實施例中，透過採用空間距離來識別相似圖像，大大提高了識別的準備性。較佳的，本實施例中的空間距離可以包括但不限於：漢明距離和歐式距離。

在本較佳的實施例中，計算模組3081和識別模組3082可以但不限於由同一個微處理器MCU來實現。

較佳的，按照空間距離的大小來識別候選圖像與輸入圖像的相似度之後，本較佳實施例的識別方法還包括：可以但不限於由圖3所示的輸出單元310按照空間距離的大小輸出候選圖像。在本較佳的實施例中，透過按照相似度來輸出相似圖像，大大提高了用戶的體驗度。

在本較佳的實施例中，輸出單元310可以但不限於為藍牙傳輸模組，或者，紅外線傳輸模組，或者，乙太網路傳輸模組。

較佳的，在分別使用L個局部散列函數對圖像簽名進行散列操作之前，透過以下步驟預先建立L個散列表：可以但不限於由圖3所示的散列表建立單元312分別使用L個局部散列函數對與每個待儲存的圖像的內容對應的圖像簽名進行散列操作，得到L個第三散列值，其中，L為自然數；可以但不限於由圖3所示的散列表建立單元312使用一個全局散列函數分別對L個第三散列值進行散列操作，得到L個第四散列值；可以但不限於由圖3所示的散列表建立單元312將第j個第四散列值以及第四散列值對應的圖像標識和圖像簽名記錄到第j個散列表中，其中，j=1,...L。在本較佳的實施例中，採用了方式來建立儲存圖像索引的散列表，提高了查找的準確性和效率。

在本較佳的實施例中，散列表建立單元312可以但不限於由同一個微處理器MCU來實現。

基於以上的識別系統和裝置以及識別方法，以下結合附圖來具體描述識別方法中的圖像簽名獲取方法、圖像索引構建方法以及相似圖像查詢方法。

如圖6所示，圖像簽名獲取方法(也稱特徵提取階段)包括從圖像中提取元資料資訊作為唯一標識圖像本身的簽名，本較佳的實施例採用基於邊緣直方圖的紋理特徵來生成簽名，具體步驟如下：

S602，可以但不限於由圖4所示的轉化模組3021將原始圖像轉化為灰度圖像，以期到最終得到的結果對顏色、光照的改變不敏感；

S604，可以但不限於由圖4所示的計算模組3022將灰度圖像分割成N×N的子圖像；

S606，可以但不限於由圖4所示的計算模組3022把S604中處理完畢的子圖像進一步分割為固定數目的一系列圖像塊，每個圖像塊的面積隨著原始圖像的面積變化而變化；

S608，可以但不限於由圖4所示的計算模組3022計算每個子圖像的五個方向上的邊緣直方圖。具體地，對於每個子圖像中的每個圖像塊而言，計算該圖像塊五個方向上的梯度值，選取梯度值最大的方向進行作為該圖像塊的待統計方向，在一個子圖像中統計上述五個方向作為待統計方向的次數，並將得到的統計值作為該子圖像的邊緣直方圖。

舉例來說，假設一個子圖像具有1000個圖像塊，上述五個方向分別為：A，B，C，D，E，其中，100個圖像塊的待統計方向為A，200個圖像塊的待統計方向為B，300個圖像塊的待統計方向為C，400個圖像塊的待統計方向為D，0個圖像塊的待統計方向為E，則該子圖像的統計值(或對應的邊緣直方圖)為向量(100，200，300，400，0)。

S610，可以但不限於由圖4所示的生成模組3023將各個子圖像的統計值(即向量)拼接成一個多維向量作為原始圖像的簽名。假設按照N=4進行切分，原始圖像的簽名最終會以一個4×4×5=80維的向量來表示。

S612，考慮到人眼視覺對亮度敏感程度的非均勻性，採用非線性量化的方式，可以但不限於由圖4所示的生成模組3023對S610中得到的80維整型向量進行量化壓縮，以達到較高的空間利用率。舉例來說，使用0-7之間的8個數字進行量化，最後得到的單個簽名所占空間的大小為80×3=240bit，也就是30個位元組，相比量化之前節約了90%以上的儲存空間。

S614，將壓縮後的結果作為圖像簽名。

當然，上述S612步驟中的壓縮處理是一種較佳的方式，本發明也可以直接將S610得到的80維向量來作為該圖像的圖像簽名。

如圖7所示，圖像索引構建方法(也稱為索引構建階段)主要包括針對特徵提取階段所獲得的圖像簽名，實現高維向量的K近似檢索，本較佳實施例採用局部敏感散列來實現，具體步驟如下：

S702，可以但不限於由圖4所示的第一散列處理模組3041將特徵提取階段所獲的向量標識轉化為漢明空間中的高維二進位向量(即每一維僅為1或0)，例如，假設某一維的向量值為X，最大值為C，則向量在漢明空間表示為連續的X個1緊跟C-X個0的C維二進位向量。

S704，可以但不限於由圖4所示的第一散列處理模組3041定義如下的散列函數G，隨機選取S702中目標向量的K維二進位向量，將結果拼接起來作為返回值。目標向量之間相似度越大，產生的相同散列值相機率越大。

S706，為降低近似檢索的誤差，可以但不限於由圖4所示的第一散列處理模組3041利用L個S704中隨機生成的散列函數，將其分別作用在S702中提取的高維向量中；

S708，可以但不限於由圖4所示的第二散列處理模組3042對S706中的結果使用傳統的散列函數(例如md5)再次散列；

S710，可以但不限於由圖4所示的第二散列處理模組3042將S708中的散列結果作為鍵、圖片的唯一標識(ID)作為值存放存在對應的L個散列表當中。較佳的，相同的圖像簽名會被放在同一個桶中去，不同的圖像簽名，則有較大機率放到不同的桶中去。

較佳的，選擇不同K與L的會在很大程度上影響檢索的準確率與召回率，一般透過事先的模擬實驗進行預估。最後生成的索引結構，在硬體允許的條件下，可以考慮常駐記憶體以提高檢索效率；在海量樣本庫的情況下，也可以考慮將索引檔持久化到本地磁片或者分散式的處理方式。

如圖8所示，相似圖像查詢方法(也稱為查詢階段)主要包括針對輸入的圖像進行處理，獲得其邊緣直方圖的簽名，並在樣本庫中查詢出相似圖像的過程，其具體步驟如下：

S802，可以但不限於由圖4所示的獲取單元302採用圖6所示的方法計算輸入圖像的簽名值；

S804-S810，根據S802中得到的簽名值，可以但不限於由圖4所示的散列操作單元304採用圖7所示的圖像索引構建方法，將L個散列函數作用在該簽名上，再計算md5散列過後的值，可以但不限於由圖4所示的查詢單元306分別將計算得到的結果作為鍵在L個散列表中查詢；

S812，可以但不限於由圖4所示的查詢單元306將查詢得到的多個結果所對應的圖像添加到候選圖像佇列中；

S814，針對候選圖像佇列中的每一個簽名值，可以但不限於由圖4所示的識別單元308計算其與輸入圖像的簽名值的空間距離(漢明距離或者歐氏距離)，其值的大小決定了候選圖片與輸入圖片的相似度；

S816，可以但不限於由圖3所示的輸出單元310按照距離的大小進行排序輸出。由於候選佇列中圖像簽名的數量與樣本庫中簽名的數量相比，已大大減少，因此與現有技術相比，計算的成本或開銷也大為減少。最後得到的結果集就是與目標圖像相似、並按照相似度排序的圖像集。

在本較佳的實施例中，散列操作單元304可以為微處理器MCU，或FPGA等，作為一種較佳的方式，散列操作單元304與獲取單元302所執行的功能可以由同一個處理器來實現。此外，在本較佳的實施例中，查詢單元306可以但不限於透過內部匯流排與保存了散列表的資料庫進行通信，查詢單元306與識別單元308所執行的功能可以由同一個處理器來實現。

從以上的描述中，可以看出，本申請實現了如下技術效果：在本申請中，利用圖像本身的內容作為圖像簽名，其簽名的相似度取決於圖像本身的相似度，即越是相似的圖像，其簽名的相似度也越大，或者說對應的空間距離(漢明距離或歐氏距離)越短，這樣，僅僅是儲存格式不同的圖像具有完全相同圖像簽名值，從而解決了現有技術中的圖像識別方法所存在的容錯性的問題，使得能夠準確地識別出所需的相似圖像。在此基礎上，本申請還提出了基於局部敏感散列技術的海量相似圖像索引方案，將檢索的時間複雜度降低到亞線性級別，並且能將結果按照相似程度進行排序輸出。此外，採用邊緣直方圖的統計值作為圖像簽名的基礎特徵，配合圖像分割和基於人眼視覺敏感程度的非均勻量化技術，對不同顏色、不同縮放比例、局部模糊以及失真均有很好的適應性。

顯然，本領域的技術人員應該明白，本申請的各模組或各步驟可以用通用的計算裝置來實現，它們可以集中在單個的計算裝置上，或者分佈在多個計算裝置所組成的網路上，替代地，它們可以用計算裝置可執行的程式碼來實現，從而可以將它們儲存在儲存裝置中由計算裝置來執行，或者將它們分別製作成各個積體電路模組，或者將它們中的多個模組或步驟製作成單個積體電路模組來實現。這樣，本申請不限制於任何特定的硬體和軟體結合。

以上該僅為本申請的較佳實施例而已，並不用於限制本申請，對於本領域的技術人員來說，本申請可以有各種更改和變化。凡在本申請的精神和原則之內，所作的任何修改、等同替換、改進等，均應包含在本申請的保護範圍之內。

10．．．圖像伺服器

202．．．上傳伺服器

204．．．圖像資料庫裝置

206．．．索引伺服器

208．．．圖像計算伺服器

210．．．圖像檢索前臺伺服器

302．．．獲取單元

304．．．散列操作單元

306．．．查詢單元

308．．．識別單元

310．．．輸出單元

312．．．散列表建立單元

3021．．．轉化模組

3022．．．計算模組

3023．．．生成模組

3041．．．第一散列處理模組

3042．．．第二散列處理模組

3061．．．查找模組

3062．．．添加模組

3081．．．計算模組

3082．．．識別模組

此處所說明的附圖用來提供對本申請的進一步理解，構成本申請的一部分，本申請的示意性實施例及其說明用於解釋本申請，並不構成對本申請的不當限定。在附圖中：

圖1是根據相關技術的相似圖像的識別系統的一種結構示意圖；

圖2是根據本申請實施例的相似圖像的識別系統的一種較佳結構示意圖；

圖3是根據本申請實施例的相似圖像的識別裝置的一種較佳結構示意圖；

圖4是根據本申請實施例的相似圖像的識別裝置的另一種較佳結構示意圖；

圖5是根據本申請實施例的相似圖像的識別方法的一種較佳流程圖；

圖6是根據本申請實施例的圖像簽名獲取方法的一種較佳流程圖；

圖7是根據本申請實施例的圖像索引構建方法的一種較佳流程圖；

圖8是根據本申請實施例的相似圖像查詢方法的一種較佳流程圖。