TWI731919B - 圖像識別方法與裝置及度量學習方法與裝置 - Google Patents
圖像識別方法與裝置及度量學習方法與裝置 Download PDFInfo
- Publication number
- TWI731919B TWI731919B TW106101919A TW106101919A TWI731919B TW I731919 B TWI731919 B TW I731919B TW 106101919 A TW106101919 A TW 106101919A TW 106101919 A TW106101919 A TW 106101919A TW I731919 B TWI731919 B TW I731919B
- Authority
- TW
- Taiwan
- Prior art keywords
- image
- model
- feature
- similarity
- comparison
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 116
- 238000005259 measurement Methods 0.000 claims abstract description 111
- 238000012549 training Methods 0.000 claims description 128
- 239000000523 sample Substances 0.000 claims description 97
- 238000004422 calculation algorithm Methods 0.000 claims description 66
- 238000013145 classification model Methods 0.000 claims description 52
- 238000009826 distribution Methods 0.000 claims description 47
- 239000011159 matrix material Substances 0.000 claims description 35
- 238000000605 extraction Methods 0.000 claims description 28
- 238000004364 calculation method Methods 0.000 claims description 22
- 239000000284 extract Substances 0.000 claims description 19
- 238000007637 random forest analysis Methods 0.000 claims description 10
- 239000013074 reference sample Substances 0.000 claims description 6
- 230000001815 facial effect Effects 0.000 description 31
- 230000008569 process Effects 0.000 description 24
- 238000005516 engineering process Methods 0.000 description 14
- 238000010586 diagram Methods 0.000 description 11
- 230000006870 function Effects 0.000 description 9
- 238000012795 verification Methods 0.000 description 4
- 230000008859 change Effects 0.000 description 3
- 238000009795 derivation Methods 0.000 description 3
- 238000001514 detection method Methods 0.000 description 3
- 238000004590 computer program Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000003909 pattern recognition Methods 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 108010001267 Protein Subunits Proteins 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000001149 cognitive effect Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000010219 correlation analysis Methods 0.000 description 1
- 238000011478 gradient descent method Methods 0.000 description 1
- 238000005286 illumination Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Landscapes
- Image Analysis (AREA)
Abstract
本發明公開了一種圖像識別方法及裝置、一種度量學習方法及裝置、以及一種圖像來源識別方法及裝置。其中,所述圖像識別方法包括:獲取待識別客體圖像;提取所述待識別客體圖像的客體特徵;從預先訓練好的度量模型集合中選擇與所述待識別客體圖像的來源類別相對應的相似度度量模型,並計算所述客體特徵與註冊圖像客體特徵的相似度,作為輸出客體識別結果的依據;其中,所述度量模型集合包含至少一個相似度度量模型,不同的相似度度量模型分別與客體圖像的不同來源類別相對應。採用本方法進行圖像識別,能夠有效處理非對稱客體圖像識別問題,對來源多變的待識別客體圖像的識別具有更好的堅固性和更高的準確率。
Description
本發明涉及模式識別技術,具體涉及一種圖像識別方法及裝置。本發明同時提供一種度量學習方法及裝置,以及圖像來源識別方法及裝置。
人臉識別是近年來模式識別、影像處理、機器視覺、神經網路以及認知科學等領域研究的熱點課題之一。人臉識別通常是指,從人臉圖像中提取有鑒別能力的視覺特徵,並用其確定人臉身份的電腦技術,具體可以分為兩類:人臉鑒別和人臉驗證。人臉鑒別是指鑒別某張人臉圖像的身份,即確定某一張人臉圖像是哪個人的圖像;人臉驗證是指判斷一張人臉圖像的身份是否為聲稱的某個人。
現有的人臉識別技術通常包含兩個主要研究方向:特徵學習和度量學習。特徵學習的目的是將人臉圖像轉化更可分的、更具鑒別能力的形式;而度量學習則用於從訓練樣本中學習評估樣本間距離或相似度的度量模型或度量函數,其中,聯合貝葉斯臉是目前應用比較普及的度量學習方法,是一種基於高斯假設的概率判別分析推導出的度量
學習方法。
人臉識別的主要過程包括:訓練過程和識別過程。訓練過程是指利用人臉圖像訓練集求解相似度度量模型的參數,該過程也稱為度量學習過程,所述人臉圖像訓練集由人臉圖像和身份標籤(標識哪些圖像來自同一人,哪些圖像來自不同人)組成;識別過程則是指,首先採集供查詢的人臉圖像註冊集,註冊集通常由人臉圖像、身份標籤和身份資訊組成,其來源一般較為單一,品質較好,然後將待識別人臉圖像的特徵與所述註冊集中樣本特徵進行比對,利用訓練好的相似度度量模型計算待識別人臉圖像特徵與註冊圖像特徵的相似度,從而確定待識別人臉圖像對應的身份。
由於聯合貝葉斯臉的基本假設為:參與比對的人臉樣本x和y服從同一高斯分佈,而在具體應用中,註冊集中的圖像來源通常是可控的,待識別人臉圖像的來源則較為複雜,品質參差不齊,如:視頻截圖、掃描圖片、大頭貼等,即:註冊集中的圖像和待識別圖像的來源可能不同,導致參與比對的人臉樣本可能並不滿足服從同一高斯分佈的要求(也稱為非對稱人臉),在這種情況下,現有的人臉識別技術通常不能很好地處理,導致識別準確率較低,無法滿足應用的需求。在針對其他客體圖像的識別應用中,也同樣存在因為圖像來源不同(即非對稱客體圖像)而導致的上述問題。
本發明實施例提供一種圖像識別方法和裝置,以解決現有的圖像識別技術針對來源多變的客體圖像識別準確率低的問題。本發明實施例還提供一種度量學習方法和裝置,以及一種圖像來源識別方法和裝置。
本發明提供一種圖像識別方法,包括:獲取待識別客體圖像;提取所述待識別客體圖像的客體特徵;從預先訓練好的度量模型集合中選擇與所述待識別客體圖像的來源類別相對應的相似度度量模型,並計算所述客體特徵與註冊圖像客體特徵的相似度,作為輸出客體識別結果的依據;其中,所述度量模型集合包含至少一個相似度度量模型,不同的相似度度量模型分別與客體圖像的不同來源類別相對應。
可選的,所述度量模型集合中對應不同來源類別的各相似度度量模型,是利用屬於預設來源類別的基準客體圖像訓練集、以及對應不同來源類別的比對客體圖像訓練集分別訓練得到的。
可選的,所述基準客體圖像訓練集中的客體圖像與所述註冊圖像屬於相同的來源類別。
可選的,在所述從預先訓練好的度量模型集合中選擇與所述待識別客體圖像的來源類別相對應的相似度度量模 型的步驟之前,執行下述操作:以所述客體特徵為輸入,利用預先訓練好的客體圖像來源分類模型,確定所述待識別客體圖像的來源類別。
可選的,所述客體圖像來源分類模型是採用如下演算法訓練得到的多類分類模型:Softmax演算法、多類SVM演算法、或者隨機森林演算法。
可選的,所述相似度度量模型包括:在參與比對的客體特徵服從各自高斯分佈的假設下、建立的非對稱度量模型。
可選的,所述非對稱度量模型包括:基於聯合貝葉斯臉的非對稱度量模型;對應於特定來源類別的上述非對稱度量模型是採用如下步驟訓練得到的:提取屬於預設來源類別的基準客體圖像訓練集中各圖像的客體特徵,作為基準特徵樣本集;提取屬於所述特定來源類別的比對客體圖像訓練集中各圖像的客體特徵,作為比對特徵樣本集;在參與比對的客體特徵服從各自高斯分佈的假設下,建立包含參數的非對稱度量模型;根據上述兩類特徵樣本集中的樣本以及標識樣本是否屬於同一客體的身份標籤,求解所述非對稱度量模型中的參數,完成所述模型的訓練。
可選的,所述對應於特定來源類別的非對稱度量模型 如下所示:
A=(S xx +T xx )-1-E B=(S yy +T yy )-1-F G=-(S xx +T xx -S xy (S yy +T yy )-1 S yx )-1 S xy (S yy +T yy )-1 E=(S xx +T xx -S xy (S yy +T yy )-1 S yx )-1 F=(S yy +T yy -S yx (S xx +T xx )-1 S xy )-1
其中,假設基準特徵樣本集X中的樣本x=μ x +ε x ,μ x 和ε x 服從均值為0,協方差矩陣為Sxx和Txx的高斯分佈,比對特徵樣本集Y中的樣本y=μ y +ε y ,μ y 和ε y 服從均值為0,協方差矩陣為Syy和Tyy的高斯分佈,Sxy和Syx是X和Y之間的互協方差矩陣;r(x,y)為基於類內/類間對數似然比計算的相似度;所述求解所述非對稱度量模型中的參數包括:求解Sxx、Txx、Syy、Tyy、Sxy、和Syx。
可選的,所述求解所述非對稱度量模型中的參數包括:利用散度矩陣估算所述模型中的參數;或者,採用期望最大化演算法反覆運算求解所述模型中的參數。
可選的,所述計算所述客體特徵與註冊圖像客體特徵的相似度,包括: 計算所述客體特徵與對應特定身份的註冊圖像客體特徵的相似度;在上述計算相似度的步驟後,執行下述操作:判斷所述相似度是否大於預先設定的閾值;若是,判定所述待識別客體圖像與所述對應特定身份的註冊圖像屬於同一客體,並將所述判定作為客體識別結果輸出。
可選的,所述計算所述客體特徵與註冊圖像客體特徵的相似度,包括:計算所述客體特徵與指定範圍內的註冊圖像客體特徵的相似度;在上述計算相似度的步驟後,執行下述操作:判斷計算所得相似度中的最大值是否大於預先設定的閾值;若是,判定所述待識別客體圖像在所述指定範圍內的註冊圖像中匹配成功,並將所述最大值對應的註冊圖像的相關身份資訊作為客體識別結果輸出。
可選的,所述提取所述待識別客體圖像的客體特徵,包括:採用局部二值模式演算法提取所述客體特徵;或者,採用Gabor小波變換演算法提取所述客體特徵;或者,採用深度卷積網路提取所述客體特徵。
可選的,所述待識別客體圖像包括:待識別人臉圖 像;所述客體特徵包括:人臉特徵。
可選的,所述來源類別包括:證件照、生活照、視頻截圖、掃描圖像、翻拍圖像、或者監控畫面。
相應的,本發明還提供一種圖像識別裝置,包括:圖像獲取單元,用於獲取待識別客體圖像;特徵提取單元,用於提取所述待識別客體圖像的客體特徵;相似度計算單元,用於從預先訓練好的度量模型集合中選擇與所述待識別客體圖像的來源類別相對應的相似度度量模型,並計算所述客體特徵與註冊圖像客體特徵的相似度,作為輸出客體識別結果的依據;其中,所述相似度計算單元包括:度量模型選擇子單元,用於從預先訓練好的度量模型集合中選擇與所述待識別客體圖像的來源類別相對應的相似度度量模型;計算執行子單元,用於利用所述度量模型選擇子單元所選的相似度度量模型計算所述客體特徵與註冊圖像客體特徵的相似度,作為輸出客體識別結果的依據。
可選的,所述裝置包括:度量模型訓練單元,用於利用屬於預設來源類別的基準客體圖像訓練集、以及對應不同來源類別的比對客體圖像訓練集,分別訓練得到所述度量模型集合中對應不同來源類別的各相似度度量模型。
可選的,所述裝置包括:來源類別確定單元,用於在觸發所述相似度計算單元工作之前,以所述客體特徵為輸入,利用預先訓練好的客體圖像來源分類模型,確定所述待識別客體圖像的來源類別。
可選的,所述裝置包括:來源分類模型訓練單元,用於在觸發所述來源類別確定單元工作之前,採用如下演算法訓練訓練所述客體圖像來源分類模型:Softmax演算法、多類SVM演算法、或者隨機森林演算法。
可選的,所述裝置包括:度量模型訓練單元,用於訓練所述度量模型集合中的各相似度度量模型,所述相似度度量模型包括:在參與比對的客體特徵服從各自高斯分佈的假設下、基於聯合貝葉斯臉建立的非對稱度量模型;所述度量模型訓練單元藉由如下子單元訓練對應於特定來源類別的上述非對稱度量模型:基準樣本提取子單元,用於提取屬於預設來源類別的基準客體圖像訓練集中各圖像的客體特徵,作為基準特徵樣本集;比對樣本提取子單元,用於提取屬於所述特定來源類別的比對客體圖像訓練集中各圖像的客體特徵,作為比對特徵樣本集;度量模型建立子單元,用於在參與比對的客體特徵服 從各自高斯分佈的假設下,建立包含參數的非對稱度量模型;模型參數求解子單元,用於根據上述兩類特徵樣本集中的樣本以及標識樣本是否屬於同一客體的身份標籤,求解所述非對稱度量模型中的參數,完成所述模型的訓練。
可選的,所述模型參數求解子單元具體用於,利用散度矩陣估算所述模型中的參數,或者,採用期望最大化演算法反覆運算求解所述模型中的參數。
可選的,所述計算執行子單元具體用於,計算所述客體特徵與對應特定身份的註冊圖像客體特徵的相似度;所述裝置還包括:第一閾值比對單元,用於判斷所述相似度是否大於預先設定的閾值;第一識別結果輸出單元,用於當所述第一閾值比對單元的輸出為是時,判定所述待識別客體圖像與所述對應特定身份的註冊圖像屬於同一客體,並將所述判定作為客體識別結果輸出。
可選的,所述計算執行子單元具體用於,計算所述客體特徵與指定範圍內的註冊圖像客體特徵的相似度;所述裝置還包括:第二閾值比對單元,用於判斷計算所得相似度中的最大值是否大於預先設定的閾值;第二識別結果輸出單元,用於當所述第二閾值比對單元的輸出為是時,判定所述待識別客體圖像在所述指定範 圍內的註冊圖像中匹配成功,並將所述最大值對應的註冊圖像的相關身份資訊作為客體識別結果輸出。
可選的,所述特徵提取單元具體用於,採用局部二值模式演算法提取所述客體特徵、採用Gabor小波變換演算法提取所述客體特徵、或者採用深度卷積網路提取所述客體特徵。
此外,本發明還提供一種度量學習方法,包括:提取屬於同一來源類別的基準客體圖像訓練集中各圖像的客體特徵,作為基準特徵樣本集;提取屬於同一來源類別、但與所述基準客體圖像分屬不同來源類別的比對客體圖像訓練集中各圖像的客體特徵,作為比對特徵樣本集;在參與比對的客體特徵服從各自高斯分佈的假設下,建立包含參數的非對稱度量模型;利用上述兩類特徵樣本集中的樣本,求解所述非對稱度量模型中的參數。
可選的,所述非對稱度量模型包括:基於聯合貝葉斯臉的非對稱度量模型;所述非對稱度量模型如下所示:
A=(S xx +T xx )-1-E B=(S yy +T yy )-1-F G=-(S xx +T xx -S xy (S yy +T yy )-1 S yx )-1 S xy (S yy +T yy )-1 E=(S xx +T xx -S xy (S yy +T yy )-1 S yx )-1 F=(S yy +T yy -S yx (S xx +T xx )-1 S xy )-1
其中,假設基準特徵樣本集空間X中的樣本x=μ x +ε x ,μ x 和ε x 服從均值為0,協方差矩陣為Sxx和Txx的高斯分佈,比對特徵樣本集空間Y中的樣本y=μ y +ε y ,μ y 和ε y 服從均值為0,協方差矩陣為Syy和Tyy的高斯分佈,Sxy和Syx是X和Y之間的互協方差矩陣;r(x,y)為基於類內/類間對數似然比計算的相似度;所述求解所述非對稱度量模型中的參數包括:求解Sxx、Txx、Syy、Tyy、Sxy、和Syx。
可選的,所述求解所述非對稱度量模型中的參數包括:利用散度矩陣估算所述模型中的參數;或者,採用期望最大化演算法反覆運算求解所述模型中的參數。
可選的,所述基準客體圖像以及所述比對客體圖像包括:人臉圖像;所述客體特徵包括:人臉特徵。
相應的,本發明還提供一種度量學習裝置,包括:基準樣本提取單元,用於提取屬於同一來源類別的基準客體圖像訓練集中各圖像的客體特徵,作為基準特徵樣本集;比對樣本提取單元,用於提取屬於同一來源類別、但 與所述基準客體圖像分屬不同來源類別的比對客體圖像訓練集中各圖像的客體特徵,作為比對特徵樣本集;非對稱度量模型建立單元,用於在參與比對的客體特徵服從各自高斯分佈的假設下,建立包含參數的非對稱度量模型;度量模型參數求解單元,用於利用上述兩類特徵樣本集中的樣本,求解所述非對稱度量模型中的參數。
可選的,所述非對稱度量模型建立單元建立的度量模型包括:基於聯合貝葉斯臉的非對稱度量模型。
可選的,所述度量模型參數求解單元具體用於,利用散度矩陣估算所述模型中的參數,或者,採用期望最大化演算法反覆運算求解所述模型中的參數。
此外,本發明還提供一種圖像來源識別方法,包括:採集屬於不同來源類別的客體圖像集,並從中提取客體特徵組成訓練樣本集合;利用所述訓練樣本集合中的客體特徵樣本及其來源類別,訓練客體圖像來源分類模型;從待分類客體圖像中提取客體特徵;以上述提取的客體特徵為輸入,採用所述客體圖像來源分類模型識別所述待分類客體圖像的來源類別。
可選的,所述客體圖像來源分類模型是採用如下演算法訓練得到的多類分類模型:Softmax演算法、多類SVM演算法、或者隨機森林演算法。
可選的,所述客體圖像包括:人臉圖像;所述客體特徵包括:人臉特徵。
相應的,本發明還提供一種圖像來源識別裝置,包括:訓練樣本採集單元,用於採集屬於不同來源類別的客體圖像集,並從中提取客體特徵組成訓練樣本集合;分類模型訓練單元,用於利用所述訓練樣本集合中的客體特徵樣本及其來源類別,訓練圖像來源分類模型;待分類特徵提取單元,用於從待分類客體圖像中提取客體特徵;來源類別識別單元,用於以所述待分類特徵提取單元提取的客體特徵為輸入,採用所述客體圖像來源分類模型識別所述待分類客體圖像的來源類別。
可選的,所述客體圖像來源分類模型包括:多類分類模型;所述分類模型訓練單元具體用於,利用Softmax演算法、多類SVM演算法、或者隨機森林演算法訓練所述客體圖像來源分類模型。
與現有技術相比,本發明具有以下優點:
本發明提供的圖像識別方法,首先獲取待識別客體圖像,提取所述待識別客體圖像的客體特徵,然後從預先訓練好的度量模型集合中選擇與所述待識別客體圖像的來源類別相對應的相似度度量模型,並計算所述客體特徵與註冊圖像客體特徵的相似度,作為輸出客體識別結果的依 據。採用本方法進行圖像識別,由於沒有採用單一的相似度度量模型,而是選用預先訓練好的與待識別客體圖像的來源類別相對應的相似度度量模型,從而能夠有效處理非對稱客體圖像識別問題,對來源多變的待識別客體圖像的識別具有更好的堅固性和更高的準確率。
本發明提供的度量學習方法,在參與比對的人臉特徵服從各自高斯分佈的假設下,建立包含參數的非對稱度量模型,利用不同來源的客體圖像特徵樣本集合,求解所述非對稱度量模型中的參數,從而完成非對稱度量模型的構建。本方法對傳統圖像識別技術中的假設進行了修改,即:參與比對的兩個客體樣本x和y可以分別服從各自高斯分佈、而不必共用參數,並在此基礎上從分屬不同來源類別的樣本集合中學習用於識別非對稱客體的相似度度量模型,從而為適應各種圖像來源的高性能客體識別提供了基礎。
本發明提供的圖像來源識別方法,首先從分別屬於不同來源類別的客體圖像集中提取客體特徵組成訓練樣本集合,利用所述訓練樣本集合中的客體特徵樣本及其來源類別,訓練客體圖像來源分類模型,然後以從待分類客體圖像中提取的客體特徵為輸入,採用所述客體圖像來源分類模型識別所述待分類客體圖像的來源類別。本方法能夠有效識別客體圖像的來源類別,從而為在客體識別過程中選擇正確的相似度度量模型提供依據,保障了識別結果的正確性。
501‧‧‧度量模型訓練單元
502‧‧‧圖像獲取單元
503‧‧‧特徵提取單元
504‧‧‧來源類別確定單元
505‧‧‧相似度計算單元
701‧‧‧基準樣本提取單元
702‧‧‧比對樣本提取單元
703‧‧‧非對稱度量模型建立單元
704‧‧‧度量模型參數求解單元
901‧‧‧訓練樣本採集單元
902‧‧‧分類模型訓練單元
903‧‧‧待分類特徵提取單元
904‧‧‧來源類別識別單元
圖1是本發明提供的一種圖像識別方法的實施例的流程圖;圖2是本發明實施例提供的度量模型集合訓練過程的示意圖;圖3是本發明實施例提供的訓練非對稱度量模型的處理流程圖;圖4是本發明實施例提供的利用度量模型集合進行人臉識別的示意圖;圖5是本發明提供的一種圖像識別裝置的實施例的示意圖;圖6是本發明提供的一種度量學習方法的實施例的流程圖;圖7是本發明提供的一種度量學習裝置的實施例的示意圖;圖8是本發明提供的一種圖像來源識別方法的實施例的流程圖;圖9是本發明提供的一種圖像來源識別裝置的實施例的示意圖。
在下面的描述中闡述了很多具體細節以便於充分理解本發明。但是,本發明能夠以很多不同於在此描述的其它 方式來實施,本領域技術人員可以在不違背本發明內涵的情況下做類似推廣,因此,本發明不受下面公開的具體實施的限制。
在本發明中,分別提供了一種圖像識別方法及裝置,一種度量學習方法及裝置,以及一種圖像來源識別方法及裝置,在下面的實施例中逐一進行詳細說明。
雖然本發明的技術方案是以人臉識別為背景提出的,但是本發明技術方案的應用領域並非僅局限於人臉識別,在針對其他客體圖像的識別應用中同樣可以採用本發明提供的技術方案。
現有的圖像識別技術通常不考慮客體圖像的來源,採用單一的相似度度量模型進行識別,而本發明的技術方案,針對待識別客體圖像來源複雜、品質參差不齊的現象,提出了一種圖像識別的新思路:預先訓練對應不同來源類別的相似度度量模型,而在具體應用時選用與待識別客體圖像的來源類別相對應的相似度度量模型進行識別,從而能夠處理非對稱客體圖像的識別問題,對屬於不同來源類別的客體圖像的識別具有更好的堅固性和更高的準確率。
所述客體圖像通常是指,其主要展示內容(例如:作為圖像主體的前景圖像)為人臉或者各種物品等客體的圖像。不同來源的客體圖像通常是指,由於採集方式或者採集設備不同等因素、導致客體特徵遵循不同資料分佈的圖像,不同來源可以包括:視頻截圖、掃描圖像、翻拍圖像 等。
考慮到目前人臉圖像的識別應用比較普及,在本發明的實施例中以人臉圖像識別為重點進行描述。
請參考圖1,其為本發明的一種圖像識別方法的實施例的流程圖。所述方法包括如下步驟:
步驟101、訓練對應不同來源類別的相似度度量模型,組成度量模型集合。
對於本實施例中的人臉圖像,各種不同來源類別包括但不局限於:證件照、生活照、視頻截圖、掃描圖像、翻拍圖像、或者監控畫面等。
在採用本技術方案進行人臉識別之前,可以先訓練對應於不同來源類別的相似度度量模型,所有訓練好的相似度度量模型共同組成度量模型集合,該集合中的每個成員,即每個相似度度量模型分別與人臉圖像的不同來源類別相對應。
給定兩個屬於不同來源類別的人臉特徵樣本(簡稱人臉樣本)x和y,相似度度量模型用於評估兩者之間的相似度,在具體實施時,所述相似度度量模型通常可以用度量函數f(x,y,P)來表示,其中P為該模型的參數,訓練的目的是基於給定的訓練集求解度量模型的參數P,參數P一旦確定則模型訓練完畢。
針對人臉圖像的多種來源類別,訓練過程可以重複多次,從而得到多個度量函數,每個度量函數適用於不同來源類別的人臉圖像。訓練針對某一特定來源類別的度量模 型時,訓練集由三部分組成:作為訓練基準的、屬於預設來源類別的基準人臉圖像訓練集X、對應所述特定來源類別的比對人臉圖像訓練集Y、以及用於標識哪些圖像來自同一人、哪些圖像來自不同人的身份標籤Z。給定一組訓練集(X,Y,Z),即可訓練得到一個針對(X,Y)空間的度量函數f(x,y,P)。固定訓練集X,藉由更換屬於不同來源類別的訓練集Yk,則可以訓練得到多個度量函數fk(x,y,P),k=1...K,其中K為訓練集Y的個數,表示圖像來源的類別數。請參見圖2,其為度量模型集合訓練過程的示意圖。
上面對整個訓練過程作了概要性描述,下面具體描述訓練對應於某一特定來源類別的相似度度量模型的具體步驟,包括:提取特徵、建立模型、求解模型參數等。在具體實施時,可以採用不同的演算法建立相似度度量模型,為了便於理解,在本實施例中以目前應用比較普及的聯合貝葉斯臉為基礎建立相似度度量模型,並將建立的模型稱為非對稱度量模型。下面結合圖3對訓練所述非對稱度量模型的過程作進一步說明,所述訓練過程包括:
步驟101-1、提取屬於預設來源類別的基準人臉圖像訓練集中各圖像的人臉特徵,作為基準特徵樣本集。
在具體實施時,作為訓練基準的基準人臉圖像訓練集X中的人臉圖像通常是在可控環境下採集的,所述預設來源類別可以為:證件照,或者其它圖像品質通常比較好的來源類別。採集基準人臉圖像訓練集後,可以提取其中各 圖像的人臉特徵作為樣本,即通常所說的人臉樣本,所有樣本共同組成基準特徵樣本集。關於如何提取人臉特徵,請參見後續步驟103中的文字說明。
步驟101-2、提取屬於所述特定來源類別的比對人臉圖像訓練集中各圖像的人臉特徵,作為比對特徵樣本集。
所述特定來源類別可以與基準人臉圖像訓練集X的來源類別不同,例如:X是在可控環境下採集的證件照,比對人臉圖像訓練集Y中的人臉圖像可以是在不可控環境下採集的生活照。採集所述比對人臉圖像訓練集後,可以提取其中各圖像的人臉特徵作為樣本,所有樣本共同組成比對特徵樣本集。關於如何提取人臉特徵,請參見後續步驟103中的文字說明。
步驟101-3、在參與比對的人臉特徵服從各自高斯分佈的假設下,建立包含參數的非對稱度量模型。
本實施例在傳統聯合貝葉斯臉的基礎上進行了改進,並建立了非對稱度量模型。為了便於理解,先對貝葉斯臉和聯合貝葉斯臉作簡要說明。
貝葉斯臉通常是對經典貝葉斯人臉識別方法的簡稱,該方法用兩幅人臉圖像特徵的差別作為模式向量,若兩個圖像屬於同一人則稱為類內模式,否則稱為類間模式,從而將人臉識別的多分類問題轉化為二分類問題。對於任意兩個人臉樣本x和y,如果基於類內/類間模式得到的對數似然比大於預先設定的閾值,則可以判定為同一個人。
聯合貝葉斯臉則是在貝葉斯臉的基礎上,針對x和y 的聯合概率分佈建立二維模型,並將每個人臉樣本表示為兩個獨立的潛在變數之和:不同人臉的變化+相同人臉的變化,然後利用大量樣本訓練得到基於對數似然比的相似度度量模型。需要說明的是,雖然上述兩種貝葉斯臉技術是針對人臉圖像識別提出的,但是也可以應用於其他客體圖像的識別。
聯合貝葉斯臉的識別準確率比經典貝葉斯臉有所提高,但是由於聯合貝葉斯臉的基本假設為:參與比對的人臉樣本x和y服從同一高斯分佈,而在具體應用中,註冊集中的圖像來源通常是可控的,待識別人臉圖像的來源則較為複雜,品質參差不齊,也即:參與比對的人臉樣本可能並不滿足服從同一高斯分佈的要求,導致聯合貝葉斯臉技術通常不能很好地處理這種情況,識別準確率較低。
針對上述問題,本發明的發明人在對聯合貝葉斯臉的假設進行修改的基礎上,提出了非對稱度量模型、以及採用不同來源類別的人臉圖像訓練集進行訓練的度量學習方法。之所以稱為“非對稱”度量模型,是因為利用該模型進行比對的兩個人臉樣本所對應的人臉圖像可以屬於不同的來源類別,由於建模時考慮到了不同來源類別導致的資料分佈差異,依據該模型估算的相似度可以得到更為準確的人臉識別結果。
非對稱度量模型基於如下假設:參與比對的兩個人臉樣本x和y可以分別服從各自高斯分佈、而不必共用參數。假設基準特徵樣本集X中的樣本x可以用兩個獨立隨 機變數之和表示:x=μ x +ε x ,其中μ x 表示由樣本的身份標籤帶來的隨機性,ε x 表示由其他因素帶來的隨機性,如:姿態、表情、光照等,假設μ x 和ε x 服從均值為0,協方差矩陣為Sxx和Txx的高斯分佈。
同理,比對人臉圖像訓練集Y中的樣本y也可用兩個獨立隨機變數之和表示:y=μ y +ε y ,其中μ y 表示由樣本的身份標籤帶來的隨機性,ε y 表示由其他因素帶來的隨機性。假設μ y 和ε y 服從均值為0,協方差矩陣為Syy和Tyy的高斯分佈。
由於x和y都服從高斯分佈,其聯合分佈也服從高斯分佈。將X和Y空間連接起來,其中的樣本表示為{x,y},該隨機變數的均值仍為0,其方差分兩種情況進行分析。
1)對於同一人的(類內)樣本。
其中,Sxy和Syx是X和Y之間的互協方差矩陣。
由此可以得到:E=(S xx +T xx -S xy (S yy +T yy )-1 S yx )-1 G=-(S xx +T xx -S xy (S yy +T yy )-1 S yx )-1 S xy (S yy +T yy )-1 F=(S yy +T yy -S yx (S xx +T xx )-1 S xy )-1
2)對於不同人的(類間)樣本。
令A=(S xx +T xx )-1-E B=(S yy +T yy )-1-F
步驟101-4、根據上述兩類特徵樣本集中的樣本以及標識樣本是否屬於同一人的身份標籤,求解所述非對稱度量模型中的參數,完成所述模型的訓練。
訓練非對稱度量模型的主要任務在於求解公式1所示模型運算式中的A、B和G參數,而經由步驟101-3的推導過程可以看出,這三個參數可以藉由Sxx、Txx、Syy、Tyy、Sxy、和Syx經過特定的運算得到,因此訓練非對稱度量模型的核心,在於求解上述各個協方差矩陣以及互協方差矩陣。本實施例利用基準特徵樣本集X和比對特徵樣本集Y中的大量人臉樣本,採用估算散度矩陣的方式求解 所述各個參數,下面進行詳細說明。
藉由上述估算散度矩陣的方式求解得到Sxx、Txx、Syy、Tyy、Sxy、和Syx後,根據步驟101-3的推導過程,可以進一步計算得到參數A、B以及G的值,將這些參數值代入公式1中,得到訓練完畢的非對稱度量模型。
至此,經由上述步驟101-1至步驟101-4,描述了訓練對應於特定來源類別的非對稱度量模型的具體步驟。在具體實施時,對於人臉圖像的K個來源類別,可以分別採用上述步驟進行訓練,從而獲取K個分別對應於不同來源類別的相似度度量模型。
需要說明的是,本實施例在利用大量人臉樣本的基礎上、採用估算散度矩陣的方式求解所述非對稱度量模型中的各個參數,在其他實施方式中,也可以採用傳統聯合貝葉斯臉所採取的期望最大化演算法、藉由多輪反覆運算的方式求解所述模型中的參數,同樣可以實現本發明的技術方案。
此外,本實施例在聯合貝葉斯臉的基礎上、藉由修改其假設建立對應於不同來源類別的相似度度量模型,在其他實施方式中,也可以採用其他方法或者技術建立所述相 似度度量模型,例如:利用典型相關分析技術(Canonical Correlation Analysis,簡稱CCA)、非對稱深度度量學習方法(Asymmetric Deep Metric Learning,簡稱ADML)、或者基於多模態受限玻爾茲曼機(Multimodal Restricted Boltzmann Machines)的方法建立所述相似度度量模型。不管採用何種演算法或者技術,只要能夠針對來源不同的人臉圖像分別建立並訓練得到相對應的相似度度量模型,就不偏離本發明的核心,都在本發明的保護範圍之內。
步驟102、獲取待識別人臉圖像。
所述待識別人臉圖像通常是指待確定身份的人臉圖像,一般在不可控環境下採集,其來源類別較多,可以包括:生活照、翻拍海報、翻拍電視、監控畫面、掃描圖像等。
在具體實施時,可以藉由多種方式獲取待識別人臉圖像,例如,用具有攝像頭的照相機或者移動終端設備拍攝、從互聯網的資來源資料庫中下載、用掃描器掃描、或者接收由用戶端(例如:移動終端設備或者桌面電腦等)經由有線或者無線方式上傳的待識別人臉圖像等。
步驟103、提取所述待識別人臉圖像的人臉特徵。
由於人臉部分通常佔據所述待識別人臉圖像的主要空間,因此可以直接從所述待識別人臉圖像中提取人臉特徵,為了提高識別的準確率,也可以先從人臉圖像背景中檢測人臉所在的具體位置,例如:採用基於膚色的檢測方 法、基於形狀的檢測方法、或者基於統計理論的檢測方法等確定人臉在所述圖像中的具體位置,然後再從所述具體位置對應的人臉圖像中提取人臉特徵。
提取特徵的過程是將人臉圖像轉換為向量的過程,該向量稱為人臉特徵,人臉特徵對來自不同人的人臉圖像具有較強的鑒別力,同時對外部干擾因素具有堅固性。在具體實施時,可以採用多種特徵提取方法,如:局部二值模式演算法(Local Binary Patterns,簡稱LBP)、Gabor小波變換演算法、以及深度卷積網路等,其中,從識別準確率以及執行性能的角度考慮,採用深度卷積網路提取人臉特徵是本實施例提供的優選實施方式。
步驟104、利用預先訓練好的人臉圖像來源分類模型,確定所述待識別人臉圖像的來源類別。
具體實施時,可以根據步驟103獲取待識別圖像的方式確定所述待識別人臉圖像的來源類別,例如:利用照相機拍照獲取的普通生活中的人臉圖像,則其來源類別為生活照;如果採用掃描器掃描獲取的人臉圖像,則其來源類別為掃描圖像。此外,對於從用戶端或者網路獲取的待識別人臉圖像,如果所述圖像帶有預先標注好的來源資訊,那麼可以依據該資訊確定所述人臉圖像的來源類別。
對於無法藉由上述方式或者類似方式獲取來源類別的待識別人臉圖像,則可以採用本步驟所述方法:利用人臉圖像來源分類模型,確定所述待識別人臉圖像的來源類別。
所述人臉圖像來源分類模型為多類分類模型(也稱為多類分類器),在具體實施時,可以在執行本步驟之前預先訓練好所述人臉圖像來源分類模型,例如,本實施例採用Softmax回歸演算法訓練所述分類模型,下面對訓練過程作進一步說明。
首先採集屬於K個不同來源類別的人臉圖像集,並從其中每個人臉圖像中提取人臉特徵組成訓練樣本集合,所述訓練樣本集合中的每個樣本由兩部分組成:人臉特徵和其對應的來源類別標籤,具體可以採用如下表示方式:{yi,si}(i=1...N)表示,其中yi為人臉特徵,si為來源類別標籤,N為樣本數。
其中,1{}為指標函數,當括弧中的運算式成立時值為1,否則值為0。在具體實施時,對於給定的訓練集{yi, si}(i=1...N),可以採用反覆運算的優化演算法(例如:梯度下降法)最小化目標函數J(θ),並求解得到參數θ,所述人臉圖像來源分類模型訓練完畢。
本步驟可以以所述待識別人臉圖像的人臉特徵作為輸入,採用已訓練完畢的人臉圖像來源分類模型計算該人臉特徵屬於每個來源類別的概率P(s=k|y),其中最大值對應的來源類別即為所述待識別人臉圖像所屬的來源類別。
在本實施例中採用Softmax演算法實現所述人臉圖像來源分類模型,在其他實施方式中,也可以採用不同於上述演算法的其他方式,例如可以採用多類SVM演算法、或者隨機森林演算法等,也是可以的。
步驟105、從預先訓練好的度量模型集合中選擇與所述待識別人臉圖像的來源類別相對應的相似度度量模型,並計算所述人臉特徵與註冊圖像人臉特徵的相似度,作為輸出人臉識別結果的依據。
所述註冊圖像通常是指,在具體應用中供查詢的人臉圖像註冊集中的人臉圖像。所述人臉圖像註冊集中的圖像通常在可控環境下採集,其來源通常較為單一,品質通常較好,例如:二代證照片、登記照等,且其規模比較大,可以達到數萬至數千萬。為了進一步提高本技術方案的識別準確率,所述人臉圖像註冊集、與在步驟101中訓練相似度度量模型時所採用的基準人臉圖像訓練集,可以採用相同來源類別的圖像,例如:都採用證件照。
在具體實施時,採集用於組成人臉圖像註冊集的圖像後,可以提取每個人臉圖像的人臉特徵,並將人臉圖像、人臉特徵、以及對應的身份標籤和身份資訊儲存在供查詢的註冊圖像資料庫中,同時建立上述各類資訊之間的對應關係。其中,所述身份資訊通常是指能夠標識人臉圖像所對應的個人身份的資訊,例如:姓名、身份ID等。
由於在步驟101中已經預先訓練好了用於人臉識別的度量模型集合,在本實施例的一個具體例子中,預先訓練好的度量模型集合中包含K個相似度度量模型,每個相似度度量模型分別與不同來源類別相對應,其形式為fk(x,y,P),k=1...K,其中參數P已經在步驟101中求解得到。
本步驟根據所述待識別人臉圖像的來源類別,從所述度量模型集合中選擇相對應的相似度度量模型,例如待識別人臉圖像的來源類別為掃描圖像,那麼本步驟則選擇針對掃描圖像這一來源類別預先訓練的相似度度量模型,並利用所選模型計算待識別人臉圖像的人臉特徵與註冊圖像人臉特徵的相似度,最終依據相似度輸出人臉識別結果。請參考圖4,其為所述具體例子中的處理過程的示意圖。
在具體實施時,針對人臉識別的不同應用需求,本步驟在計算所述人臉特徵與註冊圖像人臉特徵的相似度時,存在兩種不同的情況,下面分別進行說明。
(一)人臉驗證。
所述人臉驗證通常是指,判斷一張人臉圖像的身份是 否為某個特定人。在這種應用場景下,通常可以預先知道所述特定人的身份資訊,例如代表其身份的數位識別碼(身份ID),根據所述身份資訊查詢註冊圖像資料庫,即可獲取對應該身份的註冊圖像人臉特徵,然後計算所述待識別人臉圖像的人臉特徵與從資料庫中獲取的註冊圖像人臉特徵的相似度,若所述相似度大於預先設定的閾值,則可以判定所述待識別人臉圖像與所述註冊圖像屬於同一個人,即:所述待識別人臉圖像的身份確實為所述特定人,並將所述判定作為人臉識別結果輸出。
(二)人臉鑒別。
所述人臉鑒別通常是指,鑒別待識別人臉圖像的身份,即確定待識別人臉圖像是具體哪個人的圖像。在這種應用場景下,本步驟可以計算所述待識別人臉圖像的人臉特徵與指定範圍內的註冊圖像人臉特徵的相似度,例如,可以與預先建立好的註冊圖像資料庫中的全部註冊圖像人臉特徵逐一進行比對,也可以按照預設策略選取註冊圖像資料庫中的部分註冊圖像人臉特徵進行比對,並計算對應的相似度。若計算所得相似度中的最大值大於預先設定的閾值,則可以判定所述待識別人臉圖像在所述指定範圍內的註冊圖像中匹配成功,即可以確定待識別人臉圖像在所述指定範圍的註冊圖像集合中,並將所述最大值對應的註冊圖像的相關身份資訊作為人臉識別結果輸出,例如,可以輸出所述最大值所對應的註冊圖像的身份ID、或者姓名等身份資訊。
至此,藉由上述步驟101至步驟105,對本實施例提供的人臉識別方法的具體實施方式進行了描述。需要說明的是,在具體實施本方法的過程中,上述步驟並非都是必需的。其中步驟101是度量模型集合的訓練過程,通常情況下,所述度量模型集合中的各個相似度度量模型一旦訓練完畢,就可以反復使用,而不必每次針對獲取的待識別人臉圖像重新進行訓練;同理,步驟104也不是必需的,如果可以藉由待識別圖像的獲取方式獲知其來源類別、或者待識別圖像本身攜帶了來源類別標注,則可以不執行步驟104。
上述實施例以人臉識別為例,詳細描述了本發明提供的圖像識別方法的具體實施過程。在實際應用中,本發明提供的圖像識別方法也可應用於對其他客體圖像(例如包含各種物品的圖像)的識別中,下面以識別箱包圖像為例進行簡要說明。
可以預先根據基準箱包圖像訓練集以及對應不同來源類別的比對箱包圖像訓練集,分別訓練對應不同圖像來源類別的相似度度量模型,在獲取待識別箱包圖像後,先提取所述待識別箱包圖像中的箱包特徵,然後選用與待識別箱包圖像的來源類別相對應的相似度度量模型、計算所述箱包特徵與註冊圖像箱包特徵的相似度,並依據所述相似度輸出所述待識別箱包圖像的識別結果,例如:所述待識別箱包圖像與對應特定身份的註冊圖像是否屬於同一箱包,或者,所述待識別箱包圖像的相關身份資訊。針對箱 包等物品的身份資訊通常可以包括以下資訊之一或者組合:生產廠家、品牌資訊、型號資訊等。
綜上所述,本發明提供的圖像識別方法,在進行客體圖像識別時,沒有採用單一的相似度度量模型,而是選用預先訓練好的與待識別客體圖像的來源類別相對應的相似度度量模型,從而能夠有效處理非對稱客體圖像的識別問題,對來源多變的待識別客體圖像的識別具有更好的堅固性和更高的準確率。
在上述的實施例中,提供了一種圖像識別方法,與之相對應的,本發明還提供一種圖像識別裝置。請參看圖5,其為本發明的一種圖像識別裝置的實施例示意圖。由於裝置實施例基本相似於方法實施例,所以描述得比較簡單,相關之處參見方法實施例的部分說明即可。下述描述的裝置實施例僅僅是示意性的。
本實施例的一種圖像識別裝置,包括:度量模型訓練單元501,用於利用屬於預設來源類別的基準客體圖像訓練集、以及對應不同來源類別的比對客體圖像訓練集,分別訓練得到所述度量模型集合中對應不同來源類別的各相似度度量模型;圖像獲取單元502,用於獲取待識別客體圖像;特徵提取單元503,用於提取所述待識別客體圖像的客體特徵;來源類別確定單元504,用於以所述客體特徵為輸入,利用預先訓練好的客體圖像來源分類模型,確定所述待識別客體圖像的來源類別;相似度計算單元505,用於從預先訓練好的度量模型集合中選擇與所述待 識別客體圖像的來源類別相對應的相似度度量模型,並計算所述客體特徵與註冊圖像客體特徵的相似度,作為輸出客體識別結果的依據;其中,所述相似度計算單元包括:度量模型選擇子單元,用於從預先訓練好的度量模型集合中選擇與所述待識別客體圖像的來源類別相對應的相似度度量模型;計算執行子單元,用於利用所述度量模型選擇子單元所選的相似度度量模型計算所述客體特徵與註冊圖像客體特徵的相似度,作為輸出客體識別結果的依據。
可選的,所述裝置包括:來源分類模型訓練單元,用於在觸發所述來源類別確定單元工作之前,採用如下演算法訓練訓練所述客體圖像來源分類模型:Softmax演算法、多類SVM演算法、或者隨機森林演算法。
可選的,所述度量模型訓練單元具體用於,訓練對應不同來源類別的非對稱度量模型,所述非對稱度量模型是在參與比對的客體特徵服從各自高斯分佈的假設下、基於聯合貝葉斯臉建立的度量模型;所述度量模型訓練單元藉由如下子單元訓練對應於特定來源類別的非對稱度量模型:基準樣本提取子單元,用於提取屬於預設來源類別的基準客體圖像訓練集中各圖像的客體特徵,作為基準特徵樣本集; 比對樣本提取子單元,用於提取屬於所述特定來源類別的比對客體圖像訓練集中各圖像的客體特徵,作為比對特徵樣本集;度量模型建立子單元,用於在參與比對的客體特徵服從各自高斯分佈的假設下,建立包含參數的非對稱度量模型;模型參數求解子單元,用於根據上述兩類特徵樣本集中的樣本以及標識樣本是否屬於同一客體的身份標籤,求解所述非對稱度量模型中的參數,完成所述模型的訓練。
可選的,所述模型參數求解子單元具體用於,利用散度矩陣估算所述模型中的參數,或者,採用期望最大化演算法反覆運算求解所述模型中的參數。
可選的,所述計算執行子單元具體用於,計算所述客體特徵與對應特定身份的註冊圖像客體特徵的相似度;所述裝置還包括:第一閾值比對單元,用於判斷所述相似度是否大於預先設定的閾值;第一識別結果輸出單元,用於當所述第一閾值比對單元的輸出為是時,判定所述待識別客體圖像與所述對應特定身份的註冊圖像屬於同一客體,並將所述判定作為客體識別結果輸出。
可選的,所述計算執行子單元具體用於,計算所述客體特徵與指定範圍內的註冊圖像客體特徵的相似度;所述裝置還包括: 第二閾值比對單元,用於判斷計算所得相似度中的最大值是否大於預先設定的閾值;第二識別結果輸出單元,用於當所述第二閾值比對單元的輸出為是時,判定所述待識別客體圖像在所述指定範圍內的註冊圖像中匹配成功,並將所述最大值對應的註冊圖像的相關身份資訊作為客體識別結果輸出。
可選的,所述特徵提取單元具體用於,採用局部二值模式演算法提取所述客體特徵、採用Gabor小波變換演算法提取所述客體特徵、或者採用深度卷積網路提取所述客體特徵。
此外,本發明還提供一種度量學習方法。請參考圖6,其為本發明提供的一種度量學習方法的實施例的流程圖,本實施例與上述圖像識別方法實施例步驟相同的部分不再贅述,下面重點描述不同之處。本發明提供的一種度量學習方法包括:
步驟601、提取屬於同一來源類別的基準客體圖像訓練集中各圖像的客體特徵,作為基準特徵樣本集。
步驟602、提取屬於同一來源、但與所述基準客體圖像分屬不同來源類別的比對客體圖像訓練集中各圖像的客體特徵,作為比對特徵樣本集。
步驟603、在參與比對的客體特徵服從各自高斯分佈的假設下,建立包含參數的非對稱度量模型。
步驟604、利用上述兩類特徵樣本集中的樣本,求解所述非對稱人臉相似度度量模型中的參數。
本步驟可以利用上述兩類特徵樣本集中的樣本,採用與所建立模型相應的演算法或者方式求解所述模型中的各個參數。例如,對於基於聯合貝葉斯臉的非對稱度量模型來說,可以根據上述兩類特徵樣本集中的樣本以及標識樣本是否屬於同一客體的身份標籤資訊,利用散度矩陣估算所述模型中的參數,或者,採用期望最大化演算法反覆運算求解所述模型中的參數。
本實施例提供的度量學習方法,可以用於學習非對稱人臉圖像的相似度度量模型,在這種應用場景下,所述基準客體圖像以及所述比對客體圖像包括:人臉圖像;所述客體特徵包括:人臉特徵。當然,在實際應用中,也可以將本實施例提供的度量學習方法用於學習其他非對稱客體圖像的相似度度量模型。
本發明提供的度量學習方法,對傳統圖像識別技術中的假設進行了修改,即:參與比對的兩個客體樣本x和y可以分別服從各自高斯分佈、而不必共用參數,並在此基礎上從分屬不同來源類別的樣本集合中學習用於識別非對稱客體的相似度度量模型,從而為適應各種圖像來源的高性能客體識別提供了基礎。
在上述的實施例中,提供了一種度量學習方法,與之相對應的,本發明還提供一種度量學習裝置。請參看圖7,其為本發明的一種度量學習裝置的實施例示意圖。由於裝置實施例基本相似於方法實施例,所以描述得比較簡單,相關之處參見方法實施例的部分說明即可。下述描述的裝置實施例僅僅是示意性的。
本實施例的一種度量學習裝置,包括:基準樣本提取單元701,用於提取屬於同一來源類別的基準客體圖像訓練集中各圖像的人臉特徵,作為基準特徵樣本集;比對樣本提取單元702,用於提取屬於同一來源類別、但與所述基準客體圖像分屬不同來源類別的比對客體圖像訓練集中各圖像的客體特徵,作為比對特徵樣本集;非對稱度量模型建立單元703,用於在參與比對的客體特徵服從各自高斯分佈的假設下,建立包含參數的非對稱度量模型;度量模型參數求解單元704,用於利用上述兩類特徵樣本集中的樣本,求解所述非對稱度量模型中的參數。
可選的,所述非對稱度量模型建立單元建立的度量模型包括:基於聯合貝葉斯臉的非對稱度量模型。
可選的,所述度量模型參數求解單元具體用於,利用散度矩陣估算所述模型中的參數,或者,採用期望最大化演算法反覆運算求解所述模型中的參數。
此外,本發明還提供一種圖像來源識別方法。請參考圖8,其為本發明提供的一種圖像來源識別方法的實施例的流程圖,本實施例與上述實施例步驟相同的部分不再贅 述,下面重點描述不同之處。本發明提供的一種圖像來源識別方法包括:
步驟801、採集屬於不同來源類別的客體圖像集,並從中提取客體特徵組成訓練樣本集合。
步驟802、利用所述訓練樣本集合中的客體特徵樣本及其來源類別,訓練客體圖像來源分類模型。
所述客體圖像來源分類模型通常為多類分類模型,在具體實施時,可以採用以下演算法訓練所述客體圖像來源分類模型:Softmax演算法、多類SVM演算法、或者隨機森林演算法。
步驟803、從待分類客體圖像中提取客體特徵。
步驟804、以上述提取的客體特徵為輸入,採用所述客體圖像來源分類模型識別所述待分類客體圖像的來源類別。
本實施例提供的圖像來源識別方法,可以用於識別人臉圖像的來源類別,在這種應用場景下,所述客體圖像包括:人臉圖像;所述客體特徵包括:人臉特徵;所述預先訓練的客體圖像來源分類模型則是指人臉圖像來源分類模型。當然,在實際應用中,也可以採用本方法識別其他客體圖像的來源類別。
本發明提供的圖像來源識別方法,能夠有效識別客體圖像的來源類別,從而為在客體圖像識別過程中選擇正確的相似度度量模型提供依據,保障了識別結果的正確性。
在上述的實施例中,提供了一種圖像來源識別方法, 與之相對應的,本發明還提供一種圖像來源識別裝置。請參看圖9,其為本發明的一種圖像來源識別裝置的實施例示意圖。由於裝置實施例基本相似於方法實施例,所以描述得比較簡單,相關之處參見方法實施例的部分說明即可。下述描述的裝置實施例僅僅是示意性的。
本實施例的一種圖像來源識別裝置,包括:訓練樣本採集單元901,用於採集屬於不同來源類別的客體圖像集,並從中提取客體特徵組成訓練樣本集合;分類模型訓練單元902,用於利用所述訓練樣本集合中的客體特徵樣本及其來源類別,訓練客體圖像來源分類模型;待分類特徵提取單元903,用於從待分類客體圖像中提取客體特徵;來源類別識別單元904,用於以所述待分類特徵提取單元提取的客體特徵為輸入,採用所述客體圖像來源分類模型識別所述待分類客體圖像的來源類別。
可選的,所述客體圖像來源分類模型包括:多類分類模型;所述分類模型訓練單元具體用於,利用softmax演算法、多類SVM演算法、或者隨機森林演算法訓練所述客體圖像來源分類模型。
本發明雖然以較佳實施例公開如上,但其並不是用來限定本發明,任何本領域技術人員在不脫離本發明的精神和範圍內,都可以做出可能的變動和修改,因此本發明的保護範圍應當以本案申請專利範圍所界定的範圍為准。
在一個典型的配置中,計算設備包括一個或多個處理 器(CPU)、輸入/輸出介面、網路介面和記憶體。
記憶體可能包括電腦可讀媒體中的非永久性記憶體,隨機存取記憶體(RAM)和/或非易失性記憶體等形式,如唯讀記憶體(ROM)或快閃記憶體(flash RAM)。記憶體是電腦可讀媒體的示例。
1、電腦可讀媒體包括永久性和非永久性、可移動和非可移動媒體可以由任何方法或技術來實現資訊儲存。資訊可以是電腦可讀指令、資料結構、程式的模組或其他資料。電腦的儲存媒體的例子包括,但不限於相變記憶體(PRAM)、靜態隨機存取記憶體(SRAM)、動態隨機存取記憶體(DRAM)、其他類型的隨機存取記憶體(RAM)、唯讀記憶體(ROM)、電可抹除可程式唯讀記憶體(EEPROM)、快閃記憶體或其他記憶體技術、唯讀光碟唯讀記憶體(CD-ROM)、數位多功能光碟(DVD)或其他光學儲存、磁盒式磁帶,磁帶磁片儲存或其他磁性存放裝置或任何其他非傳輸媒體,可用於儲存可以被計算設備存取的資訊。按照本文中的界定,電腦可讀媒體不包括非暫存電腦可讀媒體(transitory media),如調變的資料信號和載波。
2、本領域技術人員應明白,本發明的實施例可提供為方法、系統或電腦程式產品。因此,本發明可採用完全硬體實施例、完全軟體實施例或結合軟體和硬體方面的實施例的形式。而且,本發明可採用在一個或多個其中包含有電腦可用程式碼的電腦可用儲存媒體(包括但不限於磁 碟記憶體、CD-ROM、光學記憶體等)上實施的電腦程式產品的形式。
Claims (28)
- 一種圖像識別方法,其特徵在於,包括:獲取待識別客體圖像;提取所述待識別客體圖像的客體特徵;從預先訓練好的度量模型集合中選擇與所述待識別客體圖像的來源類別相對應的相似度度量模型,並計算所述客體特徵與註冊圖像客體特徵的相似度,作為輸出客體識別結果的依據;其中,所述度量模型集合包含至少一個相似度度量模型,不同的相似度度量模型分別與客體圖像的不同來源類別相對應;所述相似度度量模型包括:在參與比對的客體特徵服從各自高斯分佈的假設下,建立的基於聯合貝葉斯臉的非對稱度量模型;所述參與比對的客體特徵服從各自高斯分佈,包括:參與比對的客體特徵分別服從的高斯分佈的參數不同。
- 根據請求項1所述的圖像識別方法,其中,所述度量模型集合中對應不同來源類別的各相似度度量模型,是利用屬於預設來源類別的基準客體圖像訓練集、以及對應不同來源類別的比對客體圖像訓練集分別訓練得到的。
- 根據請求項2所述的圖像識別方法,其中,所述基準客體圖像訓練集中的客體圖像與所述註冊圖 像屬於相同的來源類別。
- 根據請求項1所述的圖像識別方法,其中,在所述從預先訓練好的度量模型集合中選擇與所述待識別客體圖像的來源類別相對應的相似度度量模型的步驟之前,執行下述操作:以所述客體特徵為輸入,利用預先訓練好的客體圖像來源分類模型,確定所述待識別客體圖像的來源類別。
- 根據請求項4所述的圖像識別方法,其中,所述客體圖像來源分類模型是採用如下演算法訓練得到的多類分類模型:Softmax演算法、多類SVM演算法、或者隨機森林演算法。
- 根據請求項1所述的圖像識別方法,其中,對應於特定來源類別的所述非對稱度量模型是採用如下步驟訓練得到的:提取屬於預設來源類別的基準客體圖像訓練集中各圖像的客體特徵,作為基準特徵樣本集;提取屬於所述特定來源類別的比對客體圖像訓練集中各圖像的客體特徵,作為比對特徵樣本集;在參與比對的客體特徵服從各自高斯分佈的假設下,建立包含參數的非對稱度量模型;根據上述兩類特徵樣本集中的樣本以及標識樣本是否屬於同一客體的身份標籤,求解所述非對稱度量模型中的參數,完成所述模型的訓練。
- 根據請求項6所述的圖像識別方法,其中,所述對應於特定來源類別的非對稱度量模型如下所示:
- 根據請求項6所述的圖像識別方法,其中,所述求解所述非對稱度量模型中的參數包括:利用散度矩陣估算所述模型中的參數;或者,採用期望最大化演算法反覆運算求解所述模型中的參數。
- 根據請求項1所述的圖像識別方法,其中,所述計算所述客體特徵與註冊圖像客體特徵的相似度,包括:計算所述客體特徵與對應特定身份的註冊圖像客體特徵的相似度;在上述計算相似度的步驟後,執行下述操作:判斷所述相似度是否大於預先設定的閾值;若是,判定所述待識別客體圖像與所述對應特定身份的註冊圖像屬於同一客體,並將所述判定作為客體識別結果輸出。
- 根據請求項1所述的圖像識別方法,其中,所述計算所述客體特徵與註冊圖像客體特徵的相似度,包括:計算所述客體特徵與指定範圍內的註冊圖像客體特徵的相似度;在上述計算相似度的步驟後,執行下述操作:判斷計算所得相似度中的最大值是否大於預先設定的閾值;若是,判定所述待識別客體圖像在所述指定範圍內的註冊圖像中匹配成功,並將所述最大值對應的註冊圖像的相關身份資訊作為客體識別結果輸出。
- 根據請求項1-10中任一項所述的圖像識別方法,其中,所述提取所述待識別客體圖像的客體特徵,包括: 採用局部二值模式演算法提取所述客體特徵;或者,採用Gabor小波變換演算法提取所述客體特徵;或者,採用深度卷積網路提取所述客體特徵。
- 根據請求項1-10中任一項所述的圖像識別方法,其中,所述待識別客體圖像包括:待識別人臉圖像;所述客體特徵包括:人臉特徵。
- 根據請求項12所述的圖像識別方法,其中,所述來源類別包括:證件照、生活照、視頻截圖、掃描圖像、翻拍圖像、或者監控畫面。
- 一種圖像識別裝置,其特徵在於,包括:圖像獲取單元,用於獲取待識別客體圖像;特徵提取單元,用於提取所述待識別客體圖像的客體特徵;相似度計算單元,用於從預先訓練好的度量模型集合中選擇與所述待識別客體圖像的來源類別相對應的相似度度量模型,並計算所述客體特徵與註冊圖像客體特徵的相似度,作為輸出客體識別結果的依據;其中,所述相似度計算單元包括:度量模型選擇子單元,用於從預先訓練好的度量模型集合中選擇與所述待識別客體圖像的來源類別相對應的相似度度量模型; 計算執行子單元,用於利用所述度量模型選擇子單元所選的相似度度量模型計算所述客體特徵與註冊圖像客體特徵的相似度,作為輸出客體識別結果的依據;所述相似度度量模型包括:在參與比對的客體特徵服從各自高斯分佈的假設下,建立的基於聯合貝葉斯臉的非對稱度量模型;所述參與比對的客體特徵服從各自高斯分佈,包括:參與比對的客體特徵分別服從的高斯分佈的參數不同。
- 根據請求項14所述的圖像識別裝置,其中,包括:度量模型訓練單元,用於利用屬於預設來源類別的基準客體圖像訓練集、以及對應不同來源類別的比對客體圖像訓練集,分別訓練得到所述度量模型集合中對應不同來源類別的各相似度度量模型。
- 根據請求項14所述的圖像識別裝置,其中,包括:來源類別確定單元,用於在觸發所述相似度計算單元工作之前,以所述客體特徵為輸入,利用預先訓練好的客體圖像來源分類模型,確定所述待識別客體圖像的來源類別。
- 根據請求項16所述的圖像識別裝置,其中,包括:來源分類模型訓練單元,用於在觸發所述來源類別確定單元工作之前,採用如下演算法訓練所述客體圖像來源 分類模型:Softmax演算法、多類SVM演算法、或者隨機森林演算法。
- 根據請求項14所述的圖像識別裝置,其中,包括:度量模型訓練單元,用於訓練所述度量模型集合中的各相似度度量模型;所述度量模型訓練單元藉由如下子單元訓練對應於特定來源類別的所述非對稱度量模型:基準樣本提取子單元,用於提取屬於預設來源類別的基準客體圖像訓練集中各圖像的客體特徵,作為基準特徵樣本集;比對樣本提取子單元,用於提取屬於所述特定來源類別的比對客體圖像訓練集中各圖像的客體特徵,作為比對特徵樣本集;度量模型建立子單元,用於在參與比對的客體特徵服從各自高斯分佈的假設下,建立包含參數的非對稱度量模型;模型參數求解子單元,用於根據上述兩類特徵樣本集中的樣本以及標識樣本是否屬於同一客體的身份標籤,求解所述非對稱度量模型中的參數,完成所述模型的訓練。
- 根據請求項18所述的圖像識別裝置,其中,所述模型參數求解子單元具體用於,利用散度矩陣估算所述模型中的參數,或者,採用期望最大化演算法反覆運算求解所述模型中的參數。
- 根據請求項14所述的圖像識別裝置,其中,所述計算執行子單元具體用於,計算所述客體特徵與對應特定身份的註冊圖像客體特徵的相似度;所述裝置還包括:第一閾值比對單元,用於判斷所述相似度是否大於預先設定的閾值;第一識別結果輸出單元,用於當所述第一閾值比對單元的輸出為是時,判定所述待識別客體圖像與所述對應特定身份的註冊圖像屬於同一客體,並將所述判定作為客體識別結果輸出。
- 根據請求項14所述的圖像識別裝置,其中,所述計算執行子單元具體用於,計算所述客體特徵與指定範圍內的註冊圖像客體特徵的相似度;所述裝置還包括:第二閾值比對單元,用於判斷計算所得相似度中的最大值是否大於預先設定的閾值;第二識別結果輸出單元,用於當所述第二閾值比對單元的輸出為是時,判定所述待識別客體圖像在所述指定範圍內的註冊圖像中匹配成功,並將所述最大值對應的註冊圖像的相關身份資訊作為客體識別結果輸出。
- 根據請求項14-21中任一項所述的圖像識別裝置,其中,所述特徵提取單元具體用於,採用局部二值模式演算法提取所述客體特徵、採用Gabor小波變換演算法提取所述客體特徵、或者採用深度卷積網路提取所 述客體特徵。
- 一種度量學習方法,其特徵在於,包括:提取屬於同一來源類別的基準客體圖像訓練集中各圖像的客體特徵,作為基準特徵樣本集;提取屬於同一來源類別、但與所述基準客體圖像分屬不同來源類別的比對客體圖像訓練集中各圖像的客體特徵,作為比對特徵樣本集;在參與比對的客體特徵服從各自高斯分佈的假設下,建立包含參數的非對稱度量模型;利用上述兩類特徵樣本集中的樣本,求解所述非對稱度量模型中的參數;其中,所述參與比對的客體特徵服從各自高斯分佈,包括:參與比對的客體特徵分別服從的高斯分佈的參數不同:所述非對稱度量模型包括:基於聯合貝葉斯臉的非對稱度量模型。
- 根據請求項23所述的度量學習方法,其中,所述非對稱度量模型如下所示:
- 根據請求項24所述的度量學習方法,其中,所述求解所述非對稱度量模型中的參數包括:利用散度矩陣估算所述模型中的參數;或者,採用期望最大化演算法反覆運算求解所述模型中的參數。
- 根據請求項23-25中任一項所述的度量學習方法,其中,所述基準客體圖像以及所述比對客體圖像包括:人臉圖像;所述客體特徵包括:人臉特徵。
- 一種度量學習裝置,其特徵在於,包括:基準樣本提取單元,用於提取屬於同一來源類別的基準客體圖像訓練集中各圖像的客體特徵,作為基準特徵樣本集;比對樣本提取單元,用於提取屬於同一來源類別、但 與所述基準客體圖像分屬不同來源類別的比對客體圖像訓練集中各圖像的客體特徵,作為比對特徵樣本集;非對稱度量模型建立單元,用於在參與比對的客體特徵服從各自高斯分佈的假設下,建立包含參數的非對稱度量模型;度量模型參數求解單元,用於利用上述兩類特徵樣本集中的樣本,求解所述非對稱度量模型中的參數;其中,所述參與比對的客體特徵服從各自高斯分佈,包括:參與比對的客體特徵分別服從的高斯分佈所對應的參數不同;所述非對稱度量模型建立單元建立的度量模型包括:基於聯合貝葉斯臉的非對稱度量模型。
- 根據請求項27所述的度量學習裝置,其中,所述度量模型參數求解單元具體用於,利用散度矩陣估算所述模型中的參數,或者,採用期望最大化演算法反覆運算求解所述模型中的參數。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
TW106101919A TWI731919B (zh) | 2017-01-19 | 2017-01-19 | 圖像識別方法與裝置及度量學習方法與裝置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
TW106101919A TWI731919B (zh) | 2017-01-19 | 2017-01-19 | 圖像識別方法與裝置及度量學習方法與裝置 |
Publications (2)
Publication Number | Publication Date |
---|---|
TW201828156A TW201828156A (zh) | 2018-08-01 |
TWI731919B true TWI731919B (zh) | 2021-07-01 |
Family
ID=63960470
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW106101919A TWI731919B (zh) | 2017-01-19 | 2017-01-19 | 圖像識別方法與裝置及度量學習方法與裝置 |
Country Status (1)
Country | Link |
---|---|
TW (1) | TWI731919B (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109800744B (zh) * | 2019-03-18 | 2021-08-20 | 深圳市商汤科技有限公司 | 图像聚类方法及装置、电子设备和存储介质 |
TWI759731B (zh) * | 2020-04-27 | 2022-04-01 | 淡江大學 | 機器學習方法 |
CN111626371B (zh) * | 2020-05-29 | 2023-10-31 | 歌尔科技有限公司 | 一种图像分类方法、装置、设备及可读存储介质 |
CN113440843B (zh) * | 2021-06-25 | 2023-12-08 | 咪咕互动娱乐有限公司 | 云游戏启动控制方法、装置、云服务器和终端设备 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20040197013A1 (en) * | 2001-12-14 | 2004-10-07 | Toshio Kamei | Face meta-data creation and face similarity calculation |
CN103902961A (zh) * | 2012-12-28 | 2014-07-02 | 汉王科技股份有限公司 | 一种人脸识别方法及装置 |
CN104281843A (zh) * | 2014-10-20 | 2015-01-14 | 上海电机学院 | 基于自适应特征和分类模型选择的图像识别方法及系统 |
TW201627917A (zh) * | 2015-01-26 | 2016-08-01 | 阿里巴巴集團服務有限公司 | 人臉活體檢測方法和裝置 |
-
2017
- 2017-01-19 TW TW106101919A patent/TWI731919B/zh not_active IP Right Cessation
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20040197013A1 (en) * | 2001-12-14 | 2004-10-07 | Toshio Kamei | Face meta-data creation and face similarity calculation |
CN103902961A (zh) * | 2012-12-28 | 2014-07-02 | 汉王科技股份有限公司 | 一种人脸识别方法及装置 |
CN104281843A (zh) * | 2014-10-20 | 2015-01-14 | 上海电机学院 | 基于自适应特征和分类模型选择的图像识别方法及系统 |
TW201627917A (zh) * | 2015-01-26 | 2016-08-01 | 阿里巴巴集團服務有限公司 | 人臉活體檢測方法和裝置 |
Also Published As
Publication number | Publication date |
---|---|
TW201828156A (zh) | 2018-08-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2017024963A1 (zh) | 图像识别方法、度量学习方法、图像来源识别方法及装置 | |
Singh et al. | Face detection and recognition system using digital image processing | |
WO2019100724A1 (zh) | 训练多标签分类模型的方法和装置 | |
Naikal et al. | Informative feature selection for object recognition via sparse PCA | |
WO2016150240A1 (zh) | 身份认证方法和装置 | |
CN109376604B (zh) | 一种基于人体姿态的年龄识别方法和装置 | |
Zhao et al. | Unified face analysis by iterative multi-output random forests | |
TWI731919B (zh) | 圖像識別方法與裝置及度量學習方法與裝置 | |
Lumini et al. | Ensemble of texture descriptors and classifiers for face recognition | |
Li et al. | Common feature discriminant analysis for matching infrared face images to optical face images | |
Luz et al. | Deep periocular representation aiming video surveillance | |
Ravì et al. | Real-time food intake classification and energy expenditure estimation on a mobile device | |
Emeršič et al. | Pixel-wise ear detection with convolutional encoder-decoder networks | |
Demirkus et al. | Hierarchical temporal graphical model for head pose estimation and subsequent attribute classification in real-world videos | |
Zafeiriou et al. | Probabilistic slow features for behavior analysis | |
Roy et al. | A novel quaternary pattern of local maximum quotient for heterogeneous face recognition | |
Martinel et al. | Classification of local eigen-dissimilarities for person re-identification | |
Kacete et al. | Real-time eye pupil localization using Hough regression forest | |
Sheng et al. | Classification of traditional Chinese paintings using a modified embedding algorithm | |
CN111160119A (zh) | 一种用于化妆人脸验证的多任务深度判别度量学习模型构建方法 | |
Olivares-Mercado et al. | Face recognition system for smartphone based on lbp | |
Agrawal et al. | An efficient approach for face recognition in uncontrolled environment | |
Roy et al. | A novel local wavelet energy mesh pattern (LWEMeP) for heterogeneous face recognition | |
Chakraborty et al. | Face recognition using eigenvector and principle component analysis | |
Galdámez et al. | A small look at the ear recognition process using a hybrid approach |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
MM4A | Annulment or lapse of patent due to non-payment of fees |