TWI467498B

TWI467498B - 影像識別方法及系統

Info

Publication number: TWI467498B
Application number: TW100147200A
Authority: TW
Inventors: Chung Chia Kang; Jian Ren Chen; Chih Wei Chen; Leii H Chang
Original assignee: Ind Tech Res Inst
Priority date: 2011-12-19
Filing date: 2011-12-19
Publication date: 2015-01-01
Also published as: TW201327418A; US8818050B2; US20130156301A1

Description

影像識別方法及系統

本揭露是一種藉由使用特徵強化遮罩來強化影像中特徵的影像識別方法與系統。

隨著數位影像處理的技術越來越進步，有越來越多關於影像識別的產品問世，例如，附加有人臉辨識的功能的數位相機、具有行人識別的功能的行車紀錄器以及計算行人流量的功能的監視器。產業界以及學術界對於影像處理技術的終極目標，就是讓電腦可以像人一樣的辨識數位影像。

在數位影像處理的領域中也有關於識別人類性別或年齡的技術，其主要是根據人臉的數位影像來識別人類的性別或年齡。但由於人類在識別性別或年齡時所依據的特徵是非常直覺的，因此人類的直覺很難幫助工程師或科學家發展出一套跟人類直覺相似的判斷法則。此外，由此延伸的另一個問題就是要用什麼人臉特徵來當作辨識的依據。一種普遍的作法是根據人臉影像中的像素值作為特徵，不經過任何處理便當作一訓練器的輸入，此作法雖然簡單但效果卻非常有限。因此，如何提升影像辨識的準確度為此領域研究者所關心的議題。

本揭露提出一種影像識別方法與系統，其可以強化數位影像中的特徵，藉此可以提高辨識率。

本揭露提出一種影像識別方法，用於依據多個類別來識別待辨識影像，其中各類別包含多個樣本影像。本影像識別方法包括：依據樣本影像來產生出各類別的平均影像；根據各類別的平均影像之間的差異值來產生特徵強化遮罩；使用特徵強化遮罩強化各類別的樣本影像以產生對應各類別的多個強化樣本影像。本影像識別方法還包括：根據各類別的強化樣本影像來訓練分類器；使用特徵強化遮罩強化待辨識影像以產生待辨識強化影像；使用所訓練之分類器將待辨識強化影像分類至上述類別之中的其中一個類別以及識別待辨識影像屬於所分類之類別。

另一方面來說，本揭露提出一種影像識別系統，用於依據多個類別來識別一待辨識影像，其中各類別包含多個樣本影像。本影像識別系統包括影像擷取單元、影像辨識單元、以及分類器訓練單元。影像辨識單元耦接至影像擷取單元，而分類器訓練單元耦接至影像擷取單元以及影像辨識單元。影像擷取單元用以擷取待辨識影像。分類器訓練單元用以依據樣本影像來產生出各類別的平均影像，根據各類別的平均影像之間的差異值來產生特徵強化遮罩，並且使用特徵強化遮罩強化各類別的樣本影像以產生對應各類別的多個強化樣本影像。另外，分類器訓練單元更用以根據各類別的強化樣本影像來訓練分類器。再者，影像辨識單元用以使用特徵強化遮罩強化待辨識影像以產生待辨識強化影像，使用所訓練之分類器將待辨識強化影像分類至上述類別之中的其中一個類別，以及識別待辨識影像屬於所分類之類別。

基於上述，本揭露利用每個類別計算出的平均影像來產生特徵強化遮罩，並用此特徵強化遮罩來強化影像中的特徵。在進行分類器的訓練時，這些被強化的特徵可以提供多個類別之間的鑑別度，藉以提高識別率。

為讓本揭露之上述特徵和優點能更明顯易懂，下文特舉範例實施例，並配合所附圖式作詳細說明如下。

[第一範例實施例]

圖1為依照第一範例實施例所繪示之電腦裝置的方塊圖。

請參照圖1，電腦裝置100包括微處理器110、暫存記憶體120以及耦接至微處理器110與暫存記憶體120的影像識別系統130。

微處理器110用以控制電腦裝置100的整體運作。例如，微處理器110為中央處理器(Central Processing Unit，CPU)。

暫存記憶體120用以暫存微處理器110所執行的指令或資料。例如，在本範例實施例中，暫存記憶體120為動態隨機存取記憶體(Dynamic Random Access Memory，DRAM)。然而，必須瞭解的是，本揭露不限於此，在另一範例實施例中，暫存記憶體120也可以是靜態隨機存取記憶體(Static Random Access Memory，SRAM)或其他適合的記憶體。

影像識別系統130用以識別影像。具體來說，影像識別系統130會依據預先分類的多個類別來識別一影像所屬的類別。也就是說，當輸入一個待辨識影像201至影像識別系統130時，影像識別系統130會輸出對應此待辨識影像201的類別202(如圖2所示)。

在本範例實施例中，影像識別系統130用以識別待辨識影像是屬於”男”類別與”女”類別。也就是說，當所輸入的待辨識影像為男性人臉影像301(如圖3A所示)時，影像識別系統130會將其分類為”男”類別；並且當所輸入的待辨識影像為女性人臉影像302(如圖3B所示)時，影像識別系統130會將其分類為”女”類別。

必須瞭解的是，在此，用以識別影像是屬於”男”類別與”女”類別僅為一個範例，本揭露不限於此。例如，在另外一個範例實施例中，影像識別系統130亦可用以識別影像是屬於”年輕”類別、”中年”類別或”老年”類別。此外，本揭露亦不限制於識別人臉影像，在另一範例實施例中，影像識別系統130亦可用以強化字元樣板間之差異以辨識字元。

在本範例實施例中，影像識別系統130包括影像擷取單元132、分類器訓練單元134、影像辨識單元136與輸出單元138。

影像擷取單元132用以擷取影像。例如，影像擷取單元132為攝影機或者數位相機。此外，影像擷取單元132也可以是用以偵測影像中特定之物體的影像偵測裝置。舉例來說，影像擷取單元132為一個有人臉偵測功能的攝影機，用以在擷取影像之後自動地偵測影像中人臉的位置並擷取其人臉影像。

分類器訓練單元134是耦接至影像擷取單元132並且用以根據各類別的樣本影像來訓練分類器。影像識別單元136是耦接至分類器訓練單元134與影像擷取單元132並且用以根據所訓練的分類器來識別待辨識影像所屬的類別。此外，輸出單元138是耦接至影像識別單元136並且用以輸出影像識別單元136所產生的識別結果。

圖4為依照第一範例實施例所繪示之辨識影像的概要示意圖。

請參照圖4，首先，分類器訓練單元134會根據樣本影像集合401來產生特徵強化遮罩440。具體來說，分類器訓練單元134會根據各類別的樣本影像來產生出各該些類別的平均影像並且根據各類別的平均影像之間的差異值來產生特徵強化遮罩。

圖5為依照第一範例實施例所繪示之產生特徵強化遮罩的示意圖。

請參照圖5，在本範例實施例中，樣本影像集合401會包含依據每個類別所收集的多個樣本影像。舉例來說，樣本影像411-1~411-N屬於第一類別410，樣本影像421-1~421-M屬於第二類別420，而樣本影像431-1~431-K屬於第三類別430。例如，第一類別410為”年輕”類別，並且樣本影像411-1~411-N為多張年輕的人臉影像。

樣本影像411-1為第一類別410中的第1張樣本影像，樣本影像411-2為第二類別410中的第2張影像，以此類推，其中在第一類別410中總共有N張樣本影像並且N為自然數。相同的，樣本影像421-1為第二類別420中第1張樣本影像，樣本影像421-2為第二類別420中的第2張影像，以此類推，其中在第二類別420中總共有M張樣本影像並且M為自然數。類似地，樣本影像431-1為第三類別430中第1張樣本影像，樣本影像431-2為第三類別430中的第2張影像，以此類推，其中在第三類別430中總共有K張樣本影像並且K為自然數。在本範例實施例中，N、M、K可為相同或不相同的數值。

圖6為依照第一範例實施例所繪示之樣本影像的範例示意圖。

請參照圖6，在本範例實施例中，樣本影像411-1~411-N、樣本影像421-1~421-M與樣本影像431-1~431-K具有相同的結構，在此，僅以樣本影像411-1為例進行說明。

樣本影像411-1包含多個像素，並且此些像素是以矩陣來排列。例如，構成樣本影像411-1的矩陣是有5個行與9個列所組成，每一行列位置對應一個像素，並且每一像素具有一像素值。舉例來說，在樣本影像411-1中第3行第4列的像素所對應的像素值是125。必須瞭解的是，圖6所示的樣本影像僅為一個範例，本揭露不受此舉例所限制，在另一範例實施例中，樣本影像是可由其他大小的矩陣所組成。

在本範例實施例中這些樣本影像可預先儲存在暫存記憶體120中，然而，在另外一個範例實施例可由影像擷取單元132來擷取這些樣本影像。

請再參照圖5，分類器訓練單元134會依據各類別的樣本影像來產生各類別的平均影像。具體來說，分類器訓練單元134會根據第一類別410的樣本影像411-1~411-N產生對應第一類別410的平均影像412；根據第二類別420的樣本影像421-1~421-M產生對應第二類別420的平均影像422；以及根據第三類別430的樣本影像431-1~431-K來產生對應第三類別430的平均影像432。具體來說，各類別的平均影像具有多個平均像素值，並且這些平均像素值對應於樣本影像中的像素，其中第m個類別的平均影像的第i行第j列個平均像素值等於第m個類別的每一樣本影像的第i行第j列個像素的像素值的總和除以第m個類別的樣本影像的個數。例如，分類器訓練單元134是根據方程式(1)來產生出各類別的平均影像：

其中，A_m,i,j 為第m類別的平均影像中第i行第j列個平均像素值，n_m 為第m類別中樣本影像的個數，為第m類別的第k個樣本影像中第i行第j列個像素的像素值。

值得注意的是，在本範例實施例中，上述樣本影像為黑白影像，也就是說，樣本影像只具有一個代表亮度(luminance)的通道(channel)，並且平均影像是根據樣本影像中亮度通道所計算出(即，方程式(1)中的代表的是亮度值)。

然而，在本揭露的另一範例實施例中，樣本影像亦可為彩色影像，並且包含R、G、B三個通道，或包含Y、Cr、Cb三個通道。在此例子中，方程式(1)中的可以是上述任何一個顏色通道並且平均影像是根據這些彩色通道所計算出。

在本範例實施例中，分類器訓練單元134更用以根據各類別的平均影像之間的差異值來產生特徵強化遮罩440。在此，特徵強化遮罩440具有以矩陣所排列的多個特徵強化值，並且這些特徵強化值是根據各類別的平均影像的平均像素值之間的多個絕對差所獲得。

例如，在本範例實施例中，分類器訓練單元134是根據類別的個數而用不同的方式產生特徵強化遮罩440。當類別的個數為2時，上述絕對差之中的第i行第j列個絕對差等於第1個類別的平均影像的第i行第j列個平均像素值與第2個類別的平均影像的第i行第j列個平均像素值相減的絕對值。而特徵強化遮罩440的第i行第j列個特徵強化遮罩值等於這些絕對差之中第i行第j列個絕對差除以這些絕對差之中最大的一個絕對差來獲得。

例如，分類器訓練單元134是根據方程式(2)來產生出特徵強化遮罩440。

其中，M_i,j 為特徵強化遮罩440的第i行第j列個特徵強化遮罩值，A_1,i,j 為其中一個類別的平均影像的第i行第j列個像素所對應的像素值，A_2,i,j 為另一個類別的平均影像的第i行第j列個像素所對應的像素值，A_1,x,y 為其中一個類別的平均影像的第x行第y列個像素所對應的像素值，並且A_2,x,y 為另一個類別的平均影像的第x行第y列個像素所對應的像素值。

另一方面，當類別的個數大於2時，上述絕對差之中的第i行第j列個絕對差等於各類別的平均影像的第i行第j列個平均像素值之中最大的一個平均像素值與各類別的平均影像的第i行第j列個平均像素值之中最小的一個平均像素值相減的絕對值。而特徵強化遮罩440第i行第j列個特徵強化遮罩值等於這些絕對差之中的第i行第j列個絕對差除以這些絕對差之中最大的一個絕對差來獲得。例如，分類器訓練單元134是根據方程式(3)來產生出特徵強化遮罩440。

其中，M_i,j 為特徵強化遮罩440中的第i行第j列個特徵強化遮罩值，A_c,i,j 為第c個類別的平均影像裡第i行第j列個像素所對應的像素值，並且A_c,x,y 為第c個類別的平均影像裡第x行第y列個像素所對應的像素值。

在本範例實施例中，特徵強化遮罩440是用以顯示影像中每個像素對於此些類別(例如，第一類別410、第二類別420與第三類別430)之鑑別度，其中當一個特徵強化值越大時，表示對應之像素具有較高的鑑別度。

圖7為繪示人臉影像與其特徵強化遮罩之間關係的示意圖。

請參考圖7，特徵強化遮罩440是根據樣本影像411-1~411-N、樣本影像421-1~421-M與樣本影像431-1~431-K所產生，其中第一類別410的樣本影像411-1~411-N、第二類別420的樣本影像421-1~421-M與第三類別430的樣本影像431-1~431-K皆為人臉影像，並且第一類別410、第二類別420與第三類別430分別地代表”年輕”類別、”中年”類別與”老年”類別。倘若特徵強化遮罩440中鑑別區域701之像素的像素值較其他區域大時，表示在人臉中眼睛到鼻梁附近的位置的像素值較能鑑別人類的年紀。在其他範例實施例中，不同類別或不同樣本影像的情況下，特徵強化遮罩440具有其他的鑑別區域701，本揭露不應受上述舉例所限制。值得注意的是，鑑別區域701只用來說明特徵強化遮罩440所代表的意義，並不是用來區分特徵強化遮罩440中的特徵強化遮罩值。在特徵強化遮罩440中包含的是矩陣所排列的特徵強化特徵值，並沒有區域的分別。

請再參照圖4，分類器訓練單元134會利用所產生特徵強化遮罩440來強化樣本影像集合401以產生對應的強化樣本影像集合402。具體來說，分類器訓練單元134會使用所產生的特徵強化遮罩440來強化各類別的每個樣本影像以產生對應各類別的多個強化樣本影像。而每個強化樣本影像具有以矩陣排列的多個像素，且每個像素對應一像素值。其中第m個類別的第k個強化樣本影像的第i行第j列個像素所對應的像素值等於特徵強化遮罩440中第i行第j列的特徵強化遮罩值乘於第m個類別的第k個樣本影像的第i行第j列個像素所對應的像素值。

例如，分類器訓練單元134是使用下列方程式(4)來產生強化樣本影像：

其中，為第m類別中第k個強化樣本影像的第i行第j列個像素的像素值。

圖8為依照本揭露範例實施例說明產生強化樣本影像的範例示意圖。對應每個樣本影像的強化樣本影像皆是以相同的方式產生，在此，僅以樣本影像411-1來作說明。

請參考圖8，根據樣本影像411-1的每個像素的像素值以及在強化特徵遮罩中對應的強化特徵遮罩值可以產生對應樣本影像411-1的強化樣本影像511-1的所有像素的像素值。例如，假設樣本影像411-1中第i行第j列個像素所對應的像素值為125(即，=125)，並且強化特徵遮罩中第i行第j列的強化特徵遮罩值為0.6(即，M_i,j =0.6)，則藉由方程式(4)運算可以得到強化樣本影像511-1中第i行第j列個像素的像素值(即，=75)。

請再參照圖4，之後，分類器訓練單元134會利用所產生的強化樣本影像集合402來訓練分類器403。具體來說，分類器訓練單元134會根據各類別的強化樣本影像來訓練分類器403。例如，分類器訓練單元134可以根據K分群演算法(K-means-clustering)、線性鑑別分析、適應增強(Adaptive Boosting，AdaBoost)演算法、類神經網路(Neural Network)或支援向量機(Support Vector Machine，SVM)來訓練分類器403。

根據以上所述，分類器訓練單元134會產生特徵強化遮罩440與分類器403。在本範例實施例中，影像辨識系統130將特徵強化遮罩440與分類器403儲存在暫存記憶體120中。之後，當影像擷取單元132擷取待辨識影像404時，影像辨識單元136會從暫存記憶體120中讀取特徵強化遮罩440與分類器403來進行待辨識影像404的識別。

具體來說，影像識別單元136會利用分類器訓練單元134所產生之特徵強化遮罩440來強化待辨識影像404以產生強化待辨識影像405並且根據分類器訓練單元134所訓練的分類器403來分類強化待辨識影像405，由此根據分類結果406識別待辨識影像所屬的類別。

例如，待辨識強化影像405具有以矩陣(如圖6所示)排列的多個像素，每一個像素對應至一個像素值。待辨識強化影像405第i行第j列個像素的像素值等於特徵強化遮罩440第i行第j列個特徵強化遮罩值乘於待辨識影像405第i行第j列個像素的像素值。例如，影像辨識單元136是使用以下方程式(4)來產生待辨識強化影像405：

U _i _, _j =M _i _, _j ×B _i _, _j 　(5)

其中，B_i,j 為待辨識影像404的第i行第j列個像素的像素值並且U_i,j 為待辨識強化影像405的第i行第j列個像素的像素值。

之後，影像辨識單元136會使用分類器403將待辨識強化影像405分類至第一類別410、第二類別420與第三類別430的其中之一，並且產生一分類結果406。特別是，影像辨識單元136會根據所產生的分類結果將待辨識影像404識別為屬於第一類別410、第二類別420與第三類別430的其中之一。舉例來說，若對應待辨識強化影像405的分類結果406為”年輕”類別時，則影像辨識單元136則將待辨識影像404識別為屬於”年輕”類別。

基於上述，本揭露的影像辨識系統130是根據各類別的平均影像來產生特徵強化遮罩440，因此所產生之特徵強化遮罩440包含了不同類別之間鑑別度的資訊。也就是說，特徵強化遮罩440包含了影像中何處較具有鑑別度的資訊，其中較具鑑別度的位置(即，像素)則對應有較大的特徵強化值。基此，利用特徵強化遮罩440來強化樣本影像401與待辨識影像404可以使影像中有鑑別度的像素值被強化(即，數值會增加)，藉此提升辨識的準確度。

圖9為依照第一範例實施例所繪示之影像識別方法的流程圖。

請參考圖9，在步驟S901中，依據各類別的樣本影像產生各類別的平均影像，並且在步驟S902，根據各類別的平均影像之間的差異值產生特徵強化遮罩。產生各類別的平均影像以及據此產生特徵強化遮罩的方法已配合圖示描述如前，在此不重複說明。

接著，在步驟S903中，藉由使用特徵強化遮罩強化各類別的樣本影像來產生對應各類別的強化樣本影像，並且在步驟S904中，根據所產生的各類別的強化樣本影像來訓練分類器。然後，在步驟S905中，藉由使用特徵強化遮罩強化待辨識影像來產生待辨識強化影像。在此，產生強化樣本影像與強化待辨識影像的方法已配合圖示描述如前，在此不重複說明。

然後，在步驟S906中，使用分類器將待辨識強化影像分類至預先設定之類別(例如，第一類別410、第二類別420與第三類別430)的其中之一。最後，在步驟S907中，識別待辨識影像屬於步驟S906中所決定的類別。

[第二範例實施例]

圖10為依照第二範例實施例所繪示之影像辨識系統的方塊圖。

請參考圖10，影像辨識系統1000包含有影像擷取單元132、正規化單元1001、分類器訓練單元134、影像辨識單元136以及儲存單元1002，其中影像擷取單元132、分類器訓練單元134與影像辨識單元136的結構與功能已詳細說明如上，在此不再重複描述。

正規化單元1001是耦接至影像擷取單元132，並且用以對樣本影像401與待辨識影像404進行直方圖等化(histogram equalization)。

具體來說，直方圖等化是用以調整影像中的對比度。舉例來說，若影像中有太亮的區域(例如，由於強光照射)，則經由直方圖等化可以將此區域的亮度降低。另一方面，或影像中有太暗的區域(例如，光線不足)，則經由直方圖等化可以將此區域的亮度提高。然而，在此領域有通常知識者應可輕易實作直方圖等化，在此並不贅述。

圖11為依照第二範例實施例所繪示之去除遮罩的示意圖。

請參照圖11，在本範例實施例中，正規化單元1001更用以使用一去除遮罩1100來去除樣本影像集合401與待辨識影像404中不相關的像素。舉例來說，樣本影像集合401中的樣本影像為人臉影像(如圖3A或圖3B所示)，而其中非人臉的部份以及頭髮的部份與辨識性別無關，因此去除遮罩可以用來去除這些不相關的像素。

去除遮罩1100包含由矩陣排列(如圖6所示)的多個位元，每個位元的數值為1或0。而去除區域1120包含了數值為0的這些位元，非去除區域1130則包含了數值為1的這些位元。正規化單元1001根據去除遮罩1100中的去除區域1120來將樣本影像中不相關的像素所對應的像素值設為0。舉例來說，請參考圖11與圖3A，正規化單元1001根據去除區域1120將所對應的男性人臉影像301中的像素(即，頭髮部分與非人臉部分)的像素值設為0。且正規化單元1001根據非去除區域1130保留男性人臉影像301中對應於非去除區域1130的像素(即，人臉部分)的像素值。如此一來，正規化單元1001可以去除樣本影像中不相關的像素，藉此提高辨識率。然而，在其他範例實施例中，去除遮罩1100可以有不同的去除區域1120與非去除區域1130，本揭露應不受此限。

在本範例實施例中，正規化單元1001更用以使用主成分分析(Principal Components Analysis，PCA)以及線性判別分析(Linear Discriminant Analysis，LDA)降低強化樣本影像的維度。詳細的來說，藉由PCA可以從多個訊號中，計算出少數個重要的基底(basis)，並根據這些基底來表示訊號，藉此降低訊號的維度。一般來說，PCA的轉換可以用方程式(6)來表示。

g =M _PCA ×f 　(6)

其中，f是一個維度為N×1的向量(vector)，代表一訊號；M_PCA 為一個維度M×N的矩陣，代表PCA的轉換；g是一個維度M×1的向量，代表降低維度後的訊號，其中M<N。在本範例實施例中，f代表強化樣本影像402的訊號。

詳細的說，若強化樣本影像402之像素的維度為A×B(即，強化樣本影像402以具有B個行A個列的矩陣所構成)，則將強化樣本影像402的每一行抽出並連接成一個向量，則可以產生一個長度為A×B的向量，此一向量即為f訊號。也就是說，強化樣本影像402被表示為一個長度為A×B的向量，其中A×B=N。而PCA的轉換便可以將樣本影像402的維度從N降低至M。

另一方面，LDA的運算也可以降低維度，並保持每一個基底之間具有鑑別度。一般來說，LDA的轉換可以用以下方程式(7)來表示。

h =M _LDA ×g 　(7)

其中，g是一個維度為M×1的向量，代表一訊號；M_LDA 是一個維度為p×m的矩陣，代表LDA的轉換；而h為一個p×1的向量，代表降低維度後的訊號，其中P<M。也就是說，LDA可以把訊號g的維度從M降低至P。

然而，在此領域有通常知識者應該可以輕易的完成PCA與LDA的演算法，並產生M_PCA 與M_LDA ，在此並不贅述。

在本範例實施例中，正規化單元1001是依照上述方程式(6)與方程式(7)降低樣本強化影像402的維度(即，從維度N降低至維度P)。詳細的說，正規化單元1001將樣本強化影像402表示成維度為N的訊號f利用方程式(6)根據訊號f來產生維度為M的訊號g，利用方程式(7)根據訊號g來產生維度為P的訊號h，並且使用訊號h來代表樣本強化影像402。

在本範例實施例中，正規化單元1001亦會使用PCA與LDA，根據方程式(6)與方程式(7)來降低待辨識強化影像405的維度。詳細的說，正規化單元1001將待辨識強化影像405表示成維度為N的f訊號，利用方程式(6)根據訊號f來產生維度為N的訊號g，利用方程式(7)根據訊號g來產生維度為P訊號h，並使用訊號h來代表待辨識強化影像405。

上述PCA與LDA的運算可以降低影像的維度，藉此避免維度之咒(curse of dimensionality)，也可簡化分類器403的運算，或者是降低儲存強化樣本影像402的儲存空間需求。

儲存單元1002是耦接至分類器訓練單元134與影像辨識單元136，並且用以儲存分類器訓練單元134所產生的特徵強化遮罩440與分類器403。當影像辨識單元136要辨識待辨識影像404時，影像辨識單元136會從儲存單元1002中讀取特徵強化遮罩440與分類器403來進行辨識。例如，儲存單元1002可以是硬碟、快閃記憶體或其他非揮發性的儲存媒體。

圖12為依照第二範例實施例說明影像識別方法的流程圖。

請參照圖12，在步驟S1201中，對樣本影像以及待辨識影像執行直方圖等化，並且在步驟S1202中，根據去除遮罩來去除樣本影像與待辨識影像中不相關的像素。

然後，在步驟S1203中，依據各類別的樣本影像產生各類別的平均影像，並且在步驟S1204，根據各類別的平均影像之間的差異值產生特徵強化遮罩。

接著，在步驟S1205中，藉由使用特徵強化遮罩強化各類別的樣本影像來產生對應各類別的強化樣本影像，並且在步驟S1206中，使用主成分分析以及線性判別分析降低強化樣本影像的維度。

之後，在步驟S1207中，根據所產生的各類別的強化樣本影像來訓練分類器，並且，在步驟S1208中，藉由使用特徵強化遮罩強化待辨識影像來產生待辨識強化影像。

接著，在步驟S1209中，使用主成分分析以及線性判別分析降低待辨識強化影像的維度。

最後，在步驟S1210中，使用分類器將待辨識強化影像分類至預先設定之類別(例如，第一類別410、第二類別420與第三類別430)的其中之一，並且，在步驟S1211中，識別待辨識影像屬於步驟S1210中所決定的類別。

綜合以上所述，本揭露提出一種影像識別方法及系統。其中，藉由各類別的平均影像來產生特徵強化遮罩，並使用特徵強化遮罩來強化樣本影像與待辨識影像的特徵，使得使影像識別的能力提高。

雖然本揭露已以較佳範例實施例揭露如上，然其並非用以限定本揭露，任何所屬技術領域中具有通常知識者，在不脫離本揭露之精神和範圍內，當可作些許之更動與潤飾，因此本揭露之保護範圍當視後附之申請專利範圍所界定者為準。

110．．．微處理器

120．．．暫存記憶體

130、1000．．．影像識別系統

132．．．影像擷取單元

134．．．分類器訓練單元

136．．．影像辨識單元

138．．．輸出單元

201、404．．．待辨識影像

202．．．類別

301．．．男性人臉影像

302．．．女性人臉影像

401．．．樣本影像集合

402．．．強化樣本影像集合

403．．．分類器

404．．．待辨識影像

405．．．待辨識強化影像

406．．．分類結果

440．．．特徵強化遮罩

410．．．第一類別

420．．．第二類別

430．．．第三類別

411-1~411-N、421-1~421-M、431-1~431-K．．．樣本影像

412、422、432．．．平均影像

701‧‧‧鑑別區域

511-1‧‧‧強化樣本影像

S901~S907‧‧‧影像識別方法的步驟

1001‧‧‧正規化單元

1002‧‧‧儲存單元

1100‧‧‧去除遮罩

1120‧‧‧去除區域

1130‧‧‧非去除區域

S1201~S1211‧‧‧影像識別方法的步驟

圖1為依照第一範例實施例所繪示之電腦裝置的方塊圖。

圖2為依照第一範例實施例所繪示之影像識別系統的運作示意圖。

圖3A與3B為依照第一範例實施例所繪示之人臉影像的示意圖。

圖4為依照第一範例實施例所繪示之辨識影像的概要示意圖。

圖6為依照第一範例實施例所繪示之樣本影像的範例示意圖。

圖7為繪示人臉影像與其特徵強化遮罩之間關係的示意圖。

圖8為依照本揭露範例實施例說明產生強化樣本影像的範例示意圖。

圖9為依照第一範例實施例所繪示之影像識別方法的流程圖。

圖11為依照第二範例實施例所繪示之去除遮罩的示意圖。

圖12為依照第二範例實施例說明影像識別方法的流程圖。

S901~S907．．．影像識別方法的步驟

Claims

一種影像識別方法，用於依據多個類別來識別一待辨識影像，其中各該些類別包含多個樣本影像，該影像識別方法包括：依據該些樣本影像來產生出各該些類別的一平均影像；根據各該些類別的該平均影像之間的一差異值來產生一特徵強化遮罩；使用該特徵強化遮罩強化各該些類別的該些樣本影像以產生對應各該些類別的多個強化樣本影像；根據各該些類別的該些強化樣本影像來訓練一分類器；使用該特徵強化遮罩強化該待辨識影像以產生一待辨識強化影像；使用該分類器將該待辨識強化影像分類至該些類別之中的其中一個類別；以及識別該待辨識影像屬於該其中一個類別，其中各該些樣本影像具有以一矩陣排列的多個像素，各該些樣本影像的各該些像素對應一像素值，並且各該些類別的該平均影像具有對應該些樣本影像的該些像素的多個平均像素值，其中該些類別中的一第m個類別的平均影像的一第i行第j列個平均像素值等於該第m個類別的每一樣本影像的第i行第j列個像素的像素值的總和除以該第m個類別的樣本影像的個數，其中該特徵強化遮罩具有以該矩陣排列的多個特徵強化值，並且該些特徵強化值是根據該些類別的平均影像的平均像素值之間的多個絕對差所獲得，其中該些類別的個數為2，其中該些絕對差以該矩陣排列，並且該些絕對差之中的一第i行第j列個絕對差的值等於該些類別的一第1個類別的平均影像的該第i行第j列個平均像素值與該些類別的一第2個類別的平均影像的該第i行第j列個平均像素值相減的絕對值，其中該特徵強化遮罩的一第i行第j列個特徵強化遮罩值等於該些絕對差之中的該第i行第j列個絕對差的值除以該些絕對差之中的一最大絕對差來獲得。
如申請專利範圍第1項所述之影像識別方法，其中各該些強化樣本影像具有以該矩陣排列的多個像素，各該些強化樣本影像的各該些像素對應一像素值；其中該第m個類別的第k個強化樣本影像的第i行第j列個像素所對應的像素值等於該特徵強化遮罩的該第i行第j列個特徵強化遮罩值乘於該第m個類別的第k個樣本影像的第i行第j列個像素所對應的像素值。
如申請專利範圍第1項所述之影像識別方法，其中根據各該些類別的該些強化樣本影像來訓練該分類器的步驟包括：使用一K分群演算法、一線性鑑別分析、一適應性增強(Adaboost)演算法、一類神經網路或一支援向量機來訓練該分類器。
如申請專利範圍第1項所述之影像識別方法，其中該待辨識強化影像具有以該矩陣排列的多個像素，該待辨識強化影像的各該像素對應一像素值，其中該待辨識強化影像第i行第j列個像素的像素值等於該特徵強化遮罩的該第i行第j列個特徵強化遮罩值乘於該待辨識影像的第i行第j列個像素的像素值。
如申請專利範圍第4項所述之影像識別方法，更包括：對該些樣本影像以及該待辨識影像執行一直方圖等化(histogram equalization)。
如申請專利範圍第5項所述之影像識別方法，更包括：使用一主成分分析(Principal Components Analysis,PCA)以及一線性判別分析(Linear DiscriminantAnalysis,LDA)降低各該些強化樣本影像的維度；以及使用該主成分分析以及該線性判別分析降低該待辨識強化影像的維度。
一種影像識別系統，用於依據多個類別來識別一待辨識影像，其中各該些類別包含多個樣本影像，該影像識別系統包括：一影像擷取單元，用以擷取該待辨識影像；一影像辨識單元，耦接至該影像擷取單元；以及一分類器訓練單元，耦接至該影像擷取單元以及該影像辨識單元；其中該分類器訓練單元依據該些樣本影像來產生出各該些類別的一平均影像，其中該分類器訓練單元根據各該些類別的該平均影像之間的一差異值來產生一特徵強化遮罩，其中該分類器訓練單元使用該特徵強化遮罩強化各該些類別的該些樣本影像以產生對應各該些類別的多個強化樣本影像，其中該分類器訓練單元根據各該些類別的該些強化樣本影像來訓練一分類器，其中該影像辨識單元使用該特徵強化遮罩強化該待辨識影像以產生一待辨識強化影像，其中該影像辨識單元使用該分類器將該待辨識強化影像分類至該些類別之中的其中一個類別；其中該影像辨識單元識別該待辨識影像屬於該其中一個類別，其中各該些樣本影像具有以一矩陣排列的多個像素，且各該些樣本影像的各該些像素對應一像素值，並且各該些類別的該平均影像具有對應該些樣本影像的該些像素的多個平均像素值，其中該些類別中的一第m個類別的平均影像的一第i行第j列個平均像素值等於該第m個類別的每一樣本影像的第i行第j列個像素的像素值的總和除以該第m個類別的樣本影像的個數，其中該特徵強化遮罩具有以該矩陣排列的多個特徵強化遮罩值，並且該些特徵強化遮罩值是根據該些類別的平均影像的平均像素值之間的多個絕對差所獲得，其中該些類別的個數為2，其中該些絕對差以該矩陣排列，並且該些絕對差之中的一第i行第j列個絕對差的值等於該些類別的一第1個類別的平均影像的該第i行第j列個平均像素值與該些類別的一第2個類別的平均影像的該第i行第j列個平均像素值相減的絕對值，其中該特徵強化遮罩的一第i行第j列個特徵強化遮罩值等於該些絕對差之中的該第i行第j列個絕對差的值除以該些絕對差之中的一最大絕對差來獲得。
如申請專利範圍第7項所述之影像識別系統，其中各該些強化樣本影像具有以該矩陣排列的多個像素，各該些強化樣本影像的各該些像素對應一像素值，其中該第m個類別的第k個強化樣本影像的第i行第j列個像素所對應的像素值等於該特徵強化遮罩中第i行第j列的特徵強化值乘於該第m個類別的第k個樣本影像的第i行第j列的像素所對應的像素值。
如申請專利範圍第7項所述之影像識別系統，該分類器訓練單元用以使用一K分群演算法、一線性鑑別分析、一AdaBoost演算法、一類神經網路或一支援向量機來訓練該分類器。
如申請專利範圍第7項所述之影像識別系統，其中該待辨識強化影像具有以該矩陣排列的多個像素，該待辨識強化影像的各該像素對應一像素值，其中該待辨識強化影像第i行第j列個像素的像素值等於該特徵強化遮罩的該第i行第j列個特徵強化遮罩值乘於該待辨識影像第i行第j列個像素的像素值。
如申請專利範圍第10項所述之影像識別系統，該影像識別系統更包括一儲存單元，耦接至該分類器訓練單元以及該影像辨識單元，其中該儲存單元用以儲存該分類器與該特徵強化遮罩。
如申請專利範圍第11項所述之影像識別系統，更包括一正規化單元，耦接至該影像擷取單元、該分類器訓練單元與該影像辨識單元，其中該正規化單元對該些樣本影像以及該待辨識影像執行一直方圖等化(histogram equalization)。
如申請專利範圍第12項所述之影像識別系統，其中該正規化單元使用一主成分分析(Principal Components Analysis,PCA)以及一線性判別分析(Linear Discriminant Analysis,LDA)降低各該些強化樣本影像的維度；以及該正規化單元使用該主成分分析以及該線性判別分析降低該待辨識強化影像的維度。
一種影像識別方法，用於依據多個類別來識別一待辨識影像，其中各該些類別包含多個樣本影像，該影像識別方法包括：依據該些樣本影像來產生出各該些類別的一平均影像；根據各該些類別的該平均影像之間的一差異值來產生一特徵強化遮罩；使用該特徵強化遮罩強化各該些類別的該些樣本影像以產生對應各該些類別的多個強化樣本影像；根據各該些類別的該些強化樣本影像來訓練一分類器；使用該特徵強化遮罩強化該待辨識影像以產生一待辨識強化影像；使用該分類器將該待辨識強化影像分類至該些類別之中的其中一個類別；以及識別該待辨識影像屬於該其中一個類別，其中各該些樣本影像具有以一矩陣排列的多個像素，各該些樣本影像的各該些像素對應一像素值，並且各該些類別的該平均影像具有對應該些樣本影像的該些像素的多個平均像素值，其中該些類別中的一第m個類別的平均影像的一第i行第j列個平均像素值等於該第m個類別的每一樣本影像的第i行第j列個像素的像素值的總和除以該第m個類別的樣本影像的個數，其中該特徵強化遮罩具有以該矩陣排列的多個特徵強化值，並且該些特徵強化值是根據該些類別的平均影像的平均像素值之間的多個絕對差所獲得，其中該些類別的個數大於2，其中該些絕對差以該矩陣排列，並且該些絕對差之中的一第i行第j列個絕對差的值等於該些類別的平均影像的該第i行第j列個平均像素值之中一最大平均像素值與該些類別的平均影像的該第i行第j列個平均像素值之中的一最小平均像素值相減的絕對值，其中該特徵強化遮罩的一第i行第j列個特徵強化遮罩值等於該些絕對差之中的該第i行第j列個絕對差的值除以該些絕對差之中的一最大絕對差來獲得。
如申請專利範圍第14項所述之影像識別方法，其中各該些強化樣本影像具有以該矩陣排列的多個像素，各該些強化樣本影像的各該些像素對應一像素值；其中該第m個類別的第k個強化樣本影像的第i行第j列個像素所對應的像素值等於該特徵強化遮罩的該第i行第j列個特徵強化遮罩值乘於該第m個類別的第k個樣本影像的第i行第j列個像素所對應的像素值。
如申請專利範圍第14項所述之影像識別方法，其中根據各該些類別的該些強化樣本影像來訓練該分類器的步驟包括：使用一K分群演算法、一線性鑑別分析、一適應性增強(Adaboost)演算法、一類神經網路或一支援向量機來訓練該分類器。
如申請專利範圍第14項所述之影像識別方法，其中該待辨識強化影像具有以該矩陣排列的多個像素，該待辨識強化影像的各該像素對應一像素值，其中該待辨識強化影像第i行第j列個像素的像素值等於該特徵強化遮罩的該第i行第j列個特徵強化遮罩值乘於該待辨識影像的第i行第j列個像素的像素值。
如申請專利範圍第17項所述之影像識別方法，更包括：對該些樣本影像以及該待辨識影像執行一直方圖等化 (histogram equalization)。
如申請專利範圍第18項所述之影像識別方法，更包括：使用一主成分分析(Principal Components Analysis,PCA)以及一線性判別分析(Linear Discriminant Analysis,LDA)降低各該些強化樣本影像的維度；以及使用該主成分分析以及該線性判別分析降低該待辨識強化影像的維度。
一種影像識別系統，用於依據多個類別來識別一待辨識影像，其中各該些類別包含多個樣本影像，該影像識別系統包括：一影像擷取單元，用以擷取該待辨識影像；一影像辨識單元，耦接至該影像擷取單元；以及一分類器訓練單元，耦接至該影像擷取單元以及該影像辨識單元；其中該分類器訓練單元依據該些樣本影像來產生出各該些類別的一平均影像，其中該分類器訓練單元根據各該些類別的該平均影像之間的一差異值來產生一特徵強化遮罩，其中該分類器訓練單元使用該特徵強化遮罩強化各該些類別的該些樣本影像以產生對應各該些類別的多個強化樣本影像，其中該分類器訓練單元根據各該些類別的該些強化樣本影像來訓練一分類器，其中該影像辨識單元使用該特徵強化遮罩強化該待辨識影像以產生一待辨識強化影像，其中該影像辨識單元使用該分類器將該待辨識強化影像分類至該些類別之中的其中一個類別；其中該影像辨識單元識別該待辨識影像屬於該其中一個類別，其中各該些樣本影像具有以一矩陣排列的多個像素，且各該些樣本影像的各該些像素對應一像素值，並且各該些類別的該平均影像具有對應該些樣本影像的該些像素的多個平均像素值，其中該些類別中的一第m個類別的平均影像的一第i行第j列個平均像素值等於該第m個類別的每一樣本影像的第i行第j列個像素的像素值的總和除以該第m個類別的樣本影像的個數，其中該特徵強化遮罩具有以該矩陣排列的多個特徵強化遮罩值，並且該些特徵強化遮罩值是根據該些類別的平均影像的平均像素值之間的多個絕對差所獲得，其中該些類別的個數大於2，其中該些絕對差以該矩陣排列，並且該些絕對差之中的一第i行第j列個絕對差的值等於該些類別的平均影像的該第i行第j列個平均像素值之中一最大平均像素值與該些類別的平均影像的該第i行第j列個平均像素值之中的一最小平均像素值相減的絕對值，其中該特徵強化遮罩的一第i行第j列個特徵強化遮罩值等於該些絕對差之中的該第i行第j列個絕對差的值除以該些絕對差之中的一最大絕對差來獲得。
如申請專利範圍第20項所述之影像識別系統，其中各該些強化樣本影像具有以該矩陣排列的多個像素，各該些強化樣本影像的各該些像素對應一像素值，其中該第m個類別的第k個強化樣本影像的第i行第j列個像素所對應的像素值等於該特徵強化遮罩中第i行第j列的特徵強化值乘於該第m個類別的第k個樣本影像的第i行第j列的像素所對應的像素值。
如申請專利範圍第20項所述之影像識別系統，該分類器訓練單元用以使用一K分群演算法、一線性鑑別分析、一AdaBoost演算法、一類神經網路或一支援向量機來訓練該分類器。
如申請專利範圍第20項所述之影像識別系統，其中該待辨識強化影像具有以該矩陣排列的多個像素，該待辨識強化影像的各該像素對應一像素值，其中該待辨識強化影像第i行第j列個像素的像素值等於該特徵強化遮罩的該第i行第j列個特徵強化遮罩值乘於該待辨識影像第i行第j列個像素的像素值。
如申請專利範圍第23項所述之影像識別系統，該影像識別系統更包括一儲存單元，耦接至該分類器訓練單元以及該影像辨識單元，其中該儲存單元用以儲存該分類器與該特徵強化遮罩。
如申請專利範圍第24項所述之影像識別系統，更包括一正規化單元，耦接至該影像擷取單元、該分類器訓練單元與該影像辨識單元，其中該正規化單元對該些樣本影像以及該待辨識影像執行一直方圖等化(histogram equalization)。
如申請專利範圍第25項所述之影像識別系統，其中該正規化單元使用一主成分分析(Principal Components Analysis,PCA)以及一線性判別分析(Linear Discriminant Analysis,LDA)降低各該些強化樣本影像的維度；以及該正規化單元使用該主成分分析以及該線性判別分析降低該待辨識強化影像的維度。