TWI467498B - 影像識別方法及系統 - Google Patents

影像識別方法及系統 Download PDF

Info

Publication number
TWI467498B
TWI467498B TW100147200A TW100147200A TWI467498B TW I467498 B TWI467498 B TW I467498B TW 100147200 A TW100147200 A TW 100147200A TW 100147200 A TW100147200 A TW 100147200A TW I467498 B TWI467498 B TW I467498B
Authority
TW
Taiwan
Prior art keywords
image
categories
row
column
enhanced
Prior art date
Application number
TW100147200A
Other languages
English (en)
Other versions
TW201327418A (zh
Inventor
Chung Chia Kang
Jian Ren Chen
Chih Wei Chen
Leii H Chang
Original Assignee
Ind Tech Res Inst
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ind Tech Res Inst filed Critical Ind Tech Res Inst
Priority to TW100147200A priority Critical patent/TWI467498B/zh
Priority to US13/431,993 priority patent/US8818050B2/en
Publication of TW201327418A publication Critical patent/TW201327418A/zh
Application granted granted Critical
Publication of TWI467498B publication Critical patent/TWI467498B/zh

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/168Feature extraction; Face representation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/28Determining representative reference patterns, e.g. by averaging or distorting; Generating dictionaries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/772Determining representative reference patterns, e.g. averaging or distorting patterns; Generating dictionaries

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Physics & Mathematics (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • General Health & Medical Sciences (AREA)
  • Multimedia (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • Medical Informatics (AREA)
  • Data Mining & Analysis (AREA)
  • Computing Systems (AREA)
  • Human Computer Interaction (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Image Analysis (AREA)

Description

影像識別方法及系統
本揭露是一種藉由使用特徵強化遮罩來強化影像中特徵的影像識別方法與系統。
隨著數位影像處理的技術越來越進步,有越來越多關於影像識別的產品問世,例如,附加有人臉辨識的功能的數位相機、具有行人識別的功能的行車紀錄器以及計算行人流量的功能的監視器。產業界以及學術界對於影像處理技術的終極目標,就是讓電腦可以像人一樣的辨識數位影像。
在數位影像處理的領域中也有關於識別人類性別或年齡的技術,其主要是根據人臉的數位影像來識別人類的性別或年齡。但由於人類在識別性別或年齡時所依據的特徵是非常直覺的,因此人類的直覺很難幫助工程師或科學家發展出一套跟人類直覺相似的判斷法則。此外,由此延伸的另一個問題就是要用什麼人臉特徵來當作辨識的依據。一種普遍的作法是根據人臉影像中的像素值作為特徵,不經過任何處理便當作一訓練器的輸入,此作法雖然簡單但效果卻非常有限。因此,如何提升影像辨識的準確度為此領域研究者所關心的議題。
本揭露提出一種影像識別方法與系統,其可以強化數位影像中的特徵,藉此可以提高辨識率。
本揭露提出一種影像識別方法,用於依據多個類別來識別待辨識影像,其中各類別包含多個樣本影像。本影像識別方法包括:依據樣本影像來產生出各類別的平均影像;根據各類別的平均影像之間的差異值來產生特徵強化遮罩;使用特徵強化遮罩強化各類別的樣本影像以產生對應各類別的多個強化樣本影像。本影像識別方法還包括:根據各類別的強化樣本影像來訓練分類器;使用特徵強化遮罩強化待辨識影像以產生待辨識強化影像;使用所訓練之分類器將待辨識強化影像分類至上述類別之中的其中一個類別以及識別待辨識影像屬於所分類之類別。
另一方面來說,本揭露提出一種影像識別系統,用於依據多個類別來識別一待辨識影像,其中各類別包含多個樣本影像。本影像識別系統包括影像擷取單元、影像辨識單元、以及分類器訓練單元。影像辨識單元耦接至影像擷取單元,而分類器訓練單元耦接至影像擷取單元以及影像辨識單元。影像擷取單元用以擷取待辨識影像。分類器訓練單元用以依據樣本影像來產生出各類別的平均影像,根據各類別的平均影像之間的差異值來產生特徵強化遮罩,並且使用特徵強化遮罩強化各類別的樣本影像以產生對應各類別的多個強化樣本影像。另外,分類器訓練單元更用以根據各類別的強化樣本影像來訓練分類器。再者,影像辨識單元用以使用特徵強化遮罩強化待辨識影像以產生待辨識強化影像,使用所訓練之分類器將待辨識強化影像分類至上述類別之中的其中一個類別,以及識別待辨識影像屬於所分類之類別。
基於上述,本揭露利用每個類別計算出的平均影像來產生特徵強化遮罩,並用此特徵強化遮罩來強化影像中的特徵。在進行分類器的訓練時,這些被強化的特徵可以提供多個類別之間的鑑別度,藉以提高識別率。
為讓本揭露之上述特徵和優點能更明顯易懂,下文特舉範例實施例,並配合所附圖式作詳細說明如下。
[第一範例實施例]
圖1為依照第一範例實施例所繪示之電腦裝置的方塊圖。
請參照圖1,電腦裝置100包括微處理器110、暫存記憶體120以及耦接至微處理器110與暫存記憶體120的影像識別系統130。
微處理器110用以控制電腦裝置100的整體運作。例如,微處理器110為中央處理器(Central Processing Unit,CPU)。
暫存記憶體120用以暫存微處理器110所執行的指令或資料。例如,在本範例實施例中,暫存記憶體120為動態隨機存取記憶體(Dynamic Random Access Memory,DRAM)。然而,必須瞭解的是,本揭露不限於此,在另一範例實施例中,暫存記憶體120也可以是靜態隨機存取記憶體(Static Random Access Memory,SRAM)或其他適合的記憶體。
影像識別系統130用以識別影像。具體來說,影像識別系統130會依據預先分類的多個類別來識別一影像所屬的類別。也就是說,當輸入一個待辨識影像201至影像識別系統130時,影像識別系統130會輸出對應此待辨識影像201的類別202(如圖2所示)。
在本範例實施例中,影像識別系統130用以識別待辨識影像是屬於”男”類別與”女”類別。也就是說,當所輸入的待辨識影像為男性人臉影像301(如圖3A所示)時,影像識別系統130會將其分類為”男”類別;並且當所輸入的待辨識影像為女性人臉影像302(如圖3B所示)時,影像識別系統130會將其分類為”女”類別。
必須瞭解的是,在此,用以識別影像是屬於”男”類別與”女”類別僅為一個範例,本揭露不限於此。例如,在另外一個範例實施例中,影像識別系統130亦可用以識別影像是屬於”年輕”類別、”中年”類別或”老年”類別。此外,本揭露亦不限制於識別人臉影像,在另一範例實施例中,影像識別系統130亦可用以強化字元樣板間之差異以辨識字元。
在本範例實施例中,影像識別系統130包括影像擷取單元132、分類器訓練單元134、影像辨識單元136與輸出單元138。
影像擷取單元132用以擷取影像。例如,影像擷取單元132為攝影機或者數位相機。此外,影像擷取單元132也可以是用以偵測影像中特定之物體的影像偵測裝置。舉例來說,影像擷取單元132為一個有人臉偵測功能的攝影機,用以在擷取影像之後自動地偵測影像中人臉的位置並擷取其人臉影像。
分類器訓練單元134是耦接至影像擷取單元132並且用以根據各類別的樣本影像來訓練分類器。影像識別單元136是耦接至分類器訓練單元134與影像擷取單元132並且用以根據所訓練的分類器來識別待辨識影像所屬的類別。此外,輸出單元138是耦接至影像識別單元136並且用以輸出影像識別單元136所產生的識別結果。
圖4為依照第一範例實施例所繪示之辨識影像的概要示意圖。
請參照圖4,首先,分類器訓練單元134會根據樣本影像集合401來產生特徵強化遮罩440。具體來說,分類器訓練單元134會根據各類別的樣本影像來產生出各該些類別的平均影像並且根據各類別的平均影像之間的差異值來產生特徵強化遮罩。
圖5為依照第一範例實施例所繪示之產生特徵強化遮罩的示意圖。
請參照圖5,在本範例實施例中,樣本影像集合401會包含依據每個類別所收集的多個樣本影像。舉例來說,樣本影像411-1~411-N屬於第一類別410,樣本影像421-1~421-M屬於第二類別420,而樣本影像431-1~431-K屬於第三類別430。例如,第一類別410為”年輕”類別,並且樣本影像411-1~411-N為多張年輕的人臉影像。
樣本影像411-1為第一類別410中的第1張樣本影像,樣本影像411-2為第二類別410中的第2張影像,以此類推,其中在第一類別410中總共有N張樣本影像並且N為自然數。相同的,樣本影像421-1為第二類別420中第1張樣本影像,樣本影像421-2為第二類別420中的第2張影像,以此類推,其中在第二類別420中總共有M張樣本影像並且M為自然數。類似地,樣本影像431-1為第三類別430中第1張樣本影像,樣本影像431-2為第三類別430中的第2張影像,以此類推,其中在第三類別430中總共有K張樣本影像並且K為自然數。在本範例實施例中,N、M、K可為相同或不相同的數值。
圖6為依照第一範例實施例所繪示之樣本影像的範例示意圖。
請參照圖6,在本範例實施例中,樣本影像411-1~411-N、樣本影像421-1~421-M與樣本影像431-1~431-K具有相同的結構,在此,僅以樣本影像411-1為例進行說明。
樣本影像411-1包含多個像素,並且此些像素是以矩陣來排列。例如,構成樣本影像411-1的矩陣是有5個行與9個列所組成,每一行列位置對應一個像素,並且每一像素具有一像素值。舉例來說,在樣本影像411-1中第3行第4列的像素所對應的像素值是125。必須瞭解的是,圖6所示的樣本影像僅為一個範例,本揭露不受此舉例所限制,在另一範例實施例中,樣本影像是可由其他大小的矩陣所組成。
在本範例實施例中這些樣本影像可預先儲存在暫存記憶體120中,然而,在另外一個範例實施例可由影像擷取單元132來擷取這些樣本影像。
請再參照圖5,分類器訓練單元134會依據各類別的樣本影像來產生各類別的平均影像。具體來說,分類器訓練單元134會根據第一類別410的樣本影像411-1~411-N產生對應第一類別410的平均影像412;根據第二類別420的樣本影像421-1~421-M產生對應第二類別420的平均影像422;以及根據第三類別430的樣本影像431-1~431-K來產生對應第三類別430的平均影像432。具體來說,各類別的平均影像具有多個平均像素值,並且這些平均像素值對應於樣本影像中的像素,其中第m個類別的平均影像的第i行第j列個平均像素值等於第m個類別的每一樣本影像的第i行第j列個像素的像素值的總和除以第m個類別的樣本影像的個數。例如,分類器訓練單元134是根據方程式(1)來產生出各類別的平均影像:
其中,Am,i,j 為第m類別的平均影像中第i行第j列個平均像素值,nm 為第m類別中樣本影像的個數,為第m類別的第k個樣本影像中第i行第j列個像素的像素值。
值得注意的是,在本範例實施例中,上述樣本影像為黑白影像,也就是說,樣本影像只具有一個代表亮度(luminance)的通道(channel),並且平均影像是根據樣本影像中亮度通道所計算出(即,方程式(1)中的代表的是亮度值)。
然而,在本揭露的另一範例實施例中,樣本影像亦可為彩色影像,並且包含R、G、B三個通道,或包含Y、Cr、Cb三個通道。在此例子中,方程式(1)中的可以是上述任何一個顏色通道並且平均影像是根據這些彩色通道所計算出。
在本範例實施例中,分類器訓練單元134更用以根據各類別的平均影像之間的差異值來產生特徵強化遮罩440。在此,特徵強化遮罩440具有以矩陣所排列的多個特徵強化值,並且這些特徵強化值是根據各類別的平均影像的平均像素值之間的多個絕對差所獲得。
例如,在本範例實施例中,分類器訓練單元134是根據類別的個數而用不同的方式產生特徵強化遮罩440。當類別的個數為2時,上述絕對差之中的第i行第j列個絕對差等於第1個類別的平均影像的第i行第j列個平均像素值與第2個類別的平均影像的第i行第j列個平均像素值相減的絕對值。而特徵強化遮罩440的第i行第j列個特徵強化遮罩值等於這些絕對差之中第i行第j列個絕對差除以這些絕對差之中最大的一個絕對差來獲得。
例如,分類器訓練單元134是根據方程式(2)來產生出特徵強化遮罩440。
其中,Mi,j 為特徵強化遮罩440的第i行第j列個特徵強化遮罩值,A1,i,j 為其中一個類別的平均影像的第i行第j列個像素所對應的像素值,A2,i,j 為另一個類別的平均影像的第i行第j列個像素所對應的像素值,A1,x,y 為其中一個類別的平均影像的第x行第y列個像素所對應的像素值,並且A2,x,y 為另一個類別的平均影像的第x行第y列個像素所對應的像素值。
另一方面,當類別的個數大於2時,上述絕對差之中的第i行第j列個絕對差等於各類別的平均影像的第i行第j列個平均像素值之中最大的一個平均像素值與各類別的平均影像的第i行第j列個平均像素值之中最小的一個平均像素值相減的絕對值。而特徵強化遮罩440第i行第j列個特徵強化遮罩值等於這些絕對差之中的第i行第j列個絕對差除以這些絕對差之中最大的一個絕對差來獲得。例如,分類器訓練單元134是根據方程式(3)來產生出特徵強化遮罩440。
其中,Mi,j 為特徵強化遮罩440中的第i行第j列個特徵強化遮罩值,Ac,i,j 為第c個類別的平均影像裡第i行第j列個像素所對應的像素值,並且Ac,x,y 為第c個類別的平均影像裡第x行第y列個像素所對應的像素值。
在本範例實施例中,特徵強化遮罩440是用以顯示影像中每個像素對於此些類別(例如,第一類別410、第二類別420與第三類別430)之鑑別度,其中當一個特徵強化值越大時,表示對應之像素具有較高的鑑別度。
圖7為繪示人臉影像與其特徵強化遮罩之間關係的示意圖。
請參考圖7,特徵強化遮罩440是根據樣本影像411-1~411-N、樣本影像421-1~421-M與樣本影像431-1~431-K所產生,其中第一類別410的樣本影像411-1~411-N、第二類別420的樣本影像421-1~421-M與第三類別430的樣本影像431-1~431-K皆為人臉影像,並且第一類別410、第二類別420與第三類別430分別地代表”年輕”類別、”中年”類別與”老年”類別。倘若特徵強化遮罩440中鑑別區域701之像素的像素值較其他區域大時,表示在人臉中眼睛到鼻梁附近的位置的像素值較能鑑別人類的年紀。在其他範例實施例中,不同類別或不同樣本影像的情況下,特徵強化遮罩440具有其他的鑑別區域701,本揭露不應受上述舉例所限制。值得注意的是,鑑別區域701只用來說明特徵強化遮罩440所代表的意義,並不是用來區分特徵強化遮罩440中的特徵強化遮罩值。在特徵強化遮罩440中包含的是矩陣所排列的特徵強化特徵值,並沒有區域的分別。
請再參照圖4,分類器訓練單元134會利用所產生特徵強化遮罩440來強化樣本影像集合401以產生對應的強化樣本影像集合402。具體來說,分類器訓練單元134會使用所產生的特徵強化遮罩440來強化各類別的每個樣本影像以產生對應各類別的多個強化樣本影像。而每個強化樣本影像具有以矩陣排列的多個像素,且每個像素對應一像素值。其中第m個類別的第k個強化樣本影像的第i行第j列個像素所對應的像素值等於特徵強化遮罩440中第i行第j列的特徵強化遮罩值乘於第m個類別的第k個樣本影像的第i行第j列個像素所對應的像素值。
例如,分類器訓練單元134是使用下列方程式(4)來產生強化樣本影像:
其中,為第m類別中第k個強化樣本影像的第i行第j列個像素的像素值。
圖8為依照本揭露範例實施例說明產生強化樣本影像的範例示意圖。對應每個樣本影像的強化樣本影像皆是以相同的方式產生,在此,僅以樣本影像411-1來作說明。
請參考圖8,根據樣本影像411-1的每個像素的像素值以及在強化特徵遮罩中對應的強化特徵遮罩值可以產生對應樣本影像411-1的強化樣本影像511-1的所有像素的像素值。例如,假設樣本影像411-1中第i行第j列個像素所對應的像素值為125(即,=125),並且強化特徵遮罩中第i行第j列的強化特徵遮罩值為0.6(即,Mi,j =0.6),則藉由方程式(4)運算可以得到強化樣本影像511-1中第i行第j列個像素的像素值(即,=75)。
請再參照圖4,之後,分類器訓練單元134會利用所產生的強化樣本影像集合402來訓練分類器403。具體來說,分類器訓練單元134會根據各類別的強化樣本影像來訓練分類器403。例如,分類器訓練單元134可以根據K分群演算法(K-means-clustering)、線性鑑別分析、適應增強(Adaptive Boosting,AdaBoost)演算法、類神經網路(Neural Network)或支援向量機(Support Vector Machine,SVM)來訓練分類器403。
根據以上所述,分類器訓練單元134會產生特徵強化遮罩440與分類器403。在本範例實施例中,影像辨識系統130將特徵強化遮罩440與分類器403儲存在暫存記憶體120中。之後,當影像擷取單元132擷取待辨識影像404時,影像辨識單元136會從暫存記憶體120中讀取特徵強化遮罩440與分類器403來進行待辨識影像404的識別。
具體來說,影像識別單元136會利用分類器訓練單元134所產生之特徵強化遮罩440來強化待辨識影像404以產生強化待辨識影像405並且根據分類器訓練單元134所訓練的分類器403來分類強化待辨識影像405,由此根據分類結果406識別待辨識影像所屬的類別。
例如,待辨識強化影像405具有以矩陣(如圖6所示)排列的多個像素,每一個像素對應至一個像素值。待辨識強化影像405第i行第j列個像素的像素值等於特徵強化遮罩440第i行第j列個特徵強化遮罩值乘於待辨識影像405第i行第j列個像素的像素值。例如,影像辨識單元136是使用以下方程式(4)來產生待辨識強化影像405:
U i , j =M i , j ×B i , j  (5)
其中,Bi,j 為待辨識影像404的第i行第j列個像素的像素值並且Ui,j 為待辨識強化影像405的第i行第j列個像素的像素值。
之後,影像辨識單元136會使用分類器403將待辨識強化影像405分類至第一類別410、第二類別420與第三類別430的其中之一,並且產生一分類結果406。特別是,影像辨識單元136會根據所產生的分類結果將待辨識影像404識別為屬於第一類別410、第二類別420與第三類別430的其中之一。舉例來說,若對應待辨識強化影像405的分類結果406為”年輕”類別時,則影像辨識單元136則將待辨識影像404識別為屬於”年輕”類別。
基於上述,本揭露的影像辨識系統130是根據各類別的平均影像來產生特徵強化遮罩440,因此所產生之特徵強化遮罩440包含了不同類別之間鑑別度的資訊。也就是說,特徵強化遮罩440包含了影像中何處較具有鑑別度的資訊,其中較具鑑別度的位置(即,像素)則對應有較大的特徵強化值。基此,利用特徵強化遮罩440來強化樣本影像401與待辨識影像404可以使影像中有鑑別度的像素值被強化(即,數值會增加),藉此提升辨識的準確度。
圖9為依照第一範例實施例所繪示之影像識別方法的流程圖。
請參考圖9,在步驟S901中,依據各類別的樣本影像產生各類別的平均影像,並且在步驟S902,根據各類別的平均影像之間的差異值產生特徵強化遮罩。產生各類別的平均影像以及據此產生特徵強化遮罩的方法已配合圖示描述如前,在此不重複說明。
接著,在步驟S903中,藉由使用特徵強化遮罩強化各類別的樣本影像來產生對應各類別的強化樣本影像,並且在步驟S904中,根據所產生的各類別的強化樣本影像來訓練分類器。然後,在步驟S905中,藉由使用特徵強化遮罩強化待辨識影像來產生待辨識強化影像。在此,產生強化樣本影像與強化待辨識影像的方法已配合圖示描述如前,在此不重複說明。
然後,在步驟S906中,使用分類器將待辨識強化影像分類至預先設定之類別(例如,第一類別410、第二類別420與第三類別430)的其中之一。最後,在步驟S907中,識別待辨識影像屬於步驟S906中所決定的類別。
[第二範例實施例]
圖10為依照第二範例實施例所繪示之影像辨識系統的方塊圖。
請參考圖10,影像辨識系統1000包含有影像擷取單元132、正規化單元1001、分類器訓練單元134、影像辨識單元136以及儲存單元1002,其中影像擷取單元132、分類器訓練單元134與影像辨識單元136的結構與功能已詳細說明如上,在此不再重複描述。
正規化單元1001是耦接至影像擷取單元132,並且用以對樣本影像401與待辨識影像404進行直方圖等化(histogram equalization)。
具體來說,直方圖等化是用以調整影像中的對比度。舉例來說,若影像中有太亮的區域(例如,由於強光照射),則經由直方圖等化可以將此區域的亮度降低。另一方面,或影像中有太暗的區域(例如,光線不足),則經由直方圖等化可以將此區域的亮度提高。然而,在此領域有通常知識者應可輕易實作直方圖等化,在此並不贅述。
圖11為依照第二範例實施例所繪示之去除遮罩的示意圖。
請參照圖11,在本範例實施例中,正規化單元1001更用以使用一去除遮罩1100來去除樣本影像集合401與待辨識影像404中不相關的像素。舉例來說,樣本影像集合401中的樣本影像為人臉影像(如圖3A或圖3B所示),而其中非人臉的部份以及頭髮的部份與辨識性別無關,因此去除遮罩可以用來去除這些不相關的像素。
去除遮罩1100包含由矩陣排列(如圖6所示)的多個位元,每個位元的數值為1或0。而去除區域1120包含了數值為0的這些位元,非去除區域1130則包含了數值為1的這些位元。正規化單元1001根據去除遮罩1100中的去除區域1120來將樣本影像中不相關的像素所對應的像素值設為0。舉例來說,請參考圖11與圖3A,正規化單元1001根據去除區域1120將所對應的男性人臉影像301中的像素(即,頭髮部分與非人臉部分)的像素值設為0。且正規化單元1001根據非去除區域1130保留男性人臉影像301中對應於非去除區域1130的像素(即,人臉部分)的像素值。如此一來,正規化單元1001可以去除樣本影像中不相關的像素,藉此提高辨識率。然而,在其他範例實施例中,去除遮罩1100可以有不同的去除區域1120與非去除區域1130,本揭露應不受此限。
在本範例實施例中,正規化單元1001更用以使用主成分分析(Principal Components Analysis,PCA)以及線性判別分析(Linear Discriminant Analysis,LDA)降低強化樣本影像的維度。詳細的來說,藉由PCA可以從多個訊號中,計算出少數個重要的基底(basis),並根據這些基底來表示訊號,藉此降低訊號的維度。一般來說,PCA的轉換可以用方程式(6)來表示。
g =M PCA ×f  (6)
其中,f是一個維度為N×1的向量(vector),代表一訊號;MPCA 為一個維度M×N的矩陣,代表PCA的轉換;g是一個維度M×1的向量,代表降低維度後的訊號,其中M<N。在本範例實施例中,f代表強化樣本影像402的訊號。
詳細的說,若強化樣本影像402之像素的維度為A×B(即,強化樣本影像402以具有B個行A個列的矩陣所構成),則將強化樣本影像402的每一行抽出並連接成一個向量,則可以產生一個長度為A×B的向量,此一向量即為f訊號。也就是說,強化樣本影像402被表示為一個長度為A×B的向量,其中A×B=N。而PCA的轉換便可以將樣本影像402的維度從N降低至M。
另一方面,LDA的運算也可以降低維度,並保持每一個基底之間具有鑑別度。一般來說,LDA的轉換可以用以下方程式(7)來表示。
h =M LDA ×g  (7)
其中,g是一個維度為M×1的向量,代表一訊號;MLDA 是一個維度為p×m的矩陣,代表LDA的轉換;而h為一個p×1的向量,代表降低維度後的訊號,其中P<M。也就是說,LDA可以把訊號g的維度從M降低至P。
然而,在此領域有通常知識者應該可以輕易的完成PCA與LDA的演算法,並產生MPCA 與MLDA ,在此並不贅述。
在本範例實施例中,正規化單元1001是依照上述方程式(6)與方程式(7)降低樣本強化影像402的維度(即,從維度N降低至維度P)。詳細的說,正規化單元1001將樣本強化影像402表示成維度為N的訊號f利用方程式(6)根據訊號f來產生維度為M的訊號g,利用方程式(7)根據訊號g來產生維度為P的訊號h,並且使用訊號h來代表樣本強化影像402。
在本範例實施例中,正規化單元1001亦會使用PCA與LDA,根據方程式(6)與方程式(7)來降低待辨識強化影像405的維度。詳細的說,正規化單元1001將待辨識強化影像405表示成維度為N的f訊號,利用方程式(6)根據訊號f來產生維度為N的訊號g,利用方程式(7)根據訊號g來產生維度為P訊號h,並使用訊號h來代表待辨識強化影像405。
上述PCA與LDA的運算可以降低影像的維度,藉此避免維度之咒(curse of dimensionality),也可簡化分類器403的運算,或者是降低儲存強化樣本影像402的儲存空間需求。
儲存單元1002是耦接至分類器訓練單元134與影像辨識單元136,並且用以儲存分類器訓練單元134所產生的特徵強化遮罩440與分類器403。當影像辨識單元136要辨識待辨識影像404時,影像辨識單元136會從儲存單元1002中讀取特徵強化遮罩440與分類器403來進行辨識。例如,儲存單元1002可以是硬碟、快閃記憶體或其他非揮發性的儲存媒體。
圖12為依照第二範例實施例說明影像識別方法的流程圖。
請參照圖12,在步驟S1201中,對樣本影像以及待辨識影像執行直方圖等化,並且在步驟S1202中,根據去除遮罩來去除樣本影像與待辨識影像中不相關的像素。
然後,在步驟S1203中,依據各類別的樣本影像產生各類別的平均影像,並且在步驟S1204,根據各類別的平均影像之間的差異值產生特徵強化遮罩。
接著,在步驟S1205中,藉由使用特徵強化遮罩強化各類別的樣本影像來產生對應各類別的強化樣本影像,並且在步驟S1206中,使用主成分分析以及線性判別分析降低強化樣本影像的維度。
之後,在步驟S1207中,根據所產生的各類別的強化樣本影像來訓練分類器,並且,在步驟S1208中,藉由使用特徵強化遮罩強化待辨識影像來產生待辨識強化影像。
接著,在步驟S1209中,使用主成分分析以及線性判別分析降低待辨識強化影像的維度。
最後,在步驟S1210中,使用分類器將待辨識強化影像分類至預先設定之類別(例如,第一類別410、第二類別420與第三類別430)的其中之一,並且,在步驟S1211中,識別待辨識影像屬於步驟S1210中所決定的類別。
綜合以上所述,本揭露提出一種影像識別方法及系統。其中,藉由各類別的平均影像來產生特徵強化遮罩,並使用特徵強化遮罩來強化樣本影像與待辨識影像的特徵,使得使影像識別的能力提高。
雖然本揭露已以較佳範例實施例揭露如上,然其並非用以限定本揭露,任何所屬技術領域中具有通常知識者,在不脫離本揭露之精神和範圍內,當可作些許之更動與潤飾,因此本揭露之保護範圍當視後附之申請專利範圍所界定者為準。
110...微處理器
120...暫存記憶體
130、1000...影像識別系統
132...影像擷取單元
134...分類器訓練單元
136...影像辨識單元
138...輸出單元
201、404...待辨識影像
202...類別
301...男性人臉影像
302...女性人臉影像
401...樣本影像集合
402...強化樣本影像集合
403...分類器
404...待辨識影像
405...待辨識強化影像
406...分類結果
440...特徵強化遮罩
410...第一類別
420...第二類別
430...第三類別
411-1~411-N、421-1~421-M、431-1~431-K...樣本影像
412、422、432...平均影像
701‧‧‧鑑別區域
511-1‧‧‧強化樣本影像
S901~S907‧‧‧影像識別方法的步驟
1001‧‧‧正規化單元
1002‧‧‧儲存單元
1100‧‧‧去除遮罩
1120‧‧‧去除區域
1130‧‧‧非去除區域
S1201~S1211‧‧‧影像識別方法的步驟
圖1為依照第一範例實施例所繪示之電腦裝置的方塊圖。
圖2為依照第一範例實施例所繪示之影像識別系統的運作示意圖。
圖3A與3B為依照第一範例實施例所繪示之人臉影像的示意圖。
圖4為依照第一範例實施例所繪示之辨識影像的概要示意圖。
圖5為依照第一範例實施例所繪示之產生特徵強化遮罩的示意圖。
圖6為依照第一範例實施例所繪示之樣本影像的範例示意圖。
圖7為繪示人臉影像與其特徵強化遮罩之間關係的示意圖。
圖8為依照本揭露範例實施例說明產生強化樣本影像的範例示意圖。
圖9為依照第一範例實施例所繪示之影像識別方法的流程圖。
圖10為依照第二範例實施例所繪示之影像辨識系統的方塊圖。
圖11為依照第二範例實施例所繪示之去除遮罩的示意圖。
圖12為依照第二範例實施例說明影像識別方法的流程圖。
S901~S907...影像識別方法的步驟

Claims (26)

  1. 一種影像識別方法,用於依據多個類別來識別一待辨識影像,其中各該些類別包含多個樣本影像,該影像識別方法包括:依據該些樣本影像來產生出各該些類別的一平均影像;根據各該些類別的該平均影像之間的一差異值來產生一特徵強化遮罩;使用該特徵強化遮罩強化各該些類別的該些樣本影像以產生對應各該些類別的多個強化樣本影像;根據各該些類別的該些強化樣本影像來訓練一分類器;使用該特徵強化遮罩強化該待辨識影像以產生一待辨識強化影像;使用該分類器將該待辨識強化影像分類至該些類別之中的其中一個類別;以及識別該待辨識影像屬於該其中一個類別,其中各該些樣本影像具有以一矩陣排列的多個像素,各該些樣本影像的各該些像素對應一像素值,並且各該些類別的該平均影像具有對應該些樣本影像的該些像素的多個平均像素值,其中該些類別中的一第m個類別的平均影像的一第i行第j列個平均像素值等於該第m個類別的每一樣本影像的第i行第j列個像素的像素值的總和除以該第m個類別的樣本影像的個數,其中該特徵強化遮罩具有以該矩陣排列的多個特徵強化 值,並且該些特徵強化值是根據該些類別的平均影像的平均像素值之間的多個絕對差所獲得,其中該些類別的個數為2,其中該些絕對差以該矩陣排列,並且該些絕對差之中的一第i行第j列個絕對差的值等於該些類別的一第1個類別的平均影像的該第i行第j列個平均像素值與該些類別的一第2個類別的平均影像的該第i行第j列個平均像素值相減的絕對值,其中該特徵強化遮罩的一第i行第j列個特徵強化遮罩值等於該些絕對差之中的該第i行第j列個絕對差的值除以該些絕對差之中的一最大絕對差來獲得。
  2. 如申請專利範圍第1項所述之影像識別方法,其中各該些強化樣本影像具有以該矩陣排列的多個像素,各該些強化樣本影像的各該些像素對應一像素值;其中該第m個類別的第k個強化樣本影像的第i行第j列個像素所對應的像素值等於該特徵強化遮罩的該第i行第j列個特徵強化遮罩值乘於該第m個類別的第k個樣本影像的第i行第j列個像素所對應的像素值。
  3. 如申請專利範圍第1項所述之影像識別方法,其中根據各該些類別的該些強化樣本影像來訓練該分類器的步驟包括:使用一K分群演算法、一線性鑑別分析、一適應性增強(Adaboost)演算法、一類神經網路或一支援向量機來訓練該分類器。
  4. 如申請專利範圍第1項所述之影像識別方法,其中該待辨識強化影像具有以該矩陣排列的多個像素,該待辨識強化影像的各該像素對應一像素值,其中該待辨識強化影像第i行第j列個像素的像素值等於該特徵強化遮罩的該第i行第j列個特徵強化遮罩值乘於該待辨識影像的第i行第j列個像素的像素值。
  5. 如申請專利範圍第4項所述之影像識別方法,更包括:對該些樣本影像以及該待辨識影像執行一直方圖等化(histogram equalization)。
  6. 如申請專利範圍第5項所述之影像識別方法,更包括:使用一主成分分析(Principal Components Analysis,PCA)以及一線性判別分析(Linear DiscriminantAnalysis,LDA)降低各該些強化樣本影像的維度;以及使用該主成分分析以及該線性判別分析降低該待辨識強化影像的維度。
  7. 一種影像識別系統,用於依據多個類別來識別一待辨識影像,其中各該些類別包含多個樣本影像,該影像識別系統包括:一影像擷取單元,用以擷取該待辨識影像;一影像辨識單元,耦接至該影像擷取單元;以及一分類器訓練單元,耦接至該影像擷取單元以及該影像辨識單元;其中該分類器訓練單元依據該些樣本影像來產生出各該些類別的一平均影像, 其中該分類器訓練單元根據各該些類別的該平均影像之間的一差異值來產生一特徵強化遮罩,其中該分類器訓練單元使用該特徵強化遮罩強化各該些類別的該些樣本影像以產生對應各該些類別的多個強化樣本影像,其中該分類器訓練單元根據各該些類別的該些強化樣本影像來訓練一分類器,其中該影像辨識單元使用該特徵強化遮罩強化該待辨識影像以產生一待辨識強化影像,其中該影像辨識單元使用該分類器將該待辨識強化影像分類至該些類別之中的其中一個類別;其中該影像辨識單元識別該待辨識影像屬於該其中一個類別,其中各該些樣本影像具有以一矩陣排列的多個像素,且各該些樣本影像的各該些像素對應一像素值,並且各該些類別的該平均影像具有對應該些樣本影像的該些像素的多個平均像素值,其中該些類別中的一第m個類別的平均影像的一第i行第j列個平均像素值等於該第m個類別的每一樣本影像的第i行第j列個像素的像素值的總和除以該第m個類別的樣本影像的個數,其中該特徵強化遮罩具有以該矩陣排列的多個特徵強化遮罩值,並且該些特徵強化遮罩值是根據該些類別的平均影像的平均像素值之間的多個絕對差所獲得, 其中該些類別的個數為2,其中該些絕對差以該矩陣排列,並且該些絕對差之中的一第i行第j列個絕對差的值等於該些類別的一第1個類別的平均影像的該第i行第j列個平均像素值與該些類別的一第2個類別的平均影像的該第i行第j列個平均像素值相減的絕對值,其中該特徵強化遮罩的一第i行第j列個特徵強化遮罩值等於該些絕對差之中的該第i行第j列個絕對差的值除以該些絕對差之中的一最大絕對差來獲得。
  8. 如申請專利範圍第7項所述之影像識別系統,其中各該些強化樣本影像具有以該矩陣排列的多個像素,各該些強化樣本影像的各該些像素對應一像素值,其中該第m個類別的第k個強化樣本影像的第i行第j列個像素所對應的像素值等於該特徵強化遮罩中第i行第j列的特徵強化值乘於該第m個類別的第k個樣本影像的第i行第j列的像素所對應的像素值。
  9. 如申請專利範圍第7項所述之影像識別系統,該分類器訓練單元用以使用一K分群演算法、一線性鑑別分析、一AdaBoost演算法、一類神經網路或一支援向量機來訓練該分類器。
  10. 如申請專利範圍第7項所述之影像識別系統,其中該待辨識強化影像具有以該矩陣排列的多個像素,該待辨識強化影像的各該像素對應一像素值,其中該待辨識強化影像第i行第j列個像素的像素值等於 該特徵強化遮罩的該第i行第j列個特徵強化遮罩值乘於該待辨識影像第i行第j列個像素的像素值。
  11. 如申請專利範圍第10項所述之影像識別系統,該影像識別系統更包括一儲存單元,耦接至該分類器訓練單元以及該影像辨識單元,其中該儲存單元用以儲存該分類器與該特徵強化遮罩。
  12. 如申請專利範圍第11項所述之影像識別系統,更包括一正規化單元,耦接至該影像擷取單元、該分類器訓練單元與該影像辨識單元,其中該正規化單元對該些樣本影像以及該待辨識影像執行一直方圖等化(histogram equalization)。
  13. 如申請專利範圍第12項所述之影像識別系統,其中該正規化單元使用一主成分分析(Principal Components Analysis,PCA)以及一線性判別分析(Linear Discriminant Analysis,LDA)降低各該些強化樣本影像的維度;以及該正規化單元使用該主成分分析以及該線性判別分析降低該待辨識強化影像的維度。
  14. 一種影像識別方法,用於依據多個類別來識別一待辨識影像,其中各該些類別包含多個樣本影像,該影像識別方法包括:依據該些樣本影像來產生出各該些類別的一平均影像;根據各該些類別的該平均影像之間的一差異值來產生一特徵強化遮罩;使用該特徵強化遮罩強化各該些類別的該些樣本影像以產生對應各該些類別的多個強化樣本影像; 根據各該些類別的該些強化樣本影像來訓練一分類器;使用該特徵強化遮罩強化該待辨識影像以產生一待辨識強化影像;使用該分類器將該待辨識強化影像分類至該些類別之中的其中一個類別;以及識別該待辨識影像屬於該其中一個類別,其中各該些樣本影像具有以一矩陣排列的多個像素,各該些樣本影像的各該些像素對應一像素值,並且各該些類別的該平均影像具有對應該些樣本影像的該些像素的多個平均像素值,其中該些類別中的一第m個類別的平均影像的一第i行第j列個平均像素值等於該第m個類別的每一樣本影像的第i行第j列個像素的像素值的總和除以該第m個類別的樣本影像的個數,其中該特徵強化遮罩具有以該矩陣排列的多個特徵強化值,並且該些特徵強化值是根據該些類別的平均影像的平均像素值之間的多個絕對差所獲得,其中該些類別的個數大於2,其中該些絕對差以該矩陣排列,並且該些絕對差之中的一第i行第j列個絕對差的值等於該些類別的平均影像的該第i行第j列個平均像素值之中一最大平均像素值與該些類別的平均影像的該第i行第j列個平均像素值之中的一最小平均像素值相減的絕對值,其中該特徵強化遮罩的一第i行第j列個特徵強化遮罩值 等於該些絕對差之中的該第i行第j列個絕對差的值除以該些絕對差之中的一最大絕對差來獲得。
  15. 如申請專利範圍第14項所述之影像識別方法,其中各該些強化樣本影像具有以該矩陣排列的多個像素,各該些強化樣本影像的各該些像素對應一像素值;其中該第m個類別的第k個強化樣本影像的第i行第j列個像素所對應的像素值等於該特徵強化遮罩的該第i行第j列個特徵強化遮罩值乘於該第m個類別的第k個樣本影像的第i行第j列個像素所對應的像素值。
  16. 如申請專利範圍第14項所述之影像識別方法,其中根據各該些類別的該些強化樣本影像來訓練該分類器的步驟包括:使用一K分群演算法、一線性鑑別分析、一適應性增強(Adaboost)演算法、一類神經網路或一支援向量機來訓練該分類器。
  17. 如申請專利範圍第14項所述之影像識別方法,其中該待辨識強化影像具有以該矩陣排列的多個像素,該待辨識強化影像的各該像素對應一像素值,其中該待辨識強化影像第i行第j列個像素的像素值等於該特徵強化遮罩的該第i行第j列個特徵強化遮罩值乘於該待辨識影像的第i行第j列個像素的像素值。
  18. 如申請專利範圍第17項所述之影像識別方法,更包括:對該些樣本影像以及該待辨識影像執行一直方圖等化 (histogram equalization)。
  19. 如申請專利範圍第18項所述之影像識別方法,更包括:使用一主成分分析(Principal Components Analysis,PCA)以及一線性判別分析(Linear Discriminant Analysis,LDA)降低各該些強化樣本影像的維度;以及使用該主成分分析以及該線性判別分析降低該待辨識強化影像的維度。
  20. 一種影像識別系統,用於依據多個類別來識別一待辨識影像,其中各該些類別包含多個樣本影像,該影像識別系統包括:一影像擷取單元,用以擷取該待辨識影像;一影像辨識單元,耦接至該影像擷取單元;以及一分類器訓練單元,耦接至該影像擷取單元以及該影像辨識單元;其中該分類器訓練單元依據該些樣本影像來產生出各該些類別的一平均影像,其中該分類器訓練單元根據各該些類別的該平均影像之間的一差異值來產生一特徵強化遮罩,其中該分類器訓練單元使用該特徵強化遮罩強化各該些類別的該些樣本影像以產生對應各該些類別的多個強化樣本影像,其中該分類器訓練單元根據各該些類別的該些強化樣本影像來訓練一分類器, 其中該影像辨識單元使用該特徵強化遮罩強化該待辨識影像以產生一待辨識強化影像,其中該影像辨識單元使用該分類器將該待辨識強化影像分類至該些類別之中的其中一個類別;其中該影像辨識單元識別該待辨識影像屬於該其中一個類別,其中各該些樣本影像具有以一矩陣排列的多個像素,且各該些樣本影像的各該些像素對應一像素值,並且各該些類別的該平均影像具有對應該些樣本影像的該些像素的多個平均像素值,其中該些類別中的一第m個類別的平均影像的一第i行第j列個平均像素值等於該第m個類別的每一樣本影像的第i行第j列個像素的像素值的總和除以該第m個類別的樣本影像的個數,其中該特徵強化遮罩具有以該矩陣排列的多個特徵強化遮罩值,並且該些特徵強化遮罩值是根據該些類別的平均影像的平均像素值之間的多個絕對差所獲得,其中該些類別的個數大於2,其中該些絕對差以該矩陣排列,並且該些絕對差之中的一第i行第j列個絕對差的值等於該些類別的平均影像的該第i行第j列個平均像素值之中一最大平均像素值與該些類別的平均影像的該第i行第j列個平均像素值之中的一最小平均像素值相減的絕對值,其中該特徵強化遮罩的一第i行第j列個特徵強化遮罩值 等於該些絕對差之中的該第i行第j列個絕對差的值除以該些絕對差之中的一最大絕對差來獲得。
  21. 如申請專利範圍第20項所述之影像識別系統,其中各該些強化樣本影像具有以該矩陣排列的多個像素,各該些強化樣本影像的各該些像素對應一像素值,其中該第m個類別的第k個強化樣本影像的第i行第j列個像素所對應的像素值等於該特徵強化遮罩中第i行第j列的特徵強化值乘於該第m個類別的第k個樣本影像的第i行第j列的像素所對應的像素值。
  22. 如申請專利範圍第20項所述之影像識別系統,該分類器訓練單元用以使用一K分群演算法、一線性鑑別分析、一AdaBoost演算法、一類神經網路或一支援向量機來訓練該分類器。
  23. 如申請專利範圍第20項所述之影像識別系統,其中該待辨識強化影像具有以該矩陣排列的多個像素,該待辨識強化影像的各該像素對應一像素值,其中該待辨識強化影像第i行第j列個像素的像素值等於該特徵強化遮罩的該第i行第j列個特徵強化遮罩值乘於該待辨識影像第i行第j列個像素的像素值。
  24. 如申請專利範圍第23項所述之影像識別系統,該影像識別系統更包括一儲存單元,耦接至該分類器訓練單元以及該影像辨識單元,其中該儲存單元用以儲存該分類器與該特徵強化遮罩。
  25. 如申請專利範圍第24項所述之影像識別系統,更包 括一正規化單元,耦接至該影像擷取單元、該分類器訓練單元與該影像辨識單元,其中該正規化單元對該些樣本影像以及該待辨識影像執行一直方圖等化(histogram equalization)。
  26. 如申請專利範圍第25項所述之影像識別系統,其中該正規化單元使用一主成分分析(Principal Components Analysis,PCA)以及一線性判別分析(Linear Discriminant Analysis,LDA)降低各該些強化樣本影像的維度;以及該正規化單元使用該主成分分析以及該線性判別分析降低該待辨識強化影像的維度。
TW100147200A 2011-12-19 2011-12-19 影像識別方法及系統 TWI467498B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
TW100147200A TWI467498B (zh) 2011-12-19 2011-12-19 影像識別方法及系統
US13/431,993 US8818050B2 (en) 2011-12-19 2012-03-28 Method and system for recognizing images

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
TW100147200A TWI467498B (zh) 2011-12-19 2011-12-19 影像識別方法及系統

Publications (2)

Publication Number Publication Date
TW201327418A TW201327418A (zh) 2013-07-01
TWI467498B true TWI467498B (zh) 2015-01-01

Family

ID=48610195

Family Applications (1)

Application Number Title Priority Date Filing Date
TW100147200A TWI467498B (zh) 2011-12-19 2011-12-19 影像識別方法及系統

Country Status (2)

Country Link
US (1) US8818050B2 (zh)
TW (1) TWI467498B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI771250B (zh) * 2021-12-16 2022-07-11 國立陽明交通大學 用於降低資料維度的裝置及方法、用於轉換資料維度的裝置的操作方法

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102015208429A1 (de) * 2015-05-06 2016-11-10 Continental Teves Ag & Co. Ohg Verfahren und Vorrichtung zur Erkennung und Bewertung von Fahrbahnreflexionen
US11631186B2 (en) * 2017-08-01 2023-04-18 3M Innovative Properties Company Neural style transfer for image varietization and recognition
TWI647658B (zh) * 2017-09-29 2019-01-11 樂達創意科技有限公司 影像特徵自動辨識裝置、系統及方法
CN109325138B (zh) * 2018-07-12 2022-07-15 上海电机学院 一种基于扩展与亚像素矩阵结合的图像快速识别方法
CN113112410A (zh) * 2020-01-10 2021-07-13 华为技术有限公司 数据增强方法、装置、计算设备、芯片及计算机存储介质
CN111753880B (zh) * 2020-05-27 2023-06-27 华东师范大学 一种规避对抗样本攻击的图像分类方法
CN111680593B (zh) * 2020-05-29 2023-03-24 西安电子科技大学 基于自适应一类svm模型的sar图像目标鉴别方法
CN112668718B (zh) * 2021-01-19 2023-07-18 北京市商汤科技开发有限公司 神经网络训练方法、装置、电子设备以及存储介质
CN115099294B (zh) * 2022-03-21 2024-07-19 昆明理工大学 一种基于特征增强和决策融合的花卉图像分类算法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060008150A1 (en) * 2004-07-07 2006-01-12 Samsung Electronics Co., Ltd. Apparatus for and method of feature extraction for image recognition
US20060198554A1 (en) * 2002-11-29 2006-09-07 Porter Robert M S Face detection
US20080130962A1 (en) * 2006-12-05 2008-06-05 Yongjin Lee Method and apparatus for extracting face feature
TW201039248A (en) * 2009-04-30 2010-11-01 Ind Tech Res Inst Method and system for identifying image and outputting identification result

Family Cites Families (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6990217B1 (en) 1999-11-22 2006-01-24 Mitsubishi Electric Research Labs. Inc. Gender classification with support vector machines
JP2001351104A (ja) * 2000-06-06 2001-12-21 Matsushita Electric Ind Co Ltd パターン認識方法及びパターン認識装置、並びにパターン照合方法及びパターン照合装置
US20030110038A1 (en) 2001-10-16 2003-06-12 Rajeev Sharma Multi-modal gender classification using support vector machines (SVMs)
US7082211B2 (en) 2002-05-31 2006-07-25 Eastman Kodak Company Method and system for enhancing portrait images
US7912246B1 (en) 2002-10-28 2011-03-22 Videomining Corporation Method and system for determining the age category of people based on facial images
GB2402536B (en) * 2003-06-05 2008-04-02 Canon Kk Image processing
US7551755B1 (en) * 2004-01-22 2009-06-23 Fotonation Vision Limited Classification and organization of consumer digital images using workflow, and face detection and recognition
US7715597B2 (en) * 2004-12-29 2010-05-11 Fotonation Ireland Limited Method and component for image recognition
TWI268453B (en) 2005-01-31 2006-12-11 Au Optronics Corp Image processing method
WO2006097902A2 (en) 2005-03-18 2006-09-21 Philips Intellectual Property & Standards Gmbh Method of performing face recognition
TWI281641B (en) 2005-10-18 2007-05-21 Au Optronics Corp Image sharpness method and device
TWI309947B (en) 2006-03-22 2009-05-11 Quanta Comp Inc Image processing apparatus and method of the same
CN100386778C (zh) 2006-06-15 2008-05-07 西安交通大学 基于平均脸和衰老比例图的人脸图像年龄变换方法
TWI330036B (en) 2006-10-27 2010-09-01 Quanta Comp Inc Apparatus for sharpening an image, and method thereof
US7773811B2 (en) * 2006-12-06 2010-08-10 D & S Consultants, Inc. Method and system for searching a database of graphical data
US20120264095A1 (en) * 2006-12-29 2012-10-18 Industrial Technology Research Institute Emotion abreaction device and using method of emotion abreaction device
CN101414348A (zh) * 2007-10-19 2009-04-22 三星电子株式会社 多角度人脸识别方法和系统
WO2010004958A1 (ja) * 2008-07-10 2010-01-14 日本電気株式会社 個人認証システム、個人認証方法
CN101419671B (zh) 2008-11-10 2011-05-18 北方工业大学 基于模糊支持向量机的人脸性别识别方法
CN101425138B (zh) 2008-11-18 2011-05-18 北京航空航天大学 一种基于人脸超分辨率处理的人脸老化模拟方法
US8351712B2 (en) * 2009-04-27 2013-01-08 The Neilsen Company (US), LLC Methods and apparatus to perform image classification based on pseudorandom features
CN101584575B (zh) 2009-06-19 2011-05-04 无锡骏聿科技有限公司 一种基于人脸识别技术的年龄评估方法
JP2011090466A (ja) * 2009-10-21 2011-05-06 Sony Corp 情報処理装置及び方法、並びにプログラム

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060198554A1 (en) * 2002-11-29 2006-09-07 Porter Robert M S Face detection
US20060008150A1 (en) * 2004-07-07 2006-01-12 Samsung Electronics Co., Ltd. Apparatus for and method of feature extraction for image recognition
US20080130962A1 (en) * 2006-12-05 2008-06-05 Yongjin Lee Method and apparatus for extracting face feature
TW201039248A (en) * 2009-04-30 2010-11-01 Ind Tech Res Inst Method and system for identifying image and outputting identification result

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI771250B (zh) * 2021-12-16 2022-07-11 國立陽明交通大學 用於降低資料維度的裝置及方法、用於轉換資料維度的裝置的操作方法

Also Published As

Publication number Publication date
TW201327418A (zh) 2013-07-01
US8818050B2 (en) 2014-08-26
US20130156301A1 (en) 2013-06-20

Similar Documents

Publication Publication Date Title
TWI467498B (zh) 影像識別方法及系統
Zhang et al. Multimodal learning for facial expression recognition
US9508001B2 (en) Note recognition and management using color classification
Lin Face detection in complicated backgrounds and different illumination conditions by using YCbCr color space and neural network
CN104050471B (zh) 一种自然场景文字检测方法及系统
Tian et al. Ear recognition based on deep convolutional network
Zhu et al. Real time face detection system using adaboost and haar-like features
JP2008159056A (ja) 画像中に生じる特徴の生成モデルによる分類
Hebbale et al. Real time COVID-19 facemask detection using deep learning
Zhao et al. Applying contrast-limited adaptive histogram equalization and integral projection for facial feature enhancement and detection
Elhassan et al. DFT-MF: Enhanced deepfake detection using mouth movement and transfer learning
Shrivastava et al. Conceptual model for proficient automated attendance system based on face recognition and gender classification using Haar-Cascade, LBPH algorithm along with LDA model
Singh et al. Feature based method for human facial emotion detection using optical flow based analysis
CN113076916B (zh) 基于几何特征加权融合的动态人脸表情识别方法及系统
KR101408344B1 (ko) 얼굴 검출 장치
Alankar et al. Facial emotion detection using deep learning and Haar Cascade Face Identification algorithm
Ma et al. Bottleneck feature extraction-based deep neural network model for facial emotion recognition
CN116343229A (zh) 挖掘边缘特征的自然场景盲文字符识别方法
Vivekanandam et al. Face recognition from video frames using hidden markov model classification model based on modified random feature extraction
Imran et al. Cursive handwritten segmentation and recognition for instructional videos
Ye et al. Cascaded convolutional neural network for eye detection under complex scenarios
Kane et al. Sign Language apprehension using convolution neural networks
Kesaulya et al. Javanese Script Text Image Recognition Using Convolutional Neural Networks
Doiphode et al. Classifying Facial Expression Using Support Vector Machine Based on Bidirectional Local Binary Pattern Histogram Feature Descriptor
Asthana et al. Frontal facial images based age classify via SVM