TWI711980B

TWI711980B - 表情辨識訓練系統及表情辨識訓練方法

Info

Publication number: TWI711980B
Application number: TW107104796A
Authority: TW
Inventors: 吳炳飛; 林俊賢; 鐘孟良
Original assignee: 國立交通大學
Priority date: 2018-02-09
Filing date: 2018-02-09
Publication date: 2020-12-01
Also published as: CN110135230A; TW201935317A; US10776614B2; CN110135230B; US20190251336A1

Abstract

一種表情辨識訓練系統包含訓練模組、特徵資料庫、擷取模組、辨識模組及調整模組。訓練模組根據已知臉部影像訓練表情特徵擷取模型。特徵資料庫儲存已知臉部影像的已知表情特徵。擷取模組連續擷取第一臉部影像，表情特徵擷取模型根據第一臉部影像輸出表情特徵。辨識模組比對表情特徵與已知表情特徵，並據此將表情特徵對應到已知表情特徵。調整模組調整表情特徵擷取模型，以縮小表情特徵與對應表情特徵徵的已知表情特徵之間的差值。

Description

表情辨識訓練系統及表情辨識訓練方法

本揭示文件係關於一種訓練系統及訓練方法，尤指一種表情辨識訓練系統及表情辨識訓練方法。

隨著科技的進步，臉部辨識的技術已經進展到表情辨識，也就是透過表情辨識系統可以辨識出臉部影像的各種表情，例如高興、吃驚、悲傷、憤怒、厭惡、驚喜及悲憤等。

習知表情辨識系統係透過機器學習，並利用大量的有標記的影像資料來訓練此表情辨識系統，藉以使此表情辨識系統能夠辨識出臉部影像的各種表情。換言之，此表情辨識系統在訓練好之後，除非再次給予有標記的影像資料來做訓練，基本上此表情辨識系統的參數不會再變動，因此若有未標記的影像資料輸入至此表情辨識系統，則此表情辨識系統有相當大的機率辨識錯誤。

本揭示文件係揭示一種表情辨識訓練系統以及表情辨識訓練方法。

本揭示文件的一種表情辨識訓練包含訓練模組、特徵資料庫、擷取模組、辨識模組及調整模組。訓練模組根據已知臉部影像訓練表情特徵擷取模型。特徵資料庫儲存已知臉部影像的已知表情特徵。擷取模組擷取第一臉部影像，表情特徵擷取模型根據第一臉部影像輸出第一臉部影像的表情特徵。辨識模組比對表情特徵與已知表情特徵，並據此將表情特徵對應到已知表情特徵其中一種已知表情特徵。調整模組調整表情特徵擷取模型，以縮小表情特徵與已知表情特徵之間的差值。

本揭示文件的一種表情辨識訓練方法包含根據已知臉部影像訓練表情特徵擷取模型。儲存已知臉部影像的已知表情特徵。擷取第一臉部影像，表情特徵擷取模型根據第一臉部影像輸出第一臉部影像的表情特徵。比對表情特徵與已知表情特徵，並據此將表情特徵對應到已知表情特徵其中一種已知表情特徵。調整表情特徵擷取模型，以縮小表情特徵與已知表情特徵之間的差值。

100‧‧‧表情辨識訓練系統

110‧‧‧訓練模組

111‧‧‧表情特徵擷取模型

120‧‧‧特徵資料庫

130‧‧‧擷取模組

140‧‧‧辨識模組

150‧‧‧調整模組

200‧‧‧表情辨識訓練系統

210‧‧‧訓練模組

211‧‧‧表情特徵擷取模型

220‧‧‧特徵資料庫

230‧‧‧擷取模組

240‧‧‧辨識模組

250‧‧‧調整模組

260‧‧‧影像校準模組

CP‧‧‧中心點

EL‧‧‧雙眼連線

FEF1‧‧‧表情特徵

FEF2‧‧‧表情特徵

FI1‧‧‧第一臉部影像

FI2‧‧‧第二臉部影像

HL‧‧‧水平線

KFEF‧‧‧已知表情特徵

KFEF1‧‧‧已知表情特徵

KFEF2‧‧‧已知表情特徵

KFI‧‧‧已知臉部影像

KP‧‧‧關鍵點

KP1‧‧‧第一關鍵點

NTEP‧‧‧鼻尖特徵點

RS‧‧‧基準面

M100‧‧‧方法

M200‧‧‧方法

S110~S160‧‧‧步驟

S210~S280‧‧‧步驟

為讓本揭示內容之上述和其他目的、特徵、優點與實施例能更明顯易懂，所附圖式之說明如下：第1圖為根據本揭示文件之一實施例所示之表情辨識訓練系統的功能方塊圖。

第2圖為根據本揭示文件之一實施例所示之表情辨識訓練方法的流程圖。

第3A圖為根據本揭示文件之一實施例所示之第一臉部影像的示意圖。

第3B圖為在第3A圖所示之第一臉部影像中標示關鍵點的示意圖。

第3C圖為依據第3B圖所示之關鍵點在第3A圖所示之第一臉部影像中框選表情特徵的示意圖。

第4圖為根據本揭示文件之另一實施例所示之表情辨識訓練系統的功能方塊圖。

第5圖為根據本揭示文件之另一實施例所示之表情辨識訓練方法的流程圖。

第6圖為第5圖所示的表情辨識訓練方法的步驟S240的進一步步驟的流程圖。

第7A圖為根據本揭示文件之一實施例所示之第一臉部影像與基準面的示意圖。

第7B圖為平移第7A圖所示之第一臉部影像以使得第一臉部影像中的鼻尖特徵點與基準面的中心點對齊的示意圖。

第7C圖為旋轉第7B圖所示之經平移的第一臉部影像以使得經平移的第一臉部影像的雙眼連線與基準面的水平線平行而形成第二臉部影像的示意圖。

第7D圖為在第7C圖所示之第二臉部影像中標示關鍵點的示意圖。

第7E圖為依據第7D圖所示之關鍵點在第7C圖所示之第二臉部影像中框選表情特徵的示意圖。

下文係舉實施例配合所附圖式作詳細說明，以更好地理解本案的態樣，但所供給之實施例並非用以限制本案所涵蓋的範圍，而結構操作之描述非用以限制其執行之順序，任何由元件重新組合之結構，所產生具有均等功效的裝置，皆為本案所涵蓋的範圍。

請參照第1圖，其為根據本揭示文件之一實施例所示之表情辨識訓練系統100的功能方塊圖。

表情辨識訓練系統100包含訓練模組110、特徵資料庫120、擷取模組130、辨識模組140以及調整模組150。

訓練模組110用以根據複數個已知臉部影像KFI訓練表情特徵擷取模型111。

於一實施例中，已知臉部影像KFI可包含具有各種表情的臉部影像，例如高興、吃驚、悲傷、憤怒、厭惡、驚喜及悲憤等。由於不同表情的已知臉部影像KFI具有不同的已知表情特徵KFEF，因此訓練模組110可依據不同的已知表情特徵KFEF而對已知臉部影像KFI進行訓練，進而得到相對應的表情特徵擷取模型111。舉例來說，若表情為高興的已知臉部影像KFI，則訓練模組110可根據已知臉部影像KFI的已知表情特徵KFEF，例如嘴巴特徵為嘴角上揚，而產生表情為高興的表情特徵擷取模型111；或者是，若表情為吃驚的已知臉部影像KFI，則訓練模組110可根據已知臉部影像KFI的已知表情特徵KFEF，例如嘴巴特徵為嘴巴張開，而產生表情為吃驚的表情特徵擷取模型111。

於一實施例中，表情特徵擷取模型111可為旋積神經網路(convolutional neural network)。

特徵資料庫120用以儲存已知臉部影像KFI的已知表情特徵KFEF，其中已知表情特徵KFEF可用特徵向量來表示，且對應不同表情的已知表情特徵KFEF具有不同的特徵向量範圍。舉例來說，表情為高興的已知表情特徵KFEF具有第一特徵向量範圍，而表情為吃驚的已知表情特徵KFEF具有第二特徵向量範圍，也就是說落在第一特徵向量範圍中的特徵向量即表示對應此特徵向量的已知臉部影像KFI之表情為高興的，而落在第二特徵向量範圍中的特徵向量即表示對應此特徵向量的已知臉部影像KFI之表情為吃驚的。

擷取模組130用以連續擷取複數個第一臉部影像FI1，該些第一臉部影像FI1可包含具有各種表情的臉部影像，例如高興、吃驚、悲傷、憤怒、厭惡、驚喜及悲憤等。

於一實施例中，擷取模組130可為相機、攝影機或錄影機等。

表情特徵擷取模型111可根據第一臉部影像FI1輸出表情特徵FEF1，其中表情特徵FEF1對應第一臉部影像FI1。換言之，第一臉部影像FI1經過表情特徵辨識模型111的辨識之後，可輸出第一臉部影像FI1的表情特徵FEF1。舉例來說，當高興、吃驚、悲傷、憤怒、厭惡、驚喜及悲憤等的第一臉部影像FI1經過表情特徵擷取模型111的辨識之後，表情特徵擷取模型111可輸出高興、吃驚、悲傷、憤怒、厭惡、驚喜及悲憤等的表情特徵FEF1。

辨識模組140用以比對表情特徵FEF1與已知表情特徵KFEF，並據此將表情特徵FEF1對應到已知表情特徵KFEF。以一個表情特徵FEF1為例，辨識模組140從已知表情特徵KFEF中找出與該表情特徵FEF1的特徵向量最接近的已知表情特徵KFEF的特徵向量，並求出該表情特徵FEF1的特徵向量與所找出的已知表情特徵KFEF的特徵向量之間的差值。因此，其餘的表情特徵FEF1亦可依照相同方式求出與其特徵向量最接近的已知表情特徵KFEF的特徵向量，並分別求其餘的表情特徵FEF1與所找出的已知表情特徵KFEF的特徵向量之間的差值。進一步地，再將所求出的所有差值經過計算後並加總，即可得到一數值。再者，當該數值接近最小值時，表情特徵擷取模型111即可被建立。

調整模組150用以調整表情特徵擷取模型111，以縮小表情特徵FEF1與已知表情特徵KFEF1之間的差值。

應注意的是，訓練模組110、特徵資料庫120、擷取模組130、辨識模組140以及調整模組150可用硬體、軟體、韌體或其組合來體現。

請一併參照第1圖及第2圖。第2圖為根據本揭示文件之一實施例所示之表情辨識訓練方法M100的流程圖。第2圖所示之表情辨識訓練方法M100可應用於第1圖所示之表情辨識訓練系統100中。

於步驟S110中，訓練模組110根據複數個已知臉部影像KFI訓練表情特徵擷取模型111。

於步驟S120中，特徵資料庫120儲存已知臉部影像KFI的已知表情特徵KFEF，例如表情為高興或吃驚的已知表情特徵KFEF。

於步驟S130中，擷取模組130擷取第一臉部影像FI1。具體來說，請一併參照第3A圖，其為根據本揭示文件之一實施例所示之第一臉部影像FI1的示意圖。應注意的是，第3A圖僅以一個第一臉部影像FI1作為示例。

如第3A圖所示，第一臉部影像FI1係以表情為高興的臉部影像作為示例。

於步驟S140中，表情特徵擷取模型111可根據第一臉部影像FI1輸出第一臉部影像FI1的表情特徵FEF1。具體來說，請一併參照第3B圖及第3C圖，第3B圖為在第3A圖所示之第一臉部影像FI1中標示關鍵點KP的示意圖，第3C圖為依據第3B圖所示之關鍵點KP在第3A圖所示之第一臉部影像FI1中框選表情特徵FEF1的示意圖。

如第3B圖所示，第一臉部影像FI1可藉由臉部辨識技術而將左眉、右眉、左眼、右眼、嘴巴、額頭、鼻子及臉部輪廓標示出對應的關鍵點KP；接著，由於第一臉部影像FI1並非正的，因此需要進一步根據鼻尖與雙眼連線而將關鍵點KP進行旋轉與平移的校準；最後，再利用橢圓回歸來去除背景者或其他不需要的特徵，藉以將臉部切割出來，並在關鍵點KP中選定第一關鍵點KP1。具體來說，於本實施例中，第一關鍵點 KP1的數量有十一個，左眉處與右眉處分別具有三個、左眼處與右眼處分別具有一個以及嘴巴處具有三個。應注意的是，第3B圖所示之關鍵點KP及第一關鍵點KP1的數量及位置僅為示例，並不以此為限。

此外，如第3C圖所示，可藉由左眉、右眉、左眼、右眼及嘴巴的第一關鍵點KP1的標示，使得表情特徵擷取模型111可根據第一關鍵點KP1而在第一臉部影像FI1中框選表情特徵FEF1，其中表情特徵FEF1包含左眉特徵、右眉特徵、左眼特徵、右眼特徵及嘴巴特徵。

再者，由於第一臉部影像FI1為高興表情，因此表情特徵FEF1的左眉特徵、右眉特徵、左眼特徵、右眼特徵及嘴巴特徵應符合高興表情的特徵，例如嘴巴特徵為嘴角上揚狀態。當嘴巴特徵為嘴較上揚狀態時，表示相較於無表情時標示於嘴巴嘴角處的第一關鍵點KP1的位置將向上移動。

於步驟S150中，辨識模組140比對表情特徵FEF1與已知表情特徵KFEF，並據此將表情特徵FEF1對應到已知表情特徵KFEF其中一種已知表情特徵KFEF1。具體來說，由於表情特徵FEF1為符合高興表情的特徵，因此辨識模組140將自特徵資料庫120的已知表情特徵KFEF中選擇符合高興表情的特徵的已知表情特徵KFEF1，其中表情特徵FEF1與已知表情特徵KFEF1之間係具有差值而不完全相同。簡言之，表情特徵FEF1與已知表情特徵KFEF1皆為符合高興表情的特徵，然兩者具有些微的差值，例如表情特徵FEF1與已知表情特徵 KFEF1的嘴巴特徵皆為嘴角上揚狀態，然上揚的幅度並不完全相同。

於步驟S160中，調整模組150調整表情特徵擷取模型111，以縮小表情特徵FEF1與已知表情特徵KFEF1之間的差值。詳言之，可藉由隨機梯度下降法(stochastic gradient descent,SCD)調整表情特徵擷取模型111的相關參數，以縮小表情特徵FEF1與已知表情特徵KFEF1之間的差值。

經過調整後的表情特徵擷取模型111可將需要進行表情特徵辨識的臉部影像進行更精確的表情辨識，藉以讓調整後的表情特徵擷取模型111所擷取出來的表情特徵FEF1可以和特徵資料庫120裡的已知表情特徵KFEF1越接近越好，以達成適應性之目的。

藉此，表情特徵擷取模型111在每一次對未標記的臉部影像進行表情特徵辨識時，調整模組150將會相應地調整表情特徵擷取模型111的參數，以使得表情特徵擷取模型111持續被訓練，進而提高表情特徵擷取模型111的表情特徵辨識能力，而達到適應性、個人化之目的；此外，更具有可線上調整表情特徵擷取模型111的參數之功效；再者，也不易產生概念漂移的問題。

再請參閱第4圖，其為根據本揭示文件之另一實施例所示之表情辨識訓練系統200的功能方塊圖。

表情辨識訓練系統200包含訓練模組210、特徵資料庫220、擷取模組230、辨識模組240、調整模組250以及影像校準模組260。

訓練模組210用以根據複數個已知臉部影像 KFI訓練表情特徵擷取模型211。

於一實施例中，表情特徵擷取模型211可為旋積神經網路(convolutional neural network)。

特徵資料庫220用以儲存已知臉部影像KFI的已知表情特徵KFEF。

擷取模組230用以擷取第一臉部影像FI1。

於一實施例中，擷取模組230可為相機、攝影機或錄影機等。

影像校準模組260用以相對於基準面而調正及銳利化第一臉部影像FI1以形成第二臉部影像FI2。

表情特徵擷取模型211可根據第二臉部影像FI2輸出第二臉部影像FI2的表情特徵FEF2。換言之，第二臉部影像FI2經過表情特徵擷取模型211的辨識之後，可輸出第二臉部影像FI2的表情特徵FEF2。

辨識模組240用以比對表情特徵FEF2與已知表情特徵KFEF，並據此將表情特徵FEF2對應到已知表情特徵KFEF其中一種已知表情特徵KFEF2。

調整模組250用以調整表情特徵擷取模型211，以縮小第二臉部影像FI2的表情特徵FEF2與已知表情特徵KFEF2之間的差值。

應注意的是，訓練模組210、特徵資料庫220、擷取模組230、辨識模組240、調整模組250以及影像校準模組260可用硬體、軟體、韌體或其組合來體現。

請一併參照第4圖及第5圖，第4圖為根據本揭示文件之另一實施例所示之表情辨識訓練系統200的功能方塊圖。第5圖為根據本揭示文件之另一實施例所示之表情辨識訓練方法M200的流程圖。

表情辨識訓練方法M200的步驟S210至步驟S230與表情辨識訓練方法M100的步驟S110至步驟S130大致相同，故不另贅述。以下將僅說明步驟S240至步驟S280。

於步驟S240中，影像校準模組260相對於基準面RS而調正第一臉部影像FI1以形成第二臉部影像FI2。進一步地，請一併參照第6圖，其為第5圖所示的表情辨識訓練方法M200的步驟S240的進一步步驟的流程圖。

步驟S240包含步驟S241以及步驟S242。

於步驟S241中，影像校準模組260相對於基準面RS平移第一臉部影像FI1以使得第一臉部影像FI1的鼻尖特徵點NTEP與基準面RS的中心點CP對齊。具體來說，請一併參照第7A圖及第7B圖，第7A圖為根據本揭示文件之一實施例所示之第一臉部影像FI1與基準面RS的示意圖，第7B圖為平移第7A圖所示之第一臉部影像FI1以使得第一臉部影像FI1中的鼻尖特徵點NTEP與基準面RS的中心點CP對齊的示意圖。

如第7A圖所示，第一臉部影像FI1係以表情為高興的臉部影像作為示例，且第一臉部影像FI1鼻尖特徵點NTEP以及雙眼連線EL，鼻尖特徵點NTEP係位於鼻尖處，雙眼連線EL為穿過雙眼的線。基準面RS為與第一臉部影像 FI1重疊的面，基準面RS具有中心點CP以及穿過中心點CP的水平線HL。

如第7B圖所示，影像校準模組260平移第一臉部影像FI1，以使得第一臉部影像FI1的鼻尖特徵點NTEP與基準面RS的中心點CP對齊。

於步驟S242中，影像校準模組260旋轉經平移的第一臉部影像FI1以使得經平移的第一臉部影像FI1的雙眼連線EL與基準面RS的水平線HL平行。具體來說，請一併參照第7C圖，其為旋轉第7B圖所示之經平移的第一臉部影像FI1以使得經平移的第一臉部影像FI1的雙眼連線EL與基準面RS的水平線HL平行而形成第二臉部影像FI2的示意圖。

如第7C圖所示，經平移及旋轉的第一臉部影像FI1形成第二臉部影像FI2。

於步驟S250中，影像校準模組260利用鄰近-中心差分影像法(neighbor-center difference images,NCDIs)銳利化第二臉部影像FI2。詳言之，影像校準模組260將第二臉部影像FI2中的每一個像素對其周圍的八個像素進行差運算而銳利化第二臉部影像FI2。

於步驟S260中，表情特徵擷取模型211可根據經銳利化的第二臉部影像FI2輸出表情特徵FEF2。具體來說，請一併參照第7D圖及第7E圖，第7D圖為在第7C圖所示之第二臉部影像FI2(尤指經銳利化的第二臉部影像FI2)中標示關鍵點KP的示意圖，第7E圖為依據第7D圖所示之關鍵點KP在第7C圖所示之第二臉部影像FI2中框選表情特徵FEF2的示意圖。

如第7D圖所示，表情特徵擷取模型211可藉由臉部的輪廓及五官的特性而在第二臉部影像FI2上標示出複數個關鍵點KP，例如在第二臉部影像FI2的左眉、右眉、左眼、右眼、嘴巴、額頭、鼻子及臉部輪廓等皆標示有對應的關鍵點KP，並利用橢圓回歸在關鍵點KP中選定第一關鍵點KP1。進一步地，於本實施例中，第一關鍵點KP1的數量有十一個，左眉處與右眉處分別具有三個、左眼處與右眼處分別具有一個以及嘴巴處具有三個。應注意的是，第7D圖所示之關鍵點KP及第一關鍵點KP1的數量及位置僅為示例，並不以此為限。

此外，如第7D圖所示，可藉由左眉、右眉、左眼、右眼及嘴巴的第一關鍵點KP1的標示，而在第二臉部影像FI2中框選表情特徵FEF2，其中表情特徵FEF2包含左眉特徵、右眉特徵、左眼特徵、右眼特徵及嘴巴特徵。

再者，由於第二臉部影像FI2為高興表情，因此表情特徵FEF2的左眉特徵、右眉特徵、左眼特徵、右眼特徵及嘴巴特徵應符合高興表情的特徵，例如嘴巴特徵為嘴角上揚狀態。當嘴巴特徵為嘴較上揚狀態時，表示相較於無表情時標示於嘴巴嘴角處的第一關鍵點KP1的位置將向上移動。

於步驟S270中，辨識模組240比對表情特徵FEF2與已知表情特徵KFEF，並據此將表情特徵FEF2對應到已知表情特徵KFEF其中一種已知表情特徵KFEF2。具體來說，由於表情特徵FEF2為符合高興表情的特徵，因此辨識模組240將自特徵資料庫220的已知表情特徵KFEF中選擇符合高興表情的特徵的已知表情特徵KFEF2，其中表情特徵FEF2與已知表情特徵KFEF2之間係具有差值而不完全相同。簡言之，表情特徵FEF2與已知表情特徵KFEF2皆為符合高興表情的特徵，然兩者具有些微的差值，例如表情特徵FEF2與已知表情特徵KFEF2的嘴巴特徵皆為嘴角上揚狀態，然上揚的幅度並不完全相同。

於步驟S280中，調整模組250調整表情特徵擷取模型211，以縮小表情特徵FEF2與已知表情特徵KFEF2之間的差值。詳言之，可藉由隨機梯度下降法調整表情特徵擷取模型211的相關參數，以縮小表情特徵FEF2與已知表情特徵KFEF2之間的差值。

經過調整後的表情特徵擷取模型211可將需要進行表情特徵辨識的臉部影像進行更精確的表情辨識，藉以讓調整後的表情特徵擷取模型211所擷取出來的表情特徵FEF2可以和特徵資料庫220裡的已知表情特徵KFEF2越接近越好，以達成適應性之目的。

藉此，表情特徵擷取模型211在每一次對未標記的臉部影像進行表情特徵辨識時，調整模組250將會相應地調整表情特徵擷取模型211的參數，以使得表情特徵擷取模型211持續被訓練，進而提高表情特徵擷取模型211的表情特徵辨識能力，而達到適應性、個人化之目的；此外，更具有可線上調整表情特徵擷取模型211的參數之功效；再者，也不易產生概念漂移的問題。

綜上所述，本揭示文件的表情辨識訓練系統藉由訓練模組、特徵資料庫、擷取模組、辨識模組以及調整模組，而使得表情特徵擷取模型可以持續被訓練，進而提高表情特徵擷取模型的表情特徵辨識能力，而達到適應性、個人化之目的，更具有可線上調整表情特徵擷取模型的參數之功效；再者，也不易產生概念漂移的問題。

雖然本案已以實施例揭露如上，然其並非用以限定本案，任何所屬技術領域中具有通常知識者，在不脫離本案之精神和範圍內，當可作些許之更動與潤飾，故本案之保護範圍當視後附之申請專利範圍所界定者為準。