TWI614723B

TWI614723B - 基於人體動作影像的分析系統

Info

Publication number: TWI614723B
Application number: TW105143765A
Authority: TW
Inventors: 王駿發; 歐陽諺; 邱正平; 蔡安朝; 官大文
Original assignee: 大仁科技大學
Priority date: 2016-12-29
Filing date: 2016-12-29
Publication date: 2018-02-11
Also published as: TW201824181A

Abstract

一種基於人體動作影像的分析系統，以鄰近該影像之各該第一階層鄰近點與其對應之該些第二階層鄰近點之間的相關性計算各個類別的權重分數，由於高離散性之第一階層鄰近點的相關值較低，因此能降低其對應之類別權重分數，而降低誤判的可能性。

Description

基於人體動作影像的分析系統

本發明是關於一種分析系統，特別是關於一種基於人體動作影像的分析系統。

情感判讀(Emotion understanding)系統為目前人機介面(Human-machine interface)致力發展的研究之一，通常是藉由捕捉人體說話的聲音、影像或其他生理訊號進行分析，以判讀人體可能的情感為何。其中，情感判讀系統是擷取預定情感的所對應之生理訊號的特徵加以分類訓練，而得一情感訓練資料庫，而在人機介面捕捉人體的生理訊號後，情感判讀系統利用生理訊號之特徵將其分類至情感訓練資料庫中，即可判別人體的情感。因此如何正確的將生理訊號分類至該情感資料庫中，為情感判讀系統的重要核心，常見的分類方式為最近鄰居法( KNearest-Neighbor, KNN)，其藉由計算出鄰近目標生理特徵的 K個鄰近點後，以多數決的方式判別目標生理特徵屬於哪個類別，但最近鄰居法應用在高離散度的資料庫中容易出現誤判的情形。

本發明的主要目的在於透過運算單元以階層相關之最近鄰居法(Hierarchy-coherence KNearest-Neighbor)對影像擷取裝置截取之影像進行分類，不僅利用鄰近目標生理特徵的第一階層鄰近點，還利用鄰近第一階層鄰近點的第二階層鄰近點進行判讀，藉由兩階層之鄰近點間的相關值作為分類權重值的一部分，可有效地解決高離散度資料庫所造成誤判錯誤的問題。

本發明之一種基於人體動作影像的分析系統包含一影像擷取裝置及一運算單元，該影像擷取裝置用以擷取一影像，該運算單元由該影像擷取裝置接收該影像，其中該運算單元具有一訓練樣本資料庫，該訓練樣本資料庫具有複數個第一訓練樣本及複數個第二訓練樣本，該運算單元計算該影像與該些第一訓練樣本及該些第二訓練樣本之間的一第一距離，並取出 K個具有最短之該第一距離的該第一訓練樣本或第二訓練樣本作為個第一階層鄰近點，該運算單元計算各該第一階層鄰近點與該些第一訓練樣本及該些第二訓練樣本之間的一第二距離，並取出 L個具有最短之該第二距離的該第一訓練樣本或該第二訓練樣本作為各該第一階層鄰近點對應之複數個第二階層鄰近點，該運算單元根據各該第一階層鄰近點及對應之該些第二階層鄰近點計算各該第一階層鄰近點的一相關值，並根據各該第一階層鄰近點及該相關值決定該影像屬於該些第一訓練樣本對應之一表情或該些第二訓練樣本對應之一表情。

本發明藉由改良式最近鄰居法：階層相關之最近鄰居法進行影像的分類，以鄰近該影像之各該第一階層鄰近點與其對應之該些第二階層鄰近點之間的相關性來決定該影像是屬於哪個訓練樣本所對應之表情類別，藉此能降低高離散性之資料的相關值，使該類別之權重分數較低，而降低誤判的可能性。

請參閱第1圖，為本發明之一種基於人體動作影像的分析系統100的功能方塊圖，在本實施例中，是以人體動作影像中的臉部特徵分析該人體的臉部表情，其中該人體動作影像的分析系統100包含一影像擷取裝置110及一運算單元120，該影像擷取裝置110可為相機、攝影機等等可捕捉人體影像的裝置，該影像擷取裝置110用以擷取人體的一影像Ima，該運算單元120耦接該運算單元120，以由該影像擷取裝置110接收該影像Ima。在本實施例中，該運算單元120具有一顯著特徵處理單元121、兩主成分分析122、123、一表情分類器124、一訓練樣本資料庫125及一臉部表情識別模組126。

請參閱第2圖，在本實施例中，該顯著特徵處理單元121包含一哈爾特徵模組121a(Harr-like module)、一顯著特徵擷取模組121b、一灰階/正規化模組121c及一影像傾斜調整模組121d，該哈爾特徵模組121a用以偵測該影像Ima中的臉部影像，該顯著特徵擷取模組121b用以擷取一特性區域的特徵，其中該特性區域可為眉毛、眼睛、鼻子或嘴巴，該灰階/正規化模組121c用以將該影像Ima轉為灰階及正規化(Normalization)，以簡化該影像Ima的編程並減少資料的冗餘，該影像傾斜調整調整模組121d用以調整該影像Ima的傾斜角度，使得訓練之該影像Ima及分析之該影像Ima的角度相同，而利於後續之分析。

其中，由於用來訓練之該影像Ima通常不會有角度傾斜的問題，因此，在其他實施例中，可直接取用未經該影像傾斜調整模組121d處理之該影像Ima進行訓練。

請參閱第2圖，於該運算單元120的後端可區分為訓練部分及分析部分，該主成分分析122、123分別位於訓練部分及分析部分，以對該影像Ima進行一主成分分析(Principal component analysis)之處理，降低該影像Ima的維度，其中，用以訓練之該影像Ima_T及用以分析之該影像Ima_A分別傳送至該主成分分析122及123。該表情分類器124接收經該主成分分析122處理之用以訓練之該影像Ima_T，以根據其特徵值進行分類並儲存於該訓練樣本資料庫125中。請參閱第3圖，為該訓練樣本資料庫125的一示意圖，其中不同形狀之單元代表著不同類別之表情，在本實施例中，該訓練樣本資料庫125具有複數個第一訓練樣本(圖中以三角形符號表示)及複數個第二訓練樣本(圖中以圓形符號表示)，較佳的，該訓練樣本資料庫125另具有複數個正常訓練樣本(圖中以正方形表示)，該些正常訓練樣本對應人體不做任何表現之表情，該些正常訓練樣本定義有一中心C，該些正常訓練樣本所定義之該中心C用以確保後續分析步驟中所採用之鄰近點較該中心C鄰近該目標特徵。

必須說明的是，在本實施例中僅列舉兩種訓練樣本是利於後續之說明，訓練樣本的類別數量並非本發明所限制。

請參閱第1圖，該臉部表情識別模組126耦接該主成分分析123及該訓練樣本資料庫125，以接收經該主成分分析123處理之用以分析之該影像Ima_A，並由該訓練樣本資料庫125接收該些訓練樣本的資訊，以進行該影像Ima_A的分析。

請參閱第4至6圖，為該臉部表情識別模組126對該影像Ima_A進行分析的示意圖，請參閱第4圖，為該影像Ima_A與其他訓練樣本位置分布的示意圖，首先，該臉部表情識別模組126計算該影像Ima_A與該些第一訓練樣本及該些第二訓練樣本之間的一第一距離D1，並計算該影像Ima_A與該中心C之間的一動態距離DT，在本實施例中，該第一距離D1及該動態距離DT為歐式距離(Euclidean distance)。接著，請參閱第5圖，該臉部表情識別模組126取出 K個具有最短之該第一距離D1的該第一訓練樣本或第二訓練樣本作為 K個第一階層鄰近點F，其中 K為正整數，由使用者自行設定，在本實施例中， K設定為4。此外，較佳的，取出 K個具有最短之該第一距離D1的該第一訓練樣本或第二訓練樣本作為複數個第一階層鄰近點F時，僅採用該第一距離D1小於該動態距離DT之該第一訓練樣本或第二訓練樣本作為該些第一階層鄰近點F，藉此，能確保所選取之第一階層鄰近點F較些該正常訓練樣本之該中心C接近該影像Ima_A，以避免該影像Ima_A為不做任何表現之表情卻被誤判為其中之一訓練樣本對應之表情。在第5圖中，是取出兩個第一訓練樣本及兩個第二訓練樣本作為該第一階層鄰近點F，該第一階層鄰近點F以粗體線條表示。

接著，請參閱第6圖，以其中之一個第一階層鄰近點F為例，該臉部表情識別模組126計算各該第一階層鄰近點F與該些第一訓練樣本及該些第二訓練樣本之間的一第二距離D2，並取出 L個具有最短之該第二距離D2的該第一訓練樣本或該第二訓練樣本作為各該第一階層鄰近點F對應之複數個第二階層鄰近點S，在本實施例中，該第二距離D2為歐式距離(Euclidean distance)，此外， L為正整數，亦由使用者自行設定，在本實施例中， L 與 K相同設定為4。在第6圖中，其中之一第一階層鄰近點F是取出3個第一訓練樣本及1個第二訓練樣本作為該第二階層鄰近點S，該第二階層鄰近點S以粗體線條表示，由於該第一階層鄰近點F是屬於該第二訓練樣本，可知該第一階層鄰近點F的相關性並不高。該臉部表情識別模組126根據各該第一階層鄰近點F及對應之該些第二階層鄰近點S計算各該第一階層鄰近點 F的一相關值，該相關值的計算式為：

其中

為第 i個第一階層鄰近點F的該相關值，

為正整數，

為第 i個第一階層鄰近點，

為第 i個第一階層鄰近點之第 j個第二階層鄰近點。由上述之計算式能得知，若各該第一階層鄰近點F與對應之該第階層二鄰近點S為相同的類別時，其相關值會越高，但若各該第一階層鄰近點F與對應之該第階層二鄰近點S為相異的類別時，其相關值會越低。

最後，該臉部表情識別模組126根據各該第一階層鄰近點F及該相關值決定該影像Ima屬於該些第一訓練樣本對應之表情類別或該些第二訓練樣本對應之表情類別，在本實施例中，是藉由一權重計算式決定該影像Ima是屬於該些第一訓練樣本對應之該表情或該些第二訓練樣本對應之該表情，該權重計算式為：

其中，

為第 r種訓練樣本的一權重分數，

為訓練樣本的類別數量，而該權重分數最高的訓練樣本對應之表情類別則決定為該影像Ima所屬之表情類別，並由該臉部表情識別模組126輸出一臉部表情鑑別訊號FE。

由上述可知，由於該權重計算式的計算加入了各該第一階層鄰近點F的該相關值，因此，該權重分數的高低不僅僅取決於各該第一階層鄰近點F所屬類別的多寡，還要視各該第一階層鄰近點F與其鄰近之第二階層鄰近點S的相關性決定，因此，可應用於具有高離散性之資料庫，以解決高離散之資料導致誤判的情形。

本發明藉由改良式最近鄰居法：階層相關之最近鄰居法進行影像的分類，以鄰近該影像之各該第一階層鄰近點與其對應之該些第二階層鄰近點之間的相關性計算各個類別的權重分數，由於高離散性之第一階層鄰近點的相關值較低，因此能降低其對應之類別的權重分數，而降低誤判的可能性。

本發明之保護範圍當視後附之申請專利範圍所界定者為準，任何熟知此項技藝者，在不脫離本發明之精神和範圍內所作之任何變化與修改，均屬於本發明之保護範圍。

100‧‧‧基於人體動作影像的分析系統

110‧‧‧影像擷取裝置

120‧‧‧運算單元

121‧‧‧顯著特徵處理單元

121a‧‧‧哈爾特徵模組

121b‧‧‧顯著特徵擷取模組

121c‧‧‧灰階/正規化模組

121d‧‧‧影像傾斜調整模組

122‧‧‧主成分分析

123‧‧‧主成分分析

124‧‧‧表情分類器

125‧‧‧訓練樣本資料庫

126‧‧‧臉部表情識別模組

Ima‧‧‧影像

C‧‧‧中心

Ima_A‧‧‧分析之影像

Ima_T‧‧‧訓練之影像

D1‧‧‧第一距離

D2‧‧‧第二距離

DT‧‧‧動態距離

FE‧‧‧臉部表情鑑別訊號

F‧‧‧第一階層鄰近點

S‧‧‧第二階層鄰近點

第1圖：依據本發明之一實施例，一種基於人體動作影像的分析系統的功能方塊圖。第2圖：依據本發明之一實施例，一顯著特徵處理單元的功能方塊圖。第3圖：依據本發明之一實施例，正常、第一及第二訓練樣本分布的示意圖。第4至6圖：依據本發明之一實施例，一影像進行分析的示意圖。