TWI698807B

TWI698807B - 以類別為基礎修剪之人工類神經網路

Info

Publication number: TWI698807B
Application number: TW106136613A
Authority: TW
Inventors: 羅賓賽柏德; 陳建單; 漢納畢卓文多堤爾; 馬丁樂容維斯特
Original assignee: 瑞典商安訊士有限公司
Priority date: 2016-12-21
Filing date: 2017-10-25
Publication date: 2020-07-11
Also published as: JP2018129033A; KR102110486B1; US20180181867A1; US10552737B2; KR20180072562A; EP3340129B1; JP6755849B2; EP3340129A1; TW201824093A; CN108229667B; CN108229667A

Abstract

本發明揭示包含電腦程式產品的實施及使用用於將一人工類神經網路組態至一特定監視情景之技術的方法及設備。選擇該監視情景特有之若干個物件類別。該等物件類別形成訓練該人工類神經網路所針對的總數目個物件類別之一子集。存取包含該人工類神經網路內之神經元之啟動頻率值的一資料庫。該等啟動頻率值隨該物件類別而變化。自該人工類神經網路移除具有比選定物件類別之該子集之一臨限值低的啟動頻率值之彼等神經元。

Description

以類別為基礎修剪之人工類神經網路

本發明係關於人工類神經網路，且更特定而言係關於用於物件辨識及驗證之人工類神經網路。近年來，對此等人工類神經網路之改良很大程度上歸因於網路擴充及訓練資料之一增加。然而，複雜人工類神經網路架構通常含有數以千萬或數以億計之參數。雖然此等人工類神經網路產生良好準確度，但大量參數可使部署不可行，尤其在通常具有有限運算能力之嵌入式系統上。作為人工類神經網路之增加大小之一結果，愈來愈關注壓縮人工類神經網路以便維持改良同時使其在具有有限運算能力之系統中實施係可行的。

由於人工類神經網路通常係非常大的，如上文所提及，因此其經常可係「過參數化的」。此使得可能在不顯著影響人工類神經網路之效能之情況下移除諸如權重及偏壓之參數或者全部神經元。此程序通常稱為「修剪」人工類神經網路。當移除一神經元時，可能追溯針對彼神經元之計算。然後可看到，可安全地移除通向彼神經元之所有權重。亦可能追蹤神經元輸出且移除自彼神經元出發之權重。然而，識別在修剪過程中將移除哪些神經元及以使得可獲得效能之一方式實施修剪過程係重要的。

修剪可應用於含有可訓練參數之層，傳統上經完全連接層及卷積層。此有助於簡化且加速計算。舉例而言，自一經完全連接層移除一神經元等效於略過一矩陣列與一向量之間的一點積。因此，矩陣變小。自一卷積層移除一神經元意味略過一個矩陣列與一個矩陣行之間的點積，此與略過一個卷積相同。將在下文之詳細說明書中進一步詳細地論述神經元之移除。可藉由以下操作而判定可在不嚴重影響人工類神經網路之準確度之情況下移除哪些神經元：在訓練/測試階段期間分析神經元；及依據所得資料識別哪些神經元係「無效的」，亦即，哪些神經元極少或從不產生非零輸出。可藉由使用不同臨限值比較效能而決定一神經元必須產生非零輸出以不定義為無效之次數，且在已移除神經元之後可進行一再訓練以便改良效能。可反覆地進行此操作。

用於修剪之另一方法集中於已在訓練步驟期間移除權重(使用一臨限值或使用具有範數之正則化迫使某些權重為零)。正則化係熟習此項技術者眾所周知之一數學/統計方法，該數學/統計方法用於執行條件，舉例而言稀疏(迫使某些值為零)或平滑。針對關於用於修剪之正則化之進一步細節，參見可在網上查閱之論文：「Memory bounded deep convolutional networks」arXiv CoRR 2014-第3節：Regularization Updates，網址為https：//arxiv.org/abs/1412.1442。

藉由關於可避免針對經移除參數之計算之一實施方案以此等方式充分地修剪一人工類神經網路，用於執行人工類神經網路之運算少於用於一全網路之運算。

本發明之一目標係完全地或部分地消除以上問題。

根據一第一態樣，本發明係關於一種在一電腦系統中用於將一人工類神經網路組態至一特定監視情景之方法。該方法由以下各項之步驟表徵：- 選擇該監視情景特有之若干個物件類別，其中該等物件類別形成訓練該人工類神經網路所針對的總數目個物件類別之一子集；- 存取包含該人工類神經網路內之神經元之啟動頻率值的一資料庫，其中該等啟動頻率值隨該物件類別而變化；及- 自該人工類神經網路移除具有比選定物件類別之該子集之一臨限值低的啟動頻率值之彼等神經元。

此提供形成輕量且因此適合用於嵌入式裝置(諸如攝影機或行動裝置)之一人工類神經網路之一方式。特定而言，藉由知曉可預期僅幾個類別(亦即，所有可能類別之一子集)且基於神經元使用之頻率而將人工類神經網路修剪至彼等類別，可能視需要且在不必須再訓練人工類神經網路之情況下使一大的人工類神經網路適應於不同先決條件，如習用地操作。再訓練一人工類神經網路通常既需要顯著時間量，又需要用於再訓練之新資料，而將該人工類神經網路修剪至一特定類別集合係一快得多之操作。進一步地，此方法可與其他習用方法(例如，使用定限或將權重正則化至零)組合使用以可能移除甚至更大數目個神經元且甚至進一步降低用於將人工類神經網路部署在嵌入式裝置中之運算效能。

根據一項實施例，該臨限值係在該人工類神經網路之一訓練程序期間針對每一類別判定之一靜態值。藉由針對不同相關類別允許不同臨限值，可能改良系統之準確度(與在跨越板針對每一相關類別使用相同臨限值之情況下相比較)。

根據一項實施例，基於系統效能，該臨限值針對每一類別係自適應的。藉由具有基於系統效能之一自適應臨限值，可基於自其中部署有該系統之一實際監視情景獲得之資料而進一步增強該系統。

根據一項實施例，可基於在一特定時間週期內收集之資料而精細化對該監視情景特有之物件類別之該選擇，且可針對對物件類別之該精細化選擇而重複該等選擇、存取及移除步驟。此允許基於真實觀察資料及系統效能評估而對系統進行進一步精細化及精細調諧。

根據一項實施例，回應於透過一使用者介面接收之一使用者輸入而執行該等選擇、存取及移除步驟中之至少某些步驟。具有一使用者介面允許使用者對比基於來自使用者之輸入而決定修剪應被自動化之程度。舉例而言，使用者可決定添加或刪除相關類別、改變個別類別之臨限值等以便進一步改良經修剪人工類神經網路之功能化。

根據一項實施例，移除一經完全連接人工類神經網路中之神經元與自形成該人工類神經網路之個別層之數學表示之矩陣移除列及行對應。藉由移除全部神經元(與僅移除權重相反)，在計算來自該人工類神經網路之輸出中所需要之運算數目可顯著減少。

根據一項實施例，自該人工類神經網路移除神經元包含：移除充足數目個神經元使得計算來自該人工類神經網路之輸出所需要之運算資源之一減少勝過維持關於該等經移除神經元之記錄所需要之運算資源之一增加。亦即，可找到一損益平衡點，其中該人工類神經網路之修剪使得所需要運算資源與未修剪網路相比較低得多，因此使部署在嵌入式裝置中為適合的，同時人工類神經網路之效能保持為高。

根據一項實施例，該人工類神經網路部署在一嵌入式裝置中。該嵌入式裝置可係(舉例而言)一監視攝影機或一蜂巢式電話。藉由能夠在此類型之嵌入式裝置中使用人工類神經網路，可顯著增強該等嵌入式裝置之操作。

根據一第二態樣，本發明係關於一種用於將一人工類神經網路組態至一特定監視情景之電腦程式。該電腦程式含有與以下各項之步驟對應之指令：- 選擇該監視情景特有之若干個物件類別，其中該等物件類別形成訓練該人工類神經網路所針對的總數目個物件類別之一子集；- 存取包含該人工類神經網路內之神經元之啟動頻率值的一資料庫，其中該等啟動頻率值隨該物件類別而變化；及- 自該人工類神經網路移除具有比選定物件類別之該子集之一臨限值低的啟動頻率值之彼等神經元。

根據一第三態樣，本發明係關於一種包括此一電腦程式之數位儲存媒體。該電腦程式及該儲存媒體涉及與方法之彼等優點對應之優點且可類似地變化。

在附圖及以下說明中陳述本發明之一或多個實施例之細節。根據說明及圖式以及申請專利範圍，將明瞭本發明之其他特徵及優點。

200:人工類神經網路

300:方程式/完整計算

400:方程式/計算

圖1展示根據一項實施例之用於修剪一人工類神經網路之一過程100之一流程圖。

圖2展示根據一項實施例之一人工類神經網路200之一示意圖。

圖3展示根據一項實施例之用於在修剪之前圖2之神經網路之完整計算之一方程式300。

圖4展示根據一項實施例之用於在修剪之後圖2之神經網路之計算之一方程式400。

在各圖式中，相似參考符號指示相似元件。

概述

如上文所論述，本發明之一個目標係修剪一人工類神經網路，以便使該人工類神經網路可在諸如攝影機及行動裝置之嵌入式裝置中使用。本文中所闡述之各種實施例藉由以下方式實現此操作：基於一特定類別之影像之神經元之使用頻率而針對每一物件類別單獨修剪權重。可以類似於習用技術之方式進行此操作，例如，藉由在測試階段期間分析人工類神經網路之神經元且依據此一分析之結果識別哪些神經元之使用頻率不高。然而，根據本文中所闡述之實施例，透過人工類神經網路饋送僅屬於一特定類別之影像，且識別低效能神經元。

如熟習此項技術者將瞭解，本發明之態樣可體現為一種系統、方法或電腦程式產品。因此，本發明之態樣可採取一完全硬體實施例、一完全軟體實施例(包含韌體、常駐軟體、微碼等)或組合軟體與硬體態樣之一實施例(可全部在本文中統稱為一「電路」、「模組」或「系統」)之形式。此外，本發明之態樣可採取體現於其上體現有電腦可讀程式碼之一或多個電腦可讀媒體中之一電腦程式產品之形式。

可利用一或多個電腦可讀媒體之任一組合。該電腦可讀媒體可係一電腦可讀信號媒體或一電腦可讀儲存媒體。一電腦可讀儲存媒體可係(舉例而言，但不限於)一電子、磁性、光學、電磁、紅外線或半導體系統、設備或裝置或者前述各項之任一適合組合。該電腦可讀儲存媒體之更特定實例(一非詳盡清單)將包含以下各項：具有一或多個導線之一電連接、一可攜式電腦磁片、一硬碟、一隨機存取記憶體(RAM)、一唯讀記憶體(ROM)、一可抹除可程式化唯讀記憶體(EPROM或快閃記憶體)、一光纖、一可攜式光碟唯讀記憶體(CD-ROM)、一光學儲存裝置、一磁性儲存裝置或前述各項之任一適合組合。在此文件之內容脈絡中，一電腦可讀儲存媒體可係可含有或儲存供由一指令執行系統、設備或裝置使用或連同其一起使用之一程式的任何有形媒體。

一電腦可讀信號媒體可包含具有其中體現有電腦可讀程式碼之一傳播資料信號(舉例而言，以基頻形式或作為一載波之部分)。此一傳播信號可採取各種形式中之任一者，包含但不限於電磁、光學或其任何適合組合。一電腦可讀信號媒體可係任何電腦可讀媒體，其並非一電腦可讀儲存媒體且可傳達、傳播或傳送供由一指令執行系統、設備或裝置使用或連同其一起使用之一程式。

可使用任何適當媒體(包含但不限於無線、有線、光纖電纜、RF等或前述各項之任一適合組合)傳輸體現於一電腦可讀媒體上之程式碼。可以一或多個程式設計語言(包含諸如Java、Smalltalk、C++或諸如此類之一物件導向程式設計語言及諸如「C」程式設計語言或類似程式設計語言之習用程序性程式設計語言)撰寫用於實施本發明之態樣之操作之電腦程式碼。該程式碼可在使用者之電腦上完全執行，在使用者之電腦上部分執行，在使用者之電腦上作為一獨立軟體套件執行，在使用者之電腦上部分執行且在一遠端電腦上部分執行或在該遠端電腦或伺服器上完全執行。在稍後情景中，該遠端電腦可透過包含一區域網路(LAN)或一廣域網路(WAN)之任一類型之網路連接至使用者之電腦，或可連接至一外部電腦 (舉例而言，透過使用一網際網路服務提供者之網際網路)。

下文參考流程圖圖解說明及/或根據本發明之實施例之方法、設備(系統)及電腦程式產品之方塊圖闡述本發明之態樣。將理解，該等流程圖圖解說明及/或方塊圖之每一方塊及該等流程圖圖解說明及/或方塊圖中之方塊組合可由電腦程式指令來實施。此等電腦程式指令可提供至一通用電腦、專用電腦或其他可程式化資料處理設備之一處理器，以產生一機器，使得該等指令(其經由電腦或其他可程式化資料處理設備之處理器執行)形成用於實施該(等)流程圖及/或方塊圖方塊中所規定之功能/動作之手段。

此等電腦程式指令亦可儲存於一電腦可讀媒體中，該電腦可讀媒體可指導一電腦、其他可程式化資料處理設備或其他裝置以一特定方式起作用，使得儲存於該電腦可讀媒體中之指令產生包含實施該(等)流程圖及/或方塊圖方塊中所規定之功能/動作之指令之一製品。

亦可將該等電腦程式指令載入至一電腦、其他可程式化資料處理設備或其他裝置上以致使在該電腦、其他可程式化設備或其他裝置上執行一系列操作步驟，以產生一電腦實施之過程，使得在該電腦或其他可程式化設備上執行之指令提供用於實施該(等)流程圖及/或方塊圖方塊中所規定之功能/動作之過程。

人工類神經網路修剪

現在將藉由實例方式且參考圖1至圖4闡述根據本發明之各種實施例之技術。在此實例中，假定存在一人工類神經網路，已針對該人工類神經網路執行1000個類別之訓練。然而，在其中由一監視攝影機記錄影像之一情景中，舉例而言，一使用者可僅對1000個類別中之12個類別感興趣。

圖1係展示根據本發明之一項實施例之用於修剪一人工類神經網路之一過程100之一流程圖。如圖1中可見，為了斷定哪些神經元針對此等類別係低效能的，在步驟102中存取一資料庫。該資料庫含有隨物件類別而變化的在人工類神經網路內之神經元之啟動頻率值。

接下來，在步驟104中識別可自人工類神經網路安全地移除之低效能神經元。此操作可(舉例而言)藉由研究12個類別中之每一者之神經元之啟動頻率值且使用定義哪一啟動頻率值構成一低效能神經元之一臨限值來進行。該臨限值可在人工類神經網路之訓練程序期間根據不同類別而預定，或可在推理程序期間根據預測效能而係自適應的。亦即，該臨限值可適應於系統效能。

最後，在步驟106中，自人工類神經網路移除低效能神經元，此結束過程100且產生能夠根據一使用者之需要調整其架構之一「自適應人工類神經網路」。

在某些實施例中，此過程可需要透過一使用者介面(UI)來自一使用者之特定輸入，且可視需要重複該過程。舉例而言，在一項實施例中，可存在一特定監視情景之全面評估之一時間週期(例如，一周)，後續接著選擇且修剪已在彼時間週期期間識別之類別。

各種程度之自動化可用於幫助使用者選擇類別。舉例而言，在某些實施例中，可完全自動化類別選擇。在其他實施例中，可向一使用者呈現經自動選擇之類別之一子集，且可依據此進行一手動使用者選擇。在又其他實施例中，該使用者可在所有類別當中自由地選擇。某些實施例亦允許一使用者對選定類別之一集合進行添加(若使用者判定此一添加針對即將發生之特定情景將係有益的)。熟習此項技術者可基於特定情景而設想諸多變化。

圖2展示僅由經完全連接層組成之一小的人工類神經網路200之一示意性圖解說明，已使用以上技術自人工類神經網路200移除特定神經元(以虛線展示)，以形成一自適應人工類神經網路。圖3展示在實際上移除神經元之前人工類神經網路之完整計算300，且圖4展示在移除與經移除神經元對應之計算之後之計算400，亦即，由所得自適應人工類神經網路執行之計算。

如藉由分別比較圖3及圖4中之方程式可見，在移除低效能神經元之後計算量顯著減少。通常，若修剪基於較少類別(例如，若使用者僅對6個類別而非12個類別感興趣)，則可修剪更多神經元及權重，此乃因訓練資料之可變性減小，藉此產生一更簡潔人工類神經網路。

表示稀疏矩陣

修剪一人工類神經網路之傳統方式係藉由獨立地查看權重值且移除低於一特定臨限值之權重來進行。雖然此將稀疏引入層中，但稀疏係非結構化的。若修剪替代地基於神經元，則可移除貢獻於一經修剪神經元之所有權重，從而產生一結構化稀疏。在具有經完全連接層之一人工類神經網路之情形中，此意味可移除輸出計算中之全部列及行。

由於關於權重矩陣所需要之唯一運算係乘法，因此可在不影響結果之情況下移除與經修剪神經元對應之列及行。使用此技術，矩陣大小減小(如在習用修剪方法中亦常見)，但未針對每一矩陣而是僅針對所得矩陣儲存用於表示稀疏矩陣之指數以便重構最終全大小輸出。此亦可產生進一步益處。舉例而言，所得稀疏矩陣可具有需要較少運算能力來處置「簿記」之一結構，如將在下文進一步詳細地闡述。

只要存在相當數量之經修剪神經元，所得稀疏矩陣乘法便比完整矩陣乘法快。其需要更多簿記(亦即，記錄將經修剪神經元定位在何處之指數)，但需要較少乘法。與習用方法相比較其亦節省儲存及記憶體空間，且可促進向量運算，諸如單指令多資料(SIMD)，此通常在稀疏矩陣上不可能且將使運算更快。確切而言，構成「相當數量」之經修剪神經元之內容將根據情形而變化，但在每一情形中，將存在一損益平衡點，其中較少計算中之增益將勝過維持記錄中之損失。

此外，一稀疏矩陣可以諸多不同方式在數學上表達，且藉由針對特定結構使用正確表達可進一步減小達到此損益平衡點之臨限值係可能的。

最後，如熟習此項技術者認識到，當自本文中所展示之計算移除矩陣之全部列及行時，所得稀疏矩陣之尺寸將改變。因此，若修剪神經網路之最後層，則有必要更新一類別標籤檔案以便能夠使一特定輸出與一特定類別相關聯。另一替代方案係不修剪最後層，在該情形中最初類別標籤檔案可照原樣使用。

各圖中之流程圖及方塊圖圖解說明根據本發明之各種實施例之系統、方法及電腦程式產品之可能實施方案之架構、功能性及操作。就此而言，流程圖或方塊圖中之每一方塊可表示碼之一模組、分段或部分，其包括用於實施規定邏輯功能之一或多個可執行指令。亦應注意，在某些替代實施方案中，方塊中所述之功能可不按圖中所述之次序出現。舉例而言，事實上，取決於所涉及之功能性，可實質上同時執行兩個連續展示之方塊，或有時可按相反次序執行該等方塊。亦將注意，方塊圖及/或流程圖圖解說明之每一方塊及方塊圖及/或流程圖圖解說明中之方塊組合可由執行規定功能或動作之特殊用途基於硬體系統或特殊用途硬體與電腦指令之組合實施。

本文中所使用之術語僅用於闡述特定實施例之目的而非意欲限制本發明。如本文中所使用，除非內容脈絡另有明確指示，否則單數形式「一(a/an)」及「該(the)」意欲亦包含複數形式。將進一步理解，當在此說明書中使用時，術語「包括(comprises)」及/或「包括(comprising)」規定存在所陳述特徵、整數、步驟、操作、元件及/或組件，但並不排除存在或添加一或多個其他特徵、整數、步驟、操作、元件、組件及/或其群組。

下文申請專利範圍中之所有構件或步驟加功能元件之對應結構、材料、動作及等效形式意欲包含用於與如具體主張之其他所主張元件組合地執行功能之任何結構、材料或動作。本發明之說明已出於圖解說明及說明目的提出，而非意欲為窮盡性的或以所揭示形式限制於本發明。熟習此項技術者在不背離本發明之精神及範疇之情況下將明瞭諸多修改及變化。舉例而言，本文中所闡述之方法可不僅作為獨立方法來執行，而且可與其他已知方法組合以增強人工類神經網路之修剪。選擇並闡述實施例以便最佳地闡釋本發明之原理及實際應用，且使得熟習此項技術者能夠針對各種實施例在具有適合於所預計之特定用途之各種修改之情況下理解本發明。

Claims

一種用於將在一嵌入式(embedded)裝置之一人工類神經網路(artificial neural network)組態至一特定監視情景(situation)之方法，該方法包括：選擇該監視情景特有之若干個物件類別，其中該等物件類別形成訓練該人工類神經網路所針對的總數目個物件類別之一子集；存取包含該人工類神經網路內之神經元(neurons)之啟動頻率值的一資料庫，其中該等啟動頻率值包含用於每一物件類別之至少一啟動頻率；及自該人工類神經網路移除具有比選定物件類別之該子集之一臨限值低的啟動頻率值之彼等神經元，其中經移除神經元之數目使得計算來自該人工類神經網路之輸出所需要之運算資源之一減少勝過維持關於該等經移除神經元之記錄所需要之運算資源之一增加。
如請求項1之方法，其中該臨限值係在該人工類神經網路之一訓練/測試程序期間針對每一類別判定之一靜態值。
如請求項1之方法，其中基於人工類神經網路效能，該臨限值針對每一類別係自適應的。
如請求項1之方法，其進一步包括：基於在一特定時間週期內收集之資料而精細化對該監視情景特有之物件類別之該選擇；及針對對物件類別之該精細化選擇而重複該等選擇、存取及移除步驟。
如請求項1之方法，其中回應於透過一使用者介面接收之一使用者輸入而執行該等選擇、存取及移除步驟中之至少某些步驟。
如請求項1之方法，其中在一經完全連接人工類神經網路中，移除神經元與自形成該人工類神經網路之個別層之數學表示之矩陣移除列及行對應，藉此減少在計算來自該人工類神經網路之該輸出中所需要之運算數目。
一種包括指令之非暫態電腦可讀儲存媒體，當該等指令在一處理系統中被執行時，使得該系統執行用於將使用(employed)在一嵌入式裝置之一人工類神經網路組態至一特定監視情景之一方法，該方法包括：選擇該監視情景特有之若干個物件類別，其中該等物件類別形成訓練該人工類神經網路所針對的總數目個物件類別之一子集；存取包含該人工類神經網路內之神經元之啟動頻率值的一資料庫，其中該等啟動頻率值包含用於每一物件類別之至少一啟動頻率；及自該人工類神經網路移除具有比選定物件類別之該子集之一臨限值低的啟動頻率值之彼等神經元，其中經移除神經元之數目使得計算來自該人工類神經網路之輸出所需要之運算資源之一減少勝過維持關於該等經移除神經元之記錄所需要之運算資源之一增加。