TW202205269A

TW202205269A - 用於執行深度神經網路運算的記憶體及其操作方法

Info

Publication number: TW202205269A
Application number: TW109124237A
Authority: TW
Inventors: 林泰吉; 丁意軒; 沈皓軒
Original assignee: 華邦電子股份有限公司
Priority date: 2020-07-17
Filing date: 2020-07-17
Publication date: 2022-02-01
Also published as: CN113947199A; US20220019881A1; TWI759799B

Abstract

一種記憶體適用於執行深度神經網路運算。記憶體包括：處理單元以及權重單元。處理單元具有資料輸入端與資料輸出端。權重單元經配置以耦接處理單元的資料輸入端。權重單元包括索引記憶體與映射表。索引記憶體經配置以儲存多個權重索引。映射表經配置以將多個權重索引分別對應至多個代表權重資料。

Description

用於執行深度神經網路運算的記憶體及其操作方法

本發明是有關於一種用於執行深度神經網路運算的記憶體及其操作方法。

隨著人工智慧（Artificial Intelligence，AI）運算的演進，AI運算的應用範圍越來越廣泛。例如，經由神經網路模型來進行影像分析、語音分析、自然語言處理等神經網路運算。因此，各技術領域持續地投入AI的研發與應用，適用於深度神經網路（Deep Neural Networks，DNN）、卷積神經網路（Convolutional Neural Network，CNN）等等的各種演算法也不斷推陳出新。

然而，無論是哪一種神經網路運算所使用的演算法，在隱藏層（Hidden layer）中所使用的資料量非常龐大，才能達成機器學習的功能。具體而言，深度神經網路的運算基礎實際上是來自於神經元與權重之間的矩陣運算。在此情況下，在執行深度神經網路運算時，需要花費大量的記憶體空間來儲存權重。倘若儲存權重的記憶體出現卡住錯誤（stuck-at-faults）的現象，將會導致深度神經網路的運算有誤。因此，如何提供一種記憶體及其操作方法可降低卡住錯誤的現象並提高深度神經網路運算的正確率將成為重要的一門課題。

本發明提供一種適用於執行深度神經網路運算的記憶體及其操作方法，其可找出具有最少卡住錯誤的編碼資料來表示權重索引與代表權重資料之間的映射關係，進而減少索引記憶體的卡住錯誤。

本發明提供一種記憶體適用於執行深度神經網路運算。上述的記憶體包括：處理單元以及權重單元。處理單元具有資料輸入端與資料輸出端。權重單元經配置以耦接處理單元的資料輸入端。權重單元包括索引記憶體與映射表。索引記憶體經配置以儲存多個權重索引。映射表經配置以將多個權重索引分別對應至多個代表權重資料。

本發明提供一種記憶體的操作方法，適用於執行深度神經網路運算。上述的記憶體的操作方法包括映射方法。上述的映射方法包括：將權重單元耦接至處理單元的資料輸入端，其中權重單元包括儲存有多個權重索引的索引記憶體以及將多個權重索引分別對應至多個代表權重資料的映射表；檢測索引記憶體，以產生錯誤映射圖（fault map），其中錯誤映射圖包括多個卡住錯誤；依據錯誤映射圖來統計每一個代表權重資料與其對應的權重索引之間的編碼資料的卡住錯誤的數量；以及依序挑選最少卡住錯誤的編碼資料來建立多個代表權重資料與多個權重索引之間的映射表。

基於上述，本發明實施例可藉由將多個權重值分群為多個代表權重資料，並藉由映射表將多個權重索引分別對應至多個代表權重資料，以大幅降低記憶體儲存多個權重值的空間。另外，本發明實施例可藉由檢測索引記憶體來產生錯誤映射圖、依據錯誤映射圖來統計每一個代表權重資料與其對應的權重索引之間的編碼資料的卡住錯誤的數量以及依序挑選最少卡住錯誤的編碼資料來建立上述的映射表。如此一來，本發明實施例可有效地減少索引記憶體的卡住錯誤，進而提高深度神經網路運算的正確率。

為了使本發明之內容可以被更容易明瞭，以下特舉實施例做為本發明確實能夠據以實施的範例。另外，凡可能之處，在圖式及實施方式中使用相同標號的元件/構件/步驟，係代表相同或類似部件。

請參照圖1，本發明實施例提供一種記憶體100包括處理單元110、資料輸入單元120、權重單元130、回饋單元140以及資料輸出單元150。具體來說，處理單元110具有資料輸入端112與資料輸出端114。在一些實施例中，處理單元110可以是人工智慧引擎，例如是由控制邏輯、運算邏輯以及快取（cache）記憶體等諸如此類的電路元件所建構而成的記憶體內運算（Processing In Memory，PIM）架構或近記憶體運算（Near Memory Processing，NMP）架構。在本實施例中，處理單元110是設計以具有執行深度神經網路運算的功能。在此情況下，本實施例的記憶體100可為一種動態隨機存取記憶體（Dynamic Random Access Memory，DRAM）晶片、電阻式隨機存取記憶體（resistive random access memory，RRAM）、相變隨機存取記憶體（phase-change random access memory，PCRAM）、磁阻隨機存取記憶體（Magnetoresistive random-access memory，MRAM）等等，但本發明不以此為限。

在一些實施例中，資料輸入單元120與權重單元130經配置以分別耦接至處理單元110的資料輸入端112，且回饋單元140經配置以耦接處理單元110的資料輸入端112與資料輸出端114。舉例來說，當處理單元110執行深度神經網路運算時，處理單元110可存取資料輸入單元120中的運算輸入資料（或運算輸入值）D1以及權重單元130中的權重資料136，並且依據輸入資料D1以及權重資料136來執行深度神經網路運算。在本實施例中，處理單元110可視為深度神經網路中的隱藏層，其由多個前後相互連結的層116所構成，其中每一層116具有多個神經元118。當輸入資料D1與權重資料136通過處理單元110運算並得到一運算結果值R1時，此運算結果值R1會通過回饋單元140重新輸入處理單元110以作為新的運算輸入資料（或運算輸入值）D2，以此完成一次隱藏層之運算。依此類推，直到完成所有隱藏層計算，並將輸出層的最終運算結果R2傳送給資料輸出單元150。

值得注意的是，在習知技術中，權重資料通常以浮點數（floating point）表示並儲存在權重記憶體中。在此情況下，在執行深度神經網路運算時，需要花費大量的記憶體空間來儲存權重資料。基於此，本發明實施例將權重單元130來取代習知的權重記憶體，由此降低記憶體的儲存空間。具體而言，權重單元130包括索引記憶體132與映射表134。如圖2所示，索引記憶體132經配置以儲存多個權重索引I₀ 、I₁ 、I₂ …I_n （以下統稱為權重索引I）。權重索引I的數量相當於習知的權重資料的數量，其與隱藏層中相互連結的層數以及每一層中的神經元的數量有關，應為神經網路領域中具有通常知識者所熟知，於此便不再詳述。另外，映射表134經配置以將多個權重索引I分別對應至多個代表權重資料RW₀ 、RW₁ 、RW₂ …RW_k-1 （以下統稱為代表權重資料RW）。在一些實施例中，可將多個權重值（例如習知的權重資料）分群為代表權重資料RW，由此減少代表權重資料RW的數量。在此情況下，代表權重資料RW的權重變化可小於權重值的權重變化，以降低深度神經網路運算錯誤率。此外，權重索引I的數量可多於代表權重資料RW的數量。如圖2所示，一或多個權重索引I可同時對應同一個代表權重資料RW。

在一些實施例中，如圖3所示，映射表134具有多個編碼資料E，以表示多個權重索引I與多個代表權重資料RW之間的映射關係。舉例來說，如圖2與圖3所示，權重索引I中的I₀ 可通過編碼資料E中的「0000」對應至代表權重資料RW₀ 中的代表權重值W為「-0.7602」。然而，當儲存權重索引I的索引記憶體132出現卡住錯誤的現象，仍會導致深度神經網路的運算有誤。在此情況下，以下實施例提供一種映射方法，其可找出具有最少卡住錯誤的編碼資料E來表示權重索引I與代表權重資料RW之間的映射關係，進而減少索引記憶體132的卡住錯誤。

請參照圖4，本發明實施例提供一種記憶體的操作方法400適用於執行深度神經網路運算。記憶體的操作方法400包括映射方法，如下所示。首先，進行步驟402，檢測索引記憶體，以產生錯誤映射圖500，如圖5所示。在一些實施例中，錯誤映射圖500包括多個卡住錯誤502。於此，所謂的卡住錯誤（stuck-at-faults）是指記憶胞的狀態準位總是為0，或者總是為1。舉例來說，如圖5所示，儲存有權重索引I的每一個記憶胞的狀態準位可使用四個位元來表示。每一位元位置為二的冪。儲存有權重索引I₁ 的記憶胞的狀態準位可以是「X1XX」，也就是說，此記憶胞的第二位元位置總是為1，其他位元位置則可以是1或是0（以X來表示）。在此情況下，若是以「X0XX」的編碼資料來對應權重索引I₁ 便會發生卡住錯誤。相似地，儲存有權重索引I₂ 的記憶胞的狀態準位可以是「XX11」；而儲存有權重索引I₃ 的記憶胞的狀態準位可以是「0XXX」。此外，儲存有權重索引I₀ 的記憶胞的狀態準位可以是「XXXX」，也就是說，可以任意編碼資料來對應權重索引I₀ 。應理解，上述的記憶胞亦可以兩個位元來表示四個狀態準位，或是更多個位元來表示更多個狀態準位。

接著，進行步驟404，依據錯誤映射圖來統計每一個代表權重資料與其對應的權重索引之間的編碼資料的卡住錯誤的數量。舉例來說，如圖5所示，當權重索引I₁ 對應代表權重資料RW₃ 時，儲存有權重索引I₁ 的記憶胞的狀態準位為「X1XX」。也就是說，具有「X0XX」的編碼資料會出現卡住錯誤，其以+1的符號來表示，如圖6A所示。相似地，如圖5所示，當權重索引I₂ 對應代表權重資料RW₁ 時，儲存有權重索引I₂ 的記憶胞的狀態準位為「XX11」。也就是說，具有「XX00」的編碼資料會出現卡住錯誤，其以+1的符號來表示，如圖6B所示。接著，如圖5所示，當權重索引I₃ 對應代表權重資料RW₃ 時，儲存有權重索引I₃ 的記憶胞的狀態準位為「0XXX」。也就是說，具有「1XXX」的編碼資料會出現卡住錯誤，其以+1的符號來表示，如圖6C所示。依此類推，直到統計完每一個代表權重資料RW與其對應的權重索引I之間的編碼資料E的卡住錯誤的數量。

然後，進行步驟406，依序挑選最少卡住錯誤的編碼資料來建立多個代表權重資料與多個權重索引之間的映射表。圖7繪示出代表權重資料RW與編碼資料E的關係表700。雖然上述實施例中的編碼資料是以四個位元來表示十六個狀態準位，為了便於解釋，圖7改以兩個位元來表示四個狀態準位。

詳細地說，當代表權重資料RW以代表權重資料RW₀ 、RW₁ 、RW₂ 、RW₃ 依序排列，可以此順序來挑選對應其的編碼資料E。舉例來說，如圖7所示，由於在代表權重資料RW₀ 的列中，編碼資料「01」具有最少卡住錯誤（亦即0個），因此可挑選多個編碼資料E中的編碼資料「01」來對應代表權重資料RW₀ 。也就是說，編碼資料「01」的卡住錯誤數量小於其他編碼資料「11」、「10」、「00」的卡住錯誤數量。接著，在代表權重資料RW₁ 的列中，編碼資料「10」具有最少卡住錯誤（亦即0個），因此可挑選多個編碼資料E中的編碼資料「10」來對應代表權重資料RW₁ 。值得注意的是，雖然在代表權重資料RW₂ 的列中，編碼資料「01」或「10」具有較少卡住錯誤（亦即1個或2個），但由於編碼資料「01」或「10」已被挑選以對應代表權重資料RW₀ 或RW₁ ，因此，可改挑選多個編碼資料E中的編碼資料「11」來對應代表權重資料RW₂ 。也就是說，每一個權重資料RW可對應於不同的編碼資料E。最後，在代表權重資料RW₃ 的列中，編碼資料「00」具有最少卡住錯誤（亦即2個），因此可挑選多個編碼資料E中的編碼資料「00」來對應代表權重資料RW₃ 。在進行上述記憶體的操作方法400的步驟402、404、406之後，可找出具有最少卡住錯誤的編碼資料E來表示權重索引I與代表權重資料RW之間的映射關係，以有效地減少索引記憶體132（如圖1所示）的卡住錯誤，進而提高深度神經網路運算的正確率。

在一些實施例中，在執行深度神經網路運算時，如圖1所示，可從索引記憶體132讀取所需的權重索引並藉由上述的映射表映射出對應的代表權重資料（或代表權重值）。然後，將對應的代表權重資料輸入處理單元110來執行深度神經網路運算。

綜上所述，本發明實施例可藉由將多個權重值分群為多個代表權重資料，並藉由映射表將多個權重索引分別對應至多個代表權重資料，以大幅降低記憶體儲存多個權重值的空間。另外，本發明實施例可藉由檢測索引記憶體來產生錯誤映射圖、依據錯誤映射圖來統計每一個代表權重資料與其對應的權重索引之間的編碼資料的卡住錯誤的數量以及依序挑選最少卡住錯誤的編碼資料來建立上述的映射表。如此一來，本發明實施例可有效地減少索引記憶體的卡住錯誤，進而提高深度神經網路運算的正確率。

100:記憶體 110:處理單元 112:資料輸入端 114:資料輸出端 116:層 118:神經元 120:資料輸入單元 130:權重單元 132:索引記憶體 134:映射表 136:權重資料 140:回饋單元 150:資料輸出單元 400:記憶體的操作方法 402、404、406:步驟 500:錯誤映射圖 502:卡住錯誤 700:關係表 D1、D2:運算輸入資料 E:編碼資料 I、I₀ 、I₁ 、I₂ 、I₃ …I_n :權重索引 RW、RW₀ 、RW₁ 、RW₂ 、RW₃ …RW_k-1 :代表權重資料 R1:運算結果值 R2:最終運算結果 W:代表權重值

圖1是依照本發明一實施例所繪示的一種記憶體的架構示意圖。圖2是依照本發明一實施例所繪示的索引記憶體與映射表之間的關係圖。圖3是依照本發明一實施例所繪示的映射表。圖4是依照本發明一實施例所繪示的一種記憶體的操作方法的流程圖。圖5是依照本發明一實施例所繪示的錯誤映射圖。圖6A至圖6C是圖4的步驟404的流程圖。圖7是依照本發明一實施例所繪示的代表權重資料與編碼資料的關係表。

100:記憶體

110:處理單元

112:資料輸入端

114:資料輸出端

116:層

118:神經元

120:資料輸入單元

130:權重單元

132:索引記憶體

134:映射表

136:權重資料

140:回饋單元

150:資料輸出單元

D1、D2:運算輸入資料

R1:運算結果值

R2:最終運算結果

Claims

一種記憶體，適用於執行深度神經網路運算，所述記憶體包括：處理單元，具有資料輸入端與資料輸出端；以及權重單元，經配置以耦接所述處理單元的所述資料輸入端，其中所述權重單元包括：索引記憶體，經配置以儲存多個權重索引；以及映射表，經配置以將所述多個權重索引分別對應至多個代表權重資料。
如請求項1所述的記憶體，其中所述映射表具有多個編碼資料，以表示所述多個權重索引與所述多個代表權重資料之間的映射關係。
如請求項1所述的記憶體，其中所述映射表是藉由檢測所述索引記憶體以產生錯誤映射圖（fault map）、根據所述錯誤映射圖來統計每一個代表權重資料與其對應的權重索引之間的編碼資料的卡住錯誤（stuck-at-fault）的數量以及依序挑選最少卡住錯誤的編碼資料所建立的。
如請求項1所述的記憶體，其中所述多個代表權重資料是將多個權重值分群所得到，且所述多個代表權重資料的權重變化小於所述多個權重值的權重變化。
如請求項1所述的記憶體，更包括：資料輸入單元，經配置以耦接所述處理單元的所述資料輸入端，並用以輸入運算輸入值至所述處理單元；以及回饋單元，經配置以耦接所述資料輸入端與所述資料輸出端，其中所述回饋單元將所述處理單元所輸出的運算結果值重新輸入所述處理單元以作為新的運算輸入值。
一種記憶體的操作方法，適用於執行深度神經網路運算，所述記憶體的操作方法包括映射方法，所述映射方法包括：將權重單元耦接至處理單元的資料輸入端，其中所述權重單元包括儲存有多個權重索引的索引記憶體以及將所述多個權重索引分別對應至多個代表權重資料的映射表；檢測所述索引記憶體，以產生錯誤映射圖，其中所述錯誤映射圖包括多個卡住錯誤；依據所述錯誤映射圖來統計每一個代表權重資料與其對應的權重索引之間的編碼資料的卡住錯誤的數量；以及依序挑選最少卡住錯誤的編碼資料來建立所述多個代表權重資料與所述多個權重索引之間的所述映射表。
如請求項6所述的記憶體的操作方法，其中所述依序挑選最少卡住錯誤的編碼資料的步驟包括：挑選所述多個編碼資料中的第一編碼資料來對應所述多個代表權重資料中的第一代表權重資料，其中以所述第一編碼資料來對應所述第一代表權重資料的卡住錯誤的數量小於以所述多個編碼資料中的其他編碼資料來對應所述第一代表權重資料的卡住錯誤的數量。
如請求項7所述的記憶體的操作方法，更包括：挑選所述多個編碼資料中的第二編碼資料來對應所述多個代表權重資料中的第二代表權重資料；挑選所述多個編碼資料中的第三編碼資料來對應所述多個代表權重資料中的第三代表權重資料；以及挑選所述多個編碼資料中的第四編碼資料來對應所述多個代表權重資料中的第四代表權重資料，其中所述第一編碼資料、所述第二編碼資料、所述第三編碼資料以及所述第四編碼資料具有不同編碼資料。
如請求項6所述的記憶體的操作方法，更包括讀取方法，其中所述讀取方法包括：從所述索引記憶體讀取所需的權重索引並藉由所述映射表映射出對應的代表權重資料；以及將所述對應的代表權重資料輸入所述處理單元來執行所述深度神經網路運算。
如請求項6所述的記憶體的操作方法，其中所述映射方法更包括：將多個權重值分群為所述多個代表權重資料，且所述多個代表權重資料的權重變化小於所述多個權重值的權重變化。