TWI737228B

TWI737228B - 基於記憶體內運算電路架構之量化方法及其系統

Info

Publication number: TWI737228B
Application number: TW109109478A
Authority: TW
Inventors: 鄭桂忠; 魏瑋辰
Original assignee: 國立清華大學
Priority date: 2020-03-20
Filing date: 2020-03-20
Publication date: 2021-08-21
Also published as: US20210294874A1; TW202137075A; US11899742B2

Abstract

本發明提供一種基於記憶體內運算電路架構之量化方法，其中參數分群步驟依據分群數值將量化權重分成分群量化權重，並依據分群數值將輸入激勵函數分成分群激勵函數。乘積累加步驟將分群量化權重及分群激勵函數執行乘積累加運算而產生卷積輸出。卷積量化步驟依據卷積目標位元將卷積輸出量化成量化卷積輸出。卷積合併步驟依據分群數值將量化卷積輸出執行部分和運算而產生輸出激勵函數。藉此，透過分群配對及考慮硬體限制，並藉由類比數位轉換器的分類分布及具體量化法搭配深度神經網路的穩健性質，可學習到較佳的權重參數。

Description

基於記憶體內運算電路架構之量化方法及其系統

本發明是關於一種量化方法及其系統，特別是關於一種基於記憶體內運算電路架構之量化方法及其系統。

在先前技術中，量化方法都是針對神經網路的輸入激勵函數及權重進行量化處理，並且透過數位電路實現低位元神經網路。近年來，記憶體內運算被提出，並在能源效率上比數位電路更好。然而，習知量化方法應用於記憶體內運算時，經神經網路訓練所得到之權重參數無法有效提升精準度。由上述可知，目前市場上缺乏一種能有效提升精準度並基於記憶體內運算電路架構之量化方法及其系統，故相關業者均在尋求其解決之道。

因此，本發明之目的在於提供一種基於記憶體內運算電路架構之量化方法及其系統，其針對神經網路的輸入激勵函數及權重進行分拆，以模擬記憶體內運算電路的字元線及位元線的特性，並且在經過分群卷積後對輸出結果進行量化處理，以模擬類比數位轉換器的限制，最後在以部分和完成典型卷積運算。上述量化結合神經網路之權重更新，可提升精準度。

依據本發明的方法態樣之一實施方式提供一種基於記憶體內運算電路架構之量化方法，其包含量化參數提供步驟、參數分群步驟、乘積累加步驟、卷積量化步驟以及卷積合併步驟。其中量化參數提供步驟係提供量化參數，量化參數包含一輸入激勵函數、一量化權重及一分群數值。參數分群步驟係依據分群數值將量化權重分成複數個分群量化權重，並依據分群數值將輸入激勵函數分成複數個分群激勵函數。乘積累加步驟係將任一分群量化權重及任一分群激勵函數執行一乘積累加運算而產生一卷積輸出。卷積量化步驟係依據一卷積目標位元將卷積輸出量化成一量化卷積輸出。卷積合併步驟係依據分群數值將量化卷積輸出執行一部分和運算而產生一輸出激勵函數。

藉此，本發明之量化方法可將分群量化權重預先儲存至記憶體單元內，並且透過特定之記憶體內運算電路架構達到記憶體內的卷積運算功能，可避免傳統架構裡階層記憶體間大量的資料搬運之間題，進而能達到降低系統功耗、降低系統延遲以及提高能源效率。此外，本發明將量化權重與輸入激勵函數分群配對，並考慮有限位元線的記憶體單元、字元線輸入及卷積輸出的離散化，透過深度神經網路的穩健性質，學習到適合非揮發性記憶體內運算之硬體限制的權重參數。

前述實施方式之其他實施例如下：前述輸入激勵函數可具有一輸入通道數，分群數值經由輸入通道數與一控制參數運算求得，分群數值等於輸入通道數除以控制參數。分群數值為正整數，並大於1且小於等於輸入通道數。

前述實施方式之其他實施例如下：前述基於記憶體內運算電路架構之量化方法可更包含一迭代執行步驟，此迭代執行步驟係依據一迭代次數重複執行乘積累加步驟、卷積量化步驟及卷積合併步驟，迭代次數等於分群數值。

前述實施方式之其他實施例如下：前述量化參數提供步驟可包含一權重量化步驟，此權重量化步驟係依據一權重目標位元將一權重量化成一量化權重。權重量化步驟包含權重目標位元、權重、映射後量化權重、量化方程式及量化權重，權重目標位元表示為b _W，權重表示為W _l，量化方程式表示為quan，量化權重表示為W _l ^q且符合下式：

前述實施方式之其他實施例如下：前述基於記憶體內運算電路架構之量化方法可更包含一激勵量化步驟，此激勵量化步驟係依據一激勵目標位元將輸出激勵函數量化成一量化輸出激勵函數。激勵量化步驟包含輸出激勵函數、剪輯函數、映射後激勵函數、激勵目標位元、量化方程式及量化輸出激勵函數，輸出激勵函數表示為A _l，剪輯函數表示為Clip，映射後激勵函數表示為

，激勵目標位元表示為b _A，量化方程式表示為quan，量化輸出激勵函數表示為

且符合下式：

前述實施方式之其他實施例如下：前述卷積量化步驟可包含執行一直通估計量化法，直通估計量化法包含卷積輸出、卷積目標位元、映射後卷積輸出、量化方程式及量化卷積輸出。卷積輸出表示為A _l,k，卷積目標位元表示為b _AD，映射後卷積輸出表示為

，量化方程式表示為 quan，量化卷積輸出表示為

，直通估計量化法符合下式：

前述實施方式之其他實施例如下：前述卷積量化步驟可包含執行一具體量化法，此具體量化法包含卷積輸出、代表位階、放大因子、偏差因子、電流數位值、激勵函數訊號、乙狀函數、標準差、具體函數、溫度常數、分類機率、隨機樣本、分群數值、激勵函數量化訊號及量化卷積輸出。卷積輸出表示為A _l,k，代表位階表示為R _AD，放大因子表示為α，偏差因子表示為β，電流數位值表示為r _i，激勵函數訊號表示為a，乙狀函數表示為sigmoid，標準差表示為σ _i，具體函數表示為Concrete，溫度常數表示為λ，分類機率表示為π _i，隨機樣本表示為s _i，分群數值表示為K，激勵函數量化訊號表示為a ^q，量化卷積輸出表示為

，具體量化法符合下式：

s _i=Concrete(π _i,λ)；及

前述實施方式之其他實施例如下：前述具體函數包含雜訊、溫度常數、分類機率、隨機樣本、甘貝爾函數及歸一化指數函數，雜訊表示為n _i，甘貝爾函數表示為Gumbel，歸一化指數函數表示為softmax，具體函數符合下式：

n _i=Gumbel(0,1)；及

依據本發明的結構態樣之一實施方式提供一種基於記憶體內運算電路架構之量化系統，其包含參數分群模組、乘積累加器、卷積量化器及加法器。其中參數分群模組依據一分群數值將一量化權重分成複數個分群量化權重，並依據分群數值將一輸入激勵函數分成複數個分群激勵函數。乘積累加器訊號連接參數分群模組，乘積累加器將任一分群量化權重及任一分群激勵函數執行一乘積累加運算而產生一卷積輸出。卷積量化器訊號連接乘積累加器，卷積量化器依據一卷積目標位元將卷積輸出量化成一量化卷積輸出。加法器訊號連接卷積量化器，加法器依據分群數值將量化卷積輸出執行一部分和運算而產生一輸出激勵函數。

藉此，本發明的基於記憶體內運算電路架構之量化系統能考慮到硬體規格的位元數限制，並且藉由類比數位轉換器的分類分布及具體量化法，訓練一個不但能適應量化雜訊，而且對記憶體內運算友好的量化深度神經網路。

前述實施方式之其他實施例如下：前述輸入激勵函數可具有一輸入通道數，分群數值經由輸入通道數與控制參數運算求得，分群數值等於輸入通道數除以控制參數。分群數值為正整數，且分群數值大於1且小於等於輸入通道數。

前述實施方式之其他實施例如下：前述乘積累加器、卷積量化器及加法器可依據一迭代次數被重複執行，迭代次數等於分群數值。

前述實施方式之其他實施例如下：前述基於記憶體內運算電路架構之量化系統可更包含一權重量化器，此權重量化器訊號連接參數分群模組，權重量化器依據一權重目標位元將一權重量化成一量化權重，權重量化器包含權重目標位元、權重、映射後量化權重、量化方程式及量化權重。權重目標位元表示為b _W，權重表示為W _l，量化方程式表示為quan，量化權重表示為W _l ^q，權重量化器表示為Q _W且符合下式：

前述實施方式之其他實施例如下：前述基於記憶體內運算電路架構之量化系統可更包含一激勵函數量化器，此激勵函數量化器訊號連接加法器，激勵函數量化器依據一激勵目標位元將輸出激勵函數量化成一量化輸出激勵函數，激勵函數量化器包含輸出激勵函數、剪輯函數、映射後激勵函數、激勵目標位元、量化方程式及量化輸出激勵函數。輸出激勵函數表示為A _l，剪輯函數表示為Clip，映射後激勵函數表示為

，激勵函數量化器表示為Q _A且符合下式：

前述實施方式之其他實施例如下：前述卷積量化器可執行一直通估計量化法，此直通估計量化法包含卷積輸出、卷積目標位元、映射後卷積輸出、量化方程式及量化卷積輸出。卷積輸出表示為A _l,k，卷積目標位元表示為 b _AD，映射後卷積輸出表示為

，量化方程式表示為 quan，量化卷積輸出表示為

，直通估計量化法符合下式：

前述實施方式之其他實施例如下：前述卷積量化器可執行一具體量化法，此具體量化法包含卷積輸出、代表位階、放大因子、偏差因子、電流數位值、激勵函數訊號、乙狀函數、標準差、具體函數、溫度常數、分類機率、隨機樣本、分群數值、激勵函數量化訊號及量化卷積輸出。卷積輸出表示為A _l,k，代表位階表示為R _AD，放大因子表示為α，偏差因子表示為β，電流數位值表示為r _i，激勵函數訊號表示為a，乙狀函數表示為sigmoid，標準差表示為σ _i，具體函數表示為Concrete，溫度常數表示為λ，分類機率表示為π _i，隨機樣本表示為s _i，分群數值表示為 K，激勵函數量化訊號表示為a ^q，量化卷積輸出表示為

，具體量化法符合下式：

s _i=Concrete(π _i,λ)；及

前述實施方式之其他實施例如下：前述具體函數可包含雜訊、溫度常數、分類機率、隨機樣本、甘貝爾函數及歸一化指數函數，甘貝爾函數表示為Gumbel，雜訊表示為n _i，歸一化指數函數表示為softmax，具體函數符合下式：

n _i=Gumbel(0,1)；及

100:量化系統

110:參數分群模組

120:乘積累加器

130:加法器

200:記憶體內運算電路架構

210:記憶體單元

220:類比數位轉換器

300:量化方法

S02:量化參數提供步驟

S022:權重量化步驟

S04:參數分群步驟

S06:乘積累加步驟

S08:卷積量化步驟

S10:卷積合併步驟

S12:迭代執行步驟

S14:激勵量化步驟

a ₀,a ₁,a _m:激勵函數訊號

A _l:輸出激勵函數

A _l,k:卷積輸出

:輸入激勵函數

:分群激勵函數

:量化卷積輸出

:量化輸出激勵函數

b _A:激勵目標位元

b _AD:卷積目標位元

b _W:權重目標位元

Bit:位元數

BL[0],BL[n]:位元線

C _in:輸入通道數

FP32:32位元符點數

,

:電流

k,l:變數

NG:負權重群

PG:正權重群

p:分布

P:累積機率密度函數

Q _A:激勵函數量化器

Q _W:權重量化器

Q _AD:卷積量化器

r _i,r ₀,r ₁,r ₂,r ₃:電流數位值

SL[0],SL[n]:來源線

w _0,0,w _1,0,w _m,0,w _0,n,w _1,n,w _m,n:權重值

W _l:權重

W _l ^q:量化權重

:分群量化權重

WK:權重張量

WL[0],WL[1],WL[8],WL[m]:字元線

x:輸入訊號

τ:控制參數

σ _i,σ ₀,σ ₁,σ ₂,σ ₃:標準差

第1圖係繪示本發明第一實施例之基於記憶體內運算電路架構之量化系統的示意圖；

第2圖係繪示本發明第二實施例之記憶體內運算電路架構的示意圖；

第3圖係繪示第1圖之參數分群模組的權重張量對應到記憶體內運算電路架構的示意圖；

第4圖係繪示第1圖之乘積累加器的卷積輸出分布，其對應單一條位元線(Bit Line；BL)的累積電流分布；

第5圖係繪示第2圖之記憶體內運算電路架構的類比數位轉換器之分類分布的示意圖；

第6圖係繪示第5圖之各電流數位值之分類機率的示意圖；

第7圖係繪示本發明第三實施例之基於記憶體內運算電路架構之量化方法的流程示意圖；

第8圖係繪示本發明之具體量化法與直通估計量化法基於類比數位轉換器位元數的正確率之比較圖；以及

第9圖係繪示本發明之具體量化法與直通估計量化法基於控制參數的正確率之比較圖。

以下將參照圖式說明本發明之複數個實施例。為明確說明起見，許多實務上的細節將在以下敘述中一併說明。然而，應瞭解到，這些實務上的細節不應用以限制本發明。也就是說，在本發明部分實施例中，這些實務上的細節是非必要的。此外，為簡化圖式起見，一些習知慣用的結構與元件在圖式中將以簡單示意的方式繪示之；並且重複之元件將可能使用相同的編號表示之。

此外，本文中當某一元件(或單元或模組等)「連接」於另一元件，可指所述元件是直接連接於另一元件，亦可指某一元件是間接連接於另一元件，意即，有其他元件介於所述元件及另一元件之間。而當有明示某一元件是「直接連接」於另一元件時，才表示沒有其他元件介於所述元件及另一元件之間。而第一、第二、第三等用語只是用來描述不同元件，而對元件本身並無限制，因此，第一元件亦可改稱為第二元件。且本文中之元件/單元/電路之組合非此領域中之一般周知、常規或習知之組合，不能以元件/單元/電路本身是否為習知，來判定其組合關係是否容易被技術領域中之通常知識者輕易完成。

本發明涵蓋對深度神經網路的權重及激勵函數量化。對於神經網路的權重量化之動機在於可以減少模型的大小以及在訓練和推論過程進行加速運算，就硬體而言，可以使用更少的記憶體與運算資源執行高精確的人工智慧(Artificial Intelligence；AI)應用。而對於激勵函數量化之動機在於能將二元運算代替內積(Inner Product)運算與減少層間資料，就硬體而言，除了可以減少暫存記憶體，還能降低系統內部傳輸所需的頻寬及延遲。

請一併參閱第1圖至第6圖，其中第1圖係繪示本發明第一實施例之基於記憶體內運算電路架構200之量化系統100的示意圖；第2圖係繪示本發明第二實施例之記憶體內運算電路架構200的示意圖；第3圖係繪示第1圖之參數分群模組110的權重張量WK對應到記憶體內運算電路架構200的示意圖；第4圖係繪示第1圖之乘積累加器120的卷積輸出A _l,k分布，其對應單一條位元線(即第2圖的BL[0]~BL[n]之其中一條)的累積電流分布；第5圖係繪示第2圖之記憶體內運算電路架構200的類比數位轉換器220之分類分布

的示意圖；以及第6圖係繪示第5圖之各電流數位值r _i之分類機率的示意圖。如圖所示，基於記憶體內運算電路架構200之量化系統100包含權重量化器Q _W、參數分群模組110、乘積累加器120、卷積量化器Q _AD、加法器130以及激勵函數量化器Q _A。

權重量化器Q _W依據一權重目標位元b _W將一權重W _l量化成一量化權重W _l ^q，權重量化器Q _W包含權重目標位元b _W、權重W _l、映射後量化權重

、量化方程式quan 及量化權重W _l ^q，且權重量化器Q _W符合下列式子(1)與(2)：

上述權重W _l為32位元符點數(FP32)，量化權重W _l ^q為權重目標位元b _W之數位值。

參數分群模組110訊號連接權重量化器Q _W並接收量化權重W _l ^q。參數分群模組110依據分群數值K將量化權重W _l ^q分成複數個分群量化權重

，並依據分群數值K將一輸入激勵函數

分成複數個分群激勵函數

。詳細地說，輸入激勵函數

具有輸入通道數C _in，分群數值K經由輸入通道數C _in與控制參數τ運算求得，分群數值K等於輸入通道數C _in除以控制參數τ。分群數值K為正整數，並大於1且小於等於輸入通道數C _in。具體而言，分群數值K可等於輸入通道數C _in，亦即控制參數τ等於1，但本發明不以此為限。

乘積累加器120訊號連接參數分群模組110，乘積累加器120將任一分群量化權重

及任一分群激勵函數

執行乘積累加運算而產生卷積輸出A _l,k。

卷積量化器Q _AD訊號連接乘積累加器120，卷積量化器Q _AD依據卷積目標位元b _AD將卷積輸出A _l,k量化成量化卷積輸出

。詳細地說，卷積量化器Q _AD可執行一直通估計量化法(Straight-Through-Estimator-based quantization；STE-based quantization)或者一具體量化法(Concrete-based quantization)。其中直通估計量化法包含卷積輸出A _l,k、卷積目標位元 b _AD、映射後卷積輸出

、量化方程式quan及量化卷積輸出

，直通估計量化法符合下列式子(3)~(5)：

上述直通估計量化法的主要概念是在量化過程中考慮到記憶體內運算電路架構200之類比數位轉換器220(Analog-to-Digital Convertor；ADC)有限的位元數，其中映射後卷積輸出

會基於類比數位轉換器220 的位元數將卷積輸出A _l,k截止於特定值，此乃因非揮發性記憶體內運算(Nonvolatile In-Memory Computing；nvIMC)在類比數位轉換器220所能承受之電流(如第2圖之

)是有限的，本發明以類比數位轉換器220位元數的極值作為能承受的電流極限，藉此將卷積輸出A _l,k限制在特定範圍內去模擬量化行為。然後，透過線性量化得到量化卷積輸出

。

具體量化法則包含卷積輸出A _l,k、代表位階R _AD、放大因子α、偏差因子β、電流數位值r _i、激勵函數訊號a、乙狀函數sigmoid、標準差σ _i、具體函數Concrete、溫度常數λ、分類機率π _i、隨機樣本s _i、分群數值K、激勵函數量化訊號a ^q及量化卷積輸出

。具體量化法符合下列式子(6)~(9)：

s _i=Concrete(π _i,λ) (8)；

上述代表位階R _AD等於

。初始之放大因子

，其中

，偏差因子β=0，標準差σ _i=α/3。具體函數Concrete包含雜訊n _i、溫度常數λ、分類機率π _i、隨機樣本s _i、甘貝爾函數Gumbel及歸一化指數函數softmax，具體函數Concrete符合下列式子 (10)~(11)：

n _i=Gumbel(0,1) (10)；

上述具體量化法透過放大因子α與偏差因子β能建構一個可學習的代表位階R _AD，並針對雜訊分佈p(η)與分類分布

進行機率模型建立，其中

且

。對於雜訊分佈p(η)，其雜訊模型假設為平均值為零的邏輯分佈(Logistic Distribution；L)且標準差以σ _i表示；也就是說p(η)=L(0,σ _i)，而分類分布

，如第 5圖所示。以任意輸入訊號x舉例，當輸入訊號x落入雜訊模型時，能在每一個分類分布

計算出對應的尾端機率，如第5圖的陰影區域。然後，將這些基於輸入訊號x的尾端機率作為輸入訊號x對於每一個電流數位值r _i的分類機率，如第6圖所示。以深度神經網路為例，每一個輸入卷積量化器Q _AD之激勵函數訊號

的分類機率符合下列式子(12)~(13)：

其中P代表累積機率密度函數(Cumulative Distribution Function；CDF)。由於邏輯分佈的CDF為乙狀函數sigmoid，因此透過邏輯分佈的假設，能受益於兩個優勢：第一個優點是邏輯分佈與常態分佈很像，也滿足位元線電流分佈；第二個優點是乙狀函數sigmoid可以在訓練時的向後傳播階段進行偏微分運算，不用再產生虛擬梯度，進一步解決梯度不匹配的問題。由上述可知，具體量化法的主要概念是針對類比數位轉換器220之雜訊分佈建立機率模型，並對得到的分類機率π _i標準化。透過分類機率π _i的建立，不但可以模擬出類比數位轉換器220的量化雜訊，還能夠防止深度神經網路過度擬合。

加法器130訊號連接卷積量化器Q _AD，加法器 130依據分群數值K將量化卷積輸出

執行部分和 (partial sum)運算而產生輸出激勵函數A _l。

激勵函數量化器Q _A訊號連接加法器130，激勵函數量化器Q _A依據激勵目標位元b _A將輸出激勵函數A _l量化成一量化輸出激勵函數

。激勵函數量化器Q _A包含輸出激勵函數A _l、剪輯函數Clip、映射後激勵函數

、激勵目標位元b _A、量化方程式quan及量化輸出激勵函數

。激勵函數量化器Q _A符合下列式子(14)與(15)：

上述乘積累加器120、卷積量化器Q _AD及加法器130可依據一迭代次數被重複執行，迭代次數等於分群數值K。藉此，分群量化權重

及分群激勵函數

可分別兩兩成對而完成卷積運算。

藉此，本發明的基於記憶體內運算電路架構200之量化系統100能考慮到硬體規格的位元數限制，並且藉由類比數位轉換器220的分類分布

及具體量化法，訓練一個不但能適應量化雜訊，而且對記憶體內運算友好的量化深度神經網路。

記憶體內運算電路架構200包含記憶體單元210與類比數位轉換器220，其中記憶體單元210訊號連接類比數位轉換器220且包含複數個記憶體細胞元、複數條字元線(如第2圖之WL[0]~WL[m]及第3圖之WL[0]~WL[8])、複數條位元線(如第2圖之BL[0]~BL[n]及第3圖之正權重群(Positive-Weight Group；PG)與負權重群(Negative-Weight Group；NG))及複數條來源線(如第2圖之SL[0]~SL[n])。各記憶體細胞元連接一條字元線、一條位元線及一條來源線。各記憶體細胞元儲存權重值(如第2圖之w _0,0~w _m,n)，各字元線傳送激勵函數訊號a(如第2圖之a ₀~a _m)，各位元線傳送卷積輸出A _l,k(如第2圖之電流

)，各來源線接地。具體而言，記憶體單元210可為電阻式隨機存取記憶體(Resistive Random Access Memory；ReRAM)，但本發明不以此為限。

舉第3圖為例，假設輸入特徵圖之大小為H×W×C _in，權重張量WK之大小為3×3×C _in×C _out(第3圖僅顯示部分權重張量WK)，進行卷積後輸出大小為H×W×C _out的輸出特徵圖。其中H、W分別代表輸入特徵圖的長度與寬度，C _in代表輸入通道數，C _out代表輸出通道數，且字元線數量等於9(即WL[0]~WL[8])。非揮發性記憶體內運算(nvIMC)的卷積運算過程為：將一個大小 3×3×1的部分輸入特徵圖對應到字元線上輸入，並與複數條位元線上的分群量化權重

(3×3個權重值)進行運算，位元線的條數為C _out。經過一個循環時間後，nvIMC會輸出C _out個矩陣向量乘法運算(Matrix-Vector Multiplication；MVM)輸出值，然後透過等待C _in個循環時間後完成C _in×C _out個MVM輸出值，最後將這些MVM輸出值進行合併而獲得1×1×C _out的輸出特徵圖，透過更換WL的部分輸入特徵圖，最後完成一層的卷積運算並得到W×H×C _out大小的輸出特徵圖。藉此，本發明之nvIMC可將分群量化權重

預先儲存至記憶體單元210內，並且透過特定之記憶體內運算電路架構200達到記憶體內的卷積運算功能，可避免傳統架構裡階層記憶體間大量的資料搬運之問題，進而能達到降低系統功耗、降低系統延遲以及提高能源效率。此外，本發明透過ReRAM之卷積將量化權重W _l ^q與輸入激勵函數

分群配對，並考慮有限位元線的記憶體單元210、字元線輸入及卷積輸出A _l,k的離散化，透過深度神經網路的穩健性質，學習到適合nvIMC硬體限制的權重參數。

請一併參閱第1圖至第7圖，其中第7圖係繪示本發明第三實施例之基於記憶體內運算電路架構200之量化方法300的流程示意圖。基於記憶體內運算電路架構200之量化方法300包含量化參數提供步驟S02、參數分群步驟S04、乘積累加步驟S06、卷積量化步驟S08、卷積合併步驟S10、迭代執行步驟S12以及激勵量化步驟 S14。

量化參數提供步驟S02係提供量化參數，量化參數包含輸入激勵函數

、量化權重W _l ^q及分群數值K。詳細地說，輸入激勵函數

具有輸入通道數C _in，分群數值K 經由輸入通道數C _in與控制參數τ運算求得，分群數值K等於輸入通道數C _in除以控制參數τ。分群數值K為正整數，並大於1且小於等於輸入通道數C _in。再者，量化參數提供步驟S02包含權重量化步驟S022，權重量化步驟S022係依據權重目標位元b _W將權重W _l量化成一量化權重W _l ^q，權重量化步驟S022包含權重目標位元b _W、權重 W _l、映射後量化權重

、量化方程式quan及量化權重W _l ^q，量化權重W _l ^q符合前述式子(1)與(2)。

參數分群步驟S04係依據分群數值K將量化權重 W _l ^q分成複數個分群量化權重

，並依據分群數值K將輸入激勵函數

分成複數個分群激勵函數

。

乘積累加步驟S06係將任一分群量化權重

及任一分群激勵函數

執行一乘積累加運算而產生一卷積輸出A _l,k。

卷積量化步驟S08係依據一卷積目標位元b _AD將卷積輸出A _l,k量化成一量化卷積輸出

。詳細地說，卷積量化步驟S08包含執行一直通估計量化法或者一具體量化法，其中直通估計量化法包含卷積輸出A _l,k、卷積目標位元b _AD、映射後卷積輸出

、量化方程式quan及量化卷積輸出

，直通估計量化法符合前述式子(3)~(5)。至於具體量化法則包含卷積輸出A _l,k、代表位階R _AD、放大因子α、偏差因子β、電流數位值r _i、激勵函數訊號a、乙狀函數sigmoid、標準差σ _i、具體函數Concrete、溫度常數λ、分類機率π _i、隨機樣本s _i、分群數值K、激勵函數量化訊號a ^q及量化卷積輸出

。具體量化法符合前述式子 (6)~(9)。此外，具體函數Concrete包含雜訊n _i、溫度常數λ、分類機率π _i、隨機樣本s _i、甘貝爾函數Gumbel及歸一化指數函數softmax，具體函數Concrete符合前述式子(10)~(11)。

卷積合併步驟S10係依據分群數值K將量化卷積輸出

執行一部分和運算而產生一輸出激勵函數A _l。

迭代執行步驟S12係依據迭代次數重複執行乘積累加步驟S06、卷積量化步驟S08及卷積合併步驟S10，迭代次數等於分群數值K。

激勵量化步驟S14係依據一激勵目標位元b _A將輸出激勵函數A _l量化成一量化輸出激勵函數

，激勵量化步驟S14包含輸出激勵函數A _l、剪輯函數Clip、映射後激勵函數

、激勵目標位元b _A、量化方程式quan及量化輸出激勵函數

。量化輸出激勵函數

符合前述式子(14)與(15)。

上述量化方法300可透過表一加以說明，表一顯展本發明的量化方法進行訓練神經網路，其將神經網路的輸入激勵函數

、權重W _l及MVM輸出值(即卷積輸出 A _l,k)分別量化至b _A、b _W與b _AD位元，並考慮了記憶體內運算有限數量的字元數，且引進數值τ作為部分和的控制參數。其中k與l均為變數。

表一第1行至第12行代表一個L深度神經網路推論部分的量化過程，而第13行與第14行分別代表神經網路的反向傳播與權重更新法則，其中SGD代表準確率梯度下降法(Stochastic Gradient Decent)，ADAM代表適應性矩估計(Adaptive Moment Estimation)，上述反向傳播與權重更新法則均為習知技術，其細節不再贅述。

表一第1行與第12行代表從第一層(l=1)開始執行至第L層，每一層會執行第2行至第11行的運算。

表一第2行係對浮點數值的權重W _l進行線性量化至權重目標位元b _W，以獲得量化權重W _l ^q。

表一第3行係根據控制參數τ與量化權重W _l ^q及輸入激勵函數

的輸入通道數C _in進行運算，獲得當前層之分群卷積的分群數值K。在深度學習中，量化權重W _l ^q與輸入激勵函數

在訓練階段都是一個四維的張量(tensor)，其中量化權重W _l ^q的四維分別是「卷積核長度、卷積核寬度、輸入通道數C _in、輸出通道數C _out」；輸入激勵函數

的四維分別是「批次大小、輸入特徵圖長度H、輸入特徵圖寬度W、輸入通道數C _in」。

表一第4行至第9行係說明如何透過迭代運算進行分群卷積，此部份係模擬記憶體內運算電路架構200的有限字元線數量與類比數位轉換器220的轉換。

表一第4行係根據第3行的分群數值K，將量化權重W _l ^q及輸入激勵函數

進行分拆運算，分拆後的張量將會變成五維的張量；換言之，量化權重W _l ^q的維度將會從原先的「卷積核長度、卷積核寬度、輸入通道數C _in、輸出通道數C _out」經由對輸入通道數C _in進行切割而變更為「卷積核長度、卷積核寬度、控制參數τ、輸出通道數C _out、分群數值K」；而輸入激勵函數

的維度則會從原先的「批次大小、輸入特徵圖長度H、輸入特徵圖寬度W、輸入通道數C _in」分切成「批次大小、輸入特徵圖長度H、輸入特徵圖寬度W、控制參數τ、分群數值K」。因此從第五維來看，能得到K組切割後的權重與張量；也就是說，能以(卷積核長度×卷積核寬度×τ)決定開啟字元線(WL)的數量，亦即由控制參數τ與卷積核大小決定。

表一第5行與第9行係執行迭代運算，其代表從k=1開始執行至k=K，每一次會執行第6行至第8行的運算。

表一第6行係將分群量化權重

與分群激勵函數

進行卷積運算。舉第一組分群(k=1)之分群量化權重

與分群激勵函數

為例，其中分群量化權重

與分群激勵函數

的張量維度分別為「卷積核長度、卷積核寬度、控制參數τ、輸出通道數C _out」與「批次大小、輸入特徵圖長度H、輸入特徵圖寬度W、控制參數τ」，將兩者進行卷積運算後可產生並輸出浮點數值的卷積輸出A _l,k(即MVM輸出值)。

表一第7行係對浮點數值的卷積輸出A _l,k進行量化，量化後將輸出一個b _AD位元的量化卷積輸出

，此部份模擬類比數位轉換器220的量化行為。

表一第8行係將量化後的數值(即量化卷積輸出

) 進行部分和運算，將每次迭代的數值進行相加，以達到所提出的分群卷積等效於傳統卷積運算之目的。

表一第10行係對累加完成的部分和(即輸出激勵函數A _l)進行激勵函數的線性量化，運算後獲得b _A位元的量化輸出激勵函數

。第11行係進行深度神經網路的其他運算(如池化)，此為習知技術，其細節不再贅述。執行完第12行代表經過L層神經網路，且結束網路的正向傳遞(Forward Propagation)。

表二顯示在各式數據集上不同控制參數τ的測試錯誤率，其透過控制參數τ模擬字元線之開啟數量。字元線之開啟數量決定了位元線上的累加電流大小與極值，不同字元線之開啟數量對於測試錯誤率會造不同程度的影響。本實施例之控制參數τ={1,2,4}，以核大小為3×3的卷積層來說，也就是字元線之L開啟數量相當於{9,18,36}條，可以從實驗結果得到一個論證，由於類比數位轉換器220的存在，過多的字元線之開啟數量會導致錯誤率的上升。在b _W-b _A-b _AD為2-2-4及CIFAR-10數據集的測試條件下，基於ReRAM卷積(τ=1)相較於不經ReRAM卷積(τ=V)之錯誤率能降低0.48%。在MNIST數據集也能有0.5%的錯誤率下降。

第8圖係繪示本發明之具體量化法與直通估計量化法基於類比數位轉換器位元數(Bit)的正確率之比較圖，其測試條件包含使用圖像分類數據集CIFAR-10、權重目標位元b _W為2位元以及激勵目標位元b _A為2位元。在不同的卷積目標位元b _AD時，基於具體分佈的卷積量化器Q _AD在每一個位元都相較於基於直通估計量化法的卷積量化器Q _AD更好的表現，在3位元至8位元有著平均0.88%的優化，特別是在的卷積目標位元b _AD為2位元時，基於具體分佈的卷積量化器Q _AD能夠有9.52%的正確率提升。

第9圖係繪示本發明之具體量化法與直通估計量化法基於控制參數τ的正確率之比較圖，其測試條件包含使用圖像分類數據集CIFAR-10、權重目標位元b _W為2位元、激勵目標位元b _A為2位元以及卷積目標位元b _AD為2位元。在不同的控制參數τ時，基於具體分佈的卷積量化器Q _AD在每一個數值都相較於基於直通估計量化法的卷積量化器Q _AD有平均2.92%的進步。

由上述實施方式可知，本發明具有下列優點：其一，基於記憶體內運算電路架構之量化系統能考慮到硬體規格的位元數限制，並且藉由類比數位轉換器的分類分布及具體量化法，訓練一個不但能適應量化雜訊，而且對記憶體內運算友好的量化深度神經網路。其二，基於記憶體內運算電路架構之量化方法可將分群量化權重預先儲存至記憶體單元內，並且透過特定之記憶體內運算電路架構達到記憶體內的卷積運算功能，可避免傳統架構裡階層記憶體間大量的資料搬運之問題，進而能達到降低系統功耗、降低系統延遲以及提高能源效率。其三，本發明將量化權重與輸入激勵函數分群配對，並考慮有限位元線的記憶體單元、字元線輸入及卷積輸出的離散化，透過深度神經網路的穩健性質，學習到適合非揮發性記憶體內運算之硬體限制的權重參數。

雖然本發明已以實施方式揭露如上，然其並非用以限定本發明，任何熟習此技藝者，在不脫離本發明之精神和範圍內，當可作各種之更動與潤飾，因此本發明之保護範圍當視後附之申請專利範圍所界定者為準。

100:量化系統

110:參數分群模組

120:乘積累加器

130:加法器

A _l:輸出激勵函數

A _l,k:卷積輸出

:輸入激勵函數

:分群激勵函數

:量化卷積輸出

:量化輸出激勵函數

b _A:激勵目標位元

b _AD:卷積目標位元

b _W:權重目標位元

FP32:32位元符點數

Q _A:激勵函數量化器

Q _W:權重量化器

Q _AD:卷積量化器

W _l:權重

W _l ^q:量化權重

:分群量化權重

Claims

一種基於記憶體內運算電路架構之量化方法，包含以下步驟：

一量化參數提供步驟，係提供一量化參數，該量化參數包含一輸入激勵函數、一量化權重及一分群數值；

一參數分群步驟，係依據該分群數值將該量化權重分成複數個分群量化權重，並依據該分群數值將該輸入激勵函數分成複數個分群激勵函數；

一乘積累加步驟，係將任一該分群量化權重及任一該分群激勵函數執行一乘積累加運算而產生一卷積輸出；

一卷積量化步驟，係依據一卷積目標位元將該卷積輸出量化成一量化卷積輸出；以及

一卷積合併步驟，係依據該分群數值將該量化卷積輸出執行一部分和運算而產生一輸出激勵函數。
如請求項1所述之基於記憶體內運算電路架構之量化方法，其中該輸入激勵函數具有一輸入通道數，該分群數值經由該輸入通道數與一控制參數運算求得，該分群數值等於該輸入通道數除以該控制參數，該分群數值為正整數，並大於1且小於等於該輸入通道數。
如請求項2所述之基於記憶體內運算電路架構之量化方法，更包含：

一迭代執行步驟，係依據一迭代次數重複執行該乘積累加步驟、該卷積量化步驟及該卷積合併步驟，該迭代次數等於該分群數值。
如請求項1所述之基於記憶體內運算電路架構之量化方法，其中該量化參數提供步驟包含：

一權重量化步驟，係依據一權重目標位元將一權重量化成該量化權重，該權重量化步驟包含該權重目標位元、該權重、一映射後量化權重、一量化方程式及該量化權重，該權重目標位元表示為b _W，該權重表示為W _l，該量化方程式表示為quan，該量化權重表示為W _l ^q且符合下式：
如請求項1所述之基於記憶體內運算電路架構之量化方法，更包含：

一激勵量化步驟，係依據一激勵目標位元將該輸出激勵函數量化成一量化輸出激勵函數，該激勵量化步驟包含該輸出激勵函數、一剪輯函數、一映射後激勵函數、該激勵目標位元、一量化方程式及該量化輸出激勵函數，該輸出激勵函數表示為A _l，該剪輯函數表示為Clip，該映射後激勵函數表示為
，該激勵目標位元表示為b _A，該量化方程式表示為quan，該量化輸出激勵函數表示為
且符合下式：
如請求項1所述之基於記憶體內運算電路架構之量化方法，其中該卷積量化步驟包含：

執行一直通估計量化法，該直通估計量化法包含該卷積輸出、該卷積目標位元、一映射後卷積輸出、一量化方程式及該量化卷積輸出，該卷積輸出表示為A _l,k，該卷積目標位元表示為b _AD，該映射後卷積輸出表示為
，該量化方程式表示為quan，該量化卷積輸出表示為
，該直通估計量化法符合下式：
如請求項1所述之基於記憶體內運算電路架構之量化方法，其中該卷積量化步驟包含：

執行一具體量化法，該具體量化法包含該卷積輸出、一代表位階、一放大因子、一偏差因子、一電流數位值、一激勵函數訊號、一乙狀函數、一標準差、一具體函數、一溫度常數、一分類機率、一隨機樣本、該分群數值、一激勵函數量化訊號及該量化卷積輸出，該卷積輸出表示為A _l,k，該代表位階表示為R _AD，該放大因子表示為α，該偏差因子表示為β，該電流數位值表示為r _i，該激勵函數訊號表示為a，該乙狀函數表示為sigmoid，該標準差表示為σ _i，該具體函數表示為Concrete，該溫度常數表示為λ，該分類機率表示為π _i，該隨機樣本表示為s _i，該分群數值表示為K，該激勵函數量化訊號表示為a ^q，該量化卷積輸出表示為
，該具體量化法符合下式：

s _i=Concrete(π _i,λ)；及
如請求項7所述之基於記憶體內運算電路架構之量化方法，其中該具體函數包含一雜訊、該溫度常數、該分類機率、該隨機樣本、一甘貝爾函數及一歸一化指數函數，該雜訊表示為n _i，該甘貝爾函數表示為Gumbel，該歸一化指數函數表示為softmax，該具體函數符合下式：

n _i=Gumbel(0,1)；及
一種基於記憶體內運算電路架構之量化系統，包含：

一參數分群模組，依據一分群數值將一量化權重分成複數個分群量化權重，並依據該分群數值將一輸入激勵函數分成複數個分群激勵函數；

一乘積累加器，訊號連接該參數分群模組，該乘積累加器將任一該分群量化權重及任一該分群激勵函數執行一乘積累加運算而產生一卷積輸出；

一卷積量化器，訊號連接該乘積累加器，該卷積量化器依據一卷積目標位元將該卷積輸出量化成一量化卷積輸出；以及

一加法器，訊號連接該卷積量化器，該加法器依據該分群數值將該量化卷積輸出執行一部分和運算而產生一輸出激勵函數。
如請求項9所述之基於記憶體內運算電路架構之量化系統，其中該輸入激勵函數具有一輸入通道數，該分群數值經由該輸入通道數與一控制參數運算求得，該分群數值等於該輸入通道數除以該控制參數，該分群數值為正整數，並大於1且小於等於該輸入通道數。
如請求項10所述之基於記憶體內運算電路架構之量化系統，其中該乘積累加器、該卷積量化器及該加法器依據一迭代次數被重複執行，該迭代次數等於該分群數值。
如請求項9所述之基於記憶體內運算電路架構之量化系統，更包含：

一權重量化器，訊號連接該參數分群模組，該權重量化器依據一權重目標位元將一權重量化成該量化權重，該權重量化器包含該權重目標位元、該權重、一映射後量化權重、一量化方程式及該量化權重，該權重目標位元表示為b _W，該權重表示為W _l，該量化方程式表示為quan，該量化權重表示為W _l ^q，該權重量化器表示為Q _W且符合下式：
如請求項9所述之基於記憶體內運算電路架構之量化系統，更包含：

一激勵函數量化器，訊號連接該加法器，該激勵函數量化器依據一激勵目標位元將該輸出激勵函數量化成一量化輸出激勵函數，該激勵函數量化器包含該輸出激勵函數、一剪輯函數、一映射後激勵函數、該激勵目標位元、一量化方程式及該量化輸出激勵函數，該輸出激勵函數表示為 A _l，該剪輯函數表示為Clip，該映射後激勵函數表示為
，該激勵目標位元表示為b _A，該量化方程式表示為quan，該量化輸出激勵函數表示為
，該激勵函數量化器表示為Q _A且符合下式：
如請求項9所述之基於記憶體內運算電路架構之量化系統，其中該卷積量化器執行一直通估計量化法，該直通估計量化法包含該卷積輸出、該卷積目標位元、一映射後卷積輸出、一量化方程式及該量化卷積輸出，該卷積輸出表示為A _l,k，該卷積目標位元表示為b _AD，該映射後卷積輸出表示為
，該量化方程式表示為quan，該量化卷積輸出表示為
，該直通估計量化法符合下式：
如請求項9所述之基於記憶體內運算電路架構之量化系統，其中該卷積量化器執行一具體量化法，該具體量化法包含該卷積輸出、一代表位階、一放大因子、一偏差因子、一電流數位值、一激勵函數訊號、一乙狀函數、一標準差、一具體函數、一溫度常數、一分類機率、一隨機樣本、該分群數值、一激勵函數量化訊號及該量化卷積輸出，該卷積輸出表示為A _l,k，該代表位階表示為R _AD，該放大因子表示為α，該偏差因子表示為β，該電流數位值表示為r _i，該激勵函數訊號表示為a，該乙狀函數表示為sigmoid，該標準差表示為σ _i，該具體函數表示為Concrete，該溫度常數表示為λ，該分類機率表示為π _i，該隨機樣本表示為s _i，該分群數值表示為K，該激勵函數量化訊號表示為a ^q，該量化卷積輸出表示為
，該具體量化法符合下式：

s _i=Concrete(π _i,λ)；及
如請求項15所述之基於記憶體內運算電路架構之量化系統，其中該具體函數包含一雜訊、該溫度常數、該分類機率、該隨機樣本、一甘貝爾函數及一歸一化指數函數，該甘貝爾函數表示為Gumbel，該雜訊表示為n _i，該歸一化指數函數表示為softmax，該具體函數符合下式：

n _i=Gumbel(0,1)；及