TWI758897B - 卷積計算裝置及方法 - Google Patents
卷積計算裝置及方法 Download PDFInfo
- Publication number
- TWI758897B TWI758897B TW109134986A TW109134986A TWI758897B TW I758897 B TWI758897 B TW I758897B TW 109134986 A TW109134986 A TW 109134986A TW 109134986 A TW109134986 A TW 109134986A TW I758897 B TWI758897 B TW I758897B
- Authority
- TW
- Taiwan
- Prior art keywords
- data
- convolution
- weight data
- compressed
- computing device
- Prior art date
Links
- 238000004364 calculation method Methods 0.000 title claims abstract description 46
- 238000000034 method Methods 0.000 title description 7
- 230000006837 decompression Effects 0.000 claims abstract description 30
- 238000007906 compression Methods 0.000 claims description 24
- 230000006835 compression Effects 0.000 claims description 23
- 238000006243 chemical reaction Methods 0.000 claims description 19
- 230000005540 biological transmission Effects 0.000 abstract description 3
- 230000003247 decreasing effect Effects 0.000 abstract 1
- 238000005303 weighing Methods 0.000 abstract 1
- 238000010586 diagram Methods 0.000 description 17
- 230000000295 complement effect Effects 0.000 description 13
- 238000003672 processing method Methods 0.000 description 12
- 238000013507 mapping Methods 0.000 description 5
- 238000013527 convolutional neural network Methods 0.000 description 4
- 238000013473 artificial intelligence Methods 0.000 description 2
- 238000005094 computer simulation Methods 0.000 description 2
- 238000013144 data compression Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 230000000873 masking effect Effects 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 230000008521 reorganization Effects 0.000 description 1
Images
Landscapes
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
一種卷積計算裝置,應用於卷積層的卷積計算,包含:解壓縮電路、資料組合電路及計算電路。解壓縮電路對卷積層的卷積核的壓縮權重資料進行解壓縮,以產生解壓後權重資料。資料組合電路用以組合解壓後資料與卷積核的未壓縮權重資料,以還原卷積核的權重資料的資料順序。計算電路根據卷積核的權重資料及卷積層的輸入資料進行計算。由於是將預先經過壓縮的卷積核的權重資料傳輸給卷積計算裝置,當進行卷積運算時,先對壓縮後的權重資料進行解壓縮後,再據以進行卷積運算,可降低卷積核在電子設備中所佔用的儲存空間及傳輸時所需的頻寬。
Description
本發明是關於卷積計算技術,尤其是關於一種卷積計算裝置及方法。
目前,越來越多的領域開始應用人工智慧技術。在人工智慧技術中,電子設備可以利用訓練樣本對計算模型(即神經網路模型)進行機器學習。之後,電子設備可以利用訓練好的計算模型來執行一些任務,如分類和預測等。比如,卷積神經網路(Convolutional Neural Networks;CNN)可以用於影像識別等。然而,有些卷積層中卷積核的資料龐大,導致在電子設備上進行卷積層的卷積處理時需要佔用較多的系統資源。
鑑於先前技術的問題,本發明之一目的在於提供一種卷積計算裝置及方法,以改善先前技術。
本發明包含一種卷積計算裝置,應用於卷積層的卷積計算,包含:解壓縮電路、資料組合電路以及計算電路。解壓縮電路用以對卷積層的卷積核的壓縮權重資料進行解壓縮,以產生解壓後權重資料。資料組合
電路用以組合解壓後資料與卷積核的未壓縮權重資料,以還原卷積核的權重資料的資料順序。計算電路根據該卷積核的權重資料及該卷積層的輸入資料進行計算。
本發明另包含一種卷積計算裝置,應用於卷積層的卷積計算,包含:解壓縮電路以及計算電路。解壓縮電路用以對卷積層的卷積核的壓縮權重資料進行解壓縮,以產生解壓後權重資料。計算電路根據解壓後權重資料及卷積層的輸入資料進行計算。其中,壓縮權重資料及輸入資料分別儲存於記憶體的不同區塊中。
本發明更包含一種卷積計算方法,應用於卷積層的卷積計算,包含:對卷積層的卷積核的壓縮權重資料進行解壓縮,以產生解壓後權重資料;以及根據解壓後權重資料及卷積層的輸入資料進行計算;其中,壓縮權重資料及輸入資料分別儲存於記憶體的不同區塊中。
有關本案的特徵、實作與功效,茲配合圖式作較佳實施例詳細說明如下。
101~105:步驟
20:卷積計算裝置
201:記憶體
202:解壓縮電路
203:計算電路
301~310:步驟
60:卷積計算裝置
601:記憶體
602:解壓縮電路
603:計算電路
604:資料組合電路
605:轉換電路
〔圖1〕顯示本發明之一實施例中,一種資料處理方法的流程示意圖;〔圖2〕顯示本發明之一實施例中,一種卷積計算裝置的方塊示意圖;〔圖3〕顯示本發明之一實施例中,資料處理方法的另一流程示意圖;〔圖4〕顯示本發明之一實施例中,卷積核的權重資料示意圖;〔圖5〕顯示本發明之一實施例中,將權重資料由補數轉換為原數的示意圖;
〔圖6〕顯示本發明之另一實施例中,卷積計算裝置的方塊示意圖;〔圖7〕顯示本發明之一實施例中,權重資料對應的壓縮字元的示意圖;以及〔圖8〕至〔圖14〕顯示本發明之一實施例中,資料處理方法的場景示意圖。
請參照圖示,其中相同的元件符號代表相同的元件,本發明的原理是以實施在一適當的運算環境中來舉例說明。以下的說明是基於所範例性示出的本發明具體實施例,其不應被視為限制本發明未在此詳述的其它具體實施例。
本發明提出可應用於卷積計算裝置的資料處理方法及對應的卷積計算裝置,其藉由預先將卷積層中卷積核的權重資料進行壓縮,再將壓縮後權重資料輸入至對應的卷積計算裝置中。當卷積計算裝置進行運算時,再對壓縮後權重資料進行解壓縮,藉此可降低卷積核權重資料所佔用的系統資源。實施上,本發明提出的卷積計算裝置可應用於諸如智慧型手機、平板電腦、安控裝置等電子設備上。
請參照圖1。圖1顯示本發明一實施例中,一種資料處理方法的流程示意圖,詳細說明如下。
步驟101中,獲取一訓練好的計算模型的一卷積層對應的一卷積核的權重資料,上述計算模型可以為卷積神經網路。
步驟102中,對卷積核的權重資料進行壓縮,得到壓縮後的權重資料。一實施例中,步驟101及步驟102是由一處理器執行特定程序代碼所實現,而此處理器並不在卷積計算裝置中,也就是說,步驟101及步驟102是由
卷積計算裝置外部的處理器預先對卷積核的權重資料進行壓縮處理。實施上,用以壓縮卷積核的權重資料的壓縮格式可為霍夫曼(Huffman)壓縮格式。
步驟103中,將壓縮後的權重資料傳輸到具有卷積計算裝置的電子設備上,例如,將壓縮後的權重資料傳輸到電子設備的記憶體。
在一實施例中,將預先壓縮好的權重資料傳輸到需使用此權重資料的電子設備上,實施上,壓縮後的權重資料是儲存於電子設備中一記憶體的一第一區塊中,而與此權重資料對應的卷積層的輸入資料是儲存於此記憶體的一第二區塊中。
步驟104中,對壓縮後的權重資料進行解壓縮。實施上,可由卷積計算裝置中的解壓縮電路對壓縮後的權重資料進行解壓縮處理。
請參照圖2。圖2顯示本發明一實施例中,一種卷積計算裝置的方塊示意圖。卷積計算裝置20設置於一電子設備中,此電子設備的記憶體201中儲存有一壓縮後的權重資料,其對應一卷積層的卷積核,記憶體201中亦可儲存此卷積層的輸入資料。當卷積計算裝置20進行卷積運算時,解壓縮電路202自記憶體201讀取壓縮後的權重資料,並對壓縮後的權重資料進行解壓縮。若壓縮權重資料的壓縮格式為霍夫曼壓縮格式時,解壓縮電路202可根據一霍夫曼碼表對壓縮後的權重資料進行解壓縮。
步驟105中,根據解壓縮後的權重資料進行卷積計算。當卷積計算裝置20進行卷積運算時,計算電路203根據解壓縮後的權重資料及對應的卷積層的輸入資料進行卷積計算。
由上可知,由於是將預先經過壓縮的卷積核的權重資料傳輸給電子設備,當進行卷積運算時,先對壓縮後的權重資料進行解壓縮後,電子設備上的卷積計算裝置再據以進行卷積運算,因此,可降低卷積核在電子設備中所佔用的儲存空間及傳輸時所需的頻寬,進而在進行卷積處理時節省系統資源。
請參照圖3,圖3顯示本發明一實施例中,資料處理方法的另一流程示意圖,詳細說明如下。
步驟301中,獲取一卷積神經網路的一卷積層對應的一卷積核的權重資料。
請參照圖4。圖4顯示本發明一實施例中,卷積核的權重資料示意圖。如圖4所示,一卷積層的卷積核的權重資料為5列12行的一個二維數組,即該卷積核共包含60個權重。在其它實施方式中,卷積核可以是具有其它行數和列數的二維數組,或者卷積核可以是三維或者四維等的數組。
步驟302中,對卷積核的權重資料進行格式轉換。為進一步降低資料量,可對卷積核的權重資料進行格式轉換,例如將卷積核的各權重由補數轉換為原數。
請參照圖5。圖5顯示本發明一實施例中,將權重資料由補數轉換為原數的示意圖。以卷積核的第1列第5行的權重為例,該權重的補數為FB(其真值為-5)。電子設備可以將該權重由補數FB轉換為原數85。需要說明的是,補數FB對應的二進位表示為11111011,其中高4位元的1111代表F(16進位),低4位元的1011代表B(16進位)。補數11111011轉換為原數是10000101。原數10000101中的高4位元1000對應的16進位數為8,低4位元0101
對應的16進位數為5。因此,FB由補數轉換為原數是85。需要說明的是,正數的補數和原數相同。
另外,一般在電腦設備中卷積核的權重資料並不是以16進位的形式儲存的,而是以具有多個位元的二進位的形式儲存的。例如,圖4中卷積核的第1列第5行的權重FB在電腦設備中並不是以FB的形式儲存的,而是以具有很多位元的二進位數的形式儲存的。
步驟303中,按照預設規則確定卷積核的各權重資料對應的8位元二進位數字。在對卷積核的權重資料進行格式轉換之後,可再按照一預設規則確定卷積核的各權重所對應的8位元二進位數字。在一實施方式中,預設規則可以是將卷積核的各權重所包含的兩個位元的數字分別轉換為對應的4位元二進位數字,並將得到的兩個4位元二進位數字按照位元的順序拼接成8位元二進位數字。
例如,卷積核的第1列第5行的權重為85,其中85中的「8」對應的二進位數字為1000,「5」對應的二進位數字0101,因此權重85對應的二進位數字可以由1000和0101拼接而成,即10000101。又例如,卷積核的第3列第4行的權重為81,其中81中的「8」對應的二進位數字為1000,「1」對應的二進位數字0001,因此權重81對應的二進位數字可以由1000和0001拼接而成,即10000001。
步驟304中,從卷積核的各權重對應的8位元二進位數字中提取第一部分資料和第二部分資料,該第一部分資料為8位元二進位數字中除最高位元的數字和最低的三個位元的數字外的其它數字,該第二部分資料包含8位元二進位數字中的最高位元的數字和最低的三個位元的數字。
例如,權重85對應的8位元二進位數字為10000101,則第一部分資料為0000(即從低到高的順序中的第7位元、第6位元、第5位元和第4位元),第二部分資料1101(即從低到高的順序中的第8位元、第3位元、第2位元和第1位元)。又例如,權重81對應的8位元二進位數字為10000001,則第一部分資料為0000(即從低到高的順序中的第7位元、第6位元、第5位元和第4位元),第二部分資料為1001(即從低到高的順序中的第8位元、第3位元、第2位元和第1位元)。
步驟305中,對各權重對應的第一部分資料進行壓縮。在得到卷積核的各權重對應的第一部分資料和第二部分資料後,可對各權重對應的第一部分資料進行無失真壓縮,壓縮後的第一部分資料與未壓縮的第二部分資料可分開儲存,也是說,經壓縮的第一部分資料是集中儲存在一起,而未經壓縮的第二部分資料是集中儲存在一起。
一實施例中,在對各權重對應的第一部分資料進行的壓縮可以是霍夫曼壓縮。霍夫曼壓縮是一種無失真壓縮方式,它可以用較少的位元表示出現頻率較高的字元,用較多的位元表示出現頻率較低的字元,進而達到資料壓縮的目的。
例如,所有權重的第一部分資料中「0000」出現的頻率最高,在霍夫曼編碼中「0000」用字元「1」表示,這樣卷積核的資料就可以實現壓縮目的了。
步驟302中之所以要將卷積核中的權重由補數轉換為原數,並從卷積核中提取第一部分資料,且對第一部分資料進行壓縮,是因為正數和
負數的原數的第一部分資料相同,因此可以提高卷積核對應的資料的壓縮率。
步驟306中,將壓縮後的權重資料及未壓縮的權重資料傳輸至一需使用這些資料的電子設備。此電子設備具有一卷積計算裝置,請參照圖6。圖6顯示本發明另一實施例中,卷積計算裝置的方塊示意圖。卷積計算裝置60可利用儲存在電子設備中的壓縮後的權重資料及未壓縮的權重資料進行卷積計算。這裡的壓縮後的權重資料即前述的壓縮後的第一部分資料,而未壓縮的權重資料即前述的第二部分資料。實施上,壓縮後的權重資料及未壓縮的權重資料儲存於電子設備中一記憶體不同的區塊中,而步驟301至步驟306是由一處理器執行特定程序代碼所實現,而此處理器並不在包含卷積計算裝置60的電子設備中。
步驟307中,對壓縮後的權重資料進行解壓縮。當卷積計算裝置進行卷積計算時,解壓縮電路自記憶體601讀取壓縮後的權重資料,並進行解壓縮處理。若壓縮權重資料的壓縮格式為霍夫曼壓縮格式時,解壓縮電路602可根據一霍夫曼碼表對壓縮後的權重資料進行解壓縮,霍夫曼碼表可儲存於一寄存器中。解壓縮電路602可將解壓後所得到的各權重對應的第一部分資料存回記憶體601中或直接輸出到資料組合電路604。
步驟308中,組合解壓後權重資料與未壓縮權重資料,以還原卷積核的權重資料的資料順序。一實施例中,解壓後所得到的各權重對應的第一部分資料儲存於記憶體601中,資料組合電路604交錯地自記憶體601中讀取第一部分資料及第二部分資料(即未壓縮的權重資料),並重排序兩者的各權重中資料的順序,以還原權重資料原始的順序。實施上,資料組
合電路604依據步驟304中取出第一部分資料及第二部分資料的規則,進行反向處理,以還原權重資料原始的順序。
步驟309中,對已還原順序的權重資料進行格式轉換,以還原權重資料原始格式。轉換電路605依據步驟302中所進行格式轉換對順序還原好的權重資料進行格式還原處理。舉例來說,若步驟302中是將卷積核中的權重資料由補數轉換為原數,轉換電路605則會將已還原順序的權重資料中的原數轉換為補數,以將權重資料還原成原始的格式。若權重資料在壓縮前有進行其它的格式轉換,轉換電路605亦會進行反向的格式轉換,以將權重資料還原成原始的格式。實施上,轉換電路605亦可在第一部分資料與第二部分資料重組前就對解壓縮後的權重資料進行反向格式轉換。
步驟310中,計算電路603根據已還原的權重資料及對應卷積層的輸入資料進行卷積計算。
在一實施例中,對卷積核的權重資料進行壓縮前,可先判斷卷積核的權重資料的資料量是否大於一預設閾值,若是,則對卷積核對應的權重資料進行分塊,得到至少兩個資料區塊,再分別對這兩個資料區塊進行壓縮。需要說明的是,由於卷積計算裝置的儲存空間較小,因此當卷積核的資料量較大時,可以先對卷積核對應的資料進行分塊,再對每一區塊進行壓縮,卷積計算裝置則可以在對各資料區塊對應的壓縮資料進行解壓縮後再拼接還原成一個完整的卷積核。本實施例中,如果需要對卷積核對應的資料進行分塊,電子設備可對分塊後得到的所有資料區塊進行統一的霍夫曼壓縮編碼,即同一個卷積層的卷積核只會對應於一個霍夫曼碼表。
在一實施例中,對各權重對應的第一部分資料所進行的壓縮處理可包含兩階段,第一階段為先將各權重對應的第一部分資料轉換為16進位的壓縮字元。第二階段為獲取卷積核的所有權重對應的壓縮字元,並對所有壓縮字元進行編碼壓縮,得到壓縮資料和解壓縮映射關係表,所述解壓縮映射關係表中記載有各壓縮字元及其對應的壓縮編碼。實施上,亦可將各權重對應的第二部分數字轉換為16進位的目標字元。而卷積計算裝置則會進行對應的反向處理,以還原原始的權重資料。
在一具體實施例中,經補數轉原數的轉換後,可將各權重對應的第一部分資料轉換為16進位的壓縮字元。例如,權重85對應的第一部分資料為0000,該第一部分資料0000對應的16進位的字元為0,該0即是權重85對應的第一部分資料轉換而來的壓縮字元。又例如,權重81對應的第一部分資料為0000,該第一部分資料0000對應的16進位的字元為0,該0即是權重81對應的第一部分資料轉換而來的壓縮字元。
在獲取到卷積核中的所有權重對應的壓縮字元後,可對所有壓縮字元進行霍夫曼(Huffman)編碼壓縮,進而得到壓縮資料和解壓縮間的映射關係表,該解壓縮映射關係表中記載有各壓縮字元及其對應的霍夫曼編碼。該解壓縮映射關係表即為用於解壓縮的霍夫曼碼表。
例如,卷積核的所有權重對應的壓縮字元按照各權重在卷積核中的行列位置進行排列得到的二維數組如圖7所示。
圖7顯示本發明一實施例中,權重資料對應的壓縮字元的示意圖。即,圖7中的二維數組的第1列第1行的字元為第二卷積核中的第1列第1
行的權重對應的壓縮字元。二維數組的第1列第2行的字元為第二卷積核中的第1列第2行的權重對應的壓縮字元,等等,依此類推。
在獲取到所有的壓縮字元後,即可對這些壓縮字元進行霍夫曼編碼壓縮,進而得到壓縮資料以及對應的用於解壓縮的霍夫曼碼表。例如,由於所有的壓縮字元中「0」出現了54次,「1」出現了5次,「3」出現了1次。因此,通過建構霍夫曼樹(Huffman Tree)可得,「0」對應的霍夫曼編碼可以為「1」,「1」對應的霍夫曼編碼可以為「01」,「3」對應的霍夫曼編碼可以為「00」。
圖8至圖9顯示本發明之一實施例中,資料處理方法的場景示意圖。霍夫曼樹可以如圖8所示,霍夫曼碼表可以如圖9所示。
此外,還可將卷積核的各權重對應的第二部分資料轉換為16進位的目標字元。這樣的話,當卷積計算裝置需要對壓縮後的卷積核進行解壓縮時,卷積計算裝置可將該壓縮資料解壓為各權重對應的壓縮字元,並將各權重對應的壓縮字元還原為各權重對應的第一部分資料。同時,卷積計算裝置可以將各權重對應的目標字元還原為各權重對應的第二部分資料。之後,卷積計算裝置再進行第一部分資料和第二部分資料重組及格式轉換等處理,以還原原始的權重資料。
可以理解的是,上述將第一部分資料和第二部分資料均轉換為16進位的字元的方式可以進一步提高壓縮率進而進一步降低在傳輸壓縮後的卷積核時的頻寬。
在一實施例中,為了進一步降低傳輸頻寬,可以通過如下方式對經過霍夫曼壓縮後的資料再進行壓縮。例如,卷積核的各權重的第一部分
資料轉換成的壓縮字元在經過霍夫曼壓縮編碼後的數組可以如圖10所示。其中,圖10顯示本發明之一實施例中,資料處理方法的場景示意圖。比如,本實施例將壓縮後的霍夫曼資料分成兩個資料區塊,即第1行至第6行為第一資料區塊,第7行至第12行為第二資料區塊,其中,第一資料區塊和第二資料區塊均各自佔據15個位元組(Byte)。對於第一資料區塊,本實施例可以按照從左至右、從上到下的順序每4個字元截取作為一個部分、不足4個字元則進行末尾補零的方式將第一資料區塊(共33個字元)轉換為10個部分,再將每個部分的字元轉換為16進位的字元,這樣第一資料區塊就被轉換為如下字元:FBFFEEFF80,如圖11所示。圖11顯示本發明之一實施例中,資料處理方法的場景示意圖。可以理解的是,在電子設備中FBFFEEFF80一共佔據5個位元組(Byte)。同理,對於第二資料區塊,本實施例可以按照從左至右、從上到下的順序每4個字元截取作為一個部分、不足4個字元則進行末尾補零的方式將第一資料區塊(共33個字元)轉換為10個部分,再將每個部分的字元轉換為16進位的字元,這樣第一資料區塊就被轉換為如下字元:7FFFE7FE80,如圖12所示。圖12顯示本發明之一實施例中,資料處理方法的場景示意圖。可以理解的是,在電子設備中7FFFE7FE80一共佔據5個位元組(Byte)。藉由上述方式,卷積核的第一部分數字對應的壓縮資料由原來的30個位元組進一步壓縮為10個位元組,壓縮率得以提高。
在一實施例中,如果對第一部分資料進行4位元的霍夫曼編碼壓縮,則霍夫曼編碼的最大長度為15位元(即24-1)。如果卷積計算裝置只有32位元作為碼表單元,其中的4位元要用於計數,14位元要用於做遮罩,那麼還有14位元可以用於做碼值。也就是說最大只有14位元表示碼值。如果遇
到15位元碼值的,此時需要對霍夫曼樹進行修正,進而使修正後的霍夫曼樹的最大位元為14位,例如以通過如下方式來修正霍夫曼樹,對所有的字元中出現頻率最低的4個字元的頻率進行改變,進而使霍夫曼樹的層數減少1層,這樣的話最長的15位元的霍夫曼編碼就會降低為14位元。例如,原來的出現頻率最低的4個字元的出現頻率依此為1、2、4、8,那麼這4個字元對應的霍夫曼樹的形狀可以如圖13所示。本發明可以將這4個字元的的頻率值依此修改為3、4、4、4,這樣的話這4個字元對應的霍夫曼樹的形狀就變為如圖14所示。其中,圖13至圖14顯示本發明之一實施例中,資料處理方法的場景示意圖。通過對比圖13和圖14可知,霍夫曼樹的層數減少了一層,這樣最長的霍夫曼編碼就由15位元變為了14位元。需要說明的是,圖13和圖14中僅繪示出了關於出現頻率最低的4個字元的霍夫曼樹,而沒有繪示出其他字元對應的霍夫曼樹的節點示意圖。需要說明的是,雖然頻率值被改變了,但霍夫曼碼表中的各字元及其對應的編碼仍然是正確的,不會出錯。
以上對本發明實施例所提供的一種資料處理方法及卷積計算裝置進行了詳細介紹,本文中應用了具體個例對本發明的原理及實施方式進行了闡述,以上實施例的說明只是用於幫助理解本發明的方法及其核心思想;同時,對於本領域的技術人員,依據本發明的思想,在具體實施方式及應用範圍上均會有改變之處,綜上所述,本說明書內容不應理解為對本發明的限制。
101~105:步驟
Claims (14)
- 一種卷積計算裝置,應用於一卷積層的卷積計算,其包含: 一解壓縮電路,用以對該卷積層的一卷積核的一壓縮權重資料進行解壓縮,以產生一解壓後權重資料; 一資料組合電路,用以組合該解壓後資料與該卷積核的一未壓縮權重資料,以還原該卷積核的權重資料的資料順序;以及 一計算電路,根據該卷積核的權重資料及該卷積層的一輸入資料進行計算。
- 如請求項1所述之卷積計算裝置,更包含: 一轉換電路,耦接於該資料組合電路與該計算電路之間,用以對該卷積核的該權重資料進行格式轉換,並將轉換後的該權重資料輸出到該計算電路。
- 如請求項1所述的卷積計算裝置,其中該卷積核的權重資料包含一第一部分資料及一第二部分資料,該壓縮權重資料對應該第一部分資料,該未壓縮權重資料對應該第二部分資料。
- 如請求項3所述之卷積計算裝置,其中該卷積核的該權重資料由多組8位元的二進位數字組成,該權重資料的該第一部分資料由每組該8位元二進位數字中的至少2位元的二進位數字所組成。
- 如請求項1所述之卷積計算裝置,其中該壓縮權重資料是經過一霍夫曼(Huffman)壓縮格式壓縮,該解壓縮電路根據一霍夫曼碼表對該壓縮權重資料進行解壓縮。
- 如請求項1所述之卷積計算裝置,其中該壓縮權重資料儲存於一記憶體的一第一區塊中,該未壓縮權重資料儲存於該記憶體的一第二區塊中,該第一區塊不同於該第二區塊。
- 如請求項1所述之卷積計算裝置,其中該壓縮權重資料是由設置有該卷積計算裝置的一電子設備以外的一裝置所壓縮的。
- 一種卷積計算裝置,應用於一卷積層的卷積計算,包含: 一解壓縮電路,用以對該卷積層的一卷積核的一壓縮權重資料進行解壓縮,以產生一解壓後權重資料;以及 一計算電路,根據該解壓後權重資料及該卷積層的一輸入資料進行計算; 其中,該壓縮權重資料及該輸入資料分別儲存於一記憶體的不同區塊中。
- 如請求項8所述之卷積計算裝置,其中該壓縮權重資料是經過一霍夫曼(Huffman)壓縮格式壓縮,該解壓縮電路根據一霍夫曼碼表對該壓縮權重資料進行解壓縮。
- 如請求項8所述之卷積計算裝置,其中該壓縮權重資料是由設置有該卷積計算裝置的一電子設備以外的一裝置所壓縮的。
- 如請求項8所述之卷積計算裝置,更包含: 一轉換電路,耦接於該解壓縮電路與該計算電路之間,用以對該解壓後權重資料進行格式轉換,並將轉換後的該權重資料輸出到該計算電路。
- 一種卷積計算方法,應用於一卷積層的卷積計算,包含: 對該卷積層的一卷積核的一壓縮權重資料進行解壓縮,以產生一解壓後權重資料;以及 根據該解壓後權重資料及該卷積層的一輸入資料進行計算; 其中,該壓縮權重資料及該輸入資料分別儲存於一記憶體的不同區塊中。
- 如請求項12所述之卷積計算方法,其中該壓縮權重資料是經過一霍夫曼(Huffman)壓縮格式壓縮,該解壓縮步驟是根據一霍夫曼碼表對該壓縮權重資料進行解壓縮。
- 如請求項12所述之卷積計算方法,其中該的卷積計算方法是執行於一卷積計算裝置中,該壓縮權重資料是由設置有該卷積計算裝置的一電子設備以外的一裝置所壓縮的。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
TW109134986A TWI758897B (zh) | 2020-10-08 | 2020-10-08 | 卷積計算裝置及方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
TW109134986A TWI758897B (zh) | 2020-10-08 | 2020-10-08 | 卷積計算裝置及方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
TWI758897B true TWI758897B (zh) | 2022-03-21 |
TW202215275A TW202215275A (zh) | 2022-04-16 |
Family
ID=81710743
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW109134986A TWI758897B (zh) | 2020-10-08 | 2020-10-08 | 卷積計算裝置及方法 |
Country Status (1)
Country | Link |
---|---|
TW (1) | TWI758897B (zh) |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101095284A (zh) * | 2004-12-28 | 2007-12-26 | 卡西欧电子工业株式会社 | 用于有选择地压缩和解压缩的设备与数据方法以及压缩数据的数据格式 |
-
2020
- 2020-10-08 TW TW109134986A patent/TWI758897B/zh active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101095284A (zh) * | 2004-12-28 | 2007-12-26 | 卡西欧电子工业株式会社 | 用于有选择地压缩和解压缩的设备与数据方法以及压缩数据的数据格式 |
Non-Patent Citations (1)
Title |
---|
Kaur, Harsimran, and Balkrishan Jindal. "Lossless text data compression using modified Huffman Coding-A review." Proceedings of the International Conference on Technologies for Sustainability-Engineering, Information Technology, Management and the Environment. 2015. * |
Also Published As
Publication number | Publication date |
---|---|
TW202215275A (zh) | 2022-04-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102122960B (zh) | 一种针对二进制数据的多字符组合无损数据压缩方法 | |
CN101095284B (zh) | 用于有选择地压缩和解压缩数据的设备与方法 | |
CN105207678B (zh) | 一种改进型lz4压缩算法的硬件实现系统 | |
CN108886367A (zh) | 用于压缩和解压缩数据的方法、设备和系统 | |
CN103702133B (zh) | 一种图像压缩展示方法及其装置 | |
US5594435A (en) | Permutation-based data compression | |
US20220114454A1 (en) | Electronic apparatus for decompressing a compressed artificial intelligence model and control method therefor | |
US7111094B1 (en) | System, method and algorithm for the optimization of entropy for lossless compression | |
CN115276666B (zh) | 一种装备训练模拟器数据高效传输方法 | |
CN114222129A (zh) | 图像压缩编码方法、装置、计算机设备和存储介质 | |
CN114692077A (zh) | 一种矩阵计算装置、方法、系统、电路、芯片及设备 | |
US4382286A (en) | Method and apparatus for compressing and decompressing strings of electrical digital data bits | |
TWI758897B (zh) | 卷積計算裝置及方法 | |
CN105409129A (zh) | 编码器设备、解码器设备和方法 | |
CN107911570A (zh) | 一种对图片特征进行压缩及解压的方法 | |
CN112200301B (zh) | 卷积计算装置及方法 | |
US10362325B2 (en) | Techniques for compressing multiple-channel images | |
KR102360116B1 (ko) | 압축 모듈을 포함하는 인공지능 가속기 및 이를 이용한 데이터 전달 방법 | |
CN104682966A (zh) | 列表数据的无损压缩方法 | |
JP2022162930A (ja) | ウェイトデータ圧縮方法、ウェイトデータ伸長方法、ウェイトデータ圧縮装置及びウェイトデータ伸長装置 | |
JP2010258532A (ja) | ビット長を符号に変換する回路及び方法 | |
CN112800183A (zh) | 内容名称数据处理方法及终端设备 | |
JP3127016B2 (ja) | データ圧縮及び復元方法 | |
US20190245554A1 (en) | Data encoder and data encoding method | |
JP3709381B2 (ja) | カラー画像圧縮方法 |