JP7348971B2 - 畳み込みニューラルネットワークハードウエア構成 - Google Patents
畳み込みニューラルネットワークハードウエア構成 Download PDFInfo
- Publication number
- JP7348971B2 JP7348971B2 JP2022006207A JP2022006207A JP7348971B2 JP 7348971 B2 JP7348971 B2 JP 7348971B2 JP 2022006207 A JP2022006207 A JP 2022006207A JP 2022006207 A JP2022006207 A JP 2022006207A JP 7348971 B2 JP7348971 B2 JP 7348971B2
- Authority
- JP
- Japan
- Prior art keywords
- data
- weight
- vector
- values
- index
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000013527 convolutional neural network Methods 0.000 title claims description 186
- 238000000034 method Methods 0.000 claims description 81
- 239000013598 vector Substances 0.000 claims description 49
- 239000000872 buffer Substances 0.000 claims description 48
- 238000004364 calculation method Methods 0.000 claims description 17
- 238000013138 pruning Methods 0.000 claims description 2
- 230000001419 dependent effect Effects 0.000 claims 2
- 239000010410 layer Substances 0.000 description 174
- 238000004519 manufacturing process Methods 0.000 description 37
- 238000009826 distribution Methods 0.000 description 30
- 238000007667 floating Methods 0.000 description 30
- 238000012545 processing Methods 0.000 description 29
- 230000008569 process Effects 0.000 description 27
- 238000012549 training Methods 0.000 description 26
- 238000013139 quantization Methods 0.000 description 15
- 238000009825 accumulation Methods 0.000 description 11
- 230000006870 function Effects 0.000 description 8
- 230000000295 complement effect Effects 0.000 description 6
- 238000010586 diagram Methods 0.000 description 5
- 238000003860 storage Methods 0.000 description 5
- XUIMIQQOPSSXEZ-UHFFFAOYSA-N Silicon Chemical compound [Si] XUIMIQQOPSSXEZ-UHFFFAOYSA-N 0.000 description 4
- 229910052710 silicon Inorganic materials 0.000 description 4
- 239000010703 silicon Substances 0.000 description 4
- 239000002356 single layer Substances 0.000 description 4
- 238000013528 artificial neural network Methods 0.000 description 3
- 230000008859 change Effects 0.000 description 3
- 239000004065 semiconductor Substances 0.000 description 3
- 238000007619 statistical method Methods 0.000 description 3
- 238000004422 calculation algorithm Methods 0.000 description 2
- 238000004590 computer program Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000010606 normalization Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 230000002194 synthesizing effect Effects 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 238000012993 chemical processing Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000013329 compounding Methods 0.000 description 1
- 230000001186 cumulative effect Effects 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
- 238000009827 uniform distribution Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/06—Physical realisation, i.e. hardware implementation of neural networks, neurons or parts of neurons
- G06N3/063—Physical realisation, i.e. hardware implementation of neural networks, neurons or parts of neurons using electronic means
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/15—Correlation function computation including computation of convolution operations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/16—Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F7/00—Methods or arrangements for processing data by operating upon the order or content of the data handled
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F7/00—Methods or arrangements for processing data by operating upon the order or content of the data handled
- G06F7/38—Methods or arrangements for performing computations using exclusively denominational number representation, e.g. using binary, ternary, decimal representation
- G06F7/48—Methods or arrangements for performing computations using exclusively denominational number representation, e.g. using binary, ternary, decimal representation using non-contact-making devices, e.g. tube, solid state device; using unspecified devices
- G06F7/544—Methods or arrangements for performing computations using exclusively denominational number representation, e.g. using binary, ternary, decimal representation using non-contact-making devices, e.g. tube, solid state device; using unspecified devices for evaluating functions by calculation
- G06F7/5443—Sum of products
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0464—Convolutional networks [CNN, ConvNet]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/048—Activation functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Health & Medical Sciences (AREA)
- Data Mining & Analysis (AREA)
- Software Systems (AREA)
- Artificial Intelligence (AREA)
- General Health & Medical Sciences (AREA)
- Evolutionary Computation (AREA)
- Computational Linguistics (AREA)
- Molecular Biology (AREA)
- Pure & Applied Mathematics (AREA)
- Computational Mathematics (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Neurology (AREA)
- Algebra (AREA)
- Databases & Information Systems (AREA)
- Image Processing (AREA)
- Complex Calculations (AREA)
- Advance Control (AREA)
- Image Analysis (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
として定義することができ、第2の層に対して重みの数を
として定義することができるように層の間で変えることができる。
一般的に、ソフトウエアツールがCNNの訓練フェーズ中に使用されて訓練データセットに基づいて層あたり1セットの重みを生成する。一部の構成では、一部の層内の重み値の一部は、他の手段、例えば、ウェーブレットベースによって発生させることができると考えられる。
任意的な低精度重み調整430段階を量子化/変換値に関して実行することができる。重み調整を実行するために、浮動小数点数は、決定された固定小数点数フォーマットに従って量子化すべきである。
は浮動仮数であり、
は、対応する8ビット固定小数点仮数である。
上述の固定小数点付番フォーマットは、整数及び指数固定小数点計算の整数ベースの実施に使用することができる。
上述の演算の全てが整数計算である。オーバーフローの場合に、数は、Xmax又はXminにクランピングされる。乗算の場合に、結果の指数は、ビットをシフトする代わりに調節することができ、数を異なる指数で乗算する時に有用になる。
低精度固定小数点フォーマットで畳み込み層を実施する段階は、いくつかの理由でCNNで畳み込み層を実施する改善された方法を提供することができる。例えば、数ビットをCNNのハードウエア実装を演算するのに使用されるメモリ帯域幅を低減する外部メモリとCNNのハードウエア実装との間で転送しなければならない。上述の整数計算論理部は、畳み込み操作を実施するのに必要なハードウエア論理部のサイズ及び複雑さを低減する畳み込み計算(上述の畳み込みエンジンなど)内に実施することができる。更に、重みデータ及び入力データを格納するのに必要なビットの数が、対応する浮動小数点数表現よりも又は上述のQフォーマット固定小数点数表現よりも少ないので、CNNのハードウエア実装に必要なバッファはより小さい。図2に対応するCNNの上述のハードウエア実装を参照すると、係数及びデータバッファ、並びに累積バッファを小さくすることができる。
CNNのハードウエア実装に使用する構成データを生成して数フォーマットを定義する方法が上記に示されている。上述のように、CNNを定義する重みを低精度ターゲットに適応させることができる重み調整430の任意段階を図4の方法の一部として実施することができる。段階430は、段階440で得られた量子化値を受信する段階及びCNNの更に別の訓練を実行することによって重み値を修正する段階を伴う。重み値の調整は、本発明の開示の固定小数点数表現を使用して実施されるCNNの分類誤差を低減することができる。本明細書に説明する例では、各々が複数の重み値を有する複数の層によって定義される事前訓練されたネットワークは、図4の段階410で上述のように従来の浮動小数点ソフトウエアツールを使用して準備されていたと仮定する。更に、固定小数点数フォーマットの重み及び入力データ指数が段階420で決定され、重み及びデータの事前定義されたビット長が設定されていたと仮定する。
410 浮動点訓練
420 数フォーマットの決定
430 低精度重み調整
440 量子化
Claims (18)
- 畳み込みニューラルネットワーク(CNN)を実装するためのハードウエアであって、
畳み込み演算ハードウエア要素(730)を備える畳み込みブロック(700)を備え、前記畳み込み演算ハードウエア要素(730)は、
CNNの層に対し第1の重みベクトル(720b)と第1のデータベクトル(720a)の間の第1の内積を実行し、ここで前記第1の重みベクトル(720b)は複数の整数ビット(n)と指数(B)によって定義される固定小数点フォーマットにおける複数の重み値を有し、前記第1のデータベクトル(720a)は複数の整数ビット(m)と指数(A)によって定義される固定小数点フォーマットにおける複数のデータ値を有し、
前記第1のデータベクトル(720a)のデータ値に対する指数(A)を示す第1のデータ指標を受け取り、
前記第1の重みベクトル(720b)の重み値に対する指数(B)を示す第1の重み指標を受け取り、
前記第1のデータベクトル(720a)のデータ値に対する指数(A)と前記第1の重みベクトル(720b)の重み値に対する指数(B)とを加算することによって、前記第1の内積の指数を計算する、
よう構成されている、ハードウエア。 - 畳み込み演算ハードウエア要素(730)は、さらに、
CNNの他の層に対し第2の重みベクトルと第2のデータベクトルの間の第2の内積を実行し、ここで前記第2の重みベクトルは複数の整数ビットと指数によって定義される固定小数点フォーマットにおける複数の重み値を有し、前記第2のデータベクトルは複数の整数ビットと指数によって定義される固定小数点フォーマットにおける複数のデータ値を有し、
前記第2のデータベクトルのデータ値に対する指数を示す第2のデータ指標を受け取り、
前記第2の重みベクトルの重み値に対する指数を示す第2の重み指標を受け取り、
前記第2のデータベクトルのデータ値に対する指数と前記第2の重みベクトルの重み値に対する指数とを加算することによって、前記第2の内積の指数を計算する、
よう構成され、
前記第2のデータベクトルのデータ値に対する指数と前記第1のデータベクトルのデータ値に対する指数は異なっている、請求項1に記載のハードウエア。 - 畳み込み演算ハードウエア要素(730)は、さらに、
CNNの他の層に対し第2の重みベクトルと第2のデータベクトルの間の第2の内積を実行し、ここで前記第2の重みベクトルは複数の整数ビットと指数によって定義される固定小数点フォーマットにおける複数の重み値を有し、前記第2のデータベクトルは複数の整数ビットと指数によって定義される固定小数点フォーマットにおける複数のデータ値を有し、
前記第2のデータベクトルのデータ値に対する指数を示す第2のデータ指標を受け取り、
前記第2の重みベクトルの重み値に対する指数を示す第2の重み指標を受け取り、
前記第2のデータベクトルのデータ値に対する指数と前記第2の重みベクトルの重み値に対する指数とを加算することによって、前記第2の内積の指数を計算する、
よう構成され、
前記第2の重みベクトルの重み値に対する指数と、前記第1の重みベクトルの重み値に対する指数は異なっている、請求項1又は2に記載のハードウエア。 - 前記第1のデータベクトルのデータ値に対する整数ビットの数と、前記第2のデータベクトルのデータ値に対する整数ビットの数は同じである、請求項2又は3に記載のハードウエア。
- 前記第1の重みベクトルの重み値に対する整数ビットの数と、前記第2の重みベクトルの重み値に対する整数ビットの数は同じである、請求項2乃至4のいずれかに記載のハードウエア。
- 前記第1の重みベクトルの重み値に対する指数と、前記第1のデータベクトルのデータ値に対する指数は異なっている、請求項1乃至5のいずれかに記載のハードウエア。
- 前記第1の重みベクトルの重み値に対する整数ビットの数と、前記第1のデータベクトルのデータ値に対する整数ビットの数は異なっている、請求項1乃至6のいずれかに記載のハードウエア。
- 前記畳み込みブロック(700)はさらに、前記内積の結果を収容できるサイズの累積器(740)を備える、請求項1乃至7のいずれかに記載のハードウエア。
- 前記畳み込みブロック(700)はさらに、入力データに対する指数及び前記第1のデータベクトルの前記データ値に対する指数に基づいて前記入力データから前記第1のデータベクトルを生成するよう構成された刈り取りユニット(710)を備える、請求項1乃至8のいずれかに記載のハードウエア。
- さらに、前記第1の重みベクトル、及び、前記第1の重みベクトルの前記重み値に対する指数を識別する前記第1の重み指標を含む指令情報を受け取るよう構成されたメモリインタフェース(210)を備える、請求項1乃至9のいずれかに記載のハードウエア。
- さらに、前記第1の内積を実行する前記畳み込み演算ハードウエア要素(730)の前に、前記第1の重みベクトルを格納するよう構成された係数バッファ(230)を備える、請求項1乃至10のいずれかに記載のハードウエア。
- 請求項10に従属する請求項11に記載のハードウエアであって、さらに、
前記メモリインタフェース(210)から前記第1の重みベクトルを受け取るよう構成された係数バッファコントローラ(225)と、
前記指令情報を復号し、かつ、前記係数バッファコントローラ(225)に対して、前記係数バッファコントローラ(225)が前記第1の重みベクトルを前記係数バッファ(230)に格納する方式を制御する制御情報を発令するよう構成された指令復号器(220)と、
を備える請求項11に記載のハードウエア。 - さらに、入力データ又は前記第1のデータベクトルと、前記第1のデータベクトルのデータ値に対する指数及び/又は前記入力データの指数を識別する前記第1のデータ指標を含む指令情報とを受け取るよう構成されたメモリインタフェース(210)を備える、請求項1乃至12のいずれかに記載のハードウエア。
- さらに、前記第1の内積を実行する前記畳み込み演算ハードウエア要素(730)の前に、前記第1のデータベクトル又は入力データを格納するよう構成された1又は2以上の入力バッファ(235a~235n)を備える、請求項1乃至13のいずれかに記載のハードウエア。
- 請求項13に従属する請求項14に記載のハードウエアであって、さらに、
前記メモリインタフェース(210)から前記第1のデータベクトル又は前記入力データを受け取るよう構成された入力バッファコントローラ(215)と、
前記指令情報を復号し、かつ、前記入力バッファコントローラ(215)に対して、前記入力バッファコントローラ(215)が前記入力データ又は前記第1のデータベクトルを前記1又は2以上の入力バッファ(235a~235n)に格納する方式を制御する制御情報を発令するよう構成された指令復号器(220)と、
を備える請求項14に記載のハードウエア。 - 前記畳み込み演算ハードウエア要素(730)は、乗算論理部の複数の要素及び加算論理部の複数の要素を備える、請求項1乃至15のいずれかに記載のハードウエア。
- 集積回路に具現化されている、請求項1乃至16のいずれかに記載のハードウエア。
- 請求項1乃至17のいずれかに記載のハードウエアを備えるコンピュータシステム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
GB1607713.3 | 2016-05-03 | ||
GBGB1607713.3A GB201607713D0 (en) | 2016-05-03 | 2016-05-03 | Convolutional neural network |
JP2017092266A JP7013143B2 (ja) | 2016-05-03 | 2017-05-08 | 畳み込みニューラルネットワークハードウエア構成 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017092266A Division JP7013143B2 (ja) | 2016-05-03 | 2017-05-08 | 畳み込みニューラルネットワークハードウエア構成 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2022058660A JP2022058660A (ja) | 2022-04-12 |
JP7348971B2 true JP7348971B2 (ja) | 2023-09-21 |
Family
ID=56234306
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017092266A Active JP7013143B2 (ja) | 2016-05-03 | 2017-05-08 | 畳み込みニューラルネットワークハードウエア構成 |
JP2022006207A Active JP7348971B2 (ja) | 2016-05-03 | 2022-01-19 | 畳み込みニューラルネットワークハードウエア構成 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017092266A Active JP7013143B2 (ja) | 2016-05-03 | 2017-05-08 | 畳み込みニューラルネットワークハードウエア構成 |
Country Status (5)
Country | Link |
---|---|
US (5) | US11144819B2 (ja) |
EP (5) | EP4439272A2 (ja) |
JP (2) | JP7013143B2 (ja) |
CN (2) | CN107403221B (ja) |
GB (6) | GB201607713D0 (ja) |
Families Citing this family (159)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20180053086A1 (en) * | 2016-08-22 | 2018-02-22 | Kneron Inc. | Artificial neuron and controlling method thereof |
FR3057090B1 (fr) * | 2016-09-30 | 2018-10-19 | Safran Identity & Security | Procedes d'apprentissage securise de parametres d'un reseau de neurones a convolution, et de classification securisee d'une donnee d'entree |
GB2554711B (en) | 2016-10-06 | 2020-11-25 | Imagination Tech Ltd | Buffer addressing for a convolutional neural network |
US10366302B2 (en) | 2016-10-10 | 2019-07-30 | Gyrfalcon Technology Inc. | Hierarchical category classification scheme using multiple sets of fully-connected networks with a CNN based integrated circuit as feature extractor |
US10402628B2 (en) | 2016-10-10 | 2019-09-03 | Gyrfalcon Technology Inc. | Image classification systems based on CNN based IC and light-weight classifier |
US10360470B2 (en) | 2016-10-10 | 2019-07-23 | Gyrfalcon Technology Inc. | Implementation of MobileNet in a CNN based digital integrated circuit |
US9940534B1 (en) * | 2016-10-10 | 2018-04-10 | Gyrfalcon Technology, Inc. | Digital integrated circuit for extracting features out of an input image based on cellular neural networks |
US10043095B2 (en) * | 2016-10-10 | 2018-08-07 | Gyrfalcon Technology, Inc. | Data structure for CNN based digital integrated circuit for extracting features out of an input image |
US10339445B2 (en) | 2016-10-10 | 2019-07-02 | Gyrfalcon Technology Inc. | Implementation of ResNet in a CNN based digital integrated circuit |
US10366328B2 (en) | 2017-09-19 | 2019-07-30 | Gyrfalcon Technology Inc. | Approximating fully-connected layers with multiple arrays of 3x3 convolutional filter kernels in a CNN based integrated circuit |
US11003985B2 (en) * | 2016-11-07 | 2021-05-11 | Electronics And Telecommunications Research Institute | Convolutional neural network system and operation method thereof |
CN106557332A (zh) * | 2016-11-30 | 2017-04-05 | 上海寒武纪信息科技有限公司 | 一种指令生成过程的复用方法及装置 |
US10096384B2 (en) | 2016-12-21 | 2018-10-09 | Disco Health, LLC | Artificial intelligence expert system |
KR102415508B1 (ko) * | 2017-03-28 | 2022-07-01 | 삼성전자주식회사 | 컨볼루션 신경망 처리 방법 및 장치 |
US11037330B2 (en) * | 2017-04-08 | 2021-06-15 | Intel Corporation | Low rank matrix compression |
CN107124609A (zh) * | 2017-04-27 | 2017-09-01 | 京东方科技集团股份有限公司 | 一种视频图像的处理系统、其处理方法及显示装置 |
US10474458B2 (en) * | 2017-04-28 | 2019-11-12 | Intel Corporation | Instructions and logic to perform floating-point and integer operations for machine learning |
US20180330234A1 (en) * | 2017-05-11 | 2018-11-15 | Hussein Al-barazanchi | Partial weights sharing convolutional neural networks |
WO2019005088A1 (en) * | 2017-06-30 | 2019-01-03 | Intel Corporation | HETEROGENEOUS MULTIPLIER |
US10600147B2 (en) * | 2017-08-22 | 2020-03-24 | Intel Corporation | Efficient memory layout for enabling smart data compression in machine learning environments |
JP2019057249A (ja) * | 2017-09-22 | 2019-04-11 | 富士通株式会社 | 演算処理装置および演算処理方法 |
CN109754359B (zh) | 2017-11-01 | 2021-12-07 | 腾讯科技(深圳)有限公司 | 一种应用于卷积神经网络的池化处理的方法及系统 |
GB2568084B (en) * | 2017-11-03 | 2022-01-12 | Imagination Tech Ltd | Error allocation format selection for hardware implementation of deep neural network |
GB2568086B (en) | 2017-11-03 | 2020-05-27 | Imagination Tech Ltd | Hardware implementation of convolution layer of deep neutral network |
GB2560600B (en) * | 2017-11-06 | 2020-03-04 | Imagination Tech Ltd | Nueral Network Hardware |
CN110059811B (zh) | 2017-11-06 | 2024-08-02 | 畅想科技有限公司 | 权重缓冲器 |
KR20190052893A (ko) * | 2017-11-09 | 2019-05-17 | 삼성전자주식회사 | 뉴럴 네트워크 연산을 위한 전처리 장치 및 방법 |
US10929746B2 (en) * | 2017-11-27 | 2021-02-23 | Samsung Electronics Co., Ltd. | Low-power hardware acceleration method and system for convolution neural network computation |
US11475305B2 (en) * | 2017-12-08 | 2022-10-18 | Advanced Micro Devices, Inc. | Activation function functional block for electronic devices |
CN110574371B (zh) * | 2017-12-08 | 2021-12-21 | 百度时代网络技术(北京)有限公司 | 使用硬件加速器的立体摄像机深度确定 |
US11216719B2 (en) * | 2017-12-12 | 2022-01-04 | Intel Corporation | Methods and arrangements to quantize a neural network with machine learning |
JP6789919B2 (ja) * | 2017-12-13 | 2020-11-25 | 日立オートモティブシステムズ株式会社 | 演算システム、サーバ、車載装置 |
CN109961133B (zh) * | 2017-12-14 | 2020-04-24 | 中科寒武纪科技股份有限公司 | 集成电路芯片装置及相关产品 |
WO2019114842A1 (zh) * | 2017-12-14 | 2019-06-20 | 北京中科寒武纪科技有限公司 | 一种集成电路芯片装置 |
CN109961137B (zh) * | 2017-12-14 | 2020-10-09 | 中科寒武纪科技股份有限公司 | 集成电路芯片装置及相关产品 |
CN108108811B (zh) * | 2017-12-18 | 2021-07-30 | 南京地平线机器人技术有限公司 | 神经网络中的卷积计算方法和电子设备 |
CN109978131B (zh) * | 2017-12-28 | 2020-05-22 | 中科寒武纪科技股份有限公司 | 集成电路芯片装置、方法及相关产品 |
WO2019136764A1 (zh) * | 2018-01-15 | 2019-07-18 | 深圳鲲云信息科技有限公司 | 卷积器及其所应用的人工智能处理装置 |
KR102463532B1 (ko) * | 2018-01-16 | 2022-11-08 | 한국전자통신연구원 | 신경망 컴퓨팅 장치 및 그것의 동작 방법 |
US11436483B2 (en) * | 2018-01-17 | 2022-09-06 | Mediatek Inc. | Neural network engine with tile-based execution |
JP7107797B2 (ja) * | 2018-01-29 | 2022-07-27 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ | 情報処理方法及び情報処理システム |
GB201801639D0 (en) * | 2018-02-01 | 2018-03-21 | Ruff Brendan Patrick | Low precision efficient multiplication free convolutional filter bank device |
KR102143928B1 (ko) | 2018-02-05 | 2020-08-13 | 고려대학교 산학협력단 | 인공 신경망 장치 및 그 동작 방법 |
EP3651077B1 (en) * | 2018-02-13 | 2021-10-27 | Shanghai Cambricon Information Technology Co., Ltd | Computation device and method |
KR102683757B1 (ko) * | 2018-02-20 | 2024-07-10 | 삼성전자주식회사 | 심층 신경망의 학습을 수행시키는 방법 및 그에 대한 장치 |
JP7056225B2 (ja) * | 2018-02-26 | 2022-04-19 | 富士通株式会社 | 演算処理装置、情報処理装置、情報処理方法、およびプログラム |
JP6540841B1 (ja) * | 2018-02-27 | 2019-07-10 | 富士通株式会社 | 演算処理装置、情報処理装置、情報処理方法、およびプログラム |
JP6757349B2 (ja) * | 2018-03-12 | 2020-09-16 | 株式会社東芝 | 固定小数点を用いて認識処理を行う多層の畳み込みニューラルネットワーク回路を実現する演算処理装置 |
US11429862B2 (en) | 2018-03-20 | 2022-08-30 | Sri International | Dynamic adaptation of deep neural networks |
KR102329590B1 (ko) * | 2018-03-19 | 2021-11-19 | 에스알아이 인터내셔널 | 딥 신경망들의 동적 적응 |
JP6961640B2 (ja) * | 2018-03-22 | 2021-11-05 | 南京地平▲線▼机▲器▼人技▲術▼有限公司 | データ処理のシステムおよび方法 |
US11475306B2 (en) | 2018-03-22 | 2022-10-18 | Amazon Technologies, Inc. | Processing for multiple input data sets |
CN118014031A (zh) * | 2018-03-22 | 2024-05-10 | 亚马逊技术股份有限公司 | 针对多个输入数据集的处理 |
US10678508B2 (en) * | 2018-03-23 | 2020-06-09 | Amazon Technologies, Inc. | Accelerated quantized multiply-and-add operations |
CN108509382B (zh) * | 2018-03-27 | 2022-06-07 | 南开大学 | 一种基于fpga实现超长序列快速卷积运算的方法 |
US10621489B2 (en) * | 2018-03-30 | 2020-04-14 | International Business Machines Corporation | Massively parallel neural inference computing elements |
US10558430B2 (en) * | 2018-04-17 | 2020-02-11 | Fotonation Limited | Neural network engine |
US11769036B2 (en) * | 2018-04-18 | 2023-09-26 | Qualcomm Incorporated | Optimizing performance of recurrent neural networks |
US11210586B1 (en) | 2018-04-20 | 2021-12-28 | Perceive Corporation | Weight value decoder of neural network inference circuit |
US12093696B1 (en) | 2018-04-20 | 2024-09-17 | Perceive Corporation | Bus for transporting output values of a neural network layer to cores specified by configuration data |
US11568227B1 (en) | 2018-04-20 | 2023-01-31 | Perceive Corporation | Neural network inference circuit read controller with multiple operational modes |
US11501138B1 (en) | 2018-04-20 | 2022-11-15 | Perceive Corporation | Control circuits for neural network inference circuit |
US11783167B1 (en) | 2018-04-20 | 2023-10-10 | Perceive Corporation | Data transfer for non-dot product computations on neural network inference circuit |
US10977338B1 (en) | 2018-04-20 | 2021-04-13 | Perceive Corporation | Reduced-area circuit for dot product computation |
US11468145B1 (en) | 2018-04-20 | 2022-10-11 | Perceive Corporation | Storage of input values within core of neural network inference circuit |
US11586910B1 (en) | 2018-04-20 | 2023-02-21 | Perceive Corporation | Write cache for neural network inference circuit |
CN108805265B (zh) * | 2018-05-21 | 2021-03-30 | Oppo广东移动通信有限公司 | 神经网络模型处理方法和装置、图像处理方法、移动终端 |
CN110533175A (zh) * | 2018-05-23 | 2019-12-03 | 富士通株式会社 | 深度学习加速的方法和设备及深度神经网络 |
CN110533176B (zh) * | 2018-05-25 | 2022-10-11 | 赛灵思电子科技(北京)有限公司 | 用于神经网络计算的缓存装置及其相关计算平台 |
KR102589616B1 (ko) | 2018-06-05 | 2023-10-13 | 라이트엘리전스 피티이. 리미티드 | 광전자 컴퓨팅 시스템 |
US11507818B2 (en) | 2018-06-05 | 2022-11-22 | Lightelligence PTE. Ltd. | Optoelectronic computing systems |
DE102018209901A1 (de) * | 2018-06-19 | 2019-12-19 | Robert Bosch Gmbh | Recheneinheit, Verfahren und Computerprogramm zum Multiplizieren zumindest zweier Multiplikanden |
DE102019205079A1 (de) | 2018-06-19 | 2019-12-19 | Robert Bosch Gmbh | Selektive Deaktivierung von Recheneinheiten für künstliche neuronale Netzwerke |
US12056594B2 (en) * | 2018-06-27 | 2024-08-06 | International Business Machines Corporation | Low precision deep neural network enabled by compensation instructions |
US10417342B1 (en) | 2018-07-03 | 2019-09-17 | Gyrfalcon Technology Inc. | Deep learning device for local processing classical chinese poetry and verse |
WO2020008643A1 (ja) * | 2018-07-06 | 2020-01-09 | 日本電気株式会社 | データ処理装置、データ処理回路およびデータ処理方法 |
JP7044160B2 (ja) * | 2018-07-06 | 2022-03-30 | 日本電気株式会社 | 学習装置、学習回路、学習方法および学習プログラム |
JP7119107B2 (ja) * | 2018-07-30 | 2022-08-16 | インテル コーポレイション | 8ビットウィノグラード畳み込みで統計推論確度を維持する方法及び装置 |
US10311149B1 (en) | 2018-08-08 | 2019-06-04 | Gyrfalcon Technology Inc. | Natural language translation device |
WO2020039493A1 (ja) * | 2018-08-21 | 2020-02-27 | 日本電気株式会社 | 演算最適化装置、方法およびプログラム |
US11836971B2 (en) * | 2018-08-23 | 2023-12-05 | Samsung Electronics Co., Ltd. | Method and device with convolution neural network processing |
KR20200026455A (ko) | 2018-09-03 | 2020-03-11 | 삼성전자주식회사 | 인공 신경망 시스템 및 인공 신경망의 고정 소수점 제어 방법 |
KR20200028168A (ko) * | 2018-09-06 | 2020-03-16 | 삼성전자주식회사 | 컨볼루셔널 뉴럴 네트워크를 이용하는 컴퓨팅 장치 및 그 동작 방법 |
KR102633139B1 (ko) | 2018-09-07 | 2024-02-02 | 삼성전자주식회사 | 데이터를 추출하는 집적 회로, 그것을 포함하는 뉴럴 네트워크 프로세서 및 뉴럴 네트워크 장치 |
US10747502B2 (en) * | 2018-09-19 | 2020-08-18 | Xilinx, Inc. | Multiply and accumulate circuit |
WO2020065874A1 (ja) * | 2018-09-27 | 2020-04-02 | 株式会社ソシオネクスト | ネットワーク量子化方法、推論方法及びネットワーク量子化装置 |
JP7040771B2 (ja) * | 2018-10-10 | 2022-03-23 | LeapMind株式会社 | ニューラルネットワーク処理装置、通信装置、ニューラルネットワーク処理方法、およびプログラム |
US10769846B2 (en) * | 2018-10-11 | 2020-09-08 | GM Global Technology Operations LLC | Point cloud data compression in an autonomous vehicle |
CN112639838A (zh) * | 2018-10-12 | 2021-04-09 | 奥林巴斯株式会社 | 运算处理装置 |
US10387772B1 (en) | 2018-10-22 | 2019-08-20 | Gyrfalcon Technology Inc. | Ensemble learning based image classification systems |
US11995533B1 (en) | 2018-12-05 | 2024-05-28 | Perceive Corporation | Executing replicated neural network layers on inference circuit |
US11586883B2 (en) * | 2018-12-14 | 2023-02-21 | Microsoft Technology Licensing, Llc | Residual quantization for neural networks |
CN111382832A (zh) * | 2018-12-29 | 2020-07-07 | 佳能株式会社 | 多层神经网络模型的训练和应用方法、装置及存储介质 |
CN109740737B (zh) * | 2018-12-30 | 2021-02-19 | 联想(北京)有限公司 | 卷积神经网络量化处理方法、装置及计算机设备 |
US12045724B2 (en) * | 2018-12-31 | 2024-07-23 | Microsoft Technology Licensing, Llc | Neural network activation compression with outlier block floating-point |
KR20200086581A (ko) * | 2019-01-09 | 2020-07-17 | 삼성전자주식회사 | 뉴럴 네트워크 양자화를 위한 방법 및 장치 |
US11734556B2 (en) | 2019-01-14 | 2023-08-22 | Lightelligence PTE. Ltd. | Optoelectronic computing systems |
US11347297B1 (en) | 2019-01-23 | 2022-05-31 | Perceive Corporation | Neural network inference circuit employing dynamic memory sleep |
US11562247B2 (en) | 2019-01-24 | 2023-01-24 | Microsoft Technology Licensing, Llc | Neural network activation compression with non-uniform mantissas |
US20200249996A1 (en) * | 2019-02-04 | 2020-08-06 | Pathtronic Inc. | Systems and methods for artificial intelligence hardware processing |
US11544525B2 (en) | 2019-02-04 | 2023-01-03 | Sateesh Kumar Addepalli | Systems and methods for artificial intelligence with a flexible hardware processing framework |
US11150720B2 (en) | 2019-02-04 | 2021-10-19 | Sateesh Kumar Addepalli | Systems and methods for power management of hardware utilizing virtual multilane architecture |
US11507662B2 (en) * | 2019-02-04 | 2022-11-22 | Sateesh Kumar Addepalli | Systems and methods of security for trusted artificial intelligence hardware processing |
US11423454B2 (en) | 2019-02-15 | 2022-08-23 | Sateesh Kumar Addepalli | Real-time customizable AI model collaboration and marketplace service over a trusted AI model network |
JP7345262B2 (ja) | 2019-03-11 | 2023-09-15 | キヤノン株式会社 | データ圧縮装置、データ処理装置、データ圧縮方法、プログラム、及び学習済みモデル |
CN111695671B (zh) * | 2019-03-12 | 2023-08-08 | 北京地平线机器人技术研发有限公司 | 训练神经网络的方法及装置、电子设备 |
JP7188237B2 (ja) * | 2019-03-29 | 2022-12-13 | 富士通株式会社 | 情報処理装置、情報処理方法、情報処理プログラム |
JP7177000B2 (ja) * | 2019-05-16 | 2022-11-22 | 日立Astemo株式会社 | 演算装置および演算方法 |
US11941533B1 (en) | 2019-05-21 | 2024-03-26 | Perceive Corporation | Compiler for performing zero-channel removal |
CN112085191B (zh) * | 2019-06-12 | 2024-04-02 | 上海寒武纪信息科技有限公司 | 一种神经网络的量化参数确定方法及相关产品 |
JP7243498B2 (ja) * | 2019-07-11 | 2023-03-22 | 富士通株式会社 | 演算処理装置、制御プログラム、及び制御方法 |
CN112308199B (zh) * | 2019-07-26 | 2024-05-10 | 杭州海康威视数字技术股份有限公司 | 数据块的处理方法、装置及存储介质 |
GB2581546B (en) * | 2019-08-22 | 2021-03-31 | Imagination Tech Ltd | Methods and systems for converting weights of a deep neural network from a first number format to a second number format |
JPWO2021039164A1 (ja) * | 2019-08-26 | 2021-03-04 | ||
WO2021036905A1 (zh) | 2019-08-27 | 2021-03-04 | 安徽寒武纪信息科技有限公司 | 数据处理方法、装置、计算机设备和存储介质 |
JP7419711B2 (ja) * | 2019-09-09 | 2024-01-23 | 株式会社ソシオネクスト | 量子化パラメータ最適化方法、及び、量子化パラメータ最適化装置 |
US11657282B2 (en) * | 2019-09-16 | 2023-05-23 | Qualcomm Incorporated | Efficient inferencing with fast pointwise convolution |
CN112561050B (zh) * | 2019-09-25 | 2023-09-05 | 杭州海康威视数字技术股份有限公司 | 一种神经网络模型训练方法及装置 |
CN110879697B (zh) * | 2019-10-29 | 2021-09-28 | 南京大学 | 一种近似计算tanh函数的装置 |
CN111091548B (zh) * | 2019-12-12 | 2020-08-21 | 哈尔滨市科佳通用机电股份有限公司 | 基于深度学习的铁路货车承载鞍错位故障图像识别方法及系统 |
US11431688B2 (en) | 2019-12-13 | 2022-08-30 | TripleBlind, Inc. | Systems and methods for providing a modified loss function in federated-split learning |
US11528259B2 (en) | 2019-12-13 | 2022-12-13 | TripleBlind, Inc. | Systems and methods for providing a systemic error in artificial intelligence algorithms |
US11973743B2 (en) | 2019-12-13 | 2024-04-30 | TripleBlind, Inc. | Systems and methods for providing a systemic error in artificial intelligence algorithms |
US12026219B2 (en) * | 2019-12-13 | 2024-07-02 | TripleBlind, Inc. | Systems and methods for efficient computations on split data and split algorithms |
KR20210079785A (ko) * | 2019-12-20 | 2021-06-30 | 삼성전자주식회사 | 뉴럴 네트워크의 컨볼루션 연산 처리 방법 및 장치 |
US11755683B2 (en) | 2019-12-23 | 2023-09-12 | Western Digital Technologies, Inc. | Flexible accelerator for sparse tensors (FAST) in machine learning |
JP2021111081A (ja) | 2020-01-09 | 2021-08-02 | 富士通株式会社 | 情報処理装置、ニューラルネットワークの演算プログラム及びニューラルネットワークの演算方法 |
WO2021142713A1 (zh) * | 2020-01-16 | 2021-07-22 | 北京比特大陆科技有限公司 | 神经网络处理的方法、装置与系统 |
CN110866862B (zh) * | 2020-01-19 | 2020-05-15 | 光子算数(北京)科技有限责任公司 | 基于缓冲器的数据处理方法、装置、存储介质及电子设备 |
CN113408715B (zh) * | 2020-03-17 | 2024-05-28 | 杭州海康威视数字技术股份有限公司 | 一种神经网络的定点化方法、装置 |
US11462003B2 (en) * | 2020-03-25 | 2022-10-04 | Western Digital Technologies, Inc. | Flexible accelerator for sparse tensors in convolutional neural networks |
US11797830B2 (en) | 2020-03-25 | 2023-10-24 | Western Digital Technologies, Inc. | Flexible accelerator for sparse tensors in convolutional neural networks |
KR20210121946A (ko) * | 2020-03-31 | 2021-10-08 | 삼성전자주식회사 | 뉴럴 네트워크 양자화를 위한 방법 및 장치 |
US12079591B2 (en) | 2020-04-07 | 2024-09-03 | Samsung Electronics Co., Ltd. | Neural network device, method of operating the neural network device, and application processor including the neural network device |
TWI768326B (zh) * | 2020-04-20 | 2022-06-21 | 國立陽明交通大學 | 卷積運算模組及方法以及其適用之卷積神經網路系統 |
US11763162B2 (en) * | 2020-06-16 | 2023-09-19 | National Tsing Hua University | Dynamic gradient calibration method for computing-in-memory neural network and system thereof |
GB2596150B (en) * | 2020-06-19 | 2022-06-15 | Imagination Tech Ltd | Methods and systems for selecting number formats for deep neural networks based on network sensitivity and quantisation error |
CN111832717B (zh) * | 2020-06-24 | 2021-09-28 | 上海西井信息科技有限公司 | 芯片及用于卷积计算的处理装置 |
JP2022022876A (ja) | 2020-07-09 | 2022-02-07 | キヤノン株式会社 | 畳み込みニューラルネットワーク処理装置 |
GB2599098B (en) * | 2020-09-22 | 2024-04-10 | Imagination Tech Ltd | Hardware implementation of windowed operations in three or more dimensions |
US11797832B2 (en) * | 2020-10-15 | 2023-10-24 | Gigantor Technologies Inc. | Composing arbitrary convolutional neural network models from a fixed set of duplicate pipelined components |
WO2022109215A1 (en) | 2020-11-20 | 2022-05-27 | TripleBlind, Inc. | Systems and methods for providing a blind de-identification of privacy data |
US12112265B2 (en) | 2020-12-18 | 2024-10-08 | Analog Devices International Unlimited Company | Architecture for running convolutional networks on memory and mips constrained embedded devices |
US11144822B1 (en) | 2021-01-04 | 2021-10-12 | Edgecortix Pte. Ltd. | Neural network accelerator run-time reconfigurability |
CN113222148B (zh) * | 2021-05-20 | 2022-01-11 | 浙江大学 | 一种面向物料识别的神经网络推理加速方法 |
GB2611521B (en) | 2021-09-30 | 2024-04-10 | Imagination Tech Ltd | Neural network accelerator with a configurable pipeline |
GB2611520B (en) | 2021-09-30 | 2024-05-22 | Imagination Tech Ltd | Methods and devices for configuring a neural network accelerator with a configurable pipeline |
GB2611522B (en) | 2021-09-30 | 2024-04-10 | Imagination Tech Ltd | Neural network accelerator with a configurable pipeline |
US20230177320A1 (en) | 2021-09-30 | 2023-06-08 | Imagination Technologies Limited | Neural network accelerator with a configurable pipeline |
WO2023113985A1 (en) * | 2021-12-17 | 2023-06-22 | SiFive, Inc. | Quad narrowing operation |
CN116384443A (zh) | 2021-12-31 | 2023-07-04 | 想象技术有限公司 | 具有可配置池化处理单元的神经网络加速器 |
GB2614327A (en) | 2021-12-31 | 2023-07-05 | Imagination Tech Ltd | Configurable pooling process unit for neural network accelerator |
GB2614705B (en) | 2021-12-31 | 2024-04-17 | Imagination Tech Ltd | Neural network accelerator with configurable pooling processing unit |
GB2615754B (en) * | 2022-02-15 | 2024-02-21 | Advanced Risc Mach Ltd | Method and processing unit for generating an output feature map |
GB2620167A (en) | 2022-06-29 | 2024-01-03 | Imagination Tech Ltd | Methods and systems for executing a neural network on a neural network accelerator |
GB2622875A (en) | 2022-09-30 | 2024-04-03 | Imagination Tech Ltd | Methods and systems for performing channel equalisation on a convolution layer in a neural network |
GB2622869A (en) | 2022-09-30 | 2024-04-03 | Imagination Tech Ltd | Methods and systems for online selection of number formats for network parameters of a neural network |
KR20240077167A (ko) * | 2022-11-24 | 2024-05-31 | 주식회사 모빌린트 | 합성곱 연산을 위한 데이터 처리 방법 및 컴퓨팅 장치 |
CN117217274B (zh) * | 2023-11-08 | 2024-06-04 | 深圳市九天睿芯科技有限公司 | 向量处理器、神经网络加速器、芯片及电子设备 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20090164544A1 (en) | 2007-12-19 | 2009-06-25 | Jeffrey Dobbek | Dynamic range enhancement for arithmetic calculations in real-time control systems using fixed point hardware |
US20120191955A1 (en) | 2011-01-20 | 2012-07-26 | Jonsson Ragnar H | Method and system for floating point acceleration on fixed point digital signal processors |
US20160026912A1 (en) | 2014-07-22 | 2016-01-28 | Intel Corporation | Weight-shifting mechanism for convolutional neural networks |
Family Cites Families (23)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH07200259A (ja) * | 1993-12-28 | 1995-08-04 | Hitachi Ltd | 演算処理方法および演算処理装置 |
FR2743246B1 (fr) * | 1995-12-29 | 1998-01-23 | Thomson Broadcast Systems | Procede et dispositif de compression de donnees numeriques |
DE19826252C2 (de) * | 1998-06-15 | 2001-04-05 | Systemonic Ag | Verfahren zur digitalen Signalverarbeitung |
JP5171118B2 (ja) * | 2007-06-13 | 2013-03-27 | キヤノン株式会社 | 演算処理装置及びその制御方法 |
US8422821B2 (en) * | 2008-12-19 | 2013-04-16 | International Business Machines Corporation | Selectively transforming a multi-dimensional array |
US8442927B2 (en) * | 2009-07-30 | 2013-05-14 | Nec Laboratories America, Inc. | Dynamically configurable, multi-ported co-processor for convolutional neural networks |
GB2487375B (en) * | 2011-01-18 | 2017-09-20 | Aptina Imaging Corp | Interest point detection |
CN102420931B (zh) * | 2011-07-26 | 2013-08-21 | 西安费斯达自动化工程有限公司 | 一种基于fpga的全帧率图像处理方法 |
US9811775B2 (en) * | 2012-12-24 | 2017-11-07 | Google Inc. | Parallelizing neural networks during training |
US9760966B2 (en) * | 2013-01-08 | 2017-09-12 | Nvidia Corporation | Parallel processor with integrated correlation and convolution engine |
US9190053B2 (en) * | 2013-03-25 | 2015-11-17 | The Governing Council Of The Univeristy Of Toronto | System and method for applying a convolutional neural network to speech recognition |
US9430829B2 (en) | 2014-01-30 | 2016-08-30 | Case Western Reserve University | Automatic detection of mitosis using handcrafted and convolutional neural network features |
FR3025344B1 (fr) * | 2014-08-28 | 2017-11-24 | Commissariat Energie Atomique | Reseau de neurones convolutionnels |
US10223333B2 (en) * | 2014-08-29 | 2019-03-05 | Nvidia Corporation | Performing multi-convolution operations in a parallel processing system |
US9563825B2 (en) | 2014-11-20 | 2017-02-07 | Adobe Systems Incorporated | Convolutional neural network using a binarized convolution layer |
US9805303B2 (en) * | 2015-05-21 | 2017-10-31 | Google Inc. | Rotating data for neural network computations |
US9747546B2 (en) * | 2015-05-21 | 2017-08-29 | Google Inc. | Neural network processor |
US10192162B2 (en) * | 2015-05-21 | 2019-01-29 | Google Llc | Vector computation unit in a neural network processor |
CN104915322B (zh) * | 2015-06-09 | 2018-05-01 | 中国人民解放军国防科学技术大学 | 一种卷积神经网络硬件加速方法 |
US9886377B2 (en) * | 2015-10-05 | 2018-02-06 | Intel Corporation | Pipelined convolutional operations for processing clusters |
US10353860B2 (en) * | 2015-10-08 | 2019-07-16 | Via Alliance Semiconductor Co., Ltd. | Neural network unit with neural processing units dynamically configurable to process multiple data sizes |
CN105205479A (zh) | 2015-10-28 | 2015-12-30 | 小米科技有限责任公司 | 人脸颜值评估方法、装置及终端设备 |
US9424494B1 (en) | 2016-01-28 | 2016-08-23 | International Business Machines Corporation | Pure convolutional neural network localization |
-
2016
- 2016-05-03 GB GBGB1607713.3A patent/GB201607713D0/en not_active Ceased
-
2017
- 2017-05-03 US US15/585,645 patent/US11144819B2/en active Active
- 2017-05-03 CN CN201710304906.6A patent/CN107403221B/zh active Active
- 2017-05-03 EP EP24194712.6A patent/EP4439272A2/en active Pending
- 2017-05-03 US US15/585,571 patent/US11625581B2/en active Active
- 2017-05-03 GB GB2012271.9A patent/GB2584243B/en active Active
- 2017-05-03 GB GB2015694.9A patent/GB2585609B/en active Active
- 2017-05-03 GB GB2008977.7A patent/GB2582519B/en active Active
- 2017-05-03 GB GB1707039.2A patent/GB2552242B/en active Active
- 2017-05-03 EP EP17169309.6A patent/EP3242254B1/en active Active
- 2017-05-03 GB GB1707040.0A patent/GB2552243B/en active Active
- 2017-05-03 EP EP21172321.8A patent/EP3901832A1/en active Pending
- 2017-05-03 CN CN202311188305.5A patent/CN117217273A/zh active Pending
- 2017-05-03 EP EP17169307.0A patent/EP3242253B1/en active Active
- 2017-05-03 EP EP21177846.9A patent/EP3901835B1/en active Active
- 2017-05-08 JP JP2017092266A patent/JP7013143B2/ja active Active
-
2021
- 2021-10-11 US US17/498,618 patent/US20220027717A1/en active Pending
-
2022
- 2022-01-19 JP JP2022006207A patent/JP7348971B2/ja active Active
-
2023
- 2023-04-10 US US18/132,929 patent/US11948070B2/en active Active
-
2024
- 2024-04-01 US US18/623,450 patent/US20240249131A1/en active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20090164544A1 (en) | 2007-12-19 | 2009-06-25 | Jeffrey Dobbek | Dynamic range enhancement for arithmetic calculations in real-time control systems using fixed point hardware |
US20120191955A1 (en) | 2011-01-20 | 2012-07-26 | Jonsson Ragnar H | Method and system for floating point acceleration on fixed point digital signal processors |
US20160026912A1 (en) | 2014-07-22 | 2016-01-28 | Intel Corporation | Weight-shifting mechanism for convolutional neural networks |
Non-Patent Citations (1)
Title |
---|
Darryl D.Lin et al.,"FIXED POINT QUANTIZATION OF DEEP CONVOLUTIONAL NETWORKS",arXiv.org [online],arXiv:1511.06393v2,2016年01月,pp.1-15,[2021年5月17日検索],インターネット:<URL: https://arxiv.org/pdf/1511.06393v2.pdf> |
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7348971B2 (ja) | 畳み込みニューラルネットワークハードウエア構成 | |
CN110033080B (zh) | 单平面滤波 | |
US20190147323A1 (en) | Activation Functions for Deep Neural Networks | |
CN110009099B (zh) | 用于确定表示dnn的层的值的定点数格式的方法和系统 | |
CN110033079B (zh) | 深度神经网络的硬件实现的端到端数据格式选择 | |
CN112418391B (zh) | 用于对深度神经网络的权重进行转换的方法和系统 | |
EP3480689B1 (en) | Hierarchical mantissa bit length selection for hardware implementation of deep neural network | |
CN114816331B (zh) | 具有时钟选通的用于执行矩阵乘法的硬件单元 | |
EP4050522A1 (en) | Implementation of softmax and exponential in hardware | |
GB2568102A (en) | Exploiting sparsity in a neural network | |
CN113887710A (zh) | 循环神经网络中的数字格式选择 | |
CN116384443A (zh) | 具有可配置池化处理单元的神经网络加速器 | |
EP4345691A1 (en) | Methods and systems for performing channel equalisation on a convolution layer in a neural network | |
EP4113384A1 (en) | Running bidirectional recurrent neural networks in hardware | |
CN115545146A (zh) | 双向rnn的数字格式选择 | |
CN113887714A (zh) | 用于在硬件中运行动态循环神经网络的方法和系统 | |
GB2622869A (en) | Methods and systems for online selection of number formats for network parameters of a neural network | |
GB2611521A (en) | Neural network accelerator with a configurable pipeline | |
CN115906964A (zh) | 具有可配置流水线的神经网络加速器 | |
GB2603647A (en) | End-to-end data format selection for hardware implementation of deep neural network | |
GB2603582A (en) | End-to-end data format selection for hardware implementation of deep neural network |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220203 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220203 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20230130 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230206 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230508 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230809 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230908 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7348971 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |