JP7013143B2 - 畳み込みニューラルネットワークハードウエア構成 - Google Patents
畳み込みニューラルネットワークハードウエア構成 Download PDFInfo
- Publication number
- JP7013143B2 JP7013143B2 JP2017092266A JP2017092266A JP7013143B2 JP 7013143 B2 JP7013143 B2 JP 7013143B2 JP 2017092266 A JP2017092266 A JP 2017092266A JP 2017092266 A JP2017092266 A JP 2017092266A JP 7013143 B2 JP7013143 B2 JP 7013143B2
- Authority
- JP
- Japan
- Prior art keywords
- layer
- cnn
- value
- values
- weight
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000013527 convolutional neural network Methods 0.000 title claims description 218
- 238000000034 method Methods 0.000 claims description 94
- 239000000872 buffer Substances 0.000 claims description 42
- 238000009826 distribution Methods 0.000 claims description 39
- 238000012549 training Methods 0.000 claims description 34
- 238000007667 floating Methods 0.000 claims description 28
- 238000013139 quantization Methods 0.000 claims description 19
- 238000003860 storage Methods 0.000 claims description 9
- 230000009466 transformation Effects 0.000 claims 1
- 230000001131 transforming effect Effects 0.000 claims 1
- 239000010410 layer Substances 0.000 description 170
- 238000004519 manufacturing process Methods 0.000 description 40
- 238000012545 processing Methods 0.000 description 28
- 230000008569 process Effects 0.000 description 25
- 238000004364 calculation method Methods 0.000 description 12
- 230000001186 cumulative effect Effects 0.000 description 11
- 230000006870 function Effects 0.000 description 10
- 230000000295 complement effect Effects 0.000 description 6
- XUIMIQQOPSSXEZ-UHFFFAOYSA-N Silicon Chemical compound [Si] XUIMIQQOPSSXEZ-UHFFFAOYSA-N 0.000 description 4
- 229910052710 silicon Inorganic materials 0.000 description 4
- 239000010703 silicon Substances 0.000 description 4
- 239000002356 single layer Substances 0.000 description 4
- 238000013528 artificial neural network Methods 0.000 description 3
- 230000008859 change Effects 0.000 description 3
- 239000004065 semiconductor Substances 0.000 description 3
- 238000007619 statistical method Methods 0.000 description 3
- 238000003491 array Methods 0.000 description 2
- 238000004422 calculation algorithm Methods 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000004590 computer program Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000010606 normalization Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000002194 synthesizing effect Effects 0.000 description 2
- 238000009825 accumulation Methods 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000012993 chemical processing Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000013329 compounding Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000006866 deterioration Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000001459 lithography Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 238000009827 uniform distribution Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/06—Physical realisation, i.e. hardware implementation of neural networks, neurons or parts of neurons
- G06N3/063—Physical realisation, i.e. hardware implementation of neural networks, neurons or parts of neurons using electronic means
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/15—Correlation function computation including computation of convolution operations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/16—Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F7/00—Methods or arrangements for processing data by operating upon the order or content of the data handled
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F7/00—Methods or arrangements for processing data by operating upon the order or content of the data handled
- G06F7/38—Methods or arrangements for performing computations using exclusively denominational number representation, e.g. using binary, ternary, decimal representation
- G06F7/48—Methods or arrangements for performing computations using exclusively denominational number representation, e.g. using binary, ternary, decimal representation using non-contact-making devices, e.g. tube, solid state device; using unspecified devices
- G06F7/544—Methods or arrangements for performing computations using exclusively denominational number representation, e.g. using binary, ternary, decimal representation using non-contact-making devices, e.g. tube, solid state device; using unspecified devices for evaluating functions by calculation
- G06F7/5443—Sum of products
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0464—Convolutional networks [CNN, ConvNet]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/048—Activation functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Health & Medical Sciences (AREA)
- Data Mining & Analysis (AREA)
- Software Systems (AREA)
- Artificial Intelligence (AREA)
- General Health & Medical Sciences (AREA)
- Evolutionary Computation (AREA)
- Computational Linguistics (AREA)
- Molecular Biology (AREA)
- Pure & Applied Mathematics (AREA)
- Computational Mathematics (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Neurology (AREA)
- Algebra (AREA)
- Databases & Information Systems (AREA)
- Image Processing (AREA)
- Complex Calculations (AREA)
- Advance Control (AREA)
- Image Analysis (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
として定義することができ、第2の層に対して重みの数を
として定義することができるように層の間で変えることができる。
一般的に、ソフトウエアツールがCNNの訓練フェーズ中に使用されて訓練データセットに基づいて層あたり1セットの重みを生成する。一部の構成では、一部の層内の重み値の一部は、他の手段、例えば、ウェーブレットベースによって発生させることができると考えられる。
任意的な低精度重み調整430段階を量子化/変換値に関して実行することができる。重み調整を実行するために、浮動小数点数は、決定された固定小数点数フォーマットに従って量子化すべきである。
は浮動仮数であり、
は、対応する8ビット固定小数点仮数である。
上述の固定小数点付番フォーマットは、整数及び指数固定小数点計算の整数ベースの実施に使用することができる。
上述の演算の全てが整数計算である。オーバーフローの場合に、数は、Xmax又はXminにクランピングされる。乗算の場合に、結果の指数は、ビットをシフトする代わりに調節することができ、数を異なる指数で乗算する時に有用になる。
低精度固定小数点フォーマットで畳み込み層を実施する段階は、いくつかの理由でCNNで畳み込み層を実施する改善された方法を提供することができる。例えば、数ビットをCNNのハードウエア実装を演算するのに使用されるメモリ帯域幅を低減する外部メモリとCNNのハードウエア実装との間で転送しなければならない。上述の整数計算論理部は、畳み込み操作を実施するのに必要なハードウエア論理部のサイズ及び複雑さを低減する畳み込み計算(上述の畳み込みエンジンなど)内に実施することができる。更に、重みデータ及び入力データを格納するのに必要なビットの数が、対応する浮動小数点数表現よりも又は上述のQフォーマット固定小数点数表現よりも少ないので、CNNのハードウエア実装に必要なバッファはより小さい。図2に対応するCNNの上述のハードウエア実装を参照すると、係数及びデータバッファ、並びに累積バッファを小さくすることができる。
CNNのハードウエア実装に使用する構成データを生成して数フォーマットを定義する方法が上記に示されている。上述のように、CNNを定義する重みを低精度ターゲットに適応させることができる重み調整430の任意段階を図4の方法の一部として実施することができる。段階430は、段階440で得られた量子化値を受信する段階及びCNNの更に別の訓練を実行することによって重み値を修正する段階を伴う。重み値の調整は、本発明の開示の固定小数点数表現を使用して実施されるCNNの分類誤差を低減することができる。本明細書に説明する例では、各々が複数の重み値を有する複数の層によって定義される事前訓練されたネットワークは、図4の段階410で上述のように従来の浮動小数点ソフトウエアツールを使用して準備されていたと仮定する。更に、固定小数点数フォーマットの重み及び入力データ指数が段階420で決定され、重み及びデータの事前定義されたビット長が設定されていたと仮定する。
410 浮動点訓練
420 数フォーマットの決定
430 低精度重み調整
440 量子化
Claims (24)
- 畳み込みニューラルネットワーク(CNN)のハードウエア実装を構成するコンピュータ実装方法であって、
前記CNNの複数の層の各々に対して、該層に対する重み値の分布に基づいて該層内の重み値を表すための第1の数フォーマットを決定する段階であって、該第1の数フォーマットが、第1の予め決められたビット長の第1の整数と該層に対して固定された第1の指数値とを含む前記決定する段階と、
前記CNNの複数の層の各々に対して、該層に対して予想されるデータ値の分布に基づいて該層内のデータ値を表すための第2の数フォーマットを決定する段階であって、該第2の数フォーマットが、第2の予め決められたビット長の第2の整数と該層に対して固定された第2の指数値とを含む前記決定する段階と、
CNNの前記ハードウエア実装を構成する際に使用するために前記決定された数フォーマットを格納する段階と、
前記重み値を調整する段階と、
を含み、
前記調整する段階は、
複数の層の各々に対して、該層内の前記重み値の部分集合を選択する段階と、
複数の層の各々に対して、該層に対する前記第1の数フォーマットに従って該層内の前記選択された重み値を量子化し、該層内に修正重み値を発生させる段階と、
前記修正重み値を使用して前記CNNを訓練して調整重み値を発生させる段階と、
を含む、
ことを特徴とする方法。 - 前記第1及び第2の予め決められたビット長は、各々が前記CNNの複数の層にわたって固定されることを特徴とする請求項1に記載の方法。
- 前記CNNの前記複数の層の各々に対する前記重み値を前記第1の数フォーマットに変換する段階と該CNNへの入力データを前記第2の数フォーマットに変換する段階とを更に含み、
前記変換する段階は、前記第1及び第2の数フォーマットに基づいて量子化を実行する段階を含む、
ことを特徴とする請求項1又は請求項2に記載の方法。 - 前記量子化は、最近傍丸め操作に基づいて実行されることを特徴とする請求項3に記載の方法。
- 前記CNNの前記複数の層の各々に対する前記変換された重み値と該CNNへのデータ値とを該CNNの前記ハードウエア実装によってアクセス可能なメモリに又は該CNNの該ハードウエア実装内の1又は2以上のバッファに格納する段階を更に含むことを特徴とする請求項3又は請求項4に記載の方法。
- 前記CNNの前記複数の層の各々に対する前記重み値を格納する段階を更に含み、
前記格納する段階は、
各重み値に対して、該重み値の前記第1の整数を表す値を格納する段階と、
各層に対して、該層に対する前記第1の指数値を表す値を格納する段階と、
を含む、
ことを特徴とする請求項1から請求項5のいずれか1項に記載の方法。 - 前記CNNの前記複数の層の各々に対する前記データ値を格納する段階を更に含み、
前記格納する段階は、
各データ値に対して、該データ値の前記第2の整数を表す値を格納する段階と、
各層に対して、該層に対する前記第2の指数値を表す値を格納する段階と、
を含む、
ことを特徴とする請求項1から請求項6のいずれか1項に記載の方法。 - 前記CNNの各層内の前記重み値は、訓練データセットを使用して該CNNを訓練することによって発生され、
前記発生された重み値は、浮動小数点フォーマットにある、
ことを特徴とする請求項1から請求項7のいずれか1項に記載の方法。 - 予想されるデータ値の前記分布は、前記訓練データセットから導出されることを特徴とする請求項8に記載の方法。
- 各層に対する前記第1の指数値を
前記層に対する重み値の前記分布に基づいて値の範囲を表すビット指標を識別し、
前記第1の予め決められたビット長に基づいて前記ビット指標の位置を前記識別されたビット指標からいくつかのビットだけ右シフトして第1のシフトビット指標を識別し、
前記第1のシフトビット指標の値を前記第1の指数値として割り当てる、
ことによって決定する段階を更に含むことを特徴とする請求項1から請求項9のいずれか1項に記載の方法。 - 各層に対する前記第2の指数値を
前記層に対して予想されるデータ値の前記分布に基づいて値の範囲を表すビット指標を識別し、
前記第2の予め決められたビット長に基づいて前記ビット指標の位置を前記識別されたビット指標からいくつかのビットだけ右シフトして第2のシフトビット指標を識別し、
前記第2のシフトビット指標の値を前記第2の指数値として割り当てる、
ことによって決定する段階を更に含むことを特徴とする請求項1から請求項10のいずれか1項に記載の方法。 - 畳み込みニューラルネットワーク(CNN)のハードウエア実装を構成するためのコンピュータシステムであって、
前記CNNの複数の層の各々に対して、該層に対する重み値の分布に基づいて該層内の重み値を表すための第1の予め決められたビット長の第1の整数と該層に対して固定された第1の指数値とを含む第1の数フォーマットを決定し、
前記CNNの複数の層の各々に対して、該層に対して予想されるデータ値の分布に基づいて該層内のデータ値を表すための第2の予め決められたビット長の第2の整数と該層に対して固定された第2の指数値とを含む第2の数フォーマットを決定し、かつ
CNNの前記ハードウエア実装を構成する際に使用するために前記決定された数フォーマットを格納し、
前記重み値を調整するように構成され、
前記重み値を調整する段階は、
複数の層の各々に対して、該層内の前記重み値の部分集合を選択する段階と、
複数の層の各々に対して、該層に対する前記第1の数フォーマットに従って該層内の前記選択された重み値を量子化し、該層内に修正重み値を発生させる段階と、
前記修正重み値を使用して前記CNNを訓練して調整重み値を発生させる段階と、
を含む、
ことを特徴とするコンピュータシステム。 - 前記第1及び第2の予め決められたビット長は、各々が前記CNNの複数の層にわたって固定されることを特徴とする請求項12に記載のコンピュータシステム。
- 前記CNNの前記複数の層の各々に対する前記重み値を前記第1の数フォーマットに変換し、かつ該CNNへの入力データを前記第2の数フォーマットに変換するように構成され、
前記変換は、前記第1及び第2の数フォーマットに基づいて量子化を実行する段階を含む、
ことを特徴とする請求項12又は請求項13に記載のコンピュータシステム。 - 前記量子化は、最近傍丸め操作に基づいて実行されることを特徴とする請求項14に記載のコンピュータシステム。
- 前記CNNの前記複数の層の各々に対して前記変換された重み値と該CNNへのデータ値とを該CNNの前記ハードウエア実装によってアクセス可能なメモリに又は該CNNの該ハードウエア実装内の1又は2以上のバッファに格納するように構成されることを特徴とする請求項14又は請求項15に記載のコンピュータシステム。
- 前記CNNの前記複数の層の各々に対する前記重み値を格納するように構成され、
前記重み値を格納する段階は、
各重み値に対して、該重み値の前記第1の整数を表す値を格納する段階と、
各層に対して、該層に対する前記第1の指数値を表す値を格納する段階と、
を含む、
ことを特徴とする請求項12から請求項16のいずれか1項に記載のコンピュータシステム。 - 前記CNNの前記複数の層の各々に対する前記データ値を格納するように構成され、
前記データ値を格納する段階は、
各データ値に対して、該データ値の前記第2の整数を表す値を格納する段階と、
各層に対して、該層に対する前記第2の指数値を表す値を格納する段階と、
を含む、
ことを特徴とする請求項12から請求項17のいずれか1項に記載のコンピュータシステム。 - 前記CNNの各層内の前記重み値は、訓練データセットを使用して該CNNを訓練することによって発生され、
前記発生された重み値は、浮動小数点フォーマットにある、
ことを特徴とする請求項12から請求項18のいずれか1項に記載のコンピュータシステム。 - 予想されるデータ値の前記分布は、前記訓練データセットから導出されることを特徴とする請求項19に記載のコンピュータシステム。
- 各層に対する前記第1の指数値を
前記層に対する重み値の前記分布に基づいて値の範囲を表すビット指標を識別し、
前記第1の予め決められたビット長に基づいて前記ビット指標の位置を前記識別されたビット指標からいくつかのビットだけ右シフトして第1のシフトビット指標を識別し、
前記第1のシフトビット指標の値を前記第1の指数値として割り当てる、
ことによって決定するように構成されることを特徴とする請求項12から請求項20のいずれか1項に記載のコンピュータシステム。 - 各層に対する前記第2の指数値を
前記層に対して予想されるデータ値の前記分布に基づいて値の範囲を表すビット指標を識別し、
前記第2の予め決められたビット長に基づいて前記ビット指標の位置を前記識別されたビット指標からいくつかのビットだけ右シフトして第2のシフトビット指標を識別し、
前記第2のシフトビット指標の値を前記第2の指数値として割り当てる、
ことによって決定するように構成されることを特徴とする請求項12から請求項21のいずれか1項に記載のコンピュータシステム。 - 請求項1から請求項11のいずれか1項に記載の方法を実行するように構成されたコンピュータシステム。
- コンピュータ可読コードが符号化されたコンピュータ可読ストレージ媒体であって、
前記コンピュータ可読コードは、該コードがコンピュータ上で実行された時に請求項1から請求項11のいずれか1項に記載の方法の段階を実行するように構成される、
ことを特徴とするコンピュータ可読ストレージ媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2022006207A JP7348971B2 (ja) | 2016-05-03 | 2022-01-19 | 畳み込みニューラルネットワークハードウエア構成 |
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
GB1607713.3 | 2016-05-03 | ||
GBGB1607713.3A GB201607713D0 (en) | 2016-05-03 | 2016-05-03 | Convolutional neural network |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022006207A Division JP7348971B2 (ja) | 2016-05-03 | 2022-01-19 | 畳み込みニューラルネットワークハードウエア構成 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2018010618A JP2018010618A (ja) | 2018-01-18 |
JP7013143B2 true JP7013143B2 (ja) | 2022-01-31 |
Family
ID=56234306
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017092266A Active JP7013143B2 (ja) | 2016-05-03 | 2017-05-08 | 畳み込みニューラルネットワークハードウエア構成 |
JP2022006207A Active JP7348971B2 (ja) | 2016-05-03 | 2022-01-19 | 畳み込みニューラルネットワークハードウエア構成 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022006207A Active JP7348971B2 (ja) | 2016-05-03 | 2022-01-19 | 畳み込みニューラルネットワークハードウエア構成 |
Country Status (5)
Country | Link |
---|---|
US (5) | US11144819B2 (ja) |
EP (5) | EP3901835B1 (ja) |
JP (2) | JP7013143B2 (ja) |
CN (2) | CN117217273A (ja) |
GB (6) | GB201607713D0 (ja) |
Families Citing this family (159)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20180053086A1 (en) * | 2016-08-22 | 2018-02-22 | Kneron Inc. | Artificial neuron and controlling method thereof |
FR3057090B1 (fr) * | 2016-09-30 | 2018-10-19 | Safran Identity & Security | Procedes d'apprentissage securise de parametres d'un reseau de neurones a convolution, et de classification securisee d'une donnee d'entree |
GB2554711B (en) | 2016-10-06 | 2020-11-25 | Imagination Tech Ltd | Buffer addressing for a convolutional neural network |
US9940534B1 (en) * | 2016-10-10 | 2018-04-10 | Gyrfalcon Technology, Inc. | Digital integrated circuit for extracting features out of an input image based on cellular neural networks |
US10339445B2 (en) | 2016-10-10 | 2019-07-02 | Gyrfalcon Technology Inc. | Implementation of ResNet in a CNN based digital integrated circuit |
US10360470B2 (en) | 2016-10-10 | 2019-07-23 | Gyrfalcon Technology Inc. | Implementation of MobileNet in a CNN based digital integrated circuit |
US10366328B2 (en) | 2017-09-19 | 2019-07-30 | Gyrfalcon Technology Inc. | Approximating fully-connected layers with multiple arrays of 3x3 convolutional filter kernels in a CNN based integrated circuit |
US10402628B2 (en) | 2016-10-10 | 2019-09-03 | Gyrfalcon Technology Inc. | Image classification systems based on CNN based IC and light-weight classifier |
US10366302B2 (en) | 2016-10-10 | 2019-07-30 | Gyrfalcon Technology Inc. | Hierarchical category classification scheme using multiple sets of fully-connected networks with a CNN based integrated circuit as feature extractor |
US10043095B2 (en) * | 2016-10-10 | 2018-08-07 | Gyrfalcon Technology, Inc. | Data structure for CNN based digital integrated circuit for extracting features out of an input image |
US11003985B2 (en) * | 2016-11-07 | 2021-05-11 | Electronics And Telecommunications Research Institute | Convolutional neural network system and operation method thereof |
CN106557332A (zh) * | 2016-11-30 | 2017-04-05 | 上海寒武纪信息科技有限公司 | 一种指令生成过程的复用方法及装置 |
US10096384B2 (en) | 2016-12-21 | 2018-10-09 | Disco Health, LLC | Artificial intelligence expert system |
KR102415508B1 (ko) * | 2017-03-28 | 2022-07-01 | 삼성전자주식회사 | 컨볼루션 신경망 처리 방법 및 장치 |
US11037330B2 (en) | 2017-04-08 | 2021-06-15 | Intel Corporation | Low rank matrix compression |
CN107124609A (zh) * | 2017-04-27 | 2017-09-01 | 京东方科技集团股份有限公司 | 一种视频图像的处理系统、其处理方法及显示装置 |
US10474458B2 (en) * | 2017-04-28 | 2019-11-12 | Intel Corporation | Instructions and logic to perform floating-point and integer operations for machine learning |
US20180330234A1 (en) * | 2017-05-11 | 2018-11-15 | Hussein Al-barazanchi | Partial weights sharing convolutional neural networks |
EP3646164A4 (en) * | 2017-06-30 | 2021-01-20 | INTEL Corporation | HETEROGENIC MULTIPLIER |
US10600147B2 (en) * | 2017-08-22 | 2020-03-24 | Intel Corporation | Efficient memory layout for enabling smart data compression in machine learning environments |
JP2019057249A (ja) * | 2017-09-22 | 2019-04-11 | 富士通株式会社 | 演算処理装置および演算処理方法 |
CN109754359B (zh) * | 2017-11-01 | 2021-12-07 | 腾讯科技(深圳)有限公司 | 一种应用于卷积神经网络的池化处理的方法及系统 |
GB2568086B (en) | 2017-11-03 | 2020-05-27 | Imagination Tech Ltd | Hardware implementation of convolution layer of deep neutral network |
GB2568084B (en) | 2017-11-03 | 2022-01-12 | Imagination Tech Ltd | Error allocation format selection for hardware implementation of deep neural network |
GB2560600B (en) * | 2017-11-06 | 2020-03-04 | Imagination Tech Ltd | Nueral Network Hardware |
EP3480747A1 (en) | 2017-11-06 | 2019-05-08 | Imagination Technologies Limited | Single plane filters |
KR20190052893A (ko) * | 2017-11-09 | 2019-05-17 | 삼성전자주식회사 | 뉴럴 네트워크 연산을 위한 전처리 장치 및 방법 |
US10929746B2 (en) * | 2017-11-27 | 2021-02-23 | Samsung Electronics Co., Ltd. | Low-power hardware acceleration method and system for convolution neural network computation |
WO2019109336A1 (en) * | 2017-12-08 | 2019-06-13 | Baidu.Com Times Technology (Beijing) Co., Ltd. | Stereo camera depth determination using hardware accelerator |
US11475305B2 (en) * | 2017-12-08 | 2022-10-18 | Advanced Micro Devices, Inc. | Activation function functional block for electronic devices |
US11216719B2 (en) * | 2017-12-12 | 2022-01-04 | Intel Corporation | Methods and arrangements to quantize a neural network with machine learning |
JP6789919B2 (ja) | 2017-12-13 | 2020-11-25 | 日立オートモティブシステムズ株式会社 | 演算システム、サーバ、車載装置 |
CN109961133B (zh) * | 2017-12-14 | 2020-04-24 | 中科寒武纪科技股份有限公司 | 集成电路芯片装置及相关产品 |
CN109961137B (zh) * | 2017-12-14 | 2020-10-09 | 中科寒武纪科技股份有限公司 | 集成电路芯片装置及相关产品 |
WO2019114842A1 (zh) * | 2017-12-14 | 2019-06-20 | 北京中科寒武纪科技有限公司 | 一种集成电路芯片装置 |
CN108108811B (zh) * | 2017-12-18 | 2021-07-30 | 南京地平线机器人技术有限公司 | 神经网络中的卷积计算方法和电子设备 |
CN109978131B (zh) * | 2017-12-28 | 2020-05-22 | 中科寒武纪科技股份有限公司 | 集成电路芯片装置、方法及相关产品 |
CN109416756A (zh) * | 2018-01-15 | 2019-03-01 | 深圳鲲云信息科技有限公司 | 卷积器及其所应用的人工智能处理装置 |
KR102463532B1 (ko) * | 2018-01-16 | 2022-11-08 | 한국전자통신연구원 | 신경망 컴퓨팅 장치 및 그것의 동작 방법 |
US11436483B2 (en) * | 2018-01-17 | 2022-09-06 | Mediatek Inc. | Neural network engine with tile-based execution |
JP7107797B2 (ja) * | 2018-01-29 | 2022-07-27 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ | 情報処理方法及び情報処理システム |
GB201801639D0 (en) * | 2018-02-01 | 2018-03-21 | Ruff Brendan Patrick | Low precision efficient multiplication free convolutional filter bank device |
KR102143928B1 (ko) | 2018-02-05 | 2020-08-13 | 고려대학교 산학협력단 | 인공 신경망 장치 및 그 동작 방법 |
EP3651075B1 (en) * | 2018-02-13 | 2021-10-27 | Shanghai Cambricon Information Technology Co., Ltd | Computation device and method |
KR102683757B1 (ko) * | 2018-02-20 | 2024-07-10 | 삼성전자주식회사 | 심층 신경망의 학습을 수행시키는 방법 및 그에 대한 장치 |
JP7056225B2 (ja) * | 2018-02-26 | 2022-04-19 | 富士通株式会社 | 演算処理装置、情報処理装置、情報処理方法、およびプログラム |
JP6540841B1 (ja) * | 2018-02-27 | 2019-07-10 | 富士通株式会社 | 演算処理装置、情報処理装置、情報処理方法、およびプログラム |
JP6757349B2 (ja) * | 2018-03-12 | 2020-09-16 | 株式会社東芝 | 固定小数点を用いて認識処理を行う多層の畳み込みニューラルネットワーク回路を実現する演算処理装置 |
KR102329590B1 (ko) * | 2018-03-19 | 2021-11-19 | 에스알아이 인터내셔널 | 딥 신경망들의 동적 적응 |
US11429862B2 (en) | 2018-03-20 | 2022-08-30 | Sri International | Dynamic adaptation of deep neural networks |
US11475306B2 (en) | 2018-03-22 | 2022-10-18 | Amazon Technologies, Inc. | Processing for multiple input data sets |
EP3738081A1 (en) * | 2018-03-22 | 2020-11-18 | Amazon Technologies Inc. | Processing for multiple input data sets |
JP6961640B2 (ja) * | 2018-03-22 | 2021-11-05 | 南京地平▲線▼机▲器▼人技▲術▼有限公司 | データ処理のシステムおよび方法 |
US10678508B2 (en) * | 2018-03-23 | 2020-06-09 | Amazon Technologies, Inc. | Accelerated quantized multiply-and-add operations |
CN108509382B (zh) * | 2018-03-27 | 2022-06-07 | 南开大学 | 一种基于fpga实现超长序列快速卷积运算的方法 |
US10621489B2 (en) * | 2018-03-30 | 2020-04-14 | International Business Machines Corporation | Massively parallel neural inference computing elements |
US10558430B2 (en) * | 2018-04-17 | 2020-02-11 | Fotonation Limited | Neural network engine |
US11769036B2 (en) * | 2018-04-18 | 2023-09-26 | Qualcomm Incorporated | Optimizing performance of recurrent neural networks |
US11568227B1 (en) | 2018-04-20 | 2023-01-31 | Perceive Corporation | Neural network inference circuit read controller with multiple operational modes |
US11886979B1 (en) | 2018-04-20 | 2024-01-30 | Perceive Corporation | Shifting input values within input buffer of neural network inference circuit |
US11210586B1 (en) | 2018-04-20 | 2021-12-28 | Perceive Corporation | Weight value decoder of neural network inference circuit |
US10977338B1 (en) | 2018-04-20 | 2021-04-13 | Perceive Corporation | Reduced-area circuit for dot product computation |
US11586910B1 (en) | 2018-04-20 | 2023-02-21 | Perceive Corporation | Write cache for neural network inference circuit |
US11205115B1 (en) | 2018-04-20 | 2021-12-21 | Perceive Corporation | Neural network inference circuit |
US11783167B1 (en) | 2018-04-20 | 2023-10-10 | Perceive Corporation | Data transfer for non-dot product computations on neural network inference circuit |
US12093696B1 (en) | 2018-04-20 | 2024-09-17 | Perceive Corporation | Bus for transporting output values of a neural network layer to cores specified by configuration data |
CN108805265B (zh) * | 2018-05-21 | 2021-03-30 | Oppo广东移动通信有限公司 | 神经网络模型处理方法和装置、图像处理方法、移动终端 |
CN110533175A (zh) * | 2018-05-23 | 2019-12-03 | 富士通株式会社 | 深度学习加速的方法和设备及深度神经网络 |
CN110533176B (zh) * | 2018-05-25 | 2022-10-11 | 赛灵思电子科技(北京)有限公司 | 用于神经网络计算的缓存装置及其相关计算平台 |
US11507818B2 (en) | 2018-06-05 | 2022-11-22 | Lightelligence PTE. Ltd. | Optoelectronic computing systems |
CA3101026A1 (en) | 2018-06-05 | 2019-12-12 | Lightelligence, Inc. | Optoelectronic computing systems |
DE102019205079A1 (de) | 2018-06-19 | 2019-12-19 | Robert Bosch Gmbh | Selektive Deaktivierung von Recheneinheiten für künstliche neuronale Netzwerke |
DE102018209901A1 (de) * | 2018-06-19 | 2019-12-19 | Robert Bosch Gmbh | Recheneinheit, Verfahren und Computerprogramm zum Multiplizieren zumindest zweier Multiplikanden |
US12056594B2 (en) * | 2018-06-27 | 2024-08-06 | International Business Machines Corporation | Low precision deep neural network enabled by compensation instructions |
US10417342B1 (en) | 2018-07-03 | 2019-09-17 | Gyrfalcon Technology Inc. | Deep learning device for local processing classical chinese poetry and verse |
WO2020008642A1 (ja) * | 2018-07-06 | 2020-01-09 | 日本電気株式会社 | 学習装置、学習回路、学習方法および学習プログラム |
JP7120308B2 (ja) * | 2018-07-06 | 2022-08-17 | 日本電気株式会社 | データ処理装置、データ処理回路およびデータ処理方法 |
JP7119107B2 (ja) * | 2018-07-30 | 2022-08-16 | インテル コーポレイション | 8ビットウィノグラード畳み込みで統計推論確度を維持する方法及び装置 |
US10311149B1 (en) | 2018-08-08 | 2019-06-04 | Gyrfalcon Technology Inc. | Natural language translation device |
WO2020039493A1 (ja) * | 2018-08-21 | 2020-02-27 | 日本電気株式会社 | 演算最適化装置、方法およびプログラム |
US11836971B2 (en) * | 2018-08-23 | 2023-12-05 | Samsung Electronics Co., Ltd. | Method and device with convolution neural network processing |
KR20200026455A (ko) | 2018-09-03 | 2020-03-11 | 삼성전자주식회사 | 인공 신경망 시스템 및 인공 신경망의 고정 소수점 제어 방법 |
KR20200028168A (ko) * | 2018-09-06 | 2020-03-16 | 삼성전자주식회사 | 컨볼루셔널 뉴럴 네트워크를 이용하는 컴퓨팅 장치 및 그 동작 방법 |
KR102633139B1 (ko) | 2018-09-07 | 2024-02-02 | 삼성전자주식회사 | 데이터를 추출하는 집적 회로, 그것을 포함하는 뉴럴 네트워크 프로세서 및 뉴럴 네트워크 장치 |
US10747502B2 (en) * | 2018-09-19 | 2020-08-18 | Xilinx, Inc. | Multiply and accumulate circuit |
WO2020065874A1 (ja) * | 2018-09-27 | 2020-04-02 | 株式会社ソシオネクスト | ネットワーク量子化方法、推論方法及びネットワーク量子化装置 |
JP7040771B2 (ja) * | 2018-10-10 | 2022-03-23 | LeapMind株式会社 | ニューラルネットワーク処理装置、通信装置、ニューラルネットワーク処理方法、およびプログラム |
US10769846B2 (en) * | 2018-10-11 | 2020-09-08 | GM Global Technology Operations LLC | Point cloud data compression in an autonomous vehicle |
CN112639838A (zh) * | 2018-10-12 | 2021-04-09 | 奥林巴斯株式会社 | 运算处理装置 |
US10387772B1 (en) | 2018-10-22 | 2019-08-20 | Gyrfalcon Technology Inc. | Ensemble learning based image classification systems |
US11995533B1 (en) | 2018-12-05 | 2024-05-28 | Perceive Corporation | Executing replicated neural network layers on inference circuit |
US11586883B2 (en) * | 2018-12-14 | 2023-02-21 | Microsoft Technology Licensing, Llc | Residual quantization for neural networks |
CN111382832A (zh) * | 2018-12-29 | 2020-07-07 | 佳能株式会社 | 多层神经网络模型的训练和应用方法、装置及存储介质 |
CN109740737B (zh) * | 2018-12-30 | 2021-02-19 | 联想(北京)有限公司 | 卷积神经网络量化处理方法、装置及计算机设备 |
US12045724B2 (en) * | 2018-12-31 | 2024-07-23 | Microsoft Technology Licensing, Llc | Neural network activation compression with outlier block floating-point |
KR20200086581A (ko) * | 2019-01-09 | 2020-07-17 | 삼성전자주식회사 | 뉴럴 네트워크 양자화를 위한 방법 및 장치 |
US11734556B2 (en) | 2019-01-14 | 2023-08-22 | Lightelligence PTE. Ltd. | Optoelectronic computing systems |
US11347297B1 (en) | 2019-01-23 | 2022-05-31 | Perceive Corporation | Neural network inference circuit employing dynamic memory sleep |
US11562247B2 (en) | 2019-01-24 | 2023-01-24 | Microsoft Technology Licensing, Llc | Neural network activation compression with non-uniform mantissas |
US11544525B2 (en) | 2019-02-04 | 2023-01-03 | Sateesh Kumar Addepalli | Systems and methods for artificial intelligence with a flexible hardware processing framework |
US11150720B2 (en) | 2019-02-04 | 2021-10-19 | Sateesh Kumar Addepalli | Systems and methods for power management of hardware utilizing virtual multilane architecture |
US20200249996A1 (en) * | 2019-02-04 | 2020-08-06 | Pathtronic Inc. | Systems and methods for artificial intelligence hardware processing |
US11507662B2 (en) * | 2019-02-04 | 2022-11-22 | Sateesh Kumar Addepalli | Systems and methods of security for trusted artificial intelligence hardware processing |
US11423454B2 (en) | 2019-02-15 | 2022-08-23 | Sateesh Kumar Addepalli | Real-time customizable AI model collaboration and marketplace service over a trusted AI model network |
JP7345262B2 (ja) | 2019-03-11 | 2023-09-15 | キヤノン株式会社 | データ圧縮装置、データ処理装置、データ圧縮方法、プログラム、及び学習済みモデル |
CN111695671B (zh) * | 2019-03-12 | 2023-08-08 | 北京地平线机器人技术研发有限公司 | 训练神经网络的方法及装置、电子设备 |
JP7188237B2 (ja) * | 2019-03-29 | 2022-12-13 | 富士通株式会社 | 情報処理装置、情報処理方法、情報処理プログラム |
JP7177000B2 (ja) * | 2019-05-16 | 2022-11-22 | 日立Astemo株式会社 | 演算装置および演算方法 |
US11868901B1 (en) | 2019-05-21 | 2024-01-09 | Percieve Corporation | Compiler for optimizing memory allocations within cores |
CN112085183B (zh) | 2019-06-12 | 2024-04-02 | 上海寒武纪信息科技有限公司 | 一种神经网络运算方法及装置以及相关产品 |
JP7243498B2 (ja) * | 2019-07-11 | 2023-03-22 | 富士通株式会社 | 演算処理装置、制御プログラム、及び制御方法 |
CN112308199B (zh) * | 2019-07-26 | 2024-05-10 | 杭州海康威视数字技术股份有限公司 | 数据块的处理方法、装置及存储介质 |
GB2581546B (en) * | 2019-08-22 | 2021-03-31 | Imagination Tech Ltd | Methods and systems for converting weights of a deep neural network from a first number format to a second number format |
CN114207609A (zh) * | 2019-08-26 | 2022-03-18 | 索尼集团公司 | 信息处理装置、信息处理系统和信息处理方法 |
WO2021036905A1 (zh) | 2019-08-27 | 2021-03-04 | 安徽寒武纪信息科技有限公司 | 数据处理方法、装置、计算机设备和存储介质 |
JP7419711B2 (ja) * | 2019-09-09 | 2024-01-23 | 株式会社ソシオネクスト | 量子化パラメータ最適化方法、及び、量子化パラメータ最適化装置 |
US11657282B2 (en) * | 2019-09-16 | 2023-05-23 | Qualcomm Incorporated | Efficient inferencing with fast pointwise convolution |
CN112561050B (zh) * | 2019-09-25 | 2023-09-05 | 杭州海康威视数字技术股份有限公司 | 一种神经网络模型训练方法及装置 |
CN110879697B (zh) * | 2019-10-29 | 2021-09-28 | 南京大学 | 一种近似计算tanh函数的装置 |
CN111091548B (zh) * | 2019-12-12 | 2020-08-21 | 哈尔滨市科佳通用机电股份有限公司 | 基于深度学习的铁路货车承载鞍错位故障图像识别方法及系统 |
US11363002B2 (en) * | 2019-12-13 | 2022-06-14 | TripleBlind, Inc. | Systems and methods for providing a marketplace where data and algorithms can be chosen and interact via encryption |
US11528259B2 (en) | 2019-12-13 | 2022-12-13 | TripleBlind, Inc. | Systems and methods for providing a systemic error in artificial intelligence algorithms |
US11431688B2 (en) | 2019-12-13 | 2022-08-30 | TripleBlind, Inc. | Systems and methods for providing a modified loss function in federated-split learning |
US11973743B2 (en) | 2019-12-13 | 2024-04-30 | TripleBlind, Inc. | Systems and methods for providing a systemic error in artificial intelligence algorithms |
KR20210079785A (ko) * | 2019-12-20 | 2021-06-30 | 삼성전자주식회사 | 뉴럴 네트워크의 컨볼루션 연산 처리 방법 및 장치 |
US11755683B2 (en) | 2019-12-23 | 2023-09-12 | Western Digital Technologies, Inc. | Flexible accelerator for sparse tensors (FAST) in machine learning |
JP2021111081A (ja) | 2020-01-09 | 2021-08-02 | 富士通株式会社 | 情報処理装置、ニューラルネットワークの演算プログラム及びニューラルネットワークの演算方法 |
CN114846478A (zh) * | 2020-01-16 | 2022-08-02 | 北京算能科技有限公司 | 神经网络处理的方法、装置与系统 |
CN110866862B (zh) * | 2020-01-19 | 2020-05-15 | 光子算数(北京)科技有限责任公司 | 基于缓冲器的数据处理方法、装置、存储介质及电子设备 |
CN113408715B (zh) * | 2020-03-17 | 2024-05-28 | 杭州海康威视数字技术股份有限公司 | 一种神经网络的定点化方法、装置 |
US11462003B2 (en) * | 2020-03-25 | 2022-10-04 | Western Digital Technologies, Inc. | Flexible accelerator for sparse tensors in convolutional neural networks |
US11797830B2 (en) | 2020-03-25 | 2023-10-24 | Western Digital Technologies, Inc. | Flexible accelerator for sparse tensors in convolutional neural networks |
KR20210121946A (ko) * | 2020-03-31 | 2021-10-08 | 삼성전자주식회사 | 뉴럴 네트워크 양자화를 위한 방법 및 장치 |
US12079591B2 (en) | 2020-04-07 | 2024-09-03 | Samsung Electronics Co., Ltd. | Neural network device, method of operating the neural network device, and application processor including the neural network device |
TWI768326B (zh) * | 2020-04-20 | 2022-06-21 | 國立陽明交通大學 | 卷積運算模組及方法以及其適用之卷積神經網路系統 |
US11763162B2 (en) * | 2020-06-16 | 2023-09-19 | National Tsing Hua University | Dynamic gradient calibration method for computing-in-memory neural network and system thereof |
GB2596150B (en) * | 2020-06-19 | 2022-06-15 | Imagination Tech Ltd | Methods and systems for selecting number formats for deep neural networks based on network sensitivity and quantisation error |
CN111832717B (zh) * | 2020-06-24 | 2021-09-28 | 上海西井信息科技有限公司 | 芯片及用于卷积计算的处理装置 |
JP2022022876A (ja) | 2020-07-09 | 2022-02-07 | キヤノン株式会社 | 畳み込みニューラルネットワーク処理装置 |
GB2599098B (en) * | 2020-09-22 | 2024-04-10 | Imagination Tech Ltd | Hardware implementation of windowed operations in three or more dimensions |
US11797832B2 (en) * | 2020-10-15 | 2023-10-24 | Gigantor Technologies Inc. | Composing arbitrary convolutional neural network models from a fixed set of duplicate pipelined components |
US11507693B2 (en) | 2020-11-20 | 2022-11-22 | TripleBlind, Inc. | Systems and methods for providing a blind de-identification of privacy data |
US12112265B2 (en) | 2020-12-18 | 2024-10-08 | Analog Devices International Unlimited Company | Architecture for running convolutional networks on memory and mips constrained embedded devices |
US11144822B1 (en) * | 2021-01-04 | 2021-10-12 | Edgecortix Pte. Ltd. | Neural network accelerator run-time reconfigurability |
CN113222148B (zh) * | 2021-05-20 | 2022-01-11 | 浙江大学 | 一种面向物料识别的神经网络推理加速方法 |
CN115906964A (zh) | 2021-09-30 | 2023-04-04 | 想象技术有限公司 | 具有可配置流水线的神经网络加速器 |
GB2611522B (en) | 2021-09-30 | 2024-04-10 | Imagination Tech Ltd | Neural network accelerator with a configurable pipeline |
GB2611521B (en) | 2021-09-30 | 2024-04-10 | Imagination Tech Ltd | Neural network accelerator with a configurable pipeline |
GB2611520B (en) | 2021-09-30 | 2024-05-22 | Imagination Tech Ltd | Methods and devices for configuring a neural network accelerator with a configurable pipeline |
WO2023113985A1 (en) * | 2021-12-17 | 2023-06-22 | SiFive, Inc. | Quad narrowing operation |
CN116384443A (zh) | 2021-12-31 | 2023-07-04 | 想象技术有限公司 | 具有可配置池化处理单元的神经网络加速器 |
GB2614327A (en) | 2021-12-31 | 2023-07-05 | Imagination Tech Ltd | Configurable pooling process unit for neural network accelerator |
GB2614705B (en) | 2021-12-31 | 2024-04-17 | Imagination Tech Ltd | Neural network accelerator with configurable pooling processing unit |
GB2615754B (en) * | 2022-02-15 | 2024-02-21 | Advanced Risc Mach Ltd | Method and processing unit for generating an output feature map |
GB2620167B (en) | 2022-06-29 | 2024-10-30 | Imagination Tech Ltd | Methods and systems for executing a neural network on a neural network accelerator |
GB2622869B (en) | 2022-09-30 | 2024-10-30 | Imagination Tech Ltd | Methods and systems for online selection of number formats for network parameters of a neural network |
GB2622875A (en) | 2022-09-30 | 2024-04-03 | Imagination Tech Ltd | Methods and systems for performing channel equalisation on a convolution layer in a neural network |
KR20240077167A (ko) * | 2022-11-24 | 2024-05-31 | 주식회사 모빌린트 | 합성곱 연산을 위한 데이터 처리 방법 및 컴퓨팅 장치 |
CN117217274B (zh) * | 2023-11-08 | 2024-06-04 | 深圳市九天睿芯科技有限公司 | 向量处理器、神经网络加速器、芯片及电子设备 |
Family Cites Families (26)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH07200259A (ja) * | 1993-12-28 | 1995-08-04 | Hitachi Ltd | 演算処理方法および演算処理装置 |
FR2743246B1 (fr) * | 1995-12-29 | 1998-01-23 | Thomson Broadcast Systems | Procede et dispositif de compression de donnees numeriques |
DE19826252C2 (de) * | 1998-06-15 | 2001-04-05 | Systemonic Ag | Verfahren zur digitalen Signalverarbeitung |
JP5171118B2 (ja) * | 2007-06-13 | 2013-03-27 | キヤノン株式会社 | 演算処理装置及びその制御方法 |
US20090164544A1 (en) * | 2007-12-19 | 2009-06-25 | Jeffrey Dobbek | Dynamic range enhancement for arithmetic calculations in real-time control systems using fixed point hardware |
US8422821B2 (en) * | 2008-12-19 | 2013-04-16 | International Business Machines Corporation | Selectively transforming a multi-dimensional array |
US8442927B2 (en) * | 2009-07-30 | 2013-05-14 | Nec Laboratories America, Inc. | Dynamically configurable, multi-ported co-processor for convolutional neural networks |
GB2487375B (en) * | 2011-01-18 | 2017-09-20 | Aptina Imaging Corp | Interest point detection |
US20120191955A1 (en) * | 2011-01-20 | 2012-07-26 | Jonsson Ragnar H | Method and system for floating point acceleration on fixed point digital signal processors |
CN102420931B (zh) | 2011-07-26 | 2013-08-21 | 西安费斯达自动化工程有限公司 | 一种基于fpga的全帧率图像处理方法 |
US9811775B2 (en) * | 2012-12-24 | 2017-11-07 | Google Inc. | Parallelizing neural networks during training |
US9760966B2 (en) * | 2013-01-08 | 2017-09-12 | Nvidia Corporation | Parallel processor with integrated correlation and convolution engine |
US9190053B2 (en) | 2013-03-25 | 2015-11-17 | The Governing Council Of The Univeristy Of Toronto | System and method for applying a convolutional neural network to speech recognition |
US9430829B2 (en) | 2014-01-30 | 2016-08-30 | Case Western Reserve University | Automatic detection of mitosis using handcrafted and convolutional neural network features |
US20160026912A1 (en) * | 2014-07-22 | 2016-01-28 | Intel Corporation | Weight-shifting mechanism for convolutional neural networks |
FR3025344B1 (fr) | 2014-08-28 | 2017-11-24 | Commissariat Energie Atomique | Reseau de neurones convolutionnels |
US10223333B2 (en) * | 2014-08-29 | 2019-03-05 | Nvidia Corporation | Performing multi-convolution operations in a parallel processing system |
US9563825B2 (en) | 2014-11-20 | 2017-02-07 | Adobe Systems Incorporated | Convolutional neural network using a binarized convolution layer |
US9805303B2 (en) * | 2015-05-21 | 2017-10-31 | Google Inc. | Rotating data for neural network computations |
US10192162B2 (en) * | 2015-05-21 | 2019-01-29 | Google Llc | Vector computation unit in a neural network processor |
US9747546B2 (en) * | 2015-05-21 | 2017-08-29 | Google Inc. | Neural network processor |
CN104915322B (zh) | 2015-06-09 | 2018-05-01 | 中国人民解放军国防科学技术大学 | 一种卷积神经网络硬件加速方法 |
US9886377B2 (en) * | 2015-10-05 | 2018-02-06 | Intel Corporation | Pipelined convolutional operations for processing clusters |
US10585848B2 (en) * | 2015-10-08 | 2020-03-10 | Via Alliance Semiconductor Co., Ltd. | Processor with hybrid coprocessor/execution unit neural network unit |
CN105205479A (zh) * | 2015-10-28 | 2015-12-30 | 小米科技有限责任公司 | 人脸颜值评估方法、装置及终端设备 |
US9424494B1 (en) | 2016-01-28 | 2016-08-23 | International Business Machines Corporation | Pure convolutional neural network localization |
-
2016
- 2016-05-03 GB GBGB1607713.3A patent/GB201607713D0/en not_active Ceased
-
2017
- 2017-05-03 EP EP21177846.9A patent/EP3901835B1/en active Active
- 2017-05-03 US US15/585,645 patent/US11144819B2/en active Active
- 2017-05-03 GB GB1707039.2A patent/GB2552242B/en active Active
- 2017-05-03 GB GB1707040.0A patent/GB2552243B/en active Active
- 2017-05-03 EP EP24194712.6A patent/EP4439272A2/en active Pending
- 2017-05-03 CN CN202311188305.5A patent/CN117217273A/zh active Pending
- 2017-05-03 GB GB2008977.7A patent/GB2582519B/en active Active
- 2017-05-03 GB GB2012271.9A patent/GB2584243B/en active Active
- 2017-05-03 EP EP21172321.8A patent/EP3901832A1/en active Pending
- 2017-05-03 EP EP17169307.0A patent/EP3242253B1/en active Active
- 2017-05-03 GB GB2015694.9A patent/GB2585609B/en active Active
- 2017-05-03 CN CN201710304906.6A patent/CN107403221B/zh active Active
- 2017-05-03 EP EP17169309.6A patent/EP3242254B1/en active Active
- 2017-05-03 US US15/585,571 patent/US11625581B2/en active Active
- 2017-05-08 JP JP2017092266A patent/JP7013143B2/ja active Active
-
2021
- 2021-10-11 US US17/498,618 patent/US20220027717A1/en active Pending
-
2022
- 2022-01-19 JP JP2022006207A patent/JP7348971B2/ja active Active
-
2023
- 2023-04-10 US US18/132,929 patent/US11948070B2/en active Active
-
2024
- 2024-04-01 US US18/623,450 patent/US20240249131A1/en active Pending
Non-Patent Citations (1)
Title |
---|
Darryl D.Lin et al.,"FIXED POINT QUANTIZATION OF DEEP CONVOLUTIONAL NETWORKS",arXiv.org[online],2016年01月,pp.1-15,[2021年5月17日検索],インターネット:<URL: https://arxiv.org/pdf/1511.06393v2.pdf> |
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7013143B2 (ja) | 畳み込みニューラルネットワークハードウエア構成 | |
US20230041966A1 (en) | Activation Functions for Deep Neural Networks | |
CN110009099B (zh) | 用于确定表示dnn的层的值的定点数格式的方法和系统 | |
CN110033079B (zh) | 深度神经网络的硬件实现的端到端数据格式选择 | |
EP4050522A1 (en) | Implementation of softmax and exponential in hardware | |
US10678509B1 (en) | Software-driven design optimization for mapping between floating-point and fixed-point multiply accumulators | |
CN113887710A (zh) | 循环神经网络中的数字格式选择 | |
CN116384443A (zh) | 具有可配置池化处理单元的神经网络加速器 | |
US20240111990A1 (en) | Methods and systems for performing channel equalisation on a convolution layer in a neural network | |
CN115545146A (zh) | 双向rnn的数字格式选择 | |
CN115545175A (zh) | 在硬件中运行双向递归神经网络 | |
GB2614705A (en) | Neural network accelerator with configurable pooling processing unit | |
CN113887714A (zh) | 用于在硬件中运行动态循环神经网络的方法和系统 | |
EP4345692A1 (en) | Methods and systems for online selection of number formats for network parameters of a neural network | |
US20230177321A1 (en) | Neural network accelerator with a configurable pipeline | |
GB2611521A (en) | Neural network accelerator with a configurable pipeline | |
GB2611520A (en) | Methods and devices for configuring a neural network accelerator with a configurable pipeline | |
GB2611522A (en) | Neural network accelerator with a configurable pipeline | |
GB2614327A (en) | Configurable pooling process unit for neural network accelerator | |
GB2619919A (en) | Hardware implementation of an attention-based neural network | |
GB2599313A (en) | Hardware for implementing a Deep Neural Network | |
GB2603647A (en) | End-to-end data format selection for hardware implementation of deep neural network | |
GB2603582A (en) | End-to-end data format selection for hardware implementation of deep neural network |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200507 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20210428 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20210524 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210823 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20211220 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220119 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7013143 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |