JP6927320B2 - 推論装置、畳み込み演算実行方法及びプログラム - Google Patents
推論装置、畳み込み演算実行方法及びプログラム Download PDFInfo
- Publication number
- JP6927320B2 JP6927320B2 JP2019551133A JP2019551133A JP6927320B2 JP 6927320 B2 JP6927320 B2 JP 6927320B2 JP 2019551133 A JP2019551133 A JP 2019551133A JP 2019551133 A JP2019551133 A JP 2019551133A JP 6927320 B2 JP6927320 B2 JP 6927320B2
- Authority
- JP
- Japan
- Prior art keywords
- input data
- weight
- unit
- multiplication
- weights
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F7/00—Methods or arrangements for processing data by operating upon the order or content of the data handled
- G06F7/38—Methods or arrangements for performing computations using exclusively denominational number representation, e.g. using binary, ternary, decimal representation
- G06F7/48—Methods or arrangements for performing computations using exclusively denominational number representation, e.g. using binary, ternary, decimal representation using non-contact-making devices, e.g. tube, solid state device; using unspecified devices
- G06F7/544—Methods or arrangements for performing computations using exclusively denominational number representation, e.g. using binary, ternary, decimal representation using non-contact-making devices, e.g. tube, solid state device; using unspecified devices for evaluating functions by calculation
- G06F7/5443—Sum of products
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0464—Convolutional networks [CNN, ConvNet]
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0495—Quantised networks; Sparse networks; Compressed networks
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/06—Physical realisation, i.e. hardware implementation of neural networks, neurons or parts of neurons
- G06N3/063—Physical realisation, i.e. hardware implementation of neural networks, neurons or parts of neurons using electronic means
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/764—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2207/00—Indexing scheme relating to methods or arrangements for processing data by operating upon the order or content of the data handled
- G06F2207/38—Indexing scheme relating to groups G06F7/38 - G06F7/575
- G06F2207/48—Indexing scheme relating to groups G06F7/48 - G06F7/575
- G06F2207/4802—Special implementations
- G06F2207/4818—Threshold devices
- G06F2207/4824—Neural networks
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Computing Systems (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- General Health & Medical Sciences (AREA)
- Software Systems (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Data Mining & Analysis (AREA)
- Computational Linguistics (AREA)
- Molecular Biology (AREA)
- Mathematical Physics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Databases & Information Systems (AREA)
- Multimedia (AREA)
- Medical Informatics (AREA)
- Neurology (AREA)
- Pure & Applied Mathematics (AREA)
- Mathematical Optimization (AREA)
- Mathematical Analysis (AREA)
- Computational Mathematics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Complex Calculations (AREA)
Description
本発明は、日本国特許出願:特願2017−204610号(2017年10月23日出願)の優先権主張に基づくものであり、同出願の全記載内容は引用をもって本書に組み込み記載されているものとする。
本発明は、推論装置、畳み込み演算実行方法及びプログラムに関する。
なお、このプログラムは、コンピュータが読み取り可能な記憶媒体に記録することができる。記憶媒体は、半導体メモリ、ハードディスク、磁気記録媒体、光記録媒体等の非トランジェント(non-transient)なものとすることができる。本発明は、コンピュータプログラム製品として具現することも可能である。
第1の実施形態について、図面を用いてより詳細に説明する。
第2の実施形態について、図面を用いてより詳細に説明する。
第3の実施形態について、図面を用いてより詳細に説明する。
第1乃至第3の実施形態にて説明した推論装置10は例示であって、その構成及び動作を限定する趣旨ではない。以下、各種変形例について説明する。
[形態1]
上述の第1の視点に係る推論装置のとおりである。
[形態2]
前記制御部は、
前記複数の入力データのそれぞれと、前記複数の入力データそれぞれに対応する重みそれぞれとの乗算処理のうち、一部の乗算処理が並列に処理されるように前記複数のPEを制御する、好ましくは形態1の推論装置。
[形態3]
前記制御部は、
前記複数の入力データのそれぞれと、複数の前記重み群に含まれる複数の重みのそれぞれとの乗算処理のうち、異なる前記重み群の重みであって同一の入力データに対応する重みを用いた乗算処理の一部が並列に実行されるように前記複数のPEを制御する、好ましくは形態2の推論装置。
[形態4]
前記複数の入力データを分割し、前記分割された入力データを前記一部の乗算処理を並列に処理するPEに供給する、入力データ分割部をさらに備える、好ましくは形態3の推論装置。
[形態5]
前記一部の乗算処理を並列に処理する複数のPEそれぞれの演算が終了するまで待機する、待機部をさらに備える、好ましくは形態3又は4の推論装置。
[形態6]
前記複数の入力データのそれぞれと1つの重み群に含まれる複数の重みとの乗算結果を加算する結果加算部をさらに備える好ましくは形態3乃至5のいずれか一に記載の推論装置。
[形態7]
前記複数のPEのそれぞれは、
入力した入力データから値がゼロ以外であるノンゼロ要素と前記ノンゼロ要素の位置を特定する入力データ処理部と、
前記入力した入力データと乗算される重みの要素のうち、前記ノンゼロ要素の位置に相当する位置の値を、前記重み群を記憶する記憶媒体から読み出す重み読み出し部と、
前記ノンゼロ要素と前記重み読み出し部により読み出された値を乗算する、乗加算部と、
を備え、
前記乗加算部は、前記入力した入力データに含まれるノンゼロ要素に関する乗算が終了すると、乗算結果を加算する、好ましくは形態1乃至6のいずれか一に記載の推論装置。
[形態8]
前記複数のPEのそれぞれは、
前記乗加算部により算出された加算結果を記憶する、演算結果記憶部をさらに備える、好ましくは形態7の推論装置。
[形態9]
前記制御部は、
1つの入力データと、異なる重み群に含まれる重みと、を乗算する複数の処理を時分割で前記複数のPEのそれぞれに実行させる、好ましくは形態3乃至8のいずれか一に記載の推論装置。
[形態10]
前記制御部は、
前記重み群を評価するための評価指標を計算する、評価指標計算部と、
前記評価指標に基づき、入力データに対して乗算する前記重み群の順序を並び替える重み群並び替え部と、
を備える、好ましくは形態1乃至9のいずれか一に記載の推論装置。
[形態11]
前記制御部は、
前記重み群の並び替えに関する順序情報を、他層に通知する、順序情報通知部をさらに備える、好ましくは形態10の推論装置。
[形態12]
前記制御部は、
前記通知された順序情報を取得する、順序情報取得部と、
前記順序情報に基づき、入力データと前記重み群に含まれる重みの対応関係を変更する、重み並び替え部と、
をさらに備える、好ましくは形態11の推論装置。
[形態13]
上述の第2の視点に係る畳み込み演算実行方法のとおりである。
[形態14]
上述の第3の視点に係るプログラムのとおりである。
[形態15]
教師データを用いた重みの推論、重みの推定誤差のフィードバック、重みのアップデート、及び重みの並び替えを行う学習装置であって、
前記重みの並び替えは、
重みを評価するための評価指標に基づき行われる、学習装置。
なお、形態13及び形態14は、形態1と同様に、形態2〜形態12のように展開することが可能である。
11 入力層実行部
12 中間層実行部
13 出力層実行部
31 畳み込み層実行部
32 活性化関数実行部
33 プーリング層実行部
40 畳み込み層制御部
41 入力データ分割部
42、42−1〜42−8、101 PE(Processing Element)
43 待機部
44 結果加算部
51 入力データ記憶部
52 重み記憶部
53 結果記憶部
60 PE制御部
61 入力データ処理部
62 重み読み出し部
63 乗加算部
64 重み一次記憶部
65 演算結果記憶部
66 繰り返し制御部
71 CPU(Central Processing Unit)
72 メモリ
73 入出力インターフェイス
74 NIC(Network Interface Card)
80 重み設定装置
90 学習装置
91 誤差逆伝搬部
92 重みアップデート部
93 並び替え部
102 制御部
311 重み取得部
312 評価指標計算部
313 重み群並び替え部
314 順序情報通知部
315 順序情報取得部
316 重み並び替え部
401、402 データ
501、502 重み
511、512、521、522 重み群
Claims (9)
- 複数のPE(Processing Element)と、
複数の入力データのそれぞれと、前記複数の入力データのそれぞれに対応する複数の重みを含む重み群と、を用いた畳み込みニューラルネットワークにおける畳み込み演算を前記複数のPEを制御することで実現する、制御部と、
を備え、
前記複数のPEのそれぞれは、
入力した入力データから値がゼロ以外であるノンゼロ要素と前記ノンゼロ要素の位置を特定する入力データ処理部と、
前記入力した入力データと乗算される重みの要素のうち、前記ノンゼロ要素の位置に相当する位置の値を、前記重み群を記憶する記憶媒体から読み出す重み読み出し部と、
前記ノンゼロ要素と前記重み読み出し部により読み出された値を乗算する、乗加算部と、
を備え、
前記乗加算部は、前記入力した入力データに含まれるノンゼロ要素に関する乗算が終了すると、乗算結果を加算する、推論装置。 - 前記制御部は、
前記複数の入力データのそれぞれと、前記複数の入力データそれぞれに対応する重みそれぞれとの乗算処理のうち、一部の乗算処理が並列に処理されるように前記複数のPEを制御する、請求項1の推論装置。 - 前記制御部は、
前記複数の入力データのそれぞれと、複数の前記重み群に含まれる複数の重みのそれぞれとの乗算処理のうち、異なる前記重み群の重みであって同一の入力データに対応する重みを用いた乗算処理の一部が並列に実行されるように前記複数のPEを制御する、請求項2の推論装置。 - 前記複数の入力データを分割し、前記分割された入力データを前記一部の乗算処理を並列に処理するPEに供給する、入力データ分割部をさらに備える、請求項3の推論装置。
- 前記複数の入力データのそれぞれと1つの重み群に含まれる複数の重みとの乗算結果を加算する結果加算部をさらに備える請求項3又は4に記載の推論装置。
- 前記制御部は、
1つの入力データと、異なる重み群に含まれる重みと、を乗算する複数の処理を時分割で前記複数のPEのそれぞれに実行させる、請求項3乃至5のいずれか一項に記載の推論装置。 - 前記制御部は、
前記重み群を評価するための評価指標を計算する、評価指標計算部と、
前記評価指標に基づき、入力データに対して乗算する前記重み群の順序を並び替える重み群並び替え部と、
を備える、請求項1乃至6のいずれか一項に記載の推論装置。 - それぞれが、1つの入力データと1つの重みの乗算処理を含む演算を実行する、複数のPE(Processing Element)を含み、
複数の入力データのそれぞれと、前記複数の入力データのそれぞれに対応する複数の重みを含む重み群と、を用いた畳み込みニューラルネットワークにおける畳み込み演算を実現する、推論装置において、
前記複数のPEのそれぞれが、
前記複数の入力データそれぞれに含まれる値がゼロではないノンゼロ要素と前記ノンゼロ要素の位置を特定するステップと、
前記入力した入力データと乗算される重みの要素のうち、前記ノンゼロ要素の位置に相当する位置の値を、前記重み群を記憶する記憶媒体から読み出すステップと、
前記ノンゼロ要素と前記重み読み出しステップにより読み出された値の乗算処理を実行するステップと、
前記入力した入力データに含まれるノンゼロ要素に関する乗算が終了すると、前記乗算処理の結果を加算するステップと、
を含む、畳み込み演算実行方法。 - それぞれが、1つの入力データと1つの重みの乗算処理を含む演算を実行する、複数のPE(Processing Element)を含み、
複数の入力データのそれぞれと、前記複数の入力データのそれぞれに対応する複数の重みを含む重み群と、を用いた畳み込みニューラルネットワークにおける畳み込み演算を実現する、推論装置に搭載されたコンピュータに、
前記複数の入力データそれぞれに含まれる値がゼロではないノンゼロ要素と前記ノンゼロ要素の位置を特定する処理と、
前記入力した入力データと乗算される重みの要素のうち、前記ノンゼロ要素の位置に相当する位置の値を、前記重み群を記憶する記憶媒体から読み出す処理と、
前記ノンゼロ要素と前記重み読み出し処理により読み出された値の乗算処理を実行する処理と、
前記入力した入力データに含まれるノンゼロ要素に関する乗算が終了すると、前記乗算処理の結果を加算する処理と、
を実行させる、プログラム。
Applications Claiming Priority (3)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2017204610 | 2017-10-23 | ||
| JP2017204610 | 2017-10-23 | ||
| PCT/JP2018/039248 WO2019082859A1 (ja) | 2017-10-23 | 2018-10-22 | 推論装置、畳み込み演算実行方法及びプログラム |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPWO2019082859A1 JPWO2019082859A1 (ja) | 2020-11-12 |
| JP6927320B2 true JP6927320B2 (ja) | 2021-08-25 |
Family
ID=66247809
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2019551133A Active JP6927320B2 (ja) | 2017-10-23 | 2018-10-22 | 推論装置、畳み込み演算実行方法及びプログラム |
Country Status (3)
| Country | Link |
|---|---|
| US (1) | US11580369B2 (ja) |
| JP (1) | JP6927320B2 (ja) |
| WO (1) | WO2019082859A1 (ja) |
Families Citing this family (15)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP7379821B2 (ja) * | 2019-01-09 | 2023-11-15 | 日本電信電話株式会社 | 推論処理装置および推論処理方法 |
| WO2020225916A1 (ja) * | 2019-05-09 | 2020-11-12 | 株式会社アラヤ | 情報処理装置 |
| US20210012178A1 (en) * | 2019-07-11 | 2021-01-14 | Facebook Technologies, Llc | Systems, methods, and devices for early-exit from convolution |
| KR20210051920A (ko) * | 2019-10-31 | 2021-05-10 | 삼성전자주식회사 | 신경망의 커널들을 정렬하는 전자 장치 및 이의 동작 방법 |
| JP2022520912A (ja) * | 2020-01-22 | 2022-04-04 | 深▲チェン▼市商▲湯▼科技有限公司 | データ処理方法、装置及びチップ、電子機器、記憶媒体 |
| US20210256357A1 (en) * | 2020-02-04 | 2021-08-19 | University Of Louisiana At Lafayette | Embedded stochastic-computing accelerator architecture and method for convolutional neural networks |
| US11568248B2 (en) * | 2020-03-31 | 2023-01-31 | Ati Technologies Ulc | Feature reordering based on similarity for improved memory compression transfers during machine learning jobs |
| US11551089B2 (en) * | 2020-03-31 | 2023-01-10 | Ati Technologies Ulc | Feature reordering based on sparsity for improved memory compression transfers during machine learning jobs |
| CN112200295B (zh) * | 2020-07-31 | 2023-07-18 | 星宸科技股份有限公司 | 稀疏化卷积神经网络的排序方法、运算方法、装置及设备 |
| KR102883349B1 (ko) * | 2021-01-25 | 2025-11-07 | 삼성전자주식회사 | 추론 태스크들을 병렬적으로 처리하는 가속기 및 이의 동작 방법 |
| TWI769807B (zh) * | 2021-05-04 | 2022-07-01 | 國立清華大學 | 基於記憶體內運算單元之軟硬體協同之壓縮運算方法及其系統 |
| US20240289621A1 (en) * | 2021-06-15 | 2024-08-29 | Nec Corporation | Neural network model conversion device and method |
| JP7719033B2 (ja) * | 2022-05-18 | 2025-08-05 | ルネサスエレクトロニクス株式会社 | 半導体装置 |
| CN115186799A (zh) * | 2022-06-15 | 2022-10-14 | 奥比中光科技集团股份有限公司 | 一种基于卷积神经网络的稀疏化计算方法及芯片 |
| WO2024014002A1 (ja) * | 2022-07-15 | 2024-01-18 | 日本電信電話株式会社 | 推論処理装置、推論処理方法、及び推論処理プログラム |
Family Cites Families (11)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP5368687B2 (ja) * | 2007-09-26 | 2013-12-18 | キヤノン株式会社 | 演算処理装置および方法 |
| JP5376920B2 (ja) | 2008-12-04 | 2013-12-25 | キヤノン株式会社 | コンボリューション演算回路、階層的コンボリューション演算回路及び物体認識装置 |
| JP6365258B2 (ja) | 2014-11-19 | 2018-08-01 | 株式会社デンソー | 演算処理装置 |
| US11423311B2 (en) * | 2015-06-04 | 2022-08-23 | Samsung Electronics Co., Ltd. | Automatic tuning of artificial neural networks |
| US9767381B2 (en) | 2015-09-22 | 2017-09-19 | Xerox Corporation | Similarity-based detection of prominent objects using deep CNN pooling layers as features |
| US10310826B2 (en) | 2015-11-19 | 2019-06-04 | Intel Corporation | Technologies for automatic reordering of sparse matrices |
| JP6561877B2 (ja) | 2016-03-01 | 2019-08-21 | 株式会社デンソー | 演算処理装置 |
| US20180082181A1 (en) * | 2016-05-13 | 2018-03-22 | Samsung Electronics, Co. Ltd. | Neural Network Reordering, Weight Compression, and Processing |
| US10891538B2 (en) * | 2016-08-11 | 2021-01-12 | Nvidia Corporation | Sparse convolutional neural network accelerator |
| CN106447034B (zh) * | 2016-10-27 | 2019-07-30 | 中国科学院计算技术研究所 | 一种基于数据压缩的神经网络处理器、设计方法、芯片 |
| US10872290B2 (en) * | 2017-09-21 | 2020-12-22 | Raytheon Company | Neural network processor with direct memory access and hardware acceleration circuits |
-
2018
- 2018-10-22 US US16/757,543 patent/US11580369B2/en active Active
- 2018-10-22 WO PCT/JP2018/039248 patent/WO2019082859A1/ja not_active Ceased
- 2018-10-22 JP JP2019551133A patent/JP6927320B2/ja active Active
Also Published As
| Publication number | Publication date |
|---|---|
| WO2019082859A1 (ja) | 2019-05-02 |
| JPWO2019082859A1 (ja) | 2020-11-12 |
| US20210201120A1 (en) | 2021-07-01 |
| US11580369B2 (en) | 2023-02-14 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP6927320B2 (ja) | 推論装置、畳み込み演算実行方法及びプログラム | |
| US20220292163A1 (en) | Dilated convolution using systolic array | |
| KR102631381B1 (ko) | 컨볼루션 신경망 처리 방법 및 장치 | |
| US20220383067A1 (en) | Buffer Addressing for a Convolutional Neural Network | |
| US10353705B2 (en) | Arithmetic processing device for deep learning and control method of the arithmetic processing device for deep learning | |
| KR102879261B1 (ko) | 컨볼루션 신경망 처리 방법 및 장치 | |
| US10642622B2 (en) | Arithmetic processing device and control method of the arithmetic processing device | |
| JP7007488B2 (ja) | ハードウェアベースのプーリングのシステムおよび方法 | |
| CN114358237A (zh) | 多核硬件中神经网络的实现方式 | |
| EP4024290A1 (en) | Implementing fully-connected neural-network layers in hardware | |
| CN110322001A (zh) | 深度学习加速器及加快深度学习操作的方法 | |
| US12026607B1 (en) | Memory operation for systolic array | |
| KR20180060149A (ko) | 컨볼루션 처리 장치 및 방법 | |
| CN109754359B (zh) | 一种应用于卷积神经网络的池化处理的方法及系统 | |
| US11580193B2 (en) | Computation device, computation method, and program | |
| EP3633559B1 (en) | Information processing apparatus, information processing method, non-transitory computer-readable storage medium | |
| JP6958027B2 (ja) | 演算処理装置及び演算処理装置の制御方法 | |
| WO2022206556A1 (zh) | 图像数据的矩阵运算方法、装置、设备及存储介质 | |
| KR101989793B1 (ko) | 컨볼루션 신경망을 위한 가속기 인식 가지 치기 방법 및 기록 매체 | |
| EP3093757B1 (en) | Multi-dimensional sliding window operation for a vector processor | |
| JP2017130036A (ja) | 情報処理装置、演算方法、および演算プログラム | |
| KR102372869B1 (ko) | 인공 신경망을 위한 행렬 연산기 및 행렬 연산 방법 | |
| KR20220134035A (ko) | 컨볼루션 연산을 위한 프로세싱 인 메모리 방법 | |
| JP2020080048A (ja) | 並列処理装置およびプログラム | |
| CN110796229A (zh) | 一种实现卷积运算的装置及方法 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200421 |
|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200421 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20210413 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210604 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20210706 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20210719 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 6927320 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |