JP6713036B2 - 折り畳まれた特徴データに対して畳み込み演算を実行するための方法および装置 - Google Patents
折り畳まれた特徴データに対して畳み込み演算を実行するための方法および装置 Download PDFInfo
- Publication number
- JP6713036B2 JP6713036B2 JP2018221116A JP2018221116A JP6713036B2 JP 6713036 B2 JP6713036 B2 JP 6713036B2 JP 2018221116 A JP2018221116 A JP 2018221116A JP 2018221116 A JP2018221116 A JP 2018221116A JP 6713036 B2 JP6713036 B2 JP 6713036B2
- Authority
- JP
- Japan
- Prior art keywords
- folded
- feature data
- convolution
- dimension
- convolution kernel
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 80
- 230000015654 memory Effects 0.000 claims description 44
- 238000004364 calculation method Methods 0.000 claims description 21
- 238000007781 pre-processing Methods 0.000 claims description 15
- 230000003068 static effect Effects 0.000 claims description 6
- 238000004590 computer program Methods 0.000 claims description 5
- 238000013527 convolutional neural network Methods 0.000 description 20
- 230000008569 process Effects 0.000 description 8
- 238000007796 conventional method Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 3
- 238000013528 artificial neural network Methods 0.000 description 2
- 238000004826 seaming Methods 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/15—Correlation function computation including computation of convolution operations
- G06F17/153—Multidimensional correlation or convolution
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/06—Physical realisation, i.e. hardware implementation of neural networks, neurons or parts of neurons
- G06N3/063—Physical realisation, i.e. hardware implementation of neural networks, neurons or parts of neurons using electronic means
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F7/00—Methods or arrangements for processing data by operating upon the order or content of the data handled
- G06F7/38—Methods or arrangements for performing computations using exclusively denominational number representation, e.g. using binary, ternary, decimal representation
- G06F7/48—Methods or arrangements for performing computations using exclusively denominational number representation, e.g. using binary, ternary, decimal representation using non-contact-making devices, e.g. tube, solid state device; using unspecified devices
- G06F7/50—Adding; Subtracting
- G06F7/501—Half or full adders, i.e. basic adder cells for one denomination
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F7/00—Methods or arrangements for processing data by operating upon the order or content of the data handled
- G06F7/38—Methods or arrangements for performing computations using exclusively denominational number representation, e.g. using binary, ternary, decimal representation
- G06F7/48—Methods or arrangements for performing computations using exclusively denominational number representation, e.g. using binary, ternary, decimal representation using non-contact-making devices, e.g. tube, solid state device; using unspecified devices
- G06F7/52—Multiplying; Dividing
- G06F7/523—Multiplying only
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
- G06N20/10—Machine learning using kernel methods, e.g. support vector machines [SVM]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Mathematical Physics (AREA)
- Pure & Applied Mathematics (AREA)
- Mathematical Analysis (AREA)
- Computational Mathematics (AREA)
- Software Systems (AREA)
- Mathematical Optimization (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Molecular Biology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Neurology (AREA)
- Databases & Information Systems (AREA)
- Algebra (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Medical Informatics (AREA)
- Complex Calculations (AREA)
- Image Processing (AREA)
Description
本開示は、コンピュータプログラムをさらに提供し、該コンピュータプログラムが、一以上のメモリと、一以上のプロセッサと、計算手段とを具備する装置によって実行されると、上記の方法のいずれかが実現される。
本開示は、さらにメモリを提供し、該メモリには、上記の方法のいずれかを実行することにより得られたデータ構造を有するデータブロックが格納されている。
ステップS305:折り畳まれた特徴データ及び畳み込み層のオリジナル畳み込みカーネルに対して前処理を実行し、
ステップS310:前処理されたオリジナル畳み込みカーネルを折り畳み、オリジナル畳み込みカーネルに対応する一又は複数の折り畳まれた畳み込みカーネルを生成し、及び
ステップS315、生成された一又は複数の折り畳まれた畳み込みカーネルを用いて、前処理された折り畳まれた特徴データに対して畳み込み演算を実行する。
プリプロセッサ1010は、畳み込み層に提供される折り畳まれた特徴データ及びオリジナル畳み込みカーネルに対して前処理を実行するように構成することができる。一実施形態では、プリプロセッサ1010は、図3に示す例示方法300のステップS305を実行するように構成することができる。
900 例示装置
910 プロセッサ
920 メモリ
930 I/Oインターフェイス
1000 例示装置
1010 プリプロセッサ
1020 フォールディング手段
1030 演算手段
1100 メインプロセッサ
1120 DRAM
1130 畳み込みエンジン
1131 入力バッファ(SRAM)
1132、1134 バッファ付きクロスバー・スイッチ
1133 計算手段
1135 出力バッファ(SRAM)
Claims (17)
- 折り畳まれた特徴データに対してコンピュータ装置が畳み込み演算を実行する方法であって、
ダイナミックランダムアクセスメモリ(DRAM)から畳み込み層に提供される折り畳まれた特徴データ及びオリジナル畳み込みカーネルを読み出すステップと、
前記折り畳まれた特徴データ及び前記オリジナル畳み込みカーネルに対し、ゼロ個の又は一若しくは複数個のゼロスライスをパディングすることにより前記折り畳まれた特徴データ及び前記オリジナル畳み込みカーネルの双方を幅又は高さの少なくとも一つの次元で揃えるのを可能にする前処理を実行するステップと、
前処理された折り畳まれた特徴データをスタティックランダムアクセスメモリ(SRAM)に格納するステップと、
前記折り畳まれた特徴データの折り畳み方法に基づいて、幅又は高さの少なくとも一つの揃えられた次元で前処理されたオリジナル畳み込みカーネルを折り畳み、前記オリジナル畳み込みカーネルに対応する一又は複数の折り畳まれた畳み込みカーネルを生成するステップと、
前記一又は複数の折り畳まれた畳み込みカーネルを前記SRAMに格納するステップと、
前記前処理された折り畳まれた特徴データ及び前記一つ又は複数の折り畳まれた畳み込みカーネルを、前記SRAMから計算手段に読み出し、前記一又は複数の折り畳まれた畳み込みカーネルを用いて、前記前処理された折り畳まれた特徴データに対して前記畳み込み演算を実行するステップと
を含む折り畳まれた特徴データに対して畳み込み演算を実行する方法。 - 前記SRAMは複数のメモリ手段を含み、メモリ手段ごとにメモリアドレスを有し、前記前処理された折り畳まれた特徴データにおいて少なくとも2画素ごとに同一のメモリ手段に格納され、各折り畳まれた畳み込みカーネルにおいて、少なくとも2画素ごとに同一のメモリ手段に格納される請求項1に記載の方法。
- 前記折り畳まれた特徴データは、第1の次元における折り畳まれていない第1特徴データに対応し、前記第1特徴データにおける第1の次元での第ifx×Nx+jfx番目のスライスのすべてのCx個のチャネルのデータは、前記折り畳まれた特徴データの前記第1の次元における第ifx番目のスライスのjfx×Cx番目のチャネルから開始する連続のCx個のチャネルのデータに対応し、前記第1の次元は幅及び高さのいずれかであり、ifxは0以上の整数で、Nxは1より大きい整数で、jfxは0以上Nx未満の整数で、Cxは0より大きい整数である請求項1に記載の方法。
- 前記前処理は、
前記畳み込み層によって指定されたパディング方法に基づいて、前記パディング方法が求める前記第1特徴データの前記第1の次元における開始境界でのパディング量を示す第1パディング量P1を決定するステップと、
前記第1パディング量P1は0以上であり、
- 前記オリジナル畳み込みカーネルの前記第1の次元における第1ストライドがNxに等しくない場合、前記畳み込み演算を行うことは、
前記オリジナル畳み込みカーネルに対応するすべての折り畳まれた畳み込みカーネルを用いて、前記前処理された折り畳まれた特徴データの同一部分に対して畳み込みを行った後に、前記オリジナル畳み込みカーネルに対応するすべての折り畳まれた畳み込みカーネルを、第1の次元で前記第1ストライドに従って同時に移動させ、前記折り畳まれた特徴データのすべての部分が畳み込まれて最終出力特徴データを得るまで前記折り畳まれた特徴データの次の部分に対して畳み込みを行うステップ、又は
前記オリジナル畳み込みカーネルに対応する各折り畳まれた畳み込みカーネルをそれぞれ用いて、前記前処理された折り畳まれた特徴データ全体に対して畳み込みを行うステップを含み、
前記折り畳まれた畳み込みカーネルごとの前記第1の次元におけるストライドは前記第1ストライドに等しく、
前記オリジナル畳み込みカーネルの第1の次元における第1ストライドがNxに等しい場合、前記折り畳まれた畳み込みカーネルごとの第1の次元におけるストライドは1である請求項3に記載の方法。 - 前記オリジナル畳み込みカーネルに対応するすべての折り畳まれた畳み込みカーネルを用いて、前記前処理された折り畳まれた特徴データの同一部分に対して畳み込みを行うことは、
前記計算手段における複数の乗算器によって、前記前処理された折り畳まれた特徴データにおける複数の画素のうちのそれぞれが、複数の折り畳まれた畳み込みカーネルの一の対応する画素との積を同時に計算するステップを含む請求項5に記載の方法。 - 前記少なくとも一つの次元で前処理されたオリジナル畳み込みカーネルの折り畳みを行うことは、
前処理されたオリジナル畳み込みカーネルの前記第1の次元における開始境界で、kx×Sx個のゼロスライスをそれぞれパディングし、Ex個の第1変換された畳み込みカーネルを生成するステップと、
Sxは前記オリジナル畳み込みカーネルの前記第1の次元における第1のストライドであり、Exは1以上であってNx及びSxによって決まる値であり、kxは0以上Ex未満の整数であり、
前記第1の次元におけるNx個ごとの連続スライスを、深さの次元でつなぎ合わせるように、前記第1の次元で第1変換された畳み込みカーネルのそれぞれに対して第1折り畳みを行い、第1変換された畳み込みカーネルのそれぞれに対して、対応する第1折り畳まれた畳み込みカーネルを生成するステップと
を含む請求項3に記載の方法。 - 前記第1変換された畳み込みカーネルごとの前記第1の次元における第ikx×Nx+jkx番目のスライスのすべてのCx個のチャネルのデータは、対応する第1折り畳まれた畳み込みカーネルの前記第1の次元における第ikx番目のスライスのjkx×Cx番目から開始する連続のCx個のチャネルのデータにそれぞれ対応し、ikxは0以上の整数で、jkxは0以上Nx未満の整数である請求項7に記載の方法。
- 前記第1特徴データは、第2の次元における折り畳まれていない第2特徴データに対応し、前記第2特徴データの第2の次元における第ify×Ny+jfy番目のスライスのすべてのCy個のチャネルのデータは、前記第1特徴データの第2の次元におけるify番目のスライスの第jfy×Cy番目のチャネルから開始する連続のCy個のチャネルのデータに対応し、第2の次元は幅又は高さのうちの他方であり、ifyは0以上の整数で、Nyは1より大きい整数で、jfyは0以上Ny未満の整数で、Cyは0より大きい整数である請求項7に記載の方法。
- 前記前処理は、
前記畳み込み層によって指定されたパディング方法に基づいて、前記パディング方法が求める前記第2特徴データの前記第2の次元における開始境界でのパディング量を示す第2のパディング量P2を決定するステップと、
前記第2のパディング量P2は0以上であり、
- 前記少なくとも一つの次元で前処理されたオリジナル畳み込みカーネルの折り畳みを行うことは、
第1折り畳まれた畳み込みカーネルごとの前記第2の次元における開始境界で、ky×Sy個のゼロスライスをそれぞれパディングし、前記第1折り畳まれた畳み込みカーネルのそれぞれに対して、Ey個の第2変換された畳み込みカーネルをそれぞれ生成するステップと、
Syは前記オリジナル畳み込みカーネルの前記第2の次元における第2のストライドで、Eyは1以上であってNy及びSyによって決まる値であり、kyは0以上Ey未満の整数であり、
前記第2の次元におけるNy個ごとの連続のスライスを深さの次元でつなぎ合わせるように、前記第2の次元で第2変換された畳み込みカーネルのそれぞれに対して第2折り畳みを行い、第2変換された畳み込みカーネルのそれぞれに対して、対応する第2折り畳まれた畳み込みカーネルを生成するステップと
をさらに含む請求項9に記載の方法。 - 前記第2変換された畳み込みカーネルごとの前記第2の次元における第iky×Ny+jky番目のスライスのすべてのCy個のチャネルのデータは、対応する第2折り畳まれた畳み込みカーネルの前記第2の次元における第iky番目のスライスのjky×Cy番目から開始する連続のCy個のチャネルのデータにそれぞれ対応し、ikyは0以上の整数で、jkyは0以上Ny未満の整数である請求項11に記載の方法。
- 前記オリジナル畳み込みカーネルの前記第2の次元における第2ストライドがNyに等しくない場合、前記畳み込み演算を行うことは、
前記オリジナル畳み込みカーネルに対応するすべての折り畳まれた畳み込みカーネルを用いて、前記前処理された折り畳まれた特徴データの同一部分に対して畳み込みを行った後に、前記オリジナル畳み込みカーネルに対応するすべての折り畳まれた畳み込みカーネルを、第2の次元で前記第2ストライドに従って同時に移動させ、前記折り畳まれた特徴データのすべての部分が畳み込まれて最終出力特徴データを得るまで前記折り畳まれた特徴データの次の部分に対して畳み込みを行うステップ、又は
前記オリジナル畳み込みカーネルに対応する各折り畳まれた畳み込みカーネルをそれぞれ用いて、前記前処理された折り畳まれた特徴データ全体に対して畳み込みを行うステップを含み、
前記折り畳まれた畳み込みカーネルごとの前記第2の次元におけるストライドは前記第2ストライドに等しく、
前記オリジナル畳み込みカーネルの第2の次元における第2ストライドがNyに等しい場合、前記折り畳まれた畳み込みカーネルごとの第2の次元におけるストライドは1である請求項11に記載の方法。 - 折り畳まれた特徴データに対して畳み込み演算を実行するための装置であって、
前記装置は一又は複数のプロセッサを具備し、前記一又は複数のプロセッサは以下のステップを実行させるための指令を実行するように構成され、
前記ステップは、
ダイナミックランダムアクセスメモリ(DRAM)から畳み込み層に提供された折り畳まれた特徴データ及びオリジナル畳み込みカーネルを読み出すステップと、
前記折り畳まれた特徴データ及びオリジナル畳み込みカーネルに対し、ゼロ個の又は一若しくは複数個のゼロスライスをパディングすることにより前記折り畳まれた特徴データ及び前記オリジナル畳み込みカーネルの双方を幅又は高さの少なくとも一つの次元で揃えるのを可能にする前処理を実行するステップと、
前処理された折り畳まれた特徴データをスタティックランダムアクセスメモリ(SRAM)に格納するステップと、
前記折り畳まれた特徴データの折り畳み方法に基づいて、幅又は高さの少なくとも一つの揃えられた次元で前処理されたオリジナル畳み込みカーネルの折り畳みを行い、前記オリジナル畳み込みカーネルに対応する一又は複数の折り畳まれた畳み込みカーネルを生成するステップと、
前記一又は複数の折り畳まれた畳み込みカーネルを前記SRAMに格納するステップと、
前記前処理された折り畳まれた特徴データ及び前記一又は複数の折り畳まれた畳み込みカーネルを、前記SRAMから計算手段に読み出し、前記一又は複数の折り畳まれた畳み込みカーネルを用いて、前記前処理された折り畳まれた特徴データに対して前記畳み込み演算を実行するステップと
を含む装置。 - 折り畳まれた特徴データに対してコンピュータ装置が畳み込み演算を実行する方法であって、
畳み込み層に提供された前記折り畳まれた特徴データ及びオリジナル畳み込みカーネルに対し、ゼロ個の又は一若しくは複数個のゼロスライスをパディングすることにより前記折り畳まれた特徴データ及び前記オリジナル畳み込みカーネルの双方を幅又は高さの少なくとも一つの次元で揃えるのを可能にする前処理を実行するステップと、
前記折り畳まれた特徴データの折り畳み方法に基づいて、前処理されたオリジナル畳み込みカーネルを、幅又は高さの少なくとも一つの揃えられた次元で折り畳み、前記オリジナル畳み込みカーネルに対応する一又は複数の折り畳まれた畳み込みカーネルを生成するステップと、
前記一又は複数の折り畳まれた畳み込みカーネルを用いて、前記前処理された折り畳まれた特徴データに対して前記畳み込み演算を実行するステップと
を含む方法。 - コンピュータプログラムであって、
前記コンピュータプログラムは、一以上のメモリと、一以上のプロセッサと、計算手段とを具備する装置によって実行されると、請求項1乃至請求項13のいずれか1項に記載の方法が実現されるコンピュータプログラム。 - コンピュータ装置によって実行されたときに請求項1乃至請求項13のいずれか1項に記載の方法を実行させるべく動作するプログラム指令を記憶したコンピュータ可読非一時記憶媒体。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711212000.8 | 2017-11-28 | ||
CN201711212000.8A CN107832842B (zh) | 2017-11-28 | 2017-11-28 | 针对折叠特征数据执行卷积运算的方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2019102082A JP2019102082A (ja) | 2019-06-24 |
JP6713036B2 true JP6713036B2 (ja) | 2020-06-24 |
Family
ID=61646178
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018221116A Active JP6713036B2 (ja) | 2017-11-28 | 2018-11-27 | 折り畳まれた特徴データに対して畳み込み演算を実行するための方法および装置 |
Country Status (5)
Country | Link |
---|---|
US (1) | US11500958B2 (ja) |
EP (1) | EP3489864A1 (ja) |
JP (1) | JP6713036B2 (ja) |
KR (1) | KR102129895B1 (ja) |
CN (1) | CN107832842B (ja) |
Families Citing this family (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109190758B (zh) * | 2018-09-04 | 2021-06-15 | 地平线(上海)人工智能技术有限公司 | 用于展开卷积神经网络的张量数据的方法和装置 |
KR102637733B1 (ko) * | 2018-10-31 | 2024-02-19 | 삼성전자주식회사 | 뉴럴 네트워크 프로세서 및 그것의 컨볼루션 연산 방법 |
CN111723917B (zh) * | 2019-03-21 | 2022-11-01 | 中科寒武纪科技股份有限公司 | 运算方法、装置及相关产品 |
CN111832585B (zh) * | 2019-04-16 | 2023-04-18 | 杭州海康威视数字技术股份有限公司 | 图像处理的方法和装置 |
CN110188773B (zh) * | 2019-05-24 | 2021-06-22 | 北京迈格威科技有限公司 | 图像处理方法及装置 |
CN113435591B (zh) * | 2019-08-14 | 2024-04-05 | 中科寒武纪科技股份有限公司 | 数据处理方法、装置、计算机设备和存储介质 |
US11699081B2 (en) * | 2019-12-20 | 2023-07-11 | Meta Platforms, Inc. | Systems and methods for reducing data movement during convolution operations in artificial neural networks |
EP4273751A1 (en) * | 2020-12-31 | 2023-11-08 | Cambricon Technologies Corporation Limited | Data processing apparatus and method for executing neural network model, and related products |
CN112668717B (zh) * | 2021-01-04 | 2023-06-02 | 哈尔滨工业大学 | 一种面向神经网络模型优化的数据处理方法和装置 |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1502203A2 (en) * | 2002-01-10 | 2005-02-02 | Massively Parallel Technologies, Inc. | Parallel processing systems and method |
US8634604B2 (en) * | 2008-05-05 | 2014-01-21 | Sonavation, Inc. | Method and system for enhanced image alignment |
EP3035204B1 (en) * | 2014-12-19 | 2018-08-15 | Intel Corporation | Storage device and method for performing convolution operations |
US10405739B2 (en) | 2015-10-23 | 2019-09-10 | International Business Machines Corporation | Automatically detecting eye type in retinal fundus images |
JP6609505B2 (ja) * | 2016-04-06 | 2019-11-20 | Kddi株式会社 | 画像合成装置及びプログラム |
US10706348B2 (en) * | 2016-07-13 | 2020-07-07 | Google Llc | Superpixel methods for convolutional neural networks |
JP6964969B2 (ja) * | 2016-09-30 | 2021-11-10 | キヤノン株式会社 | 演算処理装置、演算処理方法及びプログラム |
KR20240093932A (ko) * | 2017-05-19 | 2024-06-24 | 모비디어스 리미티드 | 콘볼루션 효율을 개선하기 위한 방법들, 시스템들, 및 장치 |
-
2017
- 2017-11-28 CN CN201711212000.8A patent/CN107832842B/zh active Active
-
2018
- 2018-11-27 JP JP2018221116A patent/JP6713036B2/ja active Active
- 2018-11-28 KR KR1020180149478A patent/KR102129895B1/ko active IP Right Grant
- 2018-11-28 US US16/202,991 patent/US11500958B2/en active Active
- 2018-11-28 EP EP18208803.9A patent/EP3489864A1/en not_active Withdrawn
Also Published As
Publication number | Publication date |
---|---|
US11500958B2 (en) | 2022-11-15 |
EP3489864A1 (en) | 2019-05-29 |
JP2019102082A (ja) | 2019-06-24 |
KR102129895B1 (ko) | 2020-07-03 |
US20190163717A1 (en) | 2019-05-30 |
KR20190062303A (ko) | 2019-06-05 |
CN107832842B (zh) | 2020-05-22 |
CN107832842A (zh) | 2018-03-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6713036B2 (ja) | 折り畳まれた特徴データに対して畳み込み演算を実行するための方法および装置 | |
JP6775565B2 (ja) | 畳み込みニューラルネットワークの畳み込み層における演算を実行するための方法、装置、メモリ及びコンピュータプログラム | |
JP6856609B2 (ja) | 畳み込みニューラルネットワークの畳み込み層における演算を実行する方法及び装置 | |
US10642622B2 (en) | Arithmetic processing device and control method of the arithmetic processing device | |
WO2019127517A1 (zh) | 数据处理方法、设备、dma控制器及计算机可读存储介质 | |
CN109885407B (zh) | 数据处理方法和装置、电子设备、存储介质 | |
EP3093757B1 (en) | Multi-dimensional sliding window operation for a vector processor | |
CN112686377B (zh) | 利用卷积硬件对特征数据进行反卷积处理的方法和装置 | |
CN112703511A (zh) | 运算加速器和数据处理方法 | |
JP2020126651A (ja) | ニューラルネットワークのコンボルーション演算を処理する方法及び装置 | |
CN111133457A (zh) | 电子设备及其控制方法 | |
WO2023103551A1 (zh) | 图像数据处理方法、装置、设备及存储介质 | |
CN114662647A (zh) | 处理用于神经网络的层的数据 | |
KR20220067142A (ko) | 하드웨어로 구현되는 초해상도 장치를 위한 전처리 장치 및 방법 | |
WO2020194465A1 (ja) | ニューラルネットワーク回路 | |
JP2021002185A (ja) | 高位合成装置及び高位合成方法 | |
US11842273B2 (en) | Neural network processing | |
KR102448147B1 (ko) | 디컨볼루션 연산에 기반한 다차원 정보 생성 방법, 그리고 이를 구현하기 위한 장치 | |
US20240257432A1 (en) | Method of generating a mipmap | |
CN118643253A (zh) | 数据处理方法、装置、设备和存储介质 | |
CN117786298A (zh) | 一种用于arm架构的通用矩阵乘法计算方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20190320 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20191126 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20200114 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200413 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20200519 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20200602 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6713036 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |