JP2021022362A - 複数の畳み込みウィンドウ内の画像データの並行抽出方法、装置、機器及びコンピュータ可読記憶媒体 - Google Patents
複数の畳み込みウィンドウ内の画像データの並行抽出方法、装置、機器及びコンピュータ可読記憶媒体 Download PDFInfo
- Publication number
- JP2021022362A JP2021022362A JP2020039446A JP2020039446A JP2021022362A JP 2021022362 A JP2021022362 A JP 2021022362A JP 2020039446 A JP2020039446 A JP 2020039446A JP 2020039446 A JP2020039446 A JP 2020039446A JP 2021022362 A JP2021022362 A JP 2021022362A
- Authority
- JP
- Japan
- Prior art keywords
- convolution
- data
- image data
- data processing
- windows
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000605 extraction Methods 0.000 title claims abstract description 42
- 238000012545 processing Methods 0.000 claims abstract description 112
- 238000000034 method Methods 0.000 claims abstract description 60
- 239000000284 extract Substances 0.000 claims abstract description 22
- 238000000638 solvent extraction Methods 0.000 claims abstract description 3
- 239000011159 matrix material Substances 0.000 claims description 55
- 230000015654 memory Effects 0.000 claims description 31
- 238000013075 data extraction Methods 0.000 claims description 19
- 238000005192 partition Methods 0.000 claims description 14
- 230000017105 transposition Effects 0.000 claims description 13
- 230000004044 response Effects 0.000 claims description 9
- 238000004590 computer program Methods 0.000 claims description 6
- 238000013500 data storage Methods 0.000 claims description 2
- 230000008569 process Effects 0.000 abstract description 27
- 238000006243 chemical reaction Methods 0.000 description 12
- 238000010586 diagram Methods 0.000 description 12
- 238000013527 convolutional neural network Methods 0.000 description 8
- 230000006399 behavior Effects 0.000 description 7
- 238000013528 artificial neural network Methods 0.000 description 6
- 238000013135 deep learning Methods 0.000 description 6
- 230000001965 increasing effect Effects 0.000 description 5
- 238000010801 machine learning Methods 0.000 description 5
- 238000004891 communication Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 230000009471 action Effects 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 2
- 238000007796 conventional method Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000005945 translocation Effects 0.000 description 2
- 230000004913 activation Effects 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 210000004556 brain Anatomy 0.000 description 1
- 238000005352 clarification Methods 0.000 description 1
- 238000013501 data transformation Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000004049 embossing Methods 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 238000011176 pooling Methods 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 230000003313 weakening effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/15—Correlation function computation including computation of convolution operations
- G06F17/153—Multidimensional correlation or convolution
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/51—Indexing; Data structures therefor; Storage structures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
- G06F18/2148—Generating training patterns; Bootstrap methods, e.g. bagging or boosting characterised by the process organisation or structure, e.g. boosting cascade
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/30—Arrangements for executing machine instructions, e.g. instruction decode
- G06F9/30003—Arrangements for executing specific machine instructions
- G06F9/30007—Arrangements for executing specific machine instructions to perform operations on data operands
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/30—Arrangements for executing machine instructions, e.g. instruction decode
- G06F9/38—Concurrent instruction execution, e.g. pipeline or look ahead
- G06F9/3885—Concurrent instruction execution, e.g. pipeline or look ahead using a plurality of independent parallel functional units
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/06—Physical realisation, i.e. hardware implementation of neural networks, neurons or parts of neurons
- G06N3/063—Physical realisation, i.e. hardware implementation of neural networks, neurons or parts of neurons using electronic means
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/94—Hardware or software architectures specially adapted for image or video understanding
- G06V10/955—Hardware or software architectures specially adapted for image or video understanding using specific electronic processors
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Software Systems (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Computing Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biomedical Technology (AREA)
- Evolutionary Computation (AREA)
- Biophysics (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Molecular Biology (AREA)
- General Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Mathematical Analysis (AREA)
- Computational Mathematics (AREA)
- Pure & Applied Mathematics (AREA)
- Mathematical Optimization (AREA)
- Databases & Information Systems (AREA)
- Algebra (AREA)
- Multimedia (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Neurology (AREA)
- Image Processing (AREA)
- Complex Calculations (AREA)
- Image Analysis (AREA)
Abstract
Description
Claims (20)
- 画像を、第1組の畳み込みウィンドウと第2組の畳み込みウィンドウとを含む複数組の畳み込みウィンドウに区画するステップと、
複数のデータ処理ユニットにより前記第1組の畳み込みウィンドウにおける複数の畳み込みウィンドウ内の画像データを並行して抽出するステップと、
前記第1組の畳み込みウィンドウ内の画像データの抽出が完了したことに応じて、前記複数のデータ処理ユニットにより前記第2組の畳み込みウィンドウにおける複数の畳み込みウィンドウ内の画像データを並行して抽出するステップと、
を含む複数の畳み込みウィンドウ内の画像データの並行抽出方法。 - 前記複数のデータ処理ユニットは、第1のデータ処理ユニットと第2のデータ処理ユニットとを含み、前記第1組の畳み込みウィンドウは、第1の畳み込みウィンドウと第2の畳み込みウィンドウとを含み、且つ、
複数のデータ処理ユニットにより前記第1組の畳み込みウィンドウにおける複数の畳み込みウィンドウ内の画像データを並行して抽出するステップは、
前記第1のデータ処理ユニットにより前記第1の畳み込みウィンドウ内の画像データを抽出することと、
前記第2のデータ処理ユニットにより前記第2の畳み込みウィンドウ内の画像データを抽出することと、を含む請求項1に記載の方法。 - 前記第1のデータ処理ユニットにより前記第1の畳み込みウィンドウ内の画像データを抽出することは、
前記第1の畳み込みウィンドウ内の第1のチャネルにおける第1行の画像データを抽出することと、
前記第1の畳み込みウィンドウ内の前記第1のチャネルにおける第2行の画像データを抽出することと、
前記第1の畳み込みウィンドウ内の前記第1のチャネルにおける第3行の画像データを抽出することと、を含む請求項2に記載の方法。 - 前記第1のデータ処理ユニットにより前記第1の畳み込みウィンドウ内の画像データを抽出することは、
前記第1の畳み込みウィンドウ内の第1のチャネルにおける全ての画像データの抽出が完了したことに応じて、
前記第1の畳み込みウィンドウ内の第2のチャネルにおける第1行の画像データを抽出することと、
前記第1の畳み込みウィンドウ内の前記第2のチャネルにおける第2行の画像データを抽出することと、
前記第1の畳み込みウィンドウ内の前記第2のチャネルにおける第3行の画像データを抽出することと、をさらに含む請求項3に記載の方法。 - 前記第1のデータ処理ユニットにより前記第1の畳み込みウィンドウ内の画像データを抽出することは、
前記第1の畳み込みウィンドウ内の全てのチャネルにおける全ての画像データの抽出が完了したことに応じて、前記第1の畳み込みウィンドウ内の全ての画像データを一次元ベクトルで表すことをさらに含み、
前記一次元ベクトルの長さが、前記画像のチャネル数と、各畳み込みウィンドウの行数と、各畳み込みウィンドウの列数との積である請求項4に記載の方法。 - 前記複数組の畳み込みウィンドウ内の全ての画像データをターゲットメモリに二次元行列で格納するステップをさらに含み、
前記二次元行列の行数が前記複数組の畳み込みウィンドウ内の全ての畳み込みウィンドウの数であり、前記二次元行列の列数が前記画像のチャネル数と、各畳み込みウィンドウの行数と、各畳み込みウィンドウの列数との積である、請求項1に記載の方法。 - 行列を列単位で第1のブロック及び第2のブロックを含む複数のブロックに区画するステップと、
前記複数のデータ処理ユニットにより前記第1のブロック内の複数列のデータを並行して転置するステップと、
前記第1のブロック内の複数列のデータの転置が完了したことに応じて、前記複数のデータ処理ユニットにより前記第2のブロック内の複数列のデータを並行して転置するステップと、をさらに含む請求項1に記載の方法。 - 前記複数のデータ処理ユニットにより前記第1のブロック内の複数列のデータを並行して転置するステップは、
前記複数のデータ処理ユニットのうちの第1のデータ処理ユニットにより前記第1のブロック内の第1列のデータを転置することと、
前記複数のデータ処理ユニットのうちの第2のデータ処理ユニットにより前記第2のブロック内の第2列のデータを転置することと、を含む請求項7に記載の方法。 - 行列を列単位で複数のブロックに区画するステップは、
前記複数のデータ処理ユニットの数に応じて、前記行列を前記複数のブロックに区画することを含む請求項7に記載の方法。 - 画像を、第1組の畳み込みウィンドウと第2組の畳み込みウィンドウとを含む複数組の畳み込みウィンドウに区画するように構成される畳み込みウィンド組区画モジュールと、
複数のデータ処理ユニットにより前記第1組の畳み込みウィンドウにおける複数の畳み込みウィンドウ内の画像データを並行して抽出するように構成される第1の並行抽出モジュールと、
前記第1組の畳み込みウィンドウ内の画像データの抽出が完了したことに応じて、前記複数のデータ処理ユニットにより前記第2組の畳み込みウィンドウにおける複数の畳み込みウィンドウ内の画像データを並行して抽出するように構成される第2の並行抽出モジュールと、
を備える複数の畳み込みウィンドウ内の画像データの並行抽出装置。 - 前記複数のデータ処理ユニットは、第1のデータ処理ユニットと第2のデータ処理ユニットとを含み、前記第1組の畳み込みウィンドウは、第1の畳み込みウィンドウと第2の畳み込みウィンドウとを含み、且つ、
前記第1の並行抽出モジュールは、
前記第1のデータ処理ユニットにより前記第1の畳み込みウィンドウ内の画像データを抽出するように構成される第1のデータ抽出モジュールと、
前記第2のデータ処理ユニットにより前記第2の畳み込みウィンドウ内の画像データを抽出するように構成される第2のデータ抽出モジュールと、
を備える請求項10に記載の装置。 - 前記第1のデータ抽出モジュールは、
前記第1の畳み込みウィンドウ内の第1のチャネルにおける第1行の画像データを抽出するように構成される第1の抽出モジュールと、
前記第1の畳み込みウィンドウ内の前記第1のチャネルにおける第2行の画像データを抽出するように構成される第2の抽出モジュールと、
前記第1の畳み込みウィンドウ内の前記第1のチャネルにおける第3行の画像データを抽出するように構成される第3の抽出モジュールと、
を備える請求項11に記載の装置。 - 前記第1のデータ抽出モジュールは、
前記第1の畳み込みウィンドウ内の第1のチャネルにおける全ての画像データの抽出が完了したことに応じて、
前記第1の畳み込みウィンドウ内の第2のチャネルにおける第1行の画像データを抽出し、
前記第1の畳み込みウィンドウ内の前記第2のチャネルにおける第2行の画像データを抽出し、
前記第1の畳み込みウィンドウ内の前記第2のチャネルにおける第3行の画像データを抽出するように構成される第2のチャネル抽出モジュールをさらに備える請求項12に記載の装置。 - 前記第1のデータ抽出モジュールは、
前記第1の畳み込みウィンドウ内の全てのチャネルにおける全ての画像データの抽出が完了したことに応じて、前記第1の畳み込みウィンドウ内の全ての画像データを一次元ベクトルで表すように構成されるデータ表示モジュールをさらに備え、
前記一次元ベクトルの長さが、前記画像のチャネル数と、各畳み込みウィンドウの行数と、各畳み込みウィンドウの列数との積である請求項13に記載の装置。 - 前記複数組の畳み込みウィンドウ内の全ての画像データをターゲットメモリに二次元行列で格納するように構成されるデータ格納モジュールをさらに備え、
前記二次元行列の行数が前記複数組の畳み込みウィンドウ内の全ての畳み込みウィンドウの数であり、前記二次元行列の列数が前記画像のチャネル数と、各畳み込みウィンドウの行数と、各畳み込みウィンドウの列数との積である、請求項10に記載の装置。 - 行列を列単位で第1のブロック及び第2のブロックを含む複数のブロックに区画するように構成されるブロック区画モジュールと、
前記複数のデータ処理ユニットにより前記第1のブロック内の複数列のデータを並行して転置するように構成される第1の並行転置モジュールと、
前記第1のブロック内の複数列のデータの転置が完了したことに応じて、前記複数のデータ処理ユニットにより前記第2のブロック内の複数列のデータを並行して転置するように構成される第2の並行転置モジュールと、
をさらに備える請求項10に記載の装置。 - 第1の並行転置モジュールは、
前記複数のデータ処理ユニットのうちの第1のデータ処理ユニットにより前記第1のブロック内の第1列のデータを転置するように構成される第1の行列転置モジュールと、
前記複数のデータ処理ユニットのうちの第2のデータ処理ユニットにより前記第2のブロック内の第2列のデータを転置するように構成される第2の行列転置モジュールと、
を備える請求項16に記載の装置。 - 前記ブロック区画モジュールは、
前記複数のデータ処理ユニットの数に応じて、前記行列を前記複数のブロックに区画するように構成される第2のブロック区画モジュールを備える請求項16に記載の装置。 - 電子機器であって、
1つまたは複数のプロセッサと、
1つまたは複数のプログラムを格納するための記憶装置であって、前記1つまたは複数のプログラムが前記1つまたは複数のプロセッサによって実行されると、前記電子機器は請求項1〜9のいずれか1項に記載の方法を実現する記憶装置と、
を備える電子機器。 - コンピュータプログラムが格納されるコンピュータ可読記憶媒体であって、
前記プログラムがプロセッサによって実行されると、請求項1〜9のいずれか1項に記載の方法を実現する、コンピュータ可読記憶媒体。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910694475.8 | 2019-07-30 | ||
CN201910694475.8A CN112306555A (zh) | 2019-07-30 | 2019-07-30 | 并行提取多个卷积窗中的图像数据的方法、装置、设备以及计算机可读存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2021022362A true JP2021022362A (ja) | 2021-02-18 |
JP6955598B2 JP6955598B2 (ja) | 2021-10-27 |
Family
ID=69784274
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020039446A Active JP6955598B2 (ja) | 2019-07-30 | 2020-03-09 | 複数の畳み込みウィンドウ内の画像データの並行抽出方法、装置、機器及びコンピュータ可読記憶媒体 |
Country Status (5)
Country | Link |
---|---|
US (1) | US11481994B2 (ja) |
EP (1) | EP3771999B1 (ja) |
JP (1) | JP6955598B2 (ja) |
KR (1) | KR102470027B1 (ja) |
CN (1) | CN112306555A (ja) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113704172B (zh) * | 2021-08-20 | 2023-11-21 | 北京大学 | 基于脉动阵列的转置卷积和卷积加速器芯片设计方法 |
CN114936633B (zh) * | 2022-06-15 | 2023-06-30 | 北京爱芯科技有限公司 | 用于转置运算的数据处理单元及图像转置运算方法 |
CN115184771B (zh) * | 2022-07-08 | 2024-06-11 | 北京地平线信息技术有限公司 | 图像信号处理器的故障检测方法和装置、电子设备和介质 |
CN117949964B (zh) * | 2024-03-27 | 2024-06-21 | 青岛科技大学 | 一种激光多普勒测速系统信号处理方法 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2018196863A1 (zh) * | 2017-04-28 | 2018-11-01 | 北京市商汤科技开发有限公司 | 卷积加速和计算处理方法、装置、电子设备及存储介质 |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10255547B2 (en) * | 2014-12-04 | 2019-04-09 | Nvidia Corporation | Indirectly accessing sample data to perform multi-convolution operations in a parallel processing system |
KR20190051697A (ko) | 2017-11-07 | 2019-05-15 | 삼성전자주식회사 | 뉴럴 네트워크의 디컨벌루션 연산을 수행하는 장치 및 방법 |
CN108304923B (zh) | 2017-12-06 | 2022-01-18 | 腾讯科技(深圳)有限公司 | 卷积运算处理方法及相关产品 |
CN111712830B (zh) * | 2018-02-21 | 2024-02-09 | 罗伯特·博世有限公司 | 使用深度传感器的实时对象检测 |
US11574694B2 (en) * | 2018-10-11 | 2023-02-07 | International Business Machines Corporation | Kernel sets normalization with capacitor charge sharing |
US11586883B2 (en) * | 2018-12-14 | 2023-02-21 | Microsoft Technology Licensing, Llc | Residual quantization for neural networks |
US20200210840A1 (en) * | 2018-12-31 | 2020-07-02 | Microsoft Technology Licensing, Llc | Adjusting precision and topology parameters for neural network training based on a performance metric |
US20200264876A1 (en) * | 2019-02-14 | 2020-08-20 | Microsoft Technology Licensing, Llc | Adjusting activation compression for neural network training |
-
2019
- 2019-07-30 CN CN201910694475.8A patent/CN112306555A/zh active Pending
-
2020
- 2020-03-03 US US16/807,775 patent/US11481994B2/en active Active
- 2020-03-09 JP JP2020039446A patent/JP6955598B2/ja active Active
- 2020-03-10 EP EP20161994.7A patent/EP3771999B1/en active Active
- 2020-03-10 KR KR1020200029546A patent/KR102470027B1/ko active IP Right Grant
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2018196863A1 (zh) * | 2017-04-28 | 2018-11-01 | 北京市商汤科技开发有限公司 | 卷积加速和计算处理方法、装置、电子设备及存储介质 |
Non-Patent Citations (1)
Title |
---|
NAVEEN SUDA, ET AL.: ""Throughput-Optimized OpenCL-based FPGA Accelerator for Large-Scale Convolutional Neural Networks"", PROCEEDINGS OF THE 2016 ACM/SIGDA INTERNATIONAL SYMPOSIUM ON FIELD-PROGRAMMABLE GATE ARRAYS (FPGA'16, JPN7021003790, 21 February 2016 (2016-02-21), pages 16 - 25, XP055542357, ISSN: 0004594268, DOI: 10.1145/2847263.2847276 * |
Also Published As
Publication number | Publication date |
---|---|
KR20210014561A (ko) | 2021-02-09 |
US11481994B2 (en) | 2022-10-25 |
EP3771999B1 (en) | 2023-01-18 |
CN112306555A (zh) | 2021-02-02 |
EP3771999A1 (en) | 2021-02-03 |
JP6955598B2 (ja) | 2021-10-27 |
US20210034900A1 (en) | 2021-02-04 |
KR102470027B1 (ko) | 2022-11-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6955598B2 (ja) | 複数の畳み込みウィンドウ内の画像データの並行抽出方法、装置、機器及びコンピュータ可読記憶媒体 | |
US11468301B2 (en) | Method and apparatus for performing operation of convolutional layer in convolutional neural network | |
CN112840356B (zh) | 运算加速器、处理方法及相关设备 | |
EP3451162B1 (en) | Device and method for use in executing matrix multiplication operations | |
US11500958B2 (en) | Method and apparatus for performing convolution operation on folded feature data | |
EP3789892A1 (en) | Method and apparatus for processing data | |
CN111465943B (zh) | 一种集成电路和用于神经网络处理的方法 | |
JP2022550730A (ja) | 高速なスパースニューラルネットワーク | |
EP3839832A1 (en) | Method and apparatus with neural network convolution operation | |
US11763131B1 (en) | Systems and methods for reducing power consumption of convolution operations for artificial neural networks | |
US20230196113A1 (en) | Neural network training under memory restraint | |
KR20200095300A (ko) | 뉴럴 네트워크의 컨볼루션 연산을 처리하는 방법 및 장치 | |
CN111133457A (zh) | 电子设备及其控制方法 | |
CN114026571A (zh) | 用于并行执行的神经网络操作重新排序 | |
US12014505B2 (en) | Method and apparatus with convolution neural network processing using shared operand | |
US11636569B1 (en) | Matrix transpose hardware acceleration | |
JP2020080048A (ja) | 並列処理装置およびプログラム | |
CN114595811A (zh) | 用于执行深度学习操作的方法和设备 | |
JP5045652B2 (ja) | 相関処理装置及びその相関処理装置で読みとり可能な媒体 | |
US20230102296A1 (en) | Decomposing matrices for processing at a processor-in-memory | |
CN117851742B (zh) | 数据存储方法、数据处理方法、数据存储器、数据处理器 | |
EP3832551B1 (en) | Method and apparatus for processing data | |
US20240086719A1 (en) | Sparse encoding and decoding at mixture-of-experts layer | |
KR20210082970A (ko) | 컨볼루션 연산을 수행하는 방법 및 장치 | |
KR20230059726A (ko) | 심층 신경망 연산을 수행하는 방법 및 전자 장치 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200727 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200727 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20210914 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20211001 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6955598 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A711 Effective date: 20211018 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313114 |