CN103902507A - 一种面向可编程代数处理器的矩阵乘法计算装置及方法 - Google Patents
一种面向可编程代数处理器的矩阵乘法计算装置及方法 Download PDFInfo
- Publication number
- CN103902507A CN103902507A CN201410123578.6A CN201410123578A CN103902507A CN 103902507 A CN103902507 A CN 103902507A CN 201410123578 A CN201410123578 A CN 201410123578A CN 103902507 A CN103902507 A CN 103902507A
- Authority
- CN
- China
- Prior art keywords
- data
- matrix
- broadcast
- buffer storage
- matrix multiplication
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 239000011159 matrix material Substances 0.000 title claims abstract description 142
- 238000000034 method Methods 0.000 title abstract description 17
- 235000019580 granularity Nutrition 0.000 claims description 47
- 238000004364 calculation method Methods 0.000 claims description 14
- 238000012545 processing Methods 0.000 abstract description 12
- 238000005516 engineering process Methods 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- 238000004891 communication Methods 0.000 description 4
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 4
- 241001269238 Data Species 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 230000007246 mechanism Effects 0.000 description 3
- 238000010586 diagram Methods 0.000 description 2
- 108091029480 NONCODE Proteins 0.000 description 1
- 208000037656 Respiratory Sounds Diseases 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000007667 floating Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000009434 installation Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 238000005192 partition Methods 0.000 description 1
- 206010037833 rales Diseases 0.000 description 1
Images
Landscapes
- Complex Calculations (AREA)
Abstract
Description
Claims (9)
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410123578.6A CN103902507B (zh) | 2014-03-28 | 2014-03-28 | 一种面向可编程代数处理器的矩阵乘法计算装置及方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410123578.6A CN103902507B (zh) | 2014-03-28 | 2014-03-28 | 一种面向可编程代数处理器的矩阵乘法计算装置及方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN103902507A true CN103902507A (zh) | 2014-07-02 |
CN103902507B CN103902507B (zh) | 2017-05-10 |
Family
ID=50993837
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201410123578.6A Active CN103902507B (zh) | 2014-03-28 | 2014-03-28 | 一种面向可编程代数处理器的矩阵乘法计算装置及方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN103902507B (zh) |
Cited By (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104572587A (zh) * | 2014-12-23 | 2015-04-29 | 中国电子科技集团公司第三十八研究所 | 数据矩阵相乘的加速运算方法和装置 |
CN105893333A (zh) * | 2016-03-25 | 2016-08-24 | 合肥工业大学 | 一种用于music算法中计算协方差矩阵的硬件电路 |
WO2017052919A1 (en) * | 2015-09-23 | 2017-03-30 | Qualcomm Incorporated | Data-driven accelerator for machine learning and raw data analysis |
CN107977231A (zh) * | 2017-12-15 | 2018-05-01 | 北京中科寒武纪科技有限公司 | 一种计算方法及相关产品 |
CN108021393A (zh) * | 2017-12-15 | 2018-05-11 | 北京中科寒武纪科技有限公司 | 一种计算方法及相关产品 |
CN108037908A (zh) * | 2017-12-15 | 2018-05-15 | 北京中科寒武纪科技有限公司 | 一种计算方法及相关产品 |
CN108108190A (zh) * | 2017-12-15 | 2018-06-01 | 北京中科寒武纪科技有限公司 | 一种计算方法及相关产品 |
CN108108189A (zh) * | 2017-12-15 | 2018-06-01 | 北京中科寒武纪科技有限公司 | 一种计算方法及相关产品 |
CN108121688A (zh) * | 2017-12-15 | 2018-06-05 | 北京中科寒武纪科技有限公司 | 一种计算方法及相关产品 |
WO2020019174A1 (zh) * | 2018-07-24 | 2020-01-30 | 深圳市大疆创新科技有限公司 | 数据存取的方法、处理器、计算机系统和可移动设备 |
CN110738311A (zh) * | 2019-10-14 | 2020-01-31 | 哈尔滨工业大学 | 基于高层次综合的lstm网络加速方法 |
CN111198670A (zh) * | 2018-11-20 | 2020-05-26 | 华为技术有限公司 | 执行矩阵乘法运算的方法、电路及soc |
CN112434255A (zh) * | 2020-12-03 | 2021-03-02 | 海光信息技术股份有限公司 | 向量-矩阵运算和数据处理方法、乘法器和处理器芯片 |
TWI746126B (zh) * | 2020-08-25 | 2021-11-11 | 創鑫智慧股份有限公司 | 矩陣乘法裝置及其操作方法 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102541774B (zh) * | 2011-12-31 | 2015-02-04 | 中国科学院自动化研究所 | 多粒度并行存储系统与存储器 |
CN102541749B (zh) * | 2011-12-31 | 2014-09-17 | 中国科学院自动化研究所 | 多粒度并行存储系统 |
CN103236903B (zh) * | 2013-04-19 | 2015-11-18 | 中国科学院自动化研究所 | 一种改变数据序列顺序的装置 |
-
2014
- 2014-03-28 CN CN201410123578.6A patent/CN103902507B/zh active Active
Cited By (27)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104572587B (zh) * | 2014-12-23 | 2017-11-14 | 中国电子科技集团公司第三十八研究所 | 数据矩阵相乘的加速运算方法和装置 |
CN104572587A (zh) * | 2014-12-23 | 2015-04-29 | 中国电子科技集团公司第三十八研究所 | 数据矩阵相乘的加速运算方法和装置 |
WO2017052919A1 (en) * | 2015-09-23 | 2017-03-30 | Qualcomm Incorporated | Data-driven accelerator for machine learning and raw data analysis |
CN105893333B (zh) * | 2016-03-25 | 2018-07-03 | 合肥工业大学 | 一种用于music算法中计算协方差矩阵的硬件电路 |
CN105893333A (zh) * | 2016-03-25 | 2016-08-24 | 合肥工业大学 | 一种用于music算法中计算协方差矩阵的硬件电路 |
CN108108189B (zh) * | 2017-12-15 | 2020-10-30 | 安徽寒武纪信息科技有限公司 | 一种计算方法及相关产品 |
CN108037908A (zh) * | 2017-12-15 | 2018-05-15 | 北京中科寒武纪科技有限公司 | 一种计算方法及相关产品 |
CN108108190A (zh) * | 2017-12-15 | 2018-06-01 | 北京中科寒武纪科技有限公司 | 一种计算方法及相关产品 |
CN108108189A (zh) * | 2017-12-15 | 2018-06-01 | 北京中科寒武纪科技有限公司 | 一种计算方法及相关产品 |
CN108121688A (zh) * | 2017-12-15 | 2018-06-05 | 北京中科寒武纪科技有限公司 | 一种计算方法及相关产品 |
CN108021393A (zh) * | 2017-12-15 | 2018-05-11 | 北京中科寒武纪科技有限公司 | 一种计算方法及相关产品 |
CN108108190B (zh) * | 2017-12-15 | 2020-01-24 | 中科寒武纪科技股份有限公司 | 一种计算方法及相关产品 |
CN107977231A (zh) * | 2017-12-15 | 2018-05-01 | 北京中科寒武纪科技有限公司 | 一种计算方法及相关产品 |
CN107977231B (zh) * | 2017-12-15 | 2020-10-27 | 安徽寒武纪信息科技有限公司 | 一种计算方法及相关产品 |
WO2020019174A1 (zh) * | 2018-07-24 | 2020-01-30 | 深圳市大疆创新科技有限公司 | 数据存取的方法、处理器、计算机系统和可移动设备 |
CN110892373A (zh) * | 2018-07-24 | 2020-03-17 | 深圳市大疆创新科技有限公司 | 数据存取的方法、处理器、计算机系统和可移动设备 |
WO2020103883A1 (zh) * | 2018-11-20 | 2020-05-28 | 华为技术有限公司 | 执行矩阵乘法运算的方法、电路及soc |
CN111198670A (zh) * | 2018-11-20 | 2020-05-26 | 华为技术有限公司 | 执行矩阵乘法运算的方法、电路及soc |
CN111198670B (zh) * | 2018-11-20 | 2021-01-29 | 华为技术有限公司 | 执行矩阵乘法运算的方法、电路及soc |
US11263292B2 (en) | 2018-11-20 | 2022-03-01 | Huawei Technologies Co., Ltd. | Method, circuit, and SOC for performing matrix multiplication operation |
US11397791B2 (en) | 2018-11-20 | 2022-07-26 | Huawei Technologies Co., Ltd. | Method, circuit, and SOC for performing matrix multiplication operation |
US11860970B2 (en) | 2018-11-20 | 2024-01-02 | Huawei Technologies Co., Ltd. | Method, circuit, and SOC for performing matrix multiplication operation |
CN110738311A (zh) * | 2019-10-14 | 2020-01-31 | 哈尔滨工业大学 | 基于高层次综合的lstm网络加速方法 |
TWI746126B (zh) * | 2020-08-25 | 2021-11-11 | 創鑫智慧股份有限公司 | 矩陣乘法裝置及其操作方法 |
US11379185B2 (en) | 2020-08-25 | 2022-07-05 | Neuchips Corporation | Matrix multiplication device and operation method thereof |
CN112434255A (zh) * | 2020-12-03 | 2021-03-02 | 海光信息技术股份有限公司 | 向量-矩阵运算和数据处理方法、乘法器和处理器芯片 |
CN112434255B (zh) * | 2020-12-03 | 2023-12-08 | 成都海光微电子技术有限公司 | 向量-矩阵运算和数据处理方法、乘法器和处理器芯片 |
Also Published As
Publication number | Publication date |
---|---|
CN103902507B (zh) | 2017-05-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103902507A (zh) | 一种面向可编程代数处理器的矩阵乘法计算装置及方法 | |
KR102492477B1 (ko) | 행렬 곱셈기 | |
US20180341495A1 (en) | Hardware Accelerator for Convolutional Neural Networks and Method of Operation Thereof | |
CN207895435U (zh) | 神经网络计算模组 | |
CN109902804A (zh) | 一种卷积运算方法及装置 | |
CN110520834A (zh) | 替选循环限制 | |
CN103336758A (zh) | 一种稀疏矩阵的存储方法CSRL及基于该方法的SpMV实现方法 | |
US11934826B2 (en) | Vector reductions using shared scratchpad memory | |
CN102411558A (zh) | 面向向量处理器的大矩阵相乘的向量化实现方法 | |
EP4318275A1 (en) | Matrix multiplier and method for controlling matrix multiplier | |
CN110727911B (zh) | 一种矩阵的运算方法及装置、存储介质、终端 | |
Yamazaki et al. | One-sided dense matrix factorizations on a multicore with multiple GPU accelerators | |
CN109952559A (zh) | 具有单独可选元素及成组复制的流式传输引擎 | |
CN103955446A (zh) | 基于dsp芯片的可变长度fft计算方法 | |
EP3798927A1 (en) | Memory organization for matrix processing | |
CN104699624A (zh) | 面向fft并行计算的无冲突存储访问方法 | |
CN114385972B (zh) | 一种直接求解结构化三角稀疏线性方程组的并行计算方法 | |
CN111242293B (zh) | 一种处理部件、数据处理的方法以及电子设备 | |
KR102541465B1 (ko) | 기계 학습 및 심층 학습 응용들을 위한 적응적 행렬 곱셈 가속기 | |
US10339200B2 (en) | System and method for optimizing mixed radix fast fourier transform and inverse fast fourier transform | |
CN103544111B (zh) | 一种基于实时性处理的混合基fft方法 | |
CN103389967A (zh) | 一种基于sram的矩阵转置的装置及方法 | |
CN102567283B (zh) | 一种利用gpu对小矩阵求逆的方法 | |
CN104615516B (zh) | 面向GPDSP的大规模高性能Linpack测试基准实现的方法 | |
US20230259282A1 (en) | Core group memory processsing unit architectures and configurations |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
TR01 | Transfer of patent right | ||
TR01 | Transfer of patent right |
Effective date of registration: 20171204 Address after: 102412 Beijing City, Fangshan District Yan Village Yan Fu Road No. 1 No. 11 building 4 layer 402 Patentee after: Beijing Si Lang science and Technology Co.,Ltd. Address before: 100190 Zhongguancun East Road, Beijing, No. 95, No. Patentee before: Institute of Automation, Chinese Academy of Sciences |
|
CP03 | Change of name, title or address | ||
CP03 | Change of name, title or address |
Address after: 201306 building C, No. 888, Huanhu West 2nd Road, Lingang New District, China (Shanghai) pilot Free Trade Zone, Pudong New Area, Shanghai Patentee after: Shanghai Silang Technology Co.,Ltd. Address before: 102412 room 402, 4th floor, building 11, No. 1, Yanfu Road, Yancun Town, Fangshan District, Beijing Patentee before: Beijing Si Lang science and Technology Co.,Ltd. |