JP7016942B2 - 演算アクセラレータ - Google Patents
演算アクセラレータ Download PDFInfo
- Publication number
- JP7016942B2 JP7016942B2 JP2020500125A JP2020500125A JP7016942B2 JP 7016942 B2 JP7016942 B2 JP 7016942B2 JP 2020500125 A JP2020500125 A JP 2020500125A JP 2020500125 A JP2020500125 A JP 2020500125A JP 7016942 B2 JP7016942 B2 JP 7016942B2
- Authority
- JP
- Japan
- Prior art keywords
- matrix
- arithmetic
- memory
- data
- circuit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/16—Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F7/00—Methods or arrangements for processing data by operating upon the order or content of the data handled
- G06F7/38—Methods or arrangements for performing computations using exclusively denominational number representation, e.g. using binary, ternary, decimal representation
- G06F7/48—Methods or arrangements for performing computations using exclusively denominational number representation, e.g. using binary, ternary, decimal representation using non-contact-making devices, e.g. tube, solid state device; using unspecified devices
- G06F7/491—Computations with decimal numbers radix 12 or 20.
- G06F7/498—Computations with decimal numbers radix 12 or 20. using counter-type accumulators
- G06F7/4981—Adding; Subtracting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F7/00—Methods or arrangements for processing data by operating upon the order or content of the data handled
- G06F7/38—Methods or arrangements for performing computations using exclusively denominational number representation, e.g. using binary, ternary, decimal representation
- G06F7/48—Methods or arrangements for performing computations using exclusively denominational number representation, e.g. using binary, ternary, decimal representation using non-contact-making devices, e.g. tube, solid state device; using unspecified devices
- G06F7/50—Adding; Subtracting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F7/00—Methods or arrangements for processing data by operating upon the order or content of the data handled
- G06F7/38—Methods or arrangements for performing computations using exclusively denominational number representation, e.g. using binary, ternary, decimal representation
- G06F7/48—Methods or arrangements for performing computations using exclusively denominational number representation, e.g. using binary, ternary, decimal representation using non-contact-making devices, e.g. tube, solid state device; using unspecified devices
- G06F7/52—Multiplying; Dividing
- G06F7/523—Multiplying only
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Pure & Applied Mathematics (AREA)
- Mathematical Analysis (AREA)
- Computational Mathematics (AREA)
- Mathematical Optimization (AREA)
- Mathematical Physics (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Algebra (AREA)
- Databases & Information Systems (AREA)
- Software Systems (AREA)
- Complex Calculations (AREA)
Description
この出願は、2017年7月7日に中国特許庁に出願された「OPERATION ACCELERATOR」という名称の中国特許第201710553286.X号に対する優先権を主張し、その全内容を参照により援用する。
この出願は、データ計算技術の分野に関し、特に、演算アクセラレータに関する。
第2の行列のK個の列ベクトルを各演算グループのK個の演算ブロックにそれぞれ書き込む動作であり、第2の行列のベクトルの第g列内の第jのデータが、各演算グループ内の第gの演算ブロック内の第jの演算ユニットに書き込まれ、演算回路503は、コントローラ504の制御下で、第2のメモリ502内の第2の行列内のデータを読み取り、第2の行列内のデータを各演算グループのK個の演算ブロックにバッファリングしてもよく、或いは、コントローラ504は、第2の行列内のデータを演算回路503内の各演算グループのK個の演算ブロックに書き込むように第2のメモリ502を制御してもよい、動作と、
第1の行列のM個の行ベクトルをM個の演算グループにそれぞれ送信する動作であり、第1の行列の第iの行ベクトルがM個の演算グループ内の第iの演算グループに送信され、第iの演算グループ内の各演算ブロック内の第jの演算ユニットが第iの行ベクトル内の第jのデータを受信し、演算回路503は、コントローラ504の制御下で、第1のメモリ501内の第1の行列内のデータを読み取ってもよく、或いは、コントローラ504は、第1の行列内のデータを演算回路503内のM個の演算グループに送信するように第1のメモリ501を制御してもよく、
それにより、M個の演算グループ内の各演算ユニットが、演算ユニットにより受信された2つのデータに対して乗算演算を実行し、加算回路5032が、第3の行列を取得するために各演算ブロック内の演算ユニットの計算結果を加算し、第3の行列は、第1の行列と第2の行列との積であり、第3の行列内の行i及び列gの要素は、第iの演算グループ内の第gの演算ブロックの計算結果である、動作と
を実行してもよい。
第1の行列のソースデータを記憶するように構成された第3のメモリ506と、
第1のメモリ501、第2のメモリ502、第3のメモリ506及びコントローラ504に接続された記憶ユニットアクセスコントローラ505であり、記憶ユニットアクセスコントローラ505は、コントローラ504の制御下で、第1の行列のソースデータ及び第2の行列を取得し、第1の行列のソースデータを第3のメモリ506に保存し、第2の行列を第2のメモリ502に保存するように構成される、記憶ユニットアクセスコントローラ505と、
第1のメモリ501、第3のメモリ506及びコントローラ504に接続されたベクトル計算ユニット(vector unit)507であり、ベクトル計算ユニット507は、コントローラ504の制御下で、第1の行列のソースデータを第1の行列に変換し、第1の行列を第1のメモリ501に保存するように構成される、ベクトル計算ユニット507と
を更に含んでもよい。
コントローラ504に接続された命令フェッチバッファ(instruction fetch buffer)509であり、コントローラ504により使用される命令を記憶するように構成された命令フェッチバッファ509と、
命令フェッチバッファ509、記憶ユニットアクセスコントローラ505及び外部メモリに接続されたバスインタフェースユニット510(Bus Interface Unit, 略称BIU)であり、外部メモリから命令を取得するために命令フェッチバッファ509により使用され、外部メモリから第1の行列のソースデータ、第1の行列及び第2の行列のうち少なくとも1つを取得するために記憶ユニットアクセスコントローラ505により更に使用されるバスインタフェースユニット510と
を更に含んでもよい。
Claims (14)
- 演算アクセラレータであって、
第1の行列を記憶するように構成された第1のメモリであり、前記第1の行列はM*N行列である、第1のメモリと、
第2の行列を記憶するように構成された第2のメモリであり、前記第2の行列はN*K行列である、第2のメモリと、
前記第1のメモリ及び前記第2のメモリに接続された演算回路であり、前記演算回路は行列乗算回路と加算回路とを含み、前記行列乗算回路はM個の演算グループを含み、各演算グループはK個の演算ブロックを含み、各演算ブロックはN個の演算ユニットを含み、各演算ユニットは、前記第1のメモリ及び前記第2のメモリからそれぞれ2つのデータを受信し、前記演算ユニットは前記2つのデータを乗算し、前記加算回路は、各演算ブロックの計算結果を取得するために、同じ演算ブロックに属する演算ユニットの計算結果を加算するように構成される、演算回路と、
前記演算回路に接続されたコントローラであり、前記コントローラが以下の動作、すなわち、
前記第2の行列のK個の列ベクトルを各演算グループの前記K個の演算ブロックにそれぞれ書き込む動作であり、前記第2の行列のベクトルの第g列内の第jのデータが、前記K個の演算ブロック内の第gの演算ブロック内の第jの演算ユニットに書き込まれる動作と、
前記第1の行列のM個の行ベクトルを前記M個の演算グループにそれぞれ送信する動作であり、前記第1の行列の第iの行ベクトルが前記M個の演算グループ内の第iの演算グループに送信され、前記第iの演算グループ内の各演算ブロック内の第jの演算ユニットが前記第iの行ベクトル内の第jのデータを受信し、
それにより、前記M個の演算グループ内の各演算ユニットが、前記演算ユニットにより受信された2つのデータに対して乗算演算を実行し、前記加算回路が、第3の行列を取得するために各演算ブロック内の演算ユニットの計算結果を加算し、前記第3の行列は前記第1の行列と前記第2の行列との積であり、前記第3の行列内の行i及び列gの要素は、前記第iの演算グループ内の第gの演算ブロックの計算結果であり、M、N及びKは0よりも大きい整数であり、iは0よりも大きくM+1よりも小さい整数であり、gは0よりも大きくK+1よりも小さい整数であり、jは0よりも大きくN+1よりも小さい整数である、動作と
を実行するように構成される、コントローラと
を含む演算アクセラレータ。 - 前記加算回路は、M*K個の加算木を含み、1つの加算木は、1つの演算ブロックに対応し、前記加算木は、対応する前記演算ブロック内のN個の演算ユニットに接続され、前記加算木は、前記加算木に接続された前記N個の演算ユニットの計算結果を加算するように構成される、請求項1に記載の演算アクセラレータ。
- 前記演算ユニットは、
第2のデータを記憶するように構成された記憶ユニットであり、前記第2のデータは、前記第2の行列からの前記データである、記憶ユニットと、
前記記憶ユニットに接続された乗算回路であり、第1のデータと前記記憶ユニットに記憶された前記第2のデータとの積を計算するように構成され、前記第1のデータは、前記第1の行列からの前記データである、乗算回路と
を含む、請求項1又は2に記載の演算アクセラレータ。 - 前記演算ユニットは、複数の記憶ユニットと、乗算回路と、前記複数の記憶ユニットに接続された第1の選択回路と、前記複数の記憶ユニット及び前記乗算回路に接続された第2の選択回路とを含み、前記複数の記憶ユニットは、データを記憶するように構成され、
前記第1の選択回路は、前記乗算回路が乗算演算を実行する前に、前記複数の記憶ユニットから、前記乗算回路が前記乗算演算を実行するときに使用されるデータを記憶するための記憶ユニットを選択するように構成され、
前記第2の選択回路は、前記乗算回路が前記乗算演算を実行するときに、前記乗算回路が前記乗算演算を実行するときに使用されるデータを記憶するための記憶ユニットを選択するように構成され、
前記乗算回路は、受信データと前記第2の選択回路により選択された前記記憶ユニットに記憶された前記データとの積を計算するように構成される、請求項1又は2に記載の演算アクセラレータ。 - 前記第1のメモリは、第1のバスを使用することにより前記演算回路に接続され、前記第1のバスのビット幅は、Wi*N*Mであり、前記第2のメモリは、第2のバスを使用することにより前記演算回路に接続され、前記第2のバスのビット幅は、Wi*Nであり、Wiは、前記演算ユニットにより許容される入力データの最大ビット幅である、請求項1乃至4のうちいずれか1項に記載の演算アクセラレータ。
- 前記演算アクセラレータは、前記第1のメモリ、前記第2のメモリ及び前記コントローラに接続された記憶ユニットアクセスコントローラを更に含み、
前記記憶ユニットアクセスコントローラは、前記コントローラの制御下で、前記第1の行列及び前記第2の行列を取得し、前記第1の行列を前記第1のメモリに保存し、前記第2の行列を前記第2のメモリに保存するように構成される、請求項1乃至5のうちいずれか1項に記載の演算アクセラレータ。 - 前記演算アクセラレータは、
前記第1の行列のソースデータを記憶するように構成された第3のメモリと、
前記第1のメモリ、前記第2のメモリ、前記第3のメモリ及び前記コントローラに接続された記憶ユニットアクセスコントローラであり、前記記憶ユニットアクセスコントローラは、前記コントローラの制御下で、前記第1の行列の前記ソースデータ及び前記第2の行列を取得し、前記第1の行列の前記ソースデータを前記第3のメモリに保存し、前記第2の行列を前記第2のメモリに保存するように構成される、記憶ユニットアクセスコントローラと、
前記第1のメモリ、前記第3のメモリ及び前記コントローラに接続されたベクトル計算ユニットであり、前記ベクトル計算ユニットは、前記コントローラの制御下で、前記第1の行列の前記ソースデータを前記第1の行列に変換し、前記第1の行列を前記第1のメモリに保存するように構成される、ベクトル計算ユニットと
を更に含む、請求項1乃至5のうちいずれか1項に記載の演算アクセラレータ。 - 前記第3のメモリは、前記演算回路に接続され、前記第3のメモリは、前記第3の行列を記憶するように更に構成される、請求項7に記載の演算アクセラレータ。
- 前記演算アクセラレータは、前記演算回路、前記ベクトル計算ユニット及び前記コントローラに接続された累算器を更に含み、
前記累算器は、前記コントローラの制御下で、前記第3の行列及び第4の行列内の対応する位置における要素を加算し、第5の行列を取得するように構成され、
前記ベクトル計算ユニットは、前記コントローラの制御下で、前記第5の行列を前記第3のメモリに保存するように更に構成され、
前記第3の行列は、前記第1の行列と前記第2の行列との前記積であり、前記第1の行列は、第1の計算対象の行列の第1の部分を含み、前記第1の計算対象の行列の前記第1の部分は、前記第1の計算対象の行列の第1~第N列の要素であり、前記第2の行列は、第2の計算対象の行列の第1の部分であり、前記第2の計算対象の行列の前記第1の部分は、前記第2の計算対象の行列の第1~第N行の要素であり、前記第1の計算対象の行列は、M個の行の要素を含み、前記第2の計算対象の行列は、K個の列の要素を含み、前記第4の行列は、前記第1の計算対象の行列の第2の部分と前記第2の計算対象の行列の第2の部分との積であり、前記第1の計算対象の行列の前記第2の部分は、前記第1の計算対象の行列における前記第1の部分以外の部分であり、前記第2の計算対象の行列の前記第2の部分は、前記第2の計算対象の行列における前記第1の部分以外の部分である、請求項7に記載の演算アクセラレータ。 - 前記演算アクセラレータは、
前記コントローラに接続された命令フェッチバッファであり、前記コントローラにより使用される命令を記憶するように構成された命令フェッチバッファと、
前記命令フェッチバッファ、前記記憶ユニットアクセスコントローラ及び外部メモリに接続されたバスインタフェースユニットであり、前記外部メモリから前記命令を取得するために前記命令フェッチバッファにより使用され、前記外部メモリから前記第1の行列のソースデータ、前記第1の行列及び前記第2の行列のうち少なくとも1つを取得するために前記記憶ユニットアクセスコントローラにより更に使用されるバスインタフェースユニットと
を更に含む、請求項6乃至9のうちいずれか1項に記載の演算アクセラレータ。 - 前記演算アクセラレータは畳み込みニューラルネットワークに適用され、前記第1の行列は入力行列であり、前記第2の行列は重み行列である、請求項1乃至10のうちいずれか1項に記載の演算アクセラレータ。
- M=N=Kである、請求項1乃至11のうちいずれか1項に記載の演算アクセラレータ。
- 演算回路により実行される演算方法であり、前記演算回路はM個の演算グループを含み、各演算グループはK個の演算ブロックを含み、各演算ブロックはN個の演算ユニットを含む、方法であって、
前記演算回路は、第1のメモリから第1の行列を読み取り、前記第1の行列内のM個の行ベクトルを前記M個の演算グループにそれぞれ送信し、前記第1の行列はM*N行列であり、
前記演算回路は、第2のメモリから第2の行列を読み取り、重み行列のK個の列ベクトルを各演算グループの前記K個の演算ブロックにそれぞれ書き込み、前記第2の行列はN*K行列であり、
前記演算回路は、加算回路を含み、各演算ユニットは、前記第1のメモリ及び前記第2のメモリからそれぞれ2つのデータを受信し、前記演算ユニットは前記2つのデータを乗算し、前記加算回路は、各演算ブロックの計算結果を取得するために、同じ演算ブロックに属する演算ユニットの計算結果を加算するように構成され、
前記演算回路は、以下の動作、すなわち、
前記第2の行列のK個の列ベクトルを各演算グループの前記K個の演算ブロックにそれぞれ書き込む動作であり、前記第2の行列のベクトルの第g列内の第jのデータが、前記K個の演算ブロック内の第gの演算ブロック内の第jの演算ユニットに書き込まれる動作と、
前記第1の行列のM個の行ベクトルを前記M個の演算グループにそれぞれ送信する動作であり、前記第1の行列の第iの行ベクトルが前記M個の演算グループ内の第iの演算グループに送信され、前記第iの演算グループ内の各演算ブロック内の第jの演算ユニットが前記第iの行ベクトル内の第jのデータを受信し、
それにより、前記M個の演算グループ内の各演算ユニットが、前記演算ユニットにより受信された2つのデータに対して乗算演算を実行し、前記加算回路が、第3の行列を取得するために各演算ブロック内の演算ユニットの計算結果を加算し、前記第3の行列は前記第1の行列と前記第2の行列との積であり、M、N及びKは0よりも大きい整数であり、iは0よりも大きくM+1よりも小さい整数であり、gは0よりも大きくK+1よりも小さい整数であり、jは0よりも大きくN+1よりも小さい整数である、動作と
を実行する、方法。 - 前記演算回路は畳み込みニューラルネットワークに適用され、前記第1の行列は入力行列であり、前記第2の行列は重み行列である、請求項13に記載の方法。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710553286.XA CN109213962B (zh) | 2017-07-07 | 2017-07-07 | 运算加速器 |
CN201710553286.X | 2017-07-07 | ||
PCT/CN2018/078407 WO2019007095A1 (zh) | 2017-07-07 | 2018-03-08 | 运算加速器 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2020526830A JP2020526830A (ja) | 2020-08-31 |
JP7016942B2 true JP7016942B2 (ja) | 2022-02-07 |
Family
ID=64949706
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020500125A Active JP7016942B2 (ja) | 2017-07-07 | 2018-03-08 | 演算アクセラレータ |
Country Status (9)
Country | Link |
---|---|
US (2) | US11321423B2 (ja) |
EP (1) | EP3637281A4 (ja) |
JP (1) | JP7016942B2 (ja) |
KR (1) | KR102316670B1 (ja) |
CN (2) | CN109213962B (ja) |
BR (1) | BR112020000167B1 (ja) |
CA (1) | CA3069185C (ja) |
SG (1) | SG11202000140QA (ja) |
WO (1) | WO2019007095A1 (ja) |
Families Citing this family (32)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111201525A (zh) * | 2017-10-18 | 2020-05-26 | 三菱电机株式会社 | 运算电路以及运算方法 |
CN111859273A (zh) | 2017-12-29 | 2020-10-30 | 华为技术有限公司 | 矩阵乘法器 |
US11169803B2 (en) | 2018-02-13 | 2021-11-09 | Shanghai Cambricon Information Technology Co., Ltd. | Computing device and method |
CN110147347B (zh) * | 2019-03-18 | 2023-01-06 | 腾讯科技(深圳)有限公司 | 用于矩阵处理的芯片、矩阵处理方法、装置及存储介质 |
US11169957B2 (en) * | 2019-03-31 | 2021-11-09 | Intel Corporation | Systems and methods for reconfigurable systolic arrays |
CN110263324B (zh) * | 2019-05-16 | 2021-02-12 | 华为技术有限公司 | 文本处理方法、模型训练方法和装置 |
US11334647B2 (en) * | 2019-06-29 | 2022-05-17 | Intel Corporation | Apparatuses, methods, and systems for enhanced matrix multiplier architecture |
CN110580324B (zh) * | 2019-07-23 | 2020-11-17 | 珠海格力电器股份有限公司 | 图像矩阵运算方法、装置、计算机设备和存储介质 |
KR102372869B1 (ko) * | 2019-07-31 | 2022-03-08 | 한양대학교 산학협력단 | 인공 신경망을 위한 행렬 연산기 및 행렬 연산 방법 |
KR102327234B1 (ko) * | 2019-10-02 | 2021-11-15 | 고려대학교 산학협력단 | 행렬 연산시 메모리 데이터 변환 방법 및 컴퓨터 |
CN110647984B (zh) * | 2019-10-25 | 2022-07-12 | 芯盟科技有限公司 | 芯片、集成处理设备及其操作方法 |
CN111124360B (zh) * | 2019-12-23 | 2022-08-16 | 中国电子科技集团公司第五十八研究所 | 一种可配置矩阵乘法的加速器 |
US11537323B2 (en) | 2020-01-07 | 2022-12-27 | SK Hynix Inc. | Processing-in-memory (PIM) device |
US11861369B2 (en) | 2020-01-07 | 2024-01-02 | SK Hynix Inc. | Processing-in-memory (PIM) device |
US11630991B2 (en) * | 2020-02-04 | 2023-04-18 | Apple Inc. | Broadcasting mode of planar engine for neural processor |
JP6896306B1 (ja) * | 2020-04-13 | 2021-06-30 | LeapMind株式会社 | ニューラルネットワーク回路、エッジデバイスおよびニューラルネットワーク演算方法 |
CN113536221B (zh) * | 2020-04-21 | 2023-12-15 | 中科寒武纪科技股份有限公司 | 运算方法、处理器以及相关产品 |
CN113536219B (zh) * | 2020-04-21 | 2024-01-26 | 中科寒武纪科技股份有限公司 | 运算方法、处理器以及相关产品 |
US20230169144A1 (en) * | 2020-04-21 | 2023-06-01 | Cambricon (Xi'an) Semiconductor Co., Ltd. | Operation method, processor, and related product |
CN113536220A (zh) * | 2020-04-21 | 2021-10-22 | 中科寒武纪科技股份有限公司 | 运算方法、处理器及相关产品 |
US20220051086A1 (en) * | 2020-08-17 | 2022-02-17 | Alibaba Group Holding Limited | Vector accelerator for artificial intelligence and machine learning |
CN114168895A (zh) * | 2020-09-11 | 2022-03-11 | 北京希姆计算科技有限公司 | 矩阵计算电路、方法、电子设备及计算机可读存储介质 |
CN112632464B (zh) * | 2020-12-28 | 2022-11-29 | 上海壁仞智能科技有限公司 | 用于处理数据的处理装置 |
KR20220101519A (ko) | 2021-01-11 | 2022-07-19 | 에스케이하이닉스 주식회사 | 엘리먼트-와이즈 곱셈을 위한 프로세싱-인-메모리 장치 |
US20220261456A1 (en) * | 2021-01-14 | 2022-08-18 | Microsoft Technology Licensing, Llc | Computing partial matrices at hardware accelerator |
US11544213B2 (en) | 2021-03-04 | 2023-01-03 | Samsung Electronics Co., Ltd. | Neural processor |
CN113110822A (zh) * | 2021-04-20 | 2021-07-13 | 安徽芯纪元科技有限公司 | 一种可配置矩阵乘法装置及算法 |
CN113918120A (zh) * | 2021-10-19 | 2022-01-11 | Oppo广东移动通信有限公司 | 计算装置、神经网络处理设备、芯片及处理数据的方法 |
CN115437602A (zh) * | 2021-10-20 | 2022-12-06 | 中科寒武纪科技股份有限公司 | 任意精度计算加速器、集成电路装置、板卡及方法 |
CN115860080B (zh) * | 2023-02-15 | 2023-05-09 | 苏州浪潮智能科技有限公司 | 计算核、加速器、计算方法、装置、设备、介质及系统 |
CN116795432B (zh) * | 2023-08-18 | 2023-12-05 | 腾讯科技(深圳)有限公司 | 运算指令的执行方法、装置、电路、处理器及设备 |
CN117093816B (zh) * | 2023-10-19 | 2024-01-19 | 上海登临科技有限公司 | 矩阵乘运算方法、装置和电子设备 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012133793A (ja) | 1997-10-10 | 2012-07-12 | Altera Corp | プロセッサアレイ及びその形成方法 |
Family Cites Families (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6131308A (ja) | 1984-07-20 | 1986-02-13 | Hitachi Chem Co Ltd | 黒鉛層間化合物の製造法 |
JPS61150067A (ja) * | 1984-12-25 | 1986-07-08 | Matsushita Electric Ind Co Ltd | 演算装置 |
JPH0748203B2 (ja) * | 1988-06-17 | 1995-05-24 | 三菱電機株式会社 | 3次元デバイスを用いた正方行列乗算器 |
US5274832A (en) * | 1990-10-04 | 1993-12-28 | National Semiconductor Corporation | Systolic array for multidimensional matrix computations |
JPH05324700A (ja) * | 1992-05-19 | 1993-12-07 | N T T Data Tsushin Kk | 行列乗算装置 |
US8051124B2 (en) * | 2007-07-19 | 2011-11-01 | Itt Manufacturing Enterprises, Inc. | High speed and efficient matrix multiplication hardware module |
US8751556B2 (en) * | 2010-06-11 | 2014-06-10 | Massachusetts Institute Of Technology | Processor for large graph algorithm computations and matrix operations |
CN101980182A (zh) * | 2010-10-15 | 2011-02-23 | 清华大学 | 基于矩阵运算的并行计算方法 |
CN102662623A (zh) * | 2012-04-28 | 2012-09-12 | 电子科技大学 | 基于单fpga的并行矩阵乘法器及其实现方法 |
US10318308B2 (en) * | 2012-10-31 | 2019-06-11 | Mobileye Vision Technologies Ltd. | Arithmetic logic unit |
US9384168B2 (en) * | 2013-06-11 | 2016-07-05 | Analog Devices Global | Vector matrix product accelerator for microprocessor integration |
CN105589677A (zh) * | 2014-11-17 | 2016-05-18 | 沈阳高精数控智能技术股份有限公司 | 一种基于fpga的脉动结构矩阵乘法器及其实现方法 |
CN104391820B (zh) * | 2014-11-25 | 2017-06-23 | 清华大学 | 基于fpga的通用浮点矩阵处理器硬件结构 |
US10255547B2 (en) * | 2014-12-04 | 2019-04-09 | Nvidia Corporation | Indirectly accessing sample data to perform multi-convolution operations in a parallel processing system |
CN104572011B (zh) * | 2014-12-22 | 2018-07-31 | 上海交通大学 | 基于fpga的通用矩阵定点乘法器及其计算方法 |
US9747546B2 (en) * | 2015-05-21 | 2017-08-29 | Google Inc. | Neural network processor |
CN104899182B (zh) * | 2015-06-09 | 2017-10-31 | 中国人民解放军国防科学技术大学 | 一种支持可变分块的矩阵乘加速方法 |
CN106445471B (zh) * | 2016-10-13 | 2018-06-01 | 北京百度网讯科技有限公司 | 处理器和用于在处理器上执行矩阵乘运算的方法 |
US10394929B2 (en) * | 2016-12-20 | 2019-08-27 | Mediatek, Inc. | Adaptive execution engine for convolution computing systems |
KR20190093568A (ko) * | 2016-12-31 | 2019-08-09 | 인텔 코포레이션 | 이종 컴퓨팅을 위한 시스템들, 방법들, 및 장치들 |
US11132599B2 (en) * | 2017-02-28 | 2021-09-28 | Microsoft Technology Licensing, Llc | Multi-function unit for programmable hardware nodes for neural network processing |
-
2017
- 2017-07-07 CN CN201710553286.XA patent/CN109213962B/zh active Active
- 2017-07-07 CN CN202010991817.5A patent/CN112214726B/zh active Active
-
2018
- 2018-03-08 SG SG11202000140QA patent/SG11202000140QA/en unknown
- 2018-03-08 BR BR112020000167-8A patent/BR112020000167B1/pt active IP Right Grant
- 2018-03-08 JP JP2020500125A patent/JP7016942B2/ja active Active
- 2018-03-08 WO PCT/CN2018/078407 patent/WO2019007095A1/zh unknown
- 2018-03-08 EP EP18829166.0A patent/EP3637281A4/en active Pending
- 2018-03-08 CA CA3069185A patent/CA3069185C/en active Active
- 2018-03-08 KR KR1020207002212A patent/KR102316670B1/ko active IP Right Grant
-
2020
- 2020-01-07 US US16/736,427 patent/US11321423B2/en active Active
-
2022
- 2022-04-21 US US17/726,410 patent/US11720646B2/en active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012133793A (ja) | 1997-10-10 | 2012-07-12 | Altera Corp | プロセッサアレイ及びその形成方法 |
Also Published As
Publication number | Publication date |
---|---|
KR20200019736A (ko) | 2020-02-24 |
EP3637281A4 (en) | 2020-07-08 |
CN109213962B (zh) | 2020-10-09 |
CN109213962A (zh) | 2019-01-15 |
WO2019007095A1 (zh) | 2019-01-10 |
CA3069185C (en) | 2023-07-18 |
EP3637281A1 (en) | 2020-04-15 |
JP2020526830A (ja) | 2020-08-31 |
CA3069185A1 (en) | 2019-01-10 |
CN112214726B (zh) | 2024-05-03 |
SG11202000140QA (en) | 2020-02-27 |
US20220327181A1 (en) | 2022-10-13 |
CN112214726A (zh) | 2021-01-12 |
BR112020000167B1 (pt) | 2022-01-25 |
CN112214727A (zh) | 2021-01-12 |
US11720646B2 (en) | 2023-08-08 |
US20200142949A1 (en) | 2020-05-07 |
KR102316670B1 (ko) | 2021-10-22 |
US11321423B2 (en) | 2022-05-03 |
BR112020000167A2 (pt) | 2020-07-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7016942B2 (ja) | 演算アクセラレータ | |
JP6977239B2 (ja) | 行列乗算器 | |
JP6880160B2 (ja) | 計算装置と計算方法 | |
US10768894B2 (en) | Processor, information processing apparatus and operation method for processor | |
US20180341484A1 (en) | Tensor Processor Instruction Set Architecture | |
CN110415157B (zh) | 一种矩阵乘法的计算方法及装置 | |
EP3631622A1 (en) | Tensor register files | |
US9910714B2 (en) | Scriptable dynamic load balancing in computer systems | |
US20230026006A1 (en) | Convolution computation engine, artificial intelligence chip, and data processing method | |
JP2023513608A (ja) | アドレス生成方法及びユニット、深層学習処理器、チップ、電子機器並びにコンピュータプログラム | |
KR20210033757A (ko) | 메모리 장치 및 그 동작 방법 | |
CN112214727B (zh) | 运算加速器 | |
EP3073387A1 (en) | Controlling data flow between processors in a processing system | |
CN116185274A (zh) | 数据处理方法、计算装置及相关产品 | |
KR20240099773A (ko) | 효율적인 연산 분할을 위한 텐서 변형 방법, 메모리 액세스 방법, 및 이를 위한 뉴럴 프로세싱 유닛 | |
CN111291884A (zh) | 神经网络剪枝方法、装置、电子设备及计算机可读介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200220 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200220 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20210325 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20210427 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210727 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220111 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220126 |