JP2022543332A - データ処理 - Google Patents
データ処理 Download PDFInfo
- Publication number
- JP2022543332A JP2022543332A JP2021551772A JP2021551772A JP2022543332A JP 2022543332 A JP2022543332 A JP 2022543332A JP 2021551772 A JP2021551772 A JP 2021551772A JP 2021551772 A JP2021551772 A JP 2021551772A JP 2022543332 A JP2022543332 A JP 2022543332A
- Authority
- JP
- Japan
- Prior art keywords
- array
- instruction
- data
- processing
- linear
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000012545 processing Methods 0.000 title claims abstract description 164
- 230000015654 memory Effects 0.000 claims abstract description 38
- 239000011159 matrix material Substances 0.000 claims description 80
- 238000003491 array Methods 0.000 claims description 50
- 239000013598 vector Substances 0.000 claims description 44
- 238000000034 method Methods 0.000 claims description 22
- 230000004044 response Effects 0.000 claims description 14
- 238000004590 computer program Methods 0.000 claims description 8
- 238000003672 processing method Methods 0.000 claims description 5
- 230000006870 function Effects 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 230000017105 transposition Effects 0.000 description 2
- 230000009471 action Effects 0.000 description 1
- 238000007792 addition Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000035515 penetration Effects 0.000 description 1
- 238000012549 training Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/30—Arrangements for executing machine instructions, e.g. instruction decode
- G06F9/30145—Instruction analysis, e.g. decoding, instruction word fields
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F15/00—Digital computers in general; Data processing equipment in general
- G06F15/76—Architectures of general purpose stored program computers
- G06F15/80—Architectures of general purpose stored program computers comprising an array of processing units with common control, e.g. single instruction multiple data processors
- G06F15/8053—Vector processors
- G06F15/8092—Array of vector units
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/30—Arrangements for executing machine instructions, e.g. instruction decode
- G06F9/30003—Arrangements for executing specific machine instructions
- G06F9/30007—Arrangements for executing specific machine instructions to perform operations on data operands
- G06F9/30036—Instructions to perform operations on packed data, e.g. vector, tile or matrix operations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/30—Arrangements for executing machine instructions, e.g. instruction decode
- G06F9/30003—Arrangements for executing specific machine instructions
- G06F9/30007—Arrangements for executing specific machine instructions to perform operations on data operands
- G06F9/30036—Instructions to perform operations on packed data, e.g. vector, tile or matrix operations
- G06F9/30038—Instructions to perform operations on packed data, e.g. vector, tile or matrix operations using a mask
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/30—Arrangements for executing machine instructions, e.g. instruction decode
- G06F9/30003—Arrangements for executing specific machine instructions
- G06F9/3004—Arrangements for executing specific machine instructions to perform operations on memory
- G06F9/30043—LOAD or STORE instructions; Clear instruction
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Software Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computer Hardware Design (AREA)
- Mathematical Physics (AREA)
- Computing Systems (AREA)
- Advance Control (AREA)
- Complex Calculations (AREA)
- Executing Machine-Instructions (AREA)
Abstract
Description
nは1を超える整数であり、内部のそれぞれの位置に複数のn個のデータ項目を含む線形アレイの、1つ以上のデータ項目に処理演算を適用する処理回路であって、n×n個の記憶位置のアレイにアクセスするように構成されており、
プログラム命令をデコードする命令デコーダ回路と、
命令デコーダ回路によってデコードされた命令を実行する命令処理回路と、
を備える、処理回路を備え、
命令デコーダ回路は、アレイアクセス命令に応じて、命令処理回路を制御して、線形アレイとして、アレイアクセス命令の制御下で、少なくとも第1のアレイ方向と、第1のアレイ方向とは異なる第2のアレイ方向とを含む候補アレイ方向のセットから選択されたアレイ方向に配置された、n個の記憶位置のセットにアクセスする。
nは1を超える整数であり、内部のそれぞれの位置に複数のn個のデータ項目を含む線形アレイの、1つ以上のデータ項目に処理演算を適用する処理手段であって、n×n個の記憶位置のアレイにアクセスするように動作可能であり、
プログラム命令をデコードする命令デコーダ手段と、
命令デコーダ手段によってデコードされた命令を実行する命令処理手段と、
を備える、処理手段を備え、
命令デコーダ手段は、アレイアクセス命令に応じて、命令処理手段を制御して、線形アレイとして、アレイアクセス命令の制御下で、少なくとも第1のアレイ方向と、第1のアレイ方向とは異なる第2のアレイ方向とを含む候補アレイ方向のセットから選択されたアレイ方向に配置された、n個の記憶位置のセットにアクセスする。
nは1を超える整数であり、内部のそれぞれの位置に複数のn個のデータ項目を含む線形アレイの、1つ以上のデータ項目に処理演算を適用することであって、n×n個の記憶位置のアレイにアクセスするように構成されており、適用するステップが、
プログラム命令をデコードすることと、
デコードするステップによってデコードされた命令を実行することと、
を含む、適用することを含み、
デコードするステップは、アレイアクセス命令に応じて、実行するステップを制御して、線形アレイとして、アレイアクセス命令の制御下で、少なくとも第1のアレイ方向と、第1のアレイ方向とは異なる第2のアレイ方向とを含む候補アレイ方向のセットから選択されたアレイ方向に配置された、n個の記憶位置のセットにアクセスする。
nは1を超える整数であり、内部のそれぞれの位置に複数のn個のデータ項目を含む線形アレイの、1つ以上のデータ項目に処理演算を適用する処理回路であって、n×n個の記憶位置のアレイにアクセスするように構成されており、
プログラム命令をデコードする命令デコーダ回路と、
命令デコーダ回路によってデコードされた命令を実行する命令処理回路と、
を備える、処理回路を備え、
命令デコーダ回路は、アレイアクセス命令に応じて、命令処理回路を制御して、線形アレイとして、アレイアクセス命令の制御下で、少なくとも第1のアレイ方向と、第1のアレイ方向とは異なる第2のアレイ方向とを含む候補アレイ方向のセットから選択されたアレイ方向に配置された、n個の記憶位置のセットにアクセスする。
nは1を超える整数であり、内部のそれぞれの位置に複数のn個のデータ項目を含む線形アレイの、1つ以上のデータ項目に処理演算を適用する処理回路であって、n×n個の記憶位置のアレイにアクセスするように構成されており、
プログラム命令をデコードする命令デコーダ回路と、
命令デコーダ回路によってデコードされた命令を実行する命令処理回路と、
を備える、処理回路を備え、
命令デコーダ回路は、アレイアクセス命令に応じて、命令処理回路を制御して、線形アレイとして、アレイアクセス命令の制御下で、少なくとも第1のアレイ方向と、第1のアレイ方向とは異なる第2のアレイ方向とを含む候補アレイ方向のセットから選択されたアレイ方向に配置された、n個の記憶位置のセットにアクセスする。
nは1を超える整数であり、内部のそれぞれの位置に複数のn個のデータ項目を含む線形アレイの、1つ以上のデータ項目に処理演算を適用する処理手段であって、n×n個の記憶位置のアレイにアクセスするように動作可能であり、
プログラム命令をデコードする命令デコーダ手段と、
命令デコーダ手段によってデコードされた命令を実行する命令処理手段と、
を備える、処理手段を備え、
命令デコーダ手段は、アレイアクセス命令に応じて、命令処理手段を制御して、線形アレイとして、アレイアクセス命令の制御下で、少なくとも第1のアレイ方向と、第1のアレイ方向とは異なる第2のアレイ方向とを含む候補アレイ方向のセットから選択されたアレイ方向に配置された、n個の記憶位置のセットにアクセスする。
nは1を超える整数であり、内部のそれぞれの位置に複数のn個のデータ項目を含む線形アレイの、1つ以上のデータ項目に処理演算を適用することであって、n×n個の記憶位置のアレイにアクセスするように構成されており、適用するステップが、
プログラム命令をデコードすることと、
デコードするステップによってデコードされた命令を実行することと、
を含む、適用することを含み、
デコードするステップは、アレイアクセス命令に応じて、実行するステップを制御して、線形アレイとして、アレイアクセス命令の制御下で、少なくとも第1のアレイ方向と、第1のアレイ方向とは異なる第2のアレイ方向とを含む候補アレイ方向のセットから選択されたアレイ方向に配置された、n個の記憶位置のセットにアクセスする。
nは1を超える整数であり、内部のそれぞれの位置に複数のn個のデータ項目を含む線形アレイの、1つ以上のデータ項目に処理演算を適用する処理回路であって、n×n個の記憶位置のアレイにアクセスするように構成されており、
プログラム命令をデコードする命令デコーダ回路と、
命令デコーダ回路によってデコードされた命令を実行する命令処理回路と、
を備える、処理回路を備え、
命令デコーダ回路は、アレイアクセス命令に応じて、命令処理回路を制御して、線形アレイとして、アレイアクセス命令の制御下で、少なくとも第1のアレイ方向と、第1のアレイ方向とは異なる第2のアレイ方向とを含む候補アレイ方向のセットから選択されたアレイ方向に配置された、n個の記憶位置のセットにアクセスする。
nは1を超える整数であり、内部のそれぞれの位置に複数のn個のデータ項目を含む線形アレイの、1つ以上のデータ項目に処理演算を適用する処理回路20であって、n×n個の記憶位置200のアレイ205にアクセスするように構成されており、
プログラム命令をデコードする命令デコーダ回路50と、
命令デコーダ回路によってデコードされた命令を実行する命令処理回路60と、
を備える、処理回路20を備え、
命令デコーダ回路は、アレイアクセス命令に応じて、命令処理回路を制御して、線形アレイとして、アレイアクセス命令の制御下で、少なくとも第1のアレイ方向と、第1のアレイ方向とは異なる第2のアレイ方向とを含む候補アレイ方向のセットから選択されたアレイ方向に配置された、n個の記憶位置のセットにアクセスする。
(a)例えば、以下を指定する、ロード及びストア命令:
・ ストレージアレイ90のうちの1つの線形アレイ(又は線形アレイのセット)(上記実施例におけるA1Hm)
・ 演算のソース又は送付先としてのメモリ位置のブロック
・ 任意選択的に(ベクトル処理回路の実施例の場合)、各メモリロケーションに対して演算が実行されるかどうかを定義する述語レジスタ
・ 任意選択的に、アクセスの粒度を定義するパラメータ(上記参照)
(b)コピー又は転置機能を提供し、例えば、以下を指定する、ムーブ命令:
・ ストレージアレイ90のうちの1つのソース線形アレイ(又は線形アレイのソースセット)(上記実施例におけるA1Hm又はA1Vm)、又は初期化値
・ アレイのうちの別の(異なる)1つのターゲット線形アレイ(又は線形アレイのターゲットセット)(上記実施例におけるA1Hm又はA1Vm)
・ 任意選択的に、アクセスの粒度を定義するパラメータ(上記参照)
(c)以下を指定する、行列乗算命令:
・ ストレージアレイ90のうちの1つの左入力線形アレイ(又は線形アレイのセット)(上記実施例におけるA1Hm又はA1Vm)
・ ストレージアレイ90のうちの別の(異なる)1つの右入力線形アレイ(又は線形アレイのセット)(上記実施例におけるA1Hm又はA1Vm)
・ 乗算演算の結果を記憶するための出力線形アレイ(又は線形アレイのセット)(又はスカラレジスタが、単一の線形アレイに単一の線形アレイを乗算する特定の場合に指定され得る)
・ 任意選択的に、アクセスの粒度を定義するパラメータ(上記参照)
(d)行列積和命令(以下に更に説明)
nは1を超える整数であり、内部のそれぞれの位置に複数のn個のデータ項目を含む線形アレイの、1つ以上のデータ項目に処理演算を(ステップ900で)適用することであって、n×n個の記憶位置のアレイにアクセスするように構成されており、適用するステップが、
(ステップ910で)プログラム命令をデコードすることと、
デコードするステップによってデコードされた命令を(ステップ920で)実行することと、
を含む、適用することを含み、
デコードするステップは、アレイアクセス命令に応じて、実行するステップを制御して、線形アレイとして、アレイアクセス命令の制御下で、少なくとも第1のアレイ方向と、第1のアレイ方向とは異なる第2のアレイ方向とを含む候補アレイ方向のセットから選択されたアレイ方向に配置された、n個の記憶位置のセットにアクセスする。
Claims (17)
- nは1を超える整数であり、内部のそれぞれの位置に複数のn個のデータ項目を含む線形アレイの、1つ以上のデータ項目に処理演算を適用する処理回路であって、n×n個の記憶位置のアレイにアクセスするように構成されており、
プログラム命令をデコードする命令デコーダ回路と、
前記命令デコーダ回路によってデコードされた命令を実行する命令処理回路と、
を備える、処理回路を備え、
前記命令デコーダ回路は、アレイアクセス命令に応じて、前記命令処理回路を制御して、線形アレイとして、前記アレイアクセス命令の制御下で、少なくとも第1のアレイ方向と、前記第1のアレイ方向とは異なる第2のアレイ方向とを含む候補アレイ方向のセットから選択されたアレイ方向に配置された、n個の記憶位置のセットにアクセスする、
データ処理装置。 - 前記第2のアレイ方向は、前記第1のアレイ方向に直交している、請求項1に記載のデータ処理装置。
- 前記命令処理回路は、前記第1のアレイ方向に配置されたn個の記憶位置のグループとして、記憶位置の前記アレイに入力ベクトルを記憶するように構成されており、データ取り出し命令に応じて、線形アレイとして、前記データ取り出し命令の制御下で、候補アレイ方向の前記セットから、選択されたアレイ方向に配列されたn個の記憶位置のセットを取り出し、
前記第1のアレイ方向は、所定のアレイ方向である、
請求項1又は請求項2に記載のデータ処理装置。 - 前記データ取り出し命令は、前記命令処理回路が線形アレイとしてn個の記憶位置のセットにアクセスするアレイ方向を指定するための、関連する命令パラメータを有する、請求項3に記載のデータ処理装置。
- n×n個の記憶位置の2つ以上のアレイを含む、請求項1~4のいずれか一項に記載のデータ処理装置。
- 前記アレイアクセス命令は、n×n個の記憶位置の前記2つ以上のアレイのうちのそれぞれに記憶されたデータ項目のそれぞれの入力行列に応じて出力データを生成する行列処理演算を定義する行列処理命令を含む、請求項5に記載のデータ処理装置。
- 前記行列処理演算は、前記入力行列のうちの1つのデータ項目の行又は列と、前記入力行列のうちの別のもののデータ項目の行又は列との間の演算を定義し、
前記行列処理命令は、データ項目の前記入力行列を記憶するn×n個の記憶位置の前記それぞれのアレイごとに、前記命令デコーダ回路が前記命令処理回路を制御して記憶位置の前記アレイから線形アレイを取り出すアレイ方向を指定するための、関連する命令パラメータを有する、
請求項6に記載のデータ処理装置。 - 前記行列処理演算は、前記入力行列のうちの1つのデータ項目の行及び列のうちの1つの要素と、前記入力行列の別のもののデータ項目の行及び列のうちの他方の要素との間の演算に依存して、出力行列の要素を生成する、行列乗算演算である、請求項7に記載のデータ処理装置。
- n×n個の記憶位置の前記アレイは、2n個の線形アレイとして前記命令処理回路によってアクセス可能な記憶素子のアレイを含み、前記2n個の線形アレイは、前記第1のアレイ方向のn個の線形アレイと、前記第2のアレイ方向のn個の線形アレイとを含み、各線形アレイはn個のデータ項目を含む、請求項2に記載のデータ処理装置。
- 前記アレイアクセス命令は、前記2n個の線形アレイのうちの1つ以上を指定する、請求項9に記載のデータ処理装置。
- 前記データ構造保持回路は、アーキテクチャ的にアドレス指定可能なレジスタ、アーキテクチャ的にアドレス指定不可能なレジスタ、スクラッチパッドメモリ、及びキャッシュ、のうちの少なくとも1つを備える、請求項1~10のいずれか一項に記載のデータ処理装置。
- nが16に等しい、請求項1~11のいずれか一項に記載のデータ処理装置。
- nは1を超える整数であり、内部のそれぞれの位置に複数のn個のデータ項目を含む線形アレイの、1つ以上のデータ項目に処理演算を適用する処理手段であって、n×n個の記憶位置のアレイにアクセスするように動作可能であり、
プログラム命令をデコードする命令デコーダ手段と、
前記命令デコーダ手段によってデコードされた命令を実行する命令処理手段と、
を備える、処理手段を備え、
前記命令デコーダ手段は、アレイアクセス命令に応じて、前記命令処理手段を制御して、線形アレイとして、前記アレイアクセス命令の制御下で、少なくとも第1のアレイ方向と、前記第1のアレイ方向とは異なる第2のアレイ方向とを含む候補アレイ方向のセットから選択されたアレイ方向に配置された、n個の記憶位置のセットにアクセスする、
データ処理装置。 - nは1を超える整数であり、内部のそれぞれの位置に複数のn個のデータ項目を含む線形アレイの、1つ以上のデータ項目に処理演算を適用することであって、n×n個の記憶位置のアレイにアクセスするように構成されており、前記適用するステップが、
プログラム命令をデコードすることと、
前記デコードするステップによってデコードされた命令を実行することと、
を含む、適用することを含み、
前記デコードするステップは、アレイアクセス命令に応じて、前記実行するステップを制御して、線形アレイとして、前記アレイアクセス命令の制御下で、少なくとも第1のアレイ方向と、前記第1のアレイ方向とは異なる第2のアレイ方向とを含む候補アレイ方向のセットから選択されたアレイ方向に配置された、n個の記憶位置のセットにアクセスする、
データ処理方法。 - コンピュータによって実行されると、前記コンピュータに、請求項14に記載の方法を実行させるコンピュータソフトウェア。
- 請求項15に記載のコンピュータソフトウェアを記憶する、非一時的マシン可読記憶媒体。
- マシン可読命令を含むコンピュータプログラムを実行するためのデータプロセッサを備える仮想マシンであって、前記コンピュータプログラムの実行は、前記データプロセッサをデータ処理装置として動作させ、前記データ処理装置は、
nは1を超える整数であり、内部のそれぞれの位置に複数のn個のデータ項目を含む線形アレイの、1つ以上のデータ項目に処理演算を適用する処理回路であって、n×n個の記憶位置のアレイにアクセスするように構成されており、
プログラム命令をデコードする命令デコーダ回路と、
前記命令デコーダ回路によってデコードされた命令を実行する命令処理回路と、
を備える、処理回路を備え、
前記命令デコーダ回路は、アレイアクセス命令に応じて、前記命令処理回路を制御して、線形アレイとして、前記アレイアクセス命令の制御下で、少なくとも第1のアレイ方向と、前記第1のアレイ方向とは異なる第2のアレイ方向とを含む候補アレイ方向のセットから選択されたアレイ方向に配置された、n個の記憶位置のセットにアクセスする、
仮想マシン。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US16/531,210 US11074214B2 (en) | 2019-08-05 | 2019-08-05 | Data processing |
US16/531,210 | 2019-08-05 | ||
PCT/GB2020/050813 WO2021023957A1 (en) | 2019-08-05 | 2020-03-26 | Data processing |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2022543332A true JP2022543332A (ja) | 2022-10-12 |
Family
ID=70166062
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021551772A Pending JP2022543332A (ja) | 2019-08-05 | 2020-03-26 | データ処理 |
Country Status (8)
Country | Link |
---|---|
US (1) | US11074214B2 (ja) |
EP (1) | EP3931688B1 (ja) |
JP (1) | JP2022543332A (ja) |
KR (1) | KR20220038579A (ja) |
CN (1) | CN113490914A (ja) |
IL (1) | IL285752B1 (ja) |
TW (1) | TW202107279A (ja) |
WO (1) | WO2021023957A1 (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB2614886A (en) | 2022-01-19 | 2023-07-26 | Advanced Risc Mach Ltd | Data processing |
GB2617829A (en) * | 2022-04-13 | 2023-10-25 | Advanced Risc Mach Ltd | Technique for handling data elements stored in an array storage |
GB2617828A (en) * | 2022-04-13 | 2023-10-25 | Advanced Risc Mach Ltd | Technique for handling data elements stored in an array storage |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5887183A (en) | 1995-01-04 | 1999-03-23 | International Business Machines Corporation | Method and system in a data processing system for loading and storing vectors in a plurality of modes |
US7062761B2 (en) * | 2001-07-10 | 2006-06-13 | Micron Technology, Inc. | Dynamic arrays and overlays with bounds policies |
US7386703B2 (en) | 2003-11-18 | 2008-06-10 | International Business Machines Corporation | Two dimensional addressing of a matrix-vector register array |
GB2514419B (en) * | 2013-05-24 | 2016-05-04 | Barclays Bank Plc | Improved user authentication system and method |
GB2540940B (en) | 2015-07-31 | 2018-01-03 | Advanced Risc Mach Ltd | An apparatus and method for transferring a plurality of data structures between memory and one or more vectors of data elements stored in a register bank |
-
2019
- 2019-08-05 US US16/531,210 patent/US11074214B2/en active Active
-
2020
- 2020-03-26 KR KR1020217027850A patent/KR20220038579A/ko unknown
- 2020-03-26 JP JP2021551772A patent/JP2022543332A/ja active Pending
- 2020-03-26 CN CN202080016631.6A patent/CN113490914A/zh active Pending
- 2020-03-26 IL IL285752A patent/IL285752B1/en unknown
- 2020-03-26 WO PCT/GB2020/050813 patent/WO2021023957A1/en unknown
- 2020-03-26 EP EP20716897.2A patent/EP3931688B1/en active Active
- 2020-08-04 TW TW109126317A patent/TW202107279A/zh unknown
Also Published As
Publication number | Publication date |
---|---|
CN113490914A (zh) | 2021-10-08 |
EP3931688A1 (en) | 2022-01-05 |
IL285752A (en) | 2021-10-31 |
WO2021023957A1 (en) | 2021-02-11 |
TW202107279A (zh) | 2021-02-16 |
EP3931688B1 (en) | 2023-04-26 |
US11074214B2 (en) | 2021-07-27 |
US20210042261A1 (en) | 2021-02-11 |
KR20220038579A (ko) | 2022-03-29 |
IL285752B1 (en) | 2024-02-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11775313B2 (en) | Hardware accelerator for convolutional neural networks and method of operation thereof | |
EP3451162B1 (en) | Device and method for use in executing matrix multiplication operations | |
CN110770701B (zh) | 基于寄存器的矩阵乘法 | |
CN110678841B (zh) | 张量处理器指令集架构 | |
JP2022543332A (ja) | データ処理 | |
US8375196B2 (en) | Vector processor with vector register file configured as matrix of data cells each selecting input from generated vector data or data from other cell via predetermined rearrangement path | |
US20230244751A1 (en) | Device and method for accelerating matrix multiply operations | |
US11409840B2 (en) | Dynamically adaptable arrays for vector and matrix operations | |
IL256403A (en) | Array query length instruction | |
US20200272478A1 (en) | Vector processor and control method therefor | |
US20230221955A1 (en) | Vector bit transpose | |
EP4095719A1 (en) | Sparse matrix multiplication in hardware | |
JP2002269067A (ja) | 行列演算装置 | |
US7788471B2 (en) | Data processor and methods thereof | |
CN113254078B (zh) | 一种在gpdpu模拟器上高效执行矩阵加法的数据流处理方法 | |
JPH1063647A (ja) | 行列演算装置 | |
WO2023242531A1 (en) | Technique for performing outer product operations | |
WO2023199015A1 (en) | Technique for handling data elements stored in an array storage | |
WO2023199014A1 (en) | Technique for handling data elements stored in an array storage | |
TW202344983A (zh) | 資料處理 | |
CN115599444A (zh) | 针对机器学习优化的并行处理器 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20210903 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20211229 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20230317 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20231011 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20231121 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20240213 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20240521 |