JP2020521198A - 加算器を使用した多次元テンソルにおけるデータへのアクセス - Google Patents
加算器を使用した多次元テンソルにおけるデータへのアクセス Download PDFInfo
- Publication number
- JP2020521198A JP2020521198A JP2019553901A JP2019553901A JP2020521198A JP 2020521198 A JP2020521198 A JP 2020521198A JP 2019553901 A JP2019553901 A JP 2019553901A JP 2019553901 A JP2019553901 A JP 2019553901A JP 2020521198 A JP2020521198 A JP 2020521198A
- Authority
- JP
- Japan
- Prior art keywords
- dimension
- value
- address offset
- partial address
- loop
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 claims abstract description 27
- 230000004044 response Effects 0.000 claims description 10
- 238000004364 calculation method Methods 0.000 description 12
- 230000008569 process Effects 0.000 description 12
- 238000004590 computer program Methods 0.000 description 7
- 239000011159 matrix material Substances 0.000 description 6
- 230000009471 action Effects 0.000 description 5
- 238000013528 artificial neural network Methods 0.000 description 5
- 230000000717 retained effect Effects 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 238000004519 manufacturing process Methods 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 238000013527 convolutional neural network Methods 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 238000000926 separation method Methods 0.000 description 2
- 238000003491 array Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000000644 propagated effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 239000000758 substrate Substances 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/16—Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/30—Arrangements for executing machine instructions, e.g. instruction decode
- G06F9/30003—Arrangements for executing specific machine instructions
- G06F9/30007—Arrangements for executing specific machine instructions to perform operations on data operands
- G06F9/3001—Arithmetic instructions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/30—Arrangements for executing machine instructions, e.g. instruction decode
- G06F9/30003—Arrangements for executing specific machine instructions
- G06F9/30007—Arrangements for executing specific machine instructions to perform operations on data operands
- G06F9/30021—Compare instructions, e.g. Greater-Than, Equal-To, MINMAX
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/30—Arrangements for executing machine instructions, e.g. instruction decode
- G06F9/30003—Arrangements for executing specific machine instructions
- G06F9/30007—Arrangements for executing specific machine instructions to perform operations on data operands
- G06F9/30036—Instructions to perform operations on packed data, e.g. vector, tile or matrix operations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/30—Arrangements for executing machine instructions, e.g. instruction decode
- G06F9/30003—Arrangements for executing specific machine instructions
- G06F9/3005—Arrangements for executing specific machine instructions to perform operations for flow control
- G06F9/30065—Loop control instructions; iterative instructions, e.g. LOOP, REPEAT
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/30—Arrangements for executing machine instructions, e.g. instruction decode
- G06F9/30003—Arrangements for executing specific machine instructions
- G06F9/30072—Arrangements for executing specific machine instructions to perform conditional operations, e.g. using predicates or guards
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/30—Arrangements for executing machine instructions, e.g. instruction decode
- G06F9/30098—Register arrangements
- G06F9/30101—Special purpose registers
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/30—Arrangements for executing machine instructions, e.g. instruction decode
- G06F9/32—Address formation of the next instruction, e.g. by incrementing the instruction counter
- G06F9/322—Address formation of the next instruction, e.g. by incrementing the instruction counter for non-sequential address
- G06F9/325—Address formation of the next instruction, e.g. by incrementing the instruction counter for non-sequential address for loops, e.g. loop detection or loop counter
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/30—Arrangements for executing machine instructions, e.g. instruction decode
- G06F9/34—Addressing or accessing the instruction operand or the result ; Formation of operand address; Addressing modes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/30—Arrangements for executing machine instructions, e.g. instruction decode
- G06F9/34—Addressing or accessing the instruction operand or the result ; Formation of operand address; Addressing modes
- G06F9/345—Addressing or accessing the instruction operand or the result ; Formation of operand address; Addressing modes of multiple operands or results
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/06—Physical realisation, i.e. hardware implementation of neural networks, neurons or parts of neurons
- G06N3/063—Physical realisation, i.e. hardware implementation of neural networks, neurons or parts of neurons using electronic means
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2212/00—Indexing scheme relating to accessing, addressing or allocation within memory systems or architectures
- G06F2212/45—Caching of specific data in cache memory
- G06F2212/454—Vector or matrix data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Software Systems (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Data Mining & Analysis (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Mathematical Optimization (AREA)
- Computational Mathematics (AREA)
- Pure & Applied Mathematics (AREA)
- Mathematical Analysis (AREA)
- Computational Linguistics (AREA)
- Molecular Biology (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- General Health & Medical Sciences (AREA)
- Neurology (AREA)
- Algebra (AREA)
- Databases & Information Systems (AREA)
- Executing Machine-Instructions (AREA)
- Complex Calculations (AREA)
- Memory System Of A Hierarchy Structure (AREA)
Abstract
Description
本明細書は、一般に、ハードウェア加算器を有する特殊目的計算ユニットを使用して機械学習計算を実行することに関する。
本明細書には、テンソル要素のメモリアドレスを求めるために1つ以上のハードウェア加算器を使用してN次元テンソルにアクセスすることに関連する技術が記載されている。
詳細な説明
一般に、ソフトウェアアルゴリズムがN次元テンソルを処理する際にネステッドループが使用されてもよい。各ループは、N次元テンソルのそれぞれの次元をトラバースすることに関与し得る。多次元テンソルは、マトリクスまたは多次元マトリクスであってもよい。たとえば、二次元テンソルは、マトリクスであり、三次元テンソルは、複数の二次元マトリクスで構成される三次元マトリクスである。N次元テンソルの各次元は、1つ以上の要素を含んでもよく、各要素は、それぞれのデータ値を格納してもよい。たとえば、テンソルは、プログラムにおける変数であってもよく、この変数は、3つの次元を有してもよい。第1の次元は、300個の要素の長さを有してもよく、第2の次元は、1000個の要素の長さを有してもよく、第3の次元は、20個の要素の長さを有してもよい。当然のことながら、各次元において他の個数の要素も可能である。
Claims (20)
- N次元テンソルにアクセスするための命令を処理する装置であって、
前記N次元テンソルの各次元について、部分アドレスオフセット値要素を備え、前記部分アドレスオフセット値要素は、前記次元の初期値、前記次元のステップ値および前記次元のループの繰り返し回数に少なくとも基づいて前記次元の部分アドレスオフセット値を格納し、前記装置はさらに、
1つ以上のハードウェア加算器と、
1つ以上のプロセッサとを備え、前記1つ以上のプロセッサは、
前記N次元テンソルの特定の要素にアクセスするための命令を取得するように構成され、前記N次元テンソルは、前記N個の次元の各々にわたって配置された複数の要素を有し、Nは、1以上の整数であり、前記1つ以上のプロセッサはさらに、
前記部分アドレスオフセット値要素および前記1つ以上のハードウェア加算器のうちの1つ以上を使用して、前記特定の要素のアドレスを求めるように構成され、
前記N次元テンソルの前記特定の要素にアクセスするための前記求められたアドレスを示すデータを出力するように構成される、装置。 - 各次元について、
前記次元の前記初期値を格納する初期値要素と、
前記次元の前記ステップ値を格納するステップ値要素とをさらに備える、請求項1に記載の装置。 - 各部分アドレスオフセット値要素、各初期値要素および各ステップ値要素は、レジスタを備える、請求項2に記載の装置。
- 前記特定の要素の前記アドレスを求めることは、前記1つ以上のハードウェア加算器を使用して各次元について前記部分アドレスオフセット値の合計を求めることを備える、請求項1から3のいずれか1項に記載の装置。
- 前記1つ以上のプロセッサはさらに、
各次元について、前記ステップ値を前記次元の以前のアドレスオフセット値に加算することによって、前記次元のネステッドループの各繰り返し後に前記次元の前記部分アドレスオフセット値を求めるように構成される、請求項1から4のいずれか1項に記載の装置。 - 各次元について、前記次元の限界値を格納する限界値要素をさらに備え、前記1つ以上のプロセッサはさらに、
各次元について、次元の前記求められた部分アドレスオフセット値が前記次元の前記限界値に等しいか否かを判断するように構成され、
第1のネステッドループに対応する第1の次元の前記求められた部分アドレスオフセット値が前記第1の次元の前記限界値に等しいと判断したことに応答して、
前記第1の次元の前記部分アドレスオフセット値を前記第1の次元の前記初期値にリセットするように構成され、
前記第1のネステッドループがネストされる第2のネステッドループに対応する第2の次元について、前記1つ以上のハードウェア加算器を使用して、前記第2の次元の前記ステップ値と前記第2の次元の前記部分アドレスオフセット値との合計に等しくなるように前記第2の次元の前記部分アドレスオフセット値を更新するように構成される、請求項5に記載の装置。 - 各次元の前記ステップ値は、1つ以上の前記次元における要素の個数に基づく予め定められた値である、請求項1から6のいずれか1項に記載の装置。
- システムであって、
N次元テンソルに対して線形代数演算を実行するように構成された1つ以上のプロセッサを備え、前記N次元テンソルは、前記N個の次元の各々にわたって配置された複数の要素を有し、Nは、1以上の整数であり、前記システムはさらに、
前記N個の次元の各次元について、部分アドレスオフセット値要素を備え、前記部分アドレスオフセット値要素は、前記次元の初期値、前記次元のステップ値および前記次元のループの繰り返し回数に少なくとも基づいて前記次元の部分アドレスオフセット値を格納し、前記システムはさらに、
1つ以上のハードウェア加算器を含む回路を備え、前記回路は、
前記N次元テンソルの特定の要素にアクセスするための命令を取得するように構成され、
前記部分アドレスオフセット値要素および前記1つ以上のハードウェア加算器のうちの1つ以上を使用して、前記特定の要素のアドレスを求めるように構成され、
前記N次元テンソルの前記特定の要素にアクセスするための前記求められたアドレスを示すデータを出力するように構成される、システム。 - 各次元について、
前記次元の前記初期値を格納する初期値要素と、
前記次元の前記ステップ値を格納するステップ値要素とをさらに備える、請求項8に記載のシステム。 - 各部分アドレスオフセット値要素、各初期値要素および各ステップ値要素は、レジスタを備える、請求項9に記載のシステム。
- 前記特定の要素の前記アドレスを求めることは、前記1つ以上のハードウェア加算器を使用して各次元について前記部分アドレスオフセット値の合計を求めることを備える、請求項8に記載のシステム。
- 前記回路はさらに、
各次元について、前記ステップ値を前記次元の以前のアドレスオフセット値に加算することによって、前記次元のネステッドループの各繰り返し後に前記次元の前記部分アドレスオフセット値を求めるように構成される、請求項8から10のいずれか1項に記載のシステム。 - 各次元について、前記次元の限界値を格納する限界値要素をさらに備え、前記回路はさらに、
各次元について、次元の前記求められた部分アドレスオフセット値が前記次元の前記限界値に等しいか否かを判断するように構成され、
第1のネステッドループに対応する第1の次元の前記求められた部分アドレスオフセット値が前記第1の次元の前記限界値に等しいと判断したことに応答して、
前記第1の次元の前記部分アドレスオフセット値を前記第1の次元の前記初期値にリセットするように構成され、
前記第1のネステッドループがネストされる第2のネステッドループに対応する第2の次元について、前記1つ以上のハードウェア加算器を使用して、前記第2の次元の前記ステップ値と前記第2の次元の前記部分アドレスオフセット値との合計に等しくなるように前記第2の次元の前記部分アドレスオフセット値を更新するように構成される、請求項12に記載のシステム。 - 各次元の前記ステップ値は、1つ以上の前記次元における要素の個数に基づく予め定められた値である、請求項8から13のいずれか1項に記載のシステム。
- コンピュータによって実行される方法であって、
N次元テンソルの特定の要素にアクセスするための命令を取得するステップを備え、前記N次元テンソルは、前記N個の次元の各々にわたって配置された複数の要素を有し、Nは、1以上の整数であり、前記方法はさらに、
それぞれの部分アドレスオフセット要素に格納された部分アドレスオフセット値および1つ以上のハードウェア加算器を使用して、前記特定の要素のアドレスを求めるステップを備え、前記部分アドレス値は、各次元の部分アドレスオフセット値を含み、次元の前記部分アドレス値は、前記次元の初期値、前記次元のステップ値および前記次元のループの繰り返し回数に少なくとも基づいており、前記方法はさらに、
前記N次元テンソルの前記特定の要素にアクセスするための前記求められたアドレスを示すデータを出力するステップを備える、方法。 - 各次元の前記初期値は、前記次元の初期値要素に格納され、
前記次元の前記ステップ値は、前記次元のステップ値要素に格納される、請求項15に記載の方法。 - 各部分アドレスオフセット値要素、各初期値要素および各ステップ値要素は、レジスタを備える、請求項16に記載の方法。
- 前記特定の要素の前記アドレスを求めるステップは、前記1つ以上のハードウェア加算器を使用して各次元について前記部分アドレスオフセット値の合計を求めるステップを備える、請求項15から17のいずれか1項に記載の方法。
- 各次元について、前記ステップ値を前記次元の以前のアドレスオフセット値に加算することによって、前記次元のネステッドループの各繰り返し後に前記次元の前記部分アドレスオフセット値を求めるステップをさらに備える、請求項15から18のいずれか1項に記載の方法。
- 各次元について、次元の前記求められた部分アドレスオフセット値が前記次元の限界値に等しいか否かを判断するステップと、
第1のネステッドループに対応する第1の次元の前記求められた部分アドレスオフセット値が前記第1の次元の前記限界値に等しいと判断したことに応答して、
前記第1の次元の前記部分アドレスオフセット値を前記第1の次元の前記初期値にリセットするステップと、
前記第1のネステッドループがネストされる第2のネステッドループに対応する第2の次元について、前記1つ以上のハードウェア加算器を使用して、前記第2の次元の前記ステップ値と前記第2の次元の前記部分アドレスオフセット値との合計に等しくなるように前記第2の次元の前記部分アドレスオフセット値を更新するステップとをさらに備える、請求項19に記載の方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2022056584A JP7433356B2 (ja) | 2017-05-23 | 2022-03-30 | 加算器を使用した多次元テンソルにおけるデータへのアクセス |
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US15/603,061 US9946539B1 (en) | 2017-05-23 | 2017-05-23 | Accessing data in multi-dimensional tensors using adders |
US15/603,061 | 2017-05-23 | ||
US15/903,991 US10534607B2 (en) | 2017-05-23 | 2018-02-23 | Accessing data in multi-dimensional tensors using adders |
US15/903,991 | 2018-02-23 | ||
PCT/US2018/019691 WO2018217258A1 (en) | 2017-05-23 | 2018-02-26 | Accessing data in multi-dimensional tensors using adders |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022056584A Division JP7433356B2 (ja) | 2017-05-23 | 2022-03-30 | 加算器を使用した多次元テンソルにおけるデータへのアクセス |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2020521198A true JP2020521198A (ja) | 2020-07-16 |
JP7051895B2 JP7051895B2 (ja) | 2022-04-11 |
Family
ID=61617155
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019553901A Active JP7051895B2 (ja) | 2017-05-23 | 2018-02-26 | 加算器を使用した多次元テンソルにおけるデータへのアクセス |
JP2022056584A Active JP7433356B2 (ja) | 2017-05-23 | 2022-03-30 | 加算器を使用した多次元テンソルにおけるデータへのアクセス |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022056584A Active JP7433356B2 (ja) | 2017-05-23 | 2022-03-30 | 加算器を使用した多次元テンソルにおけるデータへのアクセス |
Country Status (6)
Country | Link |
---|---|
US (1) | US10534607B2 (ja) |
EP (1) | EP3631625A1 (ja) |
JP (2) | JP7051895B2 (ja) |
KR (2) | KR102243036B1 (ja) |
CN (1) | CN110462586A (ja) |
WO (1) | WO2018217258A1 (ja) |
Families Citing this family (24)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB2567038B (en) * | 2017-07-31 | 2019-09-25 | Google Llc | Accessing prologue and epilogue data |
US10108538B1 (en) | 2017-07-31 | 2018-10-23 | Google Llc | Accessing prologue and epilogue data |
US10936942B2 (en) | 2017-11-21 | 2021-03-02 | Google Llc | Apparatus and mechanism for processing neural network tasks using a single chip package with multiple identical dies |
US10599583B2 (en) * | 2018-08-20 | 2020-03-24 | Macronix International Co., Ltd. | Pre-match system and pre-match method |
US11263011B2 (en) * | 2018-11-28 | 2022-03-01 | International Business Machines Corporation | Compound instruction set architecture for a neural inference chip |
JP7073581B2 (ja) | 2019-04-04 | 2022-05-23 | 中科寒武紀科技股▲分▼有限公司 | データ処理装置及び関連製品 |
US11620358B2 (en) * | 2019-05-14 | 2023-04-04 | Intel Corporation | Technologies for performing macro operations in memory |
JP7062617B2 (ja) * | 2019-06-26 | 2022-05-06 | 株式会社東芝 | 演算装置および演算方法 |
US11354564B2 (en) * | 2019-06-27 | 2022-06-07 | Intel Corporation | Tuning of loop orders in blocked dense basic linear algebra subroutines |
KR102658003B1 (ko) * | 2019-11-27 | 2024-04-17 | 한양대학교 에리카산학협력단 | 효율성이 향상된 양자 가산기 및 가산 방법 |
CN113391842B (zh) | 2020-03-13 | 2024-09-17 | 华为技术有限公司 | 一种单指令多数据simd指令的生成、处理方法以及相关设备 |
EP3896565B1 (en) * | 2020-04-16 | 2024-03-06 | NXP USA, Inc. | Memory address generator |
US11954580B2 (en) | 2020-09-16 | 2024-04-09 | Meta Platforms, Inc. | Spatial tiling of compute arrays with shared control |
US11704562B1 (en) | 2020-11-04 | 2023-07-18 | Meta Platforms, Inc. | Architecture for virtual instructions |
US11709783B1 (en) | 2020-11-11 | 2023-07-25 | Meta Platforms, Inc. | Tensor data distribution using grid direct-memory access (DMA) controller |
US11972349B1 (en) | 2020-11-12 | 2024-04-30 | Meta Platforms, Inc. | Flexible compute array utilization in a tensor processor |
US11922306B2 (en) | 2020-12-28 | 2024-03-05 | Meta Platforms, Inc. | Tensor controller architecture |
US12001893B1 (en) | 2020-12-28 | 2024-06-04 | Meta Platforms, Inc. | Distributed synchronization scheme |
US11790611B2 (en) | 2020-12-30 | 2023-10-17 | Meta Platforms, Inc. | Visual editor for designing augmented-reality effects that utilize voice recognition |
CN113836049B (zh) * | 2021-09-17 | 2023-08-08 | 海飞科(南京)信息技术有限公司 | 存储器访问方法和电子装置 |
KR20230099190A (ko) | 2021-12-27 | 2023-07-04 | 서울대학교산학협력단 | 다차원 텐서의 주소 생성 장치 및 방법 |
CN114489798B (zh) * | 2022-01-25 | 2024-04-05 | 海飞科(南京)信息技术有限公司 | 用于确定张量元素的越界状态的方法和电子装置 |
CN117435547A (zh) * | 2022-07-15 | 2024-01-23 | 北京有竹居网络技术有限公司 | 人工智能芯片、灵活地访问数据的方法、设备和介质 |
CN115658146B (zh) * | 2022-12-14 | 2023-03-31 | 成都登临科技有限公司 | 一种ai芯片、张量处理方法及电子设备 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH04218847A (ja) * | 1990-02-21 | 1992-08-10 | Matsushita Electric Ind Co Ltd | 多次元アドレス発生器およびその制御方式 |
JPH05509426A (ja) * | 1990-06-27 | 1993-12-22 | ルミニス ピーティーワイ リミテッド | 行列構造にアドレスするための整数論的割り当て発生回路 |
JPH06324935A (ja) * | 1993-05-11 | 1994-11-25 | Matsushita Electric Ind Co Ltd | アドレス発生器およびアドレス発生システム |
JP2005209060A (ja) * | 2004-01-26 | 2005-08-04 | Hitachi Ltd | アドレス生成装置を含むシステムおよびそのアドレス生成装置 |
US20170075691A1 (en) * | 2011-12-23 | 2017-03-16 | Intel Corporation | Instruction for element offset calculation in a multi-dimensional array |
Family Cites Families (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0484506A1 (en) | 1990-05-22 | 1992-05-13 | International Business Machines Corporation | A learning machine synapse processor system apparatus |
US5958048A (en) * | 1996-08-07 | 1999-09-28 | Elbrus International Ltd. | Architectural support for software pipelining of nested loops |
US6219784B1 (en) | 1997-11-17 | 2001-04-17 | Advanced Micro Devices, Inc. | Processor with N adders for parallel target addresses calculation |
US6694311B1 (en) | 1999-01-25 | 2004-02-17 | International Business Machines Corporation | Method and apparatus for fast query approximation using adaptive query vector projection |
US6507835B1 (en) | 2000-02-17 | 2003-01-14 | International Business Machines Corporation | Generating grouping queries using tensor representations |
WO2001090888A1 (en) | 2000-05-23 | 2001-11-29 | Theis Jean Paul | A data processing system having an address generation unit with hardwired multidimensional memory indexing support |
US20040133745A1 (en) * | 2002-10-28 | 2004-07-08 | Quicksilver Technology, Inc. | Adaptable datapath for a digital processing system |
US6952821B2 (en) * | 2002-08-19 | 2005-10-04 | Hewlett-Packard Development Company, L.P. | Method and system for memory management optimization |
US7225439B2 (en) * | 2003-03-21 | 2007-05-29 | Sun Microsystems, Inc. | Combining write-barriers within an inner loop with fixed step |
US8443169B2 (en) | 2005-03-28 | 2013-05-14 | Gerald George Pechanek | Interconnection network connecting operation-configurable nodes according to one or more levels of adjacency in multiple dimensions of communication in a multi-processor and a neural processor |
US20080250227A1 (en) | 2007-04-04 | 2008-10-09 | Linderman Michael D | General Purpose Multiprocessor Programming Apparatus And Method |
US8713285B2 (en) | 2008-12-09 | 2014-04-29 | Shlomo Selim Rakib | Address generation unit for accessing a multi-dimensional data structure in a desired pattern |
US20100153100A1 (en) * | 2008-12-11 | 2010-06-17 | Electronics And Telecommunications Research Institute | Address generator for searching algebraic codebook |
US9141916B1 (en) | 2012-06-29 | 2015-09-22 | Google Inc. | Using embedding functions with a deep network |
US9946539B1 (en) * | 2017-05-23 | 2018-04-17 | Google Llc | Accessing data in multi-dimensional tensors using adders |
-
2018
- 2018-02-23 US US15/903,991 patent/US10534607B2/en active Active
- 2018-02-26 KR KR1020197026962A patent/KR102243036B1/ko active IP Right Grant
- 2018-02-26 WO PCT/US2018/019691 patent/WO2018217258A1/en active Application Filing
- 2018-02-26 EP EP18710248.8A patent/EP3631625A1/en active Pending
- 2018-02-26 JP JP2019553901A patent/JP7051895B2/ja active Active
- 2018-02-26 CN CN201880021083.9A patent/CN110462586A/zh active Pending
- 2018-02-26 KR KR1020217011131A patent/KR102347119B1/ko active IP Right Grant
-
2022
- 2022-03-30 JP JP2022056584A patent/JP7433356B2/ja active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH04218847A (ja) * | 1990-02-21 | 1992-08-10 | Matsushita Electric Ind Co Ltd | 多次元アドレス発生器およびその制御方式 |
JPH05509426A (ja) * | 1990-06-27 | 1993-12-22 | ルミニス ピーティーワイ リミテッド | 行列構造にアドレスするための整数論的割り当て発生回路 |
JPH06324935A (ja) * | 1993-05-11 | 1994-11-25 | Matsushita Electric Ind Co Ltd | アドレス発生器およびアドレス発生システム |
JP2005209060A (ja) * | 2004-01-26 | 2005-08-04 | Hitachi Ltd | アドレス生成装置を含むシステムおよびそのアドレス生成装置 |
US20170075691A1 (en) * | 2011-12-23 | 2017-03-16 | Intel Corporation | Instruction for element offset calculation in a multi-dimensional array |
Also Published As
Publication number | Publication date |
---|---|
KR102243036B1 (ko) | 2021-04-21 |
JP7433356B2 (ja) | 2024-02-19 |
KR20190113973A (ko) | 2019-10-08 |
US20180341479A1 (en) | 2018-11-29 |
CN110462586A (zh) | 2019-11-15 |
EP3631625A1 (en) | 2020-04-08 |
KR20210045509A (ko) | 2021-04-26 |
US10534607B2 (en) | 2020-01-14 |
JP2022095773A (ja) | 2022-06-28 |
WO2018217258A1 (en) | 2018-11-29 |
KR102347119B1 (ko) | 2022-01-05 |
JP7051895B2 (ja) | 2022-04-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7433356B2 (ja) | 加算器を使用した多次元テンソルにおけるデータへのアクセス | |
US10802956B2 (en) | Accessing prologue and epilogue data | |
TWI678617B (zh) | 用於在使用加法器之多維張量中存取資料之系統、電腦實施方法及設備 | |
JP7279226B2 (ja) | 代替ループ限界値 | |
JP7225314B2 (ja) | N次元テンソルにアクセスするための命令を処理するための装置、システム、およびコンピュータによって実現される方法 | |
GB2567038B (en) | Accessing prologue and epilogue data |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20191218 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20191218 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20210113 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20210224 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20210521 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20210726 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210812 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20211005 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220105 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220308 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220330 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7051895 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |