JP7129138B2 - 16ビット浮動小数点乗算器を用いた行列と行列の乗算による複数精度整数乗算器 - Google Patents
16ビット浮動小数点乗算器を用いた行列と行列の乗算による複数精度整数乗算器 Download PDFInfo
- Publication number
- JP7129138B2 JP7129138B2 JP2020545788A JP2020545788A JP7129138B2 JP 7129138 B2 JP7129138 B2 JP 7129138B2 JP 2020545788 A JP2020545788 A JP 2020545788A JP 2020545788 A JP2020545788 A JP 2020545788A JP 7129138 B2 JP7129138 B2 JP 7129138B2
- Authority
- JP
- Japan
- Prior art keywords
- matrix
- integer
- product
- elements
- computer
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 239000011159 matrix material Substances 0.000 title claims description 397
- 238000006467 substitution reaction Methods 0.000 claims description 54
- 238000000034 method Methods 0.000 claims description 37
- 238000004364 calculation method Methods 0.000 claims description 29
- 230000008569 process Effects 0.000 claims description 17
- 230000001174 ascending effect Effects 0.000 claims description 10
- 238000004590 computer program Methods 0.000 claims description 8
- 238000010586 diagram Methods 0.000 description 14
- 238000012545 processing Methods 0.000 description 12
- 238000004891 communication Methods 0.000 description 8
- 230000006870 function Effects 0.000 description 7
- 230000005540 biological transmission Effects 0.000 description 5
- 230000002123 temporal effect Effects 0.000 description 4
- 230000006872 improvement Effects 0.000 description 3
- 230000010365 information processing Effects 0.000 description 3
- 230000009471 action Effects 0.000 description 2
- 238000003491 array Methods 0.000 description 2
- 238000011960 computer-aided design Methods 0.000 description 2
- 239000000835 fiber Substances 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000001902 propagating effect Effects 0.000 description 2
- RYGMFSIKBFXOCR-UHFFFAOYSA-N Copper Chemical compound [Cu] RYGMFSIKBFXOCR-UHFFFAOYSA-N 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 230000003139 buffering effect Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 229910052802 copper Inorganic materials 0.000 description 1
- 239000010949 copper Substances 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
- 230000003245 working effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F7/00—Methods or arrangements for processing data by operating upon the order or content of the data handled
- G06F7/38—Methods or arrangements for performing computations using exclusively denominational number representation, e.g. using binary, ternary, decimal representation
- G06F7/48—Methods or arrangements for performing computations using exclusively denominational number representation, e.g. using binary, ternary, decimal representation using non-contact-making devices, e.g. tube, solid state device; using unspecified devices
- G06F7/52—Multiplying; Dividing
- G06F7/523—Multiplying only
- G06F7/53—Multiplying only in parallel-parallel fashion, i.e. both operands being entered in parallel
- G06F7/5324—Multiplying only in parallel-parallel fashion, i.e. both operands being entered in parallel partitioned, i.e. using repetitively a smaller parallel parallel multiplier or using an array of such smaller multipliers
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/16—Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F7/00—Methods or arrangements for processing data by operating upon the order or content of the data handled
- G06F7/38—Methods or arrangements for performing computations using exclusively denominational number representation, e.g. using binary, ternary, decimal representation
- G06F7/48—Methods or arrangements for performing computations using exclusively denominational number representation, e.g. using binary, ternary, decimal representation using non-contact-making devices, e.g. tube, solid state device; using unspecified devices
- G06F7/544—Methods or arrangements for performing computations using exclusively denominational number representation, e.g. using binary, ternary, decimal representation using non-contact-making devices, e.g. tube, solid state device; using unspecified devices for evaluating functions by calculation
- G06F7/5443—Sum of products
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Pure & Applied Mathematics (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Computational Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Mathematical Physics (AREA)
- General Engineering & Computer Science (AREA)
- Computing Systems (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Software Systems (AREA)
- Algebra (AREA)
- Complex Calculations (AREA)
- Design And Manufacture Of Integrated Circuits (AREA)
Description
Claims (23)
- コンピュータによって実施される方法であって、
第1の整数を表す第1の整数データを第1の桁方向に分割することによって得られる複数の第1の整数要素の中の、N×N個の第1の整数要素を、N個の行とN個の列とを有する第1の行列に代入することと、
第2の整数を表す第2の整数データを第2の桁方向に分割することによって得られる複数の第2の整数要素の中の、1つまたは複数の第2の整数要素のそれぞれを、N個の行とN個の列とを有する第2の行列の少なくとも1つの行列要素に代入することと、
前記第1の行列と前記第2の行列との積である第3の行列を計算することと、
前記第3の行列の各行列要素を、前記第1の整数と前記第2の整数との積の計算における部分積として出力することと
を含む方法。 - 前記第1の行列に前記代入するおよび前記第2の行列に前記代入する間、前記第1の行列および前記第2の行列の各行列要素は、前記第1の行列に含まれる各第1の整数要素と、前記第2の行列に含まれる各第2の整数要素との前記積の中の、前記第1の整数と前記第2の整数との前記積において同じ桁位置に対応する各積が、前記第3の行列の同じ行列要素に対応するように配置される、請求項1に記載のコンピュータによって実施される方法。
- 前記N×N個の第1の整数要素は、前記第1の整数データにおいて前記第1の桁方向に連続している、請求項1に記載のコンピュータによって実施される方法。
- 前記1つまたは複数の第2の整数要素は、前記第2の整数データにおいて前記第2の桁方向に連続している、請求項3に記載のコンピュータによって実施される方法。
- 前記第1の行列に前記代入する間、前記N×N個の第1の整数要素の中の、N個の連続した第1の整数要素は、前記第1の行列の各行に、前記第1の整数データにおける前記第1の桁方向において昇順または降順で代入され、
前記第2の行列に前記代入する間、前記複数の第2の整数要素の中の、N個の連続した第2の整数要素は、前記第2の行列の各列に、前記第2の整数データの前記第2の桁方向において前記N個の第1の整数要素を前記第1の行列に前記代入する順序と反対の順序で、代入される、
請求項4に記載のコンピュータによって実施される方法。 - 前記第1の行列に前記代入する間、前記N×N個の第1の整数要素は、前記第1の行列の各行列要素に、列優先および昇順または降順で代入され、
前記第2の行列に前記代入する間、
前記N個の連続した第2の整数要素は、前記第2の行列の第1の行に、前記N個の第1の整数要素を前記第1の行列に前記代入する順序と同じ順序で代入され、
前記N個の第2の整数要素は、前記第2の行列の第2および後続の行に、前記第2の整数データ内の前記N個の第2の整数要素を一時に1つの整数要素だけシフトしながら、代入される、
請求項5に記載のコンピュータによって実施される方法。 - 前記第3の行列は、第4の行列に加算され、
前記部分積として前記出力することは、
前記第4の行列の第1の行または最後の行内の各行列要素を、前記第1の整数と前記第2の整数との前記積における対応するビット位置での、各第1の整数要素と各第2の整数要素との前記部分積の和として、抽出することと、
前記第4の行列内において、前記部分積の前記和として抽出された前記行以外の行を、前記部分積の前記和として抽出された前記行に向かって1行シフトし、空のスペースを有する行内の各行列要素を0に設定することと
を含む、請求項6に記載のコンピュータによって実施される方法。 - 前記第2の行列に前記代入する間、前記複数の第2の整数要素から前記1つまたは複数の第2の整数要素を一時に1つ、前記第2の行列に順次に代入するプロセスは、前記第1の行列に前記代入する間、前記複数の第1の整数要素の中のN×N個の第1の整数要素の異なるセットが、前記第1の行列に代入されるたびに繰り返され、
前記第3の行列を前記計算すること、および前記部分積を前記出力することは、前記1つまたは複数の第2の整数要素が、前記第2の行列に代入されるたびに行われ、
前記第1の整数と前記第2の整数との前記積は、各出力された部分積に基づいて計算される、
請求項1に記載のコンピュータによって実施される方法。 - 前記第1の整数と前記第2の整数との前記積を計算することは、
各部分積を、前記第1の整数と前記第2の整数との前記積における対応する桁位置に配置することと、
各部分積の桁あふれを、より高位の桁に加算することと
を含む、請求項8に記載のコンピュータによって実施される方法。 - 第3の整数の上半分と第4の整数の上半分との第1の積は、前記第3の整数の前記上半分を前記第1の整数として設定し、前記第4の整数の前記上半分を前記第2の整数として設定し、前記第1の整数と前記第2の整数との前記積を計算することによって計算され、
前記第3の整数の下半分と前記第4の整数の下半分との第2の積は、前記第3の整数の前記下半分を前記第1の整数として設定し、前記第4の整数の前記下半分を前記第2の整数として設定し、前記第1の整数と前記第2の整数との前記積を計算することによって計算され、
前記第3の整数の前記上半分と前記下半分との和と、前記第4の整数の前記上半分と前記下半分との和との第3の積は、前記第3の整数の前記上半分と前記下半分との前記和を前記第1の整数として設定し、前記第4の整数の前記上半分と前記下半分との前記和を前記第2の整数として設定し、前記第1の整数と前記第2の整数との前記積を計算することによって計算され、
前記第3の整数と前記第4の整数との積は、前記第1の積、前記第2の積、および前記第3の積に基づいて計算される、
請求項1に記載のコンピュータによって実施される方法。 - 前記第3の行列の計算は、1つのコマンドに従って、N個の行とN個の列とを有する行列の積を計算する第1のプロセッサによって行われる、請求項1に記載のコンピュータによって実施される方法。
- 前記第1の整数および前記第2の整数のサイズに従って、前記第1の整数と前記第2の整数との前記積を、前記第1のプロセッサを用いて計算することと、前記第1の整数と前記第2の整数との前記積を、N個の行とN個の列とを有する行列の積を計算するためのコマンドを有しない第2のプロセッサを用いて計算することとの間で、切り換えが行われる、請求項11に記載のコンピュータによって実施される方法。
- 前記複数の第1の整数要素および前記複数の第2の整数要素は、同じサイズを有する、請求項1に記載のコンピュータによって実施される方法。
- 前記複数の第1の整数要素および前記複数の第2の整数要素は、それぞれ8ビットである、請求項13に記載のコンピュータによって実施される方法。
- 装置であって、
プロセッサまたはプログラマブル回路と、
共同で命令を含む1つまたは複数のコンピュータ可読媒体とを備え、前記命令は、前記プロセッサまたは前記プログラマブル回路によって実行されるとき、前記プロセッサまたは前記プログラマブル回路に、
第1の整数を表す第1の整数データを第1の桁方向に分割することによって得られる複数の第1の整数要素の中の、N×N個の第1の整数要素を、N個の行とN個の列とを有する第1の行列に代入することと、
第2の整数を表す第2の整数データを第2の桁方向に分割することによって得られる複数の第2の整数要素の中の、1つまたは複数の第2の整数要素のそれぞれを、N個の行とN個の列とを有する第2の行列の少なくとも1つの行列要素に代入することと、
前記第1の行列と前記第2の行列との積である第3の行列を計算することと、
前記第3の行列の各行列要素を、前記第1の整数と前記第2の整数との積の計算における部分積として出力することと
を行わせる、装置。 - 前記第1の行列に前記代入するおよび前記第2の行列に前記代入する間、前記第1の行列および前記第2の行列の各行列要素は、前記第1の行列に含まれる各第1の整数要素と、前記第2の行列に含まれる各第2の整数要素との前記積の中の、前記第1の整数と前記第2の整数との前記積において同じ桁位置に対応する各積が、前記第3の行列の同じ行列要素に対応するように配置される、請求項15に記載の装置。
- 前記命令は、前記プロセッサまたは前記プログラマブル回路によって実行されるとき、前記プロセッサまたは前記プログラマブル回路に、
前記第2の行列に前記代入する間、前記複数の第2の整数要素から前記1つまたは複数の第2の整数要素を一時に1つ、前記第2の行列に順次に代入するプロセスを、前記第1の行列に前記代入する間、前記複数の第1の整数要素の中のN×N個の第1の整数要素の異なるセットが、前記第1の行列に代入されるたびに繰り返すことと、
前記1つまたは複数の第2の整数要素が、前記第2の行列に代入されるたびに、前記第3の行列の計算を行い、前記部分積を出力することと、
各出力された部分積に基づいて、前記第1の整数と前記第2の整数との前記積を計算することと
を行わせる、請求項15に記載の装置。 - 装置であって、
第1の整数を表す第1の整数データを第1の桁方向に分割することによって得られる複数の第1の整数要素の中の、N×N個の第1の整数要素を、N個の行とN個の列とを有する第1の行列に代入する、第1の行列代入部と、
第2の整数を表す第2の整数データを第2の桁方向に分割することによって得られる複数の第2の整数要素の中の、1つまたは複数の第2の整数要素のそれぞれを、N個の行とN個の列とを有する第2の行列の少なくとも1つの行列要素に代入する、第2の行列代入部と、
前記第1の行列と前記第2の行列との積である第3の行列を計算する、第3の行列計算部と、
前記第3の行列の各行列要素を、前記第1の整数と前記第2の整数との積の計算における部分積として出力する、部分積出力部と
を備える装置。 - 前記第1の行列に前記代入するおよび前記第2の行列に前記代入する間、前記第1の行列および前記第2の行列の各行列要素は、前記第1の行列に含まれる各第1の整数要素と、前記第2の行列に含まれる各第2の整数要素との前記積の中の、前記第1の整数と前記第2の整数との前記積において同じ桁位置に対応する各積が、前記第3の行列の同じ行列要素に対応するように配置される、請求項18に記載の装置。
- 前記第2の行列代入部は、前記第2の行列に前記代入する間、前記複数の第2の整数要素から前記1つまたは複数の第2の整数要素を一時に1つ、前記第2の行列に順次に代入するプロセスを、前記第1の行列代入部が、前記複数の第1の整数要素の中のN×N個の第1の整数要素の異なるセットを、前記第1の行列に代入するたびに繰り返し、
前記第3の行列計算部および前記部分積出力部は、前記第3の行列の計算および前記部分積の出力を、前記第2の行列代入部によって、前記1つまたは複数の第2の整数要素が、前記第2の行列に代入されるたびに行い、
前記装置は、各出力された部分積に基づいて、前記第1の整数と前記第2の整数との前記積を計算する整数積計算部を備える、
請求項18に記載の装置。 - コンピュータ・プログラムであって、プロセッサまたはプログラマブル回路に
第1の整数を表す第1の整数データを第1の桁方向に分割することによって得られる複数の第1の整数要素の中の、N×N個の第1の整数要素を、N個の行とN個の列とを有する第1の行列に代入することと、
第2の整数を表す第2の整数データを第2の桁方向に分割することによって得られる複数の第2の整数要素の中の、1つまたは複数の第2の整数要素のそれぞれを、N個の行とN個の列とを有する第2の行列の少なくとも1つの行列要素に代入することと、
前記第1の行列と前記第2の行列との積である第3の行列を計算することと、
前記第3の行列の各行列要素を、前記第1の整数と前記第2の整数との積の計算における部分積として出力することと
を実行させるためのコンピュータ・プログラム。 - 前記第1の行列に前記代入するおよび前記第2の行列に前記代入する間、前記第1の行列および前記第2の行列の各行列要素は、前記第1の行列に含まれる各第1の整数要素と、前記第2の行列に含まれる各第2の整数要素との前記積の中の、前記第1の整数と前記第2の整数との前記積において同じ桁位置に対応する各積が、前記第3の行列の同じ行列要素に対応するように配置される、請求項21に記載のコンピュータ・プログラム。
- 前記コンピュータ・プログラムは、前記プロセッサまたは前記プログラマブル回路に、
前記第2の行列に前記代入する間、前記複数の第2の整数要素から前記1つまたは複数の第2の整数要素を一時に1つ、前記第2の行列に順次に代入するプロセスを、前記第1の行列に前記代入する間、前記複数の第1の整数要素の中のN×N個の第1の整数要素の異なるセットが、前記第1の行列に代入されるたびに繰り返すことと、
前記1つまたは複数の第2の整数要素が、前記第2の行列に代入されるたびに、前記第3の行列の計算を行い、前記部分積を出力することと、
各出力された部分積に基づいて、前記第1の整数と前記第2の整数との前記積を計算することと
をさらに実行させる、請求項21に記載のコンピュータ・プログラム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US15/911,772 | 2018-03-05 | ||
US15/911,772 US10528642B2 (en) | 2018-03-05 | 2018-03-05 | Multiple precision integer multiple by matrix-matrix multiplications using 16-bit floating point multiplier |
PCT/IB2019/051710 WO2019171238A1 (en) | 2018-03-05 | 2019-03-04 | Multiple precision integer multiplier by matrix-matrix multiplications using 16-bit floating point multiplier |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2021515936A JP2021515936A (ja) | 2021-06-24 |
JP7129138B2 true JP7129138B2 (ja) | 2022-09-01 |
Family
ID=67768635
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020545788A Active JP7129138B2 (ja) | 2018-03-05 | 2019-03-04 | 16ビット浮動小数点乗算器を用いた行列と行列の乗算による複数精度整数乗算器 |
Country Status (6)
Country | Link |
---|---|
US (2) | US10528642B2 (ja) |
JP (1) | JP7129138B2 (ja) |
CN (1) | CN111801651A (ja) |
DE (1) | DE112019000382T5 (ja) |
GB (1) | GB2584265A (ja) |
WO (1) | WO2019171238A1 (ja) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11341185B1 (en) * | 2018-06-19 | 2022-05-24 | Amazon Technologies, Inc. | Systems and methods for content-based indexing of videos at web-scale |
KR102703432B1 (ko) * | 2018-12-31 | 2024-09-06 | 삼성전자주식회사 | 메모리 장치를 이용한 계산 방법 및 이를 수행하는 메모리 장치 |
US12072952B2 (en) | 2021-03-26 | 2024-08-27 | Advanced Micro Devices, Inc. | Data compressor for approximation of matrices for matrix multiply operations |
US20220309126A1 (en) * | 2021-03-26 | 2022-09-29 | Advanced Micro Devices, Inc. | Approximation of matrices for matrix multiply operations |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP3200068A1 (en) | 2015-07-22 | 2017-08-02 | Huawei Technologies Co., Ltd. | Parallel computing method and terminal |
Family Cites Families (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0833815B2 (ja) * | 1990-05-14 | 1996-03-29 | 日本電気株式会社 | 高桁乗算装置 |
JP3637073B2 (ja) * | 1993-10-21 | 2005-04-06 | 株式会社東芝 | 倍精度・単精度・内積演算および複素乗算が可能な乗算器 |
WO2003021423A2 (en) | 2001-09-04 | 2003-03-13 | Microunity Systems Engineering, Inc. | System and method for performing multiplication |
US7318080B2 (en) * | 2003-11-06 | 2008-01-08 | Telefonaktiebolaget L M Ericsson (Publ) | Split radix multiplication |
CN102446160B (zh) * | 2011-09-06 | 2015-02-18 | 中国人民解放军国防科学技术大学 | 面向双精度simd部件的矩阵乘实现方法 |
WO2013044276A1 (en) | 2011-09-27 | 2013-04-04 | Technische Universität Graz | Multiplication of large operands |
CN102446460A (zh) | 2011-11-30 | 2012-05-09 | 黄武昌 | 多功能轴筒式遥控记录展示系统 |
US9384168B2 (en) * | 2013-06-11 | 2016-07-05 | Analog Devices Global | Vector matrix product accelerator for microprocessor integration |
US9600235B2 (en) * | 2013-09-13 | 2017-03-21 | Nvidia Corporation | Technique for performing arbitrary width integer arithmetic operations using fixed width elements |
US9703531B2 (en) * | 2015-11-12 | 2017-07-11 | Arm Limited | Multiplication of first and second operands using redundant representation |
CN106445471B (zh) * | 2016-10-13 | 2018-06-01 | 北京百度网讯科技有限公司 | 处理器和用于在处理器上执行矩阵乘运算的方法 |
GB2563878B (en) * | 2017-06-28 | 2019-11-20 | Advanced Risc Mach Ltd | Register-based matrix multiplication |
-
2018
- 2018-03-05 US US15/911,772 patent/US10528642B2/en not_active Expired - Fee Related
-
2019
- 2019-03-04 JP JP2020545788A patent/JP7129138B2/ja active Active
- 2019-03-04 WO PCT/IB2019/051710 patent/WO2019171238A1/en active Application Filing
- 2019-03-04 CN CN201980016853.5A patent/CN111801651A/zh active Pending
- 2019-03-04 DE DE112019000382.8T patent/DE112019000382T5/de active Pending
- 2019-03-04 GB GB2015022.3A patent/GB2584265A/en not_active Withdrawn
- 2019-11-07 US US16/677,246 patent/US10795967B2/en active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP3200068A1 (en) | 2015-07-22 | 2017-08-02 | Huawei Technologies Co., Ltd. | Parallel computing method and terminal |
Also Published As
Publication number | Publication date |
---|---|
GB2584265A (en) | 2020-11-25 |
GB202015022D0 (en) | 2020-11-04 |
JP2021515936A (ja) | 2021-06-24 |
US20190272308A1 (en) | 2019-09-05 |
DE112019000382T5 (de) | 2020-09-24 |
US10795967B2 (en) | 2020-10-06 |
CN111801651A (zh) | 2020-10-20 |
WO2019171238A1 (en) | 2019-09-12 |
US20200073914A1 (en) | 2020-03-05 |
US10528642B2 (en) | 2020-01-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7129138B2 (ja) | 16ビット浮動小数点乗算器を用いた行列と行列の乗算による複数精度整数乗算器 | |
CN107077416B (zh) | 用于以选择性舍入模式进行向量处理的装置和方法 | |
US10579338B2 (en) | Apparatus and method for processing input operand values | |
US10255041B2 (en) | Unified multiply unit | |
JP2012069116A5 (ja) | ||
US20170068517A1 (en) | Decimal and binary floating point rounding | |
EP4359907A1 (en) | Fpga processing block for machine learning or digital signal processing operations | |
CN104169866B (zh) | 运算处理装置以及运算处理装置的控制方法 | |
US20210049230A1 (en) | Half-precision floating-point arrays at low overhead | |
WO2020161458A1 (en) | Encoding special value in anchored-data element | |
US10963245B2 (en) | Anchored data element conversion | |
CN110199255B (zh) | 组合若干执行单元以计算单一宽标量结果 | |
CN115843354A (zh) | 使用双曲线函数的指数函数的高效硬件实现 | |
US20210034329A1 (en) | Parallel rounding for conversion from binary floating point to binary coded decimal | |
CN113778523B (zh) | 一种数据处理方法、装置、电子设备及存储介质 | |
JP7241397B2 (ja) | 演算装置、演算方法、および演算プログラム | |
US11704092B2 (en) | High-precision anchored-implicit processing | |
RU2652460C1 (ru) | Способ организации выполнения операции умножения двух чисел в модулярно-индексном формате представления с плавающей точкой на универсальных многоядерных процессорах | |
US20230205838A1 (en) | System and method of tensor contraction for tensor networks | |
US20240202160A1 (en) | Processor, computer-readable recording medium storing instruction execution program, and information processing device | |
WO2022204620A2 (en) | Systems and methods for efficient accumulate and multiply-accumulate operations of floating-point numbers in a unified register file | |
KR20230159489A (ko) | 행렬 곱하기 동작들에 대한 행렬의 근사화 | |
TW202338601A (zh) | 執行指令以將輸入值從一種資料格式轉換為另一種資料格式之硬體裝置 | |
CN115016762A (zh) | 用于执行乘积累加运算的运算装置和运算方法 | |
CN118550500A (zh) | 处理电路及其操作方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20201007 |
|
RD12 | Notification of acceptance of power of sub attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7432 Effective date: 20200923 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210816 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20220502 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20220729 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220809 |
|
RD14 | Notification of resignation of power of sub attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7434 Effective date: 20220810 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220818 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7129138 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |