JP2019159566A - 計算装置 - Google Patents
計算装置 Download PDFInfo
- Publication number
- JP2019159566A JP2019159566A JP2018043217A JP2018043217A JP2019159566A JP 2019159566 A JP2019159566 A JP 2019159566A JP 2018043217 A JP2018043217 A JP 2018043217A JP 2018043217 A JP2018043217 A JP 2018043217A JP 2019159566 A JP2019159566 A JP 2019159566A
- Authority
- JP
- Japan
- Prior art keywords
- circuit
- memory
- module
- update
- output
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000015654 memory Effects 0.000 claims abstract description 365
- 230000006870 function Effects 0.000 claims description 143
- 238000005457 optimization Methods 0.000 abstract description 6
- 239000011159 matrix material Substances 0.000 description 33
- 239000000872 buffer Substances 0.000 description 11
- 238000010586 diagram Methods 0.000 description 11
- 230000010365 information processing Effects 0.000 description 11
- 241001442055 Vipera berus Species 0.000 description 5
- 239000004065 semiconductor Substances 0.000 description 4
- 238000000034 method Methods 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 101710092887 Integrator complex subunit 4 Proteins 0.000 description 2
- 102100037075 Proto-oncogene Wnt-3 Human genes 0.000 description 2
- 101100008052 Schizosaccharomyces pombe (strain 972 / ATCC 24843) cut8 gene Proteins 0.000 description 2
- 238000009825 accumulation Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 229940050561 matrix product Drugs 0.000 description 2
- 230000001360 synchronised effect Effects 0.000 description 2
- 230000002123 temporal effect Effects 0.000 description 2
- 101100059544 Arabidopsis thaliana CDC5 gene Proteins 0.000 description 1
- 101100498818 Arabidopsis thaliana DDR4 gene Proteins 0.000 description 1
- 101150115300 MAC1 gene Proteins 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 235000019580 granularity Nutrition 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/30—Arrangements for executing machine instructions, e.g. instruction decode
- G06F9/38—Concurrent instruction execution, e.g. pipeline or look ahead
- G06F9/3885—Concurrent instruction execution, e.g. pipeline or look ahead using a plurality of independent parallel functional units
- G06F9/3893—Concurrent instruction execution, e.g. pipeline or look ahead using a plurality of independent parallel functional units controlled in tandem, e.g. multiplier-accumulator
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F7/00—Methods or arrangements for processing data by operating upon the order or content of the data handled
- G06F7/38—Methods or arrangements for performing computations using exclusively denominational number representation, e.g. using binary, ternary, decimal representation
- G06F7/48—Methods or arrangements for performing computations using exclusively denominational number representation, e.g. using binary, ternary, decimal representation using non-contact-making devices, e.g. tube, solid state device; using unspecified devices
- G06F7/57—Arithmetic logic units [ALU], i.e. arrangements or devices for performing two or more of the operations covered by groups G06F7/483 – G06F7/556 or for performing logical operations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F7/00—Methods or arrangements for processing data by operating upon the order or content of the data handled
- G06F7/38—Methods or arrangements for performing computations using exclusively denominational number representation, e.g. using binary, ternary, decimal representation
- G06F7/48—Methods or arrangements for performing computations using exclusively denominational number representation, e.g. using binary, ternary, decimal representation using non-contact-making devices, e.g. tube, solid state device; using unspecified devices
- G06F7/544—Methods or arrangements for performing computations using exclusively denominational number representation, e.g. using binary, ternary, decimal representation using non-contact-making devices, e.g. tube, solid state device; using unspecified devices for evaluating functions by calculation
- G06F7/5443—Sum of products
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F7/00—Methods or arrangements for processing data by operating upon the order or content of the data handled
- G06F7/60—Methods or arrangements for performing computations using a digital non-denominational number representation, i.e. number representation without radix; Computing devices using combinations of denominational and non-denominational quantity representations, e.g. using difunction pulse trains, STEELE computers, phase computers
- G06F7/72—Methods or arrangements for performing computations using a digital non-denominational number representation, i.e. number representation without radix; Computing devices using combinations of denominational and non-denominational quantity representations, e.g. using difunction pulse trains, STEELE computers, phase computers using residue arithmetic
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/30—Arrangements for executing machine instructions, e.g. instruction decode
- G06F9/30003—Arrangements for executing specific machine instructions
- G06F9/30007—Arrangements for executing specific machine instructions to perform operations on data operands
- G06F9/3001—Arithmetic instructions
Landscapes
- Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Mathematical Optimization (AREA)
- Mathematical Analysis (AREA)
- Pure & Applied Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Computational Mathematics (AREA)
- Software Systems (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Logic Circuits (AREA)
- Complex Calculations (AREA)
- Memory System (AREA)
Abstract
Description
本願明細書と各図において、既出の図に関して前述したものと同様の要素には同一の符号を付して詳細な説明は適宜省略する。
図1は、第1実施形態に係る計算装置を示す模式図である。
図1に示すように、本実施形態に係る計算装置120は、第1メモリ11、第2メモリ12、第3メモリ13、第1演算モジュール21及び第2演算モジュール22を含む。これらのメモリは、例えば、保持部10に含まれる。これらの演算モジュールは、例えば、演算部20に含まれる。
計算装置120は、第1変数群{x}およびそれから計算される値を、インターフェース回路71から出力することができる。
図2(b)は、図2(a)に示す例のJX関数回路JXFで行われる演算を例示している。図3(b)は、図3(a)に示す例のJX関数回路JXFで行われる演算を例示している。
図4〜図6、図7(a)〜図7(c)、図8(a)〜図8(c)、図9(a)、図9(b)、図10、図11(a)、図11(b)、図12(a)及び図12(b)は、第1実施形態に係る計算装置を示す模式図である。
図13及び図14は、第1実施形態に係る計算装置における動作を例示する模式図である。
図13及び図14は、図2(a)及び図3(a)に示す例におけるタイムチャートに対応する。
図6に示すように、1つの積和モジュール22c(MAC演算モジュール)は、Pc個の乗算器MUL(乗算器MUL0〜MULPc−1)を含む。さらに、「Pc対1」の加算器ツリーADDtree(「add tree」)、及び、アキュムレータACCが設けられる。Pc個の乗算器MULのそれぞれにおいて、第1変数群{x}の1つ(第1変数xiなど)と、第1パラメータ群{J}の1つ(第1パラメータJi,jなど)と、の乗算が行われる。乗算の結果が、加算器ツリーADDtreeに出力される。加算器ツリーADtreeの出力が、アキュムレータACCに供給される。アキュムレータACCから、出力Aoutが出力される。
図7(a)に示すように、1つの例において、乗算器MULは、固定小数点乗算器または浮動小数点乗算器を含む。この構成は、例えば、「Xin」及び「Jin」の両方が、「INT](符号付き固定小数点)表現、または、「Float」(符号付き浮動小数点)表現の時に使用される。
図15は、第2実施形態に係る計算装置を例示する模式図である。
図15に示すように、本実施形態においては、JX演算及びFY演算が、Block0〜3の4つの部分(Block)に分割されて行われる。
図16に示す例において、例えば、1つの半導体チップ内に、複数のJXFXFYモジュールJXFXFYMが設けられる(チップ内分割)。複数のJXFXFYモジュールJXFXFYの1つは、Xmemと、Ymemと、Jmemと、JXモジュールJXMと、及び、FXFYモジュールFXFYMを含む。JXFXY0の、Xmem0、Ymem0及びJmem0は、BLOCK0に含まれる、X_B0データ、Y_B0データ、及び、J_B0データをそれぞれ保持する。JXFXY3の、Xmem3、Ymem3及びJmem3は、BLOCK3に含まれる、X_B3データ、Y_B3データ、及び、J_B3データをそれぞれ保持する。複数のJXFXFYモジュールJXFXFYMが、同時並列的に、複数のBlockにおける演算を行う。
図17に示す例では、複数の半導体チップに、JXFXFYモジュールが設けられる(マルチチップ実装)。複数の半導体チップは、相互接続配線により、互いに接続される。例えば、Chip0〜Chip3が設けられる。これらのチップのそれぞれに、第1メモリ11(Xmemメモリ及びX’memメモリ)、第2メモリ12(Ymemメモリ)、第3メモリ13(Jmemメモリ)、JXモジュールJXM、FXFYモジュールFXFYM、及び、Control Logic回路が設けられる。
これらの図は、複数のチップの相互接続配線による接続に関するいくつかの例を示している。相互接続配線には、BUS接続及びクロスバが含まれる。
図19(a)の例においては、JX演算の後で、FXFY演算が行われる。
図20に示すように、情報処理装置210は、計算装置120を含む。この例では、情報処理装置120に、複数の計算装置120が設けられる。シリアルリンク73は、例えば、複数の計算装置120を相互に接続する。
(構成1)
第1メモリと、
第2メモリと、
第3メモリと、
第1演算モジュールと、
第2演算モジュールと、
を備え、
前記第1メモリの出力端子は、前記第1演算モジュールの入力端子に接続され、
前記第1メモリの前記出力端子は、前記第2演算モジュールの入力端子に接続され、
前記第2メモリの出力端子は、前記第2演算モジュールの入力端子に接続され、
前記第3メモリの出力端子は、前記第2演算モジュールの入力端子に接続され、
前記第2演算モジュールの出力端子は、前記第1演算モジュールの入力端子に接続される、計算装置。
(構成2)
前記第2演算モジュールは、JX関数回路及びJX更新回路を含み、
記第1メモリの前記出力端子及び前記第3メモリの前記出力端子は、前記JX関数回路の入力端子に接続され、
前記JX関数回路の出力端子及び前記第2メモリの前記出力端子は、前記JX更新回路の入力端子に接続され、
前記JX更新回路の出力端子は、前記第1演算モジュールの入力端子に接続される、構成1記載の計算装置。
(構成3)
前記第2演算モジュールの前記出力端子は、前記JX更新回路の出力端子を含む、構成2記載の計算装置。
(構成4)
前記第1演算モジュールは、1または複数の回路セットを含み、
前記回路セットは、第1演算回路及び第2演算回路を含み、
前記第1演算回路は、FX関数回路及びFX更新回路を含み、
前記第2演算回路は、FY関数回路及びFY更新回路を含み、
前記FX関数回路の出力端子は、前記FX更新回路の入力端子に接続され、
前記FX更新回路の出力端子は、前記FY関数回路の入力端子に接続され、
前記FY関数回路の出力端子は、前記FY更新回路の入力端子に接続される、構成1〜3のいずれか1つに記載の計算装置。
(構成5)
前記第1演算モジュールは、モジュール入力端子1とモジュール入力端子2とモジュール出力端子1とモジュール出力端子2を含み、
前記モジュール入力端子1は前記FX関数回路の入力端子と前記FY更新回路の入力端子とに接続され、
前記モジュール入力端子2は前記FX更新回路の入力端子に接続され、
前記モジュール出力端子1は前記FY更新回路の出力端子に接続され、
前記モジュール出力端子2は前記FX更新回路の出力端子に接続され、
構成4記載の計算装置。
(構成6)
前記複数の回路セットが設けられ、
前記複数の回路セットの別の1つは、別の第1演算回路及び別の第2演算回路を含み、
前記別の第1演算回路は、別のFX関数回路及び別のFX更新回路を含み、
前記別の第2演算回路は、別のFY関数回路及び別のFY更新回路を含み、
前記別のFX関数回路の出力端子は、前記別のFX更新回路の入力端子に接続され、
前記別のFX更新回路の出力端子は、前記別のFY関数回路の入力端子に接続され、
前記別のFY関数回路の出力端子は、前記別のFY更新回路の入力端子に接続され、
前記FX更新回路の前記出力端子は、前記別のFX更新回路の入力端子に接続され、
前記FY更新回路の出力端子は、前記別のFX関数回路の入力端子と前記別のFY更新回路の入力端子とに接続される、構成5記載の計算装置。
(構成7)
前記第1演算モジュールは、1または複数の回路セットを含み、
前記回路セットは、第1演算回路及び第2演算回路を含み、
前記第1演算回路は、FX関数回路及びFX更新回路を含み、
前記第2演算回路は、FY関数回路及びFY更新回路を含み、
前記FY関数回路の出力端子は、前記FY更新回路の入力端子に接続され、
前記FY更新回路の出力端子は、前記FX関数回路の入力端子に接続され、
前記FX関数回路の出力端子は、前記FX更新回路の入力端子に接続される、構成1〜3のいずれか1つに記載の計算装置。
(構成8)
前記第1演算モジュールは、モジュール入力端子1とモジュール入力端子2とモジュール出力端子1とモジュール出力端子2を含み、
前記モジュール入力端子1は前記FY更新回路の入力端子に接続され、
前記モジュール入力端子2は前記FY関数回路の入力端子と前記FX更新回路の入力端子とに接続され、
前記モジュール出力端子1は前記FY更新回路の出力端子に接続され、
前記モジュール出力端子2は前記FX更新回路の出力端子に接続され、
構成7に記載の計算装置。
(構成9)
前記複数の回路セットが設けられ、
前記複数の回路セットの別の1つは、別の第1演算回路及び別の第2演算回路を含み、
前記別の第1演算回路は、別のFX関数回路及び別のFX更新回路を含み、
前記別の第2演算回路は、別のFY関数回路及び別のFY更新回路を含み、
前記別のFY関数回路の出力端子は、前記別のFY更新回路の入力端子に接続され、
前記別のFY更新回路の出力端子は、前記別のFX関数回路の入力端子に接続され、
前記別のFX関数回路の出力端子は、前記別のFX更新回路の入力端子に接続され、
前記FX更新回路の前記出力端子は、前記別のFY関数回路の入力端子と前記別のFX更新回路の入力端子に接続され、
前記FY更新回路の出力端子は、前記別のFY更新回路の入力端子に接続される、構成7記載の計算装置。
(構成10)
前記第2演算モジュールの前記出力は、前記FX更新回路に入力され、
前記第1メモリの前記出力は、前記FY更新回路に入力される、構成4〜9のいずれか1つに記載の計算装置。
(構成11)
前記第1演算モジュールの出力端子の一部は、前記第1メモリの入力端子に接続され、
前記第1演算モジュールの出力端子の別の一部は、前記第2メモリの入力端子に接続される、構成1〜10のいずれか1つに記載の計算装置。
(構成12)
前記第1メモリは、第1メモリ部分と、第2メモリ部分と、を含み、
前記第1メモリ部分が読み出し動作を実施している時に、前記第2メモリ部分が書き込み動作を実施し、
前記第2メモリ部分が読み出し動作を実施している時に、前記第1メモリ部分が書き込み動作を実施する、構成1〜11のいずれか1つに記載の計算装置。
(構成13)
前記第1メモリは、第1変数群{x}を保持し、
前記第2メモリは、第2変数群{y}を保持し、
前記第3メモリは、第1パラメータ群{J}を保持し、
前記第1変数群{x}は、N個(前記Nは2以上の整数)のi番目(iは1以上前記N以下の整数)の第1変数xiを含み、
前記第2変数群{y}は、前記N個のi番目(iは1以上前記N以下の整数)の第2変数yiを含み、
前記第1パラメータ群{J}は、N×N個の第1パラメータJl,m(前記lは1以上前記N以下の整数であり、前記mは1以上前記N以下の整数)を含み、
前記第1演算モジュールは、第1変数更新及び第1サブ更新を実施し、
前記第2演算モジュールは、第2サブ更新を実施し、
前記第1変数更新は、前記i番目の前記第1変数xiを前記i番目の前記第2変数yiに基づいて更新することを含み、
前記第1サブ更新は、前記i番目の前記第2変数yiを前記i番目の前記第1変数xiに基づいて更新することを含み、
前記第2サブ更新は、前記i番目の前記第2変数yiを前記第1パラメータ群{J}の少なくとも一部及び前記第1変数群{x}の少なくとも一部に基づいて更新することを含む、構成1〜12記載の計算装置。
(構成14)
前記第1演算モジュールは複数の乗算器を備え、
前記第2サブ更新に含まれる前記第1パラメータ群{J}の少なくとも一部及び前記第1変数群{x}の少なくとも一部に基づいて行う更新に含まれる乗算の内複数を、同一クロックにおいて実施する、構成1〜13のいずれか1つに記載の計算装置。
(構成15)
複数の第1配線、及び、複数の第2配線をさらに備え、
前記第1パラメータ群{J}は、N×N(Nは2以上の整数)の行列を含み、
前記第2モジュールは、Pr個(Prは2以上前記N以下の整数であり、前記Nの約数)の積和モジュールMACを含み、前記Pr個の積和モジュールの1つは、Pc個(Pcは2以上N以下の整数であり、前記Nの約数)の乗算器を含み、前記Prは、前記行列の行の並列度に対応し、前記Pcは、前記行列の列の並列度に対応し、
前記第1メモリは、前記第1メモリが前記Pc個に分割された前記Pc個の第1メモリブロックを含み、
前記第3メモリは、前記第3メモリが前記Pc個に分割された前記Pc個の第3メモリブロックを含み、
前記複数の第1配線の1つは、前記Pc個の前記第1メモリブロックの1つと、前記Pr個の前記積和モジュールの全てと、を接続し、
前記複数の第1配線の別の1つは、前記Pc個の前記第1メモリブロックの別の1つと、前記Pr個の前記積和モジュールの別の全てと、を接続し、
前記複数の第2配線の1つは、前記Pc個の前記第3メモリブロックの1つと、前記Pr個の前記積和モジュールの1つと、を接続し、
前記複数の第2配線の別の1つは、前記Pc個の前記第3メモリブロックの前記1つと、前記Pr個の前記積和モジュールの別の1つと、を接続する、構成1〜13のいずれか1つに記載の計算装置。
(構成16)
前記Pr個の前記積和モジュールの少なくとも1つは、復号器を含む乗算器、及び、データ型変換器を含む乗算器の少なくともいずれかを含む、構成15記載の計算装置。
(構成17)
第1グローバルメモリと、第0モジュールと、第1モジュールと、を備え、
前記第0モジュールは、
記第01メモリと、
第02メモリと、
第03メモリと、
第01演算モジュールと、
第02演算モジュールと、
を含み、
前記第01メモリの出力端子は、前記第01演算モジュールの入力端子に接続され、
前記第1グローバルメモリの出力端子は、前記第02演算モジュールの入力端子に接続され、
前記第02メモリの出力端子は、前記第02演算モジュールの入力端子に接続され、
前記第03メモリの出力端子は、前記第02演算モジュールの入力端子に接続され、
前記第02演算モジュールの出力端子は、前記第01演算モジュールの入力端子に接続され、
前記第01演算モジュールの出力端子の一部は、前記第01メモリの入力端子と前記第1グローバルメモリの入力端子とに接続され、
第1モジュールは、
第11メモリと、
第12メモリと、
第13メモリと、
第11演算モジュールと、
第12演算モジュールと、
を含み、
前記第11メモリの出力端子は、前記第11演算モジュールの入力端子に接続され、
前記第1グローバルメモリの出力端子は、前記第12演算モジュールの入力端子に接続され、
前記第12メモリの出力端子は、前記第12演算モジュールの入力端子に接続され、
前記第13メモリの出力端子は、前記第12演算モジュールの入力端子に接続され、
前記第12演算モジュールの出力端子は、前記第11演算モジュールの入力端子に接続され、
前記第11演算モジュールの出力端子の一部は、前記第11メモリの入力端子と前記第1グローバルメモリの入力端子とに接続される、計算装置。
(構成18)
第0チップと、第1チップと、相互接続配線と、を備え、
前記第0チップは、
第01メモリと、
第02メモリと、
第03メモリと、
第01演算モジュールと、
第02演算モジュールと、
第0チップ入力端子と、
第0チップ出力端子と、
を含み、
前記第01メモリは、第01ローカルメモリと第01グローバルメモリとを含み、
前記第01ローカルメモリの出力端子は、前記第01演算モジュールの入力端子に接続され、
前記第01グローバルメモリの出力端子は、前記第02演算モジュールの入力端子に接続され、
前記第02メモリの出力端子は、前記第02演算モジュールの入力端子に接続され、
前記第03メモリの出力端子は、前記第02演算モジュールの入力端子に接続され、
前記第02演算モジュールの出力端子は、前記第01演算モジュールの入力端子に接続され、
前記第01演算モジュールの出力端子の一部は、前記第01ローカルメモリの入力端子 と前記第0チップ出力端子とに接続され、
前記第0チップ入力端子は、前記第01グローバルメモリの入力端子に接続され、
前記第0チップ入力端子と前記第0チップ出力端子とは前記相互接続配線に接続され、
前記1モジュールは、
第11メモリと、
第12メモリと、
第13メモリと、
第11演算モジュールと、
第12演算モジュールと、
第1チップ入力端子と、
第1チップ出力端子と、
を含み、
前記第11メモリは、第11ローカルメモリと第11グローバルメモリとを含み、
前記第11ローカルメモリの出力端子は、前記第11演算モジュールの入力端子に接続され、
前記第11グローバルメモリの出力端子は、前記第12演算モジュールの入力端子に接続され、
前記第12メモリの出力端子は、前記第12演算モジュールの入力端子に接続され、
前記第13メモリの出力端子は、前記第12演算モジュールの入力端子に接続され、
前記第12演算モジュールの出力端子は、前記第11演算モジュールの入力端子に接続され、
前記第11演算モジュールの出力端子の一部は、前記第11ローカルメモリの入力端子と前記第1チップ出力端子とに接続され、
前記第1チップ入力端子は、前記第11グローバルメモリの入力端子に接続され、
前記第0チップ入力端子と前記第0チップ出力端子と前記第1チップ入力端子と前記第1チップ出力端子とは前記相互接続配線に接続される、計算装置。
図16に示す例において、例えば、1つの半導体チップ内に、複数のJXFXFYモジュールJXFXFYMが設けられる(チップ内分割)。複数のJXFXFYモジュールJXFXFYMの1つは、Xmemと、Ymemと、Jmemと、JXモジュールJXMと、及び、FXFYモジュールFXFYMを含む。JXFXY0の、Xmem0、Ymem0及びJmem0は、BLOCK0に含まれる、X_B0データ、Y_B0データ、及び、J_B0データをそれぞれ保持する。JXFXY3の、Xmem3、Ymem3及びJmem3は、BLOCK3に含まれる、X_B3データ、Y_B3データ、及び、J_B3データをそれぞれ保持する。複数のJXFXFYモジュールJXFXFYMが、同時並列的に、複数のBlockにおける演算を行う。
図20に示すように、情報処理装置210は、計算装置120を含む。この例では、情報処理装置210に、複数の計算装置120が設けられる。シリアルリンク73は、例えば、複数の計算装置120を相互に接続する。
(構成1)
第1メモリと、
第2メモリと、
第3メモリと、
第1演算モジュールと、
第2演算モジュールと、
を備え、
前記第1メモリの出力端子は、前記第1演算モジュールの入力端子に接続され、
前記第1メモリの前記出力端子は、前記第2演算モジュールの入力端子に接続され、
前記第2メモリの出力端子は、前記第2演算モジュールの入力端子に接続され、
前記第3メモリの出力端子は、前記第2演算モジュールの入力端子に接続され、
前記第2演算モジュールの出力端子は、前記第1演算モジュールの入力端子に接続される、計算装置。
(構成2)
前記第2演算モジュールは、JX関数回路及びJX更新回路を含み、
記第1メモリの前記出力端子及び前記第3メモリの前記出力端子は、前記JX関数回路の入力端子に接続され、
前記JX関数回路の出力端子及び前記第2メモリの前記出力端子は、前記JX更新回路の入力端子に接続され、
前記JX更新回路の出力端子は、前記第1演算モジュールの入力端子に接続される、構成1記載の計算装置。
(構成3)
前記第1演算モジュールは、1または複数の回路セットを含み、
前記回路セットは、第1演算回路及び第2演算回路を含み、
前記第1演算回路は、FX関数回路及びFX更新回路を含み、
前記第2演算回路は、FY関数回路及びFY更新回路を含み、
前記FX関数回路の出力端子は、前記FX更新回路の入力端子に接続され、
前記FX更新回路の出力端子は、前記FY関数回路の入力端子に接続され、
前記FY関数回路の出力端子は、前記FY更新回路の入力端子に接続される、構成1または2に記載の計算装置。
(構成4)
前記第1演算モジュールは、モジュール入力端子1とモジュール入力端子2とモジュール出力端子1とモジュール出力端子2を含み、
前記モジュール入力端子1は前記FX関数回路の入力端子と前記FY更新回路の入力端子とに接続され、
前記モジュール入力端子2は前記FX更新回路の入力端子に接続され、
前記モジュール出力端子1は前記FY更新回路の出力端子に接続され、
前記モジュール出力端子2は前記FX更新回路の出力端子に接続され、
構成3記載の計算装置。
(構成5)
前記複数の回路セットが設けられ、
前記複数の回路セットの別の1つは、別の第1演算回路及び別の第2演算回路を含み、
前記別の第1演算回路は、別のFX関数回路及び別のFX更新回路を含み、
前記別の第2演算回路は、別のFY関数回路及び別のFY更新回路を含み、
前記別のFX関数回路の出力端子は、前記別のFX更新回路の入力端子に接続され、
前記別のFX更新回路の出力端子は、前記別のFY関数回路の入力端子に接続され、
前記別のFY関数回路の出力端子は、前記別のFY更新回路の入力端子に接続され、
前記FX更新回路の前記出力端子は、前記別のFX更新回路の入力端子に接続され、
前記FY更新回路の出力端子は、前記別のFX関数回路の入力端子と前記別のFY更新回路の入力端子とに接続される、構成4記載の計算装置。
(構成6)
前記第1演算モジュールは、1または複数の回路セットを含み、
前記回路セットは、第1演算回路及び第2演算回路を含み、
前記第1演算回路は、FX関数回路及びFX更新回路を含み、
前記第2演算回路は、FY関数回路及びFY更新回路を含み、
前記FY関数回路の出力端子は、前記FY更新回路の入力端子に接続され、
前記FY更新回路の出力端子は、前記FX関数回路の入力端子に接続され、
前記FX関数回路の出力端子は、前記FX更新回路の入力端子に接続される、構成1または2に記載の計算装置。
(構成7)
前記第1演算モジュールは、モジュール入力端子1とモジュール入力端子2とモジュール出力端子1とモジュール出力端子2を含み、
前記モジュール入力端子1は前記FY更新回路の入力端子に接続され、
前記モジュール入力端子2は前記FY関数回路の入力端子と前記FX更新回路の入力端子とに接続され、
前記モジュール出力端子1は前記FY更新回路の出力端子に接続され、
前記モジュール出力端子2は前記FX更新回路の出力端子に接続され、
構成6記載の計算装置。
(構成8)
前記複数の回路セットが設けられ、
前記複数の回路セットの別の1つは、別の第1演算回路及び別の第2演算回路を含み、
前記別の第1演算回路は、別のFX関数回路及び別のFX更新回路を含み、
前記別の第2演算回路は、別のFY関数回路及び別のFY更新回路を含み、
前記別のFY関数回路の出力端子は、前記別のFY更新回路の入力端子に接続され、
前記別のFY更新回路の出力端子は、前記別のFX関数回路の入力端子に接続され、
前記別のFX関数回路の出力端子は、前記別のFX更新回路の入力端子に接続され、
前記FX更新回路の前記出力端子は、前記別のFY関数回路の入力端子と前記別のFX更新回路の入力端子に接続され、
前記FY更新回路の出力端子は、前記別のFY更新回路の入力端子に接続される、構成6記載の計算装置。
(構成9)
前記第2演算モジュールの前記出力は、前記FX更新回路に入力され、
前記第1メモリの前記出力は、前記FY更新回路に入力される、構成3〜8のいずれか1つに記載の計算装置。
(構成10)
前記第1演算モジュールの出力端子の一部は、前記第1メモリの入力端子に接続され、
前記第1演算モジュールの出力端子の別の一部は、前記第2メモリの入力端子に接続される、構成1〜9のいずれか1つに記載の計算装置。
(構成11)
前記第1メモリは、第1メモリ部分と、第2メモリ部分と、を含み、
前記第1メモリ部分が読み出し動作を実施している時に、前記第2メモリ部分が書き込み動作を実施し、
前記第2メモリ部分が読み出し動作を実施している時に、前記第1メモリ部分が書き込み動作を実施する、構成1〜10のいずれか1つに記載の計算装置。
(構成12)
前記第1メモリは、第1変数群{x}を保持し、
前記第2メモリは、第2変数群{y}を保持し、
前記第3メモリは、第1パラメータ群{J}を保持し、
前記第1変数群{x}は、N個(前記Nは2以上の整数)のi番目(iは1以上前記N以下の整数)の第1変数xiを含み、
前記第2変数群{y}は、前記N個のi番目(iは1以上前記N以下の整数)の第2変数yiを含み、
前記第1パラメータ群{J}は、N×N個の第1パラメータJl,m(前記lは1以上前記N以下の整数であり、前記mは1以上前記N以下の整数)を含み、
前記第1演算モジュールは、第1変数更新及び第1サブ更新を実施し、
前記第2演算モジュールは、第2サブ更新を実施し、
前記第1変数更新は、前記i番目の前記第1変数xiを前記i番目の前記第2変数yiに基づいて更新することを含み、
前記第1サブ更新は、前記i番目の前記第2変数yiを前記i番目の前記第1変数xiに基づいて更新することを含み、
前記第2サブ更新は、前記i番目の前記第2変数yiを前記第1パラメータ群{J}の少なくとも一部及び前記第1変数群{x}の少なくとも一部に基づいて更新することを含む、構成1〜11のいずれか1つに記載の計算装置。
(構成13)
前記第2演算モジュールは複数の乗算器を備え、
前記第2サブ更新に含まれる前記第1パラメータ群{J}の少なくとも一部及び前記第1変数群{x}の少なくとも一部に基づいて行う更新に含まれる乗算の内複数を、同一クロックにおいて実施する、構成12記載の計算装置。
(構成14)
複数の第1配線、及び、複数の第2配線をさらに備え、
前記第1パラメータ群{J}は、N×N(Nは2以上の整数)の行列を含み、
前記第2演算モジュールは、Pr個(Prは2以上前記N以下の整数であり、前記Nの約数)の積和モジュールを含み、前記Pr個の積和モジュールの1つは、Pc個(Pcは2以上N以下の整数であり、前記Nの約数)の乗算器を含み、前記Prは、前記行列の行の並列度に対応し、前記Pcは、前記行列の列の並列度に対応し、
前記第1メモリは、前記第1メモリが前記Pc個に分割された前記Pc個の第1メモリブロックを含み、
前記第3メモリは、前記第3メモリが前記Pc個に分割された前記Pc個の第3メモリブロックを含み、
前記複数の第1配線の1つは、前記Pc個の前記第1メモリブロックの1つと、前記Pr個の前記積和モジュールの全てと、を接続し、
前記複数の第1配線の別の1つは、前記Pc個の前記第1メモリブロックの別の1つと、前記Pr個の前記積和モジュールの別の全てと、を接続し、
前記複数の第2配線の1つは、前記Pc個の前記第3メモリブロックの1つと、前記Pr個の前記積和モジュールの1つと、を接続し、
前記複数の第2配線の別の1つは、前記Pc個の前記第3メモリブロックの前記1つと、前記Pr個の前記積和モジュールの別の1つと、を接続する、構成12または13に記載の計算装置。
(構成15)
前記Pr個の前記積和モジュールの少なくとも1つは、復号器を含む乗算器、及び、データ型変換器を含む乗算器の少なくともいずれかを含む、構成14記載の計算装置。
(構成16)
第1グローバルメモリと、第0モジュールと、第1モジュールと、を備え、
前記第0モジュールは、
第01メモリと、
第02メモリと、
第03メモリと、
第01演算モジュールと、
第02演算モジュールと、
を含み、
前記第01メモリの出力端子は、前記第01演算モジュールの入力端子に接続され、
前記第1グローバルメモリの出力端子は、前記第02演算モジュールの入力端子に接続され、
前記第02メモリの出力端子は、前記第02演算モジュールの入力端子に接続され、
前記第03メモリの出力端子は、前記第02演算モジュールの入力端子に接続され、
前記第02演算モジュールの出力端子は、前記第01演算モジュールの入力端子に接続され、
前記第01演算モジュールの出力端子の一部は、前記第01メモリの入力端子と前記第1グローバルメモリの入力端子とに接続され、
第1モジュールは、
第11メモリと、
第12メモリと、
第13メモリと、
第11演算モジュールと、
第12演算モジュールと、
を含み、
前記第11メモリの出力端子は、前記第11演算モジュールの入力端子に接続され、
前記第1グローバルメモリの出力端子は、前記第12演算モジュールの入力端子に接続され、
前記第12メモリの出力端子は、前記第12演算モジュールの入力端子に接続され、
前記第13メモリの出力端子は、前記第12演算モジュールの入力端子に接続され、
前記第12演算モジュールの出力端子は、前記第11演算モジュールの入力端子に接続され、
前記第11演算モジュールの出力端子の一部は、前記第11メモリの入力端子と前記第1グローバルメモリの入力端子とに接続される、計算装置。
(構成17)
第0チップと、第1チップと、相互接続配線と、を備え、
前記第0チップは、
第01メモリと、
第02メモリと、
第03メモリと、
第01演算モジュールと、
第02演算モジュールと、
第0チップ入力端子と、
第0チップ出力端子と、
を含み、
前記第01メモリは、第01ローカルメモリと第01グローバルメモリとを含み、
前記第01ローカルメモリの出力端子は、前記第01演算モジュールの入力端子に接続され、
前記第01グローバルメモリの出力端子は、前記第02演算モジュールの入力端子に接続され、
前記第02メモリの出力端子は、前記第02演算モジュールの入力端子に接続され、
前記第03メモリの出力端子は、前記第02演算モジュールの入力端子に接続され、
前記第02演算モジュールの出力端子は、前記第01演算モジュールの入力端子に接続され、
前記第01演算モジュールの出力端子の一部は、前記第01ローカルメモリの入力端子 と前記第0チップ出力端子とに接続され、
前記第0チップ入力端子は、前記第01グローバルメモリの入力端子に接続され、
前記第0チップ入力端子と前記第0チップ出力端子とは前記相互接続配線に接続され、
前記1チップは、
第11メモリと、
第12メモリと、
第13メモリと、
第11演算モジュールと、
第12演算モジュールと、
第1チップ入力端子と、
第1チップ出力端子と、
を含み、
前記第11メモリは、第11ローカルメモリと第11グローバルメモリとを含み、
前記第11ローカルメモリの出力端子は、前記第11演算モジュールの入力端子に接続され、
前記第11グローバルメモリの出力端子は、前記第12演算モジュールの入力端子に接続され、
前記第12メモリの出力端子は、前記第12演算モジュールの入力端子に接続され、
前記第13メモリの出力端子は、前記第12演算モジュールの入力端子に接続され、
前記第12演算モジュールの出力端子は、前記第11演算モジュールの入力端子に接続され、
前記第11演算モジュールの出力端子の一部は、前記第11ローカルメモリの入力端子と前記第1チップ出力端子とに接続され、
前記第1チップ入力端子は、前記第11グローバルメモリの入力端子に接続され、
前記第0チップ入力端子と前記第0チップ出力端子と前記第1チップ入力端子と前記第1チップ出力端子とは前記相互接続配線に接続される、計算装置。
Claims (12)
- 第1メモリと、
第2メモリと、
第3メモリと、
第1演算モジュールと、
第2演算モジュールと、
を備え、
前記第1メモリの出力は、前記第1演算モジュールに入力され、
前記第1メモリの前記出力は、前記第2演算モジュールに入力され、
前記第2メモリの出力は、前記第2演算モジュールに入力され、
前記第3メモリの出力は、前記第2演算モジュールに入力され、
前記第2演算モジュールの出力は、前記第1演算モジュールに入力される、計算装置。 - 前記第2演算モジュールは、JX関数回路及びJX更新回路を含み、
記第1メモリの前記出力及び前記第3メモリの前記出力は、前記JX関数回路に入力され、
前記JX関数回路の出力及び前記第2メモリの前記出力は、前記JX更新回路に入力され、
前記JX更新回路の出力は、前記第1演算モジュールに入力される、請求項1記載の計算装置。 - 前記第2演算モジュールの前記出力は、前記JX更新回路の出力を含む、請求項2記載の計算装置。
- 前記第1演算モジュールは、1または複数の回路セットを含み、
前記回路セットは、第1演算回路及び第2演算回路を含み、
前記第1演算回路は、FX関数回路及びFX更新回路を含み、
前記第2演算回路は、FY関数回路及びFY更新回路を含み、
前記FX関数回路の出力は、前記FX更新回路に入力され、
前記FX更新回路の出力は、前記FY関数回路に入力され、
前記FY関数回路の出力は、前記FY更新回路に入力される、請求項1〜3のいずれか1つに記載の計算装置。 - 前記複数の回路セットが設けられ、
前記複数の回路セットの別の1つは、別の第1演算回路及び別の第2演算回路を含み、
前記別の第1演算回路は、別のFX関数回路及び別のFX更新回路を含み、
前記別の第2演算回路は、別のFY関数回路及び別のFY更新回路を含み、
前記別のFX関数回路の出力は、前記別のFX更新回路に入力され、
前記別のFX更新回路の出力は、前記別のFY関数回路に入力され、
前記別のFY関数回路の出力は、前記別のFY更新回路に入力され、
前記FX更新回路の前記出力は、前記別のFX更新回路に入力され、
前記FY更新回路の出力は、前記別のFY更新回路に入力される、請求項4記載の計算装置。 - 前記第2演算モジュールの前記出力は、前記FX更新回路に入力され、
前記第1メモリの前記出力は、前記FY更新回路に入力される、請求項4または5に記載の計算装置。 - 前記第1演算モジュールは、1または複数の回路セットを含み、
前記回路セットは、第1演算回路及び第2演算回路を含み、
前記第1演算回路は、FX関数回路及びFX更新回路を含み、
前記第2演算回路は、FY関数回路及びFY更新回路を含み、
前記FY関数回路の出力は、前記FY更新回路に入力され、
前記FY更新回路の出力は、前記FX関数回路に入力され、
前記FX関数回路の出力は、前記FX更新回路に入力される、請求項1〜3のいずれか1つに記載の計算装置。 - 前記複数の回路セットが設けられ、
前記複数の回路セットの別の1つは、別の第1演算回路及び別の第2演算回路を含み、
前記別の第1演算回路は、別のFX関数回路及び別のFX更新回路を含み、
前記別の第2演算回路は、別のFY関数回路及び別のFY更新回路を含み、
前記別のFY関数回路の出力は、前記別のFY更新回路に入力され、
前記別のFY更新回路の出力は、前記別のFX関数回路に入力され、
前記別のFX関数回路の出力は、前記別のFX更新回路に入力され、
前記FY更新回路の前記出力は、前記別のFY更新回路に入力され、
前記FX更新回路の出力は、前記別のFX更新回路に入力される、請求項7記載の計算装置。 - 前記第2演算モジュールの前記出力は、前記FX更新回路に入力され、
前記第1メモリの前記出力は、前記FY更新回路に入力される、請求項7または8に記載の計算装置。 - 前記第1演算モジュールの出力の一部は、前記第1メモリに入力され、
前記第1演算モジュールの出力の別の一部は、前記第2メモリに入力される、請求項1〜9のいずれか1つに記載の計算装置。 - 前記第1メモリは、第1メモリ部分と、第2メモリ部分と、を含み、
前記第1メモリ部分が読み出し動作を実施している時に、前記第2メモリ部分が書き込み動作を実施し、
前記第2メモリ部分が読み出し動作を実施している時に、前記第1メモリ部分が書き込み動作を実施する、請求項1〜10のいずれか1つに記載の計算装置。 - 前記第1メモリは、第1変数群{x}を保持し、
前記第2メモリは、第2変数群{y}を保持し、
前記第3メモリは、第1パラメータ群{J}を保持し、
前記第1変数群{x}は、N個(前記Nは2以上の整数)のi番目(iは1以上前記N以下の整数)の第1変数xiを含み、
前記第2変数群{y}は、前記N個のi番目(iは1以上前記N以下の整数)の第2変数yiを含み、
前記第1パラメータ群{J}は、N×N個の第1パラメータJl,m(前記lは1以上前記N以下の整数であり、前記mは1以上前記N以下の整数)を含み、
前記第1演算モジュールは、第1変数更新及び第1サブ更新を実施し、
前記第2演算モジュールは、第2サブ更新を実施し、
前記第1変数更新は、前記i番目の前記第1変数xiを前記i番目の前記第2変数yiに基づいて更新することを含み、
前記第1サブ更新は、前記i番目の前記第2変数yiを前記i番目の前記第1変数xiに基づいて更新することを含み、
前記第2サブ更新は、前記i番目の前記第2変数yiを前記第1パラメータ群{J}の少なくとも一部及び前記第1変数群{x}の少なくとも一部に基づいて更新することを含む、請求項1〜11記載の計算装置。
Priority Applications (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018043217A JP6820875B2 (ja) | 2018-03-09 | 2018-03-09 | 計算装置 |
US16/118,646 US10817304B2 (en) | 2018-03-09 | 2018-08-31 | Calculating device |
US17/027,744 US11640303B2 (en) | 2018-03-09 | 2020-09-22 | Calculating device |
US18/187,514 US20230221962A1 (en) | 2018-03-09 | 2023-03-21 | Calculating device |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018043217A JP6820875B2 (ja) | 2018-03-09 | 2018-03-09 | 計算装置 |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020205993A Division JP7072041B2 (ja) | 2020-12-11 | 2020-12-11 | 計算装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2019159566A true JP2019159566A (ja) | 2019-09-19 |
JP6820875B2 JP6820875B2 (ja) | 2021-01-27 |
Family
ID=67842609
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018043217A Active JP6820875B2 (ja) | 2018-03-09 | 2018-03-09 | 計算装置 |
Country Status (2)
Country | Link |
---|---|
US (3) | US10817304B2 (ja) |
JP (1) | JP6820875B2 (ja) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2021044844A1 (ja) | 2019-09-02 | 2021-03-11 | 三菱マテリアル株式会社 | 銅/セラミックス接合体、及び、絶縁回路基板 |
US11093581B2 (en) | 2018-09-18 | 2021-08-17 | Kabushiki Kaisha Toshiba | Optimization problem solving calculation apparatus |
US11244239B2 (en) | 2019-10-08 | 2022-02-08 | Kabushiki Kaisha Toshiba | Search device, search method, computer program product, search system, and arbitrage system |
EP3955175A1 (en) | 2020-08-13 | 2022-02-16 | Kabushiki Kaisha Toshiba | Information processing system using an ising model |
EP4386583A1 (en) | 2022-12-12 | 2024-06-19 | Kabushiki Kaisha Toshiba | Information processing device, information processing method, and computer program |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007522699A (ja) * | 2003-12-29 | 2007-08-09 | ザイリンクス インコーポレイテッド | カスケード接続するdspスライスを備えた集積回路 |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4789957A (en) * | 1986-03-28 | 1988-12-06 | Texas Instruments Incorporated | Status output for a bit slice ALU |
JP2003015704A (ja) | 2001-06-29 | 2003-01-17 | Aie Research Inc | 最適化計算方法、最適化システムおよびプログラム |
US7865542B2 (en) * | 2003-12-29 | 2011-01-04 | Xilinx, Inc. | Digital signal processing block having a wide multiplexer |
JP6445246B2 (ja) | 2014-03-27 | 2018-12-26 | 株式会社日立製作所 | 情報処理装置及び情報処理方法 |
JP5865456B1 (ja) | 2014-08-29 | 2016-02-17 | 株式会社日立製作所 | 半導体装置 |
JP6444920B2 (ja) | 2016-03-15 | 2018-12-26 | 株式会社東芝 | 計算装置および計算方法 |
US10481870B2 (en) * | 2017-05-12 | 2019-11-19 | Google Llc | Circuit to perform dual input value absolute value and sum operation |
JP6836529B2 (ja) | 2018-02-23 | 2021-03-03 | 株式会社東芝 | 計算装置、計算プログラム、記録媒体及び計算方法 |
-
2018
- 2018-03-09 JP JP2018043217A patent/JP6820875B2/ja active Active
- 2018-08-31 US US16/118,646 patent/US10817304B2/en active Active
-
2020
- 2020-09-22 US US17/027,744 patent/US11640303B2/en active Active
-
2023
- 2023-03-21 US US18/187,514 patent/US20230221962A1/en active Pending
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007522699A (ja) * | 2003-12-29 | 2007-08-09 | ザイリンクス インコーポレイテッド | カスケード接続するdspスライスを備えた集積回路 |
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11093581B2 (en) | 2018-09-18 | 2021-08-17 | Kabushiki Kaisha Toshiba | Optimization problem solving calculation apparatus |
US11720645B2 (en) | 2018-09-18 | 2023-08-08 | Kabushiki Kaisha Toshiba | Optimization problem solving calculation apparatus |
US12105769B2 (en) | 2018-09-18 | 2024-10-01 | Kabushiki Kaisha Toshiba | Optimization problem solving calculation apparatus |
WO2021044844A1 (ja) | 2019-09-02 | 2021-03-11 | 三菱マテリアル株式会社 | 銅/セラミックス接合体、及び、絶縁回路基板 |
US11244239B2 (en) | 2019-10-08 | 2022-02-08 | Kabushiki Kaisha Toshiba | Search device, search method, computer program product, search system, and arbitrage system |
US11610146B2 (en) | 2019-10-08 | 2023-03-21 | Kabushiki Kaisha Toshiba | Search device, search method, computer program product, search system, and arbitrage system |
US11803770B2 (en) | 2019-10-08 | 2023-10-31 | Kabushiki Kaisha Toshiba | Search device, search method, computer program product, search system, and arbitrage system |
US12086736B2 (en) | 2019-10-08 | 2024-09-10 | Kabushiki Kaisha Toshiba | Search device, search method, computer program product, search system, and arbitrage system |
EP3955175A1 (en) | 2020-08-13 | 2022-02-16 | Kabushiki Kaisha Toshiba | Information processing system using an ising model |
US11816595B2 (en) | 2020-08-13 | 2023-11-14 | Kabushiki Kaisha Toshiba | Information processing system |
EP4386583A1 (en) | 2022-12-12 | 2024-06-19 | Kabushiki Kaisha Toshiba | Information processing device, information processing method, and computer program |
Also Published As
Publication number | Publication date |
---|---|
US20230221962A1 (en) | 2023-07-13 |
US11640303B2 (en) | 2023-05-02 |
JP6820875B2 (ja) | 2021-01-27 |
US20190278610A1 (en) | 2019-09-12 |
US10817304B2 (en) | 2020-10-27 |
US20210004238A1 (en) | 2021-01-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6820875B2 (ja) | 計算装置 | |
US8051124B2 (en) | High speed and efficient matrix multiplication hardware module | |
US11487845B2 (en) | Convolutional operation device with dimensional conversion | |
US11017290B2 (en) | Signal processing module, especially for a neural network and a neuronal circuit | |
JP4484756B2 (ja) | リコンフィギュラブル回路および処理装置 | |
US11750195B2 (en) | Compute dataflow architecture | |
JP2015056124A (ja) | 行列演算装置 | |
US11907681B2 (en) | Semiconductor device and method of controlling the semiconductor device | |
JP6003744B2 (ja) | 演算処理装置及び演算処理方法 | |
US11429850B2 (en) | Performing consecutive mac operations on a set of data using different kernels in a MAC circuit | |
JP7436724B2 (ja) | 計算装置 | |
JP7072041B2 (ja) | 計算装置 | |
EP4155901A1 (en) | Systems and methods for sparsity operations in a specialized processing block | |
Jayaraman et al. | Hypersort: High-performance Parallel Sorting on HBM-enabled FPGA | |
US7007059B1 (en) | Fast pipelined adder/subtractor using increment/decrement function with reduced register utilization | |
JP2024036567A5 (ja) | 回路情報 | |
Kim et al. | CiFHER: A Chiplet-Based FHE Accelerator with a Resizable Structure | |
CN114186679A (zh) | 一种基于fpga的卷积神经网络加速器及其优化方法 | |
Le | A new general purpose systolic array for matrix computations | |
Swarztrauber | The Communication Machine | |
Inakagata et al. | ASPE: an Abstraction Framework using ALU Arrays for Scalable Multiple FPGAs System |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20180807 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20190815 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20200527 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20200805 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20201001 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20201207 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20210105 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 6820875 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |