JP2018521427A - 可変レーンアーキテクチャのためのシステムおよび方法 - Google Patents
可変レーンアーキテクチャのためのシステムおよび方法 Download PDFInfo
- Publication number
- JP2018521427A JP2018521427A JP2018504845A JP2018504845A JP2018521427A JP 2018521427 A JP2018521427 A JP 2018521427A JP 2018504845 A JP2018504845 A JP 2018504845A JP 2018504845 A JP2018504845 A JP 2018504845A JP 2018521427 A JP2018521427 A JP 2018521427A
- Authority
- JP
- Japan
- Prior art keywords
- computing nodes
- computing
- node
- task
- memory
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 15
- 239000013598 vector Substances 0.000 claims abstract description 51
- 239000000872 buffer Substances 0.000 claims description 59
- 230000004044 response Effects 0.000 claims description 5
- 230000008520 organization Effects 0.000 claims description 4
- 238000012545 processing Methods 0.000 description 38
- 238000010586 diagram Methods 0.000 description 22
- 238000004364 calculation method Methods 0.000 description 17
- 230000004888 barrier function Effects 0.000 description 6
- 238000003672 processing method Methods 0.000 description 5
- 230000006870 function Effects 0.000 description 4
- 230000003139 buffering effect Effects 0.000 description 3
- 230000006872 improvement Effects 0.000 description 3
- 230000001360 synchronised effect Effects 0.000 description 3
- 230000009471 action Effects 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 230000008521 reorganization Effects 0.000 description 2
- 230000003044 adaptive effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000007334 memory performance Effects 0.000 description 1
- 230000000644 propagated effect Effects 0.000 description 1
- 238000013468 resource allocation Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/30—Arrangements for executing machine instructions, e.g. instruction decode
- G06F9/38—Concurrent instruction execution, e.g. pipeline or look ahead
- G06F9/3867—Concurrent instruction execution, e.g. pipeline or look ahead using instruction pipelines
- G06F9/3869—Implementation aspects, e.g. pipeline latches; pipeline synchronisation and clocking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/30—Arrangements for executing machine instructions, e.g. instruction decode
- G06F9/30003—Arrangements for executing specific machine instructions
- G06F9/30007—Arrangements for executing specific machine instructions to perform operations on data operands
- G06F9/30036—Instructions to perform operations on packed data, e.g. vector, tile or matrix operations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/30—Arrangements for executing machine instructions, e.g. instruction decode
- G06F9/30003—Arrangements for executing specific machine instructions
- G06F9/3004—Arrangements for executing specific machine instructions to perform operations on memory
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/30—Arrangements for executing machine instructions, e.g. instruction decode
- G06F9/38—Concurrent instruction execution, e.g. pipeline or look ahead
- G06F9/3836—Instruction issuing, e.g. dynamic instruction scheduling or out of order instruction execution
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/30—Arrangements for executing machine instructions, e.g. instruction decode
- G06F9/38—Concurrent instruction execution, e.g. pipeline or look ahead
- G06F9/3836—Instruction issuing, e.g. dynamic instruction scheduling or out of order instruction execution
- G06F9/3851—Instruction issuing, e.g. dynamic instruction scheduling or out of order instruction execution from multiple instruction streams, e.g. multistreaming
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/30—Arrangements for executing machine instructions, e.g. instruction decode
- G06F9/38—Concurrent instruction execution, e.g. pipeline or look ahead
- G06F9/3877—Concurrent instruction execution, e.g. pipeline or look ahead using a slave processor, e.g. coprocessor
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/30—Arrangements for executing machine instructions, e.g. instruction decode
- G06F9/38—Concurrent instruction execution, e.g. pipeline or look ahead
- G06F9/3885—Concurrent instruction execution, e.g. pipeline or look ahead using a plurality of independent parallel functional units
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/30—Arrangements for executing machine instructions, e.g. instruction decode
- G06F9/38—Concurrent instruction execution, e.g. pipeline or look ahead
- G06F9/3885—Concurrent instruction execution, e.g. pipeline or look ahead using a plurality of independent parallel functional units
- G06F9/3887—Concurrent instruction execution, e.g. pipeline or look ahead using a plurality of independent parallel functional units controlled by a single instruction for multiple data lanes [SIMD]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/30—Arrangements for executing machine instructions, e.g. instruction decode
- G06F9/38—Concurrent instruction execution, e.g. pipeline or look ahead
- G06F9/3885—Concurrent instruction execution, e.g. pipeline or look ahead using a plurality of independent parallel functional units
- G06F9/3893—Concurrent instruction execution, e.g. pipeline or look ahead using a plurality of independent parallel functional units controlled in tandem, e.g. multiplier-accumulator
- G06F9/3895—Concurrent instruction execution, e.g. pipeline or look ahead using a plurality of independent parallel functional units controlled in tandem, e.g. multiplier-accumulator for complex operations, e.g. multidimensional or interleaved address generators, macros
- G06F9/3897—Concurrent instruction execution, e.g. pipeline or look ahead using a plurality of independent parallel functional units controlled in tandem, e.g. multiplier-accumulator for complex operations, e.g. multidimensional or interleaved address generators, macros with adaptable data path
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/48—Program initiating; Program switching, e.g. by interrupt
- G06F9/4806—Task transfer initiation or dispatching
- G06F9/4843—Task transfer initiation or dispatching by program, e.g. task dispatcher, supervisor, operating system
- G06F9/4881—Scheduling strategies for dispatcher, e.g. round robin, multi-level priority queues
Landscapes
- Engineering & Computer Science (AREA)
- Software Systems (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Multimedia (AREA)
- Advance Control (AREA)
- Multi Processors (AREA)
- Devices For Executing Special Programs (AREA)
Abstract
Description
本出願は、2016年7月26日に出願され、「System and Method for Variable Lane Architecture」と題する、米国特許通常出願第15/220,067号の利益を主張し、第15/220,067号は、2015年7月30日に出願された米国仮特許出願第62/198,886号に対する優先権を主張し、それらの出願は参照により本明細書に組み込まれる。
102 ポイント
104 ポイント
200 処理システム
202 グローバルプログラムコントローラユニット(GPCU)
204 ベクトル命令パイプライン
206 メモリ
300 処理システム
302 コンピューティングノード
304 命令バッファ
306 データバッファ
400 処理システム
402 命令バッファ
404 データバッファ
500 処理システム
502 制御ユニット
504 ベクトル命令パイプライン
512 GPCU
514 スケジューラコア
516 超長命令語(VLIW)バンドルディスパッチユニット
518 データアドレス生成および編成(DAGO)ユニット
520 VLIWバンドルおよびデータアドレスキュー
522 DMAコントローラ
532 命令ルータ
534 RIMDコンピューティングノード
536 メモリサブバンク
538 スマートルータおよびプリフィッチャユニット
600 RIMDコンピューティングノード
602 RIMDインターフェース
604 キュー
606 ローカルプログラム制御ユニット(LPCU)
608 計算ユニット
610 データバッファ
612 命令バッファ
614 入力データバッファ
700 タイミング図
800 RIMD処理方法
900 処理システム
902 プロセッサ
904 メモリ
906 インターフェース
908 インターフェース
910 インターフェース
Claims (20)
- メモリバンク内に位置するメモリブロックと、
タスクを実行するためのベクトル命令パイプラインを形成する1つまたは複数のコンピューティングノードであって、前記コンピューティングノードの各々が前記メモリバンク内に位置し、前記コンピューティングノードの各々が前記コンピューティングノードのうちの他のコンピューティングノードと無関係に前記タスクの一部分を実行する、コンピューティングノードと、
前記タスクを実行するためのスカラー命令パイプラインを形成するグローバルプログラムコントローラユニット(GPCU)であって、前記GPCUが前記コンピューティングノードのうちの1つまたは複数において前記タスク用の命令をスケジュールするように構成され、前記GPCUが前記コンピューティングノードの各々によって使用される前記メモリブロック用のアドレスを前記コンピューティングノードにディスパッチするようにさらに構成される、GPCUと
を備える、プロセッサ。 - 前記コンピューティングノードがコンピューティングノードの複数のサブセットを備え、コンピューティングノードの前記複数のサブセットの各々が、異なる期間の間に前記タスクの異なる部分を実行する、請求項1に記載のプロセッサ。
- コンピューティングノードの前記複数のサブセットの各々が、コンピューティングノードの前記複数のサブセットの各々にディスパッチされた前記アドレスによって指定された前記メモリブロックにアクセスする、請求項2に記載のプロセッサ。
- 前記コンピューティングノードにスケジュールされた前記タスク用の命令を受け取るように構成された命令キュー
をさらに備える、請求項1から3のいずれか一項に記載のプロセッサ。 - 前記1つまたは複数のコンピューティングノードの各コンピューティングノードが、
前記コンピューティングノードにスケジュールされた前記タスクの一部分用の命令を受け取るように構成された命令キューと、
前記命令を実行するための計算ユニットと、
前記計算ユニットからの前記命令を実行した結果を記憶するように構成された結果キューと、
前記計算ユニットが前記命令キューからの前記命令の実行を完了すると、前記GPCUに通知するように構成されたローカルプログラムコントローラユニット(LPCU)と
を備える、請求項1から4のいずれか一項に記載のプロセッサ。 - 前記GPCUが、コンピューティングノードが前記コンピューティングノードの前記命令キュー内の前記命令の実行を完了したことの通知を受け取ると、前記コンピューティングノードにおいて前記タスク用のさらなる命令をスケジュールするようにさらに構成される、請求項5に記載のプロセッサ。
- 前記GPCUが前記タスク用のすべての命令を実施するようにさらに構成される、請求項1から6のいずれか一項に記載のプロセッサ。
- 前記1つまたは複数のコンピューティングノードが、各々、同時に異なる命令を実施する、請求項1から7のいずれか一項に記載のプロセッサ。
- 前記コンピューティングノードのうちの第2のコンピューティングノードから、前記コンピューティングノードのうちの第1のコンピューティングノードによって必要とされるデータをプリフェッチするように構成されたアービトレータをさらに備える、請求項1から8のいずれか一項に記載のプロセッサ。
- 前記GPCUが、前記タスクが完了すると、前記コンピューティングノードを同期させるようにさらに構成される、請求項1から9のいずれか一項に記載のプロセッサ。
- 前記コンピューティングノードのサブセットが前記タスク用にスケジュールされ、前記コンピューティングノードのうちのスケジュールされていないコンピューティングノードが、前記タスクの実行中に電源を切られる、請求項1から10のいずれか一項に記載のプロセッサ。
- タスク用のプログラムコードを受信するステップと、
前記タスクを実施するように複数のコンピューティングノードを割り当てるステップと、
前記複数のコンピューティングノードの各々に前記プログラムコード用の第1のフェッチパケットおよび前記第1のフェッチパケット用の第1のそれぞれのデータポインタをディスパッチするステップと、
各ノードが前記ノードにディスパッチされた前記第1のフェッチパケットの実行を完了することに応答して、前記複数のコンピューティングノードの各ノードからビートを受け取るステップと、
前記受け取ったビートに従って前記複数のコンピューティングノードにより前記プログラムコードの実行を追跡するステップと
を備える、方法。 - 前記受け取ったビートに従って前記複数のコンピューティングノードを同期させるステップをさらに備える、請求項12に記載の方法。
- 前記第1のフェッチパケットおよび前記第1のそれぞれのデータポインタをディスパッチするステップが、前記複数のコンピューティングノードの各々のためのバッファに前記第1のフェッチパケットおよび前記第1のそれぞれのデータポインタをキューイングするステップを備える、請求項12から13のいずれか一項に記載の方法。
- 前記バッファ内の前記第1のフェッチパケットを実行するステップと、
前記第1のフェッチパケット用の前記第1のそれぞれのデータポインタによって示されたメモリにアクセスするステップと
をさらに備える、請求項14に記載の方法。 - 前記複数のコンピューティングノードの各ノードにより、前記ノード用の前記バッファ内の前記第1のフェッチパケットのうちの1つを完了することに応答して、前記ビートを送るステップをさらに備える、請求項14に記載の方法。
- 前記プログラムコードの前記実行を追跡するステップが、
前記複数のコンピューティングノードの各ノードから受け取ったビートの数をカウントするステップと、
カウントされたビートの前記数がしきい値を超えることに応答して、前記複数のコンピューティングノードの各々に、前記プログラムコード用の第2のフェッチパケットおよび前記第2のフェッチパケット用の第2のそれぞれのデータポインタをディスパッチするステップと
を備える、請求項12から16のいずれか一項に記載の方法。 - 前記複数のコンピューティングノードの隣接コンピューティングノードから、前記複数のコンピューティングノードの第1のコンピューティングノードにデータを供給するステップをさらに備える、請求項12から17のいずれか一項に記載の方法。
- 第1のタスク用のプログラムコードを復号するように構成された超長命令語(VLIW)バンドルディスパッチャと、
前記プログラムコード用のデータポインタを割り当てるように構成されたデータアドレス生成および編成(DAGO)ユニットと、
複数のコンピューティングノードに結合されるように構成されたスケジューラであって、前記スケジューラが、前記プログラムコードを実行するように前記複数のコンピューティングノードを割り振るように構成され、前記スケジューラが、前記複数のコンピューティングノードの第1のサブセットに第1のスレッドを割り振り、前記複数のコンピューティングノードの第2のサブセットに第2のスレッドを割り振るように構成される、スケジューラと
を備える、プログラム制御ユニット。 - 前記VLIWバンドルディスパッチャが、前記第1のタスク用の前記プログラムコードが完了したことの通知を前記複数のコンピューティングノードから受け取るようにさらに構成され、前記スケジュールが、第2のタスク用のプログラムコードを実行するように前記複数のコンピューティングノードを割り振るようにさらに構成される、請求項19に記載のプログラム制御ユニット。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201562198886P | 2015-07-30 | 2015-07-30 | |
US62/198,886 | 2015-07-30 | ||
US15/220,067 | 2016-07-26 | ||
US15/220,067 US10691463B2 (en) | 2015-07-30 | 2016-07-26 | System and method for variable lane architecture |
PCT/CN2016/091922 WO2017016486A1 (en) | 2015-07-30 | 2016-07-27 | System and method for variable lane architecture |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2018521427A true JP2018521427A (ja) | 2018-08-02 |
Family
ID=57882420
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018504845A Pending JP2018521427A (ja) | 2015-07-30 | 2016-07-27 | 可変レーンアーキテクチャのためのシステムおよび方法 |
Country Status (5)
Country | Link |
---|---|
US (2) | US10691463B2 (ja) |
EP (1) | EP3320429B1 (ja) |
JP (1) | JP2018521427A (ja) |
CN (1) | CN107924309B (ja) |
WO (1) | WO2017016486A1 (ja) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10331445B2 (en) * | 2017-05-24 | 2019-06-25 | Microsoft Technology Licensing, Llc | Multifunction vector processor circuits |
CN109861781B (zh) * | 2017-11-30 | 2021-02-12 | 华为技术有限公司 | 接口传输方法、装置及设备 |
GB2575289B (en) * | 2018-07-04 | 2020-09-16 | Graphcore Ltd | Streaming engine |
CN112099768B (zh) * | 2020-08-04 | 2024-02-23 | 北京奇艺世纪科技有限公司 | 业务流程处理方法、装置及计算机可读存储介质 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0635875A (ja) * | 1992-05-22 | 1994-02-10 | Internatl Business Mach Corp <Ibm> | コンピュータ・システム |
JPH11306149A (ja) * | 1998-04-16 | 1999-11-05 | Sony Corp | 並列演算処理装置およびその方法 |
JPH11306037A (ja) * | 1998-04-16 | 1999-11-05 | Sony Corp | 並列演算処理装置およびその方法 |
JP2003091415A (ja) * | 2001-09-17 | 2003-03-28 | Sanyo Electric Co Ltd | データ処理方法と装置およびデータ変換方法 |
US20060206641A1 (en) * | 2003-04-25 | 2006-09-14 | Klein Dean A | Active memory data compression system and method |
JP2010271930A (ja) * | 2009-05-21 | 2010-12-02 | Toshiba Corp | マルチコアプロセッサシステム |
JP2013054625A (ja) * | 2011-09-06 | 2013-03-21 | Toyota Motor Corp | 情報処理装置、情報処理方法 |
Family Cites Families (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5588152A (en) | 1990-11-13 | 1996-12-24 | International Business Machines Corporation | Advanced parallel processor including advanced support hardware |
US6026478A (en) | 1997-08-01 | 2000-02-15 | Micron Technology, Inc. | Split embedded DRAM processor |
US6807614B2 (en) | 2001-07-19 | 2004-10-19 | Shine C. Chung | Method and apparatus for using smart memories in computing |
JP3708853B2 (ja) | 2001-09-03 | 2005-10-19 | 松下電器産業株式会社 | マルチプロセッサシステムおよびプログラム制御方法 |
CN1142484C (zh) | 2001-11-28 | 2004-03-17 | 中国人民解放军国防科学技术大学 | 微处理器向量处理方法 |
GB2399900B (en) | 2003-03-27 | 2005-10-05 | Micron Technology Inc | Data reording processor and method for use in an active memory device |
US7472392B2 (en) | 2003-04-23 | 2008-12-30 | Micron Technology, Inc. | Method for load balancing an n-dimensional array of parallel processing elements |
US7673102B2 (en) | 2006-05-17 | 2010-03-02 | Qualcomm Incorporated | Method and system for maximum residency replacement of cache memory |
US7676647B2 (en) | 2006-08-18 | 2010-03-09 | Qualcomm Incorporated | System and method of processing data using scalar/vector instructions |
US8180998B1 (en) | 2007-09-10 | 2012-05-15 | Nvidia Corporation | System of lanes of processing units receiving instructions via shared memory units for data-parallel or task-parallel operations |
US7873869B2 (en) | 2008-10-09 | 2011-01-18 | International Business Machines Corporation | Checkpointing a hybrid architecture computing system |
US7979844B2 (en) * | 2008-10-14 | 2011-07-12 | Edss, Inc. | TICC-paradigm to build formally verified parallel software for multi-core chips |
CN102695249B (zh) | 2011-03-23 | 2014-10-08 | 北京天地互连信息技术有限公司 | IPv6无线传感器网络节能方法 |
CN102156637A (zh) | 2011-05-04 | 2011-08-17 | 中国人民解放军国防科学技术大学 | 向量交叉多线程处理方法及向量交叉多线程微处理器 |
US9146747B2 (en) | 2013-08-08 | 2015-09-29 | Linear Algebra Technologies Limited | Apparatus, systems, and methods for providing configurable computational imaging pipeline |
US9336142B2 (en) * | 2013-11-06 | 2016-05-10 | International Business Machines Corporation | Cache configured to log addresses of high-availability data via a non-blocking channel |
CN104778080A (zh) | 2014-01-14 | 2015-07-15 | 中兴通讯股份有限公司 | 基于协处理器的作业调度处理方法及装置 |
CN104199801A (zh) | 2014-08-26 | 2014-12-10 | 山东超越数控电子有限公司 | 一种基于龙芯服务器的高性能计算集群的实现方法 |
-
2016
- 2016-07-26 US US15/220,067 patent/US10691463B2/en active Active
- 2016-07-27 EP EP16829851.1A patent/EP3320429B1/en active Active
- 2016-07-27 JP JP2018504845A patent/JP2018521427A/ja active Pending
- 2016-07-27 CN CN201680044636.3A patent/CN107924309B/zh active Active
- 2016-07-27 WO PCT/CN2016/091922 patent/WO2017016486A1/en active Application Filing
-
2020
- 2020-05-18 US US16/876,995 patent/US10884756B2/en active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0635875A (ja) * | 1992-05-22 | 1994-02-10 | Internatl Business Mach Corp <Ibm> | コンピュータ・システム |
JPH11306149A (ja) * | 1998-04-16 | 1999-11-05 | Sony Corp | 並列演算処理装置およびその方法 |
JPH11306037A (ja) * | 1998-04-16 | 1999-11-05 | Sony Corp | 並列演算処理装置およびその方法 |
JP2003091415A (ja) * | 2001-09-17 | 2003-03-28 | Sanyo Electric Co Ltd | データ処理方法と装置およびデータ変換方法 |
US20060206641A1 (en) * | 2003-04-25 | 2006-09-14 | Klein Dean A | Active memory data compression system and method |
JP2010271930A (ja) * | 2009-05-21 | 2010-12-02 | Toshiba Corp | マルチコアプロセッサシステム |
JP2013054625A (ja) * | 2011-09-06 | 2013-03-21 | Toyota Motor Corp | 情報処理装置、情報処理方法 |
Also Published As
Publication number | Publication date |
---|---|
WO2017016486A1 (en) | 2017-02-02 |
EP3320429A1 (en) | 2018-05-16 |
CN107924309B (zh) | 2021-03-23 |
US10691463B2 (en) | 2020-06-23 |
US10884756B2 (en) | 2021-01-05 |
EP3320429B1 (en) | 2023-05-31 |
US20200278869A1 (en) | 2020-09-03 |
CN107924309A (zh) | 2018-04-17 |
US20170031689A1 (en) | 2017-02-02 |
EP3320429A4 (en) | 2018-07-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10884756B2 (en) | System and method for variable lane architecture | |
US20230168897A1 (en) | System Having a Hybrid Threading Processor, a Hybrid Threading Fabric Having Configurable Computing Elements, and a Hybrid Interconnection Network | |
KR102263078B1 (ko) | 복수-타일 복수-칩 프로세싱 구성에서의 동기화 | |
JP6722251B2 (ja) | マルチタイル処理アレイにおける同期化 | |
Han et al. | Microsecond-scale preemption for concurrent {GPU-accelerated}{DNN} inferences | |
US10445271B2 (en) | Multi-core communication acceleration using hardware queue device | |
Ausavarungnirun et al. | Exploiting inter-warp heterogeneity to improve GPGPU performance | |
JP6797879B2 (ja) | 命令セット | |
KR20190044571A (ko) | 칩 밖으로 데이터 송신하기 | |
KR20190044565A (ko) | 호스트 프로세서와의 동기화 | |
KR20210030282A (ko) | 게이트웨이 상의 호스트 프록시 | |
US9405711B2 (en) | On-chip traffic prioritization in memory | |
US20200285580A1 (en) | Speculative memory activation | |
CN103197953A (zh) | 推测执行和回滚 | |
US8863099B2 (en) | Compilation and placement of instructions in a memory system | |
Liu et al. | Barrier-aware warp scheduling for throughput processors | |
JP2021528929A (ja) | データ通過ゲートウェイ | |
KR20160081815A (ko) | 데이터 관리 메커니즘을 구비하는 전자 시스템 및 그것의 동작 방법 | |
Sun et al. | HPSO: Prefetching based scheduling to improve data locality for MapReduce clusters | |
Wu et al. | Switchflow: preemptive multitasking for deep learning | |
Ausavarungnirun | Techniques for shared resource management in systems with throughput processors | |
Lin et al. | GPU performance vs. thread-level parallelism: Scalability analysis and a novel way to improve TLP | |
Khan et al. | Data locality in Hadoop cluster systems | |
KR20210023904A (ko) | 스트리밍 엔진 | |
Xu et al. | Application-aware NoC management in GPUs multitasking |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20180309 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20181126 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20181221 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190322 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20190722 |