JP6159825B2 - ハードウェアポインタを使用したsimdコア内での分岐ブランチに対するソリューション - Google Patents
ハードウェアポインタを使用したsimdコア内での分岐ブランチに対するソリューション Download PDFInfo
- Publication number
- JP6159825B2 JP6159825B2 JP2015555422A JP2015555422A JP6159825B2 JP 6159825 B2 JP6159825 B2 JP 6159825B2 JP 2015555422 A JP2015555422 A JP 2015555422A JP 2015555422 A JP2015555422 A JP 2015555422A JP 6159825 B2 JP6159825 B2 JP 6159825B2
- Authority
- JP
- Japan
- Prior art keywords
- execution
- instructions
- given
- stored
- size
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F8/00—Arrangements for software engineering
- G06F8/40—Transformation of program code
- G06F8/41—Compilation
- G06F8/44—Encoding
- G06F8/445—Exploiting fine grain parallelism, i.e. parallelism at instruction level
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/30—Arrangements for executing machine instructions, e.g. instruction decode
- G06F9/30003—Arrangements for executing specific machine instructions
- G06F9/3005—Arrangements for executing specific machine instructions to perform operations for flow control
- G06F9/30058—Conditional branch instructions
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/30—Arrangements for executing machine instructions, e.g. instruction decode
- G06F9/32—Address formation of the next instruction, e.g. by incrementing the instruction counter
- G06F9/321—Program or instruction counter, e.g. incrementing
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/30—Arrangements for executing machine instructions, e.g. instruction decode
- G06F9/32—Address formation of the next instruction, e.g. by incrementing the instruction counter
- G06F9/322—Address formation of the next instruction, e.g. by incrementing the instruction counter for non-sequential address
- G06F9/323—Address formation of the next instruction, e.g. by incrementing the instruction counter for non-sequential address for indirect branch instructions
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/30—Arrangements for executing machine instructions, e.g. instruction decode
- G06F9/38—Concurrent instruction execution, e.g. pipeline or look ahead
- G06F9/3802—Instruction prefetching
- G06F9/3804—Instruction prefetching for branches, e.g. hedging, branch folding
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/30—Arrangements for executing machine instructions, e.g. instruction decode
- G06F9/38—Concurrent instruction execution, e.g. pipeline or look ahead
- G06F9/3836—Instruction issuing, e.g. dynamic instruction scheduling or out of order instruction execution
- G06F9/3851—Instruction issuing, e.g. dynamic instruction scheduling or out of order instruction execution from multiple instruction streams, e.g. multistreaming
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/30—Arrangements for executing machine instructions, e.g. instruction decode
- G06F9/38—Concurrent instruction execution, e.g. pipeline or look ahead
- G06F9/3836—Instruction issuing, e.g. dynamic instruction scheduling or out of order instruction execution
- G06F9/3853—Instruction issuing, e.g. dynamic instruction scheduling or out of order instruction execution of compound instructions
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/30—Arrangements for executing machine instructions, e.g. instruction decode
- G06F9/38—Concurrent instruction execution, e.g. pipeline or look ahead
- G06F9/3885—Concurrent instruction execution, e.g. pipeline or look ahead using a plurality of independent parallel functional units
- G06F9/3887—Concurrent instruction execution, e.g. pipeline or look ahead using a plurality of independent parallel functional units controlled by a single instruction for multiple data lanes [SIMD]
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/30—Arrangements for executing machine instructions, e.g. instruction decode
- G06F9/38—Concurrent instruction execution, e.g. pipeline or look ahead
- G06F9/3885—Concurrent instruction execution, e.g. pipeline or look ahead using a plurality of independent parallel functional units
- G06F9/3887—Concurrent instruction execution, e.g. pipeline or look ahead using a plurality of independent parallel functional units controlled by a single instruction for multiple data lanes [SIMD]
- G06F9/38873—Iterative single instructions for multiple data lanes [SIMD]
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/30—Arrangements for executing machine instructions, e.g. instruction decode
- G06F9/38—Concurrent instruction execution, e.g. pipeline or look ahead
- G06F9/3885—Concurrent instruction execution, e.g. pipeline or look ahead using a plurality of independent parallel functional units
- G06F9/3889—Concurrent instruction execution, e.g. pipeline or look ahead using a plurality of independent parallel functional units controlled by multiple instructions, e.g. MIMD, decoupled access or execute
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Software Systems (AREA)
- General Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Advance Control (AREA)
- Devices For Executing Special Programs (AREA)
- Executing Machine-Instructions (AREA)
Description
Claims (18)
- 単一命令複数データ(SIMD)マイクロアーキテクチャ内の複数の並列実行レーンと、
複数のプログラムカウンタ(PC)レジスタと、
所与の超大命令語(VLIW)内の1つ以上の命令をフェッチするように構成された制御ロジックと、
識別子(ID)を格納するビット範囲を複数備えたベクトルレジスタと、
を備え、
前記PCレジスタは、前記1つ以上の命令のうち何れかの命令をポイントしているポインタ値を格納するものであり、
各ビット範囲は、前記複数の実行レーンのうち対応する実行レーンと関連付けられており、
前記ビット範囲に格納されている前記IDは、前記複数のPCレジスタのうち何れかのPCレジスタを識別するものであり、
前記実行レーンのそれぞれは、前記所与のVLIW内の前記1つ以上の命令のうち、当該実行レーンに関連付けられた前記ビット範囲に格納されている前記IDにより識別される、前記PCレジスタに格納されている前記ポインタ値によりポイントされる命令を実行することを、前記複数の実行レーンにおいて同時に実行する、
プロセッサ。 - 処理されるVLIWのサイズを格納するように構成されたサイズレジスタをさらに備える、請求項1に記載のプロセッサ。
- 前記ベクトルレジスタの前記ビット範囲に格納される前記IDの有効な値としてありうる、互いに異なる値の数は、前記サイズレジスタに格納されたサイズと等しい、請求項2に記載のプロセッサ。
- 前記制御ロジックは、
前記サイズレジスタに格納されたサイズに等しい数のフェッチされた命令を復号することと、
前記復号された命令のうち所与の命令を、少なくとも、前記複数の実行レーンのうち所与の実行レーンと関連付けられた前記ベクトルレジスタに格納されたIDと、前記複数のPCレジスタに格納された対応するポインタ値と、に基づいて、前記所与の実行レーンに割り当てることと、
を行うようにさらに構成されている、請求項2に記載のプロセッサ。 - 前記複数の実行レーンのうち関連付けられた実行レーンは、資源に依存しない複数の命令をポイントしている前記複数のPCレジスタのうち所与のPCレジスタに応じて、前記資源に依存しない複数の命令を同時に実行するようにさらに構成されている、請求項4に記載のプロセッサ。
- 前記制御ロジックは、ループの終わりに達している前記複数の実行レーンのうち所与の実行レーンに応じて、
前記所与の実行レーンが、前記ループの開始に分岐して戻るようにスケジューリングされているという実行時の判断に応じて、前記ベクトルレジスタ内の対応するビット範囲内にスリープ状態を書き込むことと、
前記所与の実行レーンが、前記ループの外部に分岐するようにスケジューリングされているという実行時の判断に応じて、前記ベクトルレジスタ内の前記対応するビット範囲内に終了状態を書き込むことと、
を行うようにさらに構成されている、請求項4に記載のプロセッサ。 - 前記制御ロジックは、前記スリープ状態または前記終了状態にある前記所与の実行レーンに応じて、
前記所与の実行レーンの実行を停止することと、
少なくとも次のプログラムカウンタ(PC)と、所与のトレースに関する作業項目識別子(ID)と、を格納することと、
を行うようにさらに構成されている、請求項6に記載のプロセッサ。 - 前記制御ロジックは、前記複数の実行レーンの各実行レーンが、前記スリープ状態または前記終了状態にあるという判断に応じて、それぞれ格納された次のPCに分岐することによって、実行レーンごとの実行を再開するようにさらに構成されている、請求項7に記載のプロセッサ。
- 前記制御ロジックは、前記複数の実行レーンの各実行レーンが停止されており、且つ、少なくとも1つの実行レーンが、別の実行レーンと異なる状態であることに応じて、それぞれ格納された次のPCに分岐することによって、スリープ状態にある実行レーンのみ実行を再開するようにさらに構成されている、請求項8に記載のプロセッサ。
- コンピュータシステムの少なくとも1つのプロセッサによる実行のために構成された少なくとも1つのプログラムを格納しているコンピュータ可読記憶媒体であって、前記少なくとも1つのプログラムは、
ループ内の分岐点に応じて、超大命令語(VLIW)のサイズを設定することと、
ループ内の分岐点に応じて、単一命令複数データ(SIMD)マイクロアーキテクチャ内の複数の実行レーンのそれぞれに、前記VLIW内の1つ以上の命令のうち何れかの命令を割り当てて実行させるかを判断することと、を
実行させるためのものであり、
前記判断することは、
実行レーンのそれぞれに関連付けられたインデックスを設定することと、
実行レーンのそれぞれ毎に、前記VLIW内の前記1つ以上の命令のうち、当該実行レーンに関連付けられた前記インデックスにより識別される、複数のプログラムカウンタ(PC)ポインタ値のうち何れかのPCポインタ値によりポイントされる命令を、当該実行レーンに割り当てて実行させると判断することを含むものである、
コンピュータ可読記憶媒体。 - 前記実行レーンのそれぞれに関連付けられたインデックスを設定することは、
実行レーンのそれぞれ毎に、前記分岐点における当該実行レーンでの分岐方向に基づいて、当該実行レーンに関連付けられたインデックスを設定することを含むものである、請求項10に記載のコンピュータ可読記憶媒体。 - ループ内の分岐点に応じて、超大命令語(VLIW)のサイズを設定することは、
当該分岐点のあとにおいて、VLIWのそれぞれに含まれる命令の数を、前記サイズとして設定することを含むものである、請求項11に記載のコンピュータ可読記憶媒体。 - 前記少なくとも1つのプログラムは、さらに、
前記複数のPCポインタ値のうち、設定された前記サイズが示す数の前記PCポインタ値のそれぞれを、前記サイズを有する前記VLIW内の、前記サイズが示す数の命令のうち何れかの命令をポイントする値となるように更新することと、
実行レーンのそれぞれ毎に、当該実行レーンに関連付けられた前記インデックスを更新することと、を
実行させるためのものである、請求項12に記載のコンピュータ可読記憶媒体。 - ベクトルレジスタ内の各フィールドのそれぞれに、識別子(ID)を格納することと、
複数のPCレジスタのそれぞれに、超大命令語(VLIW)内の1つ以上の命令のうち何れかの命令をポイントするポインタ値を格納することと、
超大命令語(VLIW)内の1つ以上の命令をフェッチすることと、
単一命令複数データ(SIMD)マイクロアーキテクチャ内の複数の実行レーンのそれぞれに、前記VLIW内の前記1つ以上の命令のうち何れかの命令を割り当てて実行させることと、を含み、
前記ベクトルレジスタ内の各フィールドは、前記複数の実行レーンのうち対応する実行レーンと関連付けられており、
前記フィールドに格納されている前記IDは、前記複数のPCレジスタのうち何れかのPCレジスタを識別するものであり、
前記割り当てて実行させることは、
実行レーンのそれぞれ毎に、前記VLIW内の前記1つ以上の命令のうち、当該実行レーンに関連付けられた前記フィールドに格納されている前記IDにより識別される、前記PCレジスタに格納されている前記ポインタ値によりポイントされる命令を、当該実行レーンに割り当てて実行させることを、複数の実行レーンにおいて同時に行うものである、
方法。 - 処理されるVLIWのサイズを格納することをさらに含む、請求項14に記載の方法。
- 前記ベクトルレジスタ内の前記フィールドに格納される前記IDの有効な値としてありうる、互いに異なる値の数は、前記格納されたサイズと等しい、請求項15に記載の方法。
- 前記格納されたサイズに等しい数のフェッチされた命令を復号することと、
前記復号された命令のうち所与の命令を、少なくとも、前記複数の実行レーンのうち所与のレーンと関連付けられた前記ベクトルレジスタに格納されたIDと、前記複数のPCレジスタに格納された対応するポインタ値と、に基づいて、前記所与の実行レーンに割り当てることと、
をさらに含む、請求項15に記載の方法。 - 前記複数のPCレジスタのうち所与のPCレジスタが、資源に依存しない複数の命令をポイントしていることを検出したことに応じて、前記資源に依存しない複数の命令を、前記複数の実行レーンのうち関連付けられた実行レーンで同時に実行することをさらに含む、請求項17に記載の方法。
Applications Claiming Priority (3)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| US13/753,113 US9639371B2 (en) | 2013-01-29 | 2013-01-29 | Solution to divergent branches in a SIMD core using hardware pointers |
| US13/753,113 | 2013-01-29 | ||
| PCT/US2014/013474 WO2014120703A1 (en) | 2013-01-29 | 2014-01-29 | Solution to divergent branches in a simd core using hardware pointers |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2016508640A JP2016508640A (ja) | 2016-03-22 |
| JP6159825B2 true JP6159825B2 (ja) | 2017-07-05 |
Family
ID=51224343
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2015555422A Active JP6159825B2 (ja) | 2013-01-29 | 2014-01-29 | ハードウェアポインタを使用したsimdコア内での分岐ブランチに対するソリューション |
Country Status (6)
| Country | Link |
|---|---|
| US (1) | US9639371B2 (ja) |
| EP (1) | EP2951681B1 (ja) |
| JP (1) | JP6159825B2 (ja) |
| KR (1) | KR101702651B1 (ja) |
| CN (1) | CN105051680B (ja) |
| WO (1) | WO2014120703A1 (ja) |
Families Citing this family (24)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US9697003B2 (en) * | 2013-06-07 | 2017-07-04 | Advanced Micro Devices, Inc. | Method and system for yield operation supporting thread-like behavior |
| US9582321B2 (en) * | 2013-11-08 | 2017-02-28 | Swarm64 As | System and method of data processing |
| US9292269B2 (en) * | 2014-01-31 | 2016-03-22 | Nvidia Corporation | Control flow optimization for efficient program code execution on a processor |
| US9348595B1 (en) | 2014-12-22 | 2016-05-24 | Centipede Semi Ltd. | Run-time code parallelization with continuous monitoring of repetitive instruction sequences |
| US10180841B2 (en) | 2014-12-22 | 2019-01-15 | Centipede Semi Ltd. | Early termination of segment monitoring in run-time code parallelization |
| KR101624636B1 (ko) | 2015-03-03 | 2016-05-27 | 주식회사 에이디칩스 | 명령어 패치 장치 및 방법 |
| US9208066B1 (en) * | 2015-03-04 | 2015-12-08 | Centipede Semi Ltd. | Run-time code parallelization with approximate monitoring of instruction sequences |
| US10296350B2 (en) | 2015-03-31 | 2019-05-21 | Centipede Semi Ltd. | Parallelized execution of instruction sequences |
| US10296346B2 (en) | 2015-03-31 | 2019-05-21 | Centipede Semi Ltd. | Parallelized execution of instruction sequences based on pre-monitoring |
| US9715390B2 (en) | 2015-04-19 | 2017-07-25 | Centipede Semi Ltd. | Run-time parallelization of code execution based on an approximate register-access specification |
| EP3106982B1 (en) * | 2015-06-18 | 2021-03-10 | ARM Limited | Determination of branch convergence in a sequence of program instructions |
| US10585623B2 (en) | 2015-12-11 | 2020-03-10 | Vivante Corporation | Software defined FIFO buffer for multithreaded access |
| JP6167193B1 (ja) * | 2016-01-25 | 2017-07-19 | 株式会社ドワンゴ | プロセッサ |
| US10474468B2 (en) * | 2017-02-22 | 2019-11-12 | Advanced Micro Devices, Inc. | Indicating instruction scheduling mode for processing wavefront portions |
| US10620994B2 (en) | 2017-05-30 | 2020-04-14 | Advanced Micro Devices, Inc. | Continuation analysis tasks for GPU task scheduling |
| US10990394B2 (en) * | 2017-09-28 | 2021-04-27 | Intel Corporation | Systems and methods for mixed instruction multiple data (xIMD) computing |
| US10877757B2 (en) * | 2017-11-14 | 2020-12-29 | Nvidia Corporation | Binding constants at runtime for improved resource utilization |
| KR102406340B1 (ko) * | 2018-02-26 | 2022-06-13 | 에스케이하이닉스 주식회사 | 전자 장치 및 그것의 동작 방법 |
| US12099867B2 (en) | 2018-05-30 | 2024-09-24 | Advanced Micro Devices, Inc. | Multi-kernel wavefront scheduler |
| CN110716750B (zh) * | 2018-07-11 | 2025-05-30 | 超威半导体公司 | 用于部分波前合并的方法和系统 |
| FR3084187B1 (fr) * | 2018-07-18 | 2021-01-01 | Commissariat Energie Atomique | Procede d'acceleration de l'execution d'un programme a chemin unique par execution en parallele de sequences conditionnellement concurrentes |
| US11061681B2 (en) | 2019-07-25 | 2021-07-13 | International Business Machines Corporation | Instruction streaming using copy select vector |
| CN113885877B (zh) * | 2021-10-11 | 2025-09-09 | 北京超弦存储器研究院 | 编译的方法、装置、设备及介质 |
| US20250306946A1 (en) * | 2024-03-27 | 2025-10-02 | Advanced Micro Devices, Inc. | Independent progress of lanes in a vector processor |
Family Cites Families (23)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| EP0374419A3 (en) | 1988-12-21 | 1991-04-10 | International Business Machines Corporation | Method and apparatus for efficient loop constructs in hardware and microcode |
| JPH07239780A (ja) * | 1994-01-06 | 1995-09-12 | Motohiro Kurisu | 1クロック可変長命令実行処理型命令読み込み電子計 算機 |
| GB2311882B (en) | 1996-04-04 | 2000-08-09 | Videologic Ltd | A data processing management system |
| US5838984A (en) | 1996-08-19 | 1998-11-17 | Samsung Electronics Co., Ltd. | Single-instruction-multiple-data processing using multiple banks of vector registers |
| US6003128A (en) | 1997-05-01 | 1999-12-14 | Advanced Micro Devices, Inc. | Number of pipeline stages and loop length related counter differential based end-loop prediction |
| US5898865A (en) | 1997-06-12 | 1999-04-27 | Advanced Micro Devices, Inc. | Apparatus and method for predicting an end of loop for string instructions |
| US6157988A (en) | 1997-08-01 | 2000-12-05 | Micron Technology, Inc. | Method and apparatus for high performance branching in pipelined microsystems |
| US6032252A (en) | 1997-10-28 | 2000-02-29 | Advanced Micro Devices, Inc. | Apparatus and method for efficient loop control in a superscalar microprocessor |
| US6366999B1 (en) | 1998-01-28 | 2002-04-02 | Bops, Inc. | Methods and apparatus to support conditional execution in a VLIW-based array processor with subword execution |
| US6490673B1 (en) | 1998-11-27 | 2002-12-03 | Matsushita Electric Industrial Co., Ltd | Processor, compiling apparatus, and compile program recorded on a recording medium |
| JP2000259579A (ja) | 1999-03-11 | 2000-09-22 | Hitachi Ltd | 半導体集積回路 |
| CN100367730C (zh) | 2001-02-14 | 2008-02-06 | 克利尔斯皮德科技有限公司 | 一种互连系统 |
| JP3796124B2 (ja) * | 2001-03-07 | 2006-07-12 | 株式会社ルネサステクノロジ | スレッド間優先度可変プロセッサ |
| US6986025B2 (en) * | 2001-06-11 | 2006-01-10 | Broadcom Corporation | Conditional execution per lane |
| US7159103B2 (en) | 2003-03-24 | 2007-01-02 | Infineon Technologies Ag | Zero-overhead loop operation in microprocessor having instruction buffer |
| US7124318B2 (en) | 2003-09-18 | 2006-10-17 | International Business Machines Corporation | Multiple parallel pipeline processor having self-repairing capability |
| US7366885B1 (en) | 2004-06-02 | 2008-04-29 | Advanced Micro Devices, Inc. | Method for optimizing loop control of microcoded instructions |
| US7814487B2 (en) | 2005-04-26 | 2010-10-12 | Qualcomm Incorporated | System and method of executing program threads in a multi-threaded processor |
| US7330964B2 (en) * | 2005-11-14 | 2008-02-12 | Texas Instruments Incorporated | Microprocessor with independent SIMD loop buffer |
| JP2008090744A (ja) | 2006-10-04 | 2008-04-17 | Matsushita Electric Ind Co Ltd | プロセッサおよびオブジェクトコード生成装置 |
| US7937574B2 (en) | 2007-07-17 | 2011-05-03 | Advanced Micro Devices, Inc. | Precise counter hardware for microcode loops |
| CN102043755B (zh) | 2009-10-22 | 2012-12-05 | 财团法人工业技术研究院 | 可重组态处理装置及其系统 |
| EP2624126B1 (en) | 2011-04-07 | 2016-11-02 | VIA Technologies, Inc. | Efficient conditional ALU instruction in read-port limited register file microprocessor |
-
2013
- 2013-01-29 US US13/753,113 patent/US9639371B2/en active Active
-
2014
- 2014-01-29 EP EP14746501.7A patent/EP2951681B1/en active Active
- 2014-01-29 CN CN201480013689.XA patent/CN105051680B/zh active Active
- 2014-01-29 WO PCT/US2014/013474 patent/WO2014120703A1/en not_active Ceased
- 2014-01-29 KR KR1020157023117A patent/KR101702651B1/ko active Active
- 2014-01-29 JP JP2015555422A patent/JP6159825B2/ja active Active
Also Published As
| Publication number | Publication date |
|---|---|
| EP2951681A1 (en) | 2015-12-09 |
| CN105051680B (zh) | 2018-08-14 |
| CN105051680A (zh) | 2015-11-11 |
| EP2951681B1 (en) | 2018-11-14 |
| US9639371B2 (en) | 2017-05-02 |
| JP2016508640A (ja) | 2016-03-22 |
| WO2014120703A1 (en) | 2014-08-07 |
| KR101702651B1 (ko) | 2017-02-03 |
| EP2951681A4 (en) | 2016-12-07 |
| US20140215187A1 (en) | 2014-07-31 |
| KR20150111990A (ko) | 2015-10-06 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP6159825B2 (ja) | ハードウェアポインタを使用したsimdコア内での分岐ブランチに対するソリューション | |
| JP6236093B2 (ja) | 並列パイプラインにおいてブランチを分岐するためのハードウェアおよびソフトウェアソリューション | |
| EP2710467B1 (en) | Automatic kernel migration for heterogeneous cores | |
| US9600288B1 (en) | Result bypass cache | |
| US20120331278A1 (en) | Branch removal by data shuffling | |
| US20080250227A1 (en) | General Purpose Multiprocessor Programming Apparatus And Method | |
| US20090240931A1 (en) | Indirect Function Call Instructions in a Synchronous Parallel Thread Processor | |
| EP2707797A1 (en) | Automatic load balancing for heterogeneous cores | |
| US20100250564A1 (en) | Translating a comprehension into code for execution on a single instruction, multiple data (simd) execution | |
| CN107038019A (zh) | 单指令多数据计算系统中处理指令的方法及计算系统 | |
| US20130067196A1 (en) | Vectorization of machine level scalar instructions in a computer program during execution of the computer program | |
| US20090133022A1 (en) | Multiprocessing apparatus, system and method | |
| US20170315807A1 (en) | Hardware support for dynamic data types and operators | |
| Jammer | Characterization and translation of OpenMP use cases to MPI using LLVM | |
| Masuda et al. | Software and Hardware Design Issues for Low Complexity High Performance Processor Architecture | |
| Schaffer | Design and Implementation of a Multithreaded Associative SIMD Processor | |
| Berr | Efficient Simulation of PRAM Algorithms on Shared Memory Machines | |
| Aßmann | Efficient Execution of Functional Programs | |
| 王昊 et al. | A GCC Vectorizer based Instruction Translating Method for An Array Accelerator |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20160127 |
|
| A871 | Explanation of circumstances concerning accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A871 Effective date: 20160127 |
|
| A975 | Report on accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A971005 Effective date: 20160222 |
|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20160622 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20160802 |
|
| A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20161101 |
|
| A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20161228 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20170202 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20170516 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20170612 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 6159825 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |