JP2005310167A - マルチスカラ拡張におけるアドレスマップを最適化するための方法及び機器 - Google Patents
マルチスカラ拡張におけるアドレスマップを最適化するための方法及び機器 Download PDFInfo
- Publication number
- JP2005310167A JP2005310167A JP2005125341A JP2005125341A JP2005310167A JP 2005310167 A JP2005310167 A JP 2005310167A JP 2005125341 A JP2005125341 A JP 2005125341A JP 2005125341 A JP2005125341 A JP 2005125341A JP 2005310167 A JP2005310167 A JP 2005310167A
- Authority
- JP
- Japan
- Prior art keywords
- memory
- data
- location
- functional
- processing unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 48
- 238000007667 floating Methods 0.000 claims description 4
- 230000008569 process Effects 0.000 abstract description 13
- 230000007704 transition Effects 0.000 abstract description 3
- 230000000875 corresponding effect Effects 0.000 description 14
- 238000010586 diagram Methods 0.000 description 13
- 108091006146 Channels Proteins 0.000 description 3
- 238000003860 storage Methods 0.000 description 3
- 230000002195 synergetic effect Effects 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 230000001934 delay Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000008520 organization Effects 0.000 description 2
- 102000001671 Acid Sensing Ion Channels Human genes 0.000 description 1
- 108010068806 Acid Sensing Ion Channels Proteins 0.000 description 1
- 230000001276 controlling effect Effects 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000014759 maintenance of location Effects 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000009877 rendering Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/30—Arrangements for executing machine instructions, e.g. instruction decode
- G06F9/38—Concurrent instruction execution, e.g. pipeline or look ahead
- G06F9/3885—Concurrent instruction execution, e.g. pipeline or look ahead using a plurality of independent parallel functional units
- G06F9/3889—Concurrent instruction execution, e.g. pipeline or look ahead using a plurality of independent parallel functional units controlled by multiple instructions, e.g. MIMD, decoupled access or execute
- G06F9/3891—Concurrent instruction execution, e.g. pipeline or look ahead using a plurality of independent parallel functional units controlled by multiple instructions, e.g. MIMD, decoupled access or execute organised in groups of units sharing resources, e.g. clusters
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F12/00—Accessing, addressing or allocating within memory systems or architectures
- G06F12/02—Addressing or allocation; Relocation
- G06F12/06—Addressing a physical block of locations, e.g. base addressing, module addressing, memory dedication
- G06F12/0607—Interleaved addressing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/30—Arrangements for executing machine instructions, e.g. instruction decode
- G06F9/38—Concurrent instruction execution, e.g. pipeline or look ahead
- G06F9/3824—Operand accessing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/30—Arrangements for executing machine instructions, e.g. instruction decode
- G06F9/38—Concurrent instruction execution, e.g. pipeline or look ahead
- G06F9/3836—Instruction issuing, e.g. dynamic instruction scheduling or out of order instruction execution
- G06F9/3851—Instruction issuing, e.g. dynamic instruction scheduling or out of order instruction execution from multiple instruction streams, e.g. multistreaming
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/30—Arrangements for executing machine instructions, e.g. instruction decode
- G06F9/38—Concurrent instruction execution, e.g. pipeline or look ahead
- G06F9/3885—Concurrent instruction execution, e.g. pipeline or look ahead using a plurality of independent parallel functional units
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/30—Arrangements for executing machine instructions, e.g. instruction decode
- G06F9/38—Concurrent instruction execution, e.g. pipeline or look ahead
- G06F9/3885—Concurrent instruction execution, e.g. pipeline or look ahead using a plurality of independent parallel functional units
- G06F9/3887—Concurrent instruction execution, e.g. pipeline or look ahead using a plurality of independent parallel functional units controlled by a single instruction for multiple data lanes [SIMD]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/30—Arrangements for executing machine instructions, e.g. instruction decode
- G06F9/38—Concurrent instruction execution, e.g. pipeline or look ahead
- G06F9/3885—Concurrent instruction execution, e.g. pipeline or look ahead using a plurality of independent parallel functional units
- G06F9/3888—Concurrent instruction execution, e.g. pipeline or look ahead using a plurality of independent parallel functional units controlled by a single instruction for multiple threads [SIMT] in parallel
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Software Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Advance Control (AREA)
- Memory System (AREA)
- Executing Machine-Instructions (AREA)
- Complex Calculations (AREA)
Abstract
【解決手段】 内部スレッドメモリ領域のコンフリクトなしに、シングル命令マルチデータスレッド(シムド:SIMD)とマルチスカラスレッドをマルチスレッドプロセスするために用いられるように、かつ、SIMDモードからマルチスカラモードへの遷移を可能するために、使用される共有メモリ120が開示される。この共有メモリ120のメモリ領域は、ジグザク配置されるようアドレスマッピングされる。
【選択図】 図1
Description
他の形態では、特にスレッドごとに複数の異なる命令を含む場合は、プロセッサの複数の異なる演算ユニットによって、それぞれ独立して複数の異なるプロセススレッドを処理するほうが有利な場合もある。このような実行方法はマルチスカラとして知られる。マルチスカラにおいて、各演算ユニットによって処理されるデータは、他の全ての演算ユニットによるデータ操作の手法とは独立して操作がなされる。
その後、前記共有メモリの対応する領域における前記共有メモリのロケーションに、前記レジスタに対応する各々に保持された第2データを記録し、前記ロケーションは、更に、相互に垂直にオフセットされているものとなる。
図1に本発明の1又はそれ以上の実施形態に従ったマルチプロセスシステム100を示す。なお、図面において、同様の要素には同様の符号を付した。マルチプロセスシステム100は、システムバス130を介してDRAMのような共有メモリ120に接続される複数のプロセッシングユニット110(いくつ用いられてもよい)を含む。共有メモリ120は、必ずしもDRAMである必要がないことに注目されたい。実際上、共有メモリは、知られ得る全ての、又は以下記載の開発されたテクノロジーを用いて形成され得る。各プロセッシングユニット110は、1又はそれ以上のシナジスティックプロセッシングユニット(SPU)140と有利に関連している。これらのSPU140は、各々が少なくとも1つのローカルストア(LS:Local Store)150と関連付けられ、ダイレクトメモリアクセスチャネル(DMAC:Direct Memory Access Channel)160を通じて共有メモリ120の定義される領域に対するアクセスを有する。各PU110は、PUバス170を介してサブコンポーネントと通信を行う。マルチプロセッシングシステム100は、ローカルI/O ASICチャネル180を介して他の複数のマルチプロセッシングシステム又はコンピュータコンポーネントとローカルに通信を行うが、他の通信標準及び通信チャネルが用いられてもよい。ネットワーク通信は、1又はそれ以上のネットワークインターフェースカード(NIC:Network Interface Card)190によって実行される。これには、例えば、イーサネットTM(EthernetTM)、インフィニバンドInfinibandTM [インフィニバンドトレードアソシエーション(Infiniband Trade Association)社の商標]、ワイヤレス、又は他の現在存在する又は後に開発されるネットワークテクノロジーを含む。複数のNIC190を、マルチプロセッシングシステム100に与えてもよく、あるいは、1又はそれ以上の個々のプロセッシングユニット110又はSPUs140に関連づけてもよい。
なお、本発明を特定的な実施形態に関連して説明したが、これらの実施形態は本発明の原則とアプリケーションを単に説明する目的のためであることが理解されよう。従って、多くの改変が例示的な実施形態に対して行われ、他の配置が添付された請求項に限定された本発明の趣旨の範囲内において考案されてよいことが理解されよう。
110 プロセッシングユニット
120 共有メモリ
128 共有メモリ
130 システムバス
180 チャネル
200 命令処理素子
210 レジスタ
250 バス
260 機能ユニット
265a〜d 機能ユニット
Claims (13)
- プロセッサの複数かつn個の機能ユニットによって、複数の命令を実行するための方法であって、前記複数かつn個の機能ユニットは、シングル命令マルチデータ(SIMD)方法における命令を実行するために、及び/又はマルチスカラ方法における複数の命令を実行するために動作可能であり、
共有データを1又はそれ以上のレジスタにロードし、各レジスタは、前記複数の機能ユニットの特定的なユニットによって実行されるためのデータを保持するものであり、
複数かつn個の機能ユニット全部のレジスタに保持されるデータに対する前記複数かつn個の機能ユニットによる命令を実行するか、x個(0<x<n)の機能ユニットによる1つ以上の命令を前記x個の機能ユニットに属するとともに前記機能ユニットの数であるxに対応した数であるx個のレジスタにロードされたデータに対して実行するか、の少なくとも一方のオペレーションを行ない、
その後、前記共有メモリの対応する領域における前記共有メモリのロケーションに、前記レジスタに対応する各々に保持された第2データを記録し、前記ロケーションは、更に、相互に垂直にオフセットされているものである、
方法。 - 前記ロケーションは、前記共有メモリの少なくとも一つの行だけ垂直にオフセットされている、
請求項1記載の方法。 - 更に、前記共有メモリの前記複数の対応する領域から前記プロセッサの前記機能ユニットの前記レジスタの全部に同時にロードし、前記メモリの前記対応する領域は、前記垂直にオフセットされたロケーションに同時にアクセスすることを可能にする、
請求項1記載の方法。 - 更に、データをシーケンシャルに前記共有メモリの個々のロケーションから前記プロセッサの前記機能ユニットの前記レジスタの対応する個々のロケーションにロードし、前記メモリの前記対応する領域は、前記メモリの前記対応する前記ロケーションに対するシーケンシャルアクセスを可能にする、
請求項1記載の方法。 - プロセッサの複数の機能ユニットによって実行するためのデータと命令を保持するための複数のメモリ領域を割り当てるための方法であって、
前記プロセッサの複数かつn個の機能ユニットの対応する1つにメモリの複数かつn個の領域の対応する1つを割り当て、各機能ユニットは、2Xビットサイズのレジスタを有し、
前記複数のメモリ領域の第1メモリ領域内ロケーションにデータを記録し、このロケーションは、前記複数のメモリ領域の第2のメモリ領域内のデータが記録されるロケーションから垂直にオフセットされているものである、
方法。 - 更に、前記メモリの前記n個の領域の前記垂直にオフセットされたロケーションのうちから、同時に前記プロセッサの前記n機能ユニットの全部のレジスタへと前記記録されたデータをロードすることを含む、
請求項5記載の方法。 - 前記垂直にオフセットされたロケーションは、前記共有メモリの少なくとも1つの行だけオフセットされている、
請求項5記載の方法。 - 前記メモリ領域は、前記共有メモリの対応するバンクである、
請求項5記載の方法。 - 前記複垂直にオフセットされたロケーションは、ベースアドレスに関連するオフセットによって定められ、前記ベースアドレスは、前記機能ユニットの第1機能ユニットに関する前記メモリロケーションに対応する、
請求項8記載の方法。 - マルチデータセットにシングル命令セットのマルチスレッドを実行するためのシステムであって、
システムバスを含み、
前記システムバスに少なくとも1つの第1のプロセッシングユニットを含み、各プロセッシングユニットは、プロセッシングユニットバス、前記プロセッシングユニットバス上のダイレクトメモリアクセスコントローラ、前記プロセッシングユニットバス上のプロセッサ、前記プロセッシングユニットバス上の複数の第2のプロセッシングユニットを含み、各第2のプロセッシングユニットは、レジスタ、命令プロセッサ、及び複数の機能ユニットを含み、各前記機能ユニットは、ローカルストア、浮動小数点ユニット、及び整数ユニットを含み、
前記システムバス上のローカル出入力チャネルを含み、
前記システムバスに接続されるネットワークインターフェースを含み、
前記システムバスに接続される共有メモリを含み、前記共有メモリは、前記第1のプロセッシングユニットの前記第2のプロセッシングユニットの前記機能ユニットによって複数のメモリ領域に区分され、前記機能ユニットの各々のデータは、前記メモリ領域の異なるロケーションに記録され、前記ロケーションは、更に、前記機能ユニットに基づいて相互に垂直にオフセットされており、前記メモリ領域は、前記第1のプロセッシングユニットの前記第2のプロセッシングユニットの前記機能ユニットと、前記プロセッシングユニットバス及び前記システムバスを通じ、前記ローカルストア及び前記ダイレクトメモリアクセスコントローラを介して通信を行う、
システム。 - 前記ロケーションは、前記共有メモリの少なくとも1つの行だけ垂直にオフセットされている、
請求項10記載のシステム。 - 前記第2のプロセッシングユニットは、更に、前記共有メモリの対応する領域からデータを前記プロセッサの全てのレジスタに同時にデータをロードし、前記メモリの前記対応する領域は、前記垂直にオフセットされたロケーションに同時にアクセスすることを可能にする、
請求項10記載のシステム。 - 前記第2のプロセッシングユニットは、更に、データをシーケンシャルに前記共有メモリの個々のロケーションから前記プロセッサの前記機能ユニットの前記レジスタの対応する個々のロケーションにロードし、前記メモリの前記対応する領域は、前記メモリの前記対応する前記ロケーションに対するシーケンシャルアクセスを可能にする、
請求項10記載のシステム。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US56484304P | 2004-04-23 | 2004-04-23 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2005310167A true JP2005310167A (ja) | 2005-11-04 |
JP3813624B2 JP3813624B2 (ja) | 2006-08-23 |
Family
ID=34966387
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005125341A Expired - Fee Related JP3813624B2 (ja) | 2004-04-23 | 2005-04-22 | マルチスカラ拡張におけるアドレスマップを最適化するための方法及び機器 |
Country Status (3)
Country | Link |
---|---|
US (1) | US20050251649A1 (ja) |
JP (1) | JP3813624B2 (ja) |
WO (1) | WO2005103887A2 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20090006773A1 (en) * | 2005-05-20 | 2009-01-01 | Yuji Yamaguchi | Signal Processing Apparatus |
JP2011522325A (ja) * | 2008-05-30 | 2011-07-28 | アドバンスト・マイクロ・ディバイシズ・インコーポレイテッド | ローカル及びグローバルのデータ共有 |
Families Citing this family (36)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB2423604B (en) * | 2005-02-25 | 2007-11-21 | Clearspeed Technology Plc | Microprocessor architectures |
US7567567B2 (en) | 2005-04-05 | 2009-07-28 | Sun Microsystems, Inc. | Network system including packet classification for partitioned resources |
US7750915B1 (en) * | 2005-12-19 | 2010-07-06 | Nvidia Corporation | Concurrent access of data elements stored across multiple banks in a shared memory resource |
US8074224B1 (en) * | 2005-12-19 | 2011-12-06 | Nvidia Corporation | Managing state information for a multi-threaded processor |
US8327115B2 (en) | 2006-04-12 | 2012-12-04 | Soft Machines, Inc. | Plural matrices of execution units for processing matrices of row dependent instructions in single clock cycle in super or separate mode |
EP2014028B1 (en) * | 2006-04-21 | 2010-11-10 | Oracle America, Inc. | Asymmetrical processing for networking functions and data path offload |
EP2527972A3 (en) | 2006-11-14 | 2014-08-06 | Soft Machines, Inc. | Apparatus and method for processing complex instruction formats in a multi- threaded architecture supporting various context switch modes and virtualization schemes |
US7809925B2 (en) * | 2007-12-07 | 2010-10-05 | International Business Machines Corporation | Processing unit incorporating vectorizable execution unit |
KR101685247B1 (ko) | 2010-09-17 | 2016-12-09 | 소프트 머신즈, 인크. | 조기 원거리 분기 예측을 위한 섀도우 캐시를 포함하는 단일 사이클 다중 분기 예측 |
CN108376097B (zh) | 2011-03-25 | 2022-04-15 | 英特尔公司 | 用于通过使用由可分割引擎实例化的虚拟核来支持代码块执行的寄存器文件段 |
CN103547993B (zh) | 2011-03-25 | 2018-06-26 | 英特尔公司 | 通过使用由可分割引擎实例化的虚拟核来执行指令序列代码块 |
EP2689326B1 (en) | 2011-03-25 | 2022-11-16 | Intel Corporation | Memory fragments for supporting code block execution by using virtual cores instantiated by partitionable engines |
WO2012162189A1 (en) | 2011-05-20 | 2012-11-29 | Soft Machines, Inc. | An interconnect structure to support the execution of instruction sequences by a plurality of engines |
TWI603198B (zh) | 2011-05-20 | 2017-10-21 | 英特爾股份有限公司 | 以複數個引擎作資源與互連結構的分散式分配以支援指令序列的執行 |
EP2783280B1 (en) | 2011-11-22 | 2019-09-11 | Intel Corporation | An accelerated code optimizer for a multiengine microprocessor |
WO2013077876A1 (en) | 2011-11-22 | 2013-05-30 | Soft Machines, Inc. | A microprocessor accelerated code optimizer |
WO2014150991A1 (en) | 2013-03-15 | 2014-09-25 | Soft Machines, Inc. | A method for implementing a reduced size register view data structure in a microprocessor |
US9904625B2 (en) | 2013-03-15 | 2018-02-27 | Intel Corporation | Methods, systems and apparatus for predicting the way of a set associative cache |
WO2014150806A1 (en) | 2013-03-15 | 2014-09-25 | Soft Machines, Inc. | A method for populating register view data structure by using register template snapshots |
EP2972845B1 (en) | 2013-03-15 | 2021-07-07 | Intel Corporation | A method for executing multithreaded instructions grouped onto blocks |
WO2014150971A1 (en) | 2013-03-15 | 2014-09-25 | Soft Machines, Inc. | A method for dependency broadcasting through a block organized source view data structure |
US9811342B2 (en) | 2013-03-15 | 2017-11-07 | Intel Corporation | Method for performing dual dispatch of blocks and half blocks |
US10140138B2 (en) | 2013-03-15 | 2018-11-27 | Intel Corporation | Methods, systems and apparatus for supporting wide and efficient front-end operation with guest-architecture emulation |
US9891924B2 (en) | 2013-03-15 | 2018-02-13 | Intel Corporation | Method for implementing a reduced size register view data structure in a microprocessor |
CN105247484B (zh) | 2013-03-15 | 2021-02-23 | 英特尔公司 | 利用本地分布式标志体系架构来仿真访客集中式标志体系架构的方法 |
US9886279B2 (en) | 2013-03-15 | 2018-02-06 | Intel Corporation | Method for populating and instruction view data structure by using register template snapshots |
US10275255B2 (en) | 2013-03-15 | 2019-04-30 | Intel Corporation | Method for dependency broadcasting through a source organized source view data structure |
US9569216B2 (en) | 2013-03-15 | 2017-02-14 | Soft Machines, Inc. | Method for populating a source view data structure by using register template snapshots |
US9921848B2 (en) | 2014-03-27 | 2018-03-20 | International Business Machines Corporation | Address expansion and contraction in a multithreading computer system |
US9218185B2 (en) | 2014-03-27 | 2015-12-22 | International Business Machines Corporation | Multithreading capability information retrieval |
US9354883B2 (en) | 2014-03-27 | 2016-05-31 | International Business Machines Corporation | Dynamic enablement of multithreading |
US9804846B2 (en) | 2014-03-27 | 2017-10-31 | International Business Machines Corporation | Thread context preservation in a multithreading computer system |
US9594660B2 (en) | 2014-03-27 | 2017-03-14 | International Business Machines Corporation | Multithreading computer system and program product for executing a query instruction for idle time accumulation among cores |
US10102004B2 (en) | 2014-03-27 | 2018-10-16 | International Business Machines Corporation | Hardware counters to track utilization in a multithreading computer system |
US9417876B2 (en) | 2014-03-27 | 2016-08-16 | International Business Machines Corporation | Thread context restoration in a multithreading computer system |
KR102332523B1 (ko) | 2014-12-24 | 2021-11-29 | 삼성전자주식회사 | 연산 처리 장치 및 방법 |
Family Cites Families (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5175862A (en) * | 1989-12-29 | 1992-12-29 | Supercomputer Systems Limited Partnership | Method and apparatus for a special purpose arithmetic boolean unit |
US5404469A (en) * | 1992-02-25 | 1995-04-04 | Industrial Technology Research Institute | Multi-threaded microprocessor architecture utilizing static interleaving |
EP0931290A1 (en) * | 1997-03-21 | 1999-07-28 | International Business Machines Corporation | Address mapping for system memory |
US6460134B1 (en) * | 1997-12-03 | 2002-10-01 | Intrinsity, Inc. | Method and apparatus for a late pipeline enhanced floating point unit |
US6230253B1 (en) * | 1998-03-31 | 2001-05-08 | Intel Corporation | Executing partial-width packed data instructions |
US6272616B1 (en) * | 1998-06-17 | 2001-08-07 | Agere Systems Guardian Corp. | Method and apparatus for executing multiple instruction streams in a digital processor with multiple data paths |
US6233662B1 (en) * | 1999-04-26 | 2001-05-15 | Hewlett-Packard Company | Method and apparatus for interleaving memory across computer memory banks |
WO2001067234A2 (en) * | 2000-03-08 | 2001-09-13 | Sun Microsystems, Inc. | Vliw computer processing architecture having a scalable number of register files |
US6665768B1 (en) * | 2000-10-12 | 2003-12-16 | Chipwrights Design, Inc. | Table look-up operation for SIMD processors with interleaved memory systems |
US6526491B2 (en) * | 2001-03-22 | 2003-02-25 | Sony Corporation Entertainment Inc. | Memory protection system and method for computer architecture for broadband networks |
US6826662B2 (en) * | 2001-03-22 | 2004-11-30 | Sony Computer Entertainment Inc. | System and method for data synchronization for a computer architecture for broadband networks |
JP2003196259A (ja) * | 2001-12-27 | 2003-07-11 | Sharp Corp | データ駆動型情報処理装置およびデータ処理方法 |
US6944744B2 (en) * | 2002-08-27 | 2005-09-13 | Advanced Micro Devices, Inc. | Apparatus and method for independently schedulable functional units with issue lock mechanism in a processor |
US7143264B2 (en) * | 2002-10-10 | 2006-11-28 | Intel Corporation | Apparatus and method for performing data access in accordance with memory access patterns |
US7136987B2 (en) * | 2004-03-30 | 2006-11-14 | Intel Corporation | Memory configuration apparatus, systems, and methods |
-
2005
- 2005-04-20 US US11/110,492 patent/US20050251649A1/en not_active Abandoned
- 2005-04-21 WO PCT/JP2005/008086 patent/WO2005103887A2/en active Application Filing
- 2005-04-22 JP JP2005125341A patent/JP3813624B2/ja not_active Expired - Fee Related
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20090006773A1 (en) * | 2005-05-20 | 2009-01-01 | Yuji Yamaguchi | Signal Processing Apparatus |
US8464025B2 (en) * | 2005-05-20 | 2013-06-11 | Sony Corporation | Signal processing apparatus with signal control units and processor units operating based on different threads |
JP2011522325A (ja) * | 2008-05-30 | 2011-07-28 | アドバンスト・マイクロ・ディバイシズ・インコーポレイテッド | ローカル及びグローバルのデータ共有 |
US9619428B2 (en) | 2008-05-30 | 2017-04-11 | Advanced Micro Devices, Inc. | SIMD processing unit with local data share and access to a global data share of a GPU |
US10140123B2 (en) | 2008-05-30 | 2018-11-27 | Advanced Micro Devices, Inc. | SIMD processing lanes storing input pixel operand data in local register file for thread execution of image processing operations |
Also Published As
Publication number | Publication date |
---|---|
JP3813624B2 (ja) | 2006-08-23 |
US20050251649A1 (en) | 2005-11-10 |
WO2005103887A3 (en) | 2006-09-21 |
WO2005103887A2 (en) | 2005-11-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3813624B2 (ja) | マルチスカラ拡張におけるアドレスマップを最適化するための方法及び機器 | |
KR101303119B1 (ko) | 쓰레드 당 다중의 동시적 파이프라인을 갖는 멀티쓰레드 프로세서 | |
KR100991912B1 (ko) | 토큰 트리거 방식 멀티스레딩을 위한 방법 및 장치 | |
EP2159702B1 (en) | Cache control device and control method | |
KR100988955B1 (ko) | 멀티스레디드 프로세서에서 레지스터 파일 포트 감소를위한 방법 및 장치 | |
CN1332303C (zh) | 用于多线程处理器中基于线程的存储器存取的方法和装置 | |
US20020023201A1 (en) | VLIW computer processing architecture having a scalable number of register files | |
JP2016528641A5 (ja) | ||
US5457789A (en) | Method and apparatus for performing memory protection operations in a single instruction multiple data system | |
JPH04245540A (ja) | 条件付き分岐を有するプログラムの効率的実行をするためのコンピュータシステム | |
US5003458A (en) | Suspended instruction restart processing system based on a checkpoint microprogram address | |
US7573481B2 (en) | Method and apparatus for management of bit plane resources | |
US6003126A (en) | Special instruction register including allocation field utilized for temporary designation of physical registers as general registers | |
KR20180033527A (ko) | 레지스터 뱅크에 저장된 데이터 요소들의 하나 이상의 벡터와 메모리 사이에서 복수의 데이터 구조를 전송하는 장치 및 방법 | |
JP3797570B2 (ja) | セマフォ命令用のセマフォ・バッファを用いた装置と方法 | |
US20080082797A1 (en) | Configurable Single Instruction Multiple Data Unit | |
US20020032849A1 (en) | VLIW computer processing architecture having the program counter stored in a register file register | |
US20090063808A1 (en) | Microprocessor and method of processing data | |
JP2824484B2 (ja) | パイプライン処理計算機 | |
JPS63168762A (ja) | マルチプロセツサ起動装置 | |
JPS61194566A (ja) | ベクトルデ−タ参照制御方式 | |
JPH06139071A (ja) | 並列計算機 | |
JPH0814792B2 (ja) | データ処理装置 | |
JPH0348549B2 (ja) | ||
JPS61188628A (ja) | 情報処理装置における命令処理制御方式 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20060228 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20060501 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20060530 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20060531 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 3813624 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100609 Year of fee payment: 4 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100609 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110609 Year of fee payment: 5 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110609 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120609 Year of fee payment: 6 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120609 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130609 Year of fee payment: 7 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |