JP2006012163A5 - - Google Patents
Download PDFInfo
- Publication number
- JP2006012163A5 JP2006012163A5 JP2005179948A JP2005179948A JP2006012163A5 JP 2006012163 A5 JP2006012163 A5 JP 2006012163A5 JP 2005179948 A JP2005179948 A JP 2005179948A JP 2005179948 A JP2005179948 A JP 2005179948A JP 2006012163 A5 JP2006012163 A5 JP 2006012163A5
- Authority
- JP
- Japan
- Prior art keywords
- register
- level
- registers
- execution
- logic
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000000875 corresponding Effects 0.000 claims 10
- 230000001276 controlling effect Effects 0.000 claims 1
- 239000004065 semiconductor Substances 0.000 claims 1
Claims (29)
- 実行するための命令を選択及びデコードする命令ロジックと、
前記命令によって指定されたオペレーションを遂行する実行ロジックと、
前記命令からのレジスタ識別子を使用して参照されるレジスタ・データを記憶する複数のレジスタと、
を含み、
前記複数のレジスタが複数のレベルとして編成され、
前記複数のレベルが、
(a)第1のアクセス待ち時間及び第1の数のレジスタを有する第1レベルと、
(b)第2のアクセス待ち時間及び第2の数のレジスタを有し、前記第2のアクセス待ち時間が前記第1のアクセス待ち時間よりも長く、前記第2の数のレジスタが前記第1の数のレジスタよりも多い、第2レベルとを含み、
前記実行ロジックへの入力に対して、前記第1レベルのレジスタからの出力及び前記第2レベルのレジスタからの出力のいずれか1つを選択するための実行入力選択ロジックを含む、
ディジタル・データ処理装置。 - 前記第1レベルの前記レジスタに含まれたレジスタ・データが前記第2レベルの前記レジスタに含まれたレジスタ・データのサブセットである、請求項1に記載のディジタル・データ処理装置。
- 前記第1レベルの各レジスタが、前記第2レベルのレジスタの複数の個別のサブセットにおける対応するサブセットのレジスタの内容を記憶し、前記対応するサブセットのレジスタが前記第2レベルの複数のレジスタを含む、請求項2に記載のディジタル・データ処理装置。
- 前記第1レベルの唯一のレジスタが前記第2レベルの前記レジスタの前記対応するサブセットのそれぞれに対応する、請求項3に記載のディジタル・データ処理装置。
- 前記第1レベルの前記レジスタの各々が、最近参照された前記第2レベルのレジスタの対応するサブセットのレジスタの内容を記憶する、請求項4に記載のディジタル・データ処理装置。
- 前記レジスタ識別子の各々がNビットからなり、前記第1レベルの前記レジスタが前記レジスタ識別子のMビット部分を使用してアクセスされる(但し、N>M>1)、請求項1に記載のディジタル・データ処理装置。
- 前記第1レベルの各レジスタは、該レジスタをアクセスする際に使用される前記レジスタ識別子のMビット部分の値と等しい値をそのMビット部分に有する複数のレジスタ識別子により各々参照される複数の前記第2レベルのレジスタのサブセットのうちのいずれかのレジスタの内容を記憶する、請求項6に記載のディジタル・データ処理装置。
- 前記第1レベルの前記レジスタに書き込むために前記実行ロジックに生成された複数の結果の1つを選択するための結果選択ロジックを更に含み、
前記結果選択ロジックが前記第2レベルの前記レジスタの少なくとも1つの出力を入力として更に受ける、請求項1に記載のディジタル・データ処理装置。 - 命令の選択されたシーケンスに対する前記第1レベルのレジスタからの出力をディセーブルするために前記実行入力選択ロジックを制御する、請求項1に記載のディジタル・データ処理装置。
- 前記実行入力選択ロジックの制御は、前記第1レベルのレジスタの参照において検出された無効データの比率を動的に監視し、監視結果に基づいて行う、請求項9に記載のディジタル・データ処理装置。
- 前記第1レベルのレジスタからの出力が有効である場合に前記出力を選択し、前記第1レベルのレジスタからの出力が有効でない場合に前記第2レベルのレジスタからの出力を選択するように前記実行入力選択ロジックを制御する、請求項1に記載のディジタル・データ処理装置。
- 前記命令ロジックが、実行のための命令を複数のスレッドから同時に選択及びデコードし、
前記複数のレジスタが複数のレジスタ・セットを含み、前記レジスタ・セットの各々が前記複数のスレッドにおけるそれぞれのスレッドに対応し且つ前記第1レベルのレジスタ及び前記第2レベルのレジスタを含む、
請求項1に記載のディジタル・データ処理装置。 - 前記命令ロジックが単一のクロック・サイクルにおいて実行するための複数の命令をディスパッチすることができる、請求項1に記載のディジタル・データ処理装置。
- 複数の汎用レジスタとスカラ・データを処理するための実行ロジックとを有する実行ユニットと、
複数のオペランド・セットに関するオペレーションを並行して遂行するためのベクトル処理サブユニットと、
を更に含み、
前記ベクトル処理サブユニットが複数のレベルとして編成された前記複数のレジスタを含む、請求項1に記載のディジタル・データ処理装置。 - 単一の半導体チップとして具現化される、請求項1に記載のディジタル・データ処理装置。
- 命令を含むデータを記憶するためのメモリと、
前記メモリからの命令を実行するための少なくとも1つのプロセッサと、
を含み、
前記プロセッサが、
(a)実行するための命令を選択及びデコードする命令ロジックと、
(b)前記命令によって指定されたオペレーションを遂行する実行ロジックと、
(c)前記命令からのレジスタ識別子を使用して参照されるレジスタ・データを記憶する複数のレジスタと、
を含み、
前記複数のレジスタが複数のレベルとして編成され、
前記複数のレベルが、
(i)第1のアクセス待ち時間及び第1の数のレジスタを有する第1レベルと、
(ii)第2のアクセス待ち時間及び第2の数のレジスタを有し、前記第2のアクセス待ち時間が前記第1のアクセス待ち時間よりも長く、前記第2の数のレジスタが前記第1の数のレジスタよりも多い、第2レベルとを含み、
前記実行ロジックへの入力に対して、前記第1レベルのレジスタからの出力及び前記第2レベルのレジスタからの出力のいずれか1つを選択するための実行入力選択ロジックを含む、
コンピュータ・システム。 - 前記第1レベルの前記レジスタに含まれたレジスタ・データが前記第2レベルの前記レジスタに含まれたレジスタ・データのサブセットである、請求項16に記載のコンピュータ・システム。
- 前記第1レベルの各レジスタが、前記第2レベルのレジスタの複数の個別のサブセットの対応するサブセットのレジスタの内容を記憶し、前記対応するサブセットのレジスタが前記第2レベルの複数のレジスタを含む、請求項17に記載のコンピュータ・システム。
- 前記第1レベルの唯一のレジスタが前記第2レベルの前記レジスタの前記対応するサブセットのそれぞれに対応する、請求項18に記載のコンピュータ・システム。
- 前記第1レベルの前記レジスタの各々が、最近参照された前記第2レベルのレジスタの対応するサブセットのレジスタの内容を記憶する、請求項19に記載のコンピュータ・システム。
- 前記レジスタ識別子の各々がNビットからなり、前記第1レベルの前記レジスタが前記レジスタ識別子のMビット部分を使用してアクセスされる(但し、N>M>1)、請求項16に記載のコンピュータ・システム。
- 前記第1レベルの各レジスタは、該レジスタをアクセスする際に使用される前記レジスタ識別子のMビット部分の値と等しい値をそのMビット部分に有する複数のレジスタ識別子により各々参照される複数の前記第2レベルのレジスタのサブセットのうちのいずれかのレジスタの内容を記憶する、請求項21に記載のコンピュータ・システム。
- 前記プロセッサが、前記第1レベルの前記レジスタに書き込むために前記実行ロジックに生成された複数の結果の1つを選択するための結果選択ロジックを更に含み、
前記結果選択ロジックが、前記第2レベルの前記レジスタの少なくとも1つの出力を入力として更に受ける、請求項16に記載のコンピュータ・システム。 - 前記プロセッサが、命令の選択されたシーケンスに対する前記第1レベルのレジスタからの出力をディセーブルするために前記実行入力選択ロジックを制御する、請求項16に記載のコンピュータ・システム。
- 前記実行入力選択ロジックの制御は、前記第1レベルのレジスタの参照において検出された無効データの比率を動的に監視し、監視結果に基づいて行う、請求項24に記載のコンピュータ・システム。
- 前記プロセッサは、前記第1レベルのレジスタからの出力が有効である場合に前記出力を選択し、前記第1レベルのレジスタからの出力が有効でない場合に前記第2レベルのレジスタからの出力を選択するように前記実行入力選択ロジックを制御する、請求項16に記載のコンピュータ・システム。
- 前記命令ロジックが、実行のための命令を複数のスレッドから同時に選択及びデコードし、
前記複数のレジスタが複数のレジスタ・セットを含み、前記レジスタ・セットの各々が前記複数のスレッドにおけるそれぞれのスレッドに対応し且つ前記第1レベルのレジスタ及び前記第2レベルのレジスタを含む、
請求項16に記載のコンピュータ・システム。 - 複数のプロセッサを含み、
前記プロセッサの各々が、
(a)実行するための命令を選択及びデコードする命令ロジックと、
(b)前記命令によって指定されたオペレーションを遂行する実行ロジックと、
(c)前記命令からのレジスタ識別子を使用して参照されるレジスタ・データを記憶する複数のレジスタと、
を含み、
前記複数のレジスタが複数のレベルとして編成され、
前記複数のレベルが、
(i)第1のアクセス待ち時間及び第1の数のレジスタを有する第1レベルと、
(ii)第2のアクセス待ち時間及び第2の数のレジスタを有し、前記第2のアクセス待ち時間が前記第1のアクセス待ち時間よりも長く、前記第2の数のレジスタが前記第1の数のレジスタよりも多い、第2レベルとを含み、
前記実行ロジックへの入力に対して、前記第1レベルのレジスタからの出力及び前記第2レベルのレジスタからの出力のいずれか1つを選択するための実行入力選択ロジックを含む、
コンピュータ・システム。 - 前記メモリに含まれたデータの選択的部分を一時的に記憶するためのキャッシュ・メモリを更に含む、請求項16に記載のコンピュータ・システム。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US10/875,373 US7284092B2 (en) | 2004-06-24 | 2004-06-24 | Digital data processing apparatus having multi-level register file |
US10/875,373 | 2004-06-24 |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2006012163A JP2006012163A (ja) | 2006-01-12 |
JP2006012163A5 true JP2006012163A5 (ja) | 2008-06-19 |
JP4829541B2 JP4829541B2 (ja) | 2011-12-07 |
Family
ID=35507434
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005179948A Expired - Fee Related JP4829541B2 (ja) | 2004-06-24 | 2005-06-20 | マルチレベル・レジスタ・ファイルを有するディジタル・データ処理装置 |
Country Status (4)
Country | Link |
---|---|
US (2) | US7284092B2 (ja) |
JP (1) | JP4829541B2 (ja) |
CN (1) | CN100447738C (ja) |
TW (1) | TW200609744A (ja) |
Families Citing this family (72)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7263593B2 (en) * | 2002-11-25 | 2007-08-28 | Hitachi, Ltd. | Virtualization controller and data transfer control method |
US7933405B2 (en) * | 2005-04-08 | 2011-04-26 | Icera Inc. | Data access and permute unit |
US7861060B1 (en) * | 2005-12-15 | 2010-12-28 | Nvidia Corporation | Parallel data processing systems and methods using cooperative thread arrays and thread identifier values to determine processing behavior |
US7788468B1 (en) | 2005-12-15 | 2010-08-31 | Nvidia Corporation | Synchronization of threads in a cooperative thread array |
WO2007143278A2 (en) | 2006-04-12 | 2007-12-13 | Soft Machines, Inc. | Apparatus and method for processing an instruction matrix specifying parallel and dependent operations |
US9069547B2 (en) | 2006-09-22 | 2015-06-30 | Intel Corporation | Instruction and logic for processing text strings |
CN101627365B (zh) * | 2006-11-14 | 2017-03-29 | 索夫特机械公司 | 多线程架构 |
US7797514B2 (en) * | 2006-11-16 | 2010-09-14 | Texas Instruments Incorporated | Scalable multi-threaded sequencing/synchronizing processor architecture |
US20080229062A1 (en) * | 2007-03-12 | 2008-09-18 | Lorenzo Di Gregorio | Method of sharing registers in a processor and processor |
US20090006753A1 (en) * | 2007-06-28 | 2009-01-01 | David Arnold Luick | Design structure for accessing a cache with an effective address |
US7937530B2 (en) * | 2007-06-28 | 2011-05-03 | International Business Machines Corporation | Method and apparatus for accessing a cache with an effective address |
US7877582B2 (en) * | 2008-01-31 | 2011-01-25 | International Business Machines Corporation | Multi-addressable register file |
US7849294B2 (en) * | 2008-01-31 | 2010-12-07 | International Business Machines Corporation | Sharing data in internal and memory representations with dynamic data-driven conversion |
US8176406B2 (en) * | 2008-03-19 | 2012-05-08 | International Business Machines Corporation | Hard error detection |
US8631223B2 (en) | 2010-05-12 | 2014-01-14 | International Business Machines Corporation | Register file supporting transactional processing |
US8914619B2 (en) * | 2010-06-22 | 2014-12-16 | International Business Machines Corporation | High-word facility for extending the number of general purpose registers available to instructions |
US8661227B2 (en) * | 2010-09-17 | 2014-02-25 | International Business Machines Corporation | Multi-level register file supporting multiple threads |
KR101685247B1 (ko) | 2010-09-17 | 2016-12-09 | 소프트 머신즈, 인크. | 조기 원거리 분기 예측을 위한 섀도우 캐시를 포함하는 단일 사이클 다중 분기 예측 |
US8725993B2 (en) * | 2011-02-23 | 2014-05-13 | International Business Machines Corporation | Thread transition management |
US9766893B2 (en) | 2011-03-25 | 2017-09-19 | Intel Corporation | Executing instruction sequence code blocks by using virtual cores instantiated by partitionable engines |
KR101826121B1 (ko) | 2011-03-25 | 2018-02-06 | 인텔 코포레이션 | 분할가능한 엔진에 의해 인스턴스화된 가상 코어를 이용한 코드 블록의 실행을 지원하는 메모리 프래그먼트 |
EP2689330B1 (en) | 2011-03-25 | 2022-12-21 | Intel Corporation | Register file segments for supporting code block execution by using virtual cores instantiated by partitionable engines |
EP2710481B1 (en) | 2011-05-20 | 2021-02-17 | Intel Corporation | Decentralized allocation of resources and interconnect structures to support the execution of instruction sequences by a plurality of engines |
US9442772B2 (en) | 2011-05-20 | 2016-09-13 | Soft Machines Inc. | Global and local interconnect structure comprising routing matrix to support the execution of instruction sequences by a plurality of engines |
US8595460B2 (en) * | 2011-08-26 | 2013-11-26 | Vmware, Inc. | Configuring object storage system for input/output operations |
US9727336B2 (en) | 2011-09-16 | 2017-08-08 | International Business Machines Corporation | Fine-grained instruction enablement at sub-function granularity based on an indicated subrange of registers |
US9411585B2 (en) | 2011-09-16 | 2016-08-09 | International Business Machines Corporation | Multi-addressable register files and format conversions associated therewith |
US8615745B2 (en) | 2011-10-03 | 2013-12-24 | International Business Machines Corporation | Compiling code for an enhanced application binary interface (ABI) with decode time instruction optimization |
US8612959B2 (en) | 2011-10-03 | 2013-12-17 | International Business Machines Corporation | Linking code for an enhanced application binary interface (ABI) with decode time instruction optimization |
US9329869B2 (en) | 2011-10-03 | 2016-05-03 | International Business Machines Corporation | Prefix computer instruction for compatibily extending instruction functionality |
US8756591B2 (en) | 2011-10-03 | 2014-06-17 | International Business Machines Corporation | Generating compiled code that indicates register liveness |
US9286072B2 (en) | 2011-10-03 | 2016-03-15 | International Business Machines Corporation | Using register last use infomation to perform decode-time computer instruction optimization |
US9354874B2 (en) | 2011-10-03 | 2016-05-31 | International Business Machines Corporation | Scalable decode-time instruction sequence optimization of dependent instructions |
US20130086364A1 (en) * | 2011-10-03 | 2013-04-04 | International Business Machines Corporation | Managing a Register Cache Based on an Architected Computer Instruction Set Having Operand Last-User Information |
US10078515B2 (en) | 2011-10-03 | 2018-09-18 | International Business Machines Corporation | Tracking operand liveness information in a computer system and performing function based on the liveness information |
US9690583B2 (en) | 2011-10-03 | 2017-06-27 | International Business Machines Corporation | Exploiting an architected list-use operand indication in a computer system operand resource pool |
US9697002B2 (en) | 2011-10-03 | 2017-07-04 | International Business Machines Corporation | Computer instructions for activating and deactivating operands |
US20150039859A1 (en) | 2011-11-22 | 2015-02-05 | Soft Machines, Inc. | Microprocessor accelerated code optimizer |
EP2783280B1 (en) | 2011-11-22 | 2019-09-11 | Intel Corporation | An accelerated code optimizer for a multiengine microprocessor |
US9582464B2 (en) * | 2011-12-23 | 2017-02-28 | Intel Corporation | Systems, apparatuses, and methods for performing a double blocked sum of absolute differences |
US9286068B2 (en) | 2012-10-31 | 2016-03-15 | International Business Machines Corporation | Efficient usage of a multi-level register file utilizing a register file bypass |
US10275251B2 (en) | 2012-10-31 | 2019-04-30 | International Business Machines Corporation | Processor for avoiding reduced performance using instruction metadata to determine not to maintain a mapping of a logical register to a physical register in a first level register file |
EP2972836B1 (en) | 2013-03-15 | 2022-11-09 | Intel Corporation | A method for emulating a guest centralized flag architecture by using a native distributed flag architecture |
WO2014150991A1 (en) | 2013-03-15 | 2014-09-25 | Soft Machines, Inc. | A method for implementing a reduced size register view data structure in a microprocessor |
KR101708591B1 (ko) | 2013-03-15 | 2017-02-20 | 소프트 머신즈, 인크. | 블록들로 그룹화된 멀티스레드 명령어들을 실행하기 위한 방법 |
US9569216B2 (en) | 2013-03-15 | 2017-02-14 | Soft Machines, Inc. | Method for populating a source view data structure by using register template snapshots |
US9886279B2 (en) | 2013-03-15 | 2018-02-06 | Intel Corporation | Method for populating and instruction view data structure by using register template snapshots |
US9904625B2 (en) | 2013-03-15 | 2018-02-27 | Intel Corporation | Methods, systems and apparatus for predicting the way of a set associative cache |
US9811342B2 (en) | 2013-03-15 | 2017-11-07 | Intel Corporation | Method for performing dual dispatch of blocks and half blocks |
US9891924B2 (en) | 2013-03-15 | 2018-02-13 | Intel Corporation | Method for implementing a reduced size register view data structure in a microprocessor |
US10140138B2 (en) | 2013-03-15 | 2018-11-27 | Intel Corporation | Methods, systems and apparatus for supporting wide and efficient front-end operation with guest-architecture emulation |
US10275255B2 (en) | 2013-03-15 | 2019-04-30 | Intel Corporation | Method for dependency broadcasting through a source organized source view data structure |
WO2014150806A1 (en) | 2013-03-15 | 2014-09-25 | Soft Machines, Inc. | A method for populating register view data structure by using register template snapshots |
WO2014150971A1 (en) | 2013-03-15 | 2014-09-25 | Soft Machines, Inc. | A method for dependency broadcasting through a block organized source view data structure |
US9508112B2 (en) * | 2013-07-31 | 2016-11-29 | Apple Inc. | Multi-threaded GPU pipeline |
US9378146B2 (en) | 2013-08-20 | 2016-06-28 | Apple Inc. | Operand cache design |
US9652233B2 (en) | 2013-08-20 | 2017-05-16 | Apple Inc. | Hint values for use with an operand cache |
US9459869B2 (en) | 2013-08-20 | 2016-10-04 | Apple Inc. | Intelligent caching for an operand cache |
US9870340B2 (en) * | 2015-03-30 | 2018-01-16 | International Business Machines Corporation | Multithreading in vector processors |
US9952865B2 (en) * | 2015-04-04 | 2018-04-24 | Texas Instruments Incorporated | Low energy accelerator processor architecture with short parallel instruction word and non-orthogonal register data file |
US9619394B2 (en) | 2015-07-21 | 2017-04-11 | Apple Inc. | Operand cache flush, eviction, and clean techniques using hint information and dirty information |
US9785567B2 (en) | 2015-09-11 | 2017-10-10 | Apple Inc. | Operand cache control techniques |
US10241790B2 (en) | 2015-12-15 | 2019-03-26 | International Business Machines Corporation | Operation of a multi-slice processor with reduced flush and restore latency |
US20170371654A1 (en) * | 2016-06-23 | 2017-12-28 | Advanced Micro Devices, Inc. | System and method for using virtual vector register files |
GB2552154B (en) * | 2016-07-08 | 2019-03-06 | Advanced Risc Mach Ltd | Vector register access |
US10613987B2 (en) | 2016-09-23 | 2020-04-07 | Apple Inc. | Operand cache coherence for SIMD processor supporting predication |
US10423415B2 (en) * | 2017-04-01 | 2019-09-24 | Intel Corporation | Hierarchical general register file (GRF) for execution block |
CN111951845B (zh) * | 2019-05-15 | 2022-06-03 | 上海磁宇信息科技有限公司 | 一种分级管理冗余存储的mram芯片 |
US11848980B2 (en) * | 2020-07-09 | 2023-12-19 | Boray Data Technology Co. Ltd. | Distributed pipeline configuration in a distributed computing system |
TWI783310B (zh) * | 2020-11-26 | 2022-11-11 | 華邦電子股份有限公司 | 計數方法以及計數裝置 |
CN112817639B (zh) * | 2021-01-13 | 2022-04-08 | 中国民航大学 | Gpu读写单元通过操作数收集器访问寄存器文件的方法 |
CN116560729B (zh) * | 2023-05-11 | 2024-06-04 | 北京市合芯数字科技有限公司 | 一种多线程处理器的寄存器多级管理方法及系统 |
Family Cites Families (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4128880A (en) | 1976-06-30 | 1978-12-05 | Cray Research, Inc. | Computer vector register processing |
US5179681A (en) | 1989-11-16 | 1993-01-12 | Sun Microsystems, Inc. | Method and apparatus for current window cache with switchable address and out cache registers |
US5226142A (en) | 1990-11-21 | 1993-07-06 | Ross Technology, Inc. | High performance register file with overlapping windows |
JP3479538B2 (ja) * | 1991-12-26 | 2003-12-15 | テキサス インスツルメンツ インコーポレイテツド | 半導体集積回路を製作する方法 |
JPH06222990A (ja) * | 1992-10-16 | 1994-08-12 | Fujitsu Ltd | データ処理装置 |
JP3676411B2 (ja) | 1994-01-21 | 2005-07-27 | サン・マイクロシステムズ・インコーポレイテッド | レジスタファイル装置及びレジスタファイルアクセス方法 |
US5592679A (en) * | 1994-11-14 | 1997-01-07 | Sun Microsystems, Inc. | Apparatus and method for distributed control in a processor architecture |
EP0717359A3 (en) * | 1994-12-15 | 1997-02-05 | Sun Microsystems Inc | Register cache memory for a computer processor |
US5974438A (en) * | 1996-12-31 | 1999-10-26 | Compaq Computer Corporation | Scoreboard for cached multi-thread processes |
US6131155A (en) * | 1997-11-07 | 2000-10-10 | Pmc Sierra Ltd. | Programmer-visible uncached load/store unit having burst capability |
US6108770A (en) * | 1998-06-24 | 2000-08-22 | Digital Equipment Corporation | Method and apparatus for predicting memory dependence using store sets |
US6381678B2 (en) * | 1998-10-30 | 2002-04-30 | Intel Corporation | Processing ordered data requests to a memory |
US6282614B1 (en) * | 1999-04-15 | 2001-08-28 | National Semiconductor Corporation | Apparatus and method for reducing the power consumption of a microprocessor with multiple levels of caches |
US6557078B1 (en) * | 2000-02-21 | 2003-04-29 | Hewlett Packard Development Company, L.P. | Cache chain structure to implement high bandwidth low latency cache memory subsystem |
DE60143194D1 (de) * | 2000-04-12 | 2010-11-18 | Dsp Group Switzerland Ag | Datenverarbeitungsschaltung mit cachespeicher und vorrichtung mit solcher schaltung |
JP3659941B2 (ja) * | 2002-07-26 | 2005-06-15 | インターナショナル・ビジネス・マシーンズ・コーポレーション | マイクロプロセッサおよびその処理方法 |
US6934830B2 (en) * | 2002-09-26 | 2005-08-23 | Sun Microsystems, Inc. | Method and apparatus for reducing register file access times in pipelined processors |
US20040222379A1 (en) * | 2003-05-09 | 2004-11-11 | Cook Michael Joseph | Event counter for an imaging device |
US7206923B2 (en) * | 2003-12-12 | 2007-04-17 | International Business Machines Corporation | Method and apparatus for eliminating the need for register assignment, allocation, spilling and re-filling |
US20050138297A1 (en) * | 2003-12-23 | 2005-06-23 | Intel Corporation | Register file cache |
US7694075B1 (en) * | 2005-03-09 | 2010-04-06 | Globalfoundries Inc. | System for enabling and disabling cache and a method thereof |
-
2004
- 2004-06-24 US US10/875,373 patent/US7284092B2/en not_active Expired - Fee Related
-
2005
- 2005-06-06 TW TW094118524A patent/TW200609744A/zh unknown
- 2005-06-20 JP JP2005179948A patent/JP4829541B2/ja not_active Expired - Fee Related
- 2005-06-21 CN CNB2005100794172A patent/CN100447738C/zh not_active Expired - Fee Related
-
2007
- 2007-08-08 US US11/835,519 patent/US8793433B2/en not_active Expired - Fee Related
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2006012163A5 (ja) | ||
US20210149820A1 (en) | Two address translations from a single table look-aside buffer read | |
US8661199B2 (en) | Efficient level two memory banking to improve performance for multiple source traffic and enable deeper pipelining of accesses by reducing bank stalls | |
CN109144568B (zh) | 将有效位通道作为矢量断言暴露于cpu | |
CN109643233B (zh) | 具有带读取和读取/前进操作数编码的流引擎的数据处理设备 | |
JP4829541B2 (ja) | マルチレベル・レジスタ・ファイルを有するディジタル・データ処理装置 | |
US10606598B2 (en) | Dual data streams sharing dual level two cache access ports to maximize bandwidth utilization | |
US20110231616A1 (en) | Data processing method and system | |
US20230161587A1 (en) | System and method to control the number of active vector lanes in a processor | |
US20130007415A1 (en) | Method and apparatus for scheduling of instructions in a multi-strand out-of-order processor | |
JPH04313121A (ja) | インストラクションメモリ装置 | |
US11989072B2 (en) | Controlling the number of powered vector lanes via a register field | |
CN109997109B (zh) | 具有提取提前滞后的流引擎 | |
CN108205447B (zh) | 使用早期和后期地址以及循环计数寄存器来跟踪架构状态的流引擎 | |
CN111752616A (zh) | 用于符号存储地址生成的系统、装置和方法 | |
WO2019133258A1 (en) | Look up table with data element promotion | |
US10409602B2 (en) | Vector operand bitsize control | |
US6782470B1 (en) | Operand queues for streaming data: A processor register file extension | |
US7613905B2 (en) | Partial register forwarding for CPUs with unequal delay functional units | |
US20200371793A1 (en) | Vector store using bit-reversed order | |
US7606991B2 (en) | Dynamic clock switch mechanism for memories to improve performance | |
US20130339660A1 (en) | Method and apparatus for a partial-address select-signal generator with address shift | |
US11775310B2 (en) | Data processing system having distrubuted registers | |
JP4151497B2 (ja) | パイプライン処理装置 | |
JP2009098819A (ja) | メモリシステム、メモリシステムの制御方法、及びコンピュータシステム |