JP2006012163A5 - - Google Patents

Download PDF

Info

Publication number
JP2006012163A5
JP2006012163A5 JP2005179948A JP2005179948A JP2006012163A5 JP 2006012163 A5 JP2006012163 A5 JP 2006012163A5 JP 2005179948 A JP2005179948 A JP 2005179948A JP 2005179948 A JP2005179948 A JP 2005179948A JP 2006012163 A5 JP2006012163 A5 JP 2006012163A5
Authority
JP
Japan
Prior art keywords
register
level
registers
execution
logic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2005179948A
Other languages
English (en)
Other versions
JP4829541B2 (ja
JP2006012163A (ja
Filing date
Publication date
Priority claimed from US10/875,373 external-priority patent/US7284092B2/en
Application filed filed Critical
Publication of JP2006012163A publication Critical patent/JP2006012163A/ja
Publication of JP2006012163A5 publication Critical patent/JP2006012163A5/ja
Application granted granted Critical
Publication of JP4829541B2 publication Critical patent/JP4829541B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Claims (29)

  1. 実行するための命令を選択及びデコードする命令ロジックと、
    前記命令によって指定されたオペレーションを遂行する実行ロジックと、
    前記命令からのレジスタ識別子を使用して参照されるレジスタ・データを記憶する複数のレジスタと、
    を含み、
    前記複数のレジスタが複数のレベルとして編成され、
    前記複数のレベルが
    (a)第1のアクセス待ち時間及び第1の数のレジスタを有する第1レベルと、
    (b)第2のアクセス待ち時間及び第2の数のレジスタを有し、前記第2のアクセス待ち時間が前記第1のアクセス待ち時間よりも長く、前記第2の数のレジスタが前記第1の数のレジスタよりも多い、第2レベルとを含み、
    前記実行ロジックへの入力に対して、前記第1レベルのレジスタからの出力及び前記第2レベルのレジスタからの出力のいずれか1つを選択するための実行入力選択ロジックを含む、
    ディジタル・データ処理装置。
  2. 前記第1レベルの前記レジスタに含まれたレジスタ・データが前記第2レベルの前記レジスタに含まれたレジスタ・データのサブセットである、請求項1に記載のディジタル・データ処理装置。
  3. 前記第1レベルの各レジスタが、前記第2レベルのレジスタの複数の個別のサブセットにおける対応するサブセットのレジスタの内容を記憶し、前記対応するサブセットのレジスタが前記第2レベルの複数のレジスタを含む、請求項2に記載のディジタル・データ処理装置。
  4. 前記第1レベルの唯一のレジスタが前記第2レベルの前記レジスタの前記対応するサブセットのそれぞれに対応する、請求項3に記載のディジタル・データ処理装置。
  5. 前記第1レベルの前記レジスタの各々が、最近参照された前記第2レベルのレジスタの対応するサブセットのレジスタの内容を記憶する、請求項4に記載のディジタル・データ処理装置。
  6. 前記レジスタ識別子の各々がNビットからなり、前記第1レベルの前記レジスタが前記レジスタ識別子のMビット部分を使用してアクセスされる(但し、N>M>1)、請求項1に記載のディジタル・データ処理装置。
  7. 前記第1レベルの各レジスタは、該レジスタをアクセスする際に使用される前記レジスタ識別子のMビット部分の値と等しい値をそのMビット部分に有する複数のレジスタ識別子により各々参照される複数の前記第2レベルのレジスタのサブセットのうちのいずれかのレジスタの内容を記憶する、請求項6に記載のディジタル・データ処理装置。
  8. 前記第1レベルの前記レジスタに書き込むために前記実行ロジックに生成された複数の結果の1つを選択するための結果選択ロジックを更に含み、
    前記結果選択ロジックが前記第2レベルの前記レジスタの少なくとも1つの出力を入力として更に受ける、請求項1に記載のディジタル・データ処理装置。
  9. 命令の選択されたシーケンスに対する前記第1レベルのレジスタからの出力をディセーブルするために前記実行入力選択ロジックを制御する、請求項に記載のディジタル・データ処理装置。
  10. 前記実行入力選択ロジックの制御は、前記第1レベルのレジスタの参照において検出された無効データの比率を動的に監視し、監視結果に基づいて行う、請求項9に記載のディジタル・データ処理装置。
  11. 前記第1レベルのレジスタからの出力が有効である場合に前記出力を選択し、前記第1レベルのレジスタからの出力が有効でない場合に前記第2レベルのレジスタからの出力を選択するように前記実行入力選択ロジックを制御する、請求項に記載のディジタル・データ処理装置。
  12. 前記命令ロジックが、実行のための命令を複数のスレッドから同時に選択及びデコードし、
    前記複数のレジスタが複数のレジスタ・セットを含み、前記レジスタ・セットの各々が前記複数のスレッドにおけるそれぞれのスレッドに対応し且つ前記第1レベルのレジスタ及び前記第2レベルのレジスタを含む、
    請求項1に記載のディジタル・データ処理装置。
  13. 前記命令ロジックが単一のクロック・サイクルにおいて実行するための複数の命令をディスパッチすることができる、請求項1に記載のディジタル・データ処理装置。
  14. 複数の汎用レジスタとスカラ・データを処理するための実行ロジックとを有する実行ユニットと、
    複数のオペランド・セットに関するオペレーションを並行して遂行するためのベクトル処理サブユニットと、
    を更に含み、
    前記ベクトル処理サブユニットが複数のレベルとして編成された前記複数のレジスタを含む、請求項1に記載のディジタル・データ処理装置。
  15. 単一の半導体チップとして具現化される、請求項1に記載のディジタル・データ処理装置。
  16. 命令を含むデータを記憶するためのメモリと、
    前記メモリからの命令を実行するための少なくとも1つのプロセッサと、
    を含み、
    前記プロセッサが、
    (a)実行するための命令を選択及びデコードする命令ロジックと、
    (b)前記命令によって指定されたオペレーションを遂行する実行ロジックと、
    (c)前記命令からのレジスタ識別子を使用して参照されるレジスタ・データを記憶する複数のレジスタと、
    を含み、
    前記複数のレジスタが複数のレベルとして編成され、
    前記複数のレベルが
    (i)第1のアクセス待ち時間及び第1の数のレジスタを有する第1レベルと、
    (ii)第2のアクセス待ち時間及び第2の数のレジスタを有し、前記第2のアクセス待ち時間が前記第1のアクセス待ち時間よりも長く、前記第2の数のレジスタが前記第1の数のレジスタよりも多い、第2レベルとを含み、
    前記実行ロジックへの入力に対して、前記第1レベルのレジスタからの出力及び前記第2レベルのレジスタからの出力のいずれか1つを選択するための実行入力選択ロジックを含む、
    コンピュータ・システム。
  17. 前記第1レベルの前記レジスタに含まれたレジスタ・データが前記第2レベルの前記レジスタに含まれたレジスタ・データのサブセットである、請求項16に記載のコンピュータ・システム。
  18. 前記第1レベルの各レジスタが、前記第2レベルのレジスタの複数の個別のサブセットの対応するサブセットのレジスタの内容を記憶し、前記対応するサブセットのレジスタが前記第2レベルの複数のレジスタを含む、請求項17に記載のコンピュータ・システム。
  19. 前記第1レベルの唯一のレジスタが前記第2レベルの前記レジスタの前記対応するサブセットのそれぞれに対応する、請求項18に記載のコンピュータ・システム。
  20. 前記第1レベルの前記レジスタの各々が、最近参照された前記第2レベルのレジスタの対応するサブセットのレジスタの内容を記憶する、請求項19に記載のコンピュータ・システム。
  21. 前記レジスタ識別子の各々がNビットからなり、前記第1レベルの前記レジスタが前記レジスタ識別子のMビット部分を使用してアクセスされる(但し、N>M>1)、請求項16に記載のコンピュータ・システム。
  22. 前記第1レベルの各レジスタは、該レジスタをアクセスする際に使用される前記レジスタ識別子のMビット部分の値と等しい値をそのMビット部分に有する複数のレジスタ識別子により各々参照される複数の前記第2レベルのレジスタのサブセットのうちのいずれかのレジスタの内容を記憶する、請求項21に記載のコンピュータ・システム。
  23. 前記プロセッサが、前記第1レベルの前記レジスタに書き込むために前記実行ロジックに生成された複数の結果の1つを選択するための結果選択ロジックを更に含み、
    前記結果選択ロジックが、前記第2レベルの前記レジスタの少なくとも1つの出力を入力として更に受ける、請求項16に記載のコンピュータ・システム。
  24. 前記プロセッサが、命令の選択されたシーケンスに対する前記第1レベルのレジスタからの出力をディセーブルするために前記実行入力選択ロジックを制御する、請求項16に記載のコンピュータ・システム。
  25. 前記実行入力選択ロジックの制御は、前記第1レベルのレジスタの参照において検出された無効データの比率を動的に監視し、監視結果に基づいて行う、請求項24に記載のコンピュータ・システム。
  26. 前記プロセッサは、前記第1レベルのレジスタからの出力が有効である場合に前記出力を選択し、前記第1レベルのレジスタからの出力が有効でない場合に前記第2レベルのレジスタからの出力を選択するように前記実行入力選択ロジックを制御する、請求項16に記載のコンピュータ・システム。
  27. 前記命令ロジックが、実行のための命令を複数のスレッドから同時に選択及びデコードし、
    前記複数のレジスタが複数のレジスタ・セットを含み、前記レジスタ・セットの各々が前記複数のスレッドにおけるそれぞれのスレッドに対応し且つ前記第1レベルのレジスタ及び前記第2レベルのレジスタを含む、
    請求項16に記載のコンピュータ・システム。
  28. 複数のプロセッサを含み、
    前記プロセッサの各々が、
    (a)実行するための命令を選択及びデコードする命令ロジックと、
    (b)前記命令によって指定されたオペレーションを遂行する実行ロジックと、
    (c)前記命令からのレジスタ識別子を使用して参照されるレジスタ・データを記憶する複数のレジスタと、
    を含み、
    前記複数のレジスタが複数のレベルとして編成され、
    前記複数のレベルが
    (i)第1のアクセス待ち時間及び第1の数のレジスタを有する第1レベルと、
    (ii)第2のアクセス待ち時間及び第2の数のレジスタを有し、前記第2のアクセス待ち時間が前記第1のアクセス待ち時間よりも長く、前記第2の数のレジスタが前記第1の数のレジスタよりも多い、第2レベルとを含み、
    前記実行ロジックへの入力に対して、前記第1レベルのレジスタからの出力及び前記第2レベルのレジスタからの出力のいずれか1つを選択するための実行入力選択ロジックを含む、
    コンピュータ・システム。
  29. 前記メモリに含まれたデータの選択的部分を一時的に記憶するためのキャッシュ・メモリを更に含む、請求項16に記載のコンピュータ・システム。
JP2005179948A 2004-06-24 2005-06-20 マルチレベル・レジスタ・ファイルを有するディジタル・データ処理装置 Expired - Fee Related JP4829541B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US10/875,373 US7284092B2 (en) 2004-06-24 2004-06-24 Digital data processing apparatus having multi-level register file
US10/875,373 2004-06-24

Publications (3)

Publication Number Publication Date
JP2006012163A JP2006012163A (ja) 2006-01-12
JP2006012163A5 true JP2006012163A5 (ja) 2008-06-19
JP4829541B2 JP4829541B2 (ja) 2011-12-07

Family

ID=35507434

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005179948A Expired - Fee Related JP4829541B2 (ja) 2004-06-24 2005-06-20 マルチレベル・レジスタ・ファイルを有するディジタル・データ処理装置

Country Status (4)

Country Link
US (2) US7284092B2 (ja)
JP (1) JP4829541B2 (ja)
CN (1) CN100447738C (ja)
TW (1) TW200609744A (ja)

Families Citing this family (72)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7263593B2 (en) * 2002-11-25 2007-08-28 Hitachi, Ltd. Virtualization controller and data transfer control method
US7933405B2 (en) * 2005-04-08 2011-04-26 Icera Inc. Data access and permute unit
US7861060B1 (en) * 2005-12-15 2010-12-28 Nvidia Corporation Parallel data processing systems and methods using cooperative thread arrays and thread identifier values to determine processing behavior
US7788468B1 (en) 2005-12-15 2010-08-31 Nvidia Corporation Synchronization of threads in a cooperative thread array
WO2007143278A2 (en) 2006-04-12 2007-12-13 Soft Machines, Inc. Apparatus and method for processing an instruction matrix specifying parallel and dependent operations
US9069547B2 (en) 2006-09-22 2015-06-30 Intel Corporation Instruction and logic for processing text strings
CN101627365B (zh) * 2006-11-14 2017-03-29 索夫特机械公司 多线程架构
US7797514B2 (en) * 2006-11-16 2010-09-14 Texas Instruments Incorporated Scalable multi-threaded sequencing/synchronizing processor architecture
US20080229062A1 (en) * 2007-03-12 2008-09-18 Lorenzo Di Gregorio Method of sharing registers in a processor and processor
US20090006753A1 (en) * 2007-06-28 2009-01-01 David Arnold Luick Design structure for accessing a cache with an effective address
US7937530B2 (en) * 2007-06-28 2011-05-03 International Business Machines Corporation Method and apparatus for accessing a cache with an effective address
US7877582B2 (en) * 2008-01-31 2011-01-25 International Business Machines Corporation Multi-addressable register file
US7849294B2 (en) * 2008-01-31 2010-12-07 International Business Machines Corporation Sharing data in internal and memory representations with dynamic data-driven conversion
US8176406B2 (en) * 2008-03-19 2012-05-08 International Business Machines Corporation Hard error detection
US8631223B2 (en) 2010-05-12 2014-01-14 International Business Machines Corporation Register file supporting transactional processing
US8914619B2 (en) * 2010-06-22 2014-12-16 International Business Machines Corporation High-word facility for extending the number of general purpose registers available to instructions
US8661227B2 (en) * 2010-09-17 2014-02-25 International Business Machines Corporation Multi-level register file supporting multiple threads
KR101685247B1 (ko) 2010-09-17 2016-12-09 소프트 머신즈, 인크. 조기 원거리 분기 예측을 위한 섀도우 캐시를 포함하는 단일 사이클 다중 분기 예측
US8725993B2 (en) * 2011-02-23 2014-05-13 International Business Machines Corporation Thread transition management
US9766893B2 (en) 2011-03-25 2017-09-19 Intel Corporation Executing instruction sequence code blocks by using virtual cores instantiated by partitionable engines
KR101826121B1 (ko) 2011-03-25 2018-02-06 인텔 코포레이션 분할가능한 엔진에 의해 인스턴스화된 가상 코어를 이용한 코드 블록의 실행을 지원하는 메모리 프래그먼트
EP2689330B1 (en) 2011-03-25 2022-12-21 Intel Corporation Register file segments for supporting code block execution by using virtual cores instantiated by partitionable engines
EP2710481B1 (en) 2011-05-20 2021-02-17 Intel Corporation Decentralized allocation of resources and interconnect structures to support the execution of instruction sequences by a plurality of engines
US9442772B2 (en) 2011-05-20 2016-09-13 Soft Machines Inc. Global and local interconnect structure comprising routing matrix to support the execution of instruction sequences by a plurality of engines
US8595460B2 (en) * 2011-08-26 2013-11-26 Vmware, Inc. Configuring object storage system for input/output operations
US9727336B2 (en) 2011-09-16 2017-08-08 International Business Machines Corporation Fine-grained instruction enablement at sub-function granularity based on an indicated subrange of registers
US9411585B2 (en) 2011-09-16 2016-08-09 International Business Machines Corporation Multi-addressable register files and format conversions associated therewith
US8615745B2 (en) 2011-10-03 2013-12-24 International Business Machines Corporation Compiling code for an enhanced application binary interface (ABI) with decode time instruction optimization
US8612959B2 (en) 2011-10-03 2013-12-17 International Business Machines Corporation Linking code for an enhanced application binary interface (ABI) with decode time instruction optimization
US9329869B2 (en) 2011-10-03 2016-05-03 International Business Machines Corporation Prefix computer instruction for compatibily extending instruction functionality
US8756591B2 (en) 2011-10-03 2014-06-17 International Business Machines Corporation Generating compiled code that indicates register liveness
US9286072B2 (en) 2011-10-03 2016-03-15 International Business Machines Corporation Using register last use infomation to perform decode-time computer instruction optimization
US9354874B2 (en) 2011-10-03 2016-05-31 International Business Machines Corporation Scalable decode-time instruction sequence optimization of dependent instructions
US20130086364A1 (en) * 2011-10-03 2013-04-04 International Business Machines Corporation Managing a Register Cache Based on an Architected Computer Instruction Set Having Operand Last-User Information
US10078515B2 (en) 2011-10-03 2018-09-18 International Business Machines Corporation Tracking operand liveness information in a computer system and performing function based on the liveness information
US9690583B2 (en) 2011-10-03 2017-06-27 International Business Machines Corporation Exploiting an architected list-use operand indication in a computer system operand resource pool
US9697002B2 (en) 2011-10-03 2017-07-04 International Business Machines Corporation Computer instructions for activating and deactivating operands
US20150039859A1 (en) 2011-11-22 2015-02-05 Soft Machines, Inc. Microprocessor accelerated code optimizer
EP2783280B1 (en) 2011-11-22 2019-09-11 Intel Corporation An accelerated code optimizer for a multiengine microprocessor
US9582464B2 (en) * 2011-12-23 2017-02-28 Intel Corporation Systems, apparatuses, and methods for performing a double blocked sum of absolute differences
US9286068B2 (en) 2012-10-31 2016-03-15 International Business Machines Corporation Efficient usage of a multi-level register file utilizing a register file bypass
US10275251B2 (en) 2012-10-31 2019-04-30 International Business Machines Corporation Processor for avoiding reduced performance using instruction metadata to determine not to maintain a mapping of a logical register to a physical register in a first level register file
EP2972836B1 (en) 2013-03-15 2022-11-09 Intel Corporation A method for emulating a guest centralized flag architecture by using a native distributed flag architecture
WO2014150991A1 (en) 2013-03-15 2014-09-25 Soft Machines, Inc. A method for implementing a reduced size register view data structure in a microprocessor
KR101708591B1 (ko) 2013-03-15 2017-02-20 소프트 머신즈, 인크. 블록들로 그룹화된 멀티스레드 명령어들을 실행하기 위한 방법
US9569216B2 (en) 2013-03-15 2017-02-14 Soft Machines, Inc. Method for populating a source view data structure by using register template snapshots
US9886279B2 (en) 2013-03-15 2018-02-06 Intel Corporation Method for populating and instruction view data structure by using register template snapshots
US9904625B2 (en) 2013-03-15 2018-02-27 Intel Corporation Methods, systems and apparatus for predicting the way of a set associative cache
US9811342B2 (en) 2013-03-15 2017-11-07 Intel Corporation Method for performing dual dispatch of blocks and half blocks
US9891924B2 (en) 2013-03-15 2018-02-13 Intel Corporation Method for implementing a reduced size register view data structure in a microprocessor
US10140138B2 (en) 2013-03-15 2018-11-27 Intel Corporation Methods, systems and apparatus for supporting wide and efficient front-end operation with guest-architecture emulation
US10275255B2 (en) 2013-03-15 2019-04-30 Intel Corporation Method for dependency broadcasting through a source organized source view data structure
WO2014150806A1 (en) 2013-03-15 2014-09-25 Soft Machines, Inc. A method for populating register view data structure by using register template snapshots
WO2014150971A1 (en) 2013-03-15 2014-09-25 Soft Machines, Inc. A method for dependency broadcasting through a block organized source view data structure
US9508112B2 (en) * 2013-07-31 2016-11-29 Apple Inc. Multi-threaded GPU pipeline
US9378146B2 (en) 2013-08-20 2016-06-28 Apple Inc. Operand cache design
US9652233B2 (en) 2013-08-20 2017-05-16 Apple Inc. Hint values for use with an operand cache
US9459869B2 (en) 2013-08-20 2016-10-04 Apple Inc. Intelligent caching for an operand cache
US9870340B2 (en) * 2015-03-30 2018-01-16 International Business Machines Corporation Multithreading in vector processors
US9952865B2 (en) * 2015-04-04 2018-04-24 Texas Instruments Incorporated Low energy accelerator processor architecture with short parallel instruction word and non-orthogonal register data file
US9619394B2 (en) 2015-07-21 2017-04-11 Apple Inc. Operand cache flush, eviction, and clean techniques using hint information and dirty information
US9785567B2 (en) 2015-09-11 2017-10-10 Apple Inc. Operand cache control techniques
US10241790B2 (en) 2015-12-15 2019-03-26 International Business Machines Corporation Operation of a multi-slice processor with reduced flush and restore latency
US20170371654A1 (en) * 2016-06-23 2017-12-28 Advanced Micro Devices, Inc. System and method for using virtual vector register files
GB2552154B (en) * 2016-07-08 2019-03-06 Advanced Risc Mach Ltd Vector register access
US10613987B2 (en) 2016-09-23 2020-04-07 Apple Inc. Operand cache coherence for SIMD processor supporting predication
US10423415B2 (en) * 2017-04-01 2019-09-24 Intel Corporation Hierarchical general register file (GRF) for execution block
CN111951845B (zh) * 2019-05-15 2022-06-03 上海磁宇信息科技有限公司 一种分级管理冗余存储的mram芯片
US11848980B2 (en) * 2020-07-09 2023-12-19 Boray Data Technology Co. Ltd. Distributed pipeline configuration in a distributed computing system
TWI783310B (zh) * 2020-11-26 2022-11-11 華邦電子股份有限公司 計數方法以及計數裝置
CN112817639B (zh) * 2021-01-13 2022-04-08 中国民航大学 Gpu读写单元通过操作数收集器访问寄存器文件的方法
CN116560729B (zh) * 2023-05-11 2024-06-04 北京市合芯数字科技有限公司 一种多线程处理器的寄存器多级管理方法及系统

Family Cites Families (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4128880A (en) 1976-06-30 1978-12-05 Cray Research, Inc. Computer vector register processing
US5179681A (en) 1989-11-16 1993-01-12 Sun Microsystems, Inc. Method and apparatus for current window cache with switchable address and out cache registers
US5226142A (en) 1990-11-21 1993-07-06 Ross Technology, Inc. High performance register file with overlapping windows
JP3479538B2 (ja) * 1991-12-26 2003-12-15 テキサス インスツルメンツ インコーポレイテツド 半導体集積回路を製作する方法
JPH06222990A (ja) * 1992-10-16 1994-08-12 Fujitsu Ltd データ処理装置
JP3676411B2 (ja) 1994-01-21 2005-07-27 サン・マイクロシステムズ・インコーポレイテッド レジスタファイル装置及びレジスタファイルアクセス方法
US5592679A (en) * 1994-11-14 1997-01-07 Sun Microsystems, Inc. Apparatus and method for distributed control in a processor architecture
EP0717359A3 (en) * 1994-12-15 1997-02-05 Sun Microsystems Inc Register cache memory for a computer processor
US5974438A (en) * 1996-12-31 1999-10-26 Compaq Computer Corporation Scoreboard for cached multi-thread processes
US6131155A (en) * 1997-11-07 2000-10-10 Pmc Sierra Ltd. Programmer-visible uncached load/store unit having burst capability
US6108770A (en) * 1998-06-24 2000-08-22 Digital Equipment Corporation Method and apparatus for predicting memory dependence using store sets
US6381678B2 (en) * 1998-10-30 2002-04-30 Intel Corporation Processing ordered data requests to a memory
US6282614B1 (en) * 1999-04-15 2001-08-28 National Semiconductor Corporation Apparatus and method for reducing the power consumption of a microprocessor with multiple levels of caches
US6557078B1 (en) * 2000-02-21 2003-04-29 Hewlett Packard Development Company, L.P. Cache chain structure to implement high bandwidth low latency cache memory subsystem
DE60143194D1 (de) * 2000-04-12 2010-11-18 Dsp Group Switzerland Ag Datenverarbeitungsschaltung mit cachespeicher und vorrichtung mit solcher schaltung
JP3659941B2 (ja) * 2002-07-26 2005-06-15 インターナショナル・ビジネス・マシーンズ・コーポレーション マイクロプロセッサおよびその処理方法
US6934830B2 (en) * 2002-09-26 2005-08-23 Sun Microsystems, Inc. Method and apparatus for reducing register file access times in pipelined processors
US20040222379A1 (en) * 2003-05-09 2004-11-11 Cook Michael Joseph Event counter for an imaging device
US7206923B2 (en) * 2003-12-12 2007-04-17 International Business Machines Corporation Method and apparatus for eliminating the need for register assignment, allocation, spilling and re-filling
US20050138297A1 (en) * 2003-12-23 2005-06-23 Intel Corporation Register file cache
US7694075B1 (en) * 2005-03-09 2010-04-06 Globalfoundries Inc. System for enabling and disabling cache and a method thereof

Similar Documents

Publication Publication Date Title
JP2006012163A5 (ja)
US20210149820A1 (en) Two address translations from a single table look-aside buffer read
US8661199B2 (en) Efficient level two memory banking to improve performance for multiple source traffic and enable deeper pipelining of accesses by reducing bank stalls
CN109144568B (zh) 将有效位通道作为矢量断言暴露于cpu
CN109643233B (zh) 具有带读取和读取/前进操作数编码的流引擎的数据处理设备
JP4829541B2 (ja) マルチレベル・レジスタ・ファイルを有するディジタル・データ処理装置
US10606598B2 (en) Dual data streams sharing dual level two cache access ports to maximize bandwidth utilization
US20110231616A1 (en) Data processing method and system
US20230161587A1 (en) System and method to control the number of active vector lanes in a processor
US20130007415A1 (en) Method and apparatus for scheduling of instructions in a multi-strand out-of-order processor
JPH04313121A (ja) インストラクションメモリ装置
US11989072B2 (en) Controlling the number of powered vector lanes via a register field
CN109997109B (zh) 具有提取提前滞后的流引擎
CN108205447B (zh) 使用早期和后期地址以及循环计数寄存器来跟踪架构状态的流引擎
CN111752616A (zh) 用于符号存储地址生成的系统、装置和方法
WO2019133258A1 (en) Look up table with data element promotion
US10409602B2 (en) Vector operand bitsize control
US6782470B1 (en) Operand queues for streaming data: A processor register file extension
US7613905B2 (en) Partial register forwarding for CPUs with unequal delay functional units
US20200371793A1 (en) Vector store using bit-reversed order
US7606991B2 (en) Dynamic clock switch mechanism for memories to improve performance
US20130339660A1 (en) Method and apparatus for a partial-address select-signal generator with address shift
US11775310B2 (en) Data processing system having distrubuted registers
JP4151497B2 (ja) パイプライン処理装置
JP2009098819A (ja) メモリシステム、メモリシステムの制御方法、及びコンピュータシステム