CN103309644B

CN103309644B - 用于微处理器的转译地址高速缓存

Info

Publication number: CN103309644B
Application number: CN201310079112.6A
Authority: CN
Inventors: 罗斯·泽格尔肯; 亚历山大·克莱贝尔; 纳瑟·塔克; 戴维·邓恩
Original assignee: Nvidia Corp
Current assignee: Nvidia Corp
Priority date: 2012-03-13
Filing date: 2013-03-13
Publication date: 2016-08-03
Anticipated expiration: 2033-03-13
Also published as: CN103309644A; US20130246709A1; TW201407348A; DE102013201767B4; DE102013201767A1; TWI515567B; US10146545B2

Abstract

提供了从包括在微处理器中的指令高速缓存获取指令和达到与指令相同功能性的替代版本相关的实施例。在一个示例中，提供了方法，其包括在示范性微处理器处从指令高速缓存获取指令。示范性方法还包括对用于指令的地址进行散列来确定达到与该指令相同功能性的指令的替代版本是否存在。示范性方法进一步包括，如果散列导致确定这样的替代版本存在，那么中止指令的获取并检索以及执行替代版本。

Description

用于微处理器的转译地址高速缓存

背景技术

可在指令集架构（ISA）和本地（native）架构之间转译用于微处理器的架构级指令。在一些微处理器中，ISA指令的软件优化可比那些软件优化所基于的ISA指令相对更有效地执行。一些过去的方法对软件优化加以链接以从一个软件优化到另一个软件优化来传递控制。然而，因为可能难以确定间接分支的目标，所以这样的方法可能受到经间接分支的过程的挑战。

附图说明

图1示意性示出了根据本公开的实施例的微处理器。

图2示意性示出了根据本公开的实施例的转译地址高速缓存。

图3A示出了根据本公开的实施例的、从指令高速缓存获取指令和确定用于指令的替代版本是否存储在指令高速缓存中的方法的流程图的一部分。

图3B示出了图3A中所示出的流程图的另一部分。

图3C示出了图3A和图3B中所示出的流程图的另一部分。

图4示意性示出了根据本公开的实施例的对用于指令的线性地址进行散列以生成用于该线性地址的散列（hash）索引和消歧标签的方法。

图5示意性示出了根据本公开的实施例的转译地址高速缓存条目。

具体实施方式

在现代微处理器中，可在诸如高级RISC机器（ARM）架构或x86架构的源指令集架构（ISA）和取得与该源相同可觉察功能性的替代ISA之间转译架构级指令。例如，源ISA的一个或多个指令的集合可转译为实施与该源ISA相同功能的本地架构的一个或多个微操作。在一些设定中，本地微操作可提供相对于源ISA指令的增强的或优化的性能。

一些过去的方法试图对源指令的软件优化进行链接使得控制经由直接本地分支从一个软件优化传递到另一个软件优化。然而，这样的方法可能受到经分支的过程的挑战。因为在程序执行期间分支源可以是动态的，因此软件优化之间的链向交递可能不可行。例如，如果间接分支发生，那么分支的不确定目标可能使得难以查明在创建优化的时候应该检索哪个软件优化。因此，当从潜在的数千候选优化来确定分支和用于该分支的软件优化时微处理器可能停滞。

因此，本文所公开的各种实施例与获取源信息和源信息的替代版本相关，所述源信息的替代版本在可接受公差内（例如，在架构上可觉察效应的可接受公差内）达到源信息的相同可觉察功能性（本文以相同功能性（thesamefunctionality）来指代）。应该理解，几乎可采用任何合适的源信息和其任何替代版本，而不脱离本公开的范围。在一些实施例中，源可包括诸如用于ISA架构的指令的指令。补充或者取代指令，源信息可包括源数据，并且替代版本可包括源数据的可替换的形式或版本。同样地，应该理解，将源转换为其替代版本（例如，软件方法和/或硬件方法）的任何合适的方式均可视为是在本公开的范围内。出于示例性目的，尽管这样的实施例不是限制性的，但是本文所呈现的描述和图形分别将源指令和源指令的转译指代为源信息和源信息的替代版本。

一个示范性方法包括，一旦被引导以检索指令时，就对用于该指令的地址进行散列使得可确定是否存在用于该指令的替代版本。实施散列以确定是否存在达到相同功能性的指令的替代版本，诸如本地转译（例如，在源指令集架构和本地微操作集架构之间的、用于可由微处理器所获取以用于执行的各种指令的转译）。该示范性方法进一步包括，如果散列导致确定这样的替代版本存在，则中止（abort）检索指令并且检索和执行替代版本。

本文的论述将频繁提到“检索（retrieving）”指令以及如果存在某些条件，那么随后中止该检索。在一些实施例中，“检索”指令可包括对指令进行获取。进一步地，当这样的中止发生时，则检索过程终止。终止典型性地在检索过程完成之前发生。例如，在一个场景中，中止检索可在当正在检索用于指令的物理地址时发生。在另一个场景中，中止检索可在检索用于指令的物理地址之后但在从存储器检索该指令之前发生。在检索过程完成之前中止检索可节省花费在访问和从存储器检索源的时间。应该理解，如本文所使用的，检索不限于获取场景，其中获取典型性地在解码之前完成。例如，可在解码期间、在解码之前或在任何合适的点检索但中止指令。

对于在源信息和该信息的经转译版本之间进行映射和转译而言存在各种不同的可能性。通过确定替代版本是否存在并且中止检索指令，例如，ISA指令，如果替代版本的确存在，那么微处理器通过避免解码操作可相对于解码源ISA指令的微处理器提供增强的性能。附加的性能增强可在设定中实现，在该设定中替代版本通过对操作的改变来提供经优化的性能，其允许替代版本比源ISA指令更快地进行执行。

图1示意性描绘了微处理器100的实施例，可结合本文所描述的系统和方法来采用所述微处理器100。微处理器100可包括处理器寄存器109。进一步地，微处理器100可包括和/或可与存储器层级结构110通信，该存储器层级结构110可包括L1处理器高速缓存110A、L2处理器高速缓存110B、L3处理器高速缓存110C、主存储器110D（例如，一个或多个DRAM芯片）、二级存储110E（例如，磁和/或光存储单元）和/或三级存储110F（例如，磁带群）。应该理解，这些示范性的存储器/存储部件按照访问时间和容量的递增顺序列出，尽管可能有例外。

存储器控制器110H可用来处置协议并且提供主存储器110D的所要求的信号接口以及用来调度存储器访问。存储器控制器110H可在处理器裸片（die）或在分开的裸片上实现。可以理解，上文所提供的存储器层级结构是非限制性的并且可使用其他存储器层级结构，而不脱离本公开的范围。

微处理器100还包括管线，其在图1中以简化形式示出为管线102。管线可允许多于一个指令并发地处于检索和执行的不同阶段中。换句话说，可通过管线102中所包括的各阶段（其中包括获取、解码、执行和回写阶段）来传递指令集，同时由管线102从存储器中检索并作用于另一个指令和/或数据。因此，管线102中的下游阶段可被利用，同时上游阶段正在等待存储器返回指令和/或数据等等。该方法可相对于以单独的、串行的方式检索和执行指令和/或数据的方法而言，潜在地加速由微处理器进行的指令和数据处理。

如图1所示，示范性管线102包括获取逻辑120、本地转译缓冲区130、解码逻辑132、调度逻辑134、执行逻辑136、mem（存储）逻辑138以及回写逻辑140。获取逻辑120从指令高速缓存获取所选择的指令用于执行。在图1中所示的示例中，获取逻辑120包括指令转译后备缓冲区122，用于将所选择的指令的线性地址转译为用于待获取以执行的指令的物理地址。如本文所使用的，用于指令的线性地址是指由页表所转译/重映射到与指令存储于该处的存储器中的位置相关联的物理地址的地址。在一些实施例中，线性地址可包括目录、表和/或偏移条目，所述偏移条目可识别可在该处发现用于指令的物理地址的页目录、页表和/或页表中的页帧位置。

指令转译后备缓冲区122几乎可对于那些指令实施将线性地址转译为物理地址的任何合适的方式。例如，在一些实施例中，指令转译后备缓冲区122可包括内容可寻址存储器，该内容可寻址存储器存储将用于指令的线性地址映射到用于那些指令的物理地址的页表的一部分。

获取逻辑120还确定是否存在用于所选择的指令的本地转译。如果这样的本地转译存在，那么系统中止指令获取并且替代地发送本地转译用于执行。在图1所描绘的实施例中，获取逻辑120包括转译地址高速缓存124用于存储本地转译的地址。

几乎任何合适的数据存储架构和逻辑均可用于转译地址高速缓存124。例如，图2示意性示出了用作转译地址高速缓存的4路（way）关联高速缓存200的实施例。在图2所示的实施例中，1024个转译地址条目可存储在4路的任何一个中，其取决于所选择的地址方案，每一路包括256个数据位置。然而，应该理解，一些实施例可具有更少的数据路和/或数据位置而其他实施例可包括更多的数据路和/或数据位置，而不脱离本公开的范围。

继续图1，获取逻辑120包括物理地址多路复用器126，该物理地址多路复用器126对从指令转译后备缓冲区122和转译地址高速缓存124中接收的物理地址进行多路复用并且将其分布到指令高速缓存128。反过来，指令高速缓存128参照用于那些指令和本地转译的物理地址来检索所存储以用于由微处理器100执行的指令和本地转译。如果获取逻辑120确定针对所选择的指令存在本地转译，则从指令高速缓存128检索该本地转移并且可被转发到可选的本地转译缓冲区130以为最终分布到调度逻辑134做准备。可替代地，如果获取逻辑120确定针对所选择的指令不存在本地转译，那么从指令高速缓存128检索所选择的指令并且转发到解码逻辑132。解码逻辑132例如通过解析操作码、操作数以及寻址模式来解码所选择的指令，并且生成一个或多个本地指令或微操作的经解码集合以为分布到调度逻辑134做准备。调度逻辑134调度本地转译和经解码指令用于由执行逻辑136执行。

图1中所描绘的实施例示出了指令高速缓存128，其包括物理索引物理标签（physically-indexed-physically-tagged（PIPT））指令高速缓存，使得可与从指令转译后备缓冲区122中检索源地址并发地从转译地址高速缓存124中检索用于本地转译的地址。然而，应该理解，可随着任何合适的指令高速缓存128来采用根据本公开的实施例。例如，在一些实施例中，指令高速缓存128可包括线性索引物理标签（linear-indexed-physically-tagged（LIPT））指令高速缓存。在这样的实施例中，获取逻辑可并发地从指令转译后备缓冲区中检索用于源的地址、从转译地址高速缓存中检索用于本地转译的地址、以及从LIPT指令高速缓存中检索源。如果存在可用的本地转译，那么可丢弃指令并且可基于用于本地转译的地址从LIPT高速缓存检索本地转译以用于执行。如果不存在可用的本地转译版本，那么可解码指令并且随后加以执行。

管线102还可包括用于实施加载和/或存储操作的mem逻辑138和用于将操作的结果写到诸如寄存器109的适当的位置的回写逻辑140。一旦进行回写，则微处理器输入由指令或多个指令所修改的状态，使得导致所提交状态的操作的结果可能无可挽回。

应该理解，管线102中所示的上述阶段是示例性的典型RISC实现方案，并且不意味着是限制性的。例如，在一些实施例中，VLIW技术可在某些管线化阶段的上游实现。在一些其他实施例中，调度逻辑可包括在微处理器的获取逻辑和/或解码逻辑中。更普遍地，微处理器可包括获取、解码和执行逻辑，而mem和回写功能性由执行逻辑所执行。本公开同等地适用于这些和其他微处理器实现方案。

在所描述的示例中，可以一次一个或者一次多于一个地获取和执行指令，这可能要求多个时钟周期。在该时间期间，数据路径的有效部分可能是未被使用的。补充或者代替单个指令获取，可使用预取方法以改进性能以及避免与读取和存储操作（即指令的读取以及将这样的指令加载到处理器寄存器和/或执行队列中）相关联的时延瓶颈。因此，应予以理解的是，几乎可使用获取、调度和分派指令的任意合适的方式，而不脱离本公开的范围。

图3A-C示意性示出了用于从指令高速缓存中获取所选择的指令和确定用于所选择的指令的本地转译是否存储在指令高速缓存中的方法300的实施例。当就对于指令确定本地转译是否可用而描述方法300时，应予以理解的是，该场景仅是获取指令和确定是否存在达到与该指令相同功能性的替代版本的例示，并且该方法300不限于下面所述的示例和设定。因此，应予以理解的是，对方法300中所述的过程出于示例性目的而加以安排和和描述，并且不意在加以限制。在一些实施例中，本文所述的方法可包括附加的或可替代的过程，而在一些实施例中，本文所述的方法可包括可被重新排序或省略的一些过程，而不脱离本公开的范围。进一步地，应予以理解的是，可使用包括本文所述硬件的任何合适的硬件来实施本文所述的方法。

转向图3A，在302处，方法300包括正被引导以从指令高速缓存获取所选择的指令。在一些实施例中，可引导获取过程以参照用于所选择的指令的线性地址来检索指令。例如，可响应于到目标指令指针的分支而从指令高速缓存中获取所选择的指令，诸如可因分支预测器或因微处理器管线中的分支验证点而产生的分支。应该理解，过程302可如以下更多细节所描述的包括在指令转译后备缓冲区中查找用于该选择的物理地址。

在一些实施例中，获取所选择的指令可包括从指令转译后备缓冲区中获取用于所选择的指令的物理地址。在这样的实施例中，可根据到目标指令指针的引导来接收用于所选择的指令的线性地址。反过来，可由指令转译后备缓冲区通过参照线性地址以搜索存储在指令后备缓冲区中的物理地址来将线性地址转译成用于所选择的指令的物理地址。如果搜索未发现用于所选择的指令的物理地址，那么该物理地址可经由页走（pagewalk）或经由在更高级别的转译后备缓冲区中的查找来加以确定。不管如何确定物理地址，一旦用于所选择的指令的物理地址被确定，其就被提供到指令高速缓存使得可获得所选择的指令。

在304处，方法300包括对用于所选择的指令的线性地址进行散列以当正在获得用于所选择的指令的物理地址的同时从线性地址生成散列索引。如下以更多细节所描述的，当确定用于所选择的指令的本地转译是否存在时可随后使用散列索引。

例如，到目标指令指针的引导可导致与线性地址到指令转译后备缓冲区的分布一起并发地（在合适的公差内）对线性地址进行散列。然而，应予以理解的是，可在过程流内的任何合适的位置采用实施散列的任何合适的方式，而不脱离本公开的范围。

在一些实施例中，可通过包括在微处理器中的合适的硬件结构来对线性地址进行散列。例如，线性地址可由获取逻辑和/或本地转译地址高速缓存进行散列，尽管几乎任何合适的硬件结构均可用来对线性地址进行散列而不脱离本公开的范围。

可采用种类繁多的散列技术。例如，在一些实施例中，可使用XOR散列函数来生成散列索引。还可通过对线性地址的多个部分进行散列来生成散列索引。在一些其他实施例中，可通过使用线性地址的单个部分来生成散列索引。图4示意性示出了使用XOR散列函数对用于指令的48位线性地址进行散列以生成8位散列索引的方法。在图4中所示的示例中，将位0-7与位8-15进行XOR的结果与位16-23进行XOR以生成8位散列索引。

在一些实施例中，当线性地址被散列时可生成消歧标签。当转译地址高速缓存中的多于一个转译地址条目具有相同散列值时，消歧标签可用来对用于替代版本的各种转译地址条目（例如，用于指令的本地转译的地址条目）加以彼此区别。因此，在一些实施例中，消歧标签可用来消除存储在转译地址高速缓存中的具有同样的转译地址索引的多个转译地址条目的歧义。例如，图4示意性示出了由线性地址中未形成8位散列索引的部分来生成用于48位线性地址的40位消歧标签的方法。因此，在一些实施例中，未被用来生成散列标签的位可用来生成消歧标签。在图4中所示的示例中，位8-48用来形成消歧标签。然而，可采用生成消歧标签的任何合适的方式，而不脱离本公开的范围。

虽然上述论述涉及对线性地址进行散列以从转译地址高速缓存中获得一个或多个转译地址条目，使得根据线性地址来为转译地址条目编索引，但应该予以理解的是，可根据任何合适的地址来为转译地址高速缓存编索引。例如，在一些实施例中，可根据物理地址来为经适当配置的转译地址高速缓存编索引。当两个过程在不同的线性地址处映射到共享库时，根据物理地址为转译地址高速缓存编索引可节省转译地址高速缓存内的空间。在一些这样的场景中，可以在存储器中仅物理加载共享库的一个版本。通过根据物理地址来编索引，共享的映射可引向正在获得的单个条目，而未共享的映射可引向正在获得的不同条目。

转向图3B，示范性方法300在306处包括确定对于正在获取的所选择的源指令是否存在有效本地转译。在一些实施例中，对是否存在有效本地转译的确定（在合适的公差内）与对用于所选择的指令的物理地址的确定、对从指令转译后备缓冲区的地址的检索并发发生。在这样的实施例中，如果确定有效本地转译不存在，那么在这些阶段的一个或多个处进行并发处理可允许物理地址获取在没有惩罚的情况下继续进行。然而，应予以理解的是，在一些实施例中该确定并不需要是并发的。

例如，不管何时实施有效性确定，如果确定有效本地转译存在，那么可通过中止对用于源指令的物理地址的检索来中止获取源指令。反过来，通过避免解码步骤和通过允许替代版本的使用，处理效率可得到增强。

在图3B所示的实施例中，对有效本地转译是否存在的确定包括，在308处，获得用于经散列地址的一个或多个转译地址条目，在310处，将在散列过程期间所生成的消歧标签与使用所获得的转译地址中的每一个而获得的一个或多个转译地址消歧标签加以比较。

转译地址条目存储物理地址，在该物理地址中存储本地转译。转译地址条目可根据与其相关联的转译地址索引而被查找。例如，当对地址进行散列时所生成的散列索引可用来查找转译地址高速缓存中的特定转译地址索引。

在一些实施例中，可经由对特定转译地址索引的查找来获得多于一个的转译地址条目。例如，用来查找用于4路关联高速缓存的转译地址索引的经散列的地址可导致对多达4个转译地址条目的检索。在这样的实施例中，每个转译地址条目具有各自的、区分该条目与具有同样的转译地址索引的其他条目的转译地址消歧标签。将由对地址进行散列所生成的消歧标签与随着各自的转译地址条目所检索的消歧标签加以比较可确定所获得的任何条目是否代表用于有效本地转译的物理地址。在一些实施例中，对消歧标签的比较可包括有效位的比较。在这样的实施例中，仅在有效位设置为预选值的情况下，诸如值为1，才可认定正被比较的标签之间的一致。

在一些实施例中，转译地址条目可包括代表用于本地转译的物理地址的位和代表用于本地转译的所假定的上下文的位。此外，在一些实施例中，转译地址条目可包括与转译和/或转译的各方面相关的一个或多个其他位。图5示意性示出了包括物理地址位、所假定的上下文位以及转译相关位的转译地址条目的实施例。

继续图3B，方法300在312处包括确定在对地址进行散列时所生成的消歧标签是否与随着转译地址条目所获得的任何消歧标签相一致。如果消歧标签不一致，那么方法300前进到330，如图3C所描绘的。如果从转译地址高速缓存所获得的消歧标签与由散列所生成的消歧标签相一致，则该一致就指示获得了有效消歧标签。在一些实施例中，有效消歧标签的存在可引向对有效转译存在的确定。然而，在一些实施例中，只靠有效消歧标签的存在可能无法支持与该标签相关联的条目包括有效本地转译的结论。因此，方法300可在314处进行分支，下面以更多细节加以讨论，或者可替代地可继续到318，如图3C所示。

如上所介绍的，在一些实施例中，转译地址条目可包括用于本地转译的所假定的上下文。如本文所使用的，当前上下文描述了微处理器的当前工作状态并且所假定的上下文描述了本地转译对其有效的微处理器的状态。因此，在一些实施例中，即使识别了用于条目的有效消歧标签，与该消歧标签相关联的条目也可不包括用于当前上下文的有效本地转译。在一些示例中，发出对其而言当前上下文和所假定的上下文不相一致的本地转译可造成执行错误或危险。

应该予以理解的是，上下文可包括在转译地址条目和/或转译地址的任何合适的部分中。在图5中所示的示例中，上下文位示出为正被包括在转译地址条目中。在这样的实施例中，上下文可选地可被加以比较，如在图3C的316处所示。因此，取代前进到318，方法300可选地可在314处进行分支，将用于微处理器的当前上下文与存储在转译地址条目中的所假定的上下文加以比较。转到图3C，在这样的实施例中，方法300可包括在316处确定是否当前上下文与所假定的上下文相一致。在一些实施例中，可将当前上下文与所假定的上下文加以比较以确定一致。在一个示范性场景中，如果所假定的和当前上下文基于一对一比较相一致，那么可认定一致。如果上下文一致，那么方法300继续到318，在该处方法300进行对有效本地转译存在的确定。如果上下文不一致，那么方法300前进到330，在该处方法300进行对有效本地转译不存在的确定。

附加地或可替代地，在一些实施例中，用于所假定的上下文的位可包括在转译地址中，诸如在消歧标签和/或散列中。在这样的实施例中，在地址的一个或多个部分中的所假定的上下文的包含物可允许在转译地址高速缓存内的、具有不同上下文而具有同样线性地址的两个或两个以上条目的并发存储。应该予以理解的是，这样的实施例的实现方案可取决于特定于应用的考虑。例如，在一些设置关联性为低的实施例中，诸如在地址被直接映射的场景中，所假定的上下文可包括在散列中可避免冲突未命中。例如，所假定的上下文可在散列期间被XOR到散列中。在一些其他实施例中，诸如那些用于对附加位进行散列的周期时间影响处理时间多于用于处理相对更宽的消歧标签的时间的情况下，所假定的上下文可添加到消歧标签以避免潜在处理延迟。作为示例，所假定的上下文可附加到消歧标签。而在其他实施例中，所假定的上下文可包括在散列中和在消歧标签中。

一旦确定有效本地转译存在，则在320处，方法300包括中止对指令的获取。当中止发生时，终止获取过程。虽然终止可在指令的获取之后发生，但是在一些实施例中，终止可在获取过程的完成之前发生。例如，在对指令进行获取包括从指令转译后备缓冲区中检索用于指令的物理地址的实施例中，中止对指令进行获取可包括中止从指令转译后备缓冲区中检索物理地址。

在322处，方法300包括将用于本地转译的物理地址发送到指令高速缓存，并且，在324处，从指令高速缓存接收所选择的本地转译。在一些实施例中，一旦从指令高速缓存中接收了所选择的本地转译，就可将其转发到本地转译缓冲区以为最终分布到调度逻辑做准备，其在调度逻辑处将被调度以用于执行。

可替代地，在图3C中所示的实施例中，如果有效本地转译不存在，那么在332处，方法300包括允许从指令高速缓存进行获取以完成。例如，在对指令进行获取包括从指令转译后备缓冲区中检索物理地址的实施例中，在334处，方法300可包括在从指令转译后备缓冲区中接收用于指令的物理地址之后，将用于指令的物理地址发送到指令高速缓存，使得在336处可从指令高速缓存获得指令。

因此，通过确定用于源材料的替代版本的存在，（在如上所述的示例中，是提供了与源指令的相同功能性的本地转译）以及同时获取源材料，本文所述的方法可相对于单独基于源材料进行处理而提供增强的处理。进一步地，通过利用硬件结构来实施并发的确定，本文所述的方法相对于基于软件优化的方案可相对更有效率，特别是在经分支的处理场景中。

本书面描述使用示例来公开本发明，包括最佳模式，并且还使相关领域的普通技术人员能够实践本发明，包括制造和使用任何设备或系统以及实施任何所包含的方法。本发明的可专利范围由权利要求所定义，并且可包括如本领域普通技术人员所理解的其他示例。这样的其他示例意在处于权利要求的范围之内。

Claims

1.一种微处理器，包括获取单元可操作以：

获取指令；

对用于所述指令的地址进行散列来确定达到与所述指令相同功能性的所述指令的替代版本是否存在，包括经由用于所述指令的线性地址的一个或多个部分的散列来生成散列索引以及从用于所述指令的所述线性地址的其他部分来生成消歧标签；以及

如果所述散列导致确定这样的替代版本的确存在，那么中止所述获取和检索，包括避免解码，并且发送所述替代版本用于执行。

2.根据权利要求1所述的微处理器，其中所述获取单元进一步可操作以在正在获取所述指令的同时对所述地址进行散列。

3.根据权利要求1所述的微处理器，其中所述获取单元进一步可操作以：

根据从所述散列生成的散列索引、通过参考所述微处理器的转译地址高速缓存中的转译地址索引来确定所述替代版本是否存在；以及

如果所述替代版本存在，那么从所述转译地址高速缓存中检索用于所述替代版本的物理地址。

4.根据权利要求3所述的微处理器，其中所述获取单元进一步可操作以：

根据所述转译地址索引来获得存储在所述转译地址高速缓存中的一个或多个转译地址条目；

将从所述散列所生成的消歧标签和与所获得的所述一个或多个转译地址条目中的每一个相关联的消歧标签加以比较；以及

如果从所述散列所生成的所述消歧标签与从所述转译地址高速缓存中所获得的消歧标签相一致，那么确定所述替代版本存在。

5.根据权利要求3所述的微处理器，其中所述获取单元进一步可操作以：

将用于所述微处理器的当前上下文与所假定的上下文加以比较，所述当前上下文描述所述微处理器的当前工作状态，所述所假定的上下文描述所述替代版本对其有效的所述微处理器的状态；以及

如果所述当前上下文与所述所假定的上下文相一致，那么确定所述替代版本存在，

其中所述所假定的上下文包括在所述散列索引、消歧标签、或者与所述散列索引和所述消歧标签相关联的一个或多个转译地址条目的一个或多个中。

6.根据权利要求3所述的微处理器，进一步包括获取单元可操作以：

将用于所述替代版本的所述物理地址发送到指令高速缓存，使得能够从所述指令高速缓存中获得所述替代版本；以及

将从所述指令高速缓存中获得的所述替代版本发送到调度单元用于调度所述替代版本以执行。

7.根据权利要求1所述的微处理器，进一步包括转译地址高速缓存，配置为针对存储在所述转译地址高速缓存内每个替代版本而存储转译地址条目，所述转译地址条目包括用于所述替代版本的物理地址和用于描述所述替代版本对其有效的所述微处理器的状态的所假定的上下文。

8.根据权利要求1所述的微处理器，进一步包括从包括线性索引物理标签的指令高速缓存和物理索引物理标签的指令高速缓存的组中所选择的指令高速缓存。

9.根据权利要求1所述的微处理器，其中所述获取单元进一步可操作以参照用于所述指令的线性地址，从指令转译后备缓冲区中检索用于所述指令的物理地址。