WO2015027809A1

WO2015027809A1 - 指令处理方法及装置、处理器

Info

Publication number: WO2015027809A1
Application number: PCT/CN2014/083879
Authority: WO
Inventors: 侯锐; 郭旭斌; 冯煜晶; 王曦爽; 李晔
Original assignee: 华为技术有限公司
Priority date: 2013-08-30
Filing date: 2014-08-07
Publication date: 2015-03-05
Also published as: CN104423927A; CN104423927B

Abstract

一种指令处理方法及装置、处理器，涉及计算机技术领域。当从处理器的第二缓存中按序读取多条指令时，若确定所述多条指令中存在特殊指令序列，则确定所述特殊指令序列中各指令对应的控制码；将所述特殊指令序列中各指令及其对应的控制码保存到所述处理器的第一缓存中；若确定从所述处理器的第一缓存中读取的指令存在对应的控制码，则根据所述控制码调整所述处理器的微结构，使得所述处理器的流水线不停顿，可以优化处理器执行指令的工作效率。

Description

指令处理方法及装置、处理器本申请要求于 2013 年 8 月 30 日提交中国专利局、申请号为 201310389245.3、发明名称为"指令处理方法及装置、处理器，，的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本发明实施例涉及计算机技术领域，尤其涉及一种指令处理方法及装置、处理器。

背景技术

基于数据挖掘方法研究处理器硬件发现：一些特殊指令序列存在緩存缺失率高、分支预测失误率高等问题，例如， <load,load,load>指令序列中的 load 指令由于緩存缺失会导致处理器流水线的停顿；又例如， <branch,store,load,compare>指令序列中的 branch指令由于分支预测失误也会导致处理器流水线的停顿。

由此可见，现有处理器的一些特殊指令序列由于緩存缺失率高或分支预测失误等原因导致处理器工作流水线的停顿，从而影响了处理器执行指令的工作效率。发明内容

本发明提供一种指令处理方法及装置、处理器，用以解决现有处理器的一些指令序列由于緩存缺失率高或分支预测失误等原因导致处理器工作流水线的停顿，以及处理器执行指令序列的效率低的问题。

第一方面，提供一种指令处理方法，包括：

从处理器的第二緩存中按序读取多条指令，若确定所述多条指令中存在特殊指令序列，则确定所述特殊指令序列中各指令对应的控制码；将所述特殊指令序列中各指令及其对应的控制码保存到所述处理器的第一緩存中；

若确定从所述处理器的第一緩存中读取的指令存在对应的控制码，则根据所述控制码调整所述处理器的微结构，使得所述处理器的流水线不停顿；所述特殊指令序列是指造成所述处理器的流水线停顿的特殊指令序列。基于第一方面，在第一种可能的实现方式中，所述从处理器的第二緩存中按序读取多条指令，若确定所述多条指令中存在特殊指令序列，则确定所述特殊指令序列中各指令对应的控制码，包括：

从所述处理器的第二緩存中按序读取多条指令，根据指令与预译码值之间的对应关系，按序分别确定所述多条指令中每条指令对应的预译码值；根据所述多条指令中每条指令对应的预译码值组成的序列，若确定存在特殊指令序列对应的预译码值序列，则确定所述多条指令中包括特殊指令序列；

根据所述特殊指令序列中各指令和控制码之间的对应关系，确定所述特殊指令序列中各指令对应的控制码。

基于第一方面或第一方面的第一种可能的实现方式，在第二种可能的实现方式中，所述控制码包括关闭加载之后指令预测执行部件的代码或关闭分支预测部件的代码；

所述根据所述控制码调整所述处理器的微结构 , 包括：

根据所述关闭加载之后指令预测执行部件的代码，关闭加载之后所述处理器的指令预测执行部件；或

才艮据所述关闭分支预测部件的代码，关闭所述处理器的分支预测部件。第二方面，提供一种指令处理装置，包括：

确定模块，用于从处理器的第二緩存中按序读取多条指令，若确定所述多条指令中存在特殊指令序列，则确定所述特殊指令序列中各指令对应的控制码；所述处理器的第一緩存中；

调整模块，用于若确定从所述处理器的第一緩存中读取的指令存在对应的控制码，则根据所述控制码调整所述处理器的微结构，使得所述处理器的流水线不停顿；

所述特殊指令序列是指造成所述处理器的流水线停顿的特殊指令序列。基于第二方面，在第一种可能的实现方式中，所述确定模块具体包括：第一确定单元，用于从所述处理器的第二緩存中按序读取多条指令，根据指令与预译码值之间的对应关系，按序分别确定所述多条指令中每条指令对应的预译码值；

第二确定单元，用于根据所述多条指令中每条指令对应的预译码值组成的序列，若确定存在特殊指令序列对应的预译码值序列，则确定所述多条指令中包括特殊指令序列；

第三确定单元，用于根据所述特殊指令序列中各指令和控制码之间的对应关系，确定所述特殊指令序列中各指令对应的控制码。

基于第二方面或第二方面的第一种可能的实现方式，在第二种可能的实现方式中，所述控制码包括关闭加载之后指令预测执行部件的代码或关闭分支预测部件的代码；

所述调整模块具体用于：

才艮据所述关闭分支预测部件的代码，关闭所述处理器的分支预测部件。第三方面，提供一种处理器，包括：上述指令处理装置。

第四方面，提供一种终端设备，包括：上述处理器。

本发明实施例通过对从处理器的第二緩存中按序读取多条指令，检测是否存在特殊指令序列，若存在特殊指令序列，则确定所述特殊指令序列中各指令对应的控制码；并将所述特殊指令序列中各指令及其对应的控制码保存到所述处理器的第一緩存中；之后，若确定从所述处理器的第一緩存中读取的指令存在对应的控制码，则根据所述控制码调整所述处理器的微结构，使得所述处理器的流水线不停顿；上述提供的方案可以避免在执行特殊指令序列时，由于緩存缺失或分支预测失误等原因造成的处理器流水线停顿的问题；因此，可以优化处理器执行指令的工作效率。附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍，显而易见地，下面描述中的附图是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图 1为本发明一实施例提供的指令处理方法的流程示意图；

图 2为本发明另一实施例提供的指令处理装置的结构示意图；

图 3为图 2所示实施例的原理框图；

图 4为本发明另一实施例提供的指令处理装置的结构示意图；

图 5为本发明另一实施例提供的处理器的结构示意图。具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

本发明的说明书和权利要求书及上述附图中的术语 "第一"、 "第二"、 "第三" "第四" 等（如果存在）是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的本发明的实施例例如能够以除了在这里图示或描述的那些以外的顺序实施。此外，术语 "包括" 和 "具有" 以及他们的任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

现有的处理器微结构设计主要是根据已经执行过的历史指令预测即将执行的指令，调整对即将执行指令流的处理策略（例如预测跳转指令的跳转方向与跳转地址；)，从而对处理器的指令流的整体执行效率进行优化。

然而，有些特殊指令序列容易造成处理器的流水线的停顿，例如，指令序列 <10 (1,10 (1,10 (1>中的 Load指令就是要从存储器中取回数据到寄存器，如果数据高速緩冲存储器（Cache ) 中包含这需要取回的数据，处理器执行指令的流水线就可以流畅运行，继续执行 Load指令之后进入流水线的指令。如果数据 Cache不包含这一需要取回的数据，则会发生一次数据緩存缺失（ Cache Miss ), 这样就需要刷新处理器执行指令的流水线，也就是说，在 Load指令之后进入流水线的指令都要被清除掉，这样就导致了处理器执行指令的流水线停顿。

又例如，指令序列<1«¾11。11,81；0^,103(1 0111 3^>中的 branch指令是指进行分支跳转的指令，根据现有的处理器微结构设计，当 branch指令进入流水线时，由于在处理器完成初始化工作以后，通常分支预测部件就开启，因此，会根据分支预测部件提供的分支跳转方向，预测下一条指令的位置。而实验数据表明，当处理器在执 #<branch, store, load, compare>指令序列时，错误地将不需要执行的指令送入流水线，发现分支预测错误后还需要清除掉这些指令，这样就导致了处理器流水线停顿。。

上述仅仅以指令序歹¹ J <load,load,load>、 <branch,store,load,compare> 例进行说明，可以理解，本领域的普通技术人员根据上述指令序列所联想到其他导致由于緩存缺失率高或分支预测失误导致的指令序列也属于本专利的保护范围。

由此可知，现有的处理器的微结构设计中，当出现某些特殊指令序列时，会由于緩存缺失率高或分支预测失误或其他原因导致处理器的流水线停顿的问题，从而降低了处理器执行指令的工作效率。

基于上述现有技术存在的问题，本发明实施例提供一种指令处理方法，可以解决在现有的处理器流水线微结构设计中，当出现某些特殊指令序列时，存在处理器的流水线停顿的问题，可以优化处理器执行指令的工作效率。

需要说明的是，本实施例所述的处理器的微结构（ Micro Architecture )具体是指处理器内部的一些功能部件的集合，其中，功能部件例如包括指令预测执行部件或分支预测部件等。

图 1为本发明一实施例提供的指令处理方法的流程示意图，如图 1所示，本实施例的指令处理方法可以包括：

101、从处理器的第二緩存中按序读取多条指令，若确定所述多条指令中存在特殊指令序列，则确定所述特殊指令序列中各指令对应的控制码；

在本发明的一个可选的实施方式中，步骤 101具体包括：

需要说明的是，本实施例所述的第二緩存例如为二级緩存 L2 Cache„ 需要说明的是，本实施例所述的特殊指令序列包括但不限于 <load,load,load>指令序歹¹ J ^。<branch,store,load,compare>指令序歹¹ J；

其中，特殊指令序列 <10 (1,10 (1,10 (1>中的 load指令的控制码为关闭加载之后指令预测执行部件的代码；

特殊指令序列 <branch,store,load,compare>† branch指令的控制码为关闭分支预测部件的代码，其中，需要说明的是，该特殊指令序列 <1«¾11011,81；0^,103(1,00111 3^>中的其他三个 store ^ load、 compare指令对应的控制码可以默认设为 0, 表示不需要进行处理器的微结构的调整。

102、将所述特殊指令序列中各指令及其对应的控制码保存到所述处理器的第一緩存中；

需要说明的是，本实施例所述的第一緩存例如为指令高速緩冲存储器 ( Instruction- Cache , I-Cache )。

103、若确定所述处理器的第一緩存中读取的指令存在对应的控制码，则根据所述控制码调整所述处理器的微结构，使得所述处理器的流水线不停顿。

从处理器的第一緩存中读取的指令具体是指进入处理器的流水线的指令，也就是即将执行的指令；

假设即将执行的指令为特殊指令序列中 <load ,load ,10 (1>中的 load指令时，为了避免在执行 load指令时，由于 Cache Miss可能造成处理器的流水线停顿的问题，该 load指令对应的控制码为关闭加载之后指令预测执行部件的代码；因此，步骤 103具体为：根据关闭加载之后指令预测执行部件的代码，关闭加载之后所述处理器的指令预测执行部件。

需要说明的是，当执行完特殊指令序列中 <load ,load ,load>†的三个 load 之后，需要重新开启加载之后所述处理器的指令预测执行部件。

£设即将执行的指令为特殊指令序列†<branch, store, load, 0011^3^>中的 branch指令时，为了避免在执行 branch指令时分支预测部件的分支预测失误，该 branch指令对应的控制码为关闭分支预测部件的代码；因此，步骤 103 具体为：根据关闭分支预测部件的代码，关闭所述处理器的分支预测部件。

需要说明的是，当执行完特殊指令序列中 <branch, store, load, compare>中的 branch指令之后，需要重新开启处理器的分支预测部件。

本发明实施例通过对从处理器的第二緩存中按序读取多条指令，检测是否存在特殊指令序列，若存在特殊指令序列，则确定所述特殊指令序列中各指令对应的控制码；并将所述特殊指令序列中各指令及其对应的控制码保存到所述处理器的第一緩存中；之后，若确定从所述处理器的第一緩存中读取的指令存在对应的控制码，则根据所述控制码调整所述处理器的微结构；由于本实施例的控制码是为了避免当某些特殊指令序列进入处理器的流水线时会造成流水线停顿的问题，针对某些特殊指令序列中的各指令设计的，时，处理器可以关闭加载之后所述处理器的流水线的指令预测执行部件，从而避免在执行 load指令时造成处理器的流水线停顿的问题；又例如，当检测出特殊指令序列 <branch,store,load,compare>即将进入处理器的流水线时，为了避免分支预测部件的分支预测失误，处理器可以关闭分支预测部件，从而可以避免在执行 branch指令时造成的分支预测失误；因此，可以优化处理器执行指令的工作效率。

图 2为本发明另一实施例提供的指令处理方法的流程示意图，图 3为图 2 所示实施例的原理框图，如图 2和图 3所示，本实施例的指令处理方法是图 1 所示实施例的具体实现，包括：

201、在第一个时钟周期内从 L2 Cache中按序读取 4条指令。

具体实现时，假设 L2 Cache读端口为 16字段（ Bytes )，每条指令为 4 Bytes, 每个时钟周期内只能读出 4条指令（Instr0、 Instrl、 Instr2、 Instr3 )。

202、确定第一个时钟周期内读取的 4条指令对应的预译码值。

表 1为本发明实施例建立的第一关系对应表，如表 1所示:

该第一关系对应表中保存的每个指令与其预译码值之间的对应关系，如图 3所示，预译码器（ Pre-decoder ) 中保存有第一关系对应表，可以根据表 1 所示的对应关系，确定第一个时钟周期内读取的 4 条指令对应的预译码值 ( precode0、 precode 1、 precode2、 precode3 )。需要说明的是，上述第一关系对应表可以釆用硬件模块进行设置；或者也可以釆用软件模块进行定义。

203、在第二个时钟周期内从 L2 Cache中按序读取 4条指令。

为了保证不会漏掉任一特殊指令序列，需要从 L2 Cache中按序连续读取 8条指令，因此，本实施例中，需要将在第一个时钟周期内读出四条指令及其对应的预译码值緩存一拍，之后，在第二个时钟周期内从 L2 Cache中按序读取 4条指令（Instr4、 Instr5、 Instr6、 Instr7 )„

204、确定第二个时钟周期内读取的 4条指令对应的预译码值。

预译码器（ Pre-decoder )根据表 1所示的对应关系，可以确定第二个时钟周期内读取的 4 条指令对应的预译码值（precode4、 precode5、 precode6、 precode7 )。测，并根据检测结果产生第一个时钟周期内读取的 4条指令的控制码。

如图 3所示，第一个时钟周期内读取的 4条指令（Instr0、 Instrl、 Instr2、

Instr3 ) 的控制码分别为（ctlcode0、 ctlcodel、 ctlcode2、 ctlcode3 )。

表 2为本发明实施例建立的第二关系对应表，如表 2所示：

第二关系对应表中保存有每个符夕尽厅 n 兵 t贝

应关系；如图 3 所示，指令序列模式检测器（Instruction Sequential Pattern Check )中保存有第二关系对应表，根据上述按序读出的连续 8条指令以及对应的预译码值，查询第二关系对应表，可以确定上述按序读出的连续 8条指令中是否存在特殊指令序列即将进入处理器的流水线。

需要说明的是，上述第二关系对应表可以釆用硬件模块进行设置；或者也可以釆用软件模块进行定义。

本实施例以<10 (1,10 (1,10 (1>指令序列为例进行特殊指令序列检测的说明：若在第一个时钟周期内连续读取的 4条指令的预译码值中存在 3个连续为 1 的预译码值时，可以确定第一个时钟周期内连续读取的 4条指令中存在 <load,load,load>的特殊指令序列；或者

若在第二个时钟周期内连续读取的 4条指令的预译码值中存在 3个连续为 1 的预译码值时，可以确定第二个时钟周期内连续读取的 4条指令中存在 <load,load,load>的特殊指令序列；或者

若在第一个时钟周期内读取的最后 2条指令的预译码值为 1 时，且在第二个时钟周期内读取第 1条指令的预译码值也为 1 时，则可以确定上述按序读出的连续 8条指令中存在 <load,load,load^々特殊指令序列；或者

若在第一个时钟周期内读取的最后 1条指令的预译码值为 1 时，且在第二个时钟周期内读取第 1条和第 2条指令的预译码值也为 1时，则可以确定上述按序读出的连续 8条指令中存在 <load,load,load^々特殊指令序列；

表 3为本发明实施例建立的第三关系对应表，如表 3所示:

该第三关系对应表中保存有特殊指令序列中各指令与其控制码之间的对应关系，根据表 3 所示的对应关系，可以确定检测出的特殊指令序列中各指令的控制码。需要说明的是，上述第二关系对应表可以釆用硬件模块进行设置；或者也可以釆用软件模块进行定义。

本实施例以 <load,load,load>指令序列为例进行第一个时钟周期内读取的指令的控制码的产生说明：

当确定第一个时钟周期内连续读取的 4条指令中存在 <load ,load ,10 (1>的特殊指令序列，例如第一个时钟周期内连续读取的第 1、 2、 3个指令都是 load 时，第 4个指令是除 load指令外的其他指令时，根据表 3所示的对应关系，确定第 1、 2、 3个 load指令对应的控制码，其中，第 4个其他指令的控制码缺省设置为 0, 即表示当执行第 4个其他指令时，不需要对处理器的微结构进行调整，按照现有的处理器的微结构设计进行调整。

若在第一个时钟周期内读取的最后 2条指令的预译码值为 1 时，且在第二个时钟周期内读取第 1条指令的预译码值也为 1 时，则可以确定上述按序读出的连续 8条指令中存在 <load,load,load>的特殊指令序列；由于在第一个时钟周期内读取的第 1、 2个指令为除 load指令外的其他指令，此时，第一个时钟周期内读取的第 1、 2个指令对应的控制码为 0 , 而第一个时钟周期内读取的最后 2条指令为特殊指令序列<10 (1,10 (1,10 (1>中的第 1、 2个 load指令，根据表 3所示的对应关系，可以确定特殊指令序列<10 (1,10 (1,10 (1>中的第 1、 2 个 load指令对应的控制码，从而可以确定第一个时钟周期内读取的最后 2个 load指令对应的控制码。

206、将第一个时钟周期内读取的 4 条指令以及对应的控制码保存到 I-Cache中。

207、从 I-Cache中读取指令，确定该指令是否绑定有控制码，若是，则执行步骤 208 , 否则执行步骤 209。

208、根据该指令的控制码，调整处理器的微结构。

例如，若该指令是特殊指令序列 <1₀ (1,10 (1,10 (1>中的 load指令，则需要关掉加载之后的指令预测执行部件；当执行完特殊指令序列<1_{0 (}1,10 (1,10 (1> 中的 3个 load指令之后，重新开启加载之后处理器的指令预测执行部件。

209、不调整处理器的微结构。

也就是说，按照现有的处理器的微结构设计进行调整。

本发明实施例利用在 L2 Cache回填 I-Cache的过程中，根据连续读取的 8 条指令以及对应预译码值，检测是否存在特殊指令序列，若存在，则确定该特殊指令序列中各指令对应的控制码，并将该特殊指令序列中各指令以及对应的控制码绑定保存到 I-Cache中，使得当该特殊指令序列中各指令进入流水线时，根据该特殊指令序列中各指令对应的控制码调整处理器的微结构，如关掉 Load之后指令预测执行部件，关闭分支预测部件等，从而可以避免在执行特殊指令序列中的指令时造成的流水线停顿的问题或分支预测失误的问题，可以优化处理器执行指令的工作效率。

图 4为本发明另一实施例提供的指令处理装置的结构示意图，如图 4所示，包括：

确定模块 41 , 用于从处理器的第二緩存中按序读取多条指令，若确定所述多条指令中存在特殊指令序列，则确定所述特殊指令序列中各指令对应的控制码；

保存模块 42, 用于将所述特殊指令序列中各指令及其对应的控制码保存到所述处理器的第一緩存中；

调整模块 43 , 用于若确定从所述处理器的第一緩存中读取的指令存在对应的控制码，则根据所述控制码调整所述处理器的微结构，使得所述处理器的流水线不停顿。

举例来说，所述确定模块 41具体包括：

第一确定单元 411 , 用于从所述处理器的第二緩存中按序读取多条指令，根据指令与预译码值之间的对应关系，按序分别确定所述多条指令中每条指令对应的预译码值；

第二确定单元 412 ,用于根据所述多条指令中每条指令对应的预译码值组成的序列，若确定存在特殊指令序列对应的预译码值序列，则确定所述多条指令中包括特殊指令序列；

第三确定单元 413 ,用于根据所述特殊指令序列中各指令和控制码之间的对应关系，确定所述特殊指令序列中各指令对应的控制码。

举例来说，所述控制码包括但不限于关闭加载之后指令预测执行部件的代码或关闭分支预测部件的代码；

所述调整模块 43具体用于：

根据关闭加载之后指令预测执行部件的代码，关闭加载之后所述处理器的指令预测执行部件；或才艮据关闭分支预测部件的代码，关闭所述处理器的分支预测部件。

本发明实施例通过对从处理器的第二緩存中按序读取多条指令，检测是否存在特殊指令序列，若存在特殊指令序列，则确定所述特殊指令序列中各指令对应的控制码；并将所述特殊指令序列中各指令及其对应的控制码保存到所述处理器的第一緩存中；之后，若确定从所述处理器的第一緩存中读取的指令存在对应的控制码，则根据所述控制码调整所述处理器的微结构；由于本实施例的控制码是为了避免当某些特殊指令序列进入处理器的流水线时会造成流水线停顿的问题，针对某些特殊指令序列中的各指令设计的，时，处理器可以关闭加载之后所述处理器的指令预测执行部件，从而避免在执行 load指令时造成处理器的流水线停顿的问题；又例如，当检测出特殊指令序列 <1«¾1^11^0^,10 (1 01^3^>即将进入处理器的流水线时，为了避免分支预测部件的分支预测失误，处理器可以关闭分支预测部件，从而可以避免在执行 branch指令时造成的分支预测失误；因此，可以优化处理器执行指令的工作效率。

本发明实施例还提供一种处理器，包括：图 4 所示实施例所述的指令处理装置，详细内容不再赘述。

图 5为本发明另一实施例提供的处理器的结构示意图，如图 5所示，包括：第一緩存器 51、第二緩存器 52、预译码器 53和特殊指令序列检测器 54; 第一緩存器 51、第二緩存器 52、预译码器 53和特殊指令序列检测器 54之间通过通信总线进行连接。

其中，第二緩存器 52 , 用于按序连续读取多条指令；

预译码器 53 , 用于根据第二緩存器 52按序读取的多条指令，利用指令与预译码值之间的对应关系，按序分别确定该多条指令对应的预译码值；

特殊指令序列检测器 54 ,用于根据预译码器 53按序分别确定的多条指令对应的预译码值组成的序列，若确定存在特殊指令序列对应的预译码值序列，则确定该多条指令中存在特殊指令序列，则进一步根据该特殊指令序列与该特殊指令序列中各指令的控制码之间的对应关系，确定该特殊指令序列中各指令对应的控制码；

第一緩存器 51 ,用于保存特殊指令序列检测器 54确定的特殊指令序列中各指令及其对应的控制码；

需要说明的是，第一緩存器 51 , 还用于保存上述多条指令中除特殊指令序列之外的其他指令。

对应地，当第一緩存器 51中保存的指令进入处理器的流水线时，若确定进入处理器的流水线的指令存在对应的控制码，则根据控制码调整该处理器的微结构，使得处理器的流水线不停顿。

举例来说，第一緩存器 51 可以是 I-Cache, 第二緩存器 52 可以是 L2 CACHE。

举例来说，上述特殊指令序列包括但不限于 <load,load,load>指令序列和 <branch,store,load,compare>指令序歹¹ J。

举例来说，若所述特殊指令序列为<1。 (1, load, load>指令序列时，则特殊指令序列<10 (1, load, 10 (1>中各 load指令的控制码为关掉加载之后的指令预测执行部件的代码，相应地，根据 load指令的控制码，掉加载之后的指令预测执行部件；

举例来说 , 若所述特殊指令序列为 <branch,store,load,compare>指令序列时，则 <branch,store,load,compare>中 branch指令的控制码为关闭分支预测部件的代码，相应地，根据 branch指令的控制码，关闭分支预测部件。

本发明实施例通过对从处理器的第二緩存器中按序读取多条指令，检测是否存在特殊指令序列，若存在特殊指令序列，则确定所述特殊指令序列中各指令对应的控制码；并将所述特殊指令序列中各指令及其对应的控制码绑定后保存到所述处理器的第一緩存器中；之后，当从所述处理器的第一緩存器中读取的指令中绑定有对应的控制码，则根据所述控制码调整所述处理器的微结构；

由于本实施例的控制码是为了避免当某些特殊指令序列进入处理器的流水线时会造成流水线停顿的问题，针对某些特殊指令序列中的各指令设计的，时，处理器可以关闭加载之后所述处理器的指令预测执行部件，从而避免在执行 load指令时造成处理器的流水线停顿的问题；又例如，当检测出特殊指令序列 <1«¾1^11^0^,10 (1 01^3^>即将进入处理器的流水线时，为了避免分支预测部件的分支预测失误，处理器可以关闭分支预测部件，从而可以避免在执行 branch指令时造成的分支预测失误；因此，可以优化处理器执行指令的工作效率。

本发明实施例还提供一种终端设备，包括：图 5 所示实施例所述的处理器，详细内容不再赘述。

在本申请所提供的几个实施例中，应该理解到，所揭露的系统，装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本发明各个实施例中的各功能单元可以集成在一个处理单元中 , 也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以釆用硬件的形式实现，也可以釆用软件功能单元的形式实现。

上述以软件功能单元的形式实现的集成的单元，可以以代码的形式存储在一个计算机可读取存储介质中。上述代码存储在一个计算机可读存储介质中，包括若干指令用以使处理器或硬件电路执行本发明各个实施例所述方法的部分或全部步骤。而前述的存储介质包括：通用串行总线接口的无需物理驱动器的微型高容量移动存储盘、移动硬盘、只读存储器（英文： Read-Only Memory, 简称 ROM )、随机存取存储器（英文： Random Access Memory, 简称 RAM )、磁碟或者光盘等各种可以存储程序代码的介质。

最后应说明的是：以上实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的保护范围。

Claims

权利要求书

1、一种指令处理方法，其特征在于，包括：

从处理器的第二緩存中按序读取多条指令，若确定所述多条指令中存在特殊指令序列，则确定所述特殊指令序列中各指令对应的控制码；

将所述特殊指令序列中各指令及其对应的控制码保存到所述处理器的第一緩存中；

若确定从所述处理器的第一緩存中读取的指令存在对应的控制码，则根据所述控制码调整所述处理器的微结构，使得所述处理器的流水线不发生停顿；所述特殊指令序列是指造成所述处理器的流水线停顿的特殊指令序列。

2、根据权利要求 1所述的方法，其特征在于，所述从处理器的第二緩存中按序读取多条指令，若确定所述多条指令中存在特殊指令序列，则确定所述特殊指令序列中各指令对应的控制码，包括：

从所述处理器的第二緩存中按序读取多条指令，根据指令与预译码值之间的对应关系，按序分别确定所述多条指令中每条指令对应的预译码值；

在所述多条指令所对应的预译码值组成的序列中，若确定存在特殊指令序列对应的预译码值序列，则确定所述多条指令中包括特殊指令序列；

3、根据权利要求 1-2中任一项所述的方法，其特征在于，所述控制码包括关闭加载之后指令预测执行部件的代码或关闭分支预测部件的代码；

所述根据所述控制码调整所述处理器的微结构 , 包括：

才艮据所述关闭分支预测部件的代码，关闭所述处理器的分支预测部件。

4、一种指令处理装置，其特征在于，包括：

确定模块，用于从处理器的第二緩存中按序读取多条指令，若确定所述多条指令中存在特殊指令序列，则确定所述特殊指令序列中各指令对应的控制码；保存模块，用于将所述特殊指令序列中各指令及其对应的控制码保存到所述处理器的第一緩存中；

所述特殊指令序列是指造成所述处理器的流水线停顿的特殊指令序列。

5、根据权利要求 4所述的装置，其特征在于，所述确定模块具体包括：第一确定单元，用于从所述处理器的第二緩存中按序读取多条指令，根据指令与预译码值之间的对应关系，按序分别确定所述多条指令中每条指令对应的预译码值；

6、根据权利要求 4-5中任一项所述的装置，其特征在于，所述控制码包括关闭加载之后指令预测执行部件的代码或关闭分支预测部件的代码；

所述调整模块具体用于：

7、一种处理器，其特征在于，包括：如权利要求 4-6任一项所述的指令处理装置。

8、一种终端设备，其特征在于，包括：如权利要求 7所述的处理器。