CN106933538B - 侦测自修正程序码的处理器与方法 - Google Patents

侦测自修正程序码的处理器与方法 Download PDF

Info

Publication number
CN106933538B
CN106933538B CN201710137900.4A CN201710137900A CN106933538B CN 106933538 B CN106933538 B CN 106933538B CN 201710137900 A CN201710137900 A CN 201710137900A CN 106933538 B CN106933538 B CN 106933538B
Authority
CN
China
Prior art keywords
instruction
storage element
ownership
cache line
queue
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710137900.4A
Other languages
English (en)
Other versions
CN106933538A (zh
Inventor
布兰特·比恩
柯林·艾迪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Zhaoxin Semiconductor Co Ltd
Original Assignee
Shanghai Zhaoxin Integrated Circuit Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from US15/156,429 external-priority patent/US9798670B1/en
Application filed by Shanghai Zhaoxin Integrated Circuit Co Ltd filed Critical Shanghai Zhaoxin Integrated Circuit Co Ltd
Publication of CN106933538A publication Critical patent/CN106933538A/zh
Application granted granted Critical
Publication of CN106933538B publication Critical patent/CN106933538B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/30Arrangements for executing machine instructions, e.g. instruction decode
    • G06F9/30003Arrangements for executing specific machine instructions
    • G06F9/3004Arrangements for executing specific machine instructions to perform operations on memory

Landscapes

  • Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Memory System Of A Hierarchy Structure (AREA)

Abstract

一种侦测自修正程序码的处理器与方法,该处理器与方法依据快取线决定存储器所有权以侦测通过执行指令修正快取线的自修正程序码。所有权索引与对应的快取线地址因为每一快取线而被输入所有权队列。每一指令所有权索引与从快取线产生的指令一同被提供。当指令被提出时,对应的储存单元的执行位被设定。当储存指令的目标地址匹配于所有权队列中的储存单元时,且当储存单元的执行位被设定时,储存指令被标记以产生执行例外事件。当将要退出的储存指令被标记以产生执行例外事件时,储存指令被允许退出,处理器被刷新,且在储存指令后的下一个指令被重新撷取以继续处理。本发明能够提高处理器的效能。

Description

侦测自修正程序码的处理器与方法
技术领域
本发明关联于存储器所有权,特别是关联于基于快取线决定存储器所有权以侦测自修正程序码。
背景技术
自修正程序码(self modified code,SMC)具有被本地处理器执行的至少一指令以修正另一指令,或者是后续被处理器处理的一程序码序列。自修正程序码可能具有一序列的程序码以修正刚被执行的程序码,使得被修正而具有新功能的程序码再被执行一次。于另一个例子中,自修正程序码用以修正顺序紧接的程序码且就在之前被执行。虽然自修正程序码现在并不如往昔普遍,许多旧式的程序仍具有自修正程序码且应被适当的执行。处理器必须能够侦测自修正程序码且校正运算以避免不适当的结果。此处所用的“处理器”一词用以代表任意类型的处理单元,包含微处理器(micro processor)、中央处理器(central processing unit,CPU)、一运算核或一微控制器(micro controller)等等。此处所用的“处理器”一词还包含了任意类型的处理器架构,例如整合有多个处理单元的晶片,或者是包含了具有一系统晶片(system of a chip,SOC)的集成电路(integratedcircuit,IC)。
现代的处理器经常执行预撷取运算以将存储器中一或多行读进指令快取存储器(icache)。指令快取存储器的快取线被解析为指令并被执行。为了使效率最大化,撷取单元或者是相仿的元件会试图填满指令快取存储器并维持填满的状态以确保指令被连续地供给执行。为了使效能最大化,执行管线(execution pipeline)被希望能够维持满载的状态。现代的处理器经常采用乱序(out-of-order,OOO)执行,也就是说晚收到但已准备好被执行的指令可以先于早收到但还没准备好被执行指令被执行。预撷取与乱序运算的至少一个问题是,被预撷取与提供执行的指令可能会在之后被自修正程序码修改。因此,已经被提供执行的指令可能会错过修正,而可能导致不适当或非原意的运算。
现代的处理器需要侦测或预防逾时指令被完成,逾时指令是指被程序码修改之后不欲被执行的指令。处理器一般会将存储器的所有权分割为一指令区域与一数据区域,指令快取存储器拥有指令区域,数据快取存储器(data cache,dcache)拥有数据区域。指令区域被预设为只储存用以执行的指令,而数据区域被预设为可被软件程序所储存的数据与信息所利用。如果指令快取存储器尝试读取数据快取存储器所拥有的存储器,所有权必需被从数据快取存储器转换,且转换的过程会缓慢而冗长且使得运算被串列化。
在以往的架构中,所有权基于分页的边界。通常一个分页的大小是4KB(kilobytes)。虽然,4KB的存储器并不占有显着的容量,自修正程序码能会产生指令快取存储器与数据快取存储器之间的所有权颠簸(thrashing)现象,而降低了运算效率。一种解决方法是降低所有权的大小至四分之一页,也就是4KB的分页大小中的1KB的存储器区块。但尽管只是1KB的所有权区块在许多情况中还是足以对自修正程序码造成麻烦。而且,更大的分页大小也常被使用,像是2MB(megabytes)甚至是1GB(gigabyte),因此对于降低整体效能来说,所有权区块一直是个重要的议题。
发明内容
一种处理器用以基于快取线决定存储器所有权以侦测通过执行指令修正快取线的自修正程序码,依据一实施例,处理器具有所有权队列、撷取系统、处理前端、执行系统、新近目标地址比较器与执行逾时侦测器。撷取系统用以提供被撷取的快取线的快取线数据给处理前端。撷取系统用以决定每一快取线的所有权索引。撷取系统还用以将所有权索引与对应的快取线地址输入进所有权队列的储存单元的其中之一。处理前端用以将快取线的快取线数据转译成多个指令。每一指令包括所有权队列中储存有快取线地址的储存单元的所有权索引。快取线地址关联于从每一指令产生的快取线数据。且处理前端用以输出指令以执行。当指令被提出时,处理前端设定对应的储存单元的执行位。其中,处理器还包含执行系统,执行系统用以决定已被输出的每一指令的目标地址。当目标地址被执行系统决定时,新近目标地址比较器用以对新被决定的每一目标地址与储存于所有权队列的有效储存单元的每一快取线地址进行比较,以决定是否有匹配的储存单元。执行逾时侦测器用以计算被新近目标地址比较器决定的每一匹配的储存单元的执行位,且当匹配的任一储存单元的任何执行位被设定时,逾时侦测器还用以使对应于被决定的目标地址的储存指令被标记以产生执行例外事件。其中,当将要退出的储存指令被标记以产生执行例外事件时,执行系统用以执行所述的执行例外事件。
在一实施例中,执行例外事件使执行系统令被标记以产生执行例外事件的储存指令退出,以刷新处理器,且以使撷取系统取得指令指标以从指令快取存储器读取储存指令后的指令。
在一实施例中,处理前端还用以设定依据跨立于两快取线的快取线数据产生得每一指令中的跨立位。当被提出的指令的跨立位被设定时,处理器还设定对应的储存单元之后的下一个连续的储存单元的执行位。
在一实施例中,执行系统例如还具有储存队列与储存管线。储存队列用以储存自储存前端被提出的每一储存指令,且用以储存执行系统决定的目标地址。储存管线,用以决定在提出后被执行的每一储存指令的目标地址,且将每一被决定的目标地址提供至储存队列中对应的储存单元且提供至新近目标地址比较器。
在一实施例中,处理器例如还具有新近储存单元比较器与提交逾时侦测器。新近储存单元比较器用以比较被输入进储存队列中的储存单元其中之一的对应的快取线地址与储存于储存队列中的每一目标地址,且当匹配结果被找到时,新近储存单元比较器用以设定所有权队列中的储存单元其中之一的逾时位。新近目标地址比较器设定新近目标地址比较器决定的任一匹配的储存单元的逾时位。提交逾时侦测器依据被处理前端提出的每一指令的所有权索引存取所有权队列中对应的储存单元,且当将要退出的指令被标记以产生提交例外事件,提交逾时侦测器标记被提出的指令以产生提交例外事件。当将要退出的指令被标记以产生提交例外事件时,执行系统执行提交例外事件。提交例外事件使执行系统刷新处理器,以避免被标记以产生提交例外事件的指令退出,且以撷取系统自指令快取存储器中重新撷取被标记的指令以产生提交例外事件的指令。处理前端还用以设定依据跨立于二快取线的快取线数据而产生的至少一指令中的跨立位。当被提出的指令的跨立位被设定时,提交逾时侦测器用以读取所有权快取存储器中对应的储存单元之后的下一个连续的储存单元的逾时位。当所有权快取存储器中对应的储存单元之后的下一个连续的储存单元的逾时位被设定时,提交逾时侦测器使被提出的指令被标记以产生提交例外事件。
依据一实施例,依据快取线决定存储器所有权以侦测通过执行指令修正快取线的自修正程序码的方法具有,撷取得多条快取线,每一快取线具有快取线地址与快取线数据,决定取得的每一快取线的所有权索引,并将每一快取线与对应的所有权索引输入进所有权队列中的储存单元的其中之一。转译来自快取线的快取线数据为多个指令。将所有权队列中的储存单元的所有权索引加入每一指令,所有权队列储存有快取线地址,快取线地址对应于指令所产生自的快取线数据。提出多个指令以执行,且当指令被提出时,设定对应的储存单元的执行位。决定被提出的每一储存指令的目标地址。当每一目标地址被决定,比较新被决定的目标地址与储存于所有权队列中的有效的储存单元的每一快取线地址,以决定是否有任何匹配的储存单元。当匹配的任一储存单元的执行位被设定时,使对应的储存指令被标记以产生执行例外事件。当将要退出的储存指令被标记以产生执行例外事件时,执行所述的执行例外事件。
在一实施例中,执行例外事件的步骤例如具有,令被标记以产生执行例外事件的储存指令退出,刷新处理器,取得指令指标以自指令快取存储器撷取储存指令之后的指令。
在一实施例中,所述的方法例如还具有,设定依据跨立于两快取线的快取线数据产生的每一指令中的跨立位。当被提出的指令的跨立位被设定时,设定所有权队列中对应的储存单元之后的下一个连续的储存单元的执行位。所述的方法例如还具有,储存被提出的每一储存指令,决定被提出的每一储存指令的目标地址,并将被决定的每一目标地址连同被储存的多个储存指令中对应的其中之一一同储存。
本发明能够提高处理器的效能。
附图说明
通过以下的叙述与图式,本发明的益处、特点与优点可以被更佳的理解。
图1为依据一实施例实作以建立数据与指令间的所有权的一所有权队列结合一处理器的简化功能区块图。
图2为依据一实施例实作的图1中的所有权队列具有相对于其他所有权处理模块的接口的一简化功能区块图。
图3为依据一实施例中图1的处理前端的运算的流程示意图。
图4为依据一实施例中所有权与例外事件处理的流程示意图。
图5为依据一实施例中执行、退出与例外事件处理的流程示意图。
其中,附图中符号的简单说明如下:
100:处理器;101:所有权队列;102:系统存储器;103:预撷取模块;104:处理前端;105:指令快取存储器;106:执行系统;107:撷取模块;109:解码器;111:循环队列;113:循环侦测器;115:指令转译器;117:暂存器别名表;118:微操作;119:分支侦测器;121:重排序缓冲器;123:排程器;125:执行单元;127:储存队列;129:储存管线;130:数据快取存储器;131:其他元件;135:退出模块;137、139:逾时侦测比较器;141:覆写侦测器;143、145:逾时侦测器;CA:快取线地址;DA:目标地址;EXB:执行位;L、T1、T2:栏位;IP:指令指标;OWNI:所有权索引;SDB:跨立位;STB:逾时位;UOP、UOPX:微操作;WB:缠绕位。
具体实施方式
发明人发现了由于自修正程序码所产生的存储器所有权的问题。他们开发出了依据快取线建立存储器所有权的所有权队列以侦测自修正程序码。
图1是处理器100结合一所有权队列(OWNQ)101的一个简化的功能区块图。所有权队列101依据一实施例而实作以建立数据与指令间的所有权。处理器100的标准指令集架构(instruction set architecture,ISA)可以是一个x86宏(macro)架构。此x86宏架构可以正确地执行被设计成执行于一个x86处理器的大部分的应用程序。一个应用程序的预期结果被取得时,应用程序算是被正确地执行。尤其是,处理器100执行x86指令集中的指令,且具有x86使用者可视的暂存器集。但是本发明并不限制于x86架构,处理器100可依据本领域普通技术人员理解的其他可替换的指令集架构。如图所示,处理器100耦接一外部系统存储器102。外部系统存储器102用以储存软件程序、应用程序、数据与本领域普通技术人员所理解的其他数据。处理器100可以具有一总线接口单元(bus interface unit,BIU)或相仿的元件(未绘示)以耦接系统存储器102。在一系统晶片的架构中,处理器100、系统存储器102与其它处理功能模块(未绘示)可以结合于一共用的集成电路。
处理器100具有一处理系统。处理系统具有处理前端104与执行系统106以及其他于后续说明的处理模块。处理前端104具有一信息预撷取(PREFETCH)引擎103、一指令快取存储器(ICACHE)105、一撷取单元107、一解码器109、一循环队列(LQ)111、一指令转译器(XLATE)115、一暂存器别名表(RAT)117与一分支预测器119。执行系统106一般具有一重排序缓冲器(ROB)121、一排程器123(亦称保留站)、执行单元125与一储存队列127。执行单元125具有至少一储存管线129以及其他的执行单元131。执行单元131例如为一或多个整数(INT)单元、一或多个浮点数(或媒体)单元或至少一负载管线。在一实施例中,负载管线与储存管线可以被结合进一个存储器排序缓冲器(MOB)(未绘示)或相仿的元件。储存管线129可以还耦接一数据快取存储器(DCACHE)130。数据快取存储器130具有一或多个级别的数据快取存储器,例如一第一级别(L1)的快取存储器或一第二级别(L2)的快取存储器等等。数据快取存储器130可以也耦接系统存储器102。如图所示,重排序缓冲器121还具有一退出模块135,相关细节请容后再叙。
其他的所有权逻辑与电路连同所有权队列101一同被提供,以进行所有权决定与侦测自修正程序码。以下进行相关细节的介绍。所述的其他的所有权逻辑与电路具有一第一逾时侦测比较器(STALE DETECT COMPARATOR1)137、一第二逾时侦测比较器(STALEDETECT COMPARATOR2)139、一覆写侦测器141、一第一逾时侦测器(STALE DETECTOR1)143与一第二逾时侦测器(STALE DETECTOR2)145。
在一般性的操作中,预撷取引擎103从系统存储器102撷取程序资讯并储存所述的资讯进指令快取存储器105的快取线中。每一快取线可以具有一预设长度。所述的预设长度例如为64字节(byte)。快取线的尺寸可以是任意的且在其他的架构之下可以是不同的。撷取单元107从指令快取存储器105取得每一快取线且提供快取线数据给解码器109以将所述的数据解析成指令信息。解码器109将快取线数据分割且格式化成指令与对应于指令的信息,例如运算域或相仿的信息。举例来说,在处理器100支持x86指令集架构的情况下,所述的指令例如为x86指令。此处提到的每一指令集架构例如是一宏指令或依据处理器100所支持的指令集的一宏操作。解码器109所提供的宏操作接着被加入循环队列111,且被提供至指令转译器115。指令转译器115将每一宏操作转译成一或多个对应的微指令或称微操作(micro operations,uop)。所述的微指令或微操作依据处理器100的原生指令集编排而成。当每一微操作被提供至重排序缓冲器121时,一指令指标(IP)也被决定且连同每一微操作被提供。微操作被提供至暂存器别名表117。暂存器别名表117用以依据每一微操作的程序排序、运算域源或重命名信息,产生每一微操作的相依信息。
来自暂存器别名表117的每一微操作(连同相关联的信息)依据程序顺序被加入至重排序缓冲器121,且被加入至排程器123。排程器123具有至少一个队列,所述的队列用以储存接收自暂存器别名表117的每一微操作以及其相依信息。当微操作已准备好被执行时,排程器123调度接收到的微操作至对应的执行单元125。储存微操作被提供至储存管线129以进行处理,而所有其他的指令类型被提供至其他执行单元131中的适当的单元(例如整数指令被提供至整数执行单元,媒体指令被提供至媒体执行单元,等等)。当所有的相依关系被解决了,一微操作被认为是准备好进行执行。连同调度一微操作,暂存器别名表117将重排序缓冲器121的一储存单元安排给所述的微操作。因此,所述的微操作按程序顺序被分配至重排序缓冲器121中。重排序缓冲器121例如被编排成一循环队列,以确保所述的微操作依据程序顺序退出。暂存器别名表117也将对应的指令指标连同对应的相依信息提供给重排序缓冲器121,以将指令指标连同对应的相依信息储存于储存有微操作的储存运算元与结果的储存单元。在一实施例中,一个单独的物理暂存器堆(PRF)(未绘示)可以被包含进来。暂存器别名表117可以还将物理暂存器堆中的一或多个物理暂存器分配或映射给每一个微操作,以储存运算元与结果。
执行单元211的结果例如被传回给重排序缓冲器121。重排序缓冲器121更新对应的栏位且/或更新架构暂存器(architectural register)或相仿的元件。在一物理暂存器堆的实施例中,重排序缓冲器121具有指标,指标用以更新物理暂存器堆中对应的暂存器。在一实施例中,暂存器别名表117将架构暂存器映射至物理暂存器堆中的物理暂存器,并更新重排序缓冲器121中对应于微操作的指标或其他相仿的信息(未绘示)。重排序缓冲器121中的指标例如在执行中或在执行之后被更新,且指标用以于运算中更新物理暂存器堆的暂存器中的内容。重排序缓冲器121中的退出模块135最后依据程序码顺序令微操作退出,以确保适当的运算与软件程序或应用程序原本的指令一致。当一微操作被标记或者是指示有一例外事件时,退出模块135依据例外事件的类型采取适当的行动。相关细节请见以下详述。
被加入至储存管线129以进行运算的储存微操作也被加入至储存队列127中的对应的一个储存单元。当最初被从暂存器别名表117加入时,储存微操作的运算元的地址可能是不被确知的。储存微操作的运算元的地址包含目标地址(DA)。当储存管线129决定被执行的一储存微操作的目标地址,储存管线129提供目标地址至储存队列127中的对应的储存单元。
分支预测器119侦测由解码器109提供的与/或循环队列111中的分支宏操作输出,且分支预测器119依据分支是否被采用而产生分支预测结果。分支预测器119与撷取单元107进行通讯。撷取单元107依据分支预测结果可以在指令快取存储器105中分支至不同的位置。撷取单元107与预撷取引擎103也彼此进行通讯。因此,当分支位置并不位于指令快取存储器105中时,预撷取引擎103从系统存储器102取得对应的位置,以输入进指令快取存储器105。
在正常的运算当中,来自解码器109的宏操作被经由循环队列111缓冲并被提供至指令转译器115。当循环侦测器113判断出循环中的指令多次递回,所述的循环例如全部位于循环队列111或者是至少部分位于循环队列111,循环侦测器113辨识一循环,所述循环中的指令重复地从循环队列111中被取出而不是从指令快取存储器105中被取出。在一实施例中,当一预设数量的循环递回发生时,循环侦测器113侦测到一循环。在一具体的实施例中,递回个数为24,但其他合适的递回个数也可以被使用。在一实施例中,循环侦测器113假设循环会无限的持续,因此循环侦测器113持续重复的循环运算直到预测不正确(循环分支不被采用),此时,系统被刷新,且撷取单元107开始在指令快取存储器105的循环之后的下一个位置(或可能是另一个分支位置)取得信息。
在循环侦测器113已侦测到一循环的情况下,撷取单元107会持续地取得且将快取线加入至解码器109的缓冲器,直到缓冲器被填满,而撷取运算会暂时地停住。在一实施例中,当循环侦测器113侦测到一循环时,撷取单元107重复地取得循环中的快取线。于另一实施例中,撷取单元107会被通知循环侦测器113已侦测到一循环,且撷取单元107会开始读取循环外的数据。例如,撷取单元107会开始读取循环的下一个连续的位置。不论哪一个情况中,当一个循环进行中,解码器109会被填满。
当撷取单元107将快取线数据加入解码器109时,撷取单元107也将对应的快取线地址(CA)加入所有权队列101中的一储存单元并标记此储存单元为有效的。所有权队列101会是被编排为循环缓冲器或相仿的结构,所有权队列101会具有加入指标与推出指标以区别已被分配的储存单元与已被解除分配的储存单元。于另一实施例中,所有权队列101中的每一储存单元具有一有效位或一有效值以区别有效储存单元与无效储存单元。其中,每一被加入所有权队列101的新的储存单元的有效位被设定。在一实施例中,撷取单元107决定一所有权索引(OWNI)与一缠绕(wrap)位(WB)。所有权索引与缠绕位对应于快取线的快取线地址,且对应的所有权索引值与缠绕位值被连同快取线地址一同加入所有权队列101中对应的储存单元。所有权索引唯一地定义出所有权队列101中的每一储存单元。在此缠绕位被用以侦测所有权队列101中的一覆写动作。
暂存器别名表117用以依据对应的所有权索引识别每一快取线中的最后的微操作,并用以标注所述的快取线的微操作为最后一个的微操作,以使此信息被提供至重排序缓冲器121。当退出模块135退出一个微操作时,退出模块135决定被退出的微操作是否被标注为所有权队列101中被给定的一快取线的最后一个微操作。若是,退出模块135指示所有权队列101推出对应的储存单元或使所有权队列中的对应的储存单元无效。
当撷取单元107将每一新的快取线地址加入进所有权队列101中的一储存单元时,快取线地址也被提供至第一逾时侦测比较器137的输入端。逾时侦测比较器137也自储存队列127中读取每一有效的目标地址(DA),并比较每一目标地址与新的快取线地址,以决定是否有相匹配者。逾时侦测比较器137可以被视为一种新储存单元的比较器。当快取线地址与任何的目标地址相匹配,所有权队列101中的储存单元的对应的一个逾时位被设定。逾时位STB指示一储存微操作与快取线命中彼此,亦即,储存指令已经修改快取线或者是储存指令将会修改快取线。当一储存指令与储存在所有权队列101一有效储存单元的一快取线命中彼此或彼此冲突,任何依据此快取线产生的指令会是无效的。当逾时位STB被设定的时候,任何来自于所述的快取线的微操作可能是无效的(也就是逾时的)。
所有权索引值与缠绕位值更被加进或关联至提供到解码器109的对应的快取线数据。解码器109具有每一宏操作的一对应的缠绕位值与所有权索引值以识别出是由解码器109从哪个宏操作对应的快取线取得。当多个宏操作被自同一条快取线取出时,同样的缠绕位与所有权索引被指派给来自同一条快取线的每一宏操作。在一实施例中,宏操作并未与数据快取存储器105中的快取线对齐时,每一宏操作还具有一跨立位SDB。跨立位SDB用以识别出一宏指令跨立于两条不同的快取线的情况。也就是说,一宏指令开始于其中一条快取线并结束于下一个连续的快取线。当这样的情况发生时,解码器109加入第一条线的所有权索引并设定宏操作的跨立位为真。当宏操作被包含进一单一的快取线,跨立位被设定为假。当被加入进指令转译器115时,每一宏操作具有对应的缠绕位、所有权索引与跨立位。当一个位或一个栏位被设定为真或假时,所述的位或栏位(具有至少一个位)被设定为逻辑“1”以设定为真,且被设定为逻辑“0”以设定为假。
指令转译器115将每一宏操作转译成一或多个微操作。在转译的过程当中,由一宏操作产生的每一微操作同样具有与所来自的宏操作一样的缠绕位值、所有权索引值与跨立位值。因此,当一个宏操作被转译成三个个别的微操作时,三个微操作中的每一具有与原本的宏操作相同的缠绕位值、所有权索引值与跨立位值。当传输经过暂存器别名表117时,缠绕位值、所有权索引值与跨立位值还是被保留于每一微操作。
一示范性微操作uopx示于图1中的118,且示范性微操作uopx用以被暂存器别名表117推出与被加入进重排序缓冲器121及排程器123中的为处理器100所定义的任意一个微操作。每一微操作具有多个栏位以便于对应的微操作的运算或执行被处理器100的执行系统106所执行。一或多个栏位(未绘示)用以识别特定的指令与指令类型及其相关联的运算元,例如常数运算元、地址、储存位置与暂存器索引等等的。其他的栏位被提供以储存指令指标IP、缠绕位WB、所有权索引OWNI与跨立位SDB。如以下所述地,每一微操作还具有栏位T1以指示第一类型的例外事件,每一微操作还具有栏位T2以指示第二类型的例外事件,每一微操作还具有栏位L以指示指令是否是被暂存器别表117标记为快取线中的最后指令。
当每一微操作自暂存器别名表117中推出且被加入重排序缓冲器121与排程器123中时,暂存器别名表117依据微操作的所有权索引OWNI的索引值存取所有权队列101中对应的储存单元,并设定取出的储存单元中的一个执行位EXB。当微操作的跨立位为真以指示其为跨立指令时,暂存器别名表117设定所有权队列101中下一个连续的储存单元的执行位。除此之外。储存单元的执行位用以侦测一未被侦测为逾时的储存微操作的之后的命中。
当每一微操作被自暂存器别名表117中输出时,覆写侦测器141通过微操作所具有的所有权索引值存取所有权队列101中对应的储存单元,且覆写侦测器141通过微操作所具有的所有权索引值读取被取出的储存单元的缠绕位值。当微操作的缠绕位值并不匹配于所有权队列101中的对应的储存单元的缠绕位值时,一覆写作动曾经发生,且覆写侦测器141设置微操作的位T1(或是标记栏位T1为真)以指示一第一例外事件或是第一类型的例外事件于微操作被退出时被执行。在一实施例中,在微操作被加入重排序缓冲器121前,位T1于微操作被提出之时可以被覆写侦测器141设定。在另一实施例中,当被加入至重排序缓冲器121时或当被加入至重排序缓冲器121之后,重排序缓冲器121中的储存单元的位T1被覆写侦测器141设定或是被重排序缓冲器121依据覆写侦测器141的指示设定。一个缠绕位不匹配通常指示一循环引发所有权队列101中的一覆写,以至于对应的快取线不再侦测自修正程序码。退出模块135侦测T1被设定以指示对应于重排序缓冲器121的微操作储存单元的微操作被标记成第一类型的例外事件。覆写意味着所有权队列101中的一个储存单元被覆写而使得关联于对应快取线的自修正程序码可能变得无法侦测而导致不正确的结果。更进一步地来说,第一类型的例外事件刷新了机器以预防不正确的状况。
当每一微操作被自暂存器别名表117中输出时,第一逾时侦测器143依据微操作所具有的所有权索引存取所有权队列101中对应的储存单元,且第一逾时侦测器143依据微操作所具有的所有权索引读取取出的储存单元的逾时位。当微操作的跨立位为真时,第一逾时侦测器43还读取所有权队列101中的下一个连续的储存单元的逾时位STB。当所有权队列101中的此逾时位STB为真,或是微操作如跨立位SDB所示地为跨立指令且所有权队列101中的下一个连续的储存单元的逾时位为真,则第一逾时侦测器143通过设定栏位T1为真(或是通过设定位T1)以标记微操作成第一类型的例外事件。逾时侦测器143可以是指用以当指令被提出时,用以侦测可能的无效指令的提交逾时侦测器。如覆写侦测器141的例子,栏位T1于被加入进重排序缓冲器121中的一储存单元前、于被加入进重排序缓冲器121中的一储存单元时、或于被加入进重排序缓冲器121中的一储存单元后被设定为真,可以是由第一逾时侦测器143或是由重排序缓冲器121设定为真。如前述地,逾时位STB用以指示快取线已被一储存微操作修改,因此指令可能是无效的。
每当储存管线129产生一目标地址(DA)给对应的一储存微操作时,目标地址除了被提供以更新储存队列127中对应的一储存单元之外,目标地址还提供给第二逾时侦测比较器139的一输入端。逾时侦测比较器139还存取所有有效的快取线地址且比较新的目标地址于所有权队列101中每一有效的快取线地址。逾时侦测比较器139可做为新目标地址的比较器。当有一相匹配结果时,逾时侦测比较器139设定所有权队列101中的对应的储存单元的逾时位为真。此外,当逾时侦测比较器139侦测到有一相匹配结果时,对应的所有权索引被提供至第二逾时侦测器145的一输入端。逾时侦测器145存取所有权队列101中对应的储存单元,且读取此储存单元中的执行位EXB。当储存单元的执行位EXB被设定为真,则逾时侦测器145使重排序缓冲器121中的储存微操作储存单元被标记成第二例外事件类型或者是第二类型的例外事件,这是通过设定储存单元的栏位T2为真。逾时侦测器145可做为用以侦测正执行中的可能的无效指令的执行中逾时侦测器。逾时侦测器145可以直接存取重排序缓冲器121中的储存微操作储存单元以设定T2,或者逾时侦测器145可以指示重排序缓冲器121以设定T2。
关联于重排序缓冲器121中的一特定的微操作uopx的示范性的微操作118简化后被示于图1中。每一个别的微操作储存单元具有栏位T1以指示第一类型的例外事件,且每一个别的微操作储存单元具有栏位T2以指示第二类型的例外事件,每一个别的微操作储存单元具有栏位L以指示指令是否为被暂存器别名表117标记的快取线的最后一个微操作指令。当微操作为一快取线的最后一个微操作,栏位L被设定为真,反之则栏位L被设定为假。退出模块135侦测重排序缓冲器121的微操作的储存单元的栏位T1与栏位T2,且退出模块135执行或初始化对应的例外常式(routine)或者是程序。然而,包含储存微操作的任何的微操作都可能被标记成第一类型的例外事件,但只有储存微操作会被标记成第二类型的例外事件。
退出模块135侦测每一微操作于何时准备好退出,例如当微操作为重排序缓冲器121中最老的指令时。当一个微操作准备好退出时,退出模块135还侦测对应的微操作的储存单元中的栏位T1、栏位T2与栏位L。当一微操作的栏位T1为真时,退出模块135产生第一类型的例外事件给所述的微操作,且当栏位T2为真时,退出模块135产生第二类型的例外事件给所述的微操作。当栏位T1与栏位T2为假且栏位L为真时,退出模块135指示所有权队列101推出所有权队列101中对应的储存单元或是使所有权队列101中的所述的储存单元无效化,而有效率地从所有权队列101中移除完整的快取线。
当重排序缓冲器121中最老的微操作(也就是将要退出)被指示为第一类型的例外事件,重排序缓冲器121在处理器100中广播一对应的例外事件讯号,且处理系统被刷新。在这样的情况下,执行管线中的任何的宏操作与微操作被有效率地无效化,包括导致所述的例外事件的微操作。当第一类型的例外事件发生时,所有未退出的微操作被刷新,包括储存队列127中任何未退出的储存微操作。退出的储存微操作仍持续停留在储存队列127中,直到其数据被提交给存储器架构(如数据快取存储器130与/或系统存储器102)。导致第一类型的例外事件的微操作并不被允许退出,微操作记录于暂存器重排缓冲器121中对应的指令指标可被使用以存取微操作于指令快取存储器105中的地址。预撷取引擎103与撷取单元107暂时的停住。处理器100中断于处理器100的一微程序码唯读存储器(未绘示)中的例外常式,且对应的例外程序码用以指示例外事件的类型。一旦处理系统被刷新时,例外常式取得指令指标且将指令指标传给撷取单元107以重新撷取关联于导致例外事件的微操作的宏操作。
储存微操作的第二类型的例外事件相仿于其他类型的微操作的第一类型的例外事件。在此情况中,储存微操作被允许退出,使储存微操作完成了其运算且更新其目标地址所指出的存储器位置。因为存储器位置先被指令快取存储器105所拥有,且储存微操作是需要被处理器100中的数据快取存储器130所拥有的数据运算,因此一监控(snoop)单元被初始化以使指令快取存储器105中对应的快取线无效化。存储器修正与无效化被确保会在例外事件时发生。相仿于第一类型的例外事件,第二类型的例外事件的例外常式刷新机器,且存取与传递指令指标至撷取单元,以于所述的位置重新开始。因为导致第二类型的例外事件的储存微操作被允许完成,指令指标被增加至储存微操作于指令快取存储器105之后的下一指令,且运算由储存指令之后的所述的位置继续。
图2为依据一实施例实作的图1中的所有权队列101具有对应于其他所有权处理模块的接口的一简化功能区块图。所有权队列101具有多个储存单元。每一储存单元具有一栏位WRAP以储存缠绕位。每一储存单元具有一栏位OWNI以储存对应的一索引值。每一储存单元具有一执行栏位以储存对应的一执行位。每一储存单元具有一有效栏位以储存有效位。每一储存单元具有一快取线地址栏位以储存对应的一快取线地址。每一储存单元具有一逾时栏位以储存对应的逾时位。
在一实施例中,所有权索引为一计数值。当每一储存单元被加入进所有权队列101时,所述的计数值增加。为了确保所有权队列101中的每一储存单元的所有权索引具有一独特的索引值,所有权索引的位数B对应于所有权队列101中的储存单元的个数N,例如2B≥N。在一个例子中,如图2所示,所有权队列101中的储存单元的数量为N=32,且所有权索引的位为5。在一实施例中,撷取单元107以类似方式决定缠绕位,缠绕位做为所有权索引的一个额外的最高有效位。在这样的情况下,当所有权索引从0计数到一最大值时,缠绕位是0b(b用以代表一二进位数),其中最大值用以指示所有权队列101中的储存单元的总个数。当所有权被重设为0且重新累加至最大值时,且缠绕位是1b。换句话说,对于所有权队列101每一次完整的传递(pass),缠绕位WB被切换于两值之间。对于所有权索引的位数B,储存单元的总数可以少于储存单元最大可能的个数。举例来说,对总数量为26的储存单元来说,在第一次递回时(OWNI从十进位的0累计至十进位的25,且WB为0),WB|OWNI从0|00000b计数至0|11001b。接着,在第二次递回中(OWNI从十进位的0计数至十进位的25且WB为1),从1|00000b计数至1|11001b。后续依上述的方式重复。
如前述地,撷取单元107将一新的快取线地址CA插入快取线地址栏位,并设置有效栏位中对应的有效位,并决定与插入对应的所有权索引至栏位OWNI,并决定与插入对应的缠绕位WB至栏位WRAP。新被加入的快取线地址被提供至一逾时侦测比较器137的一输入端。逾时侦测比较器137也从储存队列127接收目标地址DA。当新的快取线地址与来自储存队列的任何目标地址之间有相匹配的结果时,逾时栏位中对应的逾时位被设定为真。当每一微操作被自暂存器别名表117提出时,它依据微操作的所有权索引存取所有权队列101中对应的储存单元以设定储存单元对应的执行位EXB。此外,当微操作的跨立位被设定以指示一跨立微操作时,暂存器别名表117存取所有权队列101中的下一个储存单元并设定该储存单元对应的执行位。当一快取线的最后的微操作退出时,暂存器重排缓冲器121存取所有权队列101中对应的储存单元并重置或清除有效位。
储存管线129决定每一储存微操作的目标地址并储存目标地址于储存队列127的对应的储存单元。目标地址也被提供至第二逾时侦测比较器139。第二逾时侦测比较器139从所有权队列101中存取快取线地址CA。当新被决定的目标地址匹配来自所有权队列101的快取线地址中的任何一个时,逾时侦测比较器139设定所有权队列101中的对应的储存单元的逾时位。此外,匹配的所有权索引的索引值被提供至第二逾时侦测器145。第二逾时侦测器145依据所有权索引值存取所有权队列101中对应的储存单元以存取对应的执行位EXB。当所有权队列101中对应的储存单元的执行位被设定为真,逾时侦测器145将重排序缓冲器121中冲突的储存微操作的储存单元标记(或是令其被标记)成第二类型的例外事件。
如前述地,覆写侦测器141从暂存器别名表117提出的微操作接收缠绕位值与所有权索引值,且覆写侦测器141依据所有权索引从所有权队列101中的对应的储存单元存取缠绕位值。当所有权队列101中对应的储存单元的缠绕位WB不匹配于微操作的缠绕位,覆写侦测器141将微操作标记(或是令其被标记)成第一类型的例外事件。此外,第一逾时侦测器143从暂存器别名表117提出的微操作接收所有权索引值与跨立位值,且第一逾时侦测器143依据所有权索引值以存取所有权队列101中对应的储存单元的逾时位。当被暂存器别名表117提出的微操作中的跨立位为真以指示一跨立微操作,则逾时侦测器143存取所有权队列101中下一个连续的储存单元的逾时位。当被存取的储存单元的任何一个的逾时位被设定为真,逾时侦测器143将微操作标记(或是令其被标记)成第一类型的例外事件。
一第一储存单元显示于所有权队列101的顶部,第一储存单元具有一缠绕位WB、一所有权索引、一执行位EXB、一有效位、一对应的快取线地址CA_33与一逾时位STB。其中,缠绕位WB=1b。所有权索引的索引值为00000b。执行位的值为0b。有效位的值为1b。逾时位的值为0b。一所有权队列101中的第二储存单元位于第一储存单元的下方。第二储存单元具有一缠绕位WB、一所有权索引、一执行位EXB、一有效位、一对应的快取线地址CA_34与一逾时位STB。其中,缠绕位WB=1b。所有权索引的索引值为00001b。执行位的值为0b。有效位的值为1b。逾时位的值为0b。一所有权队列101中的第三储存单元位于第二储存单元的下方。第三储存单元具有一缠绕位WB、一所有权索引、一执行位EXB、一有效位、一对应的快取线地址CA_03与一逾时位STB。其中,缠绕位WB=0b。所有权索引的索引值为00010b。执行位的值为0b。有效位的值为0b。逾时位的值为0b。往所有权队列101的末端,最后五个储存单元分别具有快取线地址CA_28至CA_32与对应的所有权索引,分别具有所有权索引值11011b–11111b。具有快取线地址CA_28的储存单元还具有执行位、有效位与逾时位。执行位、有效位与逾时位的值皆为0b。而接下来分别具有快取线地址CA_29–CA_31的三个储存单元分别具有值为1b的储存位与值为1b的有效位。具有快取线地址CA_29的储存单元与具有快取线地址CA_31还具有值为0b的逾时位。而具有快取线地址CA_30的储存单元则具有值为1b的逾时位。具有快取线地址CA_32的最后储存单元为有效但尚未执行,且被标记为逾时的。
在第一次传递中,快取线地址CA_1至快取线地址CA_32以具有值0b的缠绕位填满所有权队列101。在第二次传递刚开始时,第一次传递中最前面两个储存单元会被具有快取线地址CA_33与具有快取线地址CA_34与所有权索引值00000b所有权索引值00001b的储存单元给分别覆写,储存单元各具有值为1b的缠绕位WB。这些新的储存单元(33与34)为有效的,但尚未有任何微操作被执行。第三至第二十八个储存单元已被无效化(可能是完成再无效)。第二十九与第三十一储存单元为有效的,且每一具有至少一微操作正在执行中。第三十储存单元为有效的且具有至少一仍在执行中的微操作,但已被标记为逾时的。第三十二个储存单元并不具有从暂存器别名表117中被提出的微操作,因此第三十二个储存单元尚未被设定为执行,但是其逾时位已被设定以指示与一储存指令冲突或命中。
当撷取单元107计数所有权索引值至11111b,同时缠绕位WB的值如所有权队列101中最后的具有快取线地址CA_32(例如第一次传递)的储存单元所指示的为0b,它设定缠绕位的值如具有快取线地址CA_33(开始第二次传递)的储存单元所指示的为1b且将所有权索引值重置为00000b重新开始计数。后续被撷取单元107读取的三十一个储存单元的缠绕位WB的值持续维持为1b直到所有权索引被重置为00000b,操作以如上述的方式重复。当一个循环被侦测到时,循环队列111不再自解码器109加入宏操作,撷取单元107仍然持续地自快取存储器105读取快取线至所有权队列101与解码器109,所有权队列101中的对应于循环指令的一储存单元可能被撷取单元107覆写。在这样的情况下,处理器100可能不能够再为所述的快取线侦测自修正程序码。被暂存器别名表117提出的而位于一循环中的微操作的缠绕位WB的值不再与所有权队列101中被覆写的储存单元的缠绕位的值一样。在被提出的微操作的缠绕位值与所有权队列101中对应的储存单元的缠绕位值不匹配的情况下,覆写侦测器141侦测被覆写的快取线并将微操作标记(或是令其被标记)成第一类型的例外事件。即使所有权队列101中的储存单元被标记为无效或被自队列中推出,这依然为真。一个无效的或被推出的储存单元持续停留在所有权队列101中直到被覆写。
图3为依据一实施例中处理前端104的运算的流程示意图。在第一个区块301,快取线(例如从系统存储器102)被读取且储存于指令快取存储器105中,例如是通过信息预撷取引擎103。在下一个区块303,下一条快取线的一个缠绕位与所有权索引值被决定,例如是通过撷取单元107,且这些信息连同快取线地址被加入所有权队列101中下一个可用的储存单元。撷取单元107还设定所有权队列101中的储存单元中的有效位。如前述地,所有权队列101例如被实施成一循环的缓冲器,所述的有效位用以决定任意时点中所有权队列101中的当前的有效储存单元。在一可替代的实施例中,加入指标与推出指标可被使用。
如下一个区块305所示,当一个新的快取线地址被加入所有权队列101,新的快取线地址被比较于储存队列127中的每一个有效的目标地址。如下一个询问区块307所示,当有一命中被决定时,在区块309中,接收新的快取线地址的储存单元的逾时位STB被设定。在逾时位值被设定或者并没有命中时,所有权队列101的操作结束。
如区块311所示,同时,当一个新的快取线地址被加入所有权队列101中时,对应的快取线数据连同缠绕位与所有权索引被加入解码器109。而在下一个区块313,解码器109解析快取线中的宏操作,且将宏运算所在的快取线的对应的缠绕位与所有权索引加入进每一宏运算。此外,解码器109决定宏操作是否跨立两条快取线,也就是说宏操作起始于一条快取线并结束于下一条连续的快取线。若是,则宏操作的跨立位被设定。此时,每一宏操作具有缠绕位值、所有权索引值与跨立位值。
如区块315所示,宏操作接着被加入循环队列111,且如区块317所示,接着被加入指令转译器115。宏操作被转译成对应的微操作。如前述地,每一宏操作被转换成一或多个微操作。每一微操作具有被转译的宏操作的缠绕位值、所有权索引值与跨立位值。此时,每一微操作的指令指标也被指定为加入于微操作。在另一例子中,是在区块319或321时,指令指标被加入于每一微操作。在这些架构中的其中任一,指令指标最终连同每一微操作被加入重排序缓冲器121。在下一个区块319中,微操作被加入暂存器别名表117中,暂存器别名表117用以依据程序顺序、运算元与重命名信息产生每一微操作的相依信息。在区块321中,暂存器别名表117识别出且标注出位于一快取线最后的每一微操作,如前述的一实施例,是通过设定栏位L为真。此信息被传给重排序缓冲器121且被提供给重排序缓冲器121的对应的储存单元,因此退出模块135可以辨识每一快取线的指令何时被处理。接着,微操作被从暂存器别名表117中提出以进行执行以及后述的所有权与例外事件处理。
图4为依据一实施例中所有权与例外事件处理的流程示意图。在第一个区块401,暂存器别名表117提出每一个微操作至重排序缓冲器121与排程器123。此外每一储存微操作还被加入储存队列127中。相关操作继续进行至区块402,自暂存器别名表117中提出的微操作的所有权索引用于存取所有权队列101中对应的储存单元。此操作已说明于前述的处理器100的多个功能方块的叙述中,但可以集中于共同的逻辑。当微操作被自暂存器别名表117中提出时,相关操作接着进行至三个不同的区块,区块403、区块405与区块411。
在区块403中,储存单元的执行位EXB被设定。此外,若微操作的跨立位也为真,所有权队列101中的下一个连续的储存单元也被取出,且储存单元的执行位也被设定。此时,所有权队列101中被取出微操作的至少一快取线被标记为执行中,亦即,至少一快取线的微操作被提出以进行执行。在一或二执行位被设定后,流程图中的此分支被完成。
在区块405,储存单元中对应的缠绕位WB被取得且被比较于微操作的缠绕位WB。当微操作的缠绕位WB与所有权队列101中的储存单元对应的缠绕位WB不匹配,如在下个询问区块407,操作进行至区块409,而微操作标记成第一类型的例外事件(例如通过设定T1为真)。在标记(不匹配)之后或在缠绕位WB被判断为匹配,流程图的此分支的相关操作结束。
在区块411中,所有权队列101中取出的储存单元的逾时位STB被取得。此外,当微操作的跨立位值为真,所有权队列101的下一个连续的储存单元的逾时位也被取得。在区块413中,判断逾时位是否被设置。当两个逾时位其中之一被设定时,相关操作进行至区块409,微操作标记成第一类型的例外事件(例如通过设定T1为真)。在于区块409中标记微操作为第一类型的例外事件之后或当两个逾时位都未被设定时,流程图的此分支的操作结束。
当如前述地准备好被执行时,被提出至排程器123的每一微操作最终会被调度至多个执行单元125中的对应的其中之一。还包含了如区块415所示地调度储存微操作至储存管线129。在下一个区块417,储存管线129决定储存微操作的目标地址且更新储存队列127中对应的储存单元。在下一个区块419,当每一新的目标地址被决定,目标地址被比较于所有权队列101中的有效快取线地址。在区块421中,判断新的目标地址是否匹配于有效的快取线地址。当新的目标地址并不匹配于所有权队列101中的有效的快取线地址任何一个,相关操作完成。
当一个新的目标地址匹配于一个有效的快取线地址,相关操作进行至区块423,每个匹配的一储存单元的逾时位被设定。此外,匹配的储存单元的所有权索引被传至逾时侦测器145。在下一个区块425,逾时侦测器145依据被提供的所有权索引存取对应的储存单元以取得储存单元的执行位EXB。在下一个询问区块427中,当执行位EXB被决定为真,相关操作进行至区块429,冲突的储存微操作标记成第二类型的例外事件(例如通过设定T2为真)。在区块427中,当执行位EXB被决定为假或是在区块429标记储存微操作之后,操作结束。
图5为依据一实施例中执行、退出与例外事件处理的流程示意图。在第一个区块501中,微操作从排程器123如前述地被调度至执行单元125。被调度的为操作会执行,但特定操作情况下并非如此。在下一个区块503,重排序缓冲器121的退出模块135识别出下一个要退出的微操作。在下一个询问区块505,待退出的微操作的栏位T1被决定是否被设定为真(例如由退出模块135决定)。若是,则相关操作进行至区块507,第一类型的例外事件被执行,包括刷新处理器100。此外,导致第一类型的例外事件的微操作被如前述地从指令快取存储器105中重新撷取。例外事件的处理操作完成。
如下一个询问区块509,当T1不为真但T2被决定为真(例如经由退出模块135),相关操作进行至区块511,此时第二类型的例外事件被执行,储存微操作被允许完成与退出,且处理器100被刷新。在储存微操作开始例外事件之后,操作被重新开始于指令快取存储器105中的下一个指令。例外事件处理的相关操作于此被完成。在区块513,当T1与T2都不为真,微操作被允许退出。在区块514,当微操作的栏位L被设定为真,以指示为操作为快取线的最后一个微操作,则在区块515退出模块135指示所有权队列101以使对应的储存单元无效化,且操作被完成。所述的无效化例如是通过标记储存单元为无效,或者是推出所有权队列101中的储存单元堆迭中的储存单元。当栏位L为假,在指令被退出后,操作完成。
前述的相关内容被以本领域普通技术人员能制造或使用本发明,如所提供关联于特定应用与必要条件的内容。尽管本发明已参照于某些相关的版本而被相当仔细的方式描述,其他的版本与变异为可行的且是经过仔细考虑过的。前述提及的实施例的多个变化形对本领域普通技术人员来说会是显而易见的,且上述定义的一般性元则也可以适用于其他的实施例。例如此处所描述的电路可以被实作于适当的方式,例如逻辑装置或类似的电路。
以上所述仅为本发明较佳实施例,然其并非用以限定本发明的范围,任何熟悉本项技术的人员,在不脱离本发明的精神和范围内,可在此基础上做进一步的改进和变化,因此本发明的保护范围当以本申请的权利要求书所界定的范围为准。

Claims (20)

1.一种处理器,其特征在于,用于依据快取线决定存储器所有权以侦测通过执行指令修正快取线的自修正程序码,该处理器包括:
所有权队列,包括多个储存单元;
撷取系统,用以提供多条快取线的快取线数据给处理前端,其中,该撷取系统用以决定每一该快取线的所有权索引,并将该所有权索引与对应的快取线地址输入进该所有权队列的该多个储存单元的其中之一;
其中,该处理前端用以将该多条快取线的该快取线数据转译成多个指令,每一该指令包括该所有权队列中储存有快取线地址的储存单元的所有权索引,该快取线地址对应于产生每一该指令的该快取线数据,且该处理前端用以发出该指令以执行,且当该指令被发出时,设定对应的该储存单元的执行位;
该处理器还包含:
执行系统,该执行系统用以决定已被发出的每一储存指令的目标地址;
新近目标地址比较器,当目标地址被该执行系统决定时,该新近目标地址比较器用以对新被决定的每一目标地址与储存于该所有权队列的有效储存单元的每一快取线地址进行比较,以决定是否有任何匹配的储存单元;以及
执行逾时侦测器,用以计算该新近目标地址比较器决定的每一该匹配的储存单元的执行位,且当任一匹配的储存单元的任何一执行位被设定时,使对应于被决定的该目标地址的储存指令被标记以调用执行例外事件;
其中,当将要退出的储存指令被标记以调用该执行例外事件时,该执行系统执行该执行例外事件。
2.根据权利要求1所述的处理器,其特征在于,该执行例外事件使该执行系统允许被标记以调用该执行例外事件的该储存指令退出,刷新该处理器,且使该撷取系统取得指令指针以从指令快取存储器读取该储存指令后的指令。
3.根据权利要求1所述的处理器,其特征在于,还包含:
该处理前端还用以设定源自跨立于两快取线的快取线数据的每一指令中的跨立位;并且
其中,当被发出的指令的该跨立位被设定时,该处理器还设定对应的该储存单元之后的下一个连续的储存单元的执行位。
4.根据权利要求1所述的处理器,其特征在于,该执行系统还包含:
储存队列,用以储存自该处理前端被发出的每一储存指令,且用以储存该执行系统决定的对应的目标地址;以及
储存管线,用以决定在发出后被执行的每一储存指令的目标地址,且将每一被决定的目标地址提供至该储存队列中对应的储存单元和该新近目标地址比较器。
5.根据权利要求4所述的处理器,其特征在于,还包含:
新近储存单元比较器,用以比较被输入进该所有权队列中的该多个储存单元的其中之一的对应的快取线地址与储存于该储存队列中的每一目标地址,且当匹配结果被找到时,该新近储存单元比较器用以设定该所有权队列中的该多个储存单元的该其中之一的逾时位,其中,该新近目标地址比较器设定该新近目标地址比较器决定的任何匹配的储存单元的逾时位;以及
提交逾时侦测器,依据被该处理前端发出的每一指令的所有权索引存取该所有权队列中对应的储存单元,且当该所有权队列中的该对应的储存单元的逾时位被设定时,该提交逾时侦测器标记被发出的指令以调用提交例外事件;以及
其中,当将要退出的指令被标记以调用该提交例外事件时,该执行系统执行该提交例外事件。
6.根据权利要求5所述的处理器,其特征在于,该提交例外事件使该执行系统刷新该处理器,避免被标记以调用该提交例外事件的该指令退出,且使该撷取系统自指令快取存储器中重新撷取被标记以调用该提交例外事件的指令。
7.根据权利要求5所述的处理器,其特征在于,该处理前端还用以设定源自跨立于两快取线的快取线数据的每一指令中的跨立位;以及
其中,当被发出的该指令的跨立位被设定时,该提交逾时侦测器用以读取该所有权队列中对应的储存单元之后的下一个连续的储存单元的该逾时位,并且,当该所有权队列中对应的储存单元之后的该下一个连续的储存单元的该逾时位被设定时,该提交逾时侦测器使被发出的该指令被标记以调用该提交例外事件。
8.根据权利要求1所述的处理器,其特征在于,当输入快取线地址时,该撷取系统用以使该所有权队列中的对应的储存单元有效;
其中,该处理前端将该所有权队列中的该多个储存单元中的对应的一个储存单元的最后的指令标记为最后指令;以及
其中,当退出的指令被标记为该最后指令时,该执行系统使该所有权队列中的该多个储存单元中的该对应的一个储存单元无效。
9.根据权利要求1所述的处理器,其特征在于,
该撷取系统用以决定该所有权索引为二进制计数值,该二进制计数值随着每一储存单元被输入进该所有权队列而增加,该二进制计数值的总计数量至少是该所有权队列中的储存单元的总数量;
其中,该所有权索引的最高有效位包含缠绕位;
该处理器还包含覆写侦测器,该覆写侦测器用以使用被发出的指令的该所有权索引读取该所有权队列中的对应的储存单元的缠绕位,且当该对应的储存单元的该缠绕位不匹配该被发出的指令的该缠绕位时,该覆写侦测器用以令该被发出的指令被标记以调用提交例外事件;
其中,当利用该提交例外事件标记将要退出的指令时,该执行系统执行该提交例外事件。
10.根据权利要求9所述的处理器,其特征在于,该提交例外事件使该执行系统刷新该处理器,避免被标记以调用该提交例外事件的该指令退出,且使该撷取系统自指令快取存储器重新撷取被标记以调用该提交例外事件的指令。
11.一种依据快取线决定存储器所有权以侦测通过执行指令修正快取线的自修正程序码的方法,其特征在于,包括:
撷取多条快取线,决定该多条快取线的每一快取线的所有权索引,并将每一快取线与对应的所有权索引推入所有权队列中的多个储存单元的其中之一,其中每一该快取线具有快取线地址与快取线数据;
转译来自该多条快取线的快取线数据为多个指令;
将该所有权队列中的储存单元的所有权索引加入每一指令,该储存单元储存有与该指令所源自的快取线数据对应的快取线地址;
发出指令以执行,且当该指令被发出时,设定对应的储存单元的执行位;
在每一储存指令被发出后,决定该储存指令的目标地址;
当目标地址被决定时,比较每一新被决定的目标地址与储存于该所有权队列中的有效储存单元的每一快取线地址,以决定是否有任何匹配的储存单元;
当任一匹配的储存单元的执行位被设定时,使对应的储存指令被标记以调用执行例外事件;以及
当将要退出的储存指令被标记以调用该执行例外事件时,执行该执行例外事件。
12.根据权利要求11所述的方法,其特征在于,执行该执行例外事件的步骤还包含:
允许被标记以调用该执行例外事件的该储存指令退出;
刷新处理器;以及
取得一指令指针以自指令快取存储器撷取该储存指令之后的指令。
13.根据权利要求11所述的方法,其特征在于,还包含:
设定源自跨立于两快取线的快取线数据的每一指令中的跨立位;以及
当被发出的指令的跨立位被设定时,设定该所有权队列中对应的储存单元之后的下一个连续的储存单元的执行位。
14.根据权利要求11所述的方法,其特征在于,还包含:
储存被发出的每一储存指令;以及
决定被发出的每一储存指令的目标地址,并将被决定的每一目标地址连同被储存的多个储存指令中的对应的一个一同储存。
15.根据权利要求14所述的方法,其特征在于,还包含:
比较被输入进该所有权队列中的该多个储存单元的其中之一的对应的快取线地址与储存于储存队列中的每一目标地址,且当匹配结果被找到时,设定该所有权队列中的该多个储存单元的该其中之一的逾时位;
设定任一匹配的储存单元的逾时位;
依据被发出的每一指令的所有权索引存取该所有权队列中对应的储存单元,且当该所有权队列中该对应的储存单元的逾时位被设定时,标记被发出的指令以调用提交例外事件;以及
当将要退出的指令被标记以调用该提交例外事件时,执行该提交例外事件。
16.根据权利要求15所述的方法,其特征在于,执行该提交例外事件的步骤还包含:
避免被标记以调用该提交例外事件的指令退出;
刷新处理器;以及
重新撷取被标记以调用该提交例外事件的指令。
17.根据权利要求15所述的方法,其特征在于,还包含:
设定源自跨立于两快取线的快取线数据的每一指令的跨立位;
当被发出的该指令的跨立位被设定时,读取该所有权队列中对应的储存单元的下一个连续的储存单元的该逾时位;以及
当该所有权队列中对应的储存单元的该下一个连续的储存单元的该逾时位被设定时,标记被发出的该指令以调用该提交例外事件。
18.根据权利要求11所述的方法,其特征在于:
当输入快取线地址时,使该所有权队列中的对应的储存单元有效;
将该所有权队列中的该多个储存单元中的对应的一个储存单元的最后指令标记为最后指令;以及
当退出的指令被标记为最后指令时,使该所有权队列中的该多个储存单元中的对应的一个储存单元无效。
19.根据权利要求11所述的方法,其特征在于,还包含:
决定该所有权索引的步骤包含,决定该所有权索引为二进制计数值,该二进制计数值随着每一储存单元被输入进该所有权队列而增加,该二进制计数值的总计数量至少是该所有权队列中的储存单元的总数量,其中,该所有权索引的最高有效位包含缠绕位;
使用被发出的指令的所有权索引读取该所有权队列中对应的储存单元的缠绕位;以及
当该对应的储存单元的缠绕位不匹配被发出的指令的缠绕位时,标记被发出的该指令以调用提交例外事件。
20.根据权利要求19所述的方法,其特征在于,调用该提交例外事件的步骤还包含:
避免被标记以调用该提交例外事件的该指令退出;
刷新处理器;以及
重新撷取被标记以调用该提交例外事件的指令。
CN201710137900.4A 2016-04-20 2017-03-09 侦测自修正程序码的处理器与方法 Active CN106933538B (zh)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US201662324945P 2016-04-20 2016-04-20
US62/324,945 2016-04-20
US15/156,429 US9798670B1 (en) 2016-04-20 2016-05-17 System and method of determining memory ownership on cache line basis for detecting self-modifying code including modification of a cache line with an executing instruction
US15/156,429 2016-05-17

Publications (2)

Publication Number Publication Date
CN106933538A CN106933538A (zh) 2017-07-07
CN106933538B true CN106933538B (zh) 2019-03-01

Family

ID=59433088

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710137900.4A Active CN106933538B (zh) 2016-04-20 2017-03-09 侦测自修正程序码的处理器与方法

Country Status (1)

Country Link
CN (1) CN106933538B (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6009516A (en) * 1996-10-21 1999-12-28 Texas Instruments Incorporated Pipelined microprocessor with efficient self-modifying code detection and handling
US20120297146A1 (en) * 2011-05-17 2012-11-22 International Business Machines Corporation Facilitating data coherency using in-memory tag bits and tag test instructions
US20150324213A1 (en) * 2014-05-12 2015-11-12 Soft Machines, Inc. Method and apparatus for providing hardware support for self-modifying code

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6009516A (en) * 1996-10-21 1999-12-28 Texas Instruments Incorporated Pipelined microprocessor with efficient self-modifying code detection and handling
US20120297146A1 (en) * 2011-05-17 2012-11-22 International Business Machines Corporation Facilitating data coherency using in-memory tag bits and tag test instructions
US20150324213A1 (en) * 2014-05-12 2015-11-12 Soft Machines, Inc. Method and apparatus for providing hardware support for self-modifying code

Also Published As

Publication number Publication date
CN106933538A (zh) 2017-07-07

Similar Documents

Publication Publication Date Title
JP3542020B2 (ja) 複数予測分岐命令にわたる命令フェッチの位置合わせ命令キャッシュ処理を実行するプロセッサ装置およびプロセッサ制御方法
US4763245A (en) Branch prediction mechanism in which a branch history table is updated using an operand sensitive branch table
US7644198B2 (en) DMAC translation mechanism
US6883086B2 (en) Repair of mis-predicted load values
US8190825B2 (en) Arithmetic processing apparatus and method of controlling the same
US20080034187A1 (en) Method and Apparatus for Prefetching Non-Sequential Instruction Addresses
US7958336B2 (en) System and method for reservation station load dependency matrix
US11513801B2 (en) Controlling accesses to a branch prediction unit for sequences of fetch groups
CN107038125A (zh) 具有加速预取请求的独立流水线的处理器高速缓存
CN101149676A (zh) 利用改进指令目的地标记的数据处理系统、处理器和方法
US9304777B1 (en) Method and apparatus for determining relative ages of entries in a queue
CN106933538B (zh) 侦测自修正程序码的处理器与方法
CN106933537B (zh) 侦测自修正程序码的处理器与方法
CN108874447A (zh) 处理器电路及其操作方法
US8117425B2 (en) Multithread processor and method of synchronization operations among threads to be used in same
CN106919367B (zh) 侦测自修正程序码的处理器与方法
CN106933539B (zh) 侦测自修正程序码的处理器与方法
CN104516829A (zh) 微处理器及使用指令循环高速缓存的方法
TWI242744B (en) Apparatus, pipeline microprocessor and method for avoiding deadlock condition and storage media with a program for avoiding deadlock condition
US10031751B2 (en) Arithmetic processing device and method for controlling arithmetic processing device
US10430342B2 (en) Optimizing thread selection at fetch, select, and commit stages of processor core pipeline
US10366049B2 (en) Processor and method of controlling the same
TWI283827B (en) Apparatus and method for efficiently updating branch target address cache
US20080282050A1 (en) Methods and arrangements for controlling memory operations
TWI606393B (zh) 依據快取線決定記憶體所有權以偵測自修正程式碼的處理器與方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CP03 Change of name, title or address

Address after: Room 301, 2537 Jinke Road, Zhangjiang High Tech Park, Pudong New Area, Shanghai 201203

Patentee after: Shanghai Zhaoxin Semiconductor Co.,Ltd.

Address before: Room 301, 2537 Jinke Road, Zhangjiang hi tech park, Pudong New Area, Shanghai 201203

Patentee before: VIA ALLIANCE SEMICONDUCTOR Co.,Ltd.

CP03 Change of name, title or address