CN1639691A - 尤其是容许故障系统的处理器的用于事件同步的方法 - Google Patents

尤其是容许故障系统的处理器的用于事件同步的方法 Download PDF

Info

Publication number
CN1639691A
CN1639691A CNA038057115A CN03805711A CN1639691A CN 1639691 A CN1639691 A CN 1639691A CN A038057115 A CNA038057115 A CN A038057115A CN 03805711 A CN03805711 A CN 03805711A CN 1639691 A CN1639691 A CN 1639691A
Authority
CN
China
Prior art keywords
instruction
cpu
module
pattern
counter
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CNA038057115A
Other languages
English (en)
Inventor
A·韦伯
D·施纳贝尔
P·佩莱斯卡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Siemens AG
Original Assignee
Siemens AG
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from EP02020602A external-priority patent/EP1398699A1/de
Application filed by Siemens AG filed Critical Siemens AG
Publication of CN1639691A publication Critical patent/CN1639691A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/1675Temporal synchronisation or re-synchronisation of redundant processing components
    • G06F11/1691Temporal synchronisation or re-synchronisation of redundant processing components using a quantum
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/1675Temporal synchronisation or re-synchronisation of redundant processing components
    • G06F11/1683Temporal synchronisation or re-synchronisation of redundant processing components at instruction level

Abstract

对于冗余的系统一再规定了等同构造的处理器插件板,这些处理器插件板以锁步运行来工作。实现锁步系统的基本前提是所有包含在插件板中的部件的,即CPU、芯片组、主存储器等等的确定性特性。确定性的特性在此意味着,如果部件在等同的时刻获得等同的激励,这些部件则在无故障的情况下在等同的时刻提供等同的结果。确定性的特性此外还以采用时钟同步的接口为前提。在系统中异步的接口在许多情况下促成某种时间的不清晰度,由此不能维持系统的时钟同步的总特性。为了仍然能够执行锁步运行,本发明规定了一种用于同步外部事件的方法,这些外部事件输送给一个处理器(CPU)和影响该处理器(CPU),据此将这些外部事件暂存,并在指令执行中的等同的位置上给该处理器演示,其中,避免了由现代处理器并行执行指令的能力所产生的问题,其方式是在达到指令执行中的所希望的位置之前禁止处理器的并行执行,并随后以单步模式准确地达到该位置。

Description

尤其是容许故障系统的处理器的用于事件同步的方法
在电信系统中,在数据中心和另外的高度可用的系统中,在许多情况下采用直至数百个所谓的处理器插件板,以便规定必要的计算功能。这种处理器插件板典型地由处理器或CPU(中央处理器)、芯片组、主存储器和外围模块组成。
典型处理器插件板每年出现硬件故障的概率位于个位数的百分率范围内。由于大量汇总成系统的处理器插件板而产生了涉及年度的、任意硬件部件的很高的失效概率,其中,如果未采取适当的预防措施,这种个别失效则可能引起整个系统的失效。
尤其在电信系统上,以增长的程度也在数据中心中提出了对高的系统可用性的要求。例如以百分数来表达该系统可用性,或给定每年最高允许的失效时间。其型的要求例如是>99.999%的可用性,或一年之中最高数分钟的不可用性。由于在硬件故障的情况下,处理器插件板的更换和业务的重建通常要求位于数十分钟至数小时范围内的时间,对于硬件故障的情况必须在系统层面上采取相应的预防措施,以便可以满足对系统可用性的要求。
用于遵守对系统可用性的这种高要求的已知的解决方案规定了冗余的系统部件。可以将已知的方法划分成两个主要的组:基于软件的方法和基于硬件的方法。
在基于软件的方法中典型地采用中间件。但是基于软件的解决方案证明是灵活性小的,因为在这种系统中仅仅可以采用为该特别的冗余格式开发的那些(应用)软件。这显著地限制了可采用(应用)软件的范围。除此之外,软件冗余原理的应用软件的开发在实践中是极其费事的,其中,该开发附加地产生了复杂的测试方法的后果。
基于硬件方法的基本原理基于,将冗余性封装在硬件层面上,使得这对于软件是透明的。由硬件本身所管理冗余的主要优点在于,不由冗余原理来影响应用软件,并因而在大多的情况下每个任意的软件可以得到采用。
容许硬件故障系统的在实践中可以经常遇到的原理是所谓的锁步(Lockstep)原理,该系统的冗余对于软件是透明的。锁步意味着,同样类型时钟同步地运行等同构造的硬件,例如两个插件板。通过硬件机构来确保,冗余的硬件在给定的时刻获知等同的输入激励,并因此必须导致等同的结果。将冗余部件的结果进行比较,在有偏差的情况下查明故障,并引入合适的措施(向操作人员报警,部分的或全部的安全关断,系统重新启动)。
实现锁步系统的基本前提是,所有包含在插件板中的部件的,也就是CPU、芯片组、主存储器等等的节拍方式确定性的特性。节拍方式确定性的特性在此意味着,在无故障的情况下,如果部件在等同的节拍时刻获得等同的激励,这些部件则在等同的节拍时刻提供等同的结果。节拍方式确定性的特性此外还以采用时钟同步的接口为前提。在系统中,异步的接口在许多情况下促成某种时间的不清晰度,由此不能够维持系统的时钟同步的总特性。
但是异步的接口恰恰对于芯片组和CPU提供了提高效能方面的技术优点,由此使得按照锁步法的时钟同步的工作方式成为不可能。现代的CPU此外还越来越多地采用使得时钟同步的工作方式不可能的机构。例如这是向外部不可见的内部的修正措施,例如在访问超高速缓存存储器时的内部可修正故障的修正,这些修正措施可能导致指令执行的稍微滞后,或推测性地(spekulative)执行指令。一个其它的实例是未来越来越多地实现CPU内部的无节拍的执行单元,这些执行单元实现了速度和功率损失方面的显著优点,但是阻碍了CPU的时钟同步或确定性的工作。
欧洲专利申请02020602公布了一种用于同步外部事件的方法,这些事件被输送给CPU和影响这些CPU,据此将外部的事件暂存,其中,通过执行单元在用于处理的CPU的单独工作模式中调用所存储的外部事件,以及其中,CPU对满足由指令可预先给定或固定地预先给定的条件作出响应进入该工作模式。该方法也称为“仿真锁步运行“。
EP 02020602有利地规定了,如果由CPU的比较器元件来求出计数器与最大指令寄存器(MIR)的一致性,则实施转换到单独的工作模式中,其中,由指令可预先给定MIR的内容,而计数器含有从最后转换到单独的工作模式时开始的由执行单元所执行指令的数量。
但是现代的CPU不能如此来停止,以至于它们在准确数量的指令之后停止。其原因在于,可以并行执行多个在一个共同的时刻结束的指令。因此例如在一个节拍中可以在所有冗余的CPU上执行99个指令,在下一个节拍中例如由于不同的实施方案于是在一个CPU上是100个指令,但是在另一个CPU上是101个指令。因此不能在指令执行中在等同位置上演示外部的事件,例如中断。
本发明的任务是提出一种方法,用该方法即使当在执行一个和同一个指令之后不能确保冗余CPU的停止时,则也在冗余CPU的指令执行中在相同位置上演示外部的事件。
通过一种按权利要求1特征的用于同步外部事件的方法、通过一种按权利要求6特征的处理器、和通过一种按权利要求7特征的系统来解决该任务。在从属权利要求中说明了有利的改进方案。
按本发明规定了用于同步外部事件的一种方法,这些外部事件被输送给一个模块CPU和影响该模块CPU,其中,规定模块CPU用于并行执行第一数量的指令,
-据此将外部事件暂存,其中,在模块的单独工作中为了处理模式通过模块的至少一个执行单元EU来调用存储的外部事件,以及
-其中,模块在执行可预先给定的第二数量MIC指令之后进入该工作模式中,其方式是
-计数器IC求出从最后离开单独工作模式时开始的由执行单元所执行指令的数量,
-如果计数器IC大于或等于来自第二数量指令和第三数量MD指令的差值,则将模块移到单个指令执行模式中,该第三数量MD指令从第一数量指令中求出,
-模块保留在单个指令执行模式中,直至计数器IC达到了第二数量MIC指令时为止,模块随即转换到单独工作模式中,并在离开单独工作模式时重新初始化计数器IC。
所述的第三数量指令在此以最大数量的并行执行的指令为依据,并用来补偿在具有并行执行指令能力的CPU的停止时的不清晰度。优选将第三数量选择为等于或大于最大并行执行指令的第一数量。
在具有至少两个模块CPU的冗余系统中,为模块CPU规定了等同序列的指令,并通过模块在单独的工作模式中调用等同的外部事件。通过控制装置让较迅速的模块CPU保留在单独的工作模式中,直至较缓慢的模块达到单独工作模式的终点时为止。
通过软件、通过微码、或通过专用的硬件可以实现本发明的方法。在由监控软件模块监控计数器IC时,由监控软件模决促使执行指令的数量单独来采集,并从计数器IC中扣除。
本发明还规定了处理器模块CPU,该处理器模块CPU至少具有以下的内容:
-至少一个执行单元EU,
-至少一个计数器元件IC,用于从最后转换到单独工作模式中时开始对由执行单元所执行的指令进行计数,
-至少一个寄存器元件MIR,该寄存器元件MIR的内容MIC通过指令可预先给定或固定地预先给定,
-至少一个比较器元件K和至少一个控制元件S,用于通过计数器元件IC对达到了小于寄存器元件MIR值的可预先给定的值作出响应地,将执行单元EU转接到单个指令执行模式中,以及用于对计数器元件IC与寄存器元件MIR的一致性作出响应地,将执行单元转接到单独工作模式中,其中,通过处理器模块CPU调用在单独工作模式中暂存的、输送给该处理器模块CPU的外部事件,这些外部事件影响该处理器模块CPU。
可以将这些处理器中的多个有利地汇总成一个系统,其中,该系统附加地具有在处理器模块CPU中的至少两个之间的通信连接L0,L1,这些处理器模块CPU执行等同的指令序列,其中,规定了通信连接用于传输单独工作模式的同步信息。
本发明的主要优点在于,在容许硬件故障的平台上实现了采用任意新的或已有的软件,其中,在该平台上可以采用支持本发明的CPU,而不存在对CPU的时钟同步的确定性工作方式的要求,以及其中,可以采用异步的高速接口或链路。此时本发明考虑了以下的情况,具有并行执行指令能力的现代的CPU不是在任何情况下能够在准确数量的指令之后停止(anhalten)。
其它的优点是:
-不必锁相耦合地运行彼此冗余的插件板和CPU。
-CPU不必是完全相同的,它们仅须在相同数量的已执行机器指令之后停止,并转换工作模式。
-可以用不同的时钟频率来运行CPU。
-在涉及指令的推测性执行方面,CPU可以不同地表现,因为仅评价成套(komplettierten)的指令。
-例如基于在使数据失真的α粒子出现之后修正的、等同CPU的CPU内部不同的执行时间仅仅导致,在稍微不同的时刻达到同步模式。
以下联系三个附图来详述本发明的实施例。
图1展示了本发明方法的流程图。
图2示意地展示了本发明的处理器模块。
图3示意地展示了本发明的由根据图2的两个处理器模块组成的系统。
图1中以图形示出了作为流程图的本发明方法。在流程开始之前必须确定或初始化以下的值:
-计数器IC(指令计数器),该计数器IC含有由CPU执行的指令的,或机器指令的数量。
-指令的数量MIC(最大指令计数器),CPU应在该指令的数量MIC之后转换到特别的工作模式中,用于处理外部的事件。
-指令的数量MD(最大偏差),该指令的数量MD考虑了CPU停止的、由于指令执行的并行性而出现的最大不清晰度。
流程随着指令计数器IC的当前值与来自MIC和MD的差值的比较(方框11)而开始。如果指令计数器的值小于该差值,则以正常的工作模式继续指令执行;可以并行执行指令。
如果指令计数器的值达到或超过来自MIC和MD的差值,则用来自MIC和MD的差值装载寄存器d(方框12),并且流程进入环路,在该环路的开始存在着寄存器d是否已达到值MIC的查询(方框13)。在该环路中以单步模式来进行指令执行。
只要值d未达到值MIC,则在每个环路执行中执行单个的指令(方框14),并在重新检查环路条件之前(方框13),使值d增量(方框15)。通过该行动确保了,尽管在并行指令执行的正常工作中,仍然准确地在MIC指令之后实现进入单独的工作状态。
如果值d达到了值MIC(方框13),流程则进入单独的工作模式。单独的工作模式首先检验,在执行MIC指令期间中断请求是否到达,以及为了由所有冗余的CPU同时来执行,是否已暂存了该中断请求(方框16/17)。如果中断请求已到达,则处理这些中断请求(方框18),其中,在程序执行中的等同位置上由所有冗余的CPU进行该处理,并且所有的寄存器、存储器内容、...是等同的。如果未出现中断请求,则跳越该步骤。
终止单独的工作模式,并在指令计数器IC复位之后(方框19)重新接受(aufnehmen)具有并行处理指令的正常工作模式。于是可以处理中断请求。不以单独的工作模式,而是以正常的模式实现中断程序的执行。以特别的工作模式仅仅进行读入中断矢量,在此之后又离开该特别的模式。是否处理中断于是例如取决于,在该时刻是否恰好允许中断。如果恰好在处理中断,和/或清除“中断标志“,则不允许中断。
借助示出的流程可以将本发明方法直接实施为指令序列,即实施为软件。此时软件负责,在多个处理器的指令执行的等同位置上演示中断,其方式是在CPU中如此来编程指令计数器,使得在扣除“停止不清晰度“MD的所希望数量MIC的要执行指令之后,该指令计数器引起异常(Exception)、譬如调试异常、或高度优先的不可闭锁的中断、譬如不可掩蔽的中断NMI。例如在MD=3个指令的不清晰度和所希望数目MIC=1000个指令时,用1000-3+1=998来编程计数器IC。取决于指令的内部会聚,即在IC=998、或IC=999、或IC=1000个指令之后使CPU停止。随即实施的软件读出指令计数器,以便查明,处理器在哪个位置上实际已停止。此时该软件具有以下的特性,相应地修正自己指令的执行。如果软件查明,CPU例如在999个指令之后已停止,则由异常软件控制地,通过单步工作来补充执行所希望的第1000个指令。这在所有冗余的CPU上实现,使得在码中的等同位置上已使所有的CPU停止。
在此位置上必须给这个/这些CPU演示可能存在的中断请求。对此例如存在着以下的可能性:
-CPU可以读出中断控制器的寄存器,该寄存器随即释放掩蔽的中断信号。CPU借助该中断信号识别中断请求,并向中断控制器发送中断确认循环。中断控制器随即提供中断矢量,并重新掩蔽中断信号。
-替代地软件可以读出寄存器,该寄存器的值已经提供关于中断类型的信息,即中断矢量。如果在指令执行中的该时刻允许中断,软件随后则自己触发相应的中断(通过软件)。
此外也可以以微码指令的形式来实现流程。现代的CPU在许多情况下具有借助微码来控制指令执行的广泛的可能性。例如常常将这些可能性用来排除或回避设计错误。
为了本发明方法的目的如此来改变微码,使得在扣除“停止不清晰度“MD的所希望数目的要执行指令MIC之后,CPU中断正常的指令执行,并转移到微码中。微码读出已执行指令的数量IC,并如此来控制通过单步的执行,使得在所希望的位置MIC上停止指令执行。
在此位置上又必须给这个/这些CPU演示可能存在的中断请求。对于此同样存在着多种可能性:
-通过微码来释放用微码掩蔽的中断信号,并且如果存在着中断,则将CPU转移到相应的中断程序中。随后又通过微码来掩蔽中断。
-替代地可以促使CPU,生成中断确认循环和读取中断矢量。于是通过微码如此来给CPU演示该中断矢量,使得该CPU在离开了单独的模式之后转移到相应的中断程序中。
此外可以在译码软件中进行实施。数个CPU拥有简单的、但是很迅速的、大多超标量(superskalar)的RISC或VLIW处理器核心。通过译码软件将本身的指令组,例如IA-32转换成简单的码,并由RISC/VLIW处理器来实行。在此情况下译码软件实施本方法的任务,类似于以微码的实施。像在微码实施中那样进行中断请求的演示。
本发明方法的最有效的实施是硬件实施,示出在图2中。在此由处理器内部的硬件单元S在扣除不清晰度的所希望的位置上来停止并行的指令实行、求出指令计数器读数IC、以及由处理器内部的硬件单元S借助单步ES将执行单元EU引导到码中的所希望的位置上。该方法的主要优点是显著降低了的负面的性能影响。
图2以示意图展示了本发明的处理器模块CPU。在此,仅示出了对于本发明是重要的组成部分。CPU包括一个或多个执行单元EU、至少一个比较器K、至少一个用于对由执行单元EU所执行的指令进行计数的计数器IC、一个控制装置S、和至少一个寄存元件MIR,其内容由指令可预先给定或固定地预先给定。此外还示意地示出了往/返中断寄存器的通信连接(图3)。
不将影响程序流程的外部事件直接输送给CPU,而是首先通过合适构成的硬件来暂存。在图2中示出的CPU中可以进行本方法的转换,其方式是用来自值MIC和值MD的差值来装载寄存器MIR。比较器K将所执行运算的数目与该寄存器值进行比较,并将该比较的结果给控制单元S发送信号。替代地,比较器也可以仅传送一个事件到控制装置上,如果IC的值已达到了MIR的值,则产生该事件。如果出现了该事件,或已对两个寄存器的相等性发送信号,控制装置S则再次查询指令计数器,以便读取实际执行指令的数目。由于在MIR中通过用值MIC-MD的装载已经考虑了不清晰度,因此可以由控制装置将单步模式通过线路ES给执行单元发送信号,该执行单元单个地促使执行指令,直至指令计数器的值达到了预先给定值MIC时为止。控制装置S为此拥有以下的可能性,只要指令计数器非自动地对以单步执行的指令进行计数,就使指令计数器IC增量。
每个冗余CPU的控制装置S生成输送给中断模决的中断释放信号IF。随即通过中断线路INT给所有冗余的CPU报告必要时暂存的中断请求。
替代与此地,控制装置S生成自己CPU的中断,如果在指令执行中的该时刻允许中断,执行单元随即向中断模块发送中断确认循环。
在一个其它的替代方案中,由控制装置S生成一个中断释放信号IF,将该中断释放信号IF按意义与中断信号INT进行UND逻辑连接,即如果存在着逆转的信号,或如果在多个线路上演示着(prsentieren)中断信号,则应该相应地选择电路逻辑。同样可以将中断释放信号向CPU外部地,例如传送到中断寄存器上。有可能因此释放了施加在中断线路INT上的中断,并可以进行通常的中断处理,例如读取中断矢量,执行中断程序等等。
在中断处理之前对于排除单步模式和单独工作模式,以及对于继续以正常模式执行指令,向执行单元发送信号,并通过信号CL使指令计数器复位。可以将控制装置直接作为硬件或以微码的形式来实现。
最后在图3中,根据联系图2的以上说明来展示两个CPU的联接。在此没有来自图2中的细节地,示出了第一处理器CPU0和第二处理器CPU1。处理器各自通过总线A/D与所分配的中断模块交换地址和数据,这些中断模块还包括中断寄存器IR0,IR1。中断模块例如从输入/输出模块I/O接收中断INT1..INTn,存储相应的特征数据,和转送中断INT到处理器上。
根据本发明通过处理器仅在指令执行的某些位置上认可中断。这在与图2的关联中已经详述。
此外可以采用在此关联中阐述的中断释放信号,以便给分配给每个处理器的中断模块发送信号,可以开始中断处理。通过通信连接L0,L1相连接的中断模块可以交换这些信息,并在它这方面当所有的处理器生成中断释放信号时,才可以例如通过将中断矢量传送到处理器上来释放中断处理。
在一个替代方案中可以证明有利的是,CPU不在指令执行的预先给定的位置MIC上,而是在具有可并行执行指令的不清晰度的位置上停止,并且于是通过单步将位于后面的处理器引导到指令执行的以下的位置上,在该位置上已经停止了在指令执行方面进展得最远的那个处理器。为此需要处理器之间的通信。例如这可以如下来实现,使得每个处理器将它本身已停止的位置写入硬件寄存器中,并随后将其读回。寄存器等候到所有的处理器已写入了它们的值时为止,并返回提供最高的值作为读取数据(Lesedatum)。如果有必要,所有的处理器则通过单步使它们的指令执行水平相等。于是如上所述给处理器演示中断请求。
具有SMT(同时乘法处理)能力的CPU必须拥有每个虚拟CPU或每种处理用的单独的控制装置。
CPU还具有比较器K,该比较器K将已执行指令的数量,即计数器IC,与寄存器MIR进行比较,并在相等时生成例如中断请求,该比较器K在由寄存器MIR预先给定指令的数目之后中断指令执行,并将CPU连接到另外的工作模式中。在该工作模式中实行例如合适的微码,或转移到中断业务程序中,或通过硬件信号指明达到了该同步点。于是在该工作模式中如下来给冗余的CPU演示外部事件,使得在离开该工作模式之后所有的CPU可以相同地评价这些事件,并因此可以顺序地执行相同的指令。
例如在达到了由寄存器MIR预先给定的机器指令数量之后,CPU转移到中断业务程序中,在该中断业务程序中如此来查询中断信号的状态,由所述硬件使这些中断信号远离CPU,使得一个必要时在稍后时刻提出该查询的冗余CPU获得等同的消息(Auskunft)。
在离开单独的工作模式时使计数器IC复位。随后向以下的程序位置跳回,在该程序位置上通过达到了由寄存器MIR预先给定的计数器值IC已实现了中断。在此之后,CPU又执行由寄存器MIR预先给定的机器指令数量,并在达到了寄存器值MIR时由计数器IC转换模式,并因此实现了外部事件的接受(Annahme)。
有利地如下来构成CPU寄存器MIR,使得通过软件或微码可以描述它们,以便确保,对于不同的使用领域在相适应的区间中实现中断处理,其方式是在中断处理的时窗之间相应地确定要执行指令的数量。

Claims (8)

1.用于同步外部事件的一种方法,这些外部事件被输送给一个模块(CPU)和影响该模块(CPU),其中,规定所述的模块(CPU)用于并行执行第一数量的指令,
-据此将所述的外部事件暂存,其中,在所述模块的单独工作模式中为了处理通过所述模块的至少一个执行单元(EU)来调用存储的外部事件,以及
-其中,所述的模块在执行可预先给定的第二数量(MIC)指令之后进入该工作模式中,其方式是
-计数器(IC)求出从最后离开所述的单独工作模式时开始的由所述执行单元所执行指令的数量,
-如果所述的计数器(IC)大于或等于来自所述第二数量指令和第三数量(MD)指令的差值,则将所述的模块移到单个指令执行模式中,该第三数量(MD)指令从所述第一数量指令中求出,
-所述的模块保留在所述的单个指令执行模式中,直至所述的计数器(IC)达到了所述的第二数量(MIC)指令时为止,所述的模块随即转换到所述的单独工作模式中,并在离开所述的单独工作模式时重新初始化所述的计数器(IC)。
2.按权利要求1的方法,
其特征在于,
将指令的所述第三数量选择为等于或大于最大并行执行的指令的所述第一数量。
3.按权利要求1或2之一的方法,
其特征在于,
在具有至少两个模块的冗余系统中,为所述的模块(CPU)规定了等同序列的指令,并通过所述的模块在所述的单独工作模式中调用等同的外部事件。
4.按权利要求3的方法,
其特征在于,
通过控制装置让较快速的模块(CPU)保留在所述的单独工作模式中,直至较缓慢的模块达到所述单独工作模式的终点时为止。
5.按权利要求1至4之一的方法,其特征在于,在由监控软件模块监控所述的计数器(IC)时,由所述监控软件模块促使执行的指令的数量单独来采集,并从所述的计数器(IC)中扣除。
6.处理器模块(CPU),该处理器模块(CPU)至少具有以下的内容:
-至少一个执行单元(EU),
-至少一个计数器元件(IC),用于从最后转换到单独工作模式中时开始对由所述执行单元所执行的指令进行计数,
-至少一个寄存器元件(MIR),该寄存器元件(MIR)的内容(MIC)通过指令可预先给定或固定地预先给定,
-至少一个比较器元件(K)和至少一个控制元件(S),用于通过所述的计数器元件(IC)对达到了小于所述寄存器元件(MIR)值的可预先给定的值作出响应地,将所述的执行单元(EU)转接到单个指令执行模式中,以及用于对所述的计数器元件(IC)与所述寄存器元件(MIR)的一致性作出响应地,将所述的执行单元转接到所述的单独工作模式中,其中,通过所述的处理器模块(CPU)调用在所述单独工作模式中暂存的、输送给该处理器模块(CPU)的外部事件,这些外部事件影响该处理器模块(CPU)。
7.由至少两个处理器模块(CPU0,CPU1)组成的系统,这些处理器模块分别至少具有以下的内容:
-至少一个执行单元(EU),
-至少一个计数器元件(IC),用于从最后转换到所述单独工作模式中时开始对由所述执行单元所执行的指令进行计数,
-至少一个寄存器元件(MIR),该寄存器元件(MIR)的内容通过指令可预先给定或固定地预先给定,
-至少一个比较器元件(K)和至少一个控制元件(S),用于通过所述的计数器元件(IC)对达到了小于所述寄存器元件(MIR)值的可预先给定的值作出响应地,将所述的执行单元(EU)转接到单个指令执行模式中,以及用于对所述的计数器元件(IC)与所述寄存器元件(MIR)的一致性作出响应地,将所述的执行单元(EU)转接到所述的单独工作模式中,其中,通过这些处理器模块调用在所述单独工作模式中暂存的、输送给这些处理器模块的外部事件,这些外部事件影响这些处理器模块。
8.按权利要求7的系统,该系统附加地具有在所述处理器模块(CPU)中的至少两个之间的通信连接(L0,L1),这些处理器模块(CPU)执行等同的指令序列,其中,规定了所述的通信连接用于传输所述单独工作模式的同步信息。
CNA038057115A 2002-09-12 2003-08-07 尤其是容许故障系统的处理器的用于事件同步的方法 Pending CN1639691A (zh)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
EP02020602A EP1398699A1 (de) 2002-09-12 2002-09-12 Verfahren zur Ereignissynchronisation, insbesondere für Prozessoren fehlertoleranter Systeme
EP02020602.5 2002-09-12
EP02027848A EP1398701A1 (de) 2002-09-12 2002-12-12 Verfahren zur Ereignissynchronisation, insbesondere für Prozessoren fehlertoleranter Systeme
EP02027848.7 2002-12-12

Publications (1)

Publication Number Publication Date
CN1639691A true CN1639691A (zh) 2005-07-13

Family

ID=31889442

Family Applications (1)

Application Number Title Priority Date Filing Date
CNA038057115A Pending CN1639691A (zh) 2002-09-12 2003-08-07 尤其是容许故障系统的处理器的用于事件同步的方法

Country Status (6)

Country Link
US (1) US20050229035A1 (zh)
EP (2) EP1398701A1 (zh)
CN (1) CN1639691A (zh)
AU (1) AU2003251697A1 (zh)
CA (1) CA2498596A1 (zh)
WO (1) WO2004034261A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104181909A (zh) * 2013-05-24 2014-12-03 现代自动车株式会社 用于确定基于虚拟化的集成控制系统中软件错误的方法

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2003223352A1 (en) * 2002-03-25 2003-10-13 Eternal Systems, Inc. Transparent consistent active replication of multithreaded application programs
US7305582B1 (en) * 2002-08-30 2007-12-04 Availigent, Inc. Consistent asynchronous checkpointing of multithreaded application programs based on active replication
US7206964B2 (en) * 2002-08-30 2007-04-17 Availigent, Inc. Consistent asynchronous checkpointing of multithreaded application programs based on semi-active or passive replication
EP1398700A1 (de) * 2002-09-12 2004-03-17 Siemens Aktiengesellschaft Verfahren und Schaltungsanordnung zur Synchronisation redundanter Verarbeitungseinheiten
DE102004038590A1 (de) * 2004-08-06 2006-03-16 Robert Bosch Gmbh Verfahren zur Verzögerung von Zugriffen auf Daten und/oder Befehle eines Zweirechnersystems sowie entsprechende Verzögerungseinheit
JP4289293B2 (ja) * 2004-12-20 2009-07-01 日本電気株式会社 起動制御方法、二重化プラットフォームシステム及び情報処理装置
JP2006178636A (ja) * 2004-12-21 2006-07-06 Nec Corp フォールトトレラントコンピュータ、およびその制御方法
WO2006128147A2 (en) * 2005-05-26 2006-11-30 Pactolus Communications Software Corporation Systems and methods for a fault tolerant voice-over-internet protocol (voip) architecture
GB0602641D0 (en) * 2006-02-09 2006-03-22 Eads Defence And Security Syst High speed data processing system
FR2912526B1 (fr) 2007-02-13 2009-04-17 Thales Sa Procede de maintien du synchronisme d'execution entre plusieurs processeurs asynchrones fonctionnant en parallele de maniere redondante.
US9086977B2 (en) 2011-04-19 2015-07-21 Freescale Semiconductor, Inc. Cache memory with dynamic lockstep support
US9208036B2 (en) 2011-04-19 2015-12-08 Freescale Semiconductor, Inc. Dynamic lockstep cache memory replacement logic
US9262282B2 (en) * 2012-09-04 2016-02-16 Opshub, Inc. System and method for synchornisation of data and recovery of failures during synchronization between two systems

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE3235762A1 (de) * 1982-09-28 1984-03-29 Fried. Krupp Gmbh, 4300 Essen Verfahren und vorrichtung zur synchronisation von datenverarbeitungsanlagen
CA2003338A1 (en) * 1987-11-09 1990-06-09 Richard W. Cutts, Jr. Synchronization of fault-tolerant computer system having multiple processors
US5226152A (en) * 1990-12-07 1993-07-06 Motorola, Inc. Functional lockstep arrangement for redundant processors
DE19625195A1 (de) * 1996-06-24 1998-01-02 Siemens Ag Synchronisationsverfahren
DE69804489T2 (de) * 1997-11-14 2002-11-14 Marathon Techn Corp Verfahren zur erhaltung von synchronisierter ausführung bei fehler-betriebssicheren/ fehlertoleranten rechnersystemen
DE19943790C2 (de) * 1999-09-13 2001-11-15 Ericsson Telefon Ab L M Verfahren und Vorrichtung zur Bestimmung eines Synchronisationsfehlers in einem Netzwerkknoten
US6802024B2 (en) * 2001-12-13 2004-10-05 Intel Corporation Deterministic preemption points in operating system execution

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104181909A (zh) * 2013-05-24 2014-12-03 现代自动车株式会社 用于确定基于虚拟化的集成控制系统中软件错误的方法

Also Published As

Publication number Publication date
EP1552394A1 (de) 2005-07-13
EP1398701A1 (de) 2004-03-17
AU2003251697A1 (en) 2004-05-04
CA2498596A1 (en) 2004-04-22
WO2004034261A1 (de) 2004-04-22
US20050229035A1 (en) 2005-10-13

Similar Documents

Publication Publication Date Title
CN1639691A (zh) 尤其是容许故障系统的处理器的用于事件同步的方法
CN107291547B (zh) 一种任务调度处理方法、装置及系统
CN101872314B (zh) 用于多处理器的动态调度中断控制器
CN101876926B (zh) 一种非对称结构的软件三机热备容错方法
US6711700B2 (en) Method and apparatus to monitor the run state of a multi-partitioned computer system
CN102591759B (zh) 片上众核处理器时钟精确并行仿真系统
CN103440173A (zh) 一种多核处理器的调度方法和相关装置
WO2008046716A1 (en) A multi-processor computing system and its task allocating method
CN1143778A (zh) 多任务实时处理的设备和方法
JPH1097490A (ja) スケーラブル対称型マルチプロセッサにおいてバス幅またはバス・プロトコルを変更せずに割り込みを分散する方法および装置
US10831539B2 (en) Hardware thread switching for scheduling policy in a processor
CN1682195A (zh) 同步或异步定时的处理单元的同步方法和电路装置
CN102934102A (zh) 多处理器系统、执行控制方法和执行控制程序
EP0446077A2 (en) A control system for multi-processor system
EP1393175A2 (en) A resource management method
CN101048738A (zh) 用于执行计算机程序的方法、操作系统和计算设备
JP5277961B2 (ja) 情報処理装置及びその故障隠蔽方法
CN103502906A (zh) 运行操作系统的处理器核的动态分配
CN1755660A (zh) 冗余处理器中的诊断存储器转储方法
CN1635472A (zh) 多处理器计算机系统的开机切换方法
CN1540539A (zh) 中断信号控制系统与控制方法
CN101661406A (zh) 处理单元调度装置和方法
CN1093661C (zh) 反向恢复型输入输出控制装置和输入输出控制方法
CN112527487A (zh) 多线程请求数据整合方法、装置、电子设备及存储介质
WO2004034172A2 (de) Verfahren zur ereignissynchronisation, damit synchronisierte prozessoren und fehlertoleranter systeme mit derartigen prozessoren

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication