CN106776244A - 一种服务器时钟故障自动检测修复系统及方法 - Google Patents

一种服务器时钟故障自动检测修复系统及方法 Download PDF

Info

Publication number
CN106776244A
CN106776244A CN201710142393.3A CN201710142393A CN106776244A CN 106776244 A CN106776244 A CN 106776244A CN 201710142393 A CN201710142393 A CN 201710142393A CN 106776244 A CN106776244 A CN 106776244A
Authority
CN
China
Prior art keywords
clock
source
signal
unit
automatic detection
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710142393.3A
Other languages
English (en)
Inventor
程万前
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhengzhou Yunhai Information Technology Co Ltd
Original Assignee
Zhengzhou Yunhai Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhengzhou Yunhai Information Technology Co Ltd filed Critical Zhengzhou Yunhai Information Technology Co Ltd
Priority to CN201710142393.3A priority Critical patent/CN106776244A/zh
Publication of CN106776244A publication Critical patent/CN106776244A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/32Monitoring with visual or acoustical indication of the functioning of the machine
    • G06F11/321Display for diagnostics, e.g. diagnostic result display, self-test user interface
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/04Generating or distributing clock signals or signals derived directly therefrom
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • Human Computer Interaction (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Hardware Redundancy (AREA)

Abstract

本发明提供一种服务器时钟故障自动检测修复系统及方法,系统包括第一时钟源,与第一时钟源连接的时钟分路单元,与时钟分路单元连接的若干终端、时钟检测单元,与时钟检测单元连接的参考时钟源、管理控制器。第一时钟源和时钟分路单元之间还包括时钟选通单元,时钟选通单元还连接至少一个冗余时钟源。方法包括如下步骤:1.通过第一时钟源提供时钟信号;2.通过时钟分路单元分路时钟信号;3.通过时钟检测单元检测时钟信号;4.通过时钟检测单元发送时钟质量检测结果给管理控制器;5.若时钟信号正常,回到3;若时钟信号不正常,管理控制器报告时钟故障信号;6.发送时钟选通信号;7.通过时钟选通单元切换时钟信号,回到2。

Description

一种服务器时钟故障自动检测修复系统及方法
技术领域
本发明属于服务器时钟管理领域,具体涉及一种服务器时钟故障自动检测修复系统及方法。
背景技术
系统时钟是服务器系统中非常重要的组成部分,在服务器中多用来为CPU(中央处理器)、PCH、PCIE槽、BMC(管理控制器)等设备提供时钟。系统时钟需要满足一定的频率要求,当系统时钟频率超出允许范围时,服务器会发生计时不准、可靠性降低、甚至是宕机等问题。
目前的服务器系统设计中,很少对系统时钟质量进行监控。有的设计虽然采用的冗余的时钟,但是又不支持时钟故障的识别和自动切换,需要手动切换时钟源。当系统因时钟问题而出现故障时,既不能保证系统自动恢复正常工作,又不能快速定位系统问题所在,而需要工程师现场调试分析。这不利于服务器的稳定性和易维护性。
此为现有技术不足之处。因此,针对现有技术中的上述缺陷,提供设计一种服务器时钟故障自动检测修复系统及方法,是非常有必要的。
发明内容
本发明的目的在于,针对上述服务器系统时钟故障不能识别和自动切换的缺陷,提供一种服务器时钟故障自动检测修复系统及方法,以解决上述技术问题。
为实现上述目的,本发明给出以下技术方案:
一种服务器时钟故障自动检测修复系统,包括第一时钟源,与第一时钟源连接的时钟分路单元,与时钟分路单元连接的若干终端、时钟检测单元,与时钟检测单元连接的参考时钟源、管理控制器;
第一时钟源,用于提供时钟信号;
时钟分路单元,用于将第一时钟源提供的时钟信号分路;
若干终端,使用第一时钟源分路后的系统时钟;
时钟检测单元,用于检测第一时钟源分路后的时钟信号,并发送时钟质量检测结果;
参考时钟源,用于给时钟检测单元提供计时时间;
管理控制器,用于接收时钟检测单元的时钟质量检测结果,并在管理界面报告时钟故障信号。
进一步地,第一时钟源和时钟分路单元之间还包括时钟选通单元,时钟选通单元还连接至少一个冗余时钟源;
冗余时钟源用于提供备用时钟信号给时钟选通单元;时钟选通单元用于接收管理控制器的时钟选通信号,并切换时钟信号提供给时钟分路单元。
进一步地,所述参考时钟源为晶振,晶振为32.768kHZ的晶振。
进一步地,所述终端包括中央处理器CPU,南桥芯片PCH,PCIE槽,管理控制器。
进一步地,时钟检测单元采用复杂可编程逻辑器件CPLD、现场可编程门阵列FPGA或者数字电路;时钟分路单元采用时钟缓冲器或者南桥芯片PCH。
进一步地,第一时钟源设置在主板上或者独立的板卡上,冗余时钟源设置在独立的板卡上;第一时钟源和冗余时钟源可以设在同一个独立的板卡上,也可以设在不同的独立板卡上。
本发明还提供如下技术方案:
一种服务器时钟故障自动检测修复方法,包括如下步骤:
步骤1. 通过第一时钟源提供时钟信号;
步骤2. 通过时钟分路单元分路时钟信号;
步骤3. 通过时钟检测单元检测时钟信号;
步骤4. 通过时钟检测单元发送时钟质量检测结果给管理控制器;
步骤5. 若时钟信号正常,回到步骤3;
若时钟信号不正常,管理控制器报告时钟故障信号。
进一步地,步骤5之后包括如下步骤:
步骤6. 通过管理控制器向时钟选通单元发送时钟选通信号;
步骤7. 通过时钟选通单元切换时钟信号,回到步骤2。
进一步地,步骤3中检测时钟信号的步骤如下:
步骤31.系统时钟频率记为F;设置参考时钟源的计时时间为T;
步骤32.在计时时间T内,对系统时钟进行计数,数目记为n;
步骤33.比较理论计数值T*F与实际计数值n之间的关系;
步骤34.设定允许的误差范围为δ;
若|T*F-n|/(T*F)大于δ,则判定为系统时钟信号异常;
若|T*F-n|/(T*F)小于等于δ,则判定为系统时钟信号正常。
进一步地,所述步骤34中设定允许的误差范围根据允许的时钟频率偏差和允许的参考时钟源计时偏差设定。
本发明的有益效果在于:本发明对服务器系统时钟增加了监控和自动切换机制,当时钟存在故障时,管理控制器在管理界面报告该故障,并控制时钟选通单元切换时钟源,保证系统正常工作。
此外,本发明设计原理可靠,结构简单,具有非常广泛的应用前景。
由此可见,本发明与现有技术相比,具有突出的实质性特点和显著的进步,其实施的有益效果也是显而易见的。
附图说明
图1为本发明系统的连接示意图;
图2为本发明的方法流程图;
其中,1.管理控制器;2.时钟选通单元;3.第一时钟源;4.冗余时钟源;5.时钟分路单元;6.时钟检测单元;7.终端;8.参考时钟源。
具体实施方式:
为使得本发明的目的、特征、优点能够更加的明显和易懂,下面将结合本发明具体实施例中的附图,对本发明中的技术方案进行清楚、完整地描述。
如图1所示,一种服务器时钟故障自动检测修复系统,包括第一时钟源3,与第一时钟源3连接的时钟分路单元5,与时钟分路单元5连接的若干终端7、时钟检测单元6,与时钟检测单元6连接的参考时钟源8、管理控制器1;
第一时钟源3,用于提供时钟信号;
时钟分路单元5,用于将第一时钟源3提供的时钟信号分路;
若干终端7,使用第一时钟源3分路后的系统时钟;
时钟检测单元6,用于检测第一时钟源3分路后的时钟信号,并发送时钟质量检测结果;
参考时钟源8,用于给时钟检测单元6提供计时时间;
管理控制器1,用于接收时钟检测单元6的时钟质量检测结果,并在管理界面报告时钟故障信号。
第一时钟源3和时钟分路单元5之间还包括时钟选通单元2,时钟选通单元2还连接至少一个冗余时钟源4;
冗余时钟源4用于提供备用时钟信号给时钟选通单元2;时钟选通单元2用于接收管理控制器1的时钟选通信号,并切换时钟信号提供给时钟分路单元5。
所述参考时钟源8为晶振,晶振为32.768kHZ的晶振。
所述终端7包括中央处理器CPU,南桥芯片PCH,PCIE槽,管理控制器。
时钟检测单元6采用复杂可编程逻辑器件CPLD、现场可编程门阵列FPGA或者数字电路;时钟分路单元5采用时钟缓冲器或者南桥芯片PCH。
第一时钟源3设置在主板上或者独立的板卡上,冗余时钟源4设置在独立的板卡上;第一时钟源3和冗余时钟源4可以设在同一个独立的板卡上,也可以设在不同的独立板卡上。
如图2所示,一种服务器时钟故障自动检测修复方法,包括如下步骤:
步骤1. 通过第一时钟源提供时钟信号;
步骤2. 通过时钟分路单元分路时钟信号;
步骤3. 通过时钟检测单元检测时钟信号;
步骤4. 通过时钟检测单元发送时钟质量检测结果给管理控制器;
步骤5. 若时钟信号正常,回到步骤3;
若时钟信号不正常,管理控制器报告时钟故障信号。
步骤5之后包括如下步骤:
步骤6. 通过管理控制器向时钟选通单元发送时钟选通信号;
步骤7. 通过时钟选通单元切换时钟信号,回到步骤2。
步骤3中检测时钟信号的步骤如下:
步骤31.系统时钟频率记为F;设置参考时钟源的计时时间为T;
步骤32.在计时时间T内,对系统时钟进行计数,数目记为n;
步骤33.比较理论计数值T*F与实际计数值n之间的关系;
步骤34.设定允许的误差范围为δ;
若|T*F-n|/(T*F)大于δ,则判定为系统时钟信号异常;
若|T*F-n|/(T*F)小于等于δ,则判定为系统时钟信号正常。
所述步骤34中设定允许的误差范围根据允许的时钟频率偏差和允许的参考时钟源计时偏差设定。
本发明的实施例是说明性的,而非限定性的,上述实施例只是帮助理解本发明,因此本发明不限于具体实施方式中所述的实施例,凡是由本领域技术人员根据本发明的技术方案在本发明的精神和原则之内所做的任何修改、等同替换、改进等得出的其他的具体实施方式,同样属于本发明保护的范围。

Claims (10)

1.一种服务器时钟故障自动检测修复系统,其特征在于,包括第一时钟源,与第一时钟源连接的时钟分路单元,与时钟分路单元连接的若干终端、时钟检测单元,与时钟检测单元连接的参考时钟源、管理控制器。
2.如权利要求1所述的一种服务器时钟故障自动检测修复系统,其特征在于,
第一时钟源和时钟分路单元之间还包括时钟选通单元,时钟选通单元还连接至少一个冗余时钟源。
3.如权利要求1所述的一种服务器时钟故障自动检测修复系统,其特征在于,所述参考时钟源为晶振,晶振为32.768kHZ的晶振。
4.如权利要求1所述的一种服务器时钟故障自动检测修复系统,其特征在于,所述终端包括中央处理器CPU,南桥芯片PCH,PCIE槽,管理控制器。
5.如权利要求1所述的一种服务器时钟故障自动检测修复系统,其特征在于,时钟检测单元采用复杂可编程逻辑器件CPLD、现场可编程门阵列FPGA或者数字电路;时钟分路单元采用时钟缓冲器或者南桥芯片PCH。
6.如权利要求2所述的一种服务器时钟故障自动检测修复系统,其特征在于,第一时钟源设置在主板上或者独立的板卡上,冗余时钟源设置在独立的板卡上。
7.一种服务器时钟故障自动检测修复方法,其特征在于,包括如下步骤:
步骤1. 通过第一时钟源提供时钟信号;
步骤2. 通过时钟分路单元分路时钟信号;
步骤3. 通过时钟检测单元检测时钟信号;
步骤4. 通过时钟检测单元发送时钟质量检测结果给管理控制器;
步骤5. 若时钟信号正常,回到步骤3;
若时钟信号不正常,管理控制器报告时钟故障信号。
8.如权利要求7所述的一种服务器时钟故障自动检测修复方法,其特征在于,
步骤5之后包括如下步骤:
步骤6. 通过管理控制器向时钟选通单元发送时钟选通信号;
步骤7. 通过时钟选通单元切换时钟信号,回到步骤2。
9.如权利要求7所述的一种服务器时钟故障自动检测修复方法,其特征在于,步骤3中通过时钟检测单元检测时钟信号的步骤如下:
步骤31.系统时钟频率记为F;设置参考时钟源的计时时间为T;
步骤32.在计时时间T内,对系统时钟进行计数,数目记为n;
步骤33.比较理论计数值T*F与实际计数值n之间的关系;
步骤34.设定允许的误差范围为δ;
若|T*F-n|/(T*F)大于δ,则判定为系统时钟信号异常;
若|T*F-n|/(T*F)小于等于δ,则判定为系统时钟信号正常。
10.如权利要求9所述的一种服务器时钟故障自动检测修复方法,其特征在于,所述步骤34中设定允许的误差范围根据允许的时钟频率偏差和允许的参考时钟源计时偏差设定。
CN201710142393.3A 2017-03-10 2017-03-10 一种服务器时钟故障自动检测修复系统及方法 Pending CN106776244A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710142393.3A CN106776244A (zh) 2017-03-10 2017-03-10 一种服务器时钟故障自动检测修复系统及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710142393.3A CN106776244A (zh) 2017-03-10 2017-03-10 一种服务器时钟故障自动检测修复系统及方法

Publications (1)

Publication Number Publication Date
CN106776244A true CN106776244A (zh) 2017-05-31

Family

ID=58962447

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710142393.3A Pending CN106776244A (zh) 2017-03-10 2017-03-10 一种服务器时钟故障自动检测修复系统及方法

Country Status (1)

Country Link
CN (1) CN106776244A (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107577565A (zh) * 2017-10-23 2018-01-12 郑州云海信息技术有限公司 一种服务器时钟热添加和热移除的方法
CN107783864A (zh) * 2017-10-20 2018-03-09 郑州云海信息技术有限公司 一种服务器时钟冗余装置及切换方法
CN108009115A (zh) * 2017-12-21 2018-05-08 郑州云海信息技术有限公司 一种具有时钟冗余功能的双节点服务器板卡
CN109857191A (zh) * 2019-01-31 2019-06-07 郑州云海信息技术有限公司 一种频率可控的冗余时钟板及服务器
CN110308765A (zh) * 2019-06-28 2019-10-08 苏州浪潮智能科技有限公司 一种服务器时钟信号监测系统及监测方法
CN111220152A (zh) * 2020-01-13 2020-06-02 西安微电子技术研究所 一种基于lx800的导航计算模块及工作方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3233773B2 (ja) * 1994-03-18 2001-11-26 富士通株式会社 試験回路、自己試験方法及び通常試験方法
CN101621371A (zh) * 2008-07-04 2010-01-06 大唐移动通信设备有限公司 一种时钟设计方法及时钟装置
CN102223143A (zh) * 2010-04-16 2011-10-19 电信科学技术研究院 时钟信号保护的装置、方法及时钟检测补偿电路

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3233773B2 (ja) * 1994-03-18 2001-11-26 富士通株式会社 試験回路、自己試験方法及び通常試験方法
CN101621371A (zh) * 2008-07-04 2010-01-06 大唐移动通信设备有限公司 一种时钟设计方法及时钟装置
CN102223143A (zh) * 2010-04-16 2011-10-19 电信科学技术研究院 时钟信号保护的装置、方法及时钟检测补偿电路

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107783864A (zh) * 2017-10-20 2018-03-09 郑州云海信息技术有限公司 一种服务器时钟冗余装置及切换方法
CN107577565A (zh) * 2017-10-23 2018-01-12 郑州云海信息技术有限公司 一种服务器时钟热添加和热移除的方法
CN108009115A (zh) * 2017-12-21 2018-05-08 郑州云海信息技术有限公司 一种具有时钟冗余功能的双节点服务器板卡
CN109857191A (zh) * 2019-01-31 2019-06-07 郑州云海信息技术有限公司 一种频率可控的冗余时钟板及服务器
CN110308765A (zh) * 2019-06-28 2019-10-08 苏州浪潮智能科技有限公司 一种服务器时钟信号监测系统及监测方法
CN111220152A (zh) * 2020-01-13 2020-06-02 西安微电子技术研究所 一种基于lx800的导航计算模块及工作方法

Similar Documents

Publication Publication Date Title
CN106776244A (zh) 一种服务器时钟故障自动检测修复系统及方法
CN110212645B (zh) 一种用电信息采集终端停电事件上报方法及装置
CN103425553B (zh) 一种双机热备份系统及该系统的故障检测方法
CN111859398B (zh) 一种基于tpcm的双bios安全验证装置及方法
CN115550291B (zh) 交换机的复位系统及方法、存储介质、电子设备
CN105259863A (zh) 一种plc温备份冗余方法及系统
CN101964724A (zh) 通信单板的节能方法和一种通信单板
CN100595716C (zh) 分布式处理系统的时钟同步方法及装置
CN113791937B (zh) 一种数据同步冗余系统及其控制方法
CN207965068U (zh) 一种便捷高效的jtag链路远程切换系统
CN206788690U (zh) 一种具有断电检测功能的时间服务器
CN106452668B (zh) 一种基于fpga的ied双通道数据传输和双逻辑校验系统及方法
CN1780348B (zh) 一种通信系统电源控制方法和系统
CN102231700A (zh) 交换卡切换信息的下发方法和交换卡热备份系统
CN101397020A (zh) 智能采集驱动设备
CN101964731B (zh) 一种数据链路监测方法及装置
CN106919493A (zh) 一种服务器上电故障监控系统及方法
CN104535862B (zh) 一种用于混频器自检的故障检测电路及检测方法
CN103532728A (zh) 一种对故障dsp芯片复位的方法及装置
CN111447333B (zh) Tdm总线故障检测方法及装置、设备、可读存储介质
CN111506466B (zh) 一种用于关键电压的交互冗余监控系统及方法
KR100868737B1 (ko) 전력거래용 원격소 단말장치에 적용되는 데이터 오류방지용핫스왑 장치, 이를 구비한 보드 및 핫스왑 방법
CN204347204U (zh) 基于手持pos机主板自动测试仪
CN213457241U (zh) 一种侦测服务器pcie开关上下行电路
CN112929120B (zh) 一种用于时间同步的方法、设备和计算机可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20170531

RJ01 Rejection of invention patent application after publication