CN114765635A - 一种时钟同步方法、装置、系统、计算机设备及存储介质 - Google Patents

一种时钟同步方法、装置、系统、计算机设备及存储介质 Download PDF

Info

Publication number
CN114765635A
CN114765635A CN202110025047.3A CN202110025047A CN114765635A CN 114765635 A CN114765635 A CN 114765635A CN 202110025047 A CN202110025047 A CN 202110025047A CN 114765635 A CN114765635 A CN 114765635A
Authority
CN
China
Prior art keywords
machine
target
machines
target machine
clock synchronization
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110025047.3A
Other languages
English (en)
Other versions
CN114765635B (zh
Inventor
张凯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN202110025047.3A priority Critical patent/CN114765635B/zh
Publication of CN114765635A publication Critical patent/CN114765635A/zh
Application granted granted Critical
Publication of CN114765635B publication Critical patent/CN114765635B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L69/00Network arrangements, protocols or services independent of the application payload and not provided for in the other groups of this subclass
    • H04L69/28Timers or timing mechanisms used in protocols

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Security & Cryptography (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Synchronisation In Digital Transmission Systems (AREA)
  • Electric Clocks (AREA)

Abstract

本申请提供一种时钟同步方法、装置、系统、计算机设备及存储介质,应用于时钟同步系统中的目标机器,时钟同步系统由位于可用区的至少一个业务服务器和作为业务服务器上游的至少一个第一机器、位于可用区外且作为第一机器上游的至少一个第二机器和作为第二机器上游的至少一个第三机器构成,目标机器为业务服务器、第一机器,或者第二机器。时钟同步系统中的目标机器可以从与目标机器相关的参考机器集中确定最佳参考机器,并在基于当前最佳参考机器和当前目标机器的本地时间确定最佳参考机器未发生时钟跳变的情况下,调整当前目标机器的本地时间向标准时间靠拢,进而在保证ntp服务稳定性的同时,减少时钟同步错误情况的发生。

Description

一种时钟同步方法、装置、系统、计算机设备及存储介质
技术领域
本发明涉及时钟同步技术领域,更具体地说,涉及一种时钟同步方法、装置、系统、计算机设备及存储介质。
背景技术
可用区(available zone,简称az):是在同一地域内电力和网络互相独立的物理数据中心。其目标是能够保证可用区间故障相互隔离(大型灾害或者大型电力故障除外),不出现故障扩散,使得用户的业务持续在线服务。通过启动独立可用区内的实例,用户可以保护应用程序不受单一位置故障的影响。
并且,为了保证业务持续稳定的运行,通常需要对多个可用区中为业务运行提供技术支持的所有业务服务器进行时钟同步。目前常用ntp服务部署方式实现对多个可用区中业务服务器的时钟同步,这种方式需要对多个可用区中每台业务服务器配置cron定时任务执行ntpdate向外部ntp源请求同步校准时间,外部ntp源是指既能向可用区中业务服务器提供ntp服务,又能向公网ntp源请求同步时间的机器。
这种常用的ntp服务部署方式虽然能实现对多个可用区中所有业务服务器的时钟同步,但是往往存在如下缺点:1、外部ntp源单点故障,导致ntp服务不可用;2、当外部ntp源或公网ntp源服务异常,时间异常跳变,ntpdate强制性把跳变异常的时间扩散到整个集群中,导致集群中所有业务服务器时钟同步错误,造成严重后果。
发明内容
有鉴于此,为解决上述问题,本发明提供一种时钟同步方法、装置、计算机设备及存储介质,以在保证ntp服务稳定性的同时,减少时钟同步错误情况的发生,技术方案如下:
一种时钟同步方法,应用于时钟同步系统中的目标机器,所述时钟同步系统由位于可用区的至少一个业务服务器和作为所述业务服务器上游的至少一个第一机器、位于所述可用区外且作为所述第一机器上游的至少一个第二机器和作为所述第二机器上游的至少一个第三机器构成,所述第三机器为公网ntp源,所述目标机器为所述业务服务器、所述第一机器,或者所述第二机器,该方法包括:
从与所述目标机器相关的参考机器集中确定所述目标机器的最佳参考机器,所述参考机器集由作为所述目标机器上游的机器和所述目标机器的对等机器构成,除所述业务服务器以外属于同种机器的任意两个机器互为对等机器;
获取当前所述最佳参考机器的标准时间;
在基于所述标准时间和当前所述目标机器的本地时间确定所述最佳参考机器的时钟未发生跳变的情况下,调整当前所述目标机器的本地时间向所述标准时间靠拢。
一种时钟同步装置,应用于时钟同步系统中的目标机器,所述时钟同步系统由位于可用区的至少一个业务服务器和作为所述业务服务器上游的至少一个第一机器、位于所述可用区外且作为所述第一机器上游的至少一个第二机器和作为所述第二机器上游的至少一个第三机器构成,所述第三机器为公网ntp源,所述目标机器为所述业务服务器、所述第一机器,或者所述第二机器,该装置包括:
最佳参考机器确定单元,用于从与所述目标机器相关的参考机器集中确定所述目标机器的最佳参考机器,所述参考机器集由作为所述目标机器上游的机器和所述目标机器的对等机器构成,除所述业务服务器以外属于同种机器的任意两个机器互为对等机器;
标准时间获取单元,用于获取当前所述最佳参考机器的标准时间;
时钟同步单元,用于在基于所述标准时间和当前所述目标机器的本地时间确定所述最佳参考机器的时钟未发生跳变的情况下,调整当前所述目标机器的本地时间向所述标准时间靠拢。
一种时钟同步系统,包括:
位于可用区的至少一个业务服务器和作为所述业务服务器上游的至少一个第一机器;
位于所述可用区外且作为所述第一机器上游的至少一个第二机器和作为所述第二机器上游的至少一个第三机器,所述第三机器为公网ntp源;
目标机器用于从与所述目标机器相关的参考机器集中确定所述目标机器的最佳参考机器,所述参考机器集由作为所述目标机器上游的机器和所述目标机器的对等机器构成,除所述业务服务器以外属于同种机器的任意两个机器互为对等机器;获取当前所述最佳参考机器的标准时间;以及,在基于所述标准时间和当前所述目标机器的本地时间确定所述最佳参考机器的时钟未发生跳变的情况下,调整当前所述目标机器的本地时间向所述标准时间靠拢;
所述目标机器为所述业务服务器、所述第一机器,或者所述第二机器。
一种计算机设备,包括:处理器以及存储器,所述处理器以及存储器通过通信总线相连;其中,所述处理器,用于调用并执行所述存储器中存储的程序;所述存储器,用于存储程序,所述程序用于实现所述时钟同步方法。
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器加载并执行,实现所述时钟同步方法的各步骤。
本申请提供一种时钟同步方法、装置、系统、计算机设备及存储介质,应用于时钟同步系统中的目标机器,时钟同步系统由位于可用区的至少一个业务服务器和作为业务服务器上游的至少一个第一机器、位于可用区外且作为第一机器上游的至少一个第二机器和作为第二机器上游的至少一个第三机器构成,第三机器为公网ntp源,目标机器为业务服务器、第一机器,或者第二机器。时钟同步系统中的目标机器可以从与目标机器相关的参考机器集中确定最佳参考机器,并在基于当前最佳参考机器和当前目标机器的本地时间确定最佳参考机器未发生时钟跳变的情况下,调整当前目标机器的本地时间向标准时间靠拢。
本申请目标机器的时钟同步并非仅能依赖于一个机器,而是可以从与目标机器相关的参考机器集中选取最佳参考机器,这样,即使参考机器集中出现故障机器仍然可以从参考机器集中选取其他机器作为最佳参考机器,提高了ntp服务的稳定性;而且,本申请在确定最佳参考机器后,进一步基于当前最佳参考机器的标准时间和当前目标机器的本地时间对当前最佳参考机器的时钟准确性进行了校验,在确定当前最佳参考机器的时钟未发生跳变的情况下才对目标机器进行的时钟同步,因此,可以有效减少因标准时间跳变导致的目标机器时钟同步错误的情况;并且,本申请并未直接采用将当前目标机器的本地时间同步成标准时间的方式进行目标机器的时钟同步,而是采用调整当前目标机器的本地时间向标准时间靠拢的方式实现目标机器的时钟同步,这样,进一步减少了在标准时间发生跳变的情况下,标准时间的在时钟同步系统的扩散,提高了ntp服务的稳定性。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本申请实施例提供的一种现有时钟同步系统结构示意图;
图2为本申请实施例提供的一种时钟同步系统结构示意图;
图3为本申请实施例提供的一种时钟同步方法流程图;
图4为本申请实施例提供的一种时钟同步装置的结构示意图;
图5为本申请实施例提供的一种时钟同步方法所适用于的计算机设备的硬件结构框图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
为了便于对本申请提供的一种时钟同步方法、装置、系统、计算机设备及存储介质的理解,现对本申请中所涉及到的技术术语进行解释说明。
ntp服务:是用来使计算机时间同步化的一种协议,它可以使计算机对其服务器或时钟源(如石英钟,GPS等等)做同步化,它可以提供高精准度的时间校正(LAN上与标准间差小于1毫秒,WAN上几十毫秒),且可介由加密确认的方式来防止恶毒的协议攻击。时间按NTP服务器的等级传播。按照离外部UTC源的远近把所有服务器归入不同的Stratum(层)中。
ntp上级参考时钟源:用来调整本地时钟的ntp时钟参考源。
ntp的peer参考时钟源:用来互相参考的对等时钟源,形成对等体,共享时间配置。
可用区(available zone,下文简称az):是在同一地域内电力和网络互相独立的物理数据中心。其目标是能够保证可用区间故障相互隔离(大型灾害或者大型电力故障除外),不出现故障扩散,使得用户的业务持续在线服务。通过启动独立可用区内的实例,用户可以保护应用程序不受单一位置故障的影响。
cron:工具型软件cron是一款类Unix的操作系统下的基于时间的任务管理系统。用户们可以通过cron在固定时间、日期、间隔下,运行定期任务(可以是命令和脚本)。
ntpdate命令:ntpdate是一个类unix操作系统下的常用命令,普通机器向ntp服务器请求获取标准时间并校准本地时间的命令,是强制性的,可能造成时间的跳变。比如:当一个机器(ntp客户端)向ntp服务器发起时间同步请求时,ntp服务器会发送一个包含当前机器时间的udp报文给ntp客户端,ntp客户端接收到标准时间后,排除延迟后,会直接把这个“标准时间”强制设置为本机时间(无论当前机器时间和这个时间相差多少)。所以当ntp服务器的机器时间发生硬件故障导致时钟跳变,一样会把这个异常的时间发送给ntp客户端。
现有技术为了保证用户的业务持续在线服务,通常会将为业务运行提供技术支持的业务服务器分散设置于多个可用区,每个可用区设置有一台或多台业务服务器。图1是目前常用的ntp服务部署架构示意图。参见图1,对于一个封闭的环境中(没有公网,无法向公网ntp服务器同步时间),目前普通使用的方式是:在封闭的环境中的每台机器配置cron定时任务执行ntpdate向ntp服务器请求同步校准时间。如图1所示,封闭的环境可以认为是各个可用区,封闭的环境中的机器可以认为是可用区中的业务服务器,ntp服务器也可以称为外部ntp源。说明:“外部ntp源”是指既能向环境中的机器提供ntp服务,又能向公网ntp源请求同步时间的机器。
如图1所示的常用ntp服务部署架构虽然能够实现对多个可用区中业务服务器的时钟同步,但是通常存在如下缺点:
1、“外部ntp源”单点故障,导致ntp服务不可用;
2、当“外部ntp源”或者“公网ntp源”服务异常,时间异常跳变,ntpdate强制性把跳变异常的时间扩散到整个集群中,形成很严重的后果,比如证书过期导致其他业务服务不可用等。
有鉴于此,本申请实施例提供一种时钟同步系统,该时钟同步系统在每个可用区中分别使用至少一个第一机器(第一机器可以称为ntp server),并以ntpd协议提供服务,满足多可用区中ntp同步服务的高可用架构,防止时钟源异常扩散到环境中。
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
图2为本申请实施例提供的一种时钟同步系统的结构示意图。如图2所示,本申请实施例提供的时钟同步系统由位于可用区的至少一个业务服务器和作为业务服务器上游的至少一个第一机器、位于可用区外且作为第一机器上游的至少一个第二机器和作为第二机器上游的至少一个第三机器构成。
时钟同步系统可以包括至少一个可用区(n个可用区,n的取值可以为大于等于1的正整数)。针对每个可用区而言,在该可用区中设置有一个或多个业务服务器以及用于作为该可用区中业务服务器上游的至少一个第一机器,该可用区中每个第一机器均可以作为该可用区中各个业务服务器的上游,第一机器可以认为是如图2所示的ntp server。
需要说明的是,如图2所示仅在每个可用区中示出了一个业务服务器,但是,本领域技术人员需了解的是图2并不构成对本申请实施例中可用区的业务服务器数量的限制,有关可用区中业务服务器的数量本领域技术人员可根据自己的需求进行设置,在此不做限定。
示例性的,时钟同步系统在可用区之外设置有至少一个第二机器,每个第二机器均可以作为至少一个可用区中各个第一机器的上游;第二机器可以认为是如图2所示的外部ntp源。
示例性的,时钟同步系统在可用区之外还设置有至少一个第三机器,每个第三机器均可以作为至少一个第二机器中各个第二机器的上游;第三机器可以认为是如图2所示的公网ntp源。
本申请实施例所涉及到的至少一个第一机器可以为两个或两个以上第一机器,至少一个第二机器可以为两个或两个以上第二机器,这样可以保证更好的ntp服务稳定性,减少时钟同步错误情况的发生。
示例性的,如图2所示,至少一个第一机器可以为3个第一机器,至少一个第二机器可以为3个第二机器,至少一个第三机器可以为1个第三机器,以上仅仅是本申请实施例提供的至少一个第一机器、至少一个第二机器、至少一个第三机器的优选设置方式,有关至少一个第一机器、至少一个第二机器、至少一个第三机器的具体设置方式,本领域技术人员可根据自己的需求进行设置,在此不做限定。
需要说明的是,图2虽仅示出了位于可用区域1中的三个第一机器,位于可用区n中的三个第一机器、三个第二机器,以及一个第一机器,但是本申请实施例提供的时钟同步方法对于可用区中至少一个第一机器的数量、至少一个第二机器的数量、至少一个第三机器的数量并不限于图2所示,本领域技术人员可根据自己的需求设置可用区中至少一个第一机器的数量、至少一个第二机器的数量、至少一个第三机器的数量,在此不做限定。
本申请实施例,时钟同步方法应用于时钟同步系统中的目标机器,目标机器可以为业务服务器、第一机器,或者,第二机器。示例性的,时钟同步系统中的各个业务服务器、各个第一机器、各个第二机器可以同时执行本申请实施例提供的如图3所示的时钟同步方法。
如图3所示,目标机器中设置ntpd客户端,ntpd客户端上设置有一个常驻进程(ntpd进程),目标机器依赖于其上设置的ntpd进程采用ntpd协议执行如图3所示的时钟同步方法,如图3所示该时钟同步方法包括:
S301、从与目标机器相关的参考机器集中确定目标机器的最佳参考机器,参考机器集由作为目标机器上游的机器和目标机器的对等机器构成,除业务服务器以外属于同种机器的任意两个机器互为对等机器;
本申请实施例,任意两个业务服务器不互为对等机器;同一可用区中任意两个第一机器互为对等机器、任意两个第二机器互为对等机器、任意两个第三机器互为对等机器。
示例性的,若目标机器为业务服务器,作为该业务服务器上游的机器由该业务服务器所属可用区中所有第一机器构成;该业务服务器的对等机器为空;与该业务服务器相关的参考机器集由该业务服务器所属可用区中所有第一机器构成。以一个可用区为例,该可用区中的第一机器可以认为是该可用区中每个业务服务器的上游ntp服务器。
若目标机器为第一机器,作为该第一机器上游的机器由时钟同步系统中所有第二机器构成;该第一机器的对等机器由该第一机器所属可用区中除该第一机器以外的其他各个第一机器构成;与该第一机器相关的参考机器集由时钟同步系统中所有第二机器以及该第一机器所属可用区中除该第一机器以外的所有其他第一机器构成。以一个第二机器为例,该第二机器可以认为是各个可用区中每个第一机器的上游ntp服务器。
若目标机器为第二机器,作为该第二机器上游的机器由时钟同步系统中所有第三机器构成;该第二机器的对等机器由时钟同步系统中除该第二机器以外的所有其他第二机器构成;与该第二机器相关的参考机器集由时钟同步系统中所有第三机器以及时钟同步系统中除该第二机器以外的所有其他第二机器构成。以一个第三机器为例,该第三机器可以认为是时钟同步系统中每个第二机器的上游ntp服务器。
示例性的,上游ntp服务器也可以称为上游时钟源。
需要说明的是,本申请实施例提供的时钟同步方法会预先设置时钟同步系统中各个机器之间的优先级,以便于在目标机器设置与目标机器相关的参考机器集时,还可以基于预先设置的时钟同步系统中各个机器之间的优先级,设置参考机器集中各个机器之间的优先级。
示例性的,时钟同步系统中第三机器的优先级高于第二机器的优先级,第二机器的优先级高于第一机器的优先级,第一机器的优先级高于业务服务器的优先级。并且,预先设置时钟同步系统中各个第三机器之间的优先级,时钟同步系统中各个第二机器之间的优先级,以及针对时钟同步系统中每个可用区,预先对该可用区中各个第一机器之间的优先级进行设置。
相应的,与目标机器相关的参考机器集中各个机器之间的优先级遵从于预先设置的时钟同步系统中各个机器之间的优先级。
示例性的,目标机器的最佳参考机器也可以称为是目标机器的上级时钟源。
S302、获取当前最佳参考机器的标准时间;
本申请实施例,时钟同步系统中的目标机器执行本申请实施例提供的时钟同步方法之前,可以预先在目标机器本地设置与该目标机器相关的参考机器集,进而便于目标机器在执行时钟同步方法时依赖于其本地设置的参考机器集确定该目标机器的最佳参考机器。
目标机器从与目标机器相关的参考机器集中确定目标机器的最佳参考机器的方式可以为:确定与目标机器相关的参考机器集;将参考机器集中异常机器删除得到目标参考机器集,异常机器包括与目标机器之间网络不互通的机器、宕机的机器,或当前本地时间与参考机器集中其他机器的当前本地时间之间的时间差异满足预设差异条件的机器;从目标参考机器集中确定目标机器的最佳参考机器。
示例性的,目标机器可以分别从参考机器集中的每个机器上拉取时间,如果目标机器从参考机器集中的某个机器上拉取时间不成功,可以认为参考机器集中的该机器为异常机器,该异常机器可能是与目标机器之间网络不互通的机器,或者,可能是发生宕机的机器。
目标机器从机器上拉取时间可以为目标机器拉取机器当前的本地时间;目标机器拉取与该目标机器相关的参考机器集中各个机器当前的本地时间后,还可以比较拉取到的各个机器的当前本地时间,将当前本地时间与其他机器的当前本地时间之间的时间差异满足预设差异条件的机器认为是异常机器。
示例性的,可以计算拉取到的参考机器集中任意两个机器的当前本地时间之间的时间差,若参考机器集中某个机器与参考机器集中其他每个机器之间的时间差均大于预设值,则认为该机器为满足预设差异条件的机器,该机器为异常机器。
以上仅仅是本申请实施例提供的一种差异条件的优选内容,有关差异条件的具体内容,本领域技术人员可根据自己的需求进行设置,在此不做限定。
进一步的,目标机器可以从与目标机器相关的参考机器集中删除所确定的各个异常机器,将删除异常机器后的参考机器集作为与该目标机器相关的目标参考机器集。
本申请实施例,目标机器在确定与其相关的目标参考机器集后,还可以从该目标参考机器集中确定该目标机器的最佳参考机器。
示例性的,与目标机器相关的参考机器集中的各个机器之间预先设置有优先级,相应的,按照与目标机器相关的参考机器集中各个机器之间的优先级,从与目标机器相关的目标参考机器集中选取一个优先级最高的机器作为该目标机器的最佳参考机器。
S303、在基于标准时间和当前目标机器的本地时间确定最佳参考机器的时钟未发生跳变的情况下,调整当前目标机器的本地时间向标准时间靠拢;
示例性的,目标机器可以按照预先设置的第一频率确定当前时间到达最佳参考机器确定时刻时,从与目标机器相关的参考机器集中确定当前目标机器的最佳参考机器。相应的,每当重新确定一次当前目标机器的最佳参考机器便可触发拉取一次当前确定的最佳参考机器的标准时间以进行目标机器的时钟同步。
目标机器拉取最佳参考机器的标准时间的方式可以认为是:目标机器拉取当前最佳参考机器的本地时间,将拉取到的当前最佳参考机器的本地时间认为是获取到的当前最佳参考机器的标准时间。
本申请实施例,在获取到当前最佳参考机器的标准时间后,可以根据标准时间和当前目标机器的本地时间确定当前最佳参考机器的时钟是否发生跳变;如果标准时间和当前目标机器的本地时间之间的时间差未超过预先设置的时间差阈值,则认为当前最佳参考机器的时钟未发生跳变;反之,如果标准时间和当前目标机器的本地时间之间的时间差超过预先设置的时间差阈值,则认为当前最佳参考机器的时钟发生跳变。
示例性的,时间差阈值可以为800秒、950秒、1000秒等等,以上仅仅是本申请实施例提供的时间差阈值的优选内容,有关时间差阈值的具体内容,本领域技术人员可根据自己的需求进行设置,在此不做限定。
示例性的,目标机器在基于标准时间和当前目标机器的本地时间确定最佳参考机器的时钟未发生跳变的情况下,可以调整当前目标机器的本地时间向标准时间阶梯性靠拢。
S304、在基于标准时间和当前目标机器的本地时间确定最佳参考机器的时钟发生跳变的情况下,拒绝当前目标机器的本地时间向标准时间同步;
本申请实施例,目标机器在基于标准时间和当前目标机器的本地时间确定最佳参考机器的时钟发生跳变的情况下,可以拒绝将当前本地时间向标准时间同步。即,拒绝将当前目标机器的本地时间向标准时间靠拢。
S305、停止目标机器的时钟同步并发出报警信息,报警信息表征作为目标机器上游的所有机器出现异常。
进一步的,本申请实施例提供的一种时钟同步方法,目标机器在基于标准时间和当前目标机器的本地时间确定最佳参考机器的时钟发生跳变的情况下,不仅会拒绝当前目标机器的本地时间向标准时间同步,而且还可以停止该目标机器的时钟同步并发出报警信息。
示例性的,目标机器停止该目标机器的时钟同步可以认为是:目标机器停止执行本申请实施例提供的一种时钟同步方法,但是,需要注意的是,虽然目标机器停止执行本申请实施例提供的一种时钟同步方法,但是目标机器为第一机器或第二机器的情况下,目标机器还是可以作为其他机器的上游为其他机器提供标准时间的。
示例性的,目标机器获取到的标准时间和当前目标机器本地时间之间的时间差超过预先设置的时间差阈值的情况下,当前最佳参考机器的时钟发生跳变,作为目标机器的上游的所有机器可能都出现了异常,这时,可以发出报警信息以提示用户作为目标机器的上游的所有机器出现了异常,便于用户及时获知时钟同步系统中机器的异常情况,对时钟同步系统中的异常机器进行维护,提高时钟同步系统运行的稳定性,及时钟同步结果准确性。
本申请实施例中,ntpd进程是一个常驻进程,会定时请求上级时钟源请求获取时间来校准本地时钟。但不是突变性的,会按阶梯性每次向上级时钟源的标准时间逐渐靠拢。并且有保护机制,当本地时间和上级时钟源的标准时间相差过大时,则不会进行时间同步。目标机器的ntpd客户端可以在/etc/ntp.conf配置中设置目标机器的多个上游ntp服务器以及多个peer,ntpd协议会定时在多个上游ntp服务器和peer之间对比选择一个最佳参考源(即,最佳参考机器),然后每隔一段时间从最佳参考源获取标准时间,检查如果最佳参考源返回的标准时间相比本地时间相差大于1000s,就拒绝同步。否则,向标准时间阶梯性靠拢。防止最佳参考源时间异常抖动导致ntpd客户端也跟着不断异常抖动。比如:当前时间为12:30,从最佳参考源获取的标准时间为12:45,那么本次同步会把本地时间设置为12:35而不会直接设置为12:45。下一个同步周期会再次请求获取下一个同步周期的最佳参考源的标准时间进行靠拢。当所有上游的服务都不可用时,仍然可以以本地时间给其他ntpd客户端提供时间同步服务。
本申请目标机器的时钟同步并非仅能依赖于一个机器,而是可以从与目标机器相关的参考机器集中选取最佳参考机器,这样,即使参考机器集中出现故障机器仍然可以从参考机器集中选取其他机器作为最佳参考机器,提高了ntp服务的稳定性;而且,本申请在确定最佳参考机器后,进一步基于当前最佳参考机器的标准时间和当前目标机器的本地时间对当前最佳参考机器的时钟准确性进行了校验,在确定当前最佳参考机器的时钟未发生跳变的情况下才对目标机器进行的时钟同步,因此,可以有效减少因标准时间跳变导致的目标机器时钟同步错误的情况;并且,本申请并未直接采用将当前目标机器的本地时间同步成标准时间的方式进行目标机器的时钟同步,而是采用调整当前目标机器的本地时间向标准时间靠拢的方式实现目标机器的时钟同步,这样,进一步减少了在标准时间发生跳变的情况下,标准时间的在时钟同步系统的扩散,提高了ntp服务的稳定性。
下面结合图2所示的时钟同步系统,对本申请实施例提供的一种时钟同步系统的系统架构进行进一步详细说明。
(1)、环境内每个可用区使用三台ntp server作为本az的ntp源提供服务,三个ntpserver以ntpd协议提供服务,互为peer,即假如三台ntp server分别为A,B,C,则A的peer是B和C,B的,B的peer是A和C,C的peer是A和B。ntp server的上游时钟源配置为三个外部ntp源。
(2)、三个外部ntp源使用ntpd协议提供服务,互为peer,上游时钟源配置为“公网ntp源”。
(3)、每个可用区中其他的服务器(ntp server外)都使用ntpd协议启动ntp客户端,配置上游时钟源为本可用区的三个ntp server。
相应的,基于如图2所示的时钟同步系统可以实现的故障场景分析如下:
(1)、当“公网ntp源”服务不可用时,“外部ntp源”依然能以本地时间作为标准对集群内的ntp server提供时间,因此不会受到影响。
(2)、当“外部ntp源”中的一台或者两台服务不可用时,集群内的ntp server检测到当前选择的参考源服务不可用,会从另外两个上级源以及peer间选择新的参考源,如果三个上级源(外部ntp源)都异常,那么会参考peer的时间或者本地的时间,因此集群内的其他机器不会受到影响。
(3)、如果集群内的一台或者两台ntp server发生时钟跳变或者服务不可用,由于集群内的机器也是使用ntpd作为客户端向ntp server同步时间,因此会重新选择到正常的ntp server。只有在三台ntp server都异常了,才会导致本az的ntp服务不可用,但是依然不会影响另外一个az的ntp服务。如果本az三台ntp server的异常是发生时钟跳变,那么本az的其他机器也仅仅是时钟暂时无法同步,并不会把错误的时钟扩散到本az所有的机器,因此不会影响机器上的其他业务服务。
相应的,本申请实施例提供的如图2所示的一种时钟同步系统可以解决如下问题:
(1)、使用三个“外部ntp源”互为peer并提供服务,防止单点故障的出现;即使三个“外部ntp源”集体宕机,依然有“内部ntp源”提供服务,甚至一个可用区中的“内部ntp源”也能容忍两台服务器宕机,实现服务高可用以及容灾。
(2)、使用三个“外部ntp源”以ntpd协议作为缓冲层,会在“公网ntp源”发生明显跳变时(大于1000s),停止向“公网ntp源”请求同步时间。防止把错误的时间扩散到环境中。
(3)、每个az使用三个“内部ntp源”(对应架构图中的ntp server)以ntpd协议作为缓冲层,可以在“外部ntp源”都发生异常时间跳变时(大于1000s),停止向“外部ntp源”请求同步时间。防止把异常的时间扩散到环境中。
本申请实施例提供的一种时钟同步系统可以使得多可用区中业务服务器时钟保持一致;防止上游时钟源异常扩散到整个环境中;且服务高可用以及容灾,az间的故障隔离,“外部ntp源”的故障隔离。
图4为本申请实施例提供的一种时钟同步装置结构示意图。
如图4所示的时钟同步装置应用于时钟同步系统中的目标机器,时钟同步系统由位于可用区的至少一个业务服务器和作为业务服务器上游的至少一个第一机器、位于可用区外且作为第一机器上游的至少一个第二机器和作为第二机器上游的至少一个第三机器构成,第三机器为公网ntp源,目标机器为业务服务器、第一机器,或者第二机器。
如图4所示,该时钟同步装置包括:
最佳参考机器确定单元401,用于从与目标机器相关的参考机器集中确定目标机器的最佳参考机器,参考机器集由作为目标机器上游的机器和目标机器的对等机器构成,除业务服务器以外属于同种机器的任意两个机器互为对等机器;
标准时间获取单元402,用于获取当前最佳参考机器的标准时间;
时钟同步单元403,用于在基于标准时间和当前目标机器的本地时间确定最佳参考机器的时钟未发生跳变的情况下,调整当前目标机器的本地时间向标准时间靠拢。
进一步的,本申请实施例提供的一种时钟同步装置还包括:拒绝时钟同步单元,用于在基于标准时间和当前目标机器的本地时间确定最佳参考机器的时钟发生跳变的情况下,拒绝当前目标机器的本地时间向标准时间同步。
进一步的,本申请实施例提供的一种时钟同步装置还包括处理单元,用于停止目标机器的时钟同步并发出报警信息,报警信息表征作为目标机器上游的所有机器出现异常。
本申请实施例中,优选的,时钟同步单元包括:
时间差确定单元,用于确定标准时间和当前目标机器的本地时间之间的时间差;
判断单元,用于判断时间差是否超过预先设置的时间差阈值;
调整单元,用于如果时间差未超过时间差阈值,确定最佳参考机器的时钟未发生跳变,调整当前目标机器的本地时间向标准时间靠拢。
本申请实施例中,优选的,最佳参考机器确定单元包括:
参考机器集确定单元,用于确定与目标机器相关的参考机器集;
目标参见机器集确定单元,用于将参考机器集中异常机器删除得到目标参考机器集,异常机器包括与目标机器之间网络不互通的机器、宕机的机器,或当前本地时间与参考机器集中其他机器的当前本地时间之间的时间差异满足预设差异条件的机器;
最佳参考机器确定子单元,用于从目标参考机器集中确定目标机器的最佳参考机器。
本申请实施例中,优选的,参考机器集预先设置在目标机器本地且参考机器集还指示参考机器集中各个机器之间的优先级,相应的,最佳参考机器确定子单元,具体用于按照参考机器集中各个机器之间的优先级,将目标参考机器集中优先级最高的机器确定为目标机器的最佳参考机器。
如图5所示,为本申请实施例提供的计算机设备的一种实现方式的结构图,该计算机设备包括:
存储器501,用于存储程序;
处理器502,用于执行程序,程序具体用于:
从与目标机器相关的参考机器集中确定目标机器的最佳参考机器,参考机器集由作为目标机器上游的机器和目标机器的对等机器构成,除业务服务器以外属于同种机器的任意两个机器互为对等机器;
获取当前最佳参考机器的标准时间;
在基于标准时间和当前目标机器的本地时间确定最佳参考机器的时钟未发生跳变的情况下,调整当前目标机器的本地时间向标准时间靠拢。
处理器502可能是一个中央处理器CPU,或者是特定集成电路ASIC(ApplicationSpecific Integrated Circuit)。
控制设备还可以包括通信接口503以及通信总线504,其中,存储器501、处理器502以及通信接口503通过通信总线504完成相互间的通信。
本申请实施例还提供了一种可读存储介质,其上存储有计算机程序,计算机程序被处理器加载并执行,实现上述的时钟同步方法的各步骤,具体实现过程可以参照上述实施例相应部分的描述,本实施例不做赘述。
本申请还提出了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述时钟同步方法方面或时钟同步装置方面的各种可选实现方式中所提供方法,具体实现过程可以参照上述相应实施例的描述,不做赘述。
本申请实施例提供的一种时钟同步方法、装置、系统、计算机设备及存储介质,目标机器的时钟同步并非仅能依赖于一个机器,而是可以从与目标机器相关的参考机器集中选取最佳参考机器,这样,即使参考机器集中出现故障机器仍然可以从参考机器集中选取其他机器作为最佳参考机器,提高了ntp服务的稳定性;而且,本申请在确定最佳参考机器后,进一步基于当前最佳参考机器的标准时间和当前目标机器的本地时间对当前最佳参考机器的时钟准确性进行了校验,在确定当前最佳参考机器的时钟未发生跳变的情况下才对目标机器进行的时钟同步,因此,可以有效减少因标准时间跳变导致的目标机器时钟同步错误的情况;并且,本申请并未直接采用将当前目标机器的本地时间同步成标准时间的方式进行目标机器的时钟同步,而是采用调整当前目标机器的本地时间向标准时间靠拢的方式实现目标机器的时钟同步,这样,进一步减少了在标准时间发生跳变的情况下,标准时间的在时钟同步系统的扩散,提高了ntp服务的稳定性。
以上对本发明所提供的一种时钟同步方法、装置、系统、计算机设备及存储介质进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。
需要说明的是,本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备所固有的要素,或者是还包括为这些过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (10)

1.一种时钟同步方法,其特征在于,应用于时钟同步系统中的目标机器,所述时钟同步系统由位于可用区的至少一个业务服务器和作为所述业务服务器上游的至少一个第一机器、位于所述可用区外且作为所述第一机器上游的至少一个第二机器和作为所述第二机器上游的至少一个第三机器构成,所述第三机器为公网ntp源,所述目标机器为所述业务服务器、所述第一机器,或者所述第二机器,该方法包括:
从与所述目标机器相关的参考机器集中确定所述目标机器的最佳参考机器,所述参考机器集由作为所述目标机器上游的机器和所述目标机器的对等机器构成,除所述业务服务器以外属于同种机器的任意两个机器互为对等机器;
获取当前所述最佳参考机器的标准时间;
在基于所述标准时间和当前所述目标机器的本地时间确定所述最佳参考机器的时钟未发生跳变的情况下,调整当前所述目标机器的本地时间向所述标准时间靠拢。
2.根据权利要求1所述的方法,其特征在于,在基于所述标准时间和当前所述目标机器的本地时间确定所述最佳参考机器的时钟发生跳变的情况下,该方法还包括:
拒绝当前所述目标机器的本地时间向所述标准时间同步。
3.根据权利要求2所述的方法,其特征在于,还包括:
停止所述目标机器的时钟同步并发出报警信息,所述报警信息表征作为所述目标机器上游的所有机器出现异常。
4.根据权利要求1所述的方法,其特征在于,所述在基于所述标准时间和当前所述目标机器的本地时间确定所述最佳参考机器的时钟未发生跳变的情况下,调整当前所述目标机器的本地时间向所述标准时间靠拢,包括:
确定所述标准时间和当前所述目标机器的本地时间之间的时间差;
判断所述时间差是否超过预先设置的时间差阈值;
如果所述时间差未超过所述时间差阈值,确定所述最佳参考机器的时钟未发生跳变,调整当前所述目标机器的本地时间向所述标准时间靠拢。
5.根据权利要求1所述的方法,其特征在于,所述从与所述目标机器相关的参考机器集中确定所述目标机器的最佳参考机器,包括:
确定与所述目标机器相关的参考机器集;
将所述参考机器集中异常机器删除得到目标参考机器集,所述异常机器包括与所述目标机器之间网络不互通的机器、宕机的机器,或当前本地时间与所述参考机器集中其他机器的当前本地时间之间的时间差异满足预设差异条件的机器;
从所述目标参考机器集中确定所述目标机器的最佳参考机器。
6.根据权利要求5所述的方法,其特征在于,所述参考机器集预先设置在所述目标机器本地且所述参考机器集还指示所述参考机器集中各个机器之间的优先级,所述从所述目标参考机器集中确定所述目标机器的最佳参考机器,包括:
按照所述参考机器集中各个机器之间的优先级,将所述目标参考机器集中优先级最高的机器确定为所述目标机器的最佳参考机器。
7.一种时钟同步装置,其特征在于,应用于时钟同步系统中的目标机器,所述时钟同步系统由位于可用区的至少一个业务服务器和作为所述业务服务器上游的至少一个第一机器、位于所述可用区外且作为所述第一机器上游的至少一个第二机器和作为所述第二机器上游的至少一个第三机器构成,所述第三机器为公网ntp源,所述目标机器为所述业务服务器、所述第一机器,或者所述第二机器,该装置包括:
最佳参考机器确定单元,用于从与所述目标机器相关的参考机器集中确定所述目标机器的最佳参考机器,所述参考机器集由作为所述目标机器上游的机器和所述目标机器的对等机器构成,除所述业务服务器以外属于同种机器的任意两个机器互为对等机器;
标准时间获取单元,用于获取当前所述最佳参考机器的标准时间;
时钟同步单元,用于在基于所述标准时间和当前所述目标机器的本地时间确定所述最佳参考机器的时钟未发生跳变的情况下,调整当前所述目标机器的本地时间向所述标准时间靠拢。
8.一种时钟同步系统,其特征在于,包括:
位于可用区的至少一个业务服务器和作为所述业务服务器上游的至少一个第一机器;
位于所述可用区外且作为所述第一机器上游的至少一个第二机器和作为所述第二机器上游的至少一个第三机器,所述第三机器为公网ntp源;
目标机器用于从与所述目标机器相关的参考机器集中确定所述目标机器的最佳参考机器,所述参考机器集由作为所述目标机器上游的机器和所述目标机器的对等机器构成,除所述业务服务器以外属于同种机器的任意两个机器互为对等机器;获取当前所述最佳参考机器的标准时间;以及,在基于所述标准时间和当前所述目标机器的本地时间确定所述最佳参考机器的时钟未发生跳变的情况下,调整当前所述目标机器的本地时间向所述标准时间靠拢;
所述目标机器为所述业务服务器、所述第一机器,或者所述第二机器。
9.一种计算机设备,其特征在于,包括:处理器以及存储器,所述处理器以及存储器通过通信总线相连;其中,所述处理器,用于调用并执行所述存储器中存储的程序;所述存储器,用于存储程序,所述程序用于实现如权利要求1-6任意一项所述的时钟同步方法。
10.一种计算机可读存储介质,其特征在于,其上存储有计算机程序,所述计算机程序被处理器加载并执行,实现如权利要求1-6任意一项所述的时钟同步方法的各步骤。
CN202110025047.3A 2021-01-08 2021-01-08 一种时钟同步方法、装置、系统、计算机设备及存储介质 Active CN114765635B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110025047.3A CN114765635B (zh) 2021-01-08 2021-01-08 一种时钟同步方法、装置、系统、计算机设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110025047.3A CN114765635B (zh) 2021-01-08 2021-01-08 一种时钟同步方法、装置、系统、计算机设备及存储介质

Publications (2)

Publication Number Publication Date
CN114765635A true CN114765635A (zh) 2022-07-19
CN114765635B CN114765635B (zh) 2024-02-20

Family

ID=82363186

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110025047.3A Active CN114765635B (zh) 2021-01-08 2021-01-08 一种时钟同步方法、装置、系统、计算机设备及存储介质

Country Status (1)

Country Link
CN (1) CN114765635B (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102237941A (zh) * 2010-04-28 2011-11-09 中兴通讯股份有限公司 时间同步系统及方法
CN103428081A (zh) * 2012-05-14 2013-12-04 中兴通讯股份有限公司 一种分组网络同步方法、装置及系统
CN104717030A (zh) * 2013-12-17 2015-06-17 中国移动通信集团公司 时间同步方法及相应设备、系统
CN107395307A (zh) * 2017-07-12 2017-11-24 瑞斯康达科技发展股份有限公司 一种时钟同步方法和设备

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102237941A (zh) * 2010-04-28 2011-11-09 中兴通讯股份有限公司 时间同步系统及方法
CN103428081A (zh) * 2012-05-14 2013-12-04 中兴通讯股份有限公司 一种分组网络同步方法、装置及系统
CN104717030A (zh) * 2013-12-17 2015-06-17 中国移动通信集团公司 时间同步方法及相应设备、系统
CN107395307A (zh) * 2017-07-12 2017-11-24 瑞斯康达科技发展股份有限公司 一种时钟同步方法和设备

Also Published As

Publication number Publication date
CN114765635B (zh) 2024-02-20

Similar Documents

Publication Publication Date Title
US8169856B2 (en) Time synchronization in cluster systems
EP2341411B1 (en) Time synchronization method and system for multicore system
US8719386B2 (en) System and method for providing configuration synchronicity
US20190238414A1 (en) Online capacity-expanding and online capacity-reducing methods and apparatuses for distributed consensus system
US20080288812A1 (en) Cluster system and an error recovery method thereof
CN109921942B (zh) 云平台切换控制方法、装置、系统及电子设备
CN111597536A (zh) 一种hadoop集群kerberos高可用认证方法
US20200142759A1 (en) Rest gateway for messaging
CN110442591B (zh) 一种联盟链的全局时钟系统及方法
CN108199912B (zh) 一种异地多活的分布式消息的管理、消费方法及装置
CN107547160B (zh) 一种时间同步方法及装置
CN114765635A (zh) 一种时钟同步方法、装置、系统、计算机设备及存储介质
CN113014640A (zh) 请求处理方法、装置、电子设备及存储介质
CN109344202B (zh) 一种数据同步方法及管理节点
CN109088937B (zh) 一种基于统一管理的集群授权方法及装置
CN116996376A (zh) 对固网终端更新配置的方法、装置、设备及其存储介质
CN112822283B (zh) 边缘节点的控制方法、装置、控制节点及存储介质
CN114301763A (zh) 分布式集群故障的处理方法及系统、电子设备及存储介质
JP2009008444A (ja) 時刻管理サーバ、時刻管理プログラム、および時刻管理方法
Li et al. A high-accuracy clock synchronization method in distributed real-time system
CN110266790B (zh) 边缘集群管理方法、装置、边缘集群及可读存储介质
US20200053573A1 (en) Priority and locking mechanism for network modules
WO2020037607A1 (zh) 一种传输数据的方法和装置
US11956287B2 (en) Method and system for automated switchover timers tuning on network systems or next generation emergency systems
TWI838136B (zh) 用於存取和移動性管理之容錯系統、方法及其電腦可讀媒介

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant