CN115632706A - 一种fc链路管理方法、装置、设备及可读存储介质 - Google Patents

一种fc链路管理方法、装置、设备及可读存储介质 Download PDF

Info

Publication number
CN115632706A
CN115632706A CN202211524084.XA CN202211524084A CN115632706A CN 115632706 A CN115632706 A CN 115632706A CN 202211524084 A CN202211524084 A CN 202211524084A CN 115632706 A CN115632706 A CN 115632706A
Authority
CN
China
Prior art keywords
link
storage
management
equipment
server
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202211524084.XA
Other languages
English (en)
Other versions
CN115632706B (zh
Inventor
胡玉鹏
亓开元
苏志远
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suzhou Inspur Intelligent Technology Co Ltd
Original Assignee
Suzhou Inspur Intelligent Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suzhou Inspur Intelligent Technology Co Ltd filed Critical Suzhou Inspur Intelligent Technology Co Ltd
Priority to CN202211524084.XA priority Critical patent/CN115632706B/zh
Publication of CN115632706A publication Critical patent/CN115632706A/zh
Application granted granted Critical
Publication of CN115632706B publication Critical patent/CN115632706B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B10/00Transmission systems employing electromagnetic waves other than radio-waves, e.g. infrared, visible or ultraviolet light, or employing corpuscular radiation, e.g. quantum communication
    • H04B10/07Arrangements for monitoring or testing transmission systems; Arrangements for fault measurement of transmission systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04QSELECTING
    • H04Q11/00Selecting arrangements for multiplex systems
    • H04Q11/0001Selecting arrangements for multiplex systems using optical switching
    • H04Q11/0062Network aspects
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04QSELECTING
    • H04Q11/00Selecting arrangements for multiplex systems
    • H04Q11/0001Selecting arrangements for multiplex systems using optical switching
    • H04Q11/0062Network aspects
    • H04Q2011/0079Operation or maintenance aspects
    • H04Q2011/0083Testing; Monitoring

Abstract

本发明公开了一种FC链路管理方法、装置、设备及可读存储介质,属于云平台领域,用于提升云平台可用性。本申请首先可以通过IP链路在云平台的存储设备中划分测试用存储空间,然后将该测试用存储空间通过FC链路挂载至自身所在服务器,在这种情况下,便可以尝试通过FC链路向测试用存储空间中写入数据,通过是否写入成功的判断结果便可以分析服务器与存储设备之间的FC链路正常与否,以较高的自动化程度,高效地完成了对于服务器与存储设备之间FC链路的监测,有利于提升云平台的可用性以及用户体验。

Description

一种FC链路管理方法、装置、设备及可读存储介质
技术领域
本发明涉及云平台领域,特别是涉及一种FC链路管理方法,本发明还涉及一种FC链路管理装置、设备及计算机可读存储介质。
背景技术
现在各行各业都在落地云计算平台(简称云平台),并将业务迁移到云平台上来提供服务,云平台上的业务越来越多,由于业务的重要性,客户提出了承载业务的云主机必须具备高可用的能力,即当业务云主机所在的服务器出现故障后,能够快速切换到正常的服务器上运行,在实际应用中,服务器可以通过HBA(Host bus adapter,主机总线适配器)卡与存储设备建立FC(Fibre Channel,光纤通道)链路,服务器可以通过FC连续将数据下发至存储设备进行存储,然而现有技术中心缺少一种成熟的FC链路管理方法,导致难以及时发现云平台中FC链路的异常,从而降低了云平台的可用性,影响了用户体验。
因此,如何提供一种服务器与存储设备之间FC链路健康状况的监测方案,是本领域技术人员目前需要解决的问题。
发明内容
本发明的目的是提供一种FC链路管理方法,以较高的自动化程度,高效地完成了对于服务器与存储设备之间FC链路的监测,有利于提升云平台的可用性以及用户体验;本发明的另一目的是提供一种FC链路管理装置、设备及计算机可读存储介质,以较高的自动化程度,高效地完成了对于服务器与存储设备之间FC链路的监测,有利于提升云平台的可用性以及用户体验。
为解决上述技术问题,本发明提供了一种FC链路管理方法,应用于云平台中的服务器,包括:
通过IP链路在云平台的存储设备中划分测试用存储空间;
通过所述IP链路控制所述存储设备通过光纤通道FC链路挂载至自身所在服务器;
判断是否能够成功通过所述FC链路向所述测试用存储空间中写入数据;
若能,则判定所述服务器与所述存储设备之间的所述FC链路正常;
若不能,则判定所述服务器与所述存储设备之间的所述FC链路异常。
优选地,所述判断是否能够成功通过所述FC链路向所述测试用存储空间中写入数据具体为:
每隔预设周期判断是否能够通过所述FC链路将数据写入所述测试用存储空间;
若能,则更新写入时间;
判断所述写入时间是否落后于实时时间超过N个所述预设周期;
若超过,则判定无法成功通过所述FC链路向所述测试用存储空间中写入数据;
其中,N为大于1的正整数。
优选地,所述通过IP链路在云平台的存储设备中划分测试用存储空间具体为:
获取预存的云平台的存储设备的连接信息;
根据所述连接信息,通过自身所在服务器上的存储管理网卡连接所述存储设备,以便建立IP链路;
通过所述IP链路在所述存储设备中划分测试用存储空间。
优选地,所述判断是否能够成功通过所述FC链路向所述测试用存储空间中写入数据之后,该FC链路管理方法还包括:
将所述FC链路的判断结果发送至管理设备,以便所述管理设备根据所有所述服务器对于自身FC链路的判断结果评估所述存储设备是否存在故障,并在存在时控制提示器提示所述存储设备需检修。
优选地,所述管理设备根据所有所述服务器对于自身FC链路的判断结果评估所述存储设备是否存在故障具体为:
根据所有的所述判断结果判断异常的所述FC链路的数量与所述判断结果总数的比值是否大于预设阈值;
若大于,则判定所述存储设备存在故障;
若不大于,则判定所述存储设备不存在故障。
优选地,所述管理设备为预先被指定的所有所述服务器中的主节点。
优选地,所述通过所述IP链路控制所述存储设备通过FC链路挂载至自身所在服务器之后,该FC链路管理方法还包括:
将自身的程序ID、自身所在服务器ID、所述测试用存储空间的ID以及所述测试用存储空间在自身所在服务器的挂载点路径打包发送至所述管理设备,以便所述管理设备汇总管理云平台中所有所述服务器的FC链路结构。
优选地,所述将所述FC链路的判断结果发送至管理设备之后,该FC链路管理方法还包括:
响应于所述管理设备下发的重启指令进行重启;
在所述管理设备的控制下在自身对应的所述测试用存储空间的原挂载点路径上,重新挂载所述测试用存储空间;
执行所述判断是否能够成功通过所述FC链路向所述测试用存储空间中写入数据的步骤。
优选地,该FC链路管理方法还包括:
响应于所述管理设备下发的关机指令进行关机,以便所述管理设备将自身所在服务器上的业务云主机迁移至其他服务器。
优选地,该FC链路管理方法还包括:
在受控于所述管理设备进行重启时,更新自身的重启次数;
将更新后的所述重启次数发送至所述管理设备,以便所述管理设备根据所述重启次数判断是否控制对应的服务器关机。
优选地,该FC链路管理方法还包括:
在所述写入时间更新后,将更新后的写入时间发送至管理设备,以便所述管理设备管理所有所述服务器的FC链路状态。
优选地,所述每隔预设周期判断是否能够通过所述FC链路将数据写入所述测试用存储空间之后,该FC链路管理方法还包括:
若能,则将所述测试用存储空间中的数据清空。
为解决上述技术问题,本发明还提供了一种FC链路管理装置,应用于云平台中的服务器,包括:
划分模块,用于通过IP链路在云平台的存储设备中划分测试用存储空间;
挂载模块,用于通过所述IP链路控制所述存储设备通过FC链路挂载至自身所在服务器;
判断模块,用于判断是否能够成功通过所述FC链路向所述测试用存储空间中写入数据,若能,则触发第一判定模块,若不能,则触发第二判定模块;
所述第一判定模块,用于判定所述服务器与所述存储设备之间的所述FC链路正常;
所述第二判定模块,用于判定所述服务器与所述存储设备之间的所述FC链路异常。
为解决上述技术问题,本发明还提供了一种FC链路管理设备,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现如上所述FC链路管理方法的步骤。
为解决上述技术问题,本发明还提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如上所述FC链路管理方法的步骤。
本发明提供了一种FC链路管理方法,本申请首先可以通过IP链路在云平台的存储设备中划分测试用存储空间,然后将该测试用存储空间通过FC链路挂载至自身所在服务器,在这种情况下,便可以尝试通过FC链路向测试用存储空间中写入数据,通过是否写入成功的判断结果便可以分析服务器与存储设备之间的FC链路正常与否,以较高的自动化程度,高效地完成了对于服务器与存储设备之间FC链路的监测,有利于提升云平台的可用性以及用户体验。
本发明还提供了一种FC链路管理装置、设备及计算机可读存储介质,具有如上FC链路管理方法相同的有益效果。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对现有技术和实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明提供的一种FC链路管理方法的流程示意图;
图2为本发明提供的一种云平台的结构示意图;
图3为本发明提供的一种FC链路管理装置的结构示意图;
图4为本发明提供的一种FC链路管理设备的结构示意图。
具体实施方式
本发明的核心是提供一种FC链路管理方法,以较高的自动化程度,高效地完成了对于服务器与存储设备之间FC链路的监测,有利于提升云平台的可用性以及用户体验;本发明的另一核心是提供一种FC链路管理装置、设备及计算机可读存储介质,以较高的自动化程度,高效地完成了对于服务器与存储设备之间FC链路的监测,有利于提升云平台的可用性以及用户体验。
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参考图1,图1为本发明提供的一种FC链路管理方法的流程示意图,该FC链路管理方法包括:
S101:通过IP链路在云平台的存储设备中划分测试用存储空间;
具体的,考虑到如上背景技术中的技术问题,又结合考虑到若不断尝试通过FC链路向存储设备写入数据,通过是否成功写入的结果便可以评估服务器与存储设备之间的FC链路是否正常,因此本发明实施例欲周期性的通过FC链路向存储设备写入数据并判断是否写入成功,基于此,考虑到为了减小该写入动作对存储设备的影响,本发明实施例中欲在存储设备中开辟专用的测试用存储空间用于写入数据,又考虑到服务器与存储设备之间,服务器可以通过IP链路实现对于存储设备的控制,因此为了提高自动化程度,本发明实施例中可以通过IP链路在云平台的存储设备中划分测试用存储空间。
其中,测试用存储空间的具体位置以及容量可以根据实际情况自主设定,本发明实施例在此不做限定。
S102:通过IP链路控制存储设备通过光纤通道FC链路挂载至自身所在服务器;
具体的,若欲通过FC链路向存储设备写入数据,那么首先需要保证服务器与存储设备之间的FC链路的存在,为了进一步提高自动化程度,本发明实施例中可以通过IP链路控制存储设备通过光纤通道FC链路挂载至自身所在服务器,具体的,可以控制存储设备通过HBA卡挂载至自身所在服务器,从而在服务器与存储设备之间形成了FC链路。
S103:判断是否能够成功通过FC链路向测试用存储空间中写入数据,若能,则触发S104,若不能,则触发S105;
具体的,在有了FC链路,且存储设备中有了测试用存储空间后,便可以尝试向测试用存储空间中写入数据,并判断是否能够成功写入,通过不同的判断结果可以触发后续步骤中不同的判定结果。
S104:判定服务器与存储设备之间的FC链路正常;
具体的,如果能够成功写入,代表FC链路基本是正常的,因此可以判定服务器与存储设备之间的FC链路正常。
S105:判定服务器与存储设备之间的FC链路异常。
具体的,在无法成功写入时,表示FC链路可能存在问题,因此可以判定服务器与存储设备之间的FC链路异常。
本发明提供了一种FC链路管理方法,本申请首先可以通过IP链路在云平台的存储设备中划分测试用存储空间,然后将该测试用存储空间通过FC链路挂载至自身所在服务器,在这种情况下,便可以尝试通过FC链路向测试用存储空间中写入数据,通过是否写入成功的判断结果便可以分析服务器与存储设备之间的FC链路正常与否,以较高的自动化程度,高效地完成了对于服务器与存储设备之间FC链路的监测,有利于提升云平台的可用性以及用户体验。
在上述实施例的基础上:
作为一种优选的实施例,判断是否能够成功通过FC链路向测试用存储空间中写入数据具体为:
每隔预设周期判断是否能够通过FC链路将数据写入测试用存储空间;
若能,则更新写入时间;
判断写入时间是否落后于实时时间超过N个预设周期;
若超过,则判定无法成功通过FC链路向测试用存储空间中写入数据;
其中,N为大于1的正整数。
具体的,考虑到无法成功向测试用存储空间写入数据的原因有很多,因此单次或者少量的写入失败其实不足以判定FC链路异常,因此为了提高判断结果的可靠性,本发明实施例中可以每隔预设周期判断是否能够通过FC链路将数据写入测试用存储空间,如果能的话则更新写入时间,而不能的话则不更新写入时间,并且通过判断写入时间是否落后于实时时间超过N个预设周期,便可以得到写入时间未更新的周期数,也即连续未成功写入数据的周期数,一旦这个连续未成功写入数据的周期数超过预设阈值,便代表已经连续多次写入失败,此时FC链路大概率已经无法正常使用,因此可以判定无法成功通过FC链路向测试用存储空间中写入数据。
其中,N的数值可以进行自主设定,例如可以为10等,本发明实施例在此不做限定。
为了更好地对本发明实施例进行说明,请参考图2,图2为本发明提供的一种云平台的结构示意图。作为一种优选的实施例,通过IP链路在云平台的存储设备中划分测试用存储空间具体为:
获取预存的云平台的存储设备的连接信息;
根据连接信息,通过自身所在服务器上的存储管理网卡连接存储设备,以便建立IP链路;
通过IP链路在存储设备中划分测试用存储空间。
具体的,考虑到服务器与存储设备之间可能本身不存在IP链路,因此为了成功实施本申请,并提高自动化程度,服务器可以获取预存的云平台的存储设备的连接信息,然后根据连接信息,通过自身所在服务器上的存储管理网卡连接存储设备,以便建立IP链路,之后便可以通过IP链路在存储设备中划分测试用存储空间,进一步提升了自动化程度,降低了人力成本。
其中,存储设备的连接信息可以为多种类型,例如可以包括存储管理IP(网络地址)配置、登录账号、密码等配置信息,本发明实施例在此不做限定。
其中,测试用存储空间具体可以为Lun空间,容量不需要很大,每次尝试可以写入较小的数据。
作为一种优选的实施例,判断是否能够成功通过FC链路向测试用存储空间中写入数据之后,该FC链路管理方法还包括:
将FC链路的判断结果发送至管理设备,以便管理设备根据所有服务器对于自身FC链路的判断结果评估存储设备是否存在故障,并在存在时控制提示器提示存储设备需检修。
具体的,考虑到单个FC链路的正常与否并不能看出存储设备是否存在故障,而所有FC链路的状态却可以反映出存储设备是否正常,因此为了整体评估从而确定出存储设备的状态,本发明实施例中的服务器可以将FC链路的判断结果发送至管理设备,以便管理设备根据所有服务器对于自身FC链路的判断结果评估存储设备是否存在故障,并在存在时控制提示器提示存储设备需检修。
其中,可以通过图2中基于管理网卡建立的管理网向管理设备发送判断结果,Admin1可以为服务器中的管理节点,也即可以作为管理设备,而Node1以及Node2可以为其他的服务器节点,可以认为本申请的方法是基于服务器中的FC检测代理这部分程序实现的,存储设备中的Admin1-1G空间则对应于Admin1节点的测试用存储空间,Node1-1G以及Node2-1G则分别对应于Node1以及Node2的测试用存储空间。
当然,除了1GB大小外,测试用存储空间的容量还可以为其他具体情况,本发明实施例在此不做限定。
作为一种优选的实施例,管理设备根据所有服务器对于自身FC链路的判断结果评估存储设备是否存在故障具体为:
根据所有的判断结果判断异常的FC链路的数量与判断结果总数的比值是否大于预设阈值;
若大于,则判定存储设备存在故障;
若不大于,则判定存储设备不存在故障。
具体的,考虑到若存储设备存在故障,那么将会导致较大比例的FC链路异常,因此本发明预先设置了异常FC链路与所有FC链路总数比值的阈值,管理设备可以根据所有的判断结果判断异常的FC链路的数量与判断结果总数的比值是否大于预设阈值来判断存储设备是否存在故障,在大于预设阈值的时候可以判定存储设备存在故障,而在不大于预设阈值的时候可以判定存储设备不存在故障。
其中,预设阈值可以进行自主设定,例如可以设置为二分之一等,本发明实施例在此不做限定。
作为一种优选的实施例,管理设备为预先被指定的所有服务器中的主节点。
具体的,将服务器中指定的主节点作为管理设备可以充分利用云平台的现有资源,从而节省成本。
当然,除了预先被指定的所有服务器中的主节点外,管理设备还可以为其他类型,本发明实施例在此不做限定。
作为一种优选的实施例,通过IP链路控制存储设备通过FC链路挂载至自身所在服务器之后,该FC链路管理方法还包括:
将自身的程序ID、自身所在服务器ID、测试用存储空间的ID以及测试用存储空间在自身所在服务器的挂载点路径打包发送至管理设备,以便管理设备汇总管理云平台中所有服务器的FC链路结构。
具体的,为了能使得管理设备中汇总得到管理云平台中所有服务器的FC链路结构(包含各FC链路所对应服务器的相关信息),因此本发明实施例中可以将自身的程序ID、自身所在服务器ID、测试用存储空间的ID以及测试用存储空间在自身所在服务器的挂载点路径打包发送至管理设备。
其中,自身的程序ID可以为各个服务器中的FC检测代理的ID,自身所在服务器ID可以为各个服务器的ID,例如在管理设备接收到某个判断结果后,根据其中的程序ID或服务器ID便可以确定出该判断结果的归属服务器,通过测试用存储空间的ID以及测试用存储空间在自身所在服务器的挂载点路径也可以在存储设备中确定出该服务器的测试用存储空间,还可以得知该服务器的测试用存储空间在服务器上的挂载点路径,便于管理设备对FC链路监测相关事宜进行统筹管理。
作为一种优选的实施例,将FC链路的判断结果发送至管理设备之后,该FC链路管理方法还包括:
响应于管理设备下发的重启指令进行重启;
在管理设备的控制下在自身对应的测试用存储空间的原挂载点路径上,重新挂载测试用存储空间;
执行判断是否能够成功通过FC链路向测试用存储空间中写入数据的步骤。
具体的,考虑到通过重启可能使得FC链路恢复正常,因此管理设备可以在判定存储设备不存在故障后向FC链路异常的服务器下发重启指令,以便修复FC链路,然而由于重启后会导致FC链路丢失,因此服务器还可以在管理设备的控制下在自身对应的测试用存储空间的原挂载点路径上,重新挂载测试用存储空间,然后再继续判断是否能够成功通过FC链路向测试用存储空间中写入数据,自动化地实现了重启控制以及重新建立FC链路的控制。
作为一种优选的实施例,该FC链路管理方法还包括:
响应于管理设备下发的关机指令进行关机,以便管理设备将自身所在服务器上的业务云主机迁移至其他服务器。
具体的,由于管理设备负责向各服务器下发重启指令,因此管理设备可以得知各服务器的重启次数,重启次数过多也可以代表FC链路无法恢复正常,此时便不存在继续重启的必要,因此管理设备可以在接收到服务器的判定FC链路异常的信息时,判断该服务器的重启次数是否超过预设次数,若超过,则可以下发关机指令控制该服务器关机,并将该服务器上的业务云主机迁移至其他服务器,以便保证业务的正常开展,提升了用户体验。
作为一种优选的实施例,该FC链路管理方法还包括:
在受控于管理设备进行重启时,更新自身的重启次数;
将更新后的重启次数发送至管理设备,以便管理设备根据重启次数判断是否控制对应的服务器关机。
具体的,为了减轻管理设备的负担,服务器可以自主更新受控于管理设备进行重启的次数,并将该重启次数发送至管理设备,以便管理设备根据重启次数判断是否控制对应的服务器关机。
作为一种优选的实施例,该FC链路管理方法还包括:
在写入时间更新后,将更新后的写入时间发送至管理设备,以便管理设备管理所有服务器的FC链路状态。
具体的,为了便于管理设备及时获得各服务器的FC链路的状态,本发明实施例中的服务器可以在写入时间更新后,将更新后的写入时间发送至管理设备,以便管理设备管理所有服务器的FC链路状态。
作为一种优选的实施例,每隔预设周期判断是否能够通过FC链路将数据写入测试用存储空间之后,该FC链路管理方法还包括:
若能,则将测试用存储空间中的数据清空。
具体的,为了减小测试用存储空间的容量以节省存储设备的存储资源,本发明实施例中可以在成功向测试用存储空间写入数据后将测试用存储空间中的数据清空,以便后续的写入,如此一来无需太多的空间便可以支持连续写入。
请参考图3,图3为本发明提供的一种FC链路管理装置的结构示意图,该FC链路管理装置应用于云平台中的服务器,包括:
划分模块31,用于通过IP链路在云平台的存储设备中划分测试用存储空间;
挂载模块32,用于通过IP链路控制存储设备通过FC链路挂载至自身所在服务器;
判断模块33,用于判断是否能够成功通过FC链路向测试用存储空间中写入数据,若能,则触发第一判定模块34,若不能,则触发第二判定模块35;
第一判定模块34,用于判定服务器与存储设备之间的FC链路正常;
第二判定模块35,用于判定服务器与存储设备之间的FC链路异常。
本发明提供了一种FC链路管理装置,本申请首先可以通过IP链路在云平台的存储设备中划分测试用存储空间,然后将该测试用存储空间通过FC链路挂载至自身所在服务器,在这种情况下,便可以尝试通过FC链路向测试用存储空间中写入数据,通过是否写入成功的判断结果便可以分析服务器与存储设备之间的FC链路正常与否,以较高的自动化程度,高效地完成了对于服务器与存储设备之间FC链路的监测,有利于提升云平台的可用性以及用户体验。
在上述实施例的基础上:
作为一种优选的实施例,判断模块33包括:
第一动作模块,用于每隔预设周期判断是否能够通过FC链路将数据写入测试用存储空间,若能,则触发第二动作模块;
第二动作模块,用于更新写入时间;
第三动作模块,用于判断写入时间是否落后于实时时间超过N个预设周期,若超过,则触发第四动作模块;
第四动作模块,用于判定无法成功通过FC链路向测试用存储空间中写入数据;
其中,N为大于1的正整数。
作为一种优选的实施例,划分模块31包括:
第一获取模块,用于获取预存的云平台的存储设备的连接信息;
第五动作模块,用于根据连接信息,通过自身所在服务器上的存储管理网卡连接存储设备,以便建立IP链路;
划分子模块,用于通过IP链路在存储设备中划分测试用存储空间。
作为一种优选的实施例,判断是否能够成功通过FC链路向测试用存储空间中写入数据之后,该FC链路管理装置还包括:
第一发送模块,用于将FC链路的判断结果发送至管理设备,以便管理设备根据所有服务器对于自身FC链路的判断结果评估存储设备是否存在故障,并在存在时控制提示器提示存储设备需检修。
作为一种优选的实施例,管理设备根据所有服务器对于自身FC链路的判断结果评估存储设备是否存在故障具体为:
根据所有的判断结果判断异常的FC链路的数量与判断结果总数的比值是否大于预设阈值;若大于,则判定存储设备存在故障;若不大于,则判定存储设备不存在故障。
作为一种优选的实施例,管理设备为预先被指定的所有服务器中的主节点。
作为一种优选的实施例,通过IP链路控制存储设备通过FC链路挂载至自身所在服务器之后,该FC链路管理装置还包括:
第二发送模块,用于将自身的程序ID、自身所在服务器ID、测试用存储空间的ID以及测试用存储空间在自身所在服务器的挂载点路径打包发送至管理设备,以便管理设备汇总管理云平台中所有服务器的FC链路结构。
作为一种优选的实施例,将FC链路的判断结果发送至管理设备之后,该FC链路管理装置还包括:
重启模块,用于响应于管理设备下发的重启指令进行重启;
重挂载模块,用于在管理设备的控制下在自身对应的测试用存储空间的原挂载点路径上,重新挂载测试用存储空间;
触发判断模块33。
作为一种优选的实施例,该FC链路管理装置还包括:
关机模块,用于响应于管理设备下发的关机指令进行关机,以便管理设备将自身所在服务器上的业务云主机迁移至其他服务器。
作为一种优选的实施例,该FC链路管理装置还包括:
第六动作模块,用于在受控于管理设备进行重启时,更新自身的重启次数;
第二发送模块,用于将更新后的重启次数发送至管理设备,以便管理设备根据重启次数判断是否控制对应的服务器关机。
作为一种优选的实施例,该FC链路管理装置还包括:
第三发送模块,用于在写入时间更新后,将更新后的写入时间发送至管理设备,以便管理设备管理所有服务器的FC链路状态。
作为一种优选的实施例,每隔预设周期判断是否能够通过FC链路将数据写入测试用存储空间之后,该FC链路管理装置还包括:
清空模块,用于若能,则将测试用存储空间中的数据清空。
对于本发明实施例提供的FC链路管理装置的介绍请参照前述的FC链路管理方法的实施例,本发明实施例在此不再赘述。
请参考图4,图4为本发明提供的一种FC链路管理设备的结构示意图,该FC链路管理设备应用于云平台中的服务器,包括:
存储器41,用于存储计算机程序;
处理器42,用于执行计算机程序时实现如前述实施例中FC链路管理方法的步骤。
具体的,存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机可读指令,该内存储器为非易失性存储介质中的操作系统和计算机可读指令的运行提供环境。处理器执行存储器中保存的计算机程序时,可以实现以下步骤:通过IP链路在云平台的存储设备中划分测试用存储空间;通过IP链路控制存储设备通过光纤通道FC链路挂载至自身所在服务器;判断是否能够成功通过FC链路向测试用存储空间中写入数据;若能,则判定服务器与存储设备之间的FC链路正常;若不能,则判定服务器与存储设备之间的FC链路异常。
本发明提供了一种FC链路管理设备,本申请首先可以通过IP链路在云平台的存储设备中划分测试用存储空间,然后将该测试用存储空间通过FC链路挂载至自身所在服务器,在这种情况下,便可以尝试通过FC链路向测试用存储空间中写入数据,通过是否写入成功的判断结果便可以分析服务器与存储设备之间的FC链路正常与否,以较高的自动化程度,高效地完成了对于服务器与存储设备之间FC链路的监测,有利于提升云平台的可用性以及用户体验。
在上述实施例的基础上:
作为一种可选的实施例,处理器执行存储器中保存的计算机子程序时,可以实现以下步骤:每隔预设周期判断是否能够通过FC链路将数据写入测试用存储空间;
若能,则更新写入时间;
判断写入时间是否落后于实时时间超过N个预设周期;
若超过,则判定无法成功通过FC链路向测试用存储空间中写入数据;
其中,N为大于1的正整数。
作为一种可选的实施例,处理器执行存储器中保存的计算机子程序时,可以实现以下步骤:获取预存的云平台的存储设备的连接信息;
根据连接信息,通过自身所在服务器上的存储管理网卡连接存储设备,以便建立IP链路;
通过IP链路在存储设备中划分测试用存储空间。
作为一种可选的实施例,处理器执行存储器中保存的计算机子程序时,可以实现以下步骤:将FC链路的判断结果发送至管理设备,以便管理设备根据所有服务器对于自身FC链路的判断结果评估存储设备是否存在故障,并在存在时控制提示器提示存储设备需检修。
作为一种优选的实施例,管理设备为预先被指定的所有服务器中的主节点。
作为一种可选的实施例,处理器执行存储器中保存的计算机子程序时,可以实现以下步骤:将自身的程序ID、自身所在服务器ID、测试用存储空间的ID以及测试用存储空间在自身所在服务器的挂载点路径打包发送至管理设备,以便管理设备汇总管理云平台中所有服务器的FC链路结构。
作为一种可选的实施例,处理器执行存储器中保存的计算机子程序时,可以实现以下步骤:响应于管理设备下发的重启指令进行重启;
在管理设备的控制下在自身对应的测试用存储空间的原挂载点路径上,重新挂载测试用存储空间;
执行判断是否能够成功通过FC链路向测试用存储空间中写入数据的步骤。
作为一种可选的实施例,处理器执行存储器中保存的计算机子程序时,可以实现以下步骤:响应于管理设备下发的关机指令进行关机,以便管理设备将自身所在服务器上的业务云主机迁移至其他服务器。
作为一种可选的实施例,处理器执行存储器中保存的计算机子程序时,可以实现以下步骤:在受控于管理设备进行重启时,更新自身的重启次数;
将更新后的重启次数发送至管理设备,以便管理设备根据重启次数判断是否控制对应的服务器关机。
作为一种可选的实施例,处理器执行存储器中保存的计算机子程序时,可以实现以下步骤:在写入时间更新后,将更新后的写入时间发送至管理设备,以便管理设备管理所有服务器的FC链路状态。
作为一种可选的实施例,处理器执行存储器中保存的计算机子程序时,可以实现以下步骤:若能,则将测试用存储空间中的数据清空。
对于本发明实施例提供的FC链路管理设备的介绍请参照前述的FC链路管理方法的实施例,本发明实施例在此不再赘述。
本发明还提供了一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,计算机程序被处理器执行时实现如前述实施例中FC链路管理方法的步骤。
具体的,该计算机可读存储介质可以包括:U盘、移动硬盘、只读存储器(Read-OnlyMemory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。该存储介质上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:通过IP链路在云平台的存储设备中划分测试用存储空间;通过IP链路控制存储设备通过光纤通道FC链路挂载至自身所在服务器;判断是否能够成功通过FC链路向测试用存储空间中写入数据;若能,则判定服务器与存储设备之间的FC链路正常;若不能,则判定服务器与存储设备之间的FC链路异常。
本发明提供了一种计算机可读存储介质,本申请首先可以通过IP链路在云平台的存储设备中划分测试用存储空间,然后将该测试用存储空间通过FC链路挂载至自身所在服务器,在这种情况下,便可以尝试通过FC链路向测试用存储空间中写入数据,通过是否写入成功的判断结果便可以分析服务器与存储设备之间的FC链路正常与否,以较高的自动化程度,高效地完成了对于服务器与存储设备之间FC链路的监测,有利于提升云平台的可用性以及用户体验。
在上述实施例的基础上:
作为一种可选的实施例,处理器执行存储器中保存的计算机子程序时,可以实现以下步骤:每隔预设周期判断是否能够通过FC链路将数据写入测试用存储空间;
若能,则更新写入时间;
判断写入时间是否落后于实时时间超过N个预设周期;
若超过,则判定无法成功通过FC链路向测试用存储空间中写入数据;
其中,N为大于1的正整数。
作为一种可选的实施例,处理器执行存储器中保存的计算机子程序时,可以实现以下步骤:获取预存的云平台的存储设备的连接信息;
根据连接信息,通过自身所在服务器上的存储管理网卡连接存储设备,以便建立IP链路;
通过IP链路在存储设备中划分测试用存储空间。
作为一种可选的实施例,处理器执行存储器中保存的计算机子程序时,可以实现以下步骤:将FC链路的判断结果发送至管理设备,以便管理设备根据所有服务器对于自身FC链路的判断结果评估存储设备是否存在故障,并在存在时控制提示器提示存储设备需检修。
作为一种优选的实施例,管理设备为预先被指定的所有服务器中的主节点。
作为一种可选的实施例,处理器执行存储器中保存的计算机子程序时,可以实现以下步骤:将自身的程序ID、自身所在服务器ID、测试用存储空间的ID以及测试用存储空间在自身所在服务器的挂载点路径打包发送至管理设备,以便管理设备汇总管理云平台中所有服务器的FC链路结构。
作为一种可选的实施例,处理器执行存储器中保存的计算机子程序时,可以实现以下步骤:响应于管理设备下发的重启指令进行重启;
在管理设备的控制下在自身对应的测试用存储空间的原挂载点路径上,重新挂载测试用存储空间;
执行判断是否能够成功通过FC链路向测试用存储空间中写入数据的步骤。
作为一种可选的实施例,处理器执行存储器中保存的计算机子程序时,可以实现以下步骤:响应于管理设备下发的关机指令进行关机,以便管理设备将自身所在服务器上的业务云主机迁移至其他服务器。
作为一种可选的实施例,处理器执行存储器中保存的计算机子程序时,可以实现以下步骤:在受控于管理设备进行重启时,更新自身的重启次数;
将更新后的重启次数发送至管理设备,以便管理设备根据重启次数判断是否控制对应的服务器关机。
作为一种可选的实施例,处理器执行存储器中保存的计算机子程序时,可以实现以下步骤:在写入时间更新后,将更新后的写入时间发送至管理设备,以便管理设备管理所有服务器的FC链路状态。
作为一种可选的实施例,处理器执行存储器中保存的计算机子程序时,可以实现以下步骤:若能,则将测试用存储空间中的数据清空。
对于本发明实施例提供的计算机可读存储介质的介绍请参照前述的FC链路管理方法的实施例,本发明实施例在此不再赘述。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。还需要说明的是,在本说明书中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者设备中还存在另外的相同要素。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其他实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (15)

1.一种FC链路管理方法,其特征在于,应用于云平台中的服务器,包括:
通过IP链路在云平台的存储设备中划分测试用存储空间;
通过所述IP链路控制所述存储设备通过光纤通道FC链路挂载至自身所在服务器;
判断是否能够成功通过所述FC链路向所述测试用存储空间中写入数据;
若能,则判定所述服务器与所述存储设备之间的所述FC链路正常;
若不能,则判定所述服务器与所述存储设备之间的所述FC链路异常。
2.根据权利要求1所述的FC链路管理方法,其特征在于,所述判断是否能够成功通过所述FC链路向所述测试用存储空间中写入数据具体为:
每隔预设周期判断是否能够通过所述FC链路将数据写入所述测试用存储空间;
若能,则更新写入时间;
判断所述写入时间是否落后于实时时间超过N个所述预设周期;
若超过,则判定无法成功通过所述FC链路向所述测试用存储空间中写入数据;
其中,N为大于1的正整数。
3.根据权利要求2所述的FC链路管理方法,其特征在于,所述通过IP链路在云平台的存储设备中划分测试用存储空间具体为:
获取预存的云平台的存储设备的连接信息;
根据所述连接信息,通过自身所在服务器上的存储管理网卡连接所述存储设备,以便建立IP链路;
通过所述IP链路在所述存储设备中划分测试用存储空间。
4.根据权利要求2所述的FC链路管理方法,其特征在于,所述判断是否能够成功通过所述FC链路向所述测试用存储空间中写入数据之后,该FC链路管理方法还包括:
将所述FC链路的判断结果发送至管理设备,以便所述管理设备根据所有所述服务器对于自身FC链路的判断结果评估所述存储设备是否存在故障,并在存在时控制提示器提示所述存储设备需检修。
5.根据权利要求4所述的FC链路管理方法,其特征在于,所述管理设备根据所有所述服务器对于自身FC链路的判断结果评估所述存储设备是否存在故障具体为:
根据所有的所述判断结果判断异常的所述FC链路的数量与所述判断结果总数的比值是否大于预设阈值;
若大于,则判定所述存储设备存在故障;
若不大于,则判定所述存储设备不存在故障。
6.根据权利要求4所述的FC链路管理方法,其特征在于,所述管理设备为预先被指定的所有所述服务器中的主节点。
7.根据权利要求4所述的FC链路管理方法,其特征在于,所述通过所述IP链路控制所述存储设备通过FC链路挂载至自身所在服务器之后,该FC链路管理方法还包括:
将自身的程序ID、自身所在服务器ID、所述测试用存储空间的ID以及所述测试用存储空间在自身所在服务器的挂载点路径打包发送至所述管理设备,以便所述管理设备汇总管理云平台中所有所述服务器的FC链路结构。
8.根据权利要求7所述的FC链路管理方法,其特征在于,所述将所述FC链路的判断结果发送至管理设备之后,该FC链路管理方法还包括:
响应于所述管理设备下发的重启指令进行重启;
在所述管理设备的控制下在自身对应的所述测试用存储空间的原挂载点路径上,重新挂载所述测试用存储空间;
执行所述判断是否能够成功通过所述FC链路向所述测试用存储空间中写入数据的步骤。
9.根据权利要求8所述的FC链路管理方法,其特征在于,该FC链路管理方法还包括:
响应于所述管理设备下发的关机指令进行关机,以便所述管理设备将自身所在服务器上的业务云主机迁移至其他服务器。
10.根据权利要求9所述的FC链路管理方法,其特征在于,该FC链路管理方法还包括:
在受控于所述管理设备进行重启时,更新自身的重启次数;
将更新后的所述重启次数发送至所述管理设备,以便所述管理设备根据所述重启次数判断是否控制对应的服务器关机。
11.根据权利要求2所述的FC链路管理方法,其特征在于,该FC链路管理方法还包括:
在所述写入时间更新后,将更新后的写入时间发送至管理设备,以便所述管理设备管理所有所述服务器的FC链路状态。
12.根据权利要求2至11任一项所述的FC链路管理方法,其特征在于,所述每隔预设周期判断是否能够通过所述FC链路将数据写入所述测试用存储空间之后,该FC链路管理方法还包括:
若能,则将所述测试用存储空间中的数据清空。
13.一种FC链路管理装置,其特征在于,应用于云平台中的服务器,包括:
划分模块,用于通过IP链路在云平台的存储设备中划分测试用存储空间;
挂载模块,用于通过所述IP链路控制所述存储设备通过FC链路挂载至自身所在服务器;
判断模块,用于判断是否能够成功通过所述FC链路向所述测试用存储空间中写入数据,若能,则触发第一判定模块,若不能,则触发第二判定模块;
所述第一判定模块,用于判定所述服务器与所述存储设备之间的所述FC链路正常;
所述第二判定模块,用于判定所述服务器与所述存储设备之间的所述FC链路异常。
14.一种FC链路管理设备,其特征在于,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现如权利要求1至12任一项所述FC链路管理方法的步骤。
15.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至12任一项所述FC链路管理方法的步骤。
CN202211524084.XA 2022-12-01 2022-12-01 一种fc链路管理方法、装置、设备及可读存储介质 Active CN115632706B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211524084.XA CN115632706B (zh) 2022-12-01 2022-12-01 一种fc链路管理方法、装置、设备及可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211524084.XA CN115632706B (zh) 2022-12-01 2022-12-01 一种fc链路管理方法、装置、设备及可读存储介质

Publications (2)

Publication Number Publication Date
CN115632706A true CN115632706A (zh) 2023-01-20
CN115632706B CN115632706B (zh) 2023-03-14

Family

ID=84911011

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211524084.XA Active CN115632706B (zh) 2022-12-01 2022-12-01 一种fc链路管理方法、装置、设备及可读存储介质

Country Status (1)

Country Link
CN (1) CN115632706B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116909494A (zh) * 2023-09-12 2023-10-20 苏州浪潮智能科技有限公司 服务器的存储切换方法和装置,以及服务器系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020152308A1 (en) * 2001-04-13 2002-10-17 Feather Stan S. Fibre channel deferred setup
CN104363269A (zh) * 2014-10-27 2015-02-18 华为技术有限公司 一种通过fc链路传输、接收nas数据的方法及装置
CN108322393A (zh) * 2017-01-18 2018-07-24 阿里巴巴集团控股有限公司 路由链路管理方法和系统、虚拟路由网关和宿主机网关
US20210160318A1 (en) * 2014-06-04 2021-05-27 Pure Storage, Inc. Scale out storage platform having active failover

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020152308A1 (en) * 2001-04-13 2002-10-17 Feather Stan S. Fibre channel deferred setup
US20210160318A1 (en) * 2014-06-04 2021-05-27 Pure Storage, Inc. Scale out storage platform having active failover
CN104363269A (zh) * 2014-10-27 2015-02-18 华为技术有限公司 一种通过fc链路传输、接收nas数据的方法及装置
CN108322393A (zh) * 2017-01-18 2018-07-24 阿里巴巴集团控股有限公司 路由链路管理方法和系统、虚拟路由网关和宿主机网关

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116909494A (zh) * 2023-09-12 2023-10-20 苏州浪潮智能科技有限公司 服务器的存储切换方法和装置,以及服务器系统
CN116909494B (zh) * 2023-09-12 2024-01-26 苏州浪潮智能科技有限公司 服务器的存储切换方法和装置,以及服务器系统

Also Published As

Publication number Publication date
CN115632706B (zh) 2023-03-14

Similar Documents

Publication Publication Date Title
US11614943B2 (en) Determining problem dependencies in application dependency discovery, reporting, and management tool
US11868237B2 (en) Intelligent services for application dependency discovery, reporting, and management tool
US11379292B2 (en) Baseline modeling for application dependency discovery, reporting, and management tool
US11620211B2 (en) Discovery crawler for application dependency discovery, reporting, and management tool
US11663055B2 (en) Dependency analyzer in application dependency discovery, reporting, and management tool
US11650909B2 (en) Intelligent services and training agent for application dependency discovery, reporting, and management tool
US11675692B2 (en) Testing agent for application dependency discovery, reporting, and management tool
CN107800783B (zh) 远程监控服务器的方法及装置
CN114443332B (zh) 一种存储池的检测方法、装置、电子设备及存储介质
CN115632706B (zh) 一种fc链路管理方法、装置、设备及可读存储介质
CN112783792A (zh) 分布式数据库系统的故障检测方法、装置及电子设备
US7428655B2 (en) Smart card for high-availability clustering
CN108243031B (zh) 一种双机热备的实现方法及装置
EP4242850A2 (en) Determining problem dependencies in application dependency discovery, reporting, and management tool
US20090083747A1 (en) Method for managing application programs by utilizing redundancy and load balance
CN110287066B (zh) 一种服务器分区迁移方法及相关装置
CN115473793B (zh) 一种集群ei主机环境自动恢复方法、装置、终端及介质
CN114168402A (zh) 一种存储域的健康监测方法及装置
CN116112330A (zh) 一种系统维护方法、装置、设备及存储介质
CN115801564A (zh) 服务部署方法、服务部署装置、设备及介质
CN116627764A (zh) 部署方法、装置、计算机设备和存储介质
CN112506689A (zh) 一种异构柜台系统风险监控方法、装置、设备及介质
CN115373943A (zh) 一种新增资源的检查方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant