CN116545523A - 一种光模块的寿命预测方法及计算装置 - Google Patents

一种光模块的寿命预测方法及计算装置 Download PDF

Info

Publication number
CN116545523A
CN116545523A CN202310316915.2A CN202310316915A CN116545523A CN 116545523 A CN116545523 A CN 116545523A CN 202310316915 A CN202310316915 A CN 202310316915A CN 116545523 A CN116545523 A CN 116545523A
Authority
CN
China
Prior art keywords
optical module
tested
difference value
determining
threshold
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310316915.2A
Other languages
English (en)
Inventor
魏炜峰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
XFusion Digital Technologies Co Ltd
Original Assignee
XFusion Digital Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by XFusion Digital Technologies Co Ltd filed Critical XFusion Digital Technologies Co Ltd
Priority to CN202310316915.2A priority Critical patent/CN116545523A/zh
Publication of CN116545523A publication Critical patent/CN116545523A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B10/00Transmission systems employing electromagnetic waves other than radio-waves, e.g. infrared, visible or ultraviolet light, or employing corpuscular radiation, e.g. quantum communication
    • H04B10/07Arrangements for monitoring or testing transmission systems; Arrangements for fault measurement of transmission systems
    • GPHYSICS
    • G08SIGNALLING
    • G08BSIGNALLING OR CALLING SYSTEMS; ORDER TELEGRAPHS; ALARM SYSTEMS
    • G08B21/00Alarms responsive to a single specified undesired or abnormal condition and not otherwise provided for
    • G08B21/18Status alarms
    • G08B21/185Electrical failure alarms
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02EREDUCTION OF GREENHOUSE GAS [GHG] EMISSIONS, RELATED TO ENERGY GENERATION, TRANSMISSION OR DISTRIBUTION
    • Y02E10/00Energy generation through renewable energy sources
    • Y02E10/50Photovoltaic [PV] energy

Landscapes

  • Physics & Mathematics (AREA)
  • Electromagnetism (AREA)
  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Business, Economics & Management (AREA)
  • Emergency Management (AREA)
  • General Physics & Mathematics (AREA)
  • Optical Communication System (AREA)
  • Semiconductor Lasers (AREA)

Abstract

本申请提供一种光模块的寿命预测方法及计算装置,该方法包括:获取待测光模块的当前温度、当前偏置电流和当前发射功率;获取所述当前温度对应的关系函数,确定所述待测光模块在所述当前发射功率下的偏置电流阈值;其中,所述关系函数用于确定偏置电流与发射功率的对应关系;确定所述当前偏置电流与所述偏置电流阈值的第一差值,在所述第一差值满足老化条件时,确定所述待测光模块为老化模块。解决了现有技术中因不能及时知晓光模块的老化程度而导致服务器之间的通信出现中断故障的问题。

Description

一种光模块的寿命预测方法及计算装置
技术领域
本申请涉及计算设备领域,尤其涉及一种光模块的寿命预测方法及计算装置。
背景技术
目前,服务器之间通常采用光纤进行通信,因此服务器中用于光电转换的光模块,对服务器之间的通信起着至关重要的作用。然而,光信号的传输质量会随着光模块硬件的老化积累而产生质变,光模块的严重老化会导致光信号的传输质量严重下降。
现有技术中,服务器会监控光模块的发射功率等运行参数,当运行参数超出设定的阈值时,则判定光模块失效,进而对光模块进行更换。然而,光模块失效意味着光模块的老化程度已经严重到无法正常工作,此时服务器之间的通信往往已经中断。
发明内容
本申请实施例提供一种光模块的寿命预测方法及计算装置,用于解决现有技术中因不能及时知晓光模块的老化程度而导致服务器之间的通信出现中断故障的问题。
第一方面,本申请实施例提供一种光模块的寿命预测方法,包括:获取待测光模块的当前温度、当前偏置电流和当前发射功率;获取所述当前温度对应的关系函数,确定所述待测光模块在所述当前发射功率下的偏置电流阈值;其中,所述关系函数用于确定偏置电流与发射功率的对应关系;确定所述当前偏置电流与所述偏置电流阈值的第一差值,在所述第一差值满足老化条件时,确定所述待测光模块为老化模块。
在一种具体实施方式中,所述关系函数的生成方法包括:至少一次获取服务器中的光模块的温度以及与所述温度对应的工作参数,所述工作参数包括偏置电流和发射功率;确定每个所述光模块的温度所在的温度段,以基于温度段,将多个所述工作参数进行划分处理,以获取每个温度段对应的多个工作参数;针对每个温度段,根据所述温度段对应的多个工作参数,确定所述温度段对应的关系函数。
在一种具体实施方式中,所述至少一次获取服务器中的光模块的温度以及与所述温度对应的工作参数,包括:在服务器的操作系统初次上电后的预设时间内,至少一次获取所述服务器中的光模块的温度以及与所述温度对应的工作参数。
在一种具体实施方式中,在确定每个温度段对应的关系函数之后,所述方法还包括:至少一次获取服务器集群中的至少一个光模块的温度以及与所述温度对应的工作参数;其中,所述服务器集群包括多个服务器,每个服务器中包括至少一个光模块;确定所述光模块的温度所在的温度段,获取所述温度段对应的关系函数,并根据所述温度对应的工作参数,对所述温度段对应的关系函数进行修订处理。
在一种具体实施方式中,所述在所述第一差值满足老化条件时,确定所述待测光模块为老化模块,包括:在所述待测光模块的数量为一个,且所述第一差值大于第一差值阈值时,确定所述待测光模块为老化模块;其中,所述第一差值阈值为所述偏置电流阈值与第一比例阈值相乘所得到的。
在一种具体实施方式中,所述在所述待测光模块的数量为一个,且所述第一差值大于第一差值阈值时,确定所述待测光模块为老化模块,包括:在所述待测光模块的数量为一个,所述第一差值大于第一差值阈值且小于第二差值阈值时,确定所述待测光模块为待监控老化模块;在所述待测光模块的数量为一个,且所述第一差值大于第二差值阈值时,确定所述待测光模块为深度老化模块,进行告警处理;其中,所述第二差值阈值为所述偏置电流阈值与第二比例阈值相乘所得到的。
在一种具体实施方式中,所述在所述第一差值满足老化条件时,确定所述待测光模块为老化模块,包括:在所述待测光模块的数量为多个时,获取每个所述待测光模块的第一差值;获取多个所述第一差值中的最大值,确定所述最大值对应的待测光模块为老化模块。
在一种具体实施方式中,所述在所述第一差值满足老化条件时,确定所述待测光模块为老化模块,包括:在所述待测光模块的数量为多个时,获取每个所述待测光模块的第一差值,并确定多个所述第一差值的平均值,作为多个所述待测光模块的平均差值;针对每个所述待测光模块,获取所述待测光模块的第一差值与所述平均差值的第二差值,并在所述第二差值大于第三差值阈值时,确定所述待测光模块为老化模块;其中,所述第三差值阈值为所述待测光模块的偏置电流阈值与第三比例阈值相乘所得到的。
在一种具体实施方式中,所述在所述第二差值大于第三差值阈值时,确定所述待测光模块为老化模块,包括:在所述第二差值大于第三差值阈值且小于第四差值阈值时,确定所述待测光模块为待监控老化模块;在所述第二差值大于第四差值阈值时,确定所述待测光模块为深度老化模块,进行告警处理;其中,所述第四差值阈值为所述偏置电流阈值与第四比例阈值相乘所得到的。
第二方面,本申请实施例提供一种计算装置,包括:数字监控单元,用于获取待测光模块的当前温度、当前偏置电流和当前发射功率;数据分析单元,用于获取所述当前温度对应的关系函数,确定所述待测光模块在所述当前发射功率下的偏置电流阈值;其中,所述关系函数用于确定偏置电流与发射功率的对应关系;预警上报单元,用于确定所述当前偏置电流与所述偏置电流阈值的第一差值,在所述第一差值满足老化条件时,确定所述待测光模块为老化模块。
在一种具体实施方式中,所述计算装置,还包括:拟合学习单元,用于至少一次获取服务器中的光模块的温度以及与所述温度对应的工作参数,所述工作参数包括偏置电流和发射功率;确定每个所述光模块的温度所在的温度段,以基于温度段,将多个所述工作参数进行划分处理,以获取每个温度段对应的多个工作参数;针对每个温度段,根据所述温度段对应的多个工作参数,确定所述温度段对应的关系函数。
在一种具体实施方式中,所述拟合学习单元,具体用于:在服务器的操作系统初次上电后的预设时间内,至少一次获取所述服务器中的光模块的温度以及与所述温度对应的工作参数。
在一种具体实施方式中,所述拟合学习单元,还用于:在确定每个温度段对应的关系函数之后,至少一次获取服务器集群中的至少一个光模块的温度以及与所述温度对应的工作参数;其中,所述服务器集群包括多个服务器,每个服务器中包括至少一个光模块;确定所述光模块的温度所在的温度段,获取所述温度段对应的关系函数,并根据所述温度对应的工作参数,对所述温度段对应的关系函数进行修订处理。
在一种具体实施方式中,所述预警上报单元,具体用于:在所述待测光模块的数量为一个,且所述第一差值大于第一差值阈值时,确定所述待测光模块为老化模块;其中,所述第一差值阈值为所述偏置电流阈值与第一比例阈值相乘所得到的。
在一种具体实施方式中,所述预警上报单元,具体用于:在所述待测光模块的数量为一个,所述第一差值大于第一差值阈值且小于第二差值阈值时,确定所述待测光模块为待监控老化模块;在所述待测光模块的数量为一个,且所述第一差值大于第二差值阈值时,确定所述待测光模块为深度老化模块,进行告警处理;其中,所述第二差值阈值为所述偏置电流阈值与第二比例阈值相乘所得到的。
在一种具体实施方式中,所述预警上报单元,具体用于:在所述待测光模块的数量为多个时,获取每个所述待测光模块的第一差值;获取多个所述第一差值中的最大值,确定所述最大值对应的待测光模块为老化模块。
在一种具体实施方式中,所述预警上报单元,具体用于:在所述待测光模块的数量为多个时,获取每个所述待测光模块的第一差值,并确定多个所述第一差值的平均值,作为多个所述待测光模块的平均差值;针对每个所述待测光模块,获取所述待测光模块的第一差值与所述平均差值的第二差值,并在所述第二差值大于第三差值阈值时,确定所述待测光模块为老化模块;其中,所述第三差值阈值为所述待测光模块的偏置电流阈值与第三比例阈值相乘所得到的。
在一种具体实施方式中,所述预警上报单元,具体用于:在所述第二差值大于第三差值阈值且小于第四差值阈值时,确定所述待测光模块为待监控老化模块;在所述第二差值大于第四差值阈值时,确定所述待测光模块为深度老化模块,进行告警处理;其中,所述第四差值阈值为所述偏置电流阈值与第四比例阈值相乘所得到的。
第三方面,本申请实施例提供一种计算装置,包括:处理器,存储器,通信接口;所述存储器用于存储所述处理器的可执行指令;其中,所述处理器配置为经由执行所述可执行指令来执行第一方面所述的光模块的寿命预测方法。
本申请实施例提供一种光模块的寿命预测方法及计算装置,该方法包括:获取待测光模块的当前温度、当前偏置电流和当前发射功率;获取该当前温度对应的关系函数,确定该待测光模块在该当前发射功率下的偏置电流阈值;其中,该关系函数用于确定偏置电流与发射功率的对应关系;确定该当前偏置电流与该偏置电流阈值的第一差值,在该第一差值满足老化条件时,确定该待测光模块为老化模块。相较于现有技术仅监控光模块的运行参数是否超过失效阈值,本申请利用与温度对应的关系函数,确定待测光模块当前温度、当前发射功率下的偏置电流阈值,并与当前偏置电流进行比较,在当前偏置电流与偏置电流阈值的差值满足老化条件时,确定该待测光模块已老化,能够对于光模块的老化程度作出预警,有效避免了在光模块已经严重老化到失效的程度时才被发现,解决了现有技术中因不能及时知晓光模块的老化程度而导致服务器之间的通信出现中断故障的问题。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为现有技术中的服务器集群的系统结构图;
图2为本申请实施例提供的一种光模块的寿命预测方法实施例一的流程示意图;
图3为21℃~30℃温度段对应的关系函数的示意图;
图4为本申请实施例提供的一种光模块的寿命预测方法实施例二的流程示意图;
图5为利用0℃~10℃温度段对应的多个工作参数拟合偏置电流与发射功率的关系曲线的示意图;
图6为本申请实施例提供的一种光模块的寿命预测方法实施例三的流程示意图;
图7为本申请实施例提供的一种计算装置实施例的结构示意图;
图8为本申请实施例提供的另一种计算装置实施例的结构示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在根据本实施例的启示下作出的所有其他实施例,都属于本申请保护的范围。
本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
首先对本申请所涉及的名词进行解释:
光模块(Optical Modules):光纤通信中的重要组成部分,是实现光信号传输过程中光电转换和电光转换功能的光电子器件。光模块主要由光电子器件(光发射器、光接收器)、功能电路和光接口等部分组成,主要作用就是实现光纤通信中的光电转换和电光转换。按传输速率分类,光模块包括400GE光模块、100GE光模块、40GE光模块等;按封装类型分类,光模块包括小型可插拔光模块、四通道小型可热插拔光模块、可热插拔的高密并行光模块等。
目前,服务器之间通常采用光纤进行通信,因此服务器中用于光电转换的光模块,对服务器之间的通信起着至关重要的作用。图1为现有技术的服务器集群的系统结构图。服务器集群包括多台服务器,以其中两台服务器为例。源端服务器11中的光模块111将电信号转换为光信号,再通过光纤12传输到宿端服务器13,宿端服务器13中的光模块131将光信号转换为电信号,从而实现了服务器之间的通信。然而,光信号的传输质量会随着光模块硬件的老化积累而产生质变,光模块的严重老化会导致光信号的传输质量严重下降。
现有技术中,服务器中的操作系统(Operating System,简称OS)或基板管理控制器(Baseboard Management Controller,简称BMC)会监控光模块的发射功率等运行参数,当运行参数超出设定的阈值时,则判定光模块失效,进而对光模块进行更换。然而,光模块失效意味着光模块的老化程度已经严重到无法正常工作,此时服务器之间的通信往往已经中断。
基于上述技术问题,本申请的技术构思过程如下:如何对光模块的老化程度进行预警,以避免服务器之间的通信中断。
下面对本申请实施例的光模块的寿命预测方案进行详细的说明。
图2为本申请实施例提供的一种光模块的寿命预测方法实施例一的流程示意图。参见图2,该光模块的寿命预测方法具体包括以下步骤:
步骤S201:获取待测光模块的当前温度、当前偏置电流和当前发射功率。
步骤S202:获取该当前温度对应的关系函数,确定该待测光模块在该当前发射功率下的偏置电流阈值;其中,该关系函数用于确定偏置电流与发射功率的对应关系。
步骤S203:确定该当前偏置电流与该偏置电流阈值的第一差值,在该第一差值满足老化条件时,确定该待测光模块为老化模块。
在本实施例中,服务器集群包括多个服务器,每个服务器包括至少一个光模块。服务器的基板管理控制器可以通过操作系统获取各个光模块的当前温度、当前偏置电流和当前发射功率。基板管理控制器可以通过智能平台管理接口(Intelligent PlatformManagement Interface,简称IPMI)从操作系统中获取各个光模块的当前参数。具体地,可以采用数字诊断监控技术(Digital Diagnostic Monitoring,简称DDM)监控光模块的当前参数。当前参数包括但不限于工作温度、工作电压、工作电流、发射功率和接收功率。
对于服务器集群中的每个待测光模块,获取该待测光模块的当前温度、当前偏置电流和当前发射功率。示例性地,获取一个待测光模块的当前温度为25℃,当前偏置电流为9.5mA,当前发射功率为3mW。
在本实施例中,还要获取与当前温度对应的关系函数。该关系函数用于确定偏置电流与发射功率的对应关系。示例性地,划分多个温度段包括:0℃~10℃、11℃~20℃、21℃~30℃。每个温度段有与之对应的关系函数。例如,关系函数可以为线性函数:Ibase=αPTx+β,其中Ibase为偏置电流,PTx为发射功率,α、β为系数。
获取该待测光模块的当前温度对应的关系函数,以确定该待测光模块在该当前发射功率下的偏置电流阈值。如上述示例,待测光模块的当前温度为25℃,所在的温度段为21℃~30℃。图3为21℃~30℃温度段对应的关系函数的示意图。该关系函数表明光模块在正常工作状态下,发射功率与偏置电流的关系。如图3所示,该温度段对应的关系函数为Ibase=PTx+2,将该待测光模块的当前发射功率3mW代入该关系函数中,即可得到该待测光模块在当前发射功率下的偏置电流阈值为5mA。即,光模块正常工作时,激发3mW的发射功率所需的偏置电流为5mA。
确定当前偏置电流与该偏置电流阈值的第一差值。如上述示例,当前偏置电流9.5mA与偏置电流阈值5mA的第一差值为4.5mA。
示例性地,老化条件可以为:在确定第一差值大于偏置电流阈值的80%时,则确定该待测光模块为老化模块。如上述示例,第一差值为4.5mA,大于偏置电流阈值5mA的80%,因此该待测光模块为老化模块。如图3所示,该待测光模块激发3mW的发射功率,需偏置电流9.5mA,远高于正常工作状态下的偏置电流阈值5mA,说明待测光模块已经老化。
在本实施例中,获取待测光模块的当前温度、当前偏置电流和当前发射功率;获取该当前温度对应的关系函数,确定该待测光模块在该当前发射功率下的偏置电流阈值;其中,该关系函数用于确定偏置电流与发射功率的对应关系;确定该当前偏置电流与该偏置电流阈值的第一差值,在该第一差值满足老化条件时,确定该待测光模块为老化模块。相较于现有技术仅监控光模块的运行参数是否超过失效阈值,本申请利用与温度对应的关系函数,确定待测光模块当前温度、当前发射功率下的偏置电流阈值,并与当前偏置电流进行比较,在当前偏置电流与偏置电流阈值的差值满足老化条件时,确定该待测光模块已老化,能够对于光模块的老化程度作出预警,有效避免了在光模块已经严重老化到失效的程度时才被发现,解决了现有技术中因不能及时知晓光模块的老化程度而导致服务器之间的通信出现中断故障的问题。
图4为本申请实施例提供的一种光模块的寿命预测方法实施例二的流程示意图,在上述图2所示实施例的基础上,参见图4,该关系函数的生成方法,具体包括以下步骤:
步骤S401:至少一次获取服务器中的光模块的温度以及与该温度对应的工作参数,该工作参数包括偏置电流和发射功率。
在本实施例中,服务器中包括至少一个光模块。可以获取服务器中的光模块的工作参数,进而确定适用于该服务器工作环境的偏置电流和发射功率的关系函数。
具体地,可以在服务器的操作系统初次上电后的预设时间内,至少一次获取服务器中的光模块的温度以及与温度对应的工作参数,工作参数包括偏置电流和发射功率。工作参数例如可以为[Ibase,PTx],其中,Ibase为偏置电流,PTx为发射功率。示例性地,预设时间可以为3个月。
步骤S402:确定每个光模块的温度所在的温度段,以基于温度段,将多个工作参数进行划分处理,以获取每个温度段对应的多个工作参数。
在本实施例中,设置多个温度段,例如0℃~10℃、11℃~20℃、21℃~30℃。针对获取的每个光模块的温度以及与温度对应的工作参数,先确定光模块的温度所在的温度段,再将该温度对应的工作参数划分到相应的温度段中。例如获取的光模块的温度为5℃,对应的工作参数为[Ibase_1,PTx_1],确定该光模块的温度所在的温度段为0℃~10℃,则将工作参数[Ibase_1,PTx_1]划分到温度段0℃~10℃中。由此,可以获取每个温度段对应的多个工作参数。
示例性地,每个温度段对应的多个工作参数如下所示:
0℃~10℃温度段:[Ibase_1,PTx_1],[Ibase_2,PTx_2],…,[Ibase_n,PTx_n];
11℃~20℃温度段:[Ibase_1n,PTx_1n],[Ibase_2n,PTx_2n],…,[Ibase_nn,PTx_nn];
21℃~30℃温度段:[Ibase_1m,PTx_1m],[Ibase_2m,PTx_2m],…,[Ibase_nm,PTx_nm]}。
步骤S403:针对每个温度段,根据该温度段对应的多个工作参数,确定该温度段对应的关系函数。
具体地,针对每个温度段,可以根据该温度段对应的多个工作参数,在以发射功率为横坐标、偏置电流为纵坐标的坐标系中,拟合出该温度段对应的偏置电流与发射功率的关系曲线,并根据该关系曲线,确定该关系曲线对应的关系函数的系数,以确定该温度段对应的关系函数。
在本实施例中,针对每个温度段,将该温度段对应的多个工作参数,在以发射功率为横坐标、偏置电流为纵坐标的坐标系中,以坐标点的方式描绘出来。图5为利用0℃~10℃温度段对应的多个工作参数拟合偏置电流与发射功率的关系曲线的示意图。如图5所示,将0℃~10℃温度段对应的多个工作参数[Ibase_1,PTx_1],[Ibase_2,PTx_2],…,[Ibase_n,PTx_n]在坐标系中以坐标点的方式描绘出来。利用这些工作参数对应的坐标点,拟合出0℃~10℃温度段对应的偏置电流与发射功率的关系曲线。如图5所示,根据多个坐标点拟合出的偏置电流与发射功率的关系曲线为线性函数曲线:Ibase=αPTx+β,根据该曲线,可以确定该线性函数的系数α=0.5,β=2.5。由此,可以确定0℃~10℃温度段对应的关系函数为Ibase=0.5PTx+2.5。
在一种示例中,在确定每个温度段对应的关系函数之后,可以至少一次获取服务器集群中的至少一个光模块的温度以及与该温度对应的工作参数。其中,该服务器集群包括多个服务器,每个服务器中包括至少一个光模块。确定光模块的温度所在的温度段,获取该温度段对应的关系函数,并根据该温度对应的工作参数,对该温度段对应的关系函数进行修订处理。
具体地,可以在已经拟合好各个温度段对应的偏置电流与发射功率的关系曲线后,获取服务器集群中的多个光模块的温度以及与温度对应的工作参数,在与光模块的温度对应的关系曲线所在坐标系中,以坐标点的方式描绘出与温度对应的工作参数,如果偏离关系曲线的点的个数大于个数阈值,则根据获取的多个光模块的工作参数对该关系曲线进行修订。由此,通过获取服务器集群中的光模块的工作参数,共同拟合出更为准确的偏置电流与发射功率的关系曲线,进而得到更为准确的关系函数。
在本实施例中,多次获取服务器中的光模块的温度以及与该温度对应的工作参数,基于温度段,将多个工作参数进行划分处理,并根据每个温度段对应的多个工作参数,确定该温度段对应的关系函数。在此基础上,还可以多次获取服务器集群中的多个光模块的温度以及与该温度对应的工作参数,从而对该关系函数进行修订。由此,可以更为准确地获取适用于服务器集群工作环境的各个温度段对应的关系曲线,为后续准确判断光模块是否已老化,提供了前提条件。
图6为本申请实施例提供的一种光模块的寿命预测方法实施例三的流程示意图,在上述图2至图5所示实施例的基础上,参见图6,该光模块的寿命预测方法具体包括以下步骤:
步骤S601:获取待测光模块的当前温度、当前偏置电流和当前发射功率。
步骤S602:获取该当前温度对应的关系函数,确定该待测光模块在该当前发射功率下的偏置电流阈值;其中,该关系函数用于确定偏置电流与发射功率的对应关系。
在本实施例中,针对待测光模块,获取其当前温度、当前偏置电流和当前发射功率,获取当前温度对应的关系函数,确定待测光模块在当前发射功率下的偏置电流阈值,即正常工作状态下,待测光模块激发出当前发射功率所需的偏置电流。
步骤S603:确定该当前偏置电流与该偏置电流阈值的第一差值,并确定待测光模块的数量。若待测光模块的数量为一个,则执行步骤S604;若待测光模块的数量为多个,则执行步骤S605。
步骤S604:在该待测光模块的数量为一个,且该第一差值大于第一差值阈值时,确定该待测光模块为老化模块。结束。
其中,该第一差值阈值为该偏置电流阈值与第一比例阈值相乘所得到的。
步骤S605:在该待测光模块的数量为多个时,获取每个待测光模块的第一差值;
步骤S606:获取多个第一差值中的最大值,确定该最大值对应的待测光模块为老化模块。
在本实施例中,确定待测光模块的当前偏置电流与偏置电流阈值的第一差值,并确定待测光模块的数量。示例性地,待测光模块的数量不同,老化条件也不同。
在待测光模块的数量为一个的情况下,可以将待测光模块的第一差值与第一差值阈值进行比较,在第一差值大于第一差值阈值时,确定该待测光模块为老化模块。第一差值阈值可以为偏置电流阈值与第一比例阈值相乘所得到的。
示例性地,第一比例阈值为60%,则第一差值阈值为偏置电流阈值乘以60%。例如,待测光模块在当前发射功率下的偏置电流阈值为5mA,第一差值阈值为偏置电流阈值5mA的60%,即3mA。例如该待测光模块的当前偏置电流为9.5mA,则当前偏置电流9.5mA与偏置电流阈值5mA的第一差值为4.5mA。第一差值4.5mA大于第一差值阈值3mA,则确定该待测光模块为老化模块。
在一种示例中,可以根据第一差值的大小,确定待测光模块的老化程度。在待测光模块的数量为一个,该第一差值大于第一差值阈值且小于第二差值阈值时,确定该待测光模块为待监控老化模块;在待测光模块的数量为一个,且第一差值大于第二差值阈值时,确定该待测光模块为深度老化模块,进行告警处理;其中,第二差值阈值为偏置电流阈值与第二比例阈值相乘所得到的。
示例性地,第一比例阈值为60%,第一差值阈值为偏置电流阈值乘以60%,第二比例阈值为80%,第二差值阈值为偏置电流阈值乘以80%。例如,待测光模块在当前发射功率下的偏置电流阈值为5mA,第一差值阈值为偏置电流阈值5mA的60%,即3mA,第二差值阈值为偏置电流阈值5mA的80%,即4mA。例如一待测光模块的当前偏置电流为8.5mA,则当前偏置电流8.5mA与偏置电流阈值5mA的第一差值为3.5mA。第一差值3.5mA大于第一差值阈值3mA且小于第二差值阈值4mA,则确定该待测光模块为待监控老化模块,此时该待测光模块的老化程度较轻,无需立即更换,但需要对该模块进行进一步的监控。另一待测光模块的当前偏置电流为9.5mA,则当前偏置电流9.5mA与偏置电流阈值5mA的第一差值为4.5mA。第一差值4.5mA大于第二差值阈值4mA,则确定该待测光模块为深度老化模块,进行告警处理,管理员可以根据告警将该待测光模块所在的服务器上运行的业务切换到备份链路上或者更换该待测光模块。
在待测光模块的数量为多个的情况下,可以获取每个待测光模块的第一差值,并获取多个第一差值中的最大值,确定该最大值对应的待测光模块为老化模块。
在该待测光模块的数量为多个时,还可以获取每个待测光模块的第一差值,并确定多个第一差值的平均值,作为多个待测光模块的平均差值;针对每个待测光模块,获取该待测光模块的第一差值与该平均差值的第二差值,并在该第二差值大于第三差值阈值时,确定该待测光模块为老化模块;其中,该第三差值阈值为该待测光模块的偏置电流阈值与第三比例阈值相乘所得到的。
具体地,在待测光模块的数量为多个的情况下,可以获取每个待测光模块的第一差值,并确定多个第一差值的平均值,作为多个待测光模块的平均差值,并分别获取每个待测光模块的第一差值与该平均差值的第二差值,将第二差值与第三差值阈值进行比较,在第二差值大于第三差值阈值时,确定该待测光模块为老化模块。示例性地,第三差值阈值可以为一个固定值,例如5mA,当第二差值大于该固定值时,则确定该待测光模块为老化模块。第三差值阈值还可以为偏置电流阈值与第三比例阈值相乘所得到的。
示例性地,第三比例阈值为30%,则第三差值阈值为偏置电流阈值乘以30%。例如,多个待测光模块的第一差值的平均值为1mA,其中一个待测光模块的第一差值4.5mA与该平均差值的第二差值为3.5mA。该待测光模块在当前发射功率下的偏置电流阈值为5mA,第三差值阈值为偏置电流阈值5mA的30%,即1.5mA。第二差值3.5mA大于第三差值阈值1.5mA,则确定该待测光模块为老化模块。
在一种示例中,可以根据第二差值的大小,确定待测光模块的老化程度。在该第二差值大于第三差值阈值且小于第四差值阈值时,确定该待测光模块为待监控老化模块;在该第二差值大于第四差值阈值时,确定该待测光模块为深度老化模块,进行告警处理;其中,第四差值阈值为偏置电流阈值与第四比例阈值相乘所得到的。
示例性地,第三比例阈值为30%,第三差值阈值为偏置电流阈值乘以30%,第四比例阈值为50%,第四差值阈值为偏置电流阈值乘以50%。例如,多个待测光模块的第一差值的平均值为1mA。该待测光模块在当前发射功率下的偏置电流阈值为5mA,第三差值阈值为偏置电流阈值5mA的30%,即1.5mA,第四差值阈值为偏置电流阈值5mA的50%,即2.5mA。其中一个待测光模块的第一差值3mA与该平均差值1mA的第二差值为2mA,第二差值2mA大于第三差值阈值1.5mA,且小于第四差值阈值2.5mA,则确定该待测光模块为待监控老化模块,此时该待测光模块的老化程度较轻,无需立即更换,但需要对该模块进行进一步的监控。另一个待测光模块的第一差值4.5mA与该平均差值1mA的第二差值为3.5mA,第二差值3.5mA大于第四差值阈值2.5mA,则确定该待测光模块为深度老化模块,进行告警处理,管理员可以根据告警将该待测光模块所在的服务器上运行的业务切换到备份链路上或者更换该待测光模块。
在本实施例中,在待测光模块的数量为一个的情况下,将该待测光模块的第一差值与第一差值阈值进行比较;在待测光模块的数量为多个的情况下,获取每个待测光模块的第一差值,并获取多个第一差值中的最大值;或者,先获取多个待测光模块的第一差值的平均值,再分别获取每个待测光模块的第一差值与平均差值的第二差值,将第二差值与第三差值阈值进行比较。由此,可以结合多个光模块的情况,更为准确地对光模块的老化程度进行预警,进一步解决了现有技术中因不能及时知晓光模块的老化程度而导致服务器之间的通信出现中断故障的问题。
下述为本申请装置实施例,可以用于执行本申请方法实施例。对于本申请装置实施例中未披露的细节,请参照本申请方法实施例。
图7为本申请实施例提供的一种计算装置实施例的结构示意图;如图7所示,该计算装置70包括:数字监控单元71、数据分析单元72以及预警上报单元73。其中,数字监控单元71用于获取待测光模块的当前温度、当前偏置电流和当前发射功率;数据分析单元72用于获取该当前温度对应的关系函数,确定该待测光模块在该当前发射功率下的偏置电流阈值;其中,该关系函数用于确定偏置电流与发射功率的对应关系;预警上报单元73用于确定该当前偏置电流与该偏置电流阈值的第一差值,在该第一差值满足老化条件时,确定该待测光模块为老化模块。
本申请实施例提供的计算装置可以执行上述方法实施例所示的技术方案,其实现原理以及有益效果类似,此处不再进行赘述。
在一种可能的实施方案中,计算装置70还包括拟合学习单元。该拟合学习单元用于至少一次获取服务器中的光模块的温度以及与该温度对应的工作参数,该工作参数包括偏置电流和发射功率;确定每个光模块的温度所在的温度段,以基于温度段,将多个工作参数进行划分处理,以获取每个温度段对应的多个工作参数;针对每个温度段,根据该温度段对应的多个工作参数,确定该温度段对应的关系函数。
在一种可能的实施方案中,该拟合学习单元具体用于在服务器的操作系统初次上电后的预设时间内,至少一次获取该服务器中的光模块的温度以及与该温度对应的工作参数。
在一种可能的实施方案中,该拟合学习单元还用于在确定每个温度段对应的关系函数之后,至少一次获取服务器集群中的至少一个光模块的温度以及与该温度对应的工作参数;其中,该服务器集群包括多个服务器,每个服务器中包括至少一个光模块;确定该光模块的温度所在的温度段,获取该温度段对应的关系函数,并根据该温度对应的工作参数,对该温度段对应的关系函数进行修订处理。
本申请实施例提供的计算装置可以执行上述方法实施例所示的技术方案,其实现原理以及有益效果类似,此处不再进行赘述。
在一种可能的实施方案中,预警上报单元73具体用于在该待测光模块的数量为一个,且该第一差值大于第一差值阈值时,确定该待测光模块为老化模块;其中,该第一差值阈值为该偏置电流阈值与第一比例阈值相乘所得到的。
在一种可能的实施方案中,预警上报单元73具体用于在该待测光模块的数量为一个,该第一差值大于第一差值阈值且小于第二差值阈值时,确定该待测光模块为待监控老化模块;在该待测光模块的数量为一个,且该第一差值大于第二差值阈值时,确定该待测光模块为深度老化模块,进行告警处理;其中,该第二差值阈值为该偏置电流阈值与第二比例阈值相乘所得到的。
在一种可能的实施方案中,预警上报单元73具体用于在该待测光模块的数量为多个时,获取每个待测光模块的第一差值;获取多个第一差值中的最大值,确定该最大值对应的待测光模块为老化模块。
在一种可能的实施方案中,预警上报单元73具体用于在该待测光模块的数量为多个时,获取每个待测光模块的第一差值,并确定多个第一差值的平均值,作为多个待测光模块的平均差值;针对每个待测光模块,获取该待测光模块的第一差值与该平均差值的第二差值,并在该第二差值大于第三差值阈值时,确定该待测光模块为老化模块;其中,该第三差值阈值为该待测光模块的偏置电流阈值与第三比例阈值相乘所得到的。
在一种可能的实施方案中,预警上报单元73具体用于在该第二差值大于第三差值阈值且小于第四差值阈值时,确定该待测光模块为待监控老化模块;在该第二差值大于第四差值阈值时,确定该待测光模块为深度老化模块,进行告警处理;其中,该第四差值阈值为该偏置电流阈值与第四比例阈值相乘所得到的。
本申请实施例提供的计算装置可以执行上述方法实施例所示的技术方案,其实现原理以及有益效果类似,此处不再进行赘述。
图8为本申请实施例提供的另一种计算装置的结构示意图。如图8所示,该计算装置80包括:处理器81,存储器82,以及通信接口83;其中,存储器82用于存储处理器81的可执行指令;处理器81配置为经由执行可执行指令来执行前述任一方法实施例中的技术方案。
可选的,存储器82既可以是独立的,也可以跟处理器81集成在一起。
可选的,当存储器82是独立于处理器81之外的器件时,计算装置80还可以包括:总线84,用于将上述器件连接起来。
该计算装置用于执行前述任一方法实施例中的技术方案,其实现原理和技术效果类似,在此不再赘述。
本领域普通技术人员可以理解:实现上述各方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成。前述的程序可以存储于一计算机可读取存储介质中。该程序在执行时,执行包括上述各方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上各实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述各实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或对其中部分或全部技术特征进行等同替换;而这些修改或替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的范围。

Claims (10)

1.一种光模块的寿命预测方法,其特征在于,包括:
获取待测光模块的当前温度、当前偏置电流和当前发射功率;
获取所述当前温度对应的关系函数,确定所述待测光模块在所述当前发射功率下的偏置电流阈值;其中,所述关系函数用于确定偏置电流与发射功率的对应关系;
确定所述当前偏置电流与所述偏置电流阈值的第一差值,在所述第一差值满足老化条件时,确定所述待测光模块为老化模块。
2.根据权利要求1所述的光模块的寿命预测方法,其特征在于,所述关系函数的生成方法包括:
至少一次获取服务器中的光模块的温度以及与所述温度对应的工作参数,所述工作参数包括偏置电流和发射功率;
确定每个所述光模块的温度所在的温度段,以基于温度段,将多个所述工作参数进行划分处理,以获取每个温度段对应的多个工作参数;
针对每个温度段,根据所述温度段对应的多个工作参数,确定所述温度段对应的关系函数。
3.根据权利要求2所述的光模块的寿命预测方法,其特征在于,所述至少一次获取服务器中的光模块的温度以及与所述温度对应的工作参数,包括:
在服务器的操作系统初次上电后的预设时间内,至少一次获取所述服务器中的光模块的温度以及与所述温度对应的工作参数。
4.根据权利要求2所述的光模块的寿命预测方法,其特征在于,在确定每个温度段对应的关系函数之后,所述方法还包括:
至少一次获取服务器集群中的至少一个光模块的温度以及与所述温度对应的工作参数;其中,所述服务器集群包括多个服务器,每个服务器中包括至少一个光模块;
确定所述光模块的温度所在的温度段,获取所述温度段对应的关系函数,并根据所述温度对应的工作参数,对所述温度段对应的关系函数进行修订处理。
5.根据权利要求1至4中任一项所述的光模块的寿命预测方法,其特征在于,所述在所述第一差值满足老化条件时,确定所述待测光模块为老化模块,包括:
在所述待测光模块的数量为一个,且所述第一差值大于第一差值阈值时,确定所述待测光模块为老化模块;其中,所述第一差值阈值为所述偏置电流阈值与第一比例阈值相乘所得到的。
6.根据权利要求5所述的光模块的寿命预测方法,其特征在于,所述在所述待测光模块的数量为一个,且所述第一差值大于第一差值阈值时,确定所述待测光模块为老化模块,包括:
在所述待测光模块的数量为一个,所述第一差值大于第一差值阈值且小于第二差值阈值时,确定所述待测光模块为待监控老化模块;
在所述待测光模块的数量为一个,且所述第一差值大于第二差值阈值时,确定所述待测光模块为深度老化模块,进行告警处理;
其中,所述第二差值阈值为所述偏置电流阈值与第二比例阈值相乘所得到的。
7.根据权利要求1至4中任一项所述的光模块的寿命预测方法,其特征在于,所述在所述第一差值满足老化条件时,确定所述待测光模块为老化模块,包括:
在所述待测光模块的数量为多个时,获取每个所述待测光模块的第一差值;
获取多个所述第一差值中的最大值,确定所述最大值对应的待测光模块为老化模块。
8.根据权利要求1至4中任一项所述的光模块的寿命预测方法,其特征在于,所述在所述第一差值满足老化条件时,确定所述待测光模块为老化模块,包括:
在所述待测光模块的数量为多个时,获取每个所述待测光模块的第一差值,并确定多个所述第一差值的平均值,作为多个所述待测光模块的平均差值;
针对每个所述待测光模块,获取所述待测光模块的第一差值与所述平均差值的第二差值,并在所述第二差值大于第三差值阈值时,确定所述待测光模块为老化模块;
其中,所述第三差值阈值为所述待测光模块的偏置电流阈值与第三比例阈值相乘所得到的。
9.根据权利要求8所述的光模块的寿命预测方法,其特征在于,所述在所述第二差值大于第三差值阈值时,确定所述待测光模块为老化模块,包括:
在所述第二差值大于第三差值阈值且小于第四差值阈值时,确定所述待测光模块为待监控老化模块;
在所述第二差值大于第四差值阈值时,确定所述待测光模块为深度老化模块,进行告警处理;
其中,所述第四差值阈值为所述偏置电流阈值与第四比例阈值相乘所得到的。
10.一种计算装置,其特征在于,包括:
处理器,存储器,通信接口;
所述存储器用于存储所述处理器的可执行指令;
其中,所述处理器配置为经由执行所述可执行指令来执行权利要求1至9中任一项所述的光模块的寿命预测方法。
CN202310316915.2A 2023-03-28 2023-03-28 一种光模块的寿命预测方法及计算装置 Pending CN116545523A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310316915.2A CN116545523A (zh) 2023-03-28 2023-03-28 一种光模块的寿命预测方法及计算装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310316915.2A CN116545523A (zh) 2023-03-28 2023-03-28 一种光模块的寿命预测方法及计算装置

Publications (1)

Publication Number Publication Date
CN116545523A true CN116545523A (zh) 2023-08-04

Family

ID=87449595

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310316915.2A Pending CN116545523A (zh) 2023-03-28 2023-03-28 一种光模块的寿命预测方法及计算装置

Country Status (1)

Country Link
CN (1) CN116545523A (zh)

Similar Documents

Publication Publication Date Title
CN112162878B (zh) 数据库故障发现方法、装置、电子设备及存储介质
US20160205189A1 (en) Proactive monitoring and diagnostics in storage area networks
CN109000889B (zh) 一种光模块劣化的检测方法及装置
KR102144350B1 (ko) 태양광 발전시스템의 고장 진단 시스템
US10203366B2 (en) Transducer reliability testing
US9524223B2 (en) Performance metrics of a computer system
CN109088775B (zh) 异常监控方法、装置以及服务器
CN113590429B (zh) 一种服务器故障诊断方法、装置及电子设备
EP3667952B1 (en) Method, device, and storage medium for locating failure cause
CN108667514B (zh) 光传输设备在线失效预测方法和装置
US20200381889A1 (en) Life prediction method and life prediction device for optical module
US10461851B1 (en) Predicting optical transceiver failure
CN110988578A (zh) 激光器测试系统、方法及可读存储介质
CN112860504B (zh) 监控方法及装置、计算机存储介质、电子设备
CN116545523A (zh) 一种光模块的寿命预测方法及计算装置
KR20140145259A (ko) 컴포넌트 기반 시스템의 이상 상태 분석 장치 및 그 방법
CN108959025A (zh) 一种服务器告警方法、装置及服务器
JP7159596B2 (ja) 光送受信システム、光通信装置及び故障検出方法
US20190379452A1 (en) Information processing apparatus and optical fiber inspection method
JP5722167B2 (ja) 障害監視判定装置、障害監視判定方法、及びプログラム
CN115623464A (zh) 一种电能表蓝牙模块的故障处理方法、装置及电能表
CN115471968A (zh) 一种电缆防盗报警装置
CN114665987A (zh) 一种基于人工智能的天线健康管理系统
CN113810105A (zh) 光纤链路检测方法、网络设备和存储介质
WO2022015313A1 (en) Generation of alerts of correlated time-series behavior of environments

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination