CN107276832B - 一种提升psu和系统通信可靠性的方法及装置 - Google Patents

一种提升psu和系统通信可靠性的方法及装置 Download PDF

Info

Publication number
CN107276832B
CN107276832B CN201710656286.2A CN201710656286A CN107276832B CN 107276832 B CN107276832 B CN 107276832B CN 201710656286 A CN201710656286 A CN 201710656286A CN 107276832 B CN107276832 B CN 107276832B
Authority
CN
China
Prior art keywords
psu
bmc
communication
gpio
signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710656286.2A
Other languages
English (en)
Other versions
CN107276832A (zh
Inventor
张文珂
高鹏飞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suzhou Inspur Intelligent Technology Co Ltd
Original Assignee
Suzhou Inspur Intelligent Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suzhou Inspur Intelligent Technology Co Ltd filed Critical Suzhou Inspur Intelligent Technology Co Ltd
Priority to CN201710656286.2A priority Critical patent/CN107276832B/zh
Publication of CN107276832A publication Critical patent/CN107276832A/zh
Application granted granted Critical
Publication of CN107276832B publication Critical patent/CN107276832B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/08Configuration management of networks or network elements
    • H04L41/0803Configuration setting
    • H04L41/0823Configuration setting characterised by the purposes of a change of settings, e.g. optimising configuration for enhancing reliability
    • H04L41/0836Configuration setting characterised by the purposes of a change of settings, e.g. optimising configuration for enhancing reliability to enhance reliability, e.g. reduce downtime
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • H04L43/0805Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability
    • H04L43/0811Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability by checking connectivity

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Environmental & Geological Engineering (AREA)
  • Communication Control (AREA)
  • Small-Scale Networks (AREA)

Abstract

一种提升PSU和系统通信可靠性的方法,具体包括以下步骤:BMC判断PSU和系统的ME通信链路是否发生中断;如果是,则BMC通过GPIO将信号反馈给PSU;PSU将信息反馈给PSU的内部单片机,PSU的内部单片机向ME发送激活脉冲;BMC重新侦测ME通信链路否恢复通信;如果通信正常则BMC不再动作;如果通讯没有恢复,则BMC再次通过GPIO发送信号给PSU,PSU的内部单片机重新向ME发送激活脉冲。还包括一种装置,通过GPIO信号反馈线路的一端与主机的BMC的控制端相连,GPIO信号反馈线路的另一端与从机的PSU相连。通过增加GPIO信号反馈链路保持BMC主机控制身份,主动的控制通讯的中断恢复处理,提升通讯的可靠性;不会违反通信的原则,也不会出现PSU主动发脉冲带来的不良影响。

Description

一种提升PSU和系统通信可靠性的方法及装置
技术领域
本方面涉及通信技术领域,具体地说是一种提升PSU和系统通信可靠性的方法及装置。
背景技术
服务器PSU(Power Supply Unit电源供应器模块)在和系统通信的过程中受到干扰或者其他原因导致通信中断的问题频繁发生,给机房服务器工作人员带来很大的困扰。
针对电源和服务器通信中断的问题,当前已有人提出通过PSU来监测通信链路,并通过判断发出激活信号来激活整个失效的链路。
服务器电源属于从机设计,而通信的主机为服务器,现有的通过从机控制主机的方案违反了正常的设计理念,而且从机控制时受限于自身条件无法精准的判断激活的时间和次数,过多的操作可能会引起主机挂死或者其他不良反应。
发明内容
服务器在采集PSU信息与PSU进行通信的时候,受到外界干扰或者设计缺陷问题等导致通信中断无法恢复,服务器电源无法获取到PSU信息,对数据中心机房的运维带来不好的影响;为此,本发明提供了一种提升PSU和系统通信可靠性的方法及装置。
本发明解决其技术问题所采取的技术方案是:一种提升PSU和系统通信可靠性的方法,具体包括以下步骤:
BMC判断PSU和系统的ME通信链路是否发生中断;如果是,则BMC通过GPIO将信号反馈给PSU;
PSU将信息反馈给PSU的内部单片机,PSU的内部单片机向ME发送激活脉冲;
BMC重新侦测ME通信链路否恢复通信;
如果通信正常则BMC不再动作;如果通讯没有恢复,则BMC再次通过GPIO发送信号给PSU,PSU的内部单片机重新向ME发送激活脉冲。
进一步地,所述BMC判断PSU和系统通信是否发生中断的方法包括:BMC定时向ME发送指令,BMC如果接收到ME的返回值,则表示通信正常,如果接收不到返回值,则表示ME通信链路通信中断。
进一步地,GPIO反馈给PSU的信号为高电平信号或低电平信号,表示ME通信链路信号中断。
一种提升PSU和系统通信可靠性的装置,利用所述的方法,主要包括主机的BMC和ME、从机的PSU,还包括GPIO信号反馈线路,GPIO信号反馈线路,GPIO信号反馈线路的一端与主机的BMC的控制端相连,GPIO信号反馈线路的另一端与从机的PSU相连。
进一步地,所述的GPIO信号反馈线路包括信号传输线。
以上发明内容提供的仅仅是本发明实施例的表述,而不是发明本身。
发明内容中提供的效果仅仅是实施例的效果,而不是发明所有的全部效果,上述技术方案中的一个技术方案具有如下优点或有益效果:
通过增加GPIO信号反馈链路保持BMC主机控制身份,主动的控制通讯的中断恢复处理,提升通讯的可靠性;不会违反通信的原则,也不会出现PSU主动发脉冲带来的不良影响。
附图说明
图1为目前通讯中断处理原理示意图;
图2为本发明实施例的方法流程示意图;
图3为本发明实施例的结构连接示意图。
具体实施方式
为了能清楚说明本方案的技术特点,下面通过具体实施方式,并结合其附图,对本发明进行详细阐述。下文的公开提供了许多不同的实施例或例子用来实现本发明的不同结构。为了简化本发明的公开,下文中对特定例子的部件和设置进行描述。此外,本发明可以在不同例子中重复参考数字和/或字母。这种重复是为了简化和清楚的目的,其本身不指示所讨论各种实施例和/或设置之间的关系。应当注意,在附图中所图示的部件不一定按比例绘制。本发明省略了对公知组件和处理技术及工艺的描述以避免不必要地限制本发明。
为了更清楚的理解本发明,图1为对现有技术的简略描述。
如图1所示,服务器和电源在通信的过程中,PSU主动的去侦测与系统(主要为ME和BMC,BMC通过ME间接与PSU通信)通信是否正常;当侦测到PSU和系统的通讯在15s(时间根据实际系统定义)内没有数据传输时,PSU判断通信中断;为了恢复通信,PSU将从机的身份临时变为主机,通过主动发送激活脉冲来激活通信链路,从而恢复正常通信。
这种设计虽然也可以有效激活通信,但是电源PSU从从机身份变成了主机身份,违反了通信原则,同时PSU变成主机后发送激活信号无法精确的控制发送的次数,如果出现频繁的发送信号,会有几率使总线永久挂死,这样就只有将服务器断电后重启才能恢复,影响机房的正常使用。
为了解决现有技术的缺陷,如图2所示,本发明技术方案的一个实施例提供了一种提升PSU和系统通信可靠性的方法,具体包括以下步骤:
步骤1)BMC判断PSU和系统的ME通信链路是否发生中断;如果是,则BMC通过GPIO将信号反馈给PSU;
步骤2)PSU将信息反馈给PSU的内部单片机,PSU的内部单片机向ME发送激活脉冲;
步骤3)BMC重新侦测ME通信链路否恢复通信;
步骤4)如果通信正常则BMC不再动作;如果通讯没有恢复,则BMC再次通过GPIO发送信号给PSU,PSU的内部单片机重新向ME发送激活脉冲。
步骤1)中BMC判断PSU和系统通信是否发生中断的方法包括:BMC定时向ME发送指令,BMC如果接收到ME的返回值,则表示通信正常,如果接收不到返回值,则表示ME通信链路通信中断。
GPIO反馈给PSU的信号为高电平信号或低电平信号,表示ME通信链路信号中断。该信号可由自定义,如果设置高电平信号为反馈信号,则反馈信号为高电平时,表示ME通信链路信号中断;如果设置低电平信号为反馈信号,则反馈信号为低电平时,表示ME通信链路信号中断。
如图3所示,一种提升PSU和系统通信可靠性的装置,主要包括主机的BMC和ME、从机的PSU,还包括GPIO信号反馈线路,GPIO信号反馈线路,GPIO信号反馈线路的一端与主机的BMC的控制端相连,GPIO信号反馈线路的另一端与从机的PSU相连。
GPIO信号反馈线路包括信号传输线。
以上所述只是本发明的优选实施方式,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也被视为本发明的保护范围。

Claims (4)

1.一种提升PSU和系统通信可靠性的方法,其特征是,具体包括以下步骤:
BMC判断PSU和系统的ME通信链路是否发生中断,其中,所述BMC判断PSU和系统通信是否发生中断的方法包括:BMC定时向ME发送指令,BMC如果接收到ME的返回值,则表示通信正常,如果接收不到返回值,则表示ME通信链路通信中断;如果是,则BMC通过GPIO将信号反馈给PSU;
PSU将信息反馈给PSU的内部单片机,PSU的内部单片机向ME发送激活脉冲;
BMC重新侦测ME通信链路是 否恢复通信;
如果通信正常则BMC不再动作;如果通讯没有恢复,则BMC再次通过GPIO发送信号给PSU,PSU的内部单片机重新向ME发送激活脉冲。
2.根据权利要求1所述的方法,其特征是,GPIO反馈给PSU的信号为高电平信号或低电平信号,表示ME通信链路信号中断。
3.一种提升PSU和系统通信可靠性的装置,利用权利要求1至2任意一项所述的方法,主要包括主机的BMC和ME、从机的PSU,其特征是,还包括GPIO信号反馈线路, GPIO信号反馈线路的一端与主机的BMC的控制端相连,GPIO信号反馈线路的另一端与从机的PSU相连。
4.根据权利要求3所述的装置,其特征是,所述的GPIO信号反馈线路包括信号传输线。
CN201710656286.2A 2017-08-03 2017-08-03 一种提升psu和系统通信可靠性的方法及装置 Active CN107276832B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710656286.2A CN107276832B (zh) 2017-08-03 2017-08-03 一种提升psu和系统通信可靠性的方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710656286.2A CN107276832B (zh) 2017-08-03 2017-08-03 一种提升psu和系统通信可靠性的方法及装置

Publications (2)

Publication Number Publication Date
CN107276832A CN107276832A (zh) 2017-10-20
CN107276832B true CN107276832B (zh) 2020-10-20

Family

ID=60075446

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710656286.2A Active CN107276832B (zh) 2017-08-03 2017-08-03 一种提升psu和系统通信可靠性的方法及装置

Country Status (1)

Country Link
CN (1) CN107276832B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108040214B (zh) * 2017-12-08 2023-09-22 延锋伟世通电子科技(南京)有限公司 一种通过FPD-Link III中的SPI通道实现车载娱乐系统与仪表双屏互联的架构
CN110022245B (zh) * 2019-04-10 2020-05-29 苏州浪潮智能科技有限公司 一种调试方法、调试系统及存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104346252A (zh) * 2013-08-09 2015-02-11 英业达科技有限公司 监控芯片对于异常的感测数据的过滤方法
CN104850485A (zh) * 2015-05-25 2015-08-19 深圳国鑫恒宇技术有限公司 一种基于bmc远程诊断服务器开机故障的方法及系统
CN106354685A (zh) * 2016-08-19 2017-01-25 浪潮电子信息产业股份有限公司 一种psu和me通信i2c总线挂死恢复的实现方法
CN106598814A (zh) * 2016-12-26 2017-04-26 郑州云海信息技术有限公司 一种实现服务器系统过热保护的设计方法
CN106873745A (zh) * 2017-02-10 2017-06-20 郑州云海信息技术有限公司 一种实现背板电压监控的系统及方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104346252A (zh) * 2013-08-09 2015-02-11 英业达科技有限公司 监控芯片对于异常的感测数据的过滤方法
CN104850485A (zh) * 2015-05-25 2015-08-19 深圳国鑫恒宇技术有限公司 一种基于bmc远程诊断服务器开机故障的方法及系统
CN106354685A (zh) * 2016-08-19 2017-01-25 浪潮电子信息产业股份有限公司 一种psu和me通信i2c总线挂死恢复的实现方法
CN106598814A (zh) * 2016-12-26 2017-04-26 郑州云海信息技术有限公司 一种实现服务器系统过热保护的设计方法
CN106873745A (zh) * 2017-02-10 2017-06-20 郑州云海信息技术有限公司 一种实现背板电压监控的系统及方法

Also Published As

Publication number Publication date
CN107276832A (zh) 2017-10-20

Similar Documents

Publication Publication Date Title
KR101231558B1 (ko) 마이크로프로세서에서의 전압 및 주파수의 신뢰성있는 설정
US8656003B2 (en) Method for controlling rack system using RMC to determine type of node based on FRU's message when status of chassis is changed
CN111176939B (zh) 一种基于cpld的多节点服务器的管理系统及方法
CN104570721B (zh) 冗余控制器主从状态确定方法
CN104639380A (zh) 服务器监控方法
CN111831488B (zh) 具有安全等级设计的tcms-mpu控制单元
US20120131361A1 (en) Remote controller and method for remotely controlling motherboard using the remote controller
CN107276832B (zh) 一种提升psu和系统通信可靠性的方法及装置
CN102495786B (zh) 服务器系统
CN111078445A (zh) 一种psu掉电原因检测方法及装置
CN100498733C (zh) 一种实现计算机故障报警控制的方法
CN110502369B (zh) 一种设备死机恢复的方法、装置和存储介质
CN115809164A (zh) 嵌入式设备、嵌入式系统和分级复位控制方法
CN105426171A (zh) 多个二取二系统的同步和切换方法、系统
CN111324503B (zh) 机框管理装置、方法和计算机可读存储介质
US11429505B2 (en) System and method to provide optimal polling of devices for real time data
CN202142052U (zh) 列控车载设备的安全冗余计算机系统
CN106411643B (zh) Bmc检测方法以及装置
CN110825547B (zh) 一种基于smbus的pcie卡异常恢复装置及方法
CN210721440U (zh) 一种pcie卡异常恢复装置及pcie卡、pcie扩展系统
CN102053847B (zh) 服务器与其更新方法
CN116823587A (zh) 一种图形处理器控制方法、装置、电子设备及存储介质
US10769038B2 (en) Counter circuitry and methods including a master counter providing initialization data and fault detection data and wherein a threshold count difference of a fault detection count is dependent upon the fault detection data
CN109726055B (zh) 检测PCIe芯片异常的方法及计算机设备
US9405629B2 (en) Information processing system, method for controlling information processing system, and storage medium

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20200917

Address after: 215100 No. 1 Guanpu Road, Guoxiang Street, Wuzhong Economic Development Zone, Suzhou City, Jiangsu Province

Applicant after: SUZHOU LANGCHAO INTELLIGENT TECHNOLOGY Co.,Ltd.

Address before: 450018 Henan province Zheng Dong New District of Zhengzhou City Xinyi Road No. 278 16 floor room 1601

Applicant before: ZHENGZHOU YUNHAI INFORMATION TECHNOLOGY Co.,Ltd.

TA01 Transfer of patent application right
GR01 Patent grant
GR01 Patent grant