CN114138540B - 一种多个相同板卡共用时的区分结构及方法 - Google Patents

一种多个相同板卡共用时的区分结构及方法 Download PDF

Info

Publication number
CN114138540B
CN114138540B CN202111496775.9A CN202111496775A CN114138540B CN 114138540 B CN114138540 B CN 114138540B CN 202111496775 A CN202111496775 A CN 202111496775A CN 114138540 B CN114138540 B CN 114138540B
Authority
CN
China
Prior art keywords
connector
backboard
band
main board
server main
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202111496775.9A
Other languages
English (en)
Other versions
CN114138540A (zh
Inventor
王龙
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suzhou Inspur Intelligent Technology Co Ltd
Original Assignee
Suzhou Inspur Intelligent Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suzhou Inspur Intelligent Technology Co Ltd filed Critical Suzhou Inspur Intelligent Technology Co Ltd
Priority to CN202111496775.9A priority Critical patent/CN114138540B/zh
Publication of CN114138540A publication Critical patent/CN114138540A/zh
Application granted granted Critical
Publication of CN114138540B publication Critical patent/CN114138540B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0706Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
    • G06F11/0745Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment in an input/output transactions management context
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/079Root cause analysis, i.e. error or fault diagnosis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F13/00Interconnection of, or transfer of information or other signals between, memories, input/output devices or central processing units
    • G06F13/38Information transfer, e.g. on bus
    • G06F13/382Information transfer, e.g. on bus using universal interface adapter
    • G06F13/385Information transfer, e.g. on bus using universal interface adapter for adaptation of a particular data processing system to different peripheral devices
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2213/00Indexing scheme relating to interconnection of, or transfer of information or other signals between, memories, input/output devices or central processing units
    • G06F2213/0016Inter-integrated circuit (I2C)
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本发明提供一种多个相同板卡共用时的区分结构及方法,属于服务器板卡连接纠错技术领域,所述结构,包括服务器主板和两个背板;服务器主板上设置有BMC,BMC连接有I2C扩展芯片;第一I2C扩展芯片连接有两个第一带外连接器;第二I2C扩展芯片连接有两个第一I2C连接器;每个背板上均设置有CPLD、第二带外连接器和第二I2C连接器;每个背板的第二带外连接器与第一带外连接器及CPLD连接,CPLD与硬盘连接;每个背板第二I2C连接器与第一I2C连接器及硬盘连接;同一个连接组中的连接器连接上拉或下拉电阻。本发明实现相同板卡共用时的区分,防止逻辑错误,对BMC的判断逻辑进行优化,减少资源调用。

Description

一种多个相同板卡共用时的区分结构及方法
技术领域
本发明属于服务器板卡连接纠错技术领域,具体涉及一种多个相同板卡共用时的区分结构及方法。
背景技术
在服务器设计中,经常会出现同时使用多张相同板卡的情况,如扩展卡、背板等。这些板卡在硬件上完全相同,板卡内CPLD等逻辑器件无法互相区分这些板卡,主板BMC只能通过切换I2C线路来对应不同的板卡,又因为不同板卡的相同芯片I2C地址相同,因而无法在硬件上区分。
在以前的设计中,针对多背板的项目,BMC会配置为同时升级各背板CPLD、FRU等,各背板CPLD同步接收命令进行升级等操作。所有CPLD监控到的数据,都要全部回传给BMC,由BMC来判断具体是哪张背板,然后切换到对应的I2C线路上回传相应的命令给对应背板板卡的CPLD来进行下一步操作。而上述过程一般通过I2C线路以及系统带内盘序识别,来确定具体背板板卡的位置。
上述方式中,主要的判断逻辑由BMC承担,会占用一部分资源,存在一定的轮询延迟。而且,如果背板灯板卡的设计上I2C线路与其他信号在不同的连接器上,当线缆错插时,会出现因板卡信号不同源导致的板卡信息识别冲突的问题,可能会使BMC识别出不准确的信息,造成故障。
此为现有技术的不足,因此,针对现有技术中的上述缺陷,提供一种多个相同板卡共用时的区分结构及方法,是非常有必要的。
发明内容
针对现有技术的上述多张相同板卡共用时,无法区分各板卡,使得板卡内部逻辑芯片无法明确自身板卡的具体位置,从而使得BMC出现逻辑错误以及导致不同板卡间信息冲突的缺陷,本发明提供一种多个相同板卡共用时的区分结构及方法,以解决上述技术问题。
第一方面,本发明提供一种多个相同板卡共用时的区分结构,包括服务器主板和两个背板,第一背板和第二背板;
服务器主板上设置有BMC,BMC连接有第一I2C扩展芯片和第二I2C扩展芯片;
第一I2C扩展芯片连接有两个第一带外连接器;
第二I2C扩展芯片连接有两个第一I2C连接器;
每个背板上均设置有CPLD、第二带外连接器和第二I2C连接器,每个背板还连接有一个硬盘;
每个背板的第二带外连接器与第一带外连接器及CPLD连接,CPLD与硬盘连接;
每个背板第二I2C连接器与第一I2C连接器及硬盘连接;
与同一背板的第二带外连接器和第二I2C连接器分别连接的第一带外连接器和第一I2C连接器为一个连接器组;
同一个连接组中的第一带外连接器和第一I2C连接器均连接上拉电阻或下拉电阻;
不同连接器组中的连接器连接上拉电阻和下拉电阻中的不同类型。一个连接器组的连接器接上拉电阻时,另一个连接器组的连接器接下拉电阻。
进一步地,第一I2C扩展芯片和第二I2C扩展芯片采用PCA9546型号的芯片。通过I2C扩展芯片实现BMC的I2C信号扩展,解决了BMC的I2C管脚不足的问题。
进一步地,第一带外连接器与第二带外连接器通过带外I2C信号线连接,第二带外连接器与CPLD通过带外I2C信号线连接,CPLD与硬盘通过带外信号线连接;
第一I2C连接器与第二I2C连接器通过I2C信号线连接,第二I2C连接器与硬盘通过I2C信号线连接。BMC通过带外的方式通过带外I2C信号线与CPLD通信,控制背板逻辑,硬盘通过I2C信号线向BMC返回状态信息。
进一步地,CPLD还连接有PCIE SWITCH芯片和SAS扩展芯片。CPLD获取到所在背板的ID号信息后,还将背板ID号通知背板上的PCIE SWITCH芯片和SAS扩展芯片,确保PCIESWITCH芯片和SAS扩展芯片可准确指定自身所在的背板,并识别对应命令。
第二方面,本发明提供一种基于上述第一方面的多个相同板卡共用时的区分方法,包括如下步骤:
S1.根据服务器主板的两个连接组的上下拉电阻设置生成服务器主板与背板的连接器关系表;
S2.将服务器主板与两个背板进行插接;
S3.BMC根据服务器主板与背板的连接器关系表判断两个背板与服务器主板的连接器是否出现错接;
S4.当两个背板与服务器主板的连接器正确连接时,BMC判断是否存在背板故障,并在存在背板故障时,识别出对应背板,消除故障;
S5.当两个背板与服务器主板的连接器出现错接时,BMC判断是否存在背板故障,并在存在背板故障时,识别出对应背板,消除故障。
进一步地,步骤S1具体步骤如下:
S11.将服务器主板同第一背板连接的连接器组连接下拉电阻,用0表示;
S12.将服务器主板同第二背板连接的连接器组连接上拉电阻,用1表示;
S13.生成服务器主板与背板的连接器关系表,其中,第一背板的第二带外连接器与第一连接器组的第一带外连接器连接,第一背板的第二I2C连接器与第一连接器组的第一I2C连接器连接时,对应第一背板ID号为00;
第一背板的第二带外连接器与第一连接器组的第一带外连接器连接,第一背板的第二I2C连接器与第二连接器组的第一I2C连接器与连接时,对应第一背板ID号01;
第二背板的第二带外连接器与第二连接器组的第一带外连接器连接,第二背板的第二I2C连接器与第一连接器组的第一I2C连接器连接时,对应第二背板ID号10;
第二背板的第二带外连接器与第二连接器组的第一带外连接器连接,第二背板的第二I2C连接器与第二连接器组的第一I2C连接器连接时,对应第二背板ID号11。硬盘背板的ID号是预先设计的,并且BMC提前获知。
进一步地,步骤S2具体步骤如下:
S21.将服务器主板第一连接器组的第一带外连接器和第一I2C连接器分别与对应第一背板的第二带外连接器和第二I2C连接器连接;
S22.将服务器主板第二连接器组的第一带外连接器和第一I2C连接器分别与对应第二背板的第二带外连接器和第二I2C连接器连接。此处的连接方式为无连接器错接时的正确连接方式。
进一步地,步骤S3具体步骤如下:
S31.获取服务器主板与背板的连接器关系表中硬盘ID号00、01、10及11;
S32.判断第一背板ID号为00,第二背板ID号为11,还是第一背板ID号为01,第二背板ID号为10;
S33.当第一背板ID号为00,第二背板ID号为11时,判定两个背板与服务器主板的连接器正确连接,进入步骤S4;
S34.当第一背板ID号为01,第二背板ID号为10时,判定两个背板与服务器主板的连接器出现错接,进入步骤S5。步骤S34中的连接器错接指的是两背板的第二I2C连接器错接,本发明还存在两背板的第二带外连接器错接时的情形。
进一步地,步骤S4具体步骤如下:
S41.BMC根据对应连接器组返回的I2C信号判断是否存在对应背板故障;背板故障包括硬盘故障;
若是,进入步骤S42;
若否,进入步骤S43;
S42.BMC通过对应带外连接器向对应背板的CPLD发送控制信号,消除背板故障;
S43.结束。没有连接器错接时,BMC通过正确背板的ID号即可通知故障背板所在CPLD即可,消除背板故障。
进一步地,步骤S5具体步骤如下:
S51.BMC根据对应连接器组返回的I2C信号判断是否存在对应背板故障;背板故障包括硬盘故障;
若是,进入步骤S52;
若否,进入步骤S53;
S52.BMC通过对应带外连接器向对应背板的CPLD发送控制信号,消除背板故障;
S53.结束。出现两个背板的第二I2C错接时,需要准确识别出是哪个背板发生了故障,再通过BMC向对应背板发送控制,消除对应背板故障,从而避免逻辑出错,陷入死循环。
本发明的有益效果在于:
本发明提供的多个相同板卡共用时的区分结构及方法,通过为连接器设置上下拉电阻的方式,实现BMC获取CPLD识别的背板ID号,判断是否出现连接器错插,并在连接器错插时能够对背板故障进行消除,实现对BMC的判断逻辑优化,减少资源调用。
此外,本发明设计原理可靠,结构简单,具有非常广泛的应用前景。
由此可见,本发明与现有技术相比,具有突出的实质性特点和显著的进步,其实施的有益效果也是显而易见的。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明的多个相同板卡共用时的区分结构的示意图。
图2是本发明的多个相同板卡共用时的区分结构连接器错接时的示意图。
图3是本发明的多个相同板卡共用时的区分方法实施例3流程示意图。
图4是本发明的多个相同板卡共用时的区分方法实施例4流程示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明中的技术方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
实施例1:
如图1所示,本发明提供一种多个相同板卡共用时的区分结构,包括服务器主板和两个背板,第一背板和第二背板;
服务器主板上设置有BMC,BMC连接有第一I2C扩展芯片和第二I2C扩展芯片;
第一I2C扩展芯片连接有两个第一带外连接器;
第二I2C扩展芯片连接有两个第一I2C连接器;
每个背板上均设置有CPLD、第二带外连接器和第二I2C连接器,每个背板还连接有一个硬盘;
每个背板的第二带外连接器与第一带外连接器及CPLD连接,CPLD与硬盘连接;
每个背板第二I2C连接器与第一I2C连接器及硬盘连接;
与同一背板的第二带外连接器和第二I2C连接器分别连接的第一带外连接器和第一I2C连接器为一个连接器组;
同一个连接组中的第一带外连接器和第一I2C连接器均连接上拉电阻或下拉电阻;
不同连接器组中的连接器连接上拉电阻和下拉电阻中的不同类型。
本发明提供的多个相同板卡共用时的区分结构,通过为连接器设置上下拉电阻的方式,实现BMC获取CPLD识别的背板ID号,判断是否出现连接器错插,并在连接器错插时能够对背板故障进行消除,实现对BMC的判断逻辑优化,减少资源调用。
实施例2:
如图1所示,本发明提供一种多个相同板卡共用时的区分结构,包括服务器主板和两个背板,第一背板和第二背板;
服务器主板上设置有BMC,BMC连接有第一I2C扩展芯片和第二I2C扩展芯片;第一I2C扩展芯片和第二I2C扩展芯片采用PCA9546型号的芯片;通过I2C扩展芯片实现BMC的I2C信号扩展,解决了BMC的I2C管脚不足的问题;
第一I2C扩展芯片连接有两个第一带外连接器;
第二I2C扩展芯片连接有两个第一I2C连接器;
第一背板和第二背板上均设置有CPLD、第二带外连接器和第二I2C连接器,每个背板还连接有一个硬盘;CPLD还连接有PCIE SWITCH芯片和SAS扩展芯片;CPLD获取到所在背板的ID号信息后,还将背板ID号通知背板上的PCIE SWITCH芯片和SAS扩展芯片,确保PCIESWITCH芯片和SAS扩展芯片可准确指定自身所在的背板,并识别对应命令;
每个背板的第二带外连接器与第一带外连接器及CPLD连接,CPLD与硬盘连接;
每个背板第二I2C连接器与第一I2C连接器及硬盘连接;
第一带外连接器与第二带外连接器通过带外I2C信号线连接,第二带外连接器与CPLD通过带外I2C信号线连接,CPLD与硬盘通过带外信号线连接;
第一I2C连接器与第二I2C连接器通过I2C信号线连接,第二I2C连接器与硬盘通过I2C信号线连接;BMC通过带外的方式通过带外I2C信号线与CPLD通信,控制背板逻辑,硬盘通过I2C信号线向BMC返回状态信息;
与第一背板的第二带外连接器和第二I2C连接器连接的第一带外连接器和第一I2C连接器为第一连接器组;
与第二背板的第二带外连接器和第二I2C连接器连接的第一带外连接器和第一I2C连接器为第二连接器组;
第一连接组的第一带外连接器和第一I2C连接器均连接下拉电阻;
第二连接组的第一带外连接器和第一I2C连接器均连接上拉电阻;一个连接器组的连接器接上拉电阻时,另一个连接器组的连接器接下拉电阻,从而可起到区分连接器的作用。
在上述实施例2中,若出现如图2所示的连接器错插时,第一连接器组的第一I2C连接器与第二背板的第二I2C连接器连接,第二连接器组的第一I2C连接器与第一背板的第二I2C连接器,同时第二背板连接的硬盘出现故障,原有不加上下拉电阻时,BMC会接收到第一连接器组的第一I2C连接器通过I2C信号返回的硬盘故障信号,此时BMC并不知道连接器错插,因此会通过第一连接器组的第一带外连接器向第一背板的CPLD发送控制信号,消除硬盘故障,但此时第一背板连接的硬盘并没有故障,而第二背板连接的硬盘故障又无法消除,会不断向BMC发出硬盘故障信号,因此会陷入死循环;
本申请中在第一连接器组的第一带外连接器和第一I2C连接器连接下拉电阻,而第二连接器组的第一带外连接器和第一I2C连接器连接上拉电阻后,BMC内部预设I2C通路对应的背板ID信息,第一连接器组的第一I2C连接器的I2C信号线匹配到背板ID号00和背板ID号10对应背板,第二连接器组的第一I2C连接器的I2C信号线匹配到背板ID号01和背板ID号11对应背板,第一连接器组的第一带外连接器上I2C信号线匹配到背板ID号00和背板ID号01对应背板,第二连接器组第一带外连接器的I2C信号线匹配到背板ID号10和背板ID号11对应背板,ID号01为连接器错接时第一背板ID号,而ID号00为连接器正确连接时第一背板ID号,而ID号10出现错插时第二背板的ID号,ID号11连接器正确连接时第二背板的ID号;
第一背板与第二背板的第二I2C连接器出现错插时,第一背板ID号为01,第二背板ID号为10,BMC可快速识别到连接器错插,若错插时,还同时发生背板故障,以第二背板连接的硬盘故障为例,BMC此时会抓取到来自第一连接器组的第一I2C连接器对应I2C线路的信息,匹配到ID号为10的第二背板,按照预留设计,BMC会发送命令从第二连接器组的第一带外连接器对应I2C信号线给给背板ID为10的第二背板的CPLD,控制背板逻辑,此时第二背板连接的硬盘可断电消除故障,并作出警示。
同理,背板其他部位故障时,也可识别到对应背板并发出命令给准确故障的背板,两个背板的第二带外连接器错插时,第一背板的ID号为10,第二背板的ID号为01。
同时,此设计下,通过背板ID号的识别,也可判断出多连接器时的连接关系是否正确,可以避免错插的情况,同时将错插时的影响降低。
实施例3:
如图3所示,本发明提供一种基于上述实施例1或实施例2的多个相同板卡共用时的区分方法,包括如下步骤:
S1.根据服务器主板的两个连接组的上下拉电阻设置生成服务器主板与背板的连接器关系表;
S2.将服务器主板与两个背板进行插接;
S3.BMC根据服务器主板与背板的连接器关系表判断两个背板与服务器主板的连接器是否出现错接;
S4.当两个背板与服务器主板的连接器正确连接时,BMC判断是否存在背板故障,并在存在背板故障时,识别出对应背板,消除故障;
S5.当两个背板与服务器主板的连接器出现错接时,BMC判断是否存在背板故障,并在存在背板故障时,识别出对应背板,消除故障。
本发明提供的多个相同板卡共用时的区分及方法,通过为连接器设置上下拉电阻的方式,实现BMC获取CPLD识别的背板ID号,判断是否出现连接器错插,并在连接器错插时能够对背板故障进行消除,实现对BMC的判断逻辑优化,减少资源调用。
实施例4:
如图4所示,本发明提供一种多个相同板卡共用时的区分方法,包括如下步骤:
S1.根据服务器主板的两个连接组的上下拉电阻设置生成服务器主板与背板的连接器关系表;具体步骤如下:
S11.将服务器主板同第一背板连接的连接器组连接下拉电阻,用0表示;
S12.将服务器主板同第二背板连接的连接器组连接上拉电阻,用1表示;
S13.生成服务器主板与背板的连接器关系表,其中,第一背板的第二带外连接器与第一连接器组的第一带外连接器连接,第一背板的第二I2C连接器与第一连接器组的第一I2C连接器连接时,对应第一背板ID号为00;
第一背板的第二带外连接器与第一连接器组的第一带外连接器连接,第一背板的第二I2C连接器与第二连接器组的第一I2C连接器与连接时,对应第一背板ID号01;
第二背板的第二带外连接器与第二连接器组的第一带外连接器连接,第二背板的第二I2C连接器与第一连接器组的第一I2C连接器连接时,对应第二背板ID号10;
第二背板的第二带外连接器与第二连接器组的第一带外连接器连接,第二背板的第二I2C连接器与第二连接器组的第一I2C连接器连接时,对应第二背板ID号11;硬盘背板的ID号是预先设计的,并且BMC提前获知;
S2.将服务器主板与两个背板进行插接;具体步骤如下:
S21.将服务器主板第一连接器组的第一带外连接器和第一I2C连接器分别与对应第一背板的第二带外连接器和第二I2C连接器连接;
S22.将服务器主板第二连接器组的第一带外连接器和第一I2C连接器分别与对应第二背板的第二带外连接器和第二I2C连接器连接;此处的连接方式为无连接器错接时的正确连接方式;
S3.BMC根据服务器主板与背板的连接器关系表判断两个背板与服务器主板的连接器是否出现错接;具体步骤如下:
S31.获取服务器主板与背板的连接器关系表中硬盘ID号00、01、10及11;
S32.判断第一背板ID号为00,第二背板ID号为11,还是第一背板ID号为01,第二背板ID号为10;
S33.当第一背板ID号为00,第二背板ID号为11时,判定两个背板与服务器主板的连接器正确连接,进入步骤S4;
S34.当第一背板ID号为01,第二背板ID号为10时,判定两个背板与服务器主板的连接器出现错接,进入步骤S5;步骤S34中的连接器错接指的是两背板的第二I2C连接器错接,本发明还存在两背板的第二带外连接器错接时的情形;
S4.当两个背板与服务器主板的连接器正确连接时,BMC判断是否存在背板故障,并在存在背板故障时,识别出对应背板,消除故障;具体步骤如下:
S41.BMC根据对应连接器组返回的I2C信号判断是否存在对应背板故障;背板故障包括硬盘故障;
若是,进入步骤S42;
若否,进入步骤S43;
S42.BMC通过对应带外连接器向对应背板的CPLD发送控制信号,消除背板故障;
S43.结束;没有连接器错接时,BMC通过正确背板的ID号即可通知故障背板所在CPLD即可,消除背板故障;
S5.当两个背板与服务器主板的连接器出现错接时,BMC判断是否存在背板故障,并在存在背板故障时,识别出对应背板,消除故障;具体步骤如下:
S51.BMC根据对应连接器组返回的I2C信号判断是否存在对应背板故障;背板故障包括硬盘故障;
若是,进入步骤S52;
若否,进入步骤S53;
S52.BMC通过对应带外连接器向对应背板的CPLD发送控制信号,消除背板故障;
S53.结束;出现两个背板的第二I2C错接时,需要准确识别出是哪个背板发生了故障,再通过BMC向对应背板发送控制,消除对应背板故障,从而避免逻辑出错,陷入死循环。
第一背板与第二背板的第二I2C连接器并未出现错插时,第一背板ID号为00,第二背板ID号为11,若此时发生背板故障,以第二背板连接的硬盘故障为例,BMC此时会抓取到来自第二连接器组的第一I2C连接器对应I2C线路的信息,匹配到ID号为11的第二背板,按照预留设计,BMC会发送命令从第二连接器组的第一带外连接器对应I2C信号线给背板ID为11的第二背板的CPLD,控制背板逻辑,此时第二背板连接的硬盘可断电消除故障,并作出警示。
第一背板与第二背板的第二I2C连接器出现错插时,第一背板ID号为01,第二背板ID号为10,BMC可快速识别到连接器错插,若错插时,还同时发生背板故障,以第二背板连接的硬盘故障为例,BMC此时会抓取到来自第一连接器组的第一I2C连接器对应I2C线路的信息,匹配到ID号为10的第二背板,按照预留设计,BMC会发送命令从第二连接器组的第一带外连接器对应I2C信号线给背板ID为10的第二背板的CPLD,控制背板逻辑,此时第二背板连接的硬盘可断电消除故障,并作出警示。
同理,背板其他部位故障时,也可识别到对应背板并发出命令给准确故障的背板,两个背板的第二带外连接器错插时,第一背板的ID号为10,第二背板的ID号为01。
同时,此设计下,通过背板ID号的识别,也可判断出多连接器时的连接关系是否正确,可以避免错插的情况,同时将错插时的影响降低。
尽管通过参考附图并结合优选实施例的方式对本发明进行了详细描述,但本发明并不限于此。在不脱离本发明的精神和实质的前提下,本领域普通技术人员可以对本发明的实施例进行各种等效的修改或替换,而这些修改或替换都应在本发明的涵盖范围内/任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。

Claims (10)

1.一种多个相同板卡共用时的区分结构,其特征在于,包括服务器主板和两个背板,第一背板和第二背板;
服务器主板上设置有BMC,BMC连接有第一I2C扩展芯片和第二I2C扩展芯片;
第一I2C扩展芯片连接有两个第一带外连接器;
第二I2C扩展芯片连接有两个第一I2C连接器;
每个背板上均设置有CPLD、第二带外连接器和第二I2C连接器,每个背板还连接有一个硬盘;
每个背板的第二带外连接器与第一带外连接器及CPLD连接,CPLD与硬盘连接;
每个背板第二I2C连接器与第一I2C连接器及硬盘连接;
与同一背板的第二带外连接器和第二I2C连接器分别连接的第一带外连接器和第一I2C连接器为一个连接器组;
同一个连接组中的第一带外连接器和第一I2C连接器均连接上拉电阻或下拉电阻;
不同连接器组中的连接器连接上拉电阻和下拉电阻中的不同类型。
2.如权利要求1所述的多个相同板卡共用时的区分结构,其特征在于,第一I2C扩展芯片和第二I2C扩展芯片采用PCA9546型号的芯片。
3.如权利要求1所述的多个相同板卡共用时的区分结构,其特征在于,第一带外连接器与第二带外连接器通过带外I2C信号线连接,第二带外连接器与CPLD通过带外I2C信号线连接,CPLD与硬盘通过带外信号线连接;
第一I2C连接器与第二I2C连接器通过I2C信号线连接,第二I2C连接器与硬盘通过I2C信号线连接。
4.如权利要求1所述的多个相同板卡共用时的区分结构,其特征在于,CPLD还连接有PCIE SWITCH芯片和SAS扩展芯片。
5.一种基于上述权利要求1-4中任一项的多个相同板卡共用时的区分方法,其特征在于,包括如下步骤:
S1.根据服务器主板的两个连接组的上下拉电阻设置生成服务器主板与背板的连接器关系表;
S2.将服务器主板与两个背板进行插接;
S3.BMC根据服务器主板与背板的连接器关系表判断两个背板与服务器主板的连接器是否出现错接;
S4.当两个背板与服务器主板的连接器正确连接时,BMC判断是否存在背板故障,并在存在背板故障时,识别出对应背板,消除故障;
S5.当两个背板与服务器主板的连接器出现错接时,BMC判断是否存在背板故障,并在存在背板故障时,识别出对应背板,消除故障。
6.如权利要求5所述的多个相同板卡共用时的区分方法,其特征在于,步骤S1具体步骤如下:
S11.将服务器主板同第一背板连接的连接器组连接下拉电阻,用0表示;
S12.将服务器主板同第二背板连接的连接器组连接上拉电阻,用1表示;
S13.生成服务器主板与背板的连接器关系表,其中,第一背板的第二带外连接器与第一连接器组的第一带外连接器连接,第一背板的第二I2C连接器与第一连接器组的第一I2C连接器连接时,对应第一背板ID号为00;
第一背板的第二带外连接器与第一连接器组的第一带外连接器连接,第一背板的第二I2C连接器与第二连接器组的第一I2C连接器连接时,对应第一背板ID号01;
第二背板的第二带外连接器与第二连接器组的第一带外连接器连接,第二背板的第二I2C连接器与第一连接器组的第一I2C连接器连接时,对应第二背板ID号10;
第二背板的第二带外连接器与第二连接器组的第一带外连接器连接,第二背板的第二I2C连接器与第二连接器组的第一I2C连接器连接时,对应第二背板ID号11。
7.如权利要求6所述的多个相同板卡共用时的区分方法,其特征在于,步骤S2具体步骤如下:
S21.将服务器主板第一连接器组的第一带外连接器和第一I2C连接器分别与对应第一背板的第二带外连接器和第二I2C连接器连接;
S22.将服务器主板第二连接器组的第一带外连接器和第一I2C连接器分别与对应第二背板的第二带外连接器和第二I2C连接器连接。
8.如权利要求7所述的多个相同板卡共用时的区分方法,其特征在于,步骤S3具体步骤如下:
S31.获取服务器主板与背板的连接器关系表中硬盘ID号00、01、10及11;
S32.判断第一背板ID号为00,第二背板ID号为11,还是第一背板ID号为01,第二背板ID号为10;
S33.当第一背板ID号为00,第二背板ID号为11时,判定两个背板与服务器主板的连接器正确连接,进入步骤S4;
S34.当第一背板ID号为01,第二背板ID号为10时,判定两个背板与服务器主板的连接器出现错接,进入步骤S5。
9.如权利要求8所述的多个相同板卡共用时的区分方法,其特征在于,步骤S4具体步骤如下:
S41.BMC根据对应连接器组返回的I2C信号判断是否存在对应背板故障;背板故障包括硬盘故障;
若是,进入步骤S42;
若否,进入步骤S43;
S42.BMC通过对应带外连接器向对应背板的CPLD发送控制信号,消除背板故障;
S43.结束。
10.如权利要求8所述的多个相同板卡共用时的区分方法,其特征在于,步骤S5具体步骤如下:
S51.BMC根据对应连接器组返回的I2C信号判断是否存在对应背板故障;背板故障包括硬盘故障;
若是,进入步骤S52;
若否,进入步骤S53;
S52.BMC通过对应带外连接器向对应背板的CPLD发送控制信号,消除背板故障;
S53.结束。
CN202111496775.9A 2021-12-08 2021-12-08 一种多个相同板卡共用时的区分结构及方法 Active CN114138540B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111496775.9A CN114138540B (zh) 2021-12-08 2021-12-08 一种多个相同板卡共用时的区分结构及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111496775.9A CN114138540B (zh) 2021-12-08 2021-12-08 一种多个相同板卡共用时的区分结构及方法

Publications (2)

Publication Number Publication Date
CN114138540A CN114138540A (zh) 2022-03-04
CN114138540B true CN114138540B (zh) 2023-11-03

Family

ID=80385494

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111496775.9A Active CN114138540B (zh) 2021-12-08 2021-12-08 一种多个相同板卡共用时的区分结构及方法

Country Status (1)

Country Link
CN (1) CN114138540B (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107577569A (zh) * 2017-09-12 2018-01-12 郑州云海信息技术有限公司 一种服务器硬盘连接结构及其应用方法
CN110377553A (zh) * 2019-06-26 2019-10-25 苏州浪潮智能科技有限公司 一种检测硬盘背板与主板port对应关系的方法及装置
CN112034947A (zh) * 2020-09-02 2020-12-04 苏州浪潮智能科技有限公司 增强服务器硬盘兼容性的背板设计系统和参数调优方法
CN112799894A (zh) * 2021-01-24 2021-05-14 苏州浪潮智能科技有限公司 一种服务器硬件识别方法及系统

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9377967B2 (en) * 2009-05-27 2016-06-28 Dell Products L.P. Systems and methods for scalable storage management
US8397053B2 (en) * 2010-02-03 2013-03-12 Inventec Corporation Multi-motherboard server system

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107577569A (zh) * 2017-09-12 2018-01-12 郑州云海信息技术有限公司 一种服务器硬盘连接结构及其应用方法
CN110377553A (zh) * 2019-06-26 2019-10-25 苏州浪潮智能科技有限公司 一种检测硬盘背板与主板port对应关系的方法及装置
CN112034947A (zh) * 2020-09-02 2020-12-04 苏州浪潮智能科技有限公司 增强服务器硬盘兼容性的背板设计系统和参数调优方法
CN112799894A (zh) * 2021-01-24 2021-05-14 苏州浪潮智能科技有限公司 一种服务器硬件识别方法及系统

Also Published As

Publication number Publication date
CN114138540A (zh) 2022-03-04

Similar Documents

Publication Publication Date Title
US10838816B2 (en) Detecting and sparing of optical PCIE cable channel attached IO drawer
US10417167B2 (en) Implementing sideband control structure for PCIE cable cards and IO expansion enclosures
US10467110B2 (en) Implementing cable failover in multiple cable PCI Express IO interconnections
CN110377553B (zh) 一种检测硬盘背板与主板port对应关系的方法及装置
US9697167B2 (en) Implementing health check for optical cable attached PCIE enclosure
US9697156B2 (en) Detecting and configuring of external IO enclosure
CN112069766A (zh) 一种服务器内减少硬盘背板线缆的方法及装置
CN111176913A (zh) 一种检测服务器中Cable Port的电路和方法
WO2014082275A1 (zh) 线缆插接情况的检测方法及装置
CN114443531A (zh) 一种服务器PCIe端口自动配置的系统、方法
CN114138540B (zh) 一种多个相同板卡共用时的区分结构及方法
CN115729872A (zh) 一种计算设备及pcie线缆连接的检测方法
CN113992501A (zh) 一种故障定位系统、方法及计算装置
US12002494B2 (en) Method and device for detecting hard disk connection and disconnection during a computer session
US11625354B2 (en) Circuit structure with automatic PCIe link configuration adjustment and method thereof
CN113868037B (zh) 一种判断硬盘背板线缆连接准确性的系统和方法
CN113505045B (zh) 一种硬盘故障展示方法、装置以及服务器
TWI837980B (zh) 具擴展性的傳輸線檢測系統及其方法
CN112666447B (zh) 一种应用于双冗余架构设备的板位识别电路
CN118170712A (zh) 一种控制板和服务器
CN114661546A (zh) 服务器线缆的检测系统及其通信方法
CN117648239A (zh) 一种外接设备的误插检测方法及计算设备
CN117667818A (zh) 信号传输结构、服务器以及信号传输方法
CN115904024A (zh) 一种多模硬盘背板结构、方法及服务器
CN118035138A (zh) 磁盘属性信息的获取方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant