CN102486746A - 服务器及其检测pci系统错误的方法 - Google Patents

服务器及其检测pci系统错误的方法 Download PDF

Info

Publication number
CN102486746A
CN102486746A CN2010105723899A CN201010572389A CN102486746A CN 102486746 A CN102486746 A CN 102486746A CN 2010105723899 A CN2010105723899 A CN 2010105723899A CN 201010572389 A CN201010572389 A CN 201010572389A CN 102486746 A CN102486746 A CN 102486746A
Authority
CN
China
Prior art keywords
pci
server
management controller
pci system
mistake
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2010105723899A
Other languages
English (en)
Inventor
范存辉
彭建
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hongfujin Precision Industry Shenzhen Co Ltd
Hon Hai Precision Industry Co Ltd
Original Assignee
Hongfujin Precision Industry Shenzhen Co Ltd
Hon Hai Precision Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hongfujin Precision Industry Shenzhen Co Ltd, Hon Hai Precision Industry Co Ltd filed Critical Hongfujin Precision Industry Shenzhen Co Ltd
Priority to CN2010105723899A priority Critical patent/CN102486746A/zh
Priority to US13/305,755 priority patent/US20120144245A1/en
Publication of CN102486746A publication Critical patent/CN102486746A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0766Error or fault reporting or storing
    • G06F11/0787Storage of error reports, e.g. persistent data storage, storage using memory protection

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Debugging And Monitoring (AREA)

Abstract

一种服务器,包括相互连接的北桥与基板管理控制器,所述北桥通过PCI总线与PCI设备进行通信,所述北桥包括:检测模块,用于检测所述PCI总线是否发生PCI系统错误;及第一通知模块,用于通知基板管理控制器是否检测到PCI系统错误;所述基板管理控制器包括记录模块,用于在收到PCI系统错误通知后,在基板管理控制器中记录PCI系统错误信息。本发明还提供一种服务器检测PCI系统错误的方法。本发明能够在服务器启动就绪后检测PCI系统错误。

Description

服务器及其检测PCI系统错误的方法
技术领域
本发明涉及一种总线错误检测系统及方法,特别是关于一种服务器及其检测PCI系统错误的方法。
背景技术
服务器北桥的PCI(peripheral component interconnect,外围部件互连)错误分为奇偶校验错误和系统错误两种。PCI奇偶校验错误是由于PCI信号的串扰所引起。在发生奇偶校验错误后,数据将被重新传送。如果几次重传都不成功,将引发PCI系统错误。现有技术只能在服务器启动时检测PCI系统错误,在启动就绪之后,就无法对PCI系统错误进行检测。
发明内容
鉴于以上内容,有必要提供一种服务器,能够在启动就绪后检测PCI系统错误。
此外,还有必要提供一种服务器检测PCI系统错误的方法,能够在服务器启动就绪后检测PCI系统错误。
一种服务器,包括相互连接的北桥与基板管理控制器,所述北桥通过PCI总线与PCI设备进行通信,所述北桥包括:检测模块,用于检测所述PCI总线是否发生PCI系统错误;及第一通知模块,用于通知基板管理控制器是否检测到PCI系统错误;所述基板管理控制器包括:记录模块,用于在收到PCI系统错误通知后,在基板管理控制器中记录PCI系统错误信息。
一种服务器检测PCI系统错误的方法,所述服务器包括相互连接的北桥与基板管理控制器,所述北桥通过PCI总线与PCI设备进行通信,该方法包括步骤:北桥检测PCI总线是否发生PCI系统错误;北桥通知基板管理控制器是否检测到PCI系统错误;及收到PCI系统错误通知后,基板管理控制器记录PCI系统错误信息。
本发明利用北桥检测PCI系统错误并通知基板管理控制器,实现了在服务器启动就绪后检测PCI系统错误。
附图说明
图1为本发明服务器较佳实施例的应用环境示意图。
图2为图1所示服务器检测PCI系统错误的方法较佳实施例的流程图。
主要元件符号说明
  服务器   10
  北桥   11
  基板管理控制器   12
  南桥   13
  基本输入输出系统   14
  PCI总线   15
  检测模块   110
  第一通知模块   111
  记录模块   120
  第二通知模块   121
具体实施方式
参阅图1所示,是本发明服务器较佳实施例的架构图。所述服务器10包括,但不限于,北桥11、基板管理控制器12与南桥13。服务器10安装有基本输入输出系统14。基板管理控制器12与北桥11及南桥13通信连接。北桥11通过PCI(peripheral component interconnect,外围部件互连)总线15与PCI设备(图中未画出)通信连接。PCI总线15的错误分为奇偶校验错误和系统错误两种。PCI奇偶校验错误是由于PCI信号的串扰所引起。在发生PCI奇偶校验错误后,数据将被重新传送。如果几次重传都不成功,将引发PCI系统错误。
所述北桥11包括检测模块110及第一通知模块111。所述检测模块110用于检测PCI总线15是否发生PCI系统错误。在本实施例中,北桥11配置有专用的寄存器记录PCI总线15的状态,检测模块110从该寄存器读取PCI总线15的状态,以确定是否发生PCI系统错误。所述第一通知模块111用于通知基板管理控制器12是否检测到PCI系统错误。在本实施例中,第一通知模块111向基板管理控制器12输出第一通知信号,来通知基板管理控制器12是否检测到PCI系统错误。例如,在未检测到PCI系统错误时,第一通知模块111输出高电平的第一通知信号,在检测到PCI系统错误后,第一通知模块111输出低电平的第一通知信号。所述第一通知信号可以是GPIO(general purposeinput/output,通用输入输出)信号。
所述基板管理控制器12包括记录模块120及第二通知模块121。所述记录模块120在收到来自于北桥11的PCI系统错误通知后,在基板管理控制器12中记录PCI系统错误信息。例如,若收到低电平的第一通知信号,表明检测到PCI系统错误,则记录模块120在基板管理控制器12中记录PCI系统错误信息。服务器10从基板管理控制器12读取PCI系统错误信息,即可了解PCI系统错误的详细情况。所述第二通知模块121用于收到来自于北桥11的PCI系统错误通知后,通知基本输入输出系统14发生了PCI系统错误。在本实施例中,第二通知模块121通过向南桥13触发系统管理中断来通知基本输入输出系统14发生了PCI系统错误。举例来说,第二通知模块121向南桥13输出第二通知信号,假设所述系统管理中断由低电平触发,当未发生PCI系统错误时,第二通知模块121输出高电平的第二通知信号,在发生PCI系统错误后,第二通知模块121拉低第二通知信号并将拉低的第二通知信号维持指定时间(例如1-2秒),在所述指定时间到达后,再将第二通知信号恢复高电平。若检测到所述系统管理中断,则基本输入输出系统14获知发生了PCI系统错误。所述第二通知信号可以是GPIO信号。
在本实施例中,若收到来自于基板管理控制器12的PCI系统错误通知,基本输入输出系统14在系统日志中记录PCI系统错误信息。
参阅图2所示,是图1所示服务器检测PCI系统错误的方法较佳实施例的流程图。
步骤S201,检测模块110检测PCI总线15是否发生PCI系统错误。在本实施例中,北桥11配置有专用的寄存器记录PCI总线15的状态,检测模块110从该寄存器读取PCI总线15的状态,以确定是否发生PCI系统错误。
步骤S202,第一通知模块111通知基板管理控制器12是否检测到PCI系统错误。在本实施例中,第一通知模块111向基板管理控制器12输出第一通知信号,来通知基板管理控制器12是否检测到PCI系统错误。例如,在未检测到PCI系统错误时,第一通知模块111输出高电平的第一通知信号;在检测到PCI系统错误后,第一通知模块111输出低电平的第一通知信号。所述第一通知信号可以是GPIO信号。
若收到来自于北桥11的PCI系统错误通知,步骤S203,记录模块120在基板管理控制器12中记录PCI系统错误信息。例如,若收到低电平的第一通知信号,表明发生PCI系统错误,则记录模块120在基板管理控制器12中记录PCI系统错误信息。
若收到来自于北桥11的PCI系统错误通知,步骤S204,第二通知模块121通知基本输入输出系统14发生了PCI系统错误。在本实施例中,第二通知模块121通过向南桥13触发系统管理中断来通知基本输入输出系统14发生了PCI系统错误。举例来说,第二通知模块121向南桥13输出第二通知信号,假设所述系统管理中断由低电平触发,当未发生PCI系统错误时,第二通知模块121输出高电平的第二通知信号,在发生PCI系统错误后,第二通知模块121拉低第二通知信号并将拉低的第二通知信号维持指定时间(例如1-2秒),在所述指定时间到达后,再将第二通知信号恢复高电平。若检测到所述系统管理中断,则基本输入输出系统14获知发生了PCI系统错误。所述第二通知信号可以是GPIO信号。
若收到来自于基板管理控制器12的PCI系统错误通知,步骤S205,基本输入输出系统14在系统日志中记录PCI系统错误信息。
上述实施例举例说明PCI总线15的系统错误的检测方法,对于PCI总线的变种或改进(例如PCIX总线与PCIE总线),本发明同样适用于侦测该总线的系统错误。

Claims (10)

1.一种服务器,包括相互连接的北桥与基板管理控制器,所述北桥通过PCI总线与PCI设备进行通信,其特征在于,所述北桥包括:
检测模块,用于检测所述PCI总线是否发生PCI系统错误;及
第一通知模块,用于通知基板管理控制器是否检测到PCI系统错误;
所述基板管理控制器包括:
记录模块,用于在收到PCI系统错误通知后,在基板管理控制器中记录PCI系统错误信息。
2.如权利要求1所述的服务器,其特征在于,所述服务器安装有基本输入输出系统,所述基板管理控制器还包括第二通知模块,用于在收到PCI系统错误通知后,通知基本输入输出系统发生了PCI系统错误。
3.如权利要求2所述的服务器,其特征在于,所述服务器还包括南桥,所述第二通知模块通过向南桥触发系统管理中断来通知基本输入输出系统发生了PCI系统错误。
4.如权利要求2所述的服务器,其特征在于,所述基本输入输出系统在收到PCI系统错误通知后,在系统日志中记录PCI系统错误信息。
5.如权利要求1所述的服务器,其特征在于,所述第一通知模块通过输出GPIO信号来通知基板管理控制器是否检测到PCI系统错误。
6.一种服务器检测PCI系统错误的方法,所述服务器包括相互连接的北桥与基板管理控制器,所述北桥通过PCI总线与PCI设备进行通信,其特征在于,该方法包括步骤:
北桥检测PCI总线是否发生PCI系统错误;
北桥通知基板管理控制器是否检测到PCI系统错误;及
收到PCI系统错误通知后,基板管理控制器记录PCI系统错误信息。
7.如权利要求6所述的服务器检测PCI系统错误的方法,其特征在于,该方法还包括:
收到PCI系统错误通知后,基板管理控制器通知服务器的基本输入输出系统发生了PCI系统错误。
8.如权利要求7所述的服务器检测PCI系统错误的方法,其特征在于,所述基板管理控制器通过向服务器的南桥触发系统管理中断来通知基本输入输出系统发生了PCI系统错误。
9.如权利要求7所述的服务器检测PCI系统错误的方法,其特征在于,该方法还包括:
收到PCI系统错误通知后,基本输入输出系统在系统日志中记录PCI系统错误信息。
10.如权利要求6所述的服务器检测PCI系统错误的方法,其特征在于,所述北桥通过输出GPIO信号来通知基板管理控制器是否检测到PCI系统错误。
CN2010105723899A 2010-12-03 2010-12-03 服务器及其检测pci系统错误的方法 Pending CN102486746A (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN2010105723899A CN102486746A (zh) 2010-12-03 2010-12-03 服务器及其检测pci系统错误的方法
US13/305,755 US20120144245A1 (en) 2010-12-03 2011-11-29 Computing device and method for detecting pci system errors in the computing device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2010105723899A CN102486746A (zh) 2010-12-03 2010-12-03 服务器及其检测pci系统错误的方法

Publications (1)

Publication Number Publication Date
CN102486746A true CN102486746A (zh) 2012-06-06

Family

ID=46152243

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2010105723899A Pending CN102486746A (zh) 2010-12-03 2010-12-03 服务器及其检测pci系统错误的方法

Country Status (2)

Country Link
US (1) US20120144245A1 (zh)
CN (1) CN102486746A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104781790A (zh) * 2012-12-27 2015-07-15 英特尔公司 用信号通知软件可恢复错误
CN112988442A (zh) * 2021-03-05 2021-06-18 山东英信计算机技术有限公司 一种服务器运行阶段传送故障信息的方法和设备

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8793538B2 (en) * 2012-01-30 2014-07-29 Hewlett-Packard Development Company, L.P. System error response
CN104122939A (zh) * 2013-04-23 2014-10-29 英业达科技有限公司 伺服器系统
CN104424042A (zh) * 2013-08-23 2015-03-18 鸿富锦精密工业(深圳)有限公司 错误处理系统和方法
US11921582B2 (en) * 2022-04-29 2024-03-05 Microsoft Technology Licensing, Llc Out of band method to change boot firmware configuration

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1652121A (zh) * 2005-03-24 2005-08-10 威盛电子股份有限公司 中央处理器与北桥芯片共构模块
US20050235083A1 (en) * 2004-04-19 2005-10-20 Yuji Tsushima Computer system
US20080256400A1 (en) * 2007-04-16 2008-10-16 Chih-Cheng Yang System and Method for Information Handling System Error Handling
CN201281836Y (zh) * 2008-09-17 2009-07-29 研华股份有限公司 工业计算机长板的防弯结构

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6018810A (en) * 1997-12-12 2000-01-25 Compaq Computer Corporation Fault-tolerant interconnection means in a computer system
KR100293950B1 (ko) * 1998-01-22 2001-08-07 윤종용 주변소자 내부연결 버스 모니터를 이용한 장애 감지 장치 및 방법
US6898740B2 (en) * 2001-01-25 2005-05-24 Hewlett-Packard Development Company, L.P. Computer system having configurable core logic chipset for connection to a fault-tolerant accelerated graphics port bus and peripheral component interconnect bus
JP4218538B2 (ja) * 2004-01-28 2009-02-04 日本電気株式会社 コンピュータシステム、バスコントローラ及びそれらに用いるバス障害処理方法
JP4961833B2 (ja) * 2006-05-19 2012-06-27 日本電気株式会社 クラスタシステム、負荷分散方法、最適化クライアントプログラム、及び調停サーバプログラム
US7660937B2 (en) * 2006-06-28 2010-02-09 Hewlett-Packard Development Company, L.P. Emulating a USB host controller
JP4513852B2 (ja) * 2007-11-07 2010-07-28 日本電気株式会社 Pciバス障害リカバリ方法及びプログラム
JP4873073B2 (ja) * 2009-12-16 2012-02-08 日本電気株式会社 情報処理装置及び情報処理装置の障害復旧方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050235083A1 (en) * 2004-04-19 2005-10-20 Yuji Tsushima Computer system
CN1652121A (zh) * 2005-03-24 2005-08-10 威盛电子股份有限公司 中央处理器与北桥芯片共构模块
US20080256400A1 (en) * 2007-04-16 2008-10-16 Chih-Cheng Yang System and Method for Information Handling System Error Handling
CN201281836Y (zh) * 2008-09-17 2009-07-29 研华股份有限公司 工业计算机长板的防弯结构

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104781790A (zh) * 2012-12-27 2015-07-15 英特尔公司 用信号通知软件可恢复错误
CN104781790B (zh) * 2012-12-27 2017-12-29 英特尔公司 用信号通知软件可恢复错误
CN112988442A (zh) * 2021-03-05 2021-06-18 山东英信计算机技术有限公司 一种服务器运行阶段传送故障信息的方法和设备
CN112988442B (zh) * 2021-03-05 2023-03-24 山东英信计算机技术有限公司 一种服务器运行阶段传送故障信息的方法和设备

Also Published As

Publication number Publication date
US20120144245A1 (en) 2012-06-07

Similar Documents

Publication Publication Date Title
CN102486746A (zh) 服务器及其检测pci系统错误的方法
US9324294B2 (en) Graphics system for supporting multiple digital display interface standards
CN102446146B (zh) 服务器及其避免总线冲突的方法
CN109143954B (zh) 一种实现控制器复位的系统及方法
CN103164354A (zh) 具有通用异步接收发送装置的电子设备及输入控制方法
US9026685B2 (en) Memory module communication control
CN112639753B (zh) 聚合带内中断
CN105323107A (zh) 网络接口卡信息管理方法及网络接口卡信息管理系统
US8477110B2 (en) Driving circuit for driving a liquid crystal display panel
US8392638B2 (en) Master-slave device communication circuit and ID address setting method thereof
CN103164366A (zh) 具有通用输入输出扩展器的电子设备及信号侦测方法
CN102375775B (zh) 一种具有检测系统不可恢复错误指示信号的计算机系统
US20170116066A1 (en) Fault detecting system and method for server
US8391162B2 (en) Apparatus and method for testing SMNP cards
CN106708675A (zh) 一种计算机启动前故障检测方法
CN104123204A (zh) Lpc总线检测系统及方法
US11733689B2 (en) Control system, programmable logic controller, and information processing method
CN102722430A (zh) 一种检测安全数码卡热插拔的方法及装置
CN109582634B (zh) 总线系统
CN104035844A (zh) 一种故障测试方法及电子设备
CN103684404B (zh) 差错检测时的高速数据传输方法和系统
CN114328080A (zh) 一种固件状态检测的方法及装置、电子设备
TW201007440A (en) Method of control in a multimedia data service system and system thereof
CN105760325A (zh) 支持usb存储设备在dos系统下热插拔的系统及方法
CN104182370B (zh) 一种数据传输方法、装置及移动终端

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20120606