JP6862988B2 - Server system, switch module and log acquisition method - Google Patents

Server system, switch module and log acquisition method Download PDF

Info

Publication number
JP6862988B2
JP6862988B2 JP2017060976A JP2017060976A JP6862988B2 JP 6862988 B2 JP6862988 B2 JP 6862988B2 JP 2017060976 A JP2017060976 A JP 2017060976A JP 2017060976 A JP2017060976 A JP 2017060976A JP 6862988 B2 JP6862988 B2 JP 6862988B2
Authority
JP
Japan
Prior art keywords
switch module
communication
log
failure
communication path
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2017060976A
Other languages
Japanese (ja)
Other versions
JP2018163557A (en
Inventor
正崇 佐藤
正崇 佐藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2017060976A priority Critical patent/JP6862988B2/en
Publication of JP2018163557A publication Critical patent/JP2018163557A/en
Application granted granted Critical
Publication of JP6862988B2 publication Critical patent/JP6862988B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Computer And Data Communications (AREA)
  • Debugging And Monitoring (AREA)

Description

本発明は、サーバシステムのログを取得する技術に関する。 The present invention relates to a technique for acquiring a log of a server system.

ブレードサーバは、一般に、筐体内に複数のサーバと複数のスイッチモジュールを搭載し、各サーバは、スイッチモジュールを介して、他のサーバや外部と通信を行っている。このようなブレードサーバにおいて、例えば、サーバとスイッチモジュールとの間の通信において障害(通信障害)が発生した場合、ブレードサーバに搭載されている各コンポーネントがそれぞれ生成し記憶している通信障害に関連するログを採取して解析することによって、通信障害の原因を解析することが行われている。 A blade server generally includes a plurality of servers and a plurality of switch modules in a housing, and each server communicates with another server or the outside via the switch module. In such a blade server, for example, when a failure (communication failure) occurs in the communication between the server and the switch module, it is related to the communication failure generated and stored by each component mounted on the blade server. The cause of the communication failure is analyzed by collecting and analyzing the log.

例えば、サーバが生成して記憶しているログを用いて、通信障害の原因を解析することが行われている。サーバが記憶しているログファイルには、通信障害に関するログ以外にも、サーバ動作に関連したログが多数含まれている。よって、通信障害の原因を解析する際には、管理者等により、通信障害に直接関連するログを、ログファイルから抽出することが行われている。 For example, the cause of a communication failure is analyzed using a log generated and stored by a server. The log file stored by the server contains many logs related to server operation in addition to logs related to communication failures. Therefore, when analyzing the cause of the communication failure, the administrator or the like extracts the log directly related to the communication failure from the log file.

また、サーバには、拡張PCIe(Peripheral Component Interconnect Express)スロットが設けられており、NIC(Network Interface Card)を増設することが可能である。さらに、NICは、物理ポートを論理的に複数のポートに分割して使用することができる機能を有する場合がある。そのため、サーバの構成によっては、多数のLAN(Local Area Network)ポートが存在するので、管理者等は、通信障害の発生したLANポートに関連するログを、ログファイルから抽出する必要がある。 Further, the server is provided with an expansion PCIe (Peripheral Component Interface Express) slot, and a NIC (Network Interface Card) can be added. Further, the NIC may have a function of logically dividing a physical port into a plurality of ports for use. Therefore, depending on the server configuration, there are many LAN (Local Area Network) ports, so the administrator or the like needs to extract the log related to the LAN port in which the communication failure has occurred from the log file.

スイッチモジュールが生成して記憶しているログを用いて、通信障害の原因を解析することも行われている。スイッチモジュールが記憶しているログを通信障害の原因の解析に用いる場合、スイッチモジュールと接続しているNICを特定する情報が必要になる。そこで、管理者等は、例えば、スイッチモジュールとサーバとの間でリンクダウンまたはリンクアップが検出された際にスイッチモジュールで生成されたログメッセージを確認し、スイッチモジュールと接続しているNICを特定することがある。しかしながら、上記ログメッセージには、スイッチモジュールと接続しているNICを特定する情報(MACアドレスなど)が出力されていない場合が多い。そのため、管理者等は、スイッチモジュールが記憶している他のログを確認し、スイッチモジュールと接続しているNICを特定している。 The cause of the communication failure is also analyzed using the log generated and stored by the switch module. When the log stored in the switch module is used for analysis of the cause of the communication failure, information for identifying the NIC connected to the switch module is required. Therefore, the administrator, for example, checks the log message generated by the switch module when a link down or link up is detected between the switch module and the server, and identifies the NIC connected to the switch module. I have something to do. However, in many cases, the log message does not output information (MAC address, etc.) that identifies the NIC connected to the switch module. Therefore, the administrator or the like confirms other logs stored in the switch module and identifies the NIC connected to the switch module.

ブレードサーバ全体を管理するモジュール(以下、管理モジュールとも称する)が記憶しているログを用いて通信障害の原因を解析することも行われている。管理モジュールは、ブレードサーバの筐体内に格納された各コンポーネントが生成して記憶しているログを集約して、保持している。管理者等は、管理モジュールに集約されているログを解析することによって、通信障害の原因を解析している。 The cause of the communication failure is also analyzed using the log stored in the module that manages the entire blade server (hereinafter, also referred to as the management module). The management module aggregates and holds the logs generated and stored by each component stored in the chassis of the blade server. Administrators and others analyze the causes of communication failures by analyzing the logs collected in the management module.

一方、障害に関連するログを取得する技術は、広く知られている。 On the other hand, techniques for acquiring logs related to failures are widely known.

例えば、特許文献1には、ログ情報が所定期間以上取得されない場合、ログ情報の格納先を、少なくとも2面のバッファのいずれかの間で切り替えることにより、障害発生前後のコンソールログを保存する技術が開示されている。 For example, Patent Document 1 describes a technique for saving console logs before and after a failure by switching the storage destination of log information between at least two buffers when log information is not acquired for a predetermined period or longer. Is disclosed.

また、特許文献2には、プロセッサに障害が発生した場合、主記憶装置に保存されたプロセッサの動作ログを、DMA(Direct Memory Access)機構を用いて、高速に取得する技術が開示されている。また、特許文献2には、主記憶装置のアドレス空間にマッピングされたPCIeカードのレジスタダンプを、DMA機構を用いて取得する技術も開示されている。 Further, Patent Document 2 discloses a technique for acquiring an operation log of a processor stored in a main memory at high speed by using a DMA (Direct Memory Access) mechanism when a failure occurs in the processor. .. Further, Patent Document 2 also discloses a technique for acquiring a register dump of a PCIe card mapped to the address space of a main storage device by using a DMA mechanism.

また、特許文献3には、被監視装置が有する各レジスタから定期的に取得したレジスタダンプと、障害発生後に取得したレジスタダンプを異なる領域に格納する技術が開示されている。特許文献3では、CPU(Central Processing Unit)のコアは、低速伝送路を介してレジスタダンプを取得し、取得したレジスタダンプをRAM(Random Access Memory)の所定の領域に格納している。 Further, Patent Document 3 discloses a technique of storing a register dump periodically acquired from each register of the monitored device and a register dump acquired after a failure occurs in different areas. In Patent Document 3, the core of the CPU (Central Processing Unit) acquires a register dump via a low-speed transmission line, and stores the acquired register dump in a predetermined area of a RAM (Random Access Memory).

国際公開第2013/008281号International Publication No. 2013/008281 特開2014−182676号公報Japanese Unexamined Patent Publication No. 2014-182676 特開2014−026567号公報Japanese Unexamined Patent Publication No. 2014-0265667

上述したように、ブレードサーバにおけるサーバとスイッチモジュールとの間に発生した通信障害の原因を解析する際に、サーバが記憶しているログを用いる場合、管理者等は、ログファイルに多数含まれているログから、通信障害に関連するログを抽出して確認する作業を行う必要がある。 As described above, when using the log stored in the server when analyzing the cause of the communication failure that occurred between the server and the switch module in the blade server, many administrators etc. are included in the log file. It is necessary to extract the log related to the communication failure from the existing log and check it.

また、スイッチモジュールが記憶しているログを用いる場合、上述したように、管理者等は、スイッチモジュールが記憶している他のログを確認し、スイッチモジュールと接続しているNICを特定することが多い。このとき、スイッチモジュールが記憶しているログに含まれるMACアドレステーブルが、スイッチモジュールの接続相手の特定に用いられる場合がある。しかしながら、MACアドレステーブルには、一定時間を過ぎるとMACアドレスが消去される場合や、通信が行われていない際にはMACアドレスが登録されていない場合がある。よって、管理者等は、スイッチモジュール以外のコンポーネントが記憶しているログを確認する必要がある。 When using the log stored in the switch module, as described above, the administrator or the like should check other logs stored in the switch module and identify the NIC connected to the switch module. There are many. At this time, the MAC address table included in the log stored in the switch module may be used to identify the connection partner of the switch module. However, in the MAC address table, the MAC address may be deleted after a certain period of time, or the MAC address may not be registered when communication is not performed. Therefore, the administrator or the like needs to check the logs stored in the components other than the switch module.

また、管理モジュールは、各コンポーネントが生成したログを集約し保持する機能を有しているが、それらを相互に関連付ける機能は有していない場合が多い。そのため、ログを解析する前に、管理者等は、集約されたログの中から通信障害の原因を解析するために必要な情報を抜き出し、さらに、ログの内容を突き合わせ、比較検討する必要がある。 In addition, the management module has a function of aggregating and holding logs generated by each component, but often does not have a function of associating them with each other. Therefore, before analyzing the log, the administrator or the like needs to extract the information necessary for analyzing the cause of the communication failure from the aggregated log, and further compare and compare the contents of the log. ..

このように、サーバとスイッチモジュールとの間の通信障害が発生した際に、その原因を解析するためには、管理者等が通信障害に直接関係のないログを確認しなくてはならないので、通信障害の原因解析に手間がかかるという課題がある。 In this way, when a communication failure occurs between the server and the switch module, the administrator or the like must check the log that is not directly related to the communication failure in order to analyze the cause. There is a problem that it takes time and effort to analyze the cause of the communication failure.

上記特許文献1乃至3には、上記課題を解決する技術は開示されていない。 Patent Documents 1 to 3 do not disclose a technique for solving the above problems.

本願発明は、このような課題に鑑みてなされたものであり、サーバとスイッチモジュールとの間に発生した障害の原因の解析を、効率的に行うことができるサーバシステム等を提供することを主要な目的とする。 The present invention has been made in view of such a problem, and its main purpose is to provide a server system or the like capable of efficiently analyzing the cause of a failure occurring between a server and a switch module. Purpose.

本発明の一態様にかかるサーバシステムは、サーバに設けられた複数の通信手段と、前記複数の通信手段と、第1の通信路を介してそれぞれ接続されたスイッチモジュールと、前記複数の通信手段と前記スイッチモジュールとをそれぞれ接続し、前記第1の通信路とそれぞれ関連付けられた第2の通信路とを備え、前記スイッチモジュールは、前記第1の通信路のいずれかに関して障害が検出されると、前記障害が検出された前記第1の通信路を介した前記スイッチモジュールの接続相手である前記通信手段が生成した、前記第1の通信路に関する前記障害のログを、前記障害が検出された前記第1の通信路と関連付けられた前記第2の通信路を介して取得する取得手段を備える。 The server system according to one aspect of the present invention includes a plurality of communication means provided in the server, the plurality of communication means, a switch module connected via a first communication path, and the plurality of communication means. And the switch module are connected to each other, the first communication path and the second communication path associated with the first communication path are provided, and the switch module detects a failure with respect to any one of the first communication paths. And, the failure is detected in the failure log regarding the first communication path generated by the communication means which is the connection partner of the switch module via the first communication path in which the failure is detected. The acquisition means is provided through the second communication path associated with the first communication path.

本発明の一態様にかかるスイッチモジュールは、サーバに設けられた複数の通信手段と、第1の通信路を介してそれぞれ接続されたスイッチモジュールであって、前記複数の通信手段と、前記第1の通信路とそれぞれ関連付けられた第2の通信路を介してそれぞれ接続され、前記第1の通信路のいずれかに関して障害が検出されると、前記障害が検出された前記第1の通信路を介した前記スイッチモジュールの接続相手である前記通信手段が生成した、前記第1の通信路に関する前記障害のログを、前記障害が検出された前記第1の通信路と関連付けられた前記第2の通信路を介して取得する取得手段を備える。 The switch module according to one aspect of the present invention is a switch module connected to a plurality of communication means provided in the server via a first communication path, respectively, and the plurality of communication means and the first communication means. When a failure is detected in any of the first communication paths, the first communication path in which the failure is detected is used. The failure log for the first communication path generated by the communication means to which the switch module is connected via the switch module is associated with the first communication path in which the failure is detected. It is provided with an acquisition means for acquisition via a communication path.

本発明の一態様にかかるログ取得方法は、サーバに設けられた複数の通信手段とスイッチモジュールとをそれぞれ接続する第1の通信路のいずれかに関して障害が検出されると、前記障害が検出された前記第1の通信路を介した前記スイッチモジュールの接続相手である前記通信手段が生成した、前記第1の通信路に関する前記障害のログを、記複数の通信手段と前記スイッチモジュールとをそれぞれ接続し、前記障害が検出された前記第1の通信路と関連付けられた第2の通信路を介して取得する。 In the log acquisition method according to one aspect of the present invention, when a failure is detected in any of the first communication paths connecting the plurality of communication means provided in the server and the switch module, the failure is detected. A log of the failure related to the first communication path generated by the communication means to which the switch module is connected via the first communication path is recorded, and the plurality of communication means and the switch module are described, respectively. It connects and acquires through the second communication path associated with the first communication path in which the failure is detected.

本発明によれば、サーバとスイッチモジュールとの間に発生した障害の原因の解析を、効率的に行うことができるという効果を奏する。 According to the present invention, there is an effect that the cause of the failure occurring between the server and the switch module can be efficiently analyzed.

本発明の第1の実施形態に係るブレードサーバに搭載される要素の構成を概略的に示す図である。It is a figure which shows roughly the structure of the element mounted on the blade server which concerns on 1st Embodiment of this invention. 本発明の第1の実施形態に係るブレードサーバに搭載されるNICとスイッチモジュールの各構成と、相互の接続関係を示す図である。It is a figure which shows each structure of the NIC and the switch module mounted on the blade server which concerns on 1st Embodiment of this invention, and the mutual connection relationship. 本発明の第1の実施形態に係るブレードサーバに搭載されるNICとスイッチモジュールとの間の通信接続時の動作を説明する図である。It is a figure explaining the operation at the time of communication connection between the NIC mounted on the blade server which concerns on 1st Embodiment of this invention, and a switch module. 本発明の第1の実施形態に係るブレードサーバに搭載されるNICとスイッチモジュールとの間の通信に障害が発生した際の、NICとスイッチモジュールの動作を説明する図である。It is a figure explaining the operation of the NIC and the switch module when the communication between the NIC and the switch module mounted on the blade server which concerns on 1st Embodiment of this invention occurs. 本発明の第2の実施形態に係るブレードサーバに搭載されるNICとスイッチモジュールの各構成と、相互の接続関係を示す図である。It is a figure which shows each structure of the NIC and the switch module mounted on the blade server which concerns on 2nd Embodiment of this invention, and the mutual connection relationship. 本発明の第2の実施形態に係るブレードサーバに搭載されるNICとスイッチモジュールとの間の通信接続時の動作を説明する図である。It is a figure explaining the operation at the time of communication connection between the NIC mounted on the blade server which concerns on 2nd Embodiment of this invention, and a switch module. 本発明の第2の実施形態に係るブレードサーバに搭載されるNICとスイッチモジュールとの間の通信に障害が発生した際の、NICとスイッチモジュールの動作を説明する図である。It is a figure explaining the operation of the NIC and the switch module when the communication between the NIC and the switch module mounted on the blade server which concerns on the 2nd Embodiment of this invention occurs. 本発明の第3の実施形態に係るブレードサーバに搭載されるNICとスイッチモジュールの各構成と、相互の接続関係を示す図である。It is a figure which shows each structure of the NIC and the switch module mounted on the blade server which concerns on 3rd Embodiment of this invention, and the mutual connection relationship. 本発明の第4の実施形態に係るブレードサーバに搭載されるNICとスイッチモジュールの各構成と、相互の接続関係を示す図である。It is a figure which shows each structure of the NIC and the switch module mounted on the blade server which concerns on 4th Embodiment of this invention, and the mutual connection relationship. 本発明の第5の実施形態に係るブレードサーバの構成を示す図である。It is a figure which shows the structure of the blade server which concerns on 5th Embodiment of this invention.

以下、本発明の実施形態について図面を参照して説明する。 Hereinafter, embodiments of the present invention will be described with reference to the drawings.

第1の実施形態
図1は、本発明の第1の実施形態に係るブレードサーバ100に搭載される要素(コンポーネント)の構成を概略的に示す図である。図1に示すように、ブレードサーバ100は、筐体101、ミッドプレーン102、サーバ103、スイッチモジュール104、電源ユニット105、管理モジュール106a、106bおよび管理モジュール制御回路107を備える。サーバ103には、NIC108a、108bが搭載されている。
1st Embodiment FIG. 1 is a diagram schematically showing a configuration of an element (component) mounted on a blade server 100 according to a first embodiment of the present invention. As shown in FIG. 1, the blade server 100 includes a housing 101, a midplane 102, a server 103, a switch module 104, a power supply unit 105, management modules 106a and 106b, and a management module control circuit 107. NIC108a and 108b are mounted on the server 103.

ブレードサーバ100には、NICを搭載するサーバ、スイッチモジュールおよび電源ユニットが、複数搭載されてもよい。図1では、ブレードサーバ100に搭載される1または複数のサーバ、スイッチモジュール、電源ユニットのうち、いずれか1のサーバ、スイッチモジュール、電源ユニットを、それぞれサーバ103、スイッチモジュール104、電源ユニット105と表記する。また、ブレードサーバ100において、管理モジュールは、図1に管理モジュール106a、106bで示すように、二重化されている。 The blade server 100 may be equipped with a plurality of servers, switch modules, and power supply units on which the NIC is mounted. In FIG. 1, one of one or more servers, a switch module, and a power supply unit mounted on the blade server 100 is a server, a switch module, and a power supply unit, which are referred to as a server 103, a switch module 104, and a power supply unit 105, respectively. write. Further, in the blade server 100, the management modules are duplicated as shown by the management modules 106a and 106b in FIG.

ブレードサーバ100における各構成要素は、概略以下の機能を有する。すなわち、サーバ103を含む1または複数のサーバは、それぞれ、例えば、外部装置や他のサーバから入力された情報を使用して所定の処理を行ったり、その処理の結果を外部装置や他のサーバに出力したりする。スイッチモジュール104を含む1または複数のスイッチモジュールは、それぞれ、1または複数のサーバの通信を制御する。電源ユニット105を含む1または複数の電源ユニットは、それぞれ、ブレードサーバ100に搭載される各コンポーネントに電源を供給する。 Each component in the blade server 100 has the following functions. That is, one or more servers including the server 103, for example, perform a predetermined process using the information input from the external device or another server, and the result of the process is the external device or another server. Output to. One or more switch modules, including the switch module 104, control communication with one or more servers, respectively. One or more power supply units, including the power supply unit 105, each supply power to each component mounted on the blade server 100.

管理モジュール106a、106bは、それぞれ、I2C(Inter Integrated Circuit)などの管理インタフェースによって各コンポーネントと接続されており、各コンポーネントの電源管理、接続管理、ログ収集など、ブレードサーバ全体の管理を行う。管理モジュール制御回路107は、管理モジュール106a、106bの監視、故障検知、故障時の切り替えの制御等を行う。管理モジュール106a、106bは、上述したように二重化されており、管理モジュール制御回路107および自身が搭載するファームウエアにより、故障時等に、切り替えなどの制御が行われる。 The management modules 106a and 106b are each connected to each component by a management interface such as I2C (Inter Integrated Circuit), and manage the entire blade server such as power management, connection management, and log collection of each component. The management module control circuit 107 monitors the management modules 106a and 106b, detects a failure, controls switching at the time of a failure, and the like. The management modules 106a and 106b are duplicated as described above, and the management module control circuit 107 and the firmware mounted on the management module 106b perform control such as switching in the event of a failure or the like.

NIC108a、108bは、サーバ103に設けられた、例えばPCIeスロットに挿入されており、サーバ103を、外部装置または他のサーバと通信可能に接続する機能を有する。本実施形態では、スイッチモジュール104が複数のNICの通信を制御する例を示す。すなわち、本実施形態では、サーバ103がNIC108a、108bを搭載し、スイッチモジュール104がNIC108a、108bの通信を制御する構成について説明する。ただし、サーバ103には、NIC108a、108bの他にもNICが搭載されてもよい。また、スイッチモジュール104は、サーバ103と他のサーバにそれぞれ1以上搭載されたNICの通信を制御してもよい。 The NICs 108a and 108b are inserted into, for example, a PCIe slot provided in the server 103, and have a function of connecting the server 103 to an external device or another server so as to be communicable. In this embodiment, an example in which the switch module 104 controls the communication of a plurality of NICs is shown. That is, in the present embodiment, the configuration in which the server 103 mounts the NICs 108a and 108b and the switch module 104 controls the communication of the NICs 108a and 108b will be described. However, the server 103 may be equipped with a NIC in addition to the NICs 108a and 108b. Further, the switch module 104 may control the communication of one or more NICs mounted on the server 103 and another server, respectively.

ミッドプレーン102は、ブレードサーバ100に搭載される各コンポーネントを相互に接続する。上述した各コンポーネントは、筐体101に格納される。 The midplane 102 connects each component mounted on the blade server 100 to each other. Each of the above-mentioned components is stored in the housing 101.

図2は、ブレードサーバ100に搭載されるNIC108a、108bとスイッチモジュール104の各構成と、相互の接続関係を示す図である。図2を用いて、本第1の実施形態に係るブレードサーバ100におけるNIC108a、108b及びスイッチモジュール104の構成を、より詳細に説明する。 FIG. 2 is a diagram showing each configuration of NICs 108a and 108b mounted on the blade server 100 and the switch module 104, and their mutual connection relationships. The configurations of NIC 108a, 108b and the switch module 104 in the blade server 100 according to the first embodiment will be described in more detail with reference to FIG.

図2に示すように、NIC108aとスイッチモジュール104は、イーサネット(商標登録)規格に基づく信号の伝送路となるイーサネット伝送路(以降、単に「イーサネット」とも称する)201aによって、相互に通信可能に接続されている。図2に示す構成では、NIC108aとスイッチモジュール104は、LANポート181aとLANポート142aとを介して、イーサネット201aにより接続されている。 As shown in FIG. 2, the NIC 108a and the switch module 104 are communicably connected to each other by an Ethernet transmission line (hereinafter, also simply referred to as “Ethernet”) 201a which is a signal transmission line based on the Ethernet (trademark registration) standard. Has been done. In the configuration shown in FIG. 2, the NIC 108a and the switch module 104 are connected by Ethernet 201a via the LAN port 181a and the LAN port 142a.

NIC108aとスイッチモジュール104は、また、シリアル通信の伝送路となるシリアル伝送路109aにより相互に通信可能に接続されている。図2に示す構成では、NIC108aとスイッチモジュール104は、シリアルポート184aとシリアルポート12とを介して、シリアル伝送路109aにより接続されている。 The NIC 108a and the switch module 104 are also communicably connected to each other by a serial transmission line 109a, which is a transmission line for serial communication. In the configuration shown in FIG. 2, the NIC 108a and the switch module 104 are connected by a serial transmission line 109a via the serial port 184a and the serial port 12.

NIC108aは、ドライバ182a及びレジスタ183aを有する。ドライバ182aは、NIC108aの制御を行う。レジスタ183aは、NIC108aの内部の動作状態や、設定情報等を保持する。 The NIC 108a has a driver 182a and a register 183a. The driver 182a controls the NIC 108a. The register 183a holds the internal operating state of the NIC 108a, setting information, and the like.

図2では、NIC108aは、イーサネット201aと接続するLANポートを1つ備えていることを示すが、NIC108aは、イーサネットと接続する複数のLANポートを備えていてもよい。また、NIC108aは、その他にもサーバ103の通信に必要な機能を備えるが、本実施形態では、それらの説明を省略する。 FIG. 2 shows that the NIC 108a has one LAN port connected to the Ethernet 201a, but the NIC 108a may have a plurality of LAN ports connected to the Ethernet. Further, the NIC 108a also has other functions necessary for communication of the server 103, but the description thereof will be omitted in the present embodiment.

NIC108bは、NIC108aと同様の構成を有する。すなわち、NIC108bとスイッチモジュール104は、イーサネット規格に基づく信号の伝送路となるイーサネット伝送路201b(以降、単に「イーサネット201b」とも称する)によって、相互に通信可能に接続されている。図2に示す構成では、NIC108bとスイッチモジュール104は、LANポート181bとLANポート142bとを介して、イーサネット201bにより接続されている。 NIC108b has the same configuration as NIC108a. That is, the NIC 108b and the switch module 104 are communicably connected to each other by an Ethernet transmission line 201b (hereinafter, also simply referred to as "Ethernet 201b") which is a signal transmission line based on the Ethernet standard. In the configuration shown in FIG. 2, the NIC 108b and the switch module 104 are connected by Ethernet 201b via the LAN port 181b and the LAN port 142b.

NIC108bとスイッチモジュール104は、また、シリアル通信の伝送路となるシリアル伝送路109bによって、相互に通信可能に接続されている。図2に示す構成では、NIC108bとスイッチモジュール104は、シリアルポート184bとシリアルポート13とを介して、シリアル伝送路109bにより接続されている。 The NIC 108b and the switch module 104 are also communicably connected to each other by a serial transmission line 109b, which is a transmission line for serial communication. In the configuration shown in FIG. 2, the NIC 108b and the switch module 104 are connected by a serial transmission line 109b via the serial port 184b and the serial port 13.

NIC108bは、ドライバ182b及びレジスタ183bを有する。ドライバ182b及びレジスタ183bは、それぞれドライバ182a及びレジスタ183aと同様の機能を有する。図2では、NIC108bは、LANポートを1つ備えていることを示すが、NIC108bは、複数のLANポートを備えていてもよい。また、NIC108bは、その他にもサーバ103の通信に必要な機能を備えるが、本実施形態では、それらの説明を省略する。 The NIC 108b has a driver 182b and a register 183b. The driver 182b and the register 183b have the same functions as the driver 182a and the register 183a, respectively. Although FIG. 2 shows that the NIC 108b has one LAN port, the NIC 108b may have a plurality of LAN ports. Further, the NIC 108b also has other functions necessary for communication of the server 103, but the description thereof will be omitted in the present embodiment.

スイッチモジュール104は、スイッチ回路141、バススイッチ143、メモリ(記憶手段)144、MPU(書き込み手段)145及びNVRAM(Non−Volatile Random Access Memory)(不揮発性記憶手段)146を有する。 The switch module 104 includes a switch circuit 141, a bus switch 143, a memory (storage means) 144, an MPU (writing means) 145, and an NVRAM (Non-Volatile Random Access Memory) (nonvolatile storage means) 146.

スイッチ回路141は、LANポート142a、142bを介した複数のNICとの接続を切り替える機能を有する。図2では、LANポート142aは、イーサネット201aを介してLANポート181aに接続され、LANポート142bは、イーサネット201bを介してLANポート181bに接続されることを示す。なお、図2では、スイッチ回路141は、LANポートを2つ備えていることを示すが、スイッチ回路141は、3つ以上のLANポートを備えていてもよい。 The switch circuit 141 has a function of switching the connection with a plurality of NICs via the LAN ports 142a and 142b. FIG. 2 shows that the LAN port 142a is connected to the LAN port 181a via the Ethernet 201a, and the LAN port 142b is connected to the LAN port 181b via the Ethernet 201b. Although FIG. 2 shows that the switch circuit 141 includes two LAN ports, the switch circuit 141 may include three or more LAN ports.

バススイッチ143は、シリアルポート12、13を介したシリアル伝送路109a、109bによるNIC108a、108bとの接続を切り替える機能を有する。メモリ144は、シリアル伝送路109a、109bを介して、それぞれNIC108a、108bから送られたログを格納する(詳細は後述する)。 The bus switch 143 has a function of switching the connection with the NIC 108a and 108b by the serial transmission lines 109a and 109b via the serial ports 12 and 13. The memory 144 stores logs sent from NIC 108a and 108b, respectively, via serial transmission lines 109a and 109b (details will be described later).

MPU145は、スイッチモジュール104の制御や、ログの読み取りまたは書き込みの制御等を行う。NVRAM146は、スイッチモジュール104の設定やログ等を保存する不揮発性記憶手段である。 The MPU 145 controls the switch module 104, reads or writes logs, and the like. The NVRAM 146 is a non-volatile storage means for storing the settings, logs, and the like of the switch module 104.

なお、NIC108a、NIC108bは、互いに同様の機能を有するので、以降の説明では、主に、NIC108aの機能について説明する。 Since the NIC 108a and the NIC 108b have the same functions as each other, the functions of the NIC 108a will be mainly described in the following description.

本実施形態では、NIC108aと、スイッチモジュール104との間のイーサネット201aを介した通信に障害が発生した場合、その障害に関してNIC108aが生成したログを、メモリ144に書き込む処理について説明する。 In the present embodiment, when a failure occurs in communication between the NIC 108a and the switch module 104 via Ethernet 201a, a process of writing a log generated by the NIC 108a to the memory 144 with respect to the failure will be described.

まず、NIC108aとスイッチモジュール104との間のイーサネット201aを介した通信の接続時の動作について説明する。図3は、ブレードサーバ100に搭載されるNIC108aとスイッチモジュール104との間の、イーサネット201aを介した通信接続時の動作を説明する図である。図2及び図3を参照して、NIC108aとスイッチモジュール104との通信接続時の動作について説明する。 First, the operation at the time of connecting the communication between the NIC 108a and the switch module 104 via the Ethernet 201a will be described. FIG. 3 is a diagram illustrating an operation at the time of communication connection between the NIC 108a mounted on the blade server 100 and the switch module 104 via the Ethernet 201a. The operation at the time of communication connection between the NIC 108a and the switch module 104 will be described with reference to FIGS. 2 and 3.

スイッチモジュール104のスイッチ回路141は、NIC108aとの間でリンクアップしたことを検出すると(ステップS3001)、リンクアップを検出したLANポート142aのポート番号とリンクアップの通知を、MPU145に対して行う(ステップS3002)。MPU145は、通知されたポート番号に応じてバススイッチ143を切り替える。そして、MPU145は、リンクアップが検出されたNIC108aにシリアル伝送路109aを介してアクセスし、自身の論理バス番号をNIC108aに通知する(ステップS3003)。ここで、論理バス番号は、MPU145とNIC108aとを接続しているバスの論理番号であり、ミッドプレーン102におけるスイッチモジュール104の搭載位置によって、一意に定まる番号であるとする。 When the switch circuit 141 of the switch module 104 detects that it has been linked up with the NIC 108a (step S3001), it notifies the MPU 145 of the port number of the LAN port 142a that has detected the link up and the link up (step S3001). Step S3002). The MPU 145 switches the bus switch 143 according to the notified port number. Then, the MPU 145 accesses the NIC 108a in which the link-up is detected via the serial transmission line 109a, and notifies the NIC 108a of its own logic bus number (step S3003). Here, it is assumed that the logical bus number is the logical number of the bus connecting the MPU 145 and the NIC 108a, and is uniquely determined by the mounting position of the switch module 104 on the midplane 102.

NIC108aは、ドライバ182aにより、MPU145から通知された論理バス番号をレジスタ183aに登録し(ステップS3004)、MPU145にACK(ACKnowledgement)を返す(ステップS3005)。上記処理により、NIC108aとスイッチモジュール104とを接続しているイーサネット201aとシリアル伝送路109とが、互いに関連付けられる。 The NIC 108a registers the logical bus number notified from the MPU 145 in the register 183a by the driver 182a (step S3004), and returns an ACK (ACKnowledgement) to the MPU 145 (step S3005). By the above processing, the Ethernet 201a connecting the NIC 108a and the switch module 104 and the serial transmission line 109 are associated with each other.

以上で、NIC108aとスイッチモジュール104との間のイーサネット201aを介した通信接続が完了する。NIC108aは、ステップS3004で示したように、MPU145の論理バス番号をレジスタ183aに登録することで、ブレードサーバ100に複数搭載されているスイッチモジュールの中から、接続相手のスイッチモジュールを特定することができる。 This completes the communication connection between the NIC 108a and the switch module 104 via Ethernet 201a. As shown in step S3004, the NIC 108a can identify the switch module of the connection partner from among the plurality of switch modules mounted on the blade server 100 by registering the logical bus number of the MPU 145 in the register 183a. it can.

次に、NIC108aとスイッチモジュール104との間のイーサネット201aを介した通信に障害が発生した際の、ログの取得処理について説明する。図4は、ブレードサーバ100に搭載されるNIC108aとスイッチモジュール104との間のイーサネット201aを介した通信に障害が発生した際の、NIC108aとスイッチモジュール104の動作を説明する図である。図2及び図4を参照して、上記通信に障害が発生した際の、ログの取得処理について説明する。 Next, a log acquisition process when a failure occurs in communication between the NIC 108a and the switch module 104 via the Ethernet 201a will be described. FIG. 4 is a diagram illustrating the operation of the NIC 108a and the switch module 104 when a failure occurs in communication between the NIC 108a mounted on the blade server 100 and the switch module 104 via Ethernet 201a. A log acquisition process will be described with reference to FIGS. 2 and 4 when a failure occurs in the above communication.

NIC108aにおいて、ドライバ182aは、LANポート181aとスイッチモジュール104との間でリンクダウンを検出すると、レジスタ183aに登録されているMPU145の論理バス番号に対応するスイッチモジュール104に、シリアル伝送路109aを介して接続する(ステップS4001)。ドライバ182aは、ステップS4001において接続したスイッチモジュール104が備えるメモリ144に、シリアル伝送路109aを介して、入出力インタフェース14から、自身が生成した、上記リンクダウンに関するログを書き込む(ステップS4002)。このとき、ドライバ182aは、通信障害に関するログメッセージ及び通信障害が発生した日時に加えて、NIC108aのMACアドレスも合わせてメモリ144に書き込んでもよい。そして、ドライバ182aは、メモリ144にログを書き込んだことをMPU145に通知するため、割り込み通知を行う(ステップS4003)。 When the driver 182a detects a link down between the LAN port 181a and the switch module 104 in the NIC 108a, the driver 182a passes the serial transmission line 109a to the switch module 104 corresponding to the logic bus number of the MPU 145 registered in the register 183a. To connect (step S4001). The driver 182a writes a log related to the link down generated by itself from the input / output interface 14 to the memory 144 included in the switch module 104 connected in step S4001 via the serial transmission line 109a (step S4002). At this time, the driver 182a may write the MAC address of the NIC 108a to the memory 144 in addition to the log message regarding the communication failure and the date and time when the communication failure occurred. Then, the driver 182a performs an interrupt notification in order to notify the MPU 145 that the log has been written to the memory 144 (step S4003).

一方、スイッチモジュール104では、まず、スイッチ回路141は、NIC108aとLANポート142aとの間でリンクダウンを検出したことを、MPU145に通知する(ステップS4004)。MPU145は、スイッチ回路141からの通知を受けると、上記リンクダウンに関するスイッチモジュール104側のログを、NVRAM146に書き込む(ステップS4005)。 On the other hand, in the switch module 104, first, the switch circuit 141 notifies the MPU 145 that a link down has been detected between the NIC 108a and the LAN port 142a (step S4004). Upon receiving the notification from the switch circuit 141, the MPU 145 writes the log on the switch module 104 side regarding the link down to the NVRAM 146 (step S4005).

次に、MPU145は、ステップS4003においてNIC108aから通知された割り込みを検知すると、入出力インタフェース15からメモリ144にアクセスし、ステップS4002において書き込まれたログを読み取る(ステップS4006)。MPU145は、読み取ったログをNVRAM146に書き込む(ステップS4007)。MPU145は、NVRAM146へのログの書き込みを終了すると、メモリ144に記憶されているログを消去する(ステップS4008)。 Next, when the MPU 145 detects the interrupt notified from the NIC 108a in step S4003, the MPU 145 accesses the memory 144 from the input / output interface 15 and reads the log written in step S4002 (step S4006). The MPU 145 writes the read log to the NVRAM 146 (step S4007). When the MPU 145 finishes writing the log to the NVRAM 146, the MPU 145 erases the log stored in the memory 144 (step S4008).

以上の動作により、NIC108aは、自身が生成した、通信障害に関するログを、スイッチモジュール104に書き込むことができる。これにより、ブレードサーバ100は、NIC108aが生成した通信障害に関するログを、スイッチモジュール104に収集することができる。 By the above operation, the NIC 108a can write the log related to the communication failure generated by the NIC 108a to the switch module 104. As a result, the blade server 100 can collect the log related to the communication failure generated by the NIC 108a in the switch module 104.

なお、スイッチモジュール104は、自身が生成したリンクダウンに関するログとNIC108aが生成したリンクダウンに関するログとを関連付けてNVRAM146に保存してもよい。ログの関連付けは、それぞれのログが生成された日時等に基づいて行われてもよい。また、スイッチモジュール104は、NIC108aからの割り込み通知の直前にNVRAM146に書き込んだログと、当該割り込み通知の直後にNIC108aから取得したログとを関連付けて保存してもよい。スイッチモジュール104が生成したログとNIC108aが生成したログとの関連付けは、この他のどのような手法によって行われてもよい。 The switch module 104 may associate the log related to the link down generated by itself with the log related to the link down generated by the NIC 108a and store the log in the NVRAM 146. The log association may be performed based on the date and time when each log was generated. Further, the switch module 104 may save the log written in the NVRAM 146 immediately before the interrupt notification from the NIC 108a and the log acquired from the NIC 108a immediately after the interrupt notification in association with each other. The association between the log generated by the switch module 104 and the log generated by NIC108a may be performed by any other method.

また、管理モジュール106a、106bは、電気信号により、シリアル伝送路109aの有効または無効の設定を行うことができる。これにより、シリアル伝送路109aが有効なときのみNIC108aで生成されたログをスイッチモジュール104に収集することができるので、セキュリティを向上させることができる。 Further, the management modules 106a and 106b can enable or disable the serial transmission line 109a by using an electric signal. As a result, the log generated by the NIC 108a can be collected in the switch module 104 only when the serial transmission line 109a is valid, so that the security can be improved.

以上のように、本実施形態によれば、ブレードサーバ100に、NIC108aとスイッチモジュール104とを接続するシリアル伝送路109aを設ける。そして、NIC108aとLANポート142aとの間のイーサネット201aを介した通信に障害が発生した場合、NIC108aは、自身が生成したその障害に関するログを、NIC108aの識別情報と共に、シリアル伝送路109aを介してスイッチモジュール104に送信する。この構成を採用することにより、本実施形態によれば、ブレードサーバ100は、サーバ103とスイッチモジュール104との間に発生した通信障害に関するログをスイッチモジュール104に収集できるので、管理者等は、各コンポーネントからログを採取する必要はない。よって、管理者等は、スイッチモジュール104に収集されたログを解析すればよいので、通信障害の原因の解析を、効率的に行うことができるという効果が得られる。 As described above, according to the present embodiment, the blade server 100 is provided with the serial transmission line 109a that connects the NIC 108a and the switch module 104. Then, when a failure occurs in the communication between the NIC 108a and the LAN port 142a via the Ethernet 201a, the NIC 108a logs the failure generated by the NIC 108a together with the identification information of the NIC 108a via the serial transmission line 109a. It is transmitted to the switch module 104. By adopting this configuration, according to the present embodiment, the blade server 100 can collect the log regarding the communication failure occurring between the server 103 and the switch module 104 in the switch module 104, so that the administrator and the like can collect the log. It is not necessary to collect logs from each component. Therefore, since the administrator or the like may analyze the log collected in the switch module 104, it is possible to efficiently analyze the cause of the communication failure.

また、上述のように、本実施形態によれば、ブレードサーバ100は、スイッチモジュール104の接続相手のNIC108aの識別情報もスイッチモジュール104に記憶するので、管理者等は、各コンポーネントからログを収集して解析する場合に必要なログの内容の突き合わせが不要であるため、ログを比較検討する時間を削減できるという効果が得られる。 Further, as described above, according to the present embodiment, the blade server 100 also stores the identification information of the NIC 108a of the connection partner of the switch module 104 in the switch module 104, so that the administrator or the like collects logs from each component. Since it is not necessary to match the contents of the logs required for the analysis, the effect of reducing the time for comparing and examining the logs can be obtained.

さらに、スイッチモジュール104に記憶されているサーバ103側のログは、接続相手のNIC108aに関する情報に限定されるので、通信障害に直接関係のないログを排除することができるという効果が得られる。 Further, since the log on the server 103 side stored in the switch module 104 is limited to the information about the connection partner NIC108a, it is possible to eliminate the log that is not directly related to the communication failure.

また、ブレードサーバ100においてNTP(Network Time Protocol)が設定されておらず、各コンポーネントで時刻が同期されていない場合でも、管理者等は、スイッチモジュール104に記憶されたNIC108aのログを確認することにより、障害発生時の大まかな状況を理解することができる。 Further, even if NTP (Network Time Protocol) is not set in the blade server 100 and the times are not synchronized in each component, the administrator or the like should check the log of NIC108a stored in the switch module 104. Therefore, it is possible to understand the general situation when a failure occurs.

また、ブレードサーバ100においてスイッチモジュール104が交換された場合でも、スイッチモジュール104に、接続相手のNIC108aのログが記録されているので、管理者等は、スイッチモジュール104に記録されたログのみで、通信障害の解析を行うことができる。また、スイッチモジュール104のログファイルに、MACアドレスなどのNICの識別情報を出力することで、NICが交換された場合にも、スイッチモジュール104にログが残っていれば、管理者等は、NICの108a交換履歴をトレースすることができる。 Further, even when the switch module 104 is replaced in the blade server 100, the log of the connection partner NIC108a is recorded in the switch module 104, so that the administrator or the like can use only the log recorded in the switch module 104. It is possible to analyze communication failures. Further, by outputting the NIC identification information such as the MAC address to the log file of the switch module 104, even if the NIC is replaced, if the log remains in the switch module 104, the administrator or the like can use the NIC. 108a exchange history can be traced.

さらに、PCIeスロットに搭載したNIC108a起因の障害(例えばバスエラー)により、サーバ103のCPUが停止した場合にも、本実施形態に係るブレードサーバ100では、NIC108aのレジスタダンプを取得できるという効果がある。すなわち、サーバ103のCPUが停止した状態では、管理者等がサーバ103にログインしてNIC108aからレジスタダンプなど障害に関連するログを取得することはできない。また、サーバ103の電源をオフにし、再び起動すると、レジスタの内容がクリアされるので、障害発生時のNICの状態に関する情報を得ることができない。そのため、サーバ103の再起動の前に、外部にレジスタダンプを書き出す構成を設けるか、障害発生時にレジスタダンプをメモリに書き出し、保存するようなファームウエアを作成する必要がある。 Further, even if the CPU of the server 103 is stopped due to a failure (for example, a bus error) caused by the NIC108a mounted in the PCIe slot, the blade server 100 according to the present embodiment has an effect that the register dump of the NIC108a can be acquired. .. That is, when the CPU of the server 103 is stopped, the administrator or the like cannot log in to the server 103 and acquire a log related to a failure such as a register dump from the NIC 108a. Further, when the power of the server 103 is turned off and restarted, the contents of the register are cleared, so that information on the state of the NIC at the time of failure cannot be obtained. Therefore, before restarting the server 103, it is necessary to provide a configuration for writing a register dump to the outside, or to create firmware that writes and saves the register dump to the memory when a failure occurs.

外部にレジスタダンプを書き出す構成を設ける場合、高密度に設計されているブレードサーバでは、その構成を設けるためのスペースを確保するのが困難である。また、ファームウエアの作成には時間がかかることに加え、障害発生が再現するのを待つ必要がある。このため、NIC起因の障害の解析には時間がかかることが多い。 When a configuration for writing a register dump to the outside is provided, it is difficult to secure a space for the configuration in a blade server designed with high density. In addition to the time it takes to create the firmware, it is necessary to wait for the failure to reappear. Therefore, it often takes time to analyze the failure caused by NIC.

これに対して、本実施形態に係るブレードサーバ100では、NIC108aとスイッチモジュール104との間のシリアル伝送路109aを介して、スイッチモジュール104が、障害の解析に必要なレジスタダンプや設定を取得し、外部ストレージなどに保存することが可能となる。これにより、本実施形態によれば、NIC108a起因の障害の解析も、効率的に行うことができるという効果がある。 On the other hand, in the blade server 100 according to the present embodiment, the switch module 104 acquires register dumps and settings necessary for failure analysis via the serial transmission line 109a between the NIC 108a and the switch module 104. , It becomes possible to save in external storage. As a result, according to the present embodiment, there is an effect that the analysis of the failure caused by NIC108a can be efficiently performed.

さらに、複数のサーバにおいて、NIC108aに関する同一のバス番号、同一のデバイス番号の障害など、共通性が疑われる障害が発生した場合にも、本実施形態に係るブレードサーバ100では、その解析を効率的にできるという効果がある。すなわち、上記の場合、通常は、管理者等が、ブレードサーバ100に接続されたコンソールを切り替える、あるいは、リモート接続であればIP(Internet Protocol)アドレスを変更して各サーバにログインして、解析に必要なレジスタダンプなどのログを個別に取得する必要がある。この場合、複数のサーバに同じ手順を繰り返してログを取得するので、効率が悪い。これに対して、本実施形態に係るブレードサーバ100では、管理者等は、スイッチモジュール104から、シリアル伝送路109aを介してNIC108aを直接操作することができるので、コンソールの切り替えが不要となる。また、コンソールからスイッチモジュール104に接続し、CLI(Command Line Interface)によりバススイッチを切り替えてログを取得することができるので、スクリプトなどを用いることによりログの取得が容易にできるようになる。 Further, even when a failure that is suspected to be common, such as a failure of the same bus number and the same device number related to NIC108a, occurs in a plurality of servers, the blade server 100 according to the present embodiment efficiently analyzes the failure. It has the effect of being able to. That is, in the above case, usually, the administrator or the like switches the console connected to the blade server 100, or if it is a remote connection, changes the IP (Internet Protocol) address and logs in to each server for analysis. It is necessary to individually acquire logs such as register dumps required for. In this case, the log is acquired by repeating the same procedure on a plurality of servers, which is inefficient. On the other hand, in the blade server 100 according to the present embodiment, the administrator or the like can directly operate the NIC 108a from the switch module 104 via the serial transmission line 109a, so that it is not necessary to switch the console. Further, since the log can be acquired by connecting to the switch module 104 from the console and switching the bus switch by CLI (Command Line Interface), the log can be easily acquired by using a script or the like.

第2の実施形態
図5は、本発明の第2の実施形態に係るブレードサーバ200に搭載されるNIC108a、108bとスイッチモジュール210の各構成と、相互の接続関係を示す図である。第2の実施形態に係るブレードサーバ200は、上記第1の実施形態において図1および図2を参照して説明したブレードサーバ100と同様の構成を有する。ただし、第2の実施形態に係るブレードサーバ200は、図2を参照して説明したブレードサーバ100のスイッチモジュール104に代えて、スイッチモジュール210を備える。
Second Embodiment FIG. 5 is a diagram showing each configuration of NIC 108a, 108b and a switch module 210 mounted on a blade server 200 according to a second embodiment of the present invention, and a mutual connection relationship. The blade server 200 according to the second embodiment has the same configuration as the blade server 100 described with reference to FIGS. 1 and 2 in the first embodiment. However, the blade server 200 according to the second embodiment includes a switch module 210 instead of the switch module 104 of the blade server 100 described with reference to FIG.

スイッチモジュール210は、ブレードサーバ100のスイッチモジュール104に含まれるメモリ144を備えていない構成を有する。 The switch module 210 has a configuration that does not include the memory 144 included in the switch module 104 of the blade server 100.

上記第1の実施形態では、NIC108aが、通信障害に関して生成したログを、シリアル伝送路109aを介してスイッチモジュール210のメモリ144に書き込み、そのログをMPU145がNVRAM146に書き込む構成について説明した。本第2の実施形態では、スイッチモジュール210は、NIC108aとMPU145との間にメモリ144を備えておらず、MPU145が、NIC108aからログを取得し、NVRAM146に書き込む構成について説明する。 In the first embodiment, the configuration in which the NIC 108a writes the log generated for the communication failure to the memory 144 of the switch module 210 via the serial transmission line 109a and the MPU 145 writes the log to the NVRAM 146 has been described. In the second embodiment, the switch module 210 does not have a memory 144 between the NIC 108a and the MPU 145, and the MPU 145 acquires a log from the NIC 108a and writes the log to the NVRAM 146.

図5に示すNIC108a、108b及びスイッチモジュール210の各構成は、スイッチモジュール210がメモリ144を備えていない点以外は、図2に示したNIC108a、108b及びスイッチモジュール104の各構成と同様であるので、同一の符号を付して、その説明を省略する。 The configurations of the NIC 108a, 108b and the switch module 210 shown in FIG. 5 are the same as the configurations of the NIC 108a, 108b and the switch module 104 shown in FIG. 2, except that the switch module 210 does not have the memory 144. , The same reference numerals are given, and the description thereof will be omitted.

図6は、ブレードサーバ200に搭載されるNIC108aとスイッチモジュール210との間の、イーサネット201aを介した通信接続時の動作を説明する図である。図5及び図6を参照して、NIC108aとスイッチモジュール210との通信接続時の動作について説明する。なお、図6において、ステップS3001乃至S3005は、上記第1の実施形態で説明した図3において同一符号で示す処理と同様の処理であるため、本実施形態では、S6006およびS6007について主に説明する。 FIG. 6 is a diagram illustrating an operation at the time of communication connection between the NIC 108a mounted on the blade server 200 and the switch module 210 via Ethernet 201a. The operation at the time of communication connection between the NIC 108a and the switch module 210 will be described with reference to FIGS. 5 and 6. Note that, in FIG. 6, steps S3001 to S3005 are the same processes as those shown by the same reference numerals in FIG. 3 described in the first embodiment. Therefore, in this embodiment, S6006 and S6007 will be mainly described. ..

NIC108aは、S3005で示すように、MPU145にACKを返すと、シリアル伝送路109aを介して、MPU145に、ログの通知に使用するレジスタ183aのオフセットを通知する(ステップS6006)。MPU145は、通知されたレジスタ183aのオフセットを認識すると、NIC108aにACKを返す(ステップS6007)。 When the NIC 108a returns ACK to the MPU 145 as shown in S3005, the NIC 108a notifies the MPU 145 of the offset of the register 183a used for log notification via the serial transmission line 109a (step S6006). Upon recognizing the offset of the notified register 183a, the MPU 145 returns an ACK to the NIC 108a (step S6007).

以上で、NIC108aとスイッチモジュール210との間のイーサネット201aを介した通信接続が完了する。 This completes the communication connection between the NIC 108a and the switch module 210 via Ethernet 201a.

図7は、ブレードサーバ200に搭載されるNIC108aとスイッチモジュール210との間のイーサネット201aを介した通信に障害が発生した際の、NIC108aとスイッチモジュール210の動作を説明する図である。図5及び図7を参照して、上記通信に障害が発生した際の、ログの取得処理について説明する。 FIG. 7 is a diagram illustrating the operation of the NIC 108a and the switch module 210 when a failure occurs in communication between the NIC 108a mounted on the blade server 200 and the switch module 210 via Ethernet 201a. A log acquisition process will be described with reference to FIGS. 5 and 7 when a failure occurs in the above communication.

NIC108aにおいて、ドライバ182aは、LANポート181aとスイッチモジュール210との間でリンクダウンを検出すると、そのリンクダウンに関するログをレジスタ183aに登録する(ステップS7001)。ドライバ182aは、リンクダウンを検出したLANポート181aの接続相手のスイッチモジュール210に対して、レジスタ183aにログを登録したことを通知するため、論理バス番号を指定して、シリアル伝送路109aを介して、スイッチモジュール210のMPU145に、割り込み通知を行う(ステップS7002)。 When the driver 182a detects a link down between the LAN port 181a and the switch module 210 in the NIC 108a, the driver 182a registers a log related to the link down in the register 183a (step S7001). The driver 182a specifies a logical bus number to notify the switch module 210 of the connection partner of the LAN port 181a that has detected the link down that the log has been registered in the register 183a, via the serial transmission line 109a. Then, an interrupt notification is sent to the MPU 145 of the switch module 210 (step S7002).

一方、スイッチモジュール210では、まず、スイッチ回路141は、NIC108aとLANポート142aとの間でリンクダウンを検出したことを、MPU145に通知する(ステップS7003)。MPU145は、スイッチ回路141からの通知を受けると、上記リンクダウンに関するスイッチモジュール210側のログを、NVRAM146に書き込む(ステップS7004)。 On the other hand, in the switch module 210, first, the switch circuit 141 notifies the MPU 145 that a link down has been detected between the NIC 108a and the LAN port 142a (step S7003). Upon receiving the notification from the switch circuit 141, the MPU 145 writes the log on the switch module 210 side regarding the link down to the NVRAM 146 (step S7004).

次に、MPU145は、ステップS7002においてNIC108aから通知された割り込みを検知すると、シリアル伝送路109aを介して、レジスタ183aから、上記リンクダウンに関するログを読み取る(ステップS7005)。MPU145は、読み取ったログを、NVRAM146に書き込む(ステップS7006)。書き込みが完了すると、MPU145は、NIC108aに対して、ログの書き込みが完了したことを通知する(ステップS7007)。 Next, when the MPU 145 detects the interrupt notified from the NIC 108a in step S7002, the MPU 145 reads the log related to the link down from the register 183a via the serial transmission line 109a (step S7005). The MPU 145 writes the read log to the NVRAM 146 (step S7006). When the writing is completed, the MPU 145 notifies the NIC 108a that the writing of the log is completed (step S7007).

以上の動作により、スイッチモジュール210は、通信障害に関してNIC108aが生成したログを、自身が備えるNVRAM146に書き込むことができる。 By the above operation, the switch module 210 can write the log generated by the NIC 108a regarding the communication failure to the NVRAM 146 provided by the switch module 210.

以上のように、本実施形態によれば、ブレードサーバ200に、NIC108aとスイッチモジュール210とを接続するシリアル伝送路109aを設ける。そして、スイッチモジュール210は、NIC108aが生成した、NIC108aとLANポート142aとの間のイーサネット201aを介した通信の障害に関するログを、NIC108aのレジスタ183aから直接取得し、自身が備えるNVRAM146に書き込む。この構成を採用することにより、本実施形態は、第1の実施形態と同様の効果を奏するとともに、第1の実施形態に係るブレードサーバ100が備えているメモリ144を備えていない構成で上記効果を実現できるので、コストを削減することができるというさらなる効果を奏することができる。 As described above, according to the present embodiment, the blade server 200 is provided with a serial transmission line 109a for connecting the NIC 108a and the switch module 210. Then, the switch module 210 directly acquires the log generated by the NIC 108a regarding the failure of the communication between the NIC 108a and the LAN port 142a via the Ethernet 201a from the register 183a of the NIC 108a and writes the log to the NVRAM 146 provided by the switch module 210. By adopting this configuration, the present embodiment has the same effect as that of the first embodiment, and has the above-mentioned effect in a configuration that does not include the memory 144 included in the blade server 100 according to the first embodiment. Therefore, it is possible to achieve a further effect that the cost can be reduced.

第3の実施形態
図8は、本発明の第3の実施形態に係るブレードサーバ300に搭載されるNIC108a、108bとスイッチモジュール104a、104bの各構成と、相互の接続関係を示す図である。第3の実施形態に係るブレードサーバ300は、第1の実施形態において図2を参照して説明したスイッチモジュール104とそれぞれ同様の構成を備えた、スイッチモジュール104a、104bを備える構成を有する。
Third Embodiment FIG. 8 is a diagram showing each configuration of NIC 108a and 108b and switch modules 104a and 104b mounted on the blade server 300 according to the third embodiment of the present invention and their mutual connection relationships. The blade server 300 according to the third embodiment has a configuration including switch modules 104a and 104b, which have the same configurations as the switch module 104 described with reference to FIG. 2 in the first embodiment.

本第3の実施形態では、複数のスイッチモジュール104a、104bと複数のNIC108a、108bとが、互いに接続される構成について説明する。すなわち、本第3の実施形態では、NIC108aは、スイッチモジュール104a、104bと接続され、NIC108bも、スイッチモジュール104a、104bと接続される構成について説明する。 In the third embodiment, a configuration in which a plurality of switch modules 104a and 104b and a plurality of NICs 108a and 108b are connected to each other will be described. That is, in the third embodiment, the configuration in which the NIC 108a is connected to the switch modules 104a and 104b and the NIC 108b is also connected to the switch modules 104a and 104b will be described.

NIC108aは、第1の実施形態において図2を参照して説明したように、イーサネット201a−1、シリアル伝送路109a−1をそれぞれ介して、スイッチモジュール104aと通信可能に接続される。 The NIC 108a is communicably connected to the switch module 104a via the Ethernet 201a-1 and the serial transmission line 109a-1, respectively, as described with reference to FIG. 2 in the first embodiment.

また、NIC108aは、イーサネット201a−2、シリアル伝送路109a−2をそれぞれ介して、スイッチモジュール104bとも通信可能に接続される。 Further, the NIC 108a is also communicably connected to the switch module 104b via the Ethernet 201a-2 and the serial transmission line 109a-2, respectively.

さらに、NIC108bは、第1の実施形態において図2を参照して説明したように、イーサネット201b−1、シリアル伝送路109b−1をそれぞれ介して、スイッチモジュール104aと通信可能に接続される。 Further, the NIC 108b is communicably connected to the switch module 104a via the Ethernet 201b-1 and the serial transmission line 109b-1, respectively, as described with reference to FIG. 2 in the first embodiment.

また、NIC108bは、イーサネット201b−2、シリアル伝送路109b−2をそれぞれ介して、スイッチモジュール104bとも通信可能に接続される。 Further, the NIC 108b is also communicably connected to the switch module 104b via the Ethernet 201b-2 and the serial transmission line 109b-2, respectively.

図8に示すブレードサーバ300は、第1の実施形態において図2を参照して説明したブレードサーバ100と同様に、NIC108aとスイッチモジュール104aとが接続され、NIC108bとスイッチモジュール104aとが接続されることに加えて、NIC108bとスイッチモジュール104aとが接続され、NIC108bとスイッチモジュール104bとが接続されることを示す。ブレードサーバ300は、イーサネットを介した通信の障害が発生した際のログの取得については、ブレードサーバ100と同様の処理を行う。 In the blade server 300 shown in FIG. 8, the NIC 108a and the switch module 104a are connected, and the NIC 108b and the switch module 104a are connected in the same manner as the blade server 100 described with reference to FIG. 2 in the first embodiment. In addition, the NIC 108b and the switch module 104a are connected, indicating that the NIC 108b and the switch module 104b are connected. The blade server 300 performs the same processing as the blade server 100 for acquiring a log when a communication failure via Ethernet occurs.

例えば、イーサネット201a−2を介した通信の障害が発生した場合、NIC108aとスイッチモジュール104bは、図4に示す動作と同様に、ログを取得する。すなわち、NIC108aのドライバ182aは、シリアル伝送路109a−2を介して、自身が生成したログをスイッチモジュール104bのメモリ144bに書き込む。スイッチモジュール104bのMPU145bは、書き込まれたログをメモリ144bから読み出し、NVRAM146bに書き込む。 For example, when a communication failure via Ethernet 201a-2 occurs, the NIC 108a and the switch module 104b acquire a log in the same manner as the operation shown in FIG. That is, the driver 182a of the NIC 108a writes the log generated by itself to the memory 144b of the switch module 104b via the serial transmission line 109a-2. The MPU 145b of the switch module 104b reads the written log from the memory 144b and writes it to the NVRAM 146b.

イーサネット201a−1、201b−1、201b−2を介した通信の障害が発生した場合も、NIC108aとスイッチモジュール104a、NIC108bとスイッチモジュール104a、NIC108bとスイッチモジュール104bは、それぞれ上記と同様にログを取得する。 Even if a communication failure occurs via Ethernet 201a-1, 201b-1, 201b-2, NIC108a and switch module 104a, NIC108b and switch module 104a, and NIC108b and switch module 104b log in the same manner as above. get.

以上のように、本第3の実施形態によれば、複数のスイッチモジュール104a、104bと、複数のNIC108a、108bとが互いに接続される構成においても、第1の実施形態と同様の効果を奏する。 As described above, according to the third embodiment, the same effect as that of the first embodiment is obtained even in the configuration in which the plurality of switch modules 104a and 104b and the plurality of NICs 108a and 108b are connected to each other. ..

第4の実施形態
図9は、本発明の第4の実施形態に係るブレードサーバ400に搭載されるNIC108a、108bとスイッチモジュール210a、210bの各構成と、相互の接続関係を示す図である。第4の実施形態に係るブレードサーバ400は、第2の実施形態において図5を参照して説明したスイッチモジュール210とそれぞれ同様の構成を備えた、スイッチモジュール210a、210bを備える構成を有する。
Fourth Embodiment FIG. 9 is a diagram showing each configuration of NIC 108a and 108b and switch modules 210a and 210b mounted on the blade server 400 according to the fourth embodiment of the present invention and their mutual connection relationships. The blade server 400 according to the fourth embodiment has a configuration including switch modules 210a and 210b, which have the same configurations as the switch module 210 described with reference to FIG. 5 in the second embodiment.

本第4の実施形態では、スイッチモジュール210a、210bが、図8を参照して説明した接続関係と同様に、NIC108a、108bと接続されていることを示す。 In the fourth embodiment, it is shown that the switch modules 210a and 210b are connected to the NIC 108a and 108b in the same manner as the connection relationship described with reference to FIG.

図9に示すブレードサーバ400は、イーサネットを介した通信の障害が発生した際のログの取得を、ブレードサーバ200と同様に行う。 The blade server 400 shown in FIG. 9 acquires a log when a communication failure via Ethernet occurs in the same manner as the blade server 200.

例えば、イーサネット201a−2を介した通信の障害が発生した場合、NIC108aとスイッチモジュール210bは、図7に示す動作と同様に、ログを取得する。すなわち、NIC108aのドライバ182aは、自身が生成したログをレジスタ183aに登録し、レジスタ183aにログを登録した旨を、シリアル伝送路109a−2を介して、スイッチモジュール210bに通知する。スイッチモジュール210bは、NIC108aからの通知を検知すると、シリアル伝送路109a−2を介して、レジスタ183aから上記ログを読み取り、読み取ったログを、自身のNVRAM146bに書き込む。 For example, when a communication failure via Ethernet 201a-2 occurs, the NIC 108a and the switch module 210b acquire a log in the same manner as the operation shown in FIG. 7. That is, the driver 182a of the NIC 108a registers the log generated by itself in the register 183a, and notifies the switch module 210b that the log is registered in the register 183a via the serial transmission line 109a-2. When the switch module 210b detects the notification from the NIC 108a, it reads the log from the register 183a via the serial transmission line 109a-2 and writes the read log to its own NVRAM 146b.

イーサネット201a−1、201b−1、201b−2を介した通信の障害が発生した場合も、NIC108aとスイッチモジュール210a、NIC108bとスイッチモジュール210a、NIC108bとスイッチモジュール210bは、それぞれ上記と同様にログを取得する。 Even if a communication failure occurs via Ethernet 201a-1, 201b-1, 201b-2, NIC108a and the switch module 210a, NIC108b and the switch module 210a, and NIC108b and the switch module 210b each log in the same manner as described above. get.

以上のように、本第4の実施形態によれば、複数のスイッチモジュール210a、210bと、複数のNIC108a、108bとが互いに接続される構成においても、第1の実施形態及び第2の実施形態と同様の効果を奏する。 As described above, according to the fourth embodiment, even in the configuration in which the plurality of switch modules 210a and 210b and the plurality of NIC108a and 108b are connected to each other, the first embodiment and the second embodiment Has the same effect as.

なお、第3の実施形態にかかるブレードサーバ300の構成と、第4の実施形態にかかるブレードサーバ400の構成とを組み合わせてもよい。すなわち、例えば、第3の実施形態にかかるブレードサーバ300が備えるスイッチモジュール104a及び104bのいずれか1つが、第2の実施形態において図2を参照して説明したスイッチモジュール210と同様の構成を備えていてもよい。 The configuration of the blade server 300 according to the third embodiment may be combined with the configuration of the blade server 400 according to the fourth embodiment. That is, for example, any one of the switch modules 104a and 104b included in the blade server 300 according to the third embodiment has the same configuration as the switch module 210 described with reference to FIG. 2 in the second embodiment. You may be.

第5の実施形態
図10は、本発明の第5の実施形態に係るブレードサーバ800の構成を示す図である。図10に示すように、ブレードサーバ800は、サーバ801およびスイッチモジュール803を備える。サーバ801は、複数の通信部802a、802bを備える。スイッチモジュール803は、取得部804を備える。
Fifth Embodiment FIG. 10 is a diagram showing a configuration of a blade server 800 according to a fifth embodiment of the present invention. As shown in FIG. 10, the blade server 800 includes a server 801 and a switch module 803. The server 801 includes a plurality of communication units 802a and 802b. The switch module 803 includes an acquisition unit 804.

複数の通信部802a、802bは、第1の通信路805a、805bを介してそれぞれスイッチモジュール803と接続される。 The plurality of communication units 802a and 802b are connected to the switch module 803 via the first communication paths 805a and 805b, respectively.

複数の通信部802a、802bは、第1の通信路805a、805bとそれぞれ関連付けられた第2の通信路806a、806bをそれぞれ介してスイッチモジュール803と接続される。 The plurality of communication units 802a and 802b are connected to the switch module 803 via the second communication paths 806a and 806b associated with the first communication paths 805a and 805b, respectively.

スイッチモジュール803は、第1の通信路805a、805bのいずれかに関して障害が検出されると、障害が検出された第1の通信路805aを介したスイッチモジュール803の接続相手である通信部802aが生成した、第1の通信路805aに関する障害のログを、障害が検出された第1の通信路805aと関連付けられた第2の通信路806aを介して取得する取得部804を備える。 When a failure is detected in any of the first communication paths 805a and 805b, the switch module 803 has a communication unit 802a, which is a connection partner of the switch module 803, via the first communication path 805a in which the failure is detected. The acquisition unit 804 is provided to acquire the generated failure log related to the first communication path 805a via the second communication path 806a associated with the first communication path 805a in which the failure is detected.

通信部802a、802bは、例えば、上記第1の実施形態におけるNIC108a、108bにより実現される。第1の通信路805a、805bは、例えば、上記第1の実施形態におけるイーサネット201a、201bにより実現される。第2の通信路806a、806bは、例えば、上記第1の実施形態におけるシリアル伝送路109a、109bにより実現される。取得部804は、例えば、上記第1の実施形態におけるメモリ144およびMPU145の少なくともいずれかにより実現される。 The communication units 802a and 802b are realized, for example, by the NICs 108a and 108b in the first embodiment. The first communication paths 805a and 805b are realized by, for example, the Ethernet 201a and 201b in the first embodiment. The second communication lines 806a and 806b are realized by, for example, the serial transmission lines 109a and 109b in the first embodiment. The acquisition unit 804 is realized, for example, by at least one of the memory 144 and the MPU 145 in the first embodiment.

上記構成により、第5の実施形態によれば、サーバ801とスイッチモジュール803との間に発生した障害に関するログを、スイッチモジュール803に記憶することができ、管理者等は、スイッチモジュール803に記憶されたログを解析すればよいので、障害の原因の解析を、効率的に行うことができるという効果を奏する。 With the above configuration, according to the fifth embodiment, the log related to the failure occurring between the server 801 and the switch module 803 can be stored in the switch module 803, and the administrator or the like can store the log in the switch module 803. Since it is sufficient to analyze the generated log, it is possible to efficiently analyze the cause of the failure.

以上、上述した実施形態を参照して本発明を説明した。しかしながら、本発明は、上述した実施形態には限定されない。即ち、本発明は、本発明のスコープ内において、種々の上記開示要素の多様な組み合わせ乃至選択など、当業者が理解し得る様々な態様を適用することができる。 The present invention has been described above with reference to the above-described embodiments. However, the present invention is not limited to the above-described embodiments. That is, within the scope of the present invention, various aspects that can be understood by those skilled in the art, such as various combinations or selections of the various disclosed elements, can be applied.

12、13、181、184 シリアルポート
14、15 入出力インタフェース
100、200、300、400、800 ブレードサーバ
102 ミッドプレーン
103、801 サーバ
104、210、803 スイッチモジュール
105 電源ユニット
106 管理モジュール
107 管理モジュール制御回路
108 NIC
109 シリアル伝送路
141 スイッチ回路
142、181 LANポート
143 バススイッチ
144 メモリ
145 MPU
146 NVRAM
182 ドライバ
183 レジスタ
201 イーサネット伝送路
802 通信部
804 取得部
805 第1の伝送路
806 第2の伝送路
12, 13, 181, 184 Serial ports 14, 15 I / O interfaces 100, 200, 300, 400, 800 Blade server 102 Midplane 103, 801 Server 104, 210, 803 Switch module 105 Power supply unit 106 Management module 107 Management module control Circuit 108 NIC
109 Serial transmission line 141 Switch circuit 142, 181 LAN port 143 Bus switch 144 Memory 145 MPU
146 NVRAM
182 Driver 183 Register 201 Ethernet transmission line 802 Communication unit 804 Acquisition unit 805 First transmission line 806 Second transmission line

Claims (10)

サーバに設けられた複数の通信手段と、
前記複数の通信手段と、第1の通信路を介してそれぞれ接続されたスイッチモジュールと、
前記複数の通信手段と前記スイッチモジュールとをそれぞれ接続し、前記第1の通信路とそれぞれ関連付けられた第2の通信路とを備え、
前記スイッチモジュールは、
前記第1の通信路のいずれかに関して障害が検出されると、前記障害が検出された前記第1の通信路を介した前記スイッチモジュールの接続相手である前記通信手段が生成した、前記第1の通信路に関する前記障害のログを、前記障害が検出された前記第1の通信路と関連付けられた前記第2の通信路を介して取得する取得手段を備える
サーバシステム。
Multiple communication means provided on the server and
The plurality of communication means, the switch module connected to each other via the first communication path, and the switch module.
The plurality of communication means and the switch module are connected to each other, and the first communication path and the second communication path associated with the first communication path are provided.
The switch module is
When a failure is detected in any of the first communication paths, the first communication means generated by the communication means to which the switch module is connected via the first communication path in which the failure is detected is generated. A server system comprising an acquisition means for acquiring a log of the failure related to the communication path of the above via the second communication path associated with the first communication path in which the failure is detected.
前記取得手段は、
前記取得した前記ログを、前記スイッチモジュールが生成した、前記第1の通信路に関する前記障害のログと関連付けて、自スイッチモジュールが備える不揮発性記憶手段に書き込む書き込み手段を備える
請求項1に記載のサーバシステム。
The acquisition means
The first aspect of claim 1, wherein the acquired log is associated with a log of the failure related to the first communication path generated by the switch module, and a writing means for writing to the non-volatile storage means included in the own switch module is provided. Server system.
前記取得手段は、
前記通信手段が生成し、前記第2の通信路を介して送信する、前記第1の通信路に関する前記障害のログを記憶する記憶手段を備え、
前記書き込み手段は、前記記憶手段に記憶された前記第1の通信路に関する前記障害のログを読み取り、前記読み取ったログを前記不揮発性記憶手段に書き込む
請求項2に記載のサーバシステム。
The acquisition means
A storage means for storing a log of the failure related to the first communication path, which is generated by the communication means and transmitted via the second communication path, is provided.
The server system according to claim 2, wherein the writing means reads a log of the failure related to the first communication path stored in the storage means, and writes the read log in the non-volatile storage means.
前記書き込み手段は、
前記通信手段が生成し、該通信手段に記憶されている、前記第1の通信路に関する前記障害のログを、前記第2の通信路を介して取得し、前記取得した、前記第1の通信路に関する前記障害のログを前記不揮発性記憶手段に書き込む
請求項2に記載のサーバシステム。
The writing means
The failure log related to the first communication path generated by the communication means and stored in the communication means is acquired via the second communication path, and the acquired first communication is acquired. The server system according to claim 2, wherein the log of the failure related to the road is written to the non-volatile storage means.
前記取得手段が取得した、前記第1の通信路に関する前記障害のログは、前記通信手段を識別する情報を含む
請求項1乃至4のいずれか1項に記載のサーバシステム。
The server system according to any one of claims 1 to 4, wherein the failure log related to the first communication path acquired by the acquisition means includes information for identifying the communication means.
前記サーバに設けられた前記複数の通信手段と、前記第1の通信路及び前記第2の通信路を介してそれぞれ接続され、前記複数の通信手段に自スイッチモジュールの識別情報を通知する複数の前記スイッチモジュールを備える
請求項1乃至5のいずれか1項に記載のサーバシステム。
A plurality of communication means provided in the server are connected to each other via the first communication path and the second communication path, and the plurality of communication means are notified of the identification information of the own switch module. The server system according to any one of claims 1 to 5, further comprising the switch module.
前記第2の通信路を、電気信号により有効または無効に設定する管理モジュールをさらに備える
請求項1乃至6のいずれか1項に記載のサーバシステム。
The server system according to any one of claims 1 to 6, further comprising a management module for setting the second communication path to be valid or invalid by an electric signal.
サーバに設けられた複数の通信手段と、第1の通信路を介してそれぞれ接続されたスイッチモジュールであって、
前記複数の通信手段と、前記第1の通信路とそれぞれ関連付けられた第2の通信路を介してそれぞれ接続され、
前記第1の通信路のいずれかに関して障害が検出されると、前記障害が検出された前記第1の通信路を介した前記スイッチモジュールの接続相手である前記通信手段が生成した、前記第1の通信路に関する前記障害のログを、前記障害が検出された前記第1の通信路と関連付けられた前記第2の通信路を介して取得する取得手段を備える
スイッチモジュール。
A switch module connected to a plurality of communication means provided in a server via a first communication path.
The plurality of communication means are connected to each other via a second communication path associated with the first communication path, respectively.
When a failure is detected in any of the first communication paths, the first communication means generated by the communication means to which the switch module is connected via the first communication path in which the failure is detected is generated. A switch module comprising an acquisition means for acquiring a log of the failure related to the communication path of the above via the second communication path associated with the first communication path in which the failure is detected.
前記取得手段は、前記取得した前記ログを、前記スイッチモジュールが生成した、前記第1の通信路に関する前記障害のログと関連付けて、自スイッチモジュールが備える不揮発性記憶手段に書き込む書き込み手段を備える
請求項8に記載のスイッチモジュール。
The acquisition means includes a writing means for writing the acquired log to the non-volatile storage means included in the own switch module in association with the log of the failure related to the first communication path generated by the switch module. Item 8. The switch module according to item 8.
サーバに設けられた複数の通信手段とスイッチモジュールとをそれぞれ接続する第1の通信路のいずれかに関して障害が検出されると、
前記障害が検出された前記第1の通信路を介した前記スイッチモジュールの接続相手である前記通信手段が生成した、前記第1の通信路に関する前記障害のログを、記複数の通信手段と前記スイッチモジュールとをそれぞれ接続し、前記障害が検出された前記第1の通信路と関連付けられた第2の通信路を介して取得する
ログ取得方法。
When a failure is detected in any of the first communication paths connecting the plurality of communication means provided in the server and the switch module, respectively.
A log of the failure related to the first communication path generated by the communication means to which the switch module is connected via the first communication path in which the failure is detected is recorded with the plurality of communication means and the said. A log acquisition method in which the switch modules are connected to each other and acquired via the second communication path associated with the first communication path in which the failure is detected.
JP2017060976A 2017-03-27 2017-03-27 Server system, switch module and log acquisition method Active JP6862988B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2017060976A JP6862988B2 (en) 2017-03-27 2017-03-27 Server system, switch module and log acquisition method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017060976A JP6862988B2 (en) 2017-03-27 2017-03-27 Server system, switch module and log acquisition method

Publications (2)

Publication Number Publication Date
JP2018163557A JP2018163557A (en) 2018-10-18
JP6862988B2 true JP6862988B2 (en) 2021-04-21

Family

ID=63860527

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017060976A Active JP6862988B2 (en) 2017-03-27 2017-03-27 Server system, switch module and log acquisition method

Country Status (1)

Country Link
JP (1) JP6862988B2 (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7367495B2 (en) 2019-11-29 2023-10-24 富士通株式会社 Information processing equipment and communication cable log information collection method

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05204818A (en) * 1992-01-30 1993-08-13 Nec Eng Ltd Fault information gathering system in data processing system
US20070083723A1 (en) * 2005-09-23 2007-04-12 Dey Jayanta K Highly-available blade-based distributed computing system
JP2014241092A (en) * 2013-06-12 2014-12-25 株式会社日立製作所 Computer system and fault detection method
JP5987797B2 (en) * 2013-08-06 2016-09-07 富士ゼロックス株式会社 Information processing apparatus and program

Also Published As

Publication number Publication date
JP2018163557A (en) 2018-10-18

Similar Documents

Publication Publication Date Title
US7240130B2 (en) Method of transmitting data through an 12C router
US7957402B2 (en) UDP to TCP bridge
US7010639B2 (en) Inter integrated circuit bus router for preventing communication to an unauthorized port
US7082488B2 (en) System and method for presence detect and reset of a device coupled to an inter-integrated circuit router
US7630304B2 (en) Method of overflow recovery of I2C packets on an I2C router
KR102340468B1 (en) Logging traffic on computer networks
US11336552B2 (en) Data center troubleshooting mechanism
JP5811995B2 (en) Communication system and network relay device
US10586043B2 (en) System and method for detecting malicious software in NVME over fabrics devices
CN112333044B (en) Shunting equipment performance test method, device and system, electronic equipment and medium
US7398345B2 (en) Inter-integrated circuit bus router for providing increased security
CN110011941B (en) Message forwarding method and device
CN102346707A (en) Server system and operation method thereof
US8417840B2 (en) Methods for analyzing USB data traffic using a single USB host controller
JP6862988B2 (en) Server system, switch module and log acquisition method
US20190042161A1 (en) Hard Disk Operation Method and Hard Disk Manager
GB2404045A (en) An inter-integrated circuit router for supporting independent transmission rates
CN104486112A (en) Receiving processing method for data frame
KR101709632B1 (en) Information processing device
JP2005051335A (en) Switch for providing path changeover
US10243803B2 (en) Service interface topology management
US8880956B2 (en) Facilitating processing in a communications environment using stop signaling
CN111149105B (en) Method and device for immediate and non-reactive transmission of log messages
US20040255193A1 (en) Inter integrated circuit router error management system and method
CN104933001A (en) Double-controller data communication method based on RapidIO technology

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200217

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20210217

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210302

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20210315

R150 Certificate of patent or registration of utility model

Ref document number: 6862988

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150