JP2007123955A - Computer system, network apparatus, fault occurrence notification method, and fault occurrence notification program - Google Patents

Computer system, network apparatus, fault occurrence notification method, and fault occurrence notification program Download PDF

Info

Publication number
JP2007123955A
JP2007123955A JP2005309016A JP2005309016A JP2007123955A JP 2007123955 A JP2007123955 A JP 2007123955A JP 2005309016 A JP2005309016 A JP 2005309016A JP 2005309016 A JP2005309016 A JP 2005309016A JP 2007123955 A JP2007123955 A JP 2007123955A
Authority
JP
Japan
Prior art keywords
failure
network
parameter
network parameter
network device
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2005309016A
Other languages
Japanese (ja)
Other versions
JP4367400B2 (en
Inventor
Yoshiyuki Ishii
義之 石井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2005309016A priority Critical patent/JP4367400B2/en
Publication of JP2007123955A publication Critical patent/JP2007123955A/en
Application granted granted Critical
Publication of JP4367400B2 publication Critical patent/JP4367400B2/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To provide a technology capable of transmitting information denoting occurrence of a fault via a communication network even when the fault causes disabled access to an external storage device, resulting in causing unable communication network settings. <P>SOLUTION: A microcode storage section 2 stores in advance information of identifying a network apparatus 1. On the occurrence of the fault causing a disabled access to the external storage section 105, a network control section 106 transmits the information including the identification of identifying the network apparatus 1 and denoting the occurrence of the fault to an administration host computer 2 via the communication network 3 by means of multicast. <P>COPYRIGHT: (C)2007,JPO&INPIT

Description

本発明は、通信ネットワークを介して障害の発生を通知するコンピュータシステム、ネットワーク装置、障害発生通知方法、および障害発生通知プログラムに関する。   The present invention relates to a computer system, a network device, a failure occurrence notification method, and a failure occurrence notification program for notifying occurrence of a failure via a communication network.

通信ネットワークを介してコンピュータに装置が接続されているコンピュータシステムがある。   There are computer systems in which devices are connected to a computer via a communication network.

コンピュータシステムを構成する装置に障害が発生した場合には、速やかに障害の発生を検知し、障害の解析を行って復旧作業を行う必要がある。そのため、SNMP(Simple Network Management Protocol)等の管理プロトコルを用いて、通信ネットワークに接続された管理ホストコンピュータが定期的に通信ネットワークに接続された装置の運用状態を監視したり、装置が管理ホストコンピュータに障害の発生を示す情報を送信したりすることによって、管理ホストコンピュータは障害の発生を検知し、保守サービスセンタ等に障害の発生を示す情報を送信し、障害の復旧を促す。   When a failure occurs in an apparatus constituting the computer system, it is necessary to quickly detect the occurrence of the failure, analyze the failure, and perform a recovery operation. Therefore, using a management protocol such as SNMP (Simple Network Management Protocol), the management host computer connected to the communication network periodically monitors the operating state of the device connected to the communication network, or the device is managed by the management host computer. By transmitting information indicating the occurrence of a failure to the management host computer, the management host computer detects the occurrence of the failure and transmits information indicating the occurrence of the failure to the maintenance service center or the like to prompt the recovery of the failure.

このようなコンピュータシステムでは、保守サービスセンタが、送信された障害の発生を示す情報にもとづいて、障害の解析を行う。従って、障害の早期復旧には、保守サービスセンタに送信される障害の発生を示す情報が、障害発生箇所を特定するのに十分な情報を含んでいることが好ましい。   In such a computer system, the maintenance service center analyzes the failure based on the transmitted information indicating the occurrence of the failure. Therefore, for early recovery of a failure, it is preferable that the information indicating the occurrence of the failure transmitted to the maintenance service center includes information sufficient to identify the location where the failure has occurred.

一方、コンピュータシステムが処理するデータの大容量化と記憶装置の高信頼性化との要求から、記憶装置として複数の磁気ディスクドライブで構成されたRAID(Redundant Arrays of Inexpensive Disks)装置が使用されることが多くなってきている。RAID装置は、データを複数の磁気ディスクドライブに分散し、冗長性を持たせて記憶するため、磁気ディスクドライブの1つが故障した場合でもデータを復元することができるという特徴があり、故障した磁気ディスクドライブおよび磁気ディスクドライブを制御するRAIDコントローラのそれぞれを、部品として交換することができる。   On the other hand, a RAID (Redundant Arrays of Inexpensive Disks) device composed of a plurality of magnetic disk drives is used as a storage device in order to increase the capacity of data processed by the computer system and increase the reliability of the storage device. A lot is happening. A RAID device distributes data to a plurality of magnetic disk drives and stores them with redundancy, so that even if one of the magnetic disk drives fails, the data can be restored. Each of the RAID controllers that control the disk drive and the magnetic disk drive can be replaced as parts.

このRAID装置を記憶装置としてホストコンピュータにサービスを提供する仮想テープサブシステムがある。仮想テープサブシステムは、ホストコンピュータに対して磁気テープ装置のように振る舞う。そして、磁気テープへ書き込むように受信したデータをRAID装置に格納して管理を行う。そのようなシステムでは、ホストコンピュータに対してサービスを提供する仮想テープコントローラ、RAIDコントローラ、およびそれぞれの磁気ディスクドライブを故障時に交換可能である。   There is a virtual tape subsystem that provides services to a host computer using this RAID device as a storage device. The virtual tape subsystem behaves like a magnetic tape device with respect to the host computer. Then, the received data is written in the magnetic tape and stored in the RAID device for management. In such a system, the virtual tape controller that provides services to the host computer, the RAID controller, and the respective magnetic disk drives can be replaced in the event of a failure.

この仮想テープサブシステムでは、IPアドレスや、サブネットマスク、ゲートウェイホストコンピュータのIPアドレス、DHCP(Dynamic Host Configuration Protocol)の設定等の通信ネットワーク接続に必要なネットワークパラメータが、仮想テープコントローラに記憶されている場合には、仮想テープコントローラの障害発生および交換時にネットワークパラメータの設定が消去されてしまい、通信ネットワークに接続するためには、ネットワークパラメータの再設定が必要になるため、仮想テープコントローラではなく外部記憶装置(RAID)がネットワークパラメータを記憶する必要がある。   In this virtual tape subsystem, network parameters necessary for communication network connection such as IP address, subnet mask, gateway host computer IP address, DHCP (Dynamic Host Configuration Protocol) settings, etc. are stored in the virtual tape controller. In some cases, network parameter settings are erased when a virtual tape controller failure occurs and is replaced, and network parameters need to be reconfigured to connect to a communication network. The device (RAID) needs to store network parameters.

すなわち、ネットワークパラメータが、磁気ディスクドライブ等の外部記憶装置に記憶されているコンピュータシステムでは、外部記憶装置にアクセスできないような障害が発生した場合には、通信ネットワークの設定を行うことができず、障害を示す情報を通信ネットワークを介して送信することができないという問題がある。   In other words, in a computer system in which network parameters are stored in an external storage device such as a magnetic disk drive, a communication network cannot be set if a failure that prevents access to the external storage device occurs. There is a problem that information indicating a failure cannot be transmitted via a communication network.

また、DHCPサーバの障害や、DHCPで割り当てられるIPアドレスの枯渇、ネットワークパラメータの設定ミスによるIPアドレスの重複などのトラブルにより、IPアドレスの設定が行えない場合も、障害を示す情報を通信ネットワークを介して送信することができない。   In addition, if the IP address cannot be set due to a failure of the DHCP server, the IP address assigned by DHCP is exhausted, or the IP address is duplicated due to a network parameter setting error, information indicating the failure is sent to the communication network. Cannot be sent through.

従って、このような障害が発生した場合、保守サービスセンタに障害を示す情報が送信されないため、故障箇所を特定することができず、装置の設置場所まで行って故障箇所を確認しなければならなかった。   Therefore, when such a failure occurs, information indicating the failure is not transmitted to the maintenance service center, so the failure location cannot be specified, and the failure location must be confirmed by going to the installation location of the device. It was.

特許文献1には、ハードディスク等が故障した場合に、故障部品を交換した後で故障前の設定に復旧するために、復旧用情報をサーバが格納する方法が記載されている。   Patent Document 1 describes a method in which a server stores recovery information in order to recover to a setting before a failure after replacing a failed part when a hard disk or the like fails.

特許文献2には、DHCPで取得したIPアドレスが変更されたことを特定のグループのホストコンピュータに通知する方法が記載されている。   Patent Document 2 describes a method for notifying a specific group of host computers that an IP address acquired by DHCP has been changed.

特許文献3には、障害の発生を検出したサーバが、障害発生ホストコンピュータに代わる代替ホストコンピュータに処理を引き継がせることを、システムのすべてのコンピュータに通知する方法が記載されている。   Patent Document 3 describes a method in which a server that detects the occurrence of a failure notifies all computers in the system that an alternative host computer in place of the failure-occurring host computer can take over the processing.

特許文献4には、マルチキャストパケットを転送するゲートウェイコンピュータが、マルチキャストパケットをユニキャストパケットに変換して送信先に送信する方法が記載されている。   Patent Document 4 describes a method in which a gateway computer that transfers a multicast packet converts the multicast packet into a unicast packet and transmits it to a transmission destination.

なお、非特許文献1には、DHCPによって割り当てられたIPアドレスが使用中であるか否かを確認する方法が記載されている。   Non-Patent Document 1 describes a method for confirming whether an IP address assigned by DHCP is in use.

特開2001−43156号公報 (段落0019〜0036、図1)JP 2001-43156 A (paragraphs 0019 to 0036, FIG. 1) 特開2001−326656号公報 (段落0022〜0058、図1)JP 2001-326656 A (paragraphs 0022 to 0058, FIG. 1) 特開2003−186722号公報 (段落0017〜0055、図1)JP 2003-186722 A (paragraphs 0017 to 0055, FIG. 1) 特開平10−242962号公報 (段落0019〜0047、図1)Japanese Patent Laid-Open No. 10-242962 (paragraphs 0019 to 0047, FIG. 1) R.Droms、“Dynamic Host Configuration Protocol(Request for Comments:2131) 4.4.1 Initialization and allocation of network address”、[online]、1997年3月、The Internet Engineering Task Force、[平成17年9月27日検索]、インターネット<URL:http://www.ietf.org/rfc/rfc2131.txt>R. Droms, “Dynamic Host Configuration Protocol (Request for Comments: 2131) 4.4.1 Initialization and allocation of network address”, March, 1997, T er, in March, 1997. Search], Internet <URL: http://www.ietf.org/rfc/rfc2131.txt>

しかし、特許文献1では、障害の発生の検出について触れられておらず、前述した問題を解決することはできない。   However, Patent Document 1 does not mention detection of the occurrence of a failure and cannot solve the above-described problem.

特許文献2に記載されている方法は、障害の発生の通知には対応していない。また、特許文献3に記載されている方法は、代替ホストコンピュータに処理を引き継がせるための要求パケットを送信するために、要求元(すなわち、障害発生ホストコンピュータ)にIPアドレス等のネットワークパラメータを設定することが必要である。しかし、IPアドレス等のネットワークパラメータを設定することができないような障害が発生した場合には、要求パケットを送信することができず、障害の発生を通知することができないという問題がある。   The method described in Patent Document 2 does not support notification of occurrence of a failure. In addition, the method described in Patent Document 3 sets network parameters such as an IP address in a request source (that is, a faulty host computer) in order to transmit a request packet for allowing an alternative host computer to take over processing. It is necessary to. However, when a failure occurs in which a network parameter such as an IP address cannot be set, there is a problem that a request packet cannot be transmitted and the occurrence of the failure cannot be notified.

特許文献4に記載されている方法は、マルチキャストパケットをユニキャストパケットに変換するゲートウェイホストコンピュータが必要になり、コストがかかるという問題がある。   The method described in Patent Document 4 requires a gateway host computer that converts a multicast packet into a unicast packet, which is expensive.

また、特許文献1に記載されている方法と、特許文献3に記載されている方法とを組み合わせても、IPアドレス等のネットワークパラメータを設定することができないような障害が発生した場合には、要求パケットを送信することができず、障害の発生を通知することができないという問題を解決することはできない。   In addition, even when the method described in Patent Document 1 and the method described in Patent Document 3 are combined, if a failure occurs in which a network parameter such as an IP address cannot be set, The problem that the request packet cannot be transmitted and the occurrence of the failure cannot be notified cannot be solved.

特許文献2に記載されている方法と、特許文献4に記載されている方法とを組み合わせても、DHCPでIPアドレスを割り当てることができなかった場合には、障害の発生を通知することができないという問題がある。   Even if the method described in Patent Document 2 and the method described in Patent Document 4 are combined, if an IP address cannot be assigned by DHCP, the failure cannot be notified. There is a problem.

そこで、本発明は、通信ネットワークのネットワークパラメータを設定できないような障害が発生した場合でも、通信ネットワークを介して障害の発生を通知することができるコンピュータシステム、ネットワーク装置、障害発生通知方法、および障害発生通知プログラムを提供することを目的とする。   Therefore, the present invention provides a computer system, a network device, a failure occurrence notification method, and a failure that can notify the occurrence of a failure via a communication network even when a failure occurs in which a network parameter of the communication network cannot be set. The purpose is to provide an outbreak notification program.

本発明によるコンピュータシステムは、通信ネットワークに接続され、障害が発生したネットワーク装置が、通信ネットワークを介してコンピュータに障害の発生を通知するコンピュータシステムであって、ネットワーク装置は、通信ネットワークに接続するためのパラメータであるネットワークパラメータを特定できないことを検出する障害検出手段と、障害検出手段がネットワークパラメータを特定できないことを検出した場合に、障害が発生したことを示す障害情報を生成する障害情報生成手段と、障害情報をマルチキャストで送信する送信手段とを含むことを特徴とする。   A computer system according to the present invention is a computer system that is connected to a communication network, and a network device in which a failure has occurred notifies the computer of the occurrence of the failure via the communication network. The network device is connected to the communication network. Detecting means for detecting that a network parameter that is a parameter cannot be specified, and failure information generating means for generating failure information indicating that a failure has occurred when the failure detecting means detects that the network parameter cannot be specified And transmission means for transmitting the failure information by multicast.

ネットワーク装置は、ネットワーク装置を識別する情報を予め記憶する識別情報記憶手段を含み、障害情報生成手段は、識別情報記憶手段が記憶しているネットワーク装置を識別する情報を含む障害情報を生成してもよい。   The network device includes identification information storage means for preliminarily storing information for identifying the network device, and the failure information generation means generates failure information including information for identifying the network device stored in the identification information storage means. Also good.

ネットワーク装置は、ネットワークパラメータを記憶するネットワークパラメータ記憶手段を含み、障害検出手段は、ネットワークパラメータ記憶手段にアクセスできないことを検出することで、ネットワークパラメータを特定できないことを検出してもよい。   The network device may include network parameter storage means for storing network parameters, and the failure detection means may detect that the network parameters cannot be specified by detecting that the network parameter storage means cannot be accessed.

障害情報生成手段は、発生した障害を示す情報を含む障害情報を生成してもよい。なお、障害情報生成手段は、ネットワークパラメータ記憶手段にアクセスできないという障害を示す情報を含む障害情報を生成してもよい。   The failure information generation means may generate failure information including information indicating the failure that has occurred. The failure information generating unit may generate failure information including information indicating a failure that the network parameter storage unit cannot be accessed.

ネットワーク装置の要求に応じてネットワーク装置にネットワークパラメータを送信するネットワークパラメータ提供手段を備え、ネットワーク装置は、ネットワークパラメータ提供手段に対してネットワークパラメータの送信を要求し、ネットワークパラメータ提供手段からネットワークパラメータを受信するネットワークパラメータ受信手段を含み、障害検出手段は、ネットワークパラメータ受信手段がネットワークパラメータを受信できなかったこと、または受信したネットワークパラメータが使用中であったことを検出することで、ネットワークパラメータを特定できないことを検出してもよい。   Network parameter providing means for transmitting network parameters to the network apparatus in response to a request from the network apparatus. The network apparatus requests the network parameter providing means to transmit network parameters, and receives network parameters from the network parameter providing means. The failure detection means cannot identify the network parameter by detecting that the network parameter reception means cannot receive the network parameter or that the received network parameter is in use. You may detect that.

障害が発生したネットワーク装置が接続されている第1の通信ネットワークと、コンピュータが接続されている第2の通信ネットワークとを接続し、ネットワーク装置が送信した障害情報を第1の通信ネットワークを介して受信し、受信した障害情報を、第2の通信ネットワークを介してコンピュータに送信するゲートウェイ装置を備えてもよい。   The first communication network to which the network device in which the failure has occurred is connected to the second communication network to which the computer is connected, and the failure information transmitted by the network device is transmitted via the first communication network. You may provide the gateway apparatus which receives and transmits the received failure information to a computer via a 2nd communication network.

本発明によるネットワーク装置は、通信ネットワークを介してコンピュータに障害の発生を通知するネットワーク装置であって、通信ネットワークに接続するためのパラメータであるネットワークパラメータを特定できないことを検出する障害検出手段と、障害検出手段がネットワークパラメータを特定できないことを検出した場合に、障害が発生したことを示す障害情報を生成する障害情報生成手段と、障害情報をマルチキャストで送信する送信手段とを含むことを特徴とする。   A network device according to the present invention is a network device that notifies a computer of the occurrence of a failure via a communication network, and detects failure that a network parameter that is a parameter for connecting to the communication network cannot be specified; When failure detection means detects that a network parameter cannot be specified, it includes failure information generation means for generating failure information indicating that a failure has occurred, and transmission means for transmitting the failure information by multicast. To do.

ネットワーク装置を識別する情報を予め記憶する識別情報記憶手段を含み、障害情報生成手段は、識別情報記憶手段が記憶しているネットワーク装置を識別する情報を含む障害情報を生成してもよい。   Identification information storage means for preliminarily storing information for identifying the network device may be included, and the failure information generation means may generate failure information including information for identifying the network device stored in the identification information storage means.

ネットワークパラメータを記憶するネットワークパラメータ記憶手段を含み、障害検出手段は、ネットワークパラメータ記憶手段にアクセスできないことを検出することで、ネットワークパラメータを特定できないことを検出してもよい。   Network parameter storage means for storing the network parameter may be included, and the failure detection means may detect that the network parameter cannot be specified by detecting that the network parameter storage means cannot be accessed.

障害情報生成手段は、発生した障害を示す情報を含む障害情報を生成してもよい。なお、障害情報生成手段は、ネットワークパラメータ記憶手段にアクセスできないという障害を示す情報を含む障害情報を生成してもよい。   The failure information generation means may generate failure information including information indicating the failure that has occurred. The failure information generating unit may generate failure information including information indicating a failure that the network parameter storage unit cannot be accessed.

要求に応じてネットワークパラメータを送信するネットワークパラメータ提供手段に対してネットワークパラメータの送信を要求し、ネットワークパラメータ提供手段からネットワークパラメータを受信するネットワークパラメータ受信手段を含み、障害検出手段は、ネットワークパラメータ受信手段がネットワークパラメータを受信できなかったこと、または受信したネットワークパラメータが使用中であったことを検出することで、ネットワークパラメータを特定できないことを検出してもよい。   Network parameter receiving means for requesting network parameter providing means for transmitting network parameters in response to a request, and receiving network parameters from the network parameter providing means, and the failure detecting means includes network parameter receiving means By detecting that the network parameter cannot be received or that the received network parameter is being used, it may be detected that the network parameter cannot be specified.

本発明による障害発生通知方法は、障害が発生したネットワーク装置が、通信ネットワークを介してコンピュータに障害の発生を通知する障害発生通知方法であって、ネットワーク装置の障害検出手段が、通信ネットワークに接続するためのパラメータであるネットワークパラメータを特定できないことを検出する障害検出ステップと、障害検出手段がネットワークパラメータを特定できないことを検出した場合に、ネットワーク装置の障害情報生成手段が、障害が発生したことを示す障害情報を生成する障害情報生成ステップと、ネットワーク装置の送信手段が、障害情報をマルチキャストで送信する送信ステップとを含むことを特徴とする。   The failure occurrence notification method according to the present invention is a failure occurrence notification method in which a network device in which a failure has occurred notifies the computer of the occurrence of the failure via the communication network, and the failure detection means of the network device is connected to the communication network. A failure detection step for detecting that the network parameter, which is a parameter for determining the network parameter, cannot be specified, and that the failure detection means of the network device has detected a failure when the failure detection means detects that the network parameter cannot be specified Including a failure information generation step for generating failure information indicating the failure information, and a transmission step for transmitting the failure information by multicast by the transmission means of the network device.

障害情報生成手段が、障害情報生成ステップで、識別情報記憶手段が予め記憶しているネットワーク装置を識別する情報を含む障害情報を生成してもよい。   The failure information generation unit may generate failure information including information for identifying the network device stored in advance in the identification information storage unit in the failure information generation step.

ネットワーク装置の障害検出手段が、障害検出ステップで、ネットワークパラメータを記憶しているネットワークパラメータ記憶手段にアクセスできないことを検出することで、ネットワークパラメータを特定できないことを検出してもよい。   The failure detection unit of the network device may detect that the network parameter cannot be specified by detecting that the network parameter storage unit storing the network parameter cannot be accessed in the failure detection step.

障害情報生成手段が、障害情報生成ステップで、発生した障害を示す情報を含む障害情報を生成してもよい。なお、障害情報生成手段が、障害情報生成ステップで、ネットワークパラメータ記憶手段にアクセスできないという障害を示す情報を含む障害情報を生成してもよい。   The fault information generation means may generate fault information including information indicating the fault that has occurred in the fault information generation step. The failure information generation unit may generate failure information including information indicating a failure that the network parameter storage unit cannot be accessed in the failure information generation step.

ネットワーク装置のネットワークパラメータ受信手段が、ネットワーク装置の要求に応じてネットワークパラメータを送信するネットワークパラメータ提供手段に対してネットワークパラメータの送信を要求し、ネットワークパラメータ提供手段からネットワークパラメータを受信するネットワークパラメータ受信ステップを含み、ネットワーク装置の障害検出手段が、障害検出ステップで、ネットワークパラメータ受信手段がネットワークパラメータを受信できなかったこと、または受信したネットワークパラメータが使用中であったことを検出することで、ネットワークパラメータを特定できないことを検出してもよい。   A network parameter receiving step in which the network parameter receiving means of the network device requests the network parameter providing means for transmitting the network parameter in response to a request from the network device, and receives the network parameter from the network parameter providing means. And the network device failure detecting means detects that the network parameter receiving means cannot receive the network parameter or that the received network parameter is in use at the failure detecting step. It may be detected that cannot be specified.

障害が発生したネットワーク装置が接続されている第1の通信ネットワークと、コンピュータが接続されている第2の通信ネットワークとを接続するゲートウェイ装置が、ネットワーク装置が送信した障害情報を第1の通信ネットワークを介して受信し、受信した障害情報を、第2の通信ネットワークを介してコンピュータに送信する転送ステップを備えてもよい。   The gateway device that connects the first communication network to which the network device in which the failure has occurred is connected to the second communication network to which the computer is connected transmits the failure information transmitted by the network device to the first communication network. And transferring the received failure information to the computer via the second communication network.

本発明による障害発生通知プログラムは、通信ネットワークを介して他のコンピュータに障害の発生を通知するネットワーク装置に搭載される障害発生通知プログラムであって、コンピュータに、通信ネットワークに接続するためのパラメータであるネットワークパラメータを特定できないことを検出する障害検出処理と、障害検出処理でネットワークパラメータを特定できないことを検出した場合に、障害が発生したことを示す障害情報を生成する障害情報生成処理と、障害情報をマルチキャストで送信する送信処理とを実行させることを特徴とする。   A failure occurrence notification program according to the present invention is a failure occurrence notification program installed in a network device for notifying other computers of the occurrence of a failure via a communication network, and is a parameter for connecting the computer to the communication network. Failure detection processing that detects that a network parameter cannot be specified, failure information generation processing that generates failure information indicating that a failure has occurred when the failure detection processing detects that a network parameter cannot be specified, and failure And a transmission process for transmitting information by multicast.

本発明によれば、障害情報をマルチキャストで送信するため、通信ネットワークに接続するためのネットワークパラメータを特定できないような障害が発生した場合でも、通信ネットワークを介して障害の発生を通知することができる。   According to the present invention, since failure information is transmitted by multicast, even when a failure occurs in which a network parameter for connecting to a communication network cannot be specified, the occurrence of the failure can be notified via the communication network. .

識別情報記憶手段が、ネットワーク装置を識別する情報を予め記憶するように構成されている場合には、障害が発生した装置を通知することができる。また、障害情報生成手段が、ネットワークパラメータを記憶している機器にアクセスできない場合や、接続されている装置からネットワークパラメータを受信できない場合、または受信したネットワークパラメータが使用中であった場合等の障害が発生したことを示す障害情報を生成するように構成されている場合には、障害の内容を通知することができる。   When the identification information storage unit is configured to store information for identifying the network device in advance, it is possible to notify the device in which the failure has occurred. Failures such as when the failure information generation means cannot access the device storing the network parameters, when it cannot receive network parameters from the connected device, or when the received network parameters are in use If it is configured to generate failure information indicating that a failure has occurred, the content of the failure can be notified.

ゲートウェイ装置が、ネットワーク装置が送信した障害情報を、コンピュータに送信するように構成されている場合には、ネットワーク装置とコンピュータとが異なる通信ネットワークに接続されていても、障害の発生を通知することができる。   When the gateway device is configured to transmit the failure information transmitted by the network device to the computer, the occurrence of the failure is notified even if the network device and the computer are connected to different communication networks. Can do.

実施の形態1.
本発明の第1の実施の形態について、図面を参照して説明する。図1は、本発明の第1の実施の形態におけるコンピュータシステムの一構成例を示すブロック図である。
Embodiment 1 FIG.
A first embodiment of the present invention will be described with reference to the drawings. FIG. 1 is a block diagram showing a configuration example of a computer system according to the first embodiment of the present invention.

本発明の第1の実施の形態のコンピュータシステムは、接続された装置を管理する管理ホストコンピュータ2、および通信ネットワーク3を介して管理ホストコンピュータ2に接続されたネットワーク装置1を含む。   The computer system according to the first embodiment of this invention includes a management host computer 2 that manages connected devices and a network device 1 that is connected to the management host computer 2 via a communication network 3.

なお、通信ネットワーク3は、例えば、Ethernet(登録商標)や、FDDI(Fiber−Distributed Data Interface)等に対応した通信ネットワーク、無線LAN等によって実現されるが、本発明はこれに限定されるものではなく、他の通信ネットワークによって実現されてもよい。   The communication network 3 is realized by, for example, a communication network, a wireless LAN, or the like corresponding to Ethernet (registered trademark), FDDI (Fiber-Distributed Data Interface), etc., but the present invention is not limited to this. Instead, it may be realized by another communication network.

ネットワーク装置1は、プログラム制御にしたがって動作するCPU(中央演算装置)(障害検出手段、障害情報生成手段)101、CPU101を動作させるためのマイクロコードを格納するマイクロコード格納部(識別情報記憶手段)102、情報を記憶する外部記憶装置105、外部記憶装置(ネットワークパラメータ記憶手段)105を制御する外部記憶装置制御部104、管理ホストコンピュータ2と情報を送受信するネットワーク制御部(送信手段、ネットワークパラメータ受信手段)106、およびネットワーク装置1の各部を接続する内部バス103を含む。   The network apparatus 1 includes a CPU (central processing unit) (fault detection means, fault information generation means) 101 that operates according to program control, and a microcode storage unit (identification information storage means) that stores microcode for operating the CPU 101. 102, an external storage device 105 that stores information, an external storage device control unit 104 that controls the external storage device (network parameter storage unit) 105, and a network control unit that transmits and receives information to and from the management host computer 2 (transmission unit, network parameter reception) Means) 106 and an internal bus 103 for connecting each part of the network device 1.

なお、ネットワーク装置1は、例えば、仮想テープライブラリ装置によって実現され、装置の障害は管理ホストコンピュータ2に通知される。   The network device 1 is realized by, for example, a virtual tape library device, and the failure of the device is notified to the management host computer 2.

また、外部記憶装置105に用いられる文言「外部」とは、ネットワーク装置1の筐体の外部に設置されることを示しているのではなく、CPU101が直接制御を行わず、CPU101が外部記憶装置制御部104を介して制御することを示している。具体的には、外部記憶装置105は、例えば、RAID装置等の不揮発性記憶手段によって実現される。   Further, the term “external” used for the external storage device 105 does not indicate that it is installed outside the casing of the network device 1, but the CPU 101 does not directly control the CPU 101. Control is performed via the control unit 104. Specifically, the external storage device 105 is realized by non-volatile storage means such as a RAID device, for example.

CPU101は、プログラム制御にしたがって、マイクロコード格納部102が格納しているマイクロコードにより動作し、ネットワーク装置1の各部を制御する。   The CPU 101 operates according to the microcode stored in the microcode storage unit 102 according to program control, and controls each unit of the network device 1.

マイクロコード格納部102は、CPU101の動作を制御するマイクロコードと、障害を示す情報の送信先のマルチキャストアドレスおよびUDP(User Datagram Protocol)ポート番号と、ネットワーク装置1を識別する情報とを予め記憶している。なお、ネットワーク装置1を識別する情報とは、例えば、ネットワーク装置1のMAC(Media Access Control)アドレス、製品識別子および製品シリアル番号等である。   The microcode storage unit 102 stores in advance a microcode for controlling the operation of the CPU 101, a multicast address and a UDP (User Datagram Protocol) port number of information indicating a failure, and information for identifying the network device 1 in advance. ing. The information for identifying the network device 1 is, for example, a MAC (Media Access Control) address, a product identifier, a product serial number, and the like of the network device 1.

外部記憶装置制御部104は、CPU101の命令に従って、外部記憶装置105を制御する。   The external storage device control unit 104 controls the external storage device 105 in accordance with an instruction from the CPU 101.

外部記憶装置105は、ネットワーク装置1が通信ネットワーク3に接続するためのパラメータであるネットワークパラメータを記憶している。なお、ネットワークパラメータは、管理ホストコンピュータ2のIPアドレスを含んでもよい。   The external storage device 105 stores network parameters that are parameters for the network device 1 to connect to the communication network 3. The network parameter may include the IP address of the management host computer 2.

ネットワーク制御部106は、CPU101によって外部記憶装置105が記憶しているネットワークパラメータが設定されると、CPU101の命令に従って通信ネットワーク3を介して管理ホストコンピュータ2と情報を送受信する。また、ネットワーク制御部106は、CPU101の制御にしたがって、マルチキャストで障害を示す情報を送信する。なお、マルチキャストで情報を送信するとは、特定のIPアドレスをもつコンピュータではなく、同じグループに属する(マルチキャストアドレスの)単一または複数のコンピュータに同時に情報を送信することをいう。   When the network parameters stored in the external storage device 105 are set by the CPU 101, the network control unit 106 transmits and receives information to and from the management host computer 2 via the communication network 3 in accordance with instructions from the CPU 101. Further, the network control unit 106 transmits information indicating a failure by multicast under the control of the CPU 101. Note that sending information by multicast means sending information to a single computer or a plurality of computers belonging to the same group (of a multicast address) at the same time, not to a computer having a specific IP address.

ネットワーク装置1は、コンピュータに、通信ネットワークに接続するためのパラメータであるネットワークパラメータを特定できないことを検出する障害検出処理と、障害検出処理でネットワークパラメータを特定できないことを検出した場合に、障害が発生したことを示す障害情報を生成する障害情報生成処理と、障害情報をマルチキャストで送信する送信処理とを実行させることを特徴とする障害発生通知プログラムを搭載している。   When the network device 1 detects that the network parameter that is a parameter for connecting to the communication network cannot be specified in the computer, and detects that the network parameter cannot be specified in the failure detection process, the network device 1 detects the failure. A failure occurrence notification program characterized by executing failure information generation processing for generating failure information indicating that it has occurred and transmission processing for transmitting failure information by multicast is installed.

次に、本発明の第1の実施の形態の動作について、図面を参照して説明する。図2は、本発明の第1の実施の形態の動作を説明するフローチャートである。   Next, the operation of the first exemplary embodiment of the present invention will be described with reference to the drawings. FIG. 2 is a flowchart for explaining the operation of the first embodiment of the present invention.

ネットワーク装置1が起動すると、CPU101は、外部記憶装置制御部104に、外部記憶装置105に正常にアクセスできるか否かを確認させる(ステップS101)。   When the network device 1 is activated, the CPU 101 causes the external storage device control unit 104 to check whether the external storage device 105 can be normally accessed (step S101).

CPU101は、外部記憶装置制御部104が、外部記憶装置105に正常にアクセスできることを確認すると、外部記憶装置制御部104に、外部記憶装置105が記憶しているネットワーク装置1や管理ホストコンピュータ2のIPアドレスを含むネットワークパラメータを読み出させる(ステップS102)。   When the CPU 101 confirms that the external storage device control unit 104 can normally access the external storage device 105, the CPU 101 stores the network device 1 and management host computer 2 stored in the external storage device 105 in the external storage device control unit 104. The network parameters including the IP address are read (step S102).

そして、CPU101は、読み出させたネットワークパラメータを、ネットワーク制御部106に設定する(ステップS103)。   Then, the CPU 101 sets the read network parameter in the network control unit 106 (step S103).

CPU101は、外部記憶装置制御部104が、外部記憶装置105に正常にアクセスできない(つまり、ネットワークパラメータを設定(特定)できない)ことを確認すると、障害を示す情報を生成し、ネットワーク制御部106に通信ネットワーク3を介して管理ホストコンピュータ2へマルチキャストで送信させる(ステップS104)。   When the CPU 101 confirms that the external storage device control unit 104 cannot normally access the external storage device 105 (that is, the network parameter cannot be set (specified)), the CPU 101 generates information indicating a failure and sends it to the network control unit 106. The data is transmitted by multicast to the management host computer 2 via the communication network 3 (step S104).

具体的には、ネットワーク制御部106は、管理ホストコンピュータ2が属するグループのマルチキャストアドレスのUDPポート番号に、障害を示す情報を管理ホストコンピュータ2が認識できる形式で送信する。   Specifically, the network control unit 106 transmits information indicating a failure to the UDP port number of the multicast address of the group to which the management host computer 2 belongs in a format that the management host computer 2 can recognize.

図3は、障害を示す情報のパケットの一例を示す説明図である。図3には、障害を示す情報のパケットが、IP Headerの部分に、管理ホストコンピュータ2が属するグループのマルチキャストアドレス(Destination Address)を含み、UDP Headerの部分に、UDPポート番号(Destination Port)を含み、Packet Dataの部分に、障害が発生したネットワーク装置1のMACアドレス(MAC Address)、製品識別子(Product Identifier)、製品シリアル番号(Product Sereal No.)、障害の状態(Status)、および障害の詳細(Details)の情報を含むことが例示されている。   FIG. 3 is an explanatory diagram illustrating an example of a packet of information indicating a failure. In FIG. 3, a packet of information indicating a failure includes a multicast address (Destination Address) of a group to which the management host computer 2 belongs in the IP Header portion, and a UDP port number (Destination Port) in the UDP Header portion. In the Packet Data part, the MAC address (MAC Address), product identifier (Product Identifier), product serial number (Product Serial No.), failure status (Status), and failure It includes an example of including details (Details) information.

すなわち、障害を示す情報を生成するとは、ネットワーク装置1を識別する情報を含むパケットを生成することであって、例えば、図3で例示したネットワーク装置1のMACアドレス等の情報を含むパケットを生成することをいう。   That is, generating information indicating a failure means generating a packet including information for identifying the network device 1, for example, generating a packet including information such as the MAC address of the network device 1 illustrated in FIG. 3. To do.

そして、図3で例示した障害を示す情報は、外部記憶装置105のLBA(Logical Block Address)0x0011022セクタ番地からデータの読み込みができない(Disk Read Failure)という障害が発生していることを、Statusの欄が示している。   The information indicating the failure illustrated in FIG. 3 indicates that the failure that the data cannot be read from the LBA (Logical Block Address) 0x0011022 sector address of the external storage device 105 (Disk Read Fail) has occurred. The column shows.

管理ホストコンピュータ2は、このマルチキャストアドレスのUDPポート番号で予め障害情報の受信待ちを行い、障害を示す情報を受信する。   The management host computer 2 waits in advance for receiving failure information using the UDP port number of this multicast address, and receives information indicating the failure.

以上に述べたように、この実施の形態によれば、ネットワーク装置1は、IPアドレスを用いずに、UDPのマルチキャストでマルチキャストアドレスを送信先として、管理ホストコンピュータ2に障害を示す情報を送信する。そのため、外部記憶装置105や、外部記憶装置105のインタフェース等の障害によってネットワークパラメータが読み出せない場合であっても、ネットワーク装置1は、障害を示す情報を管理ホストコンピュータ2に送信することができる。   As described above, according to this embodiment, the network device 1 transmits information indicating a failure to the management host computer 2 using the multicast address as the transmission destination by UDP multicast without using the IP address. . Therefore, even when the network parameter cannot be read due to a failure such as the external storage device 105 or an interface of the external storage device 105, the network device 1 can transmit information indicating the failure to the management host computer 2. .

実施の形態2.
本発明の第2の実施の形態について、図面を参照して説明する。図4は、本発明の第2の実施の形態の一構成例を示すブロック図である。
Embodiment 2. FIG.
A second embodiment of the present invention will be described with reference to the drawings. FIG. 4 is a block diagram showing a configuration example of the second embodiment of the present invention.

本発明の第2の実施の形態では、ネットワーク装置1が第1の通信ネットワーク6に接続され、管理ホストコンピュータ2が、第1の通信ネットワーク6にゲートウェイホストコンピュータ(ゲートウェイ装置)5を介して接続されている第2の通信ネットワーク7に接続されている。また、第1の通信ネットワーク6には、DHCPサーバ(ネットワークパラメータ提供手段)4が接続されている。   In the second embodiment of the present invention, the network device 1 is connected to the first communication network 6, and the management host computer 2 is connected to the first communication network 6 via the gateway host computer (gateway device) 5. Connected to the second communication network 7. In addition, a DHCP server (network parameter providing means) 4 is connected to the first communication network 6.

その他の構成は、第1の実施の形態と同様なため、図1と同じ符号を付し、説明を省略する。なお、第1の通信ネットワーク6および第2の通信ネットワーク7は、例えば、Ethernetや、FDDI(Fiber−Distributed Data Interface)等に対応した通信ネットワーク、無線LAN等によって実現されるが、本発明はこれに限定されるものではなく、他の通信ネットワークによって実現されてもよい。   Since other configurations are the same as those in the first embodiment, the same reference numerals as those in FIG. The first communication network 6 and the second communication network 7 are realized by, for example, a communication network, a wireless LAN, or the like corresponding to Ethernet, FDDI (Fiber-Distributed Data Interface), and the like. However, the present invention is not limited to this, and may be realized by another communication network.

DHCPは、起動時に各装置に動的にネットワークパラメータを割り当てるためのプロトコルで、DHCPサーバ4は、第1の通信ネットワーク6に接続されているネットワーク装置1にIPアドレスを割り当て、割り当てたIPアドレスを含むネットワークパラメータを管理する。   DHCP is a protocol for dynamically assigning network parameters to each device at startup. The DHCP server 4 assigns an IP address to the network device 1 connected to the first communication network 6, and assigns the assigned IP address. Manage network parameters including.

ネットワーク装置1のネットワーク制御部106は、CPU101の制御に従って、第1の通信ネットワーク6を介してDHCPサーバ4にネットワークパラメータの送信を要求する。   The network control unit 106 of the network device 1 requests the DHCP server 4 to transmit network parameters via the first communication network 6 under the control of the CPU 101.

DHCPサーバ4は、ネットワーク装置1の要求に応じて、ネットワーク装置1のIPアドレス、サブネットマスク、およびゲートウェイホストコンピュータ5のIPアドレスを含むネットワークパラメータを、第1の通信ネットワーク6を介してネットワーク装置1に送信する。   In response to a request from the network device 1, the DHCP server 4 sends network parameters including the IP address of the network device 1, the subnet mask, and the IP address of the gateway host computer 5 via the first communication network 6. Send to.

ネットワーク装置1のCPU101は、DHCPサーバ4から受信したネットワークパラメータをネットワーク制御部106に設定する。   The CPU 101 of the network device 1 sets the network parameter received from the DHCP server 4 in the network control unit 106.

ネットワーク装置1は、障害を示す情報を管理ホストコンピュータ2に送信する場合、まず、ゲートウェイホストコンピュータ5に障害を示す情報を送信する。そして、ゲートウェイホストコンピュータ5は、ネットワーク装置1から受信した障害を示す情報を、管理ホストコンピュータ2に送信する。   When transmitting information indicating a failure to the management host computer 2, the network device 1 first transmits information indicating the failure to the gateway host computer 5. Then, the gateway host computer 5 transmits information indicating the failure received from the network device 1 to the management host computer 2.

また、管理ホストコンピュータ2は、情報をネットワーク装置1に送信する場合、まず、ゲートウェイホストコンピュータ5に情報を送信する。そして、ゲートウェイホストコンピュータ5は、管理ホストコンピュータ2から受信した情報を、ネットワーク装置1に送信する。   In addition, when transmitting information to the network device 1, the management host computer 2 first transmits information to the gateway host computer 5. Then, the gateway host computer 5 transmits the information received from the management host computer 2 to the network device 1.

また、ゲートウェイホストコンピュータ5は、管理ホストコンピュータ2からマルチキャストのMembership Reportを受け付けると、第1の通信ネットワーク6を介して受信したマルチキャストパケットを、第2の通信ネットワーク7に接続されている装置に送信する。   When the gateway host computer 5 receives the multicast Membership Report from the management host computer 2, the gateway host computer 5 transmits the multicast packet received via the first communication network 6 to a device connected to the second communication network 7. To do.

ゲートウェイホストコンピュータ5は、例えば、通信ネットワークインタフェースを複数備えたホストコンピュータや、サーバ、ルータ等によって実現される。   The gateway host computer 5 is realized by, for example, a host computer having a plurality of communication network interfaces, a server, a router, or the like.

次に、本発明の第2の実施の形態の動作について、図面を参照して説明する。図5は、本発明の第2の実施の形態の管理ホストコンピュータ2の動作を説明するフローチャートである。   Next, the operation of the second exemplary embodiment of the present invention will be described with reference to the drawings. FIG. 5 is a flowchart illustrating the operation of the management host computer 2 according to the second embodiment of this invention.

管理ホストコンピュータ2は、ゲートウェイホストコンピュータ5に、ネットワーク装置1が送信したマルチキャストパケットを送信してもらうために、IGMP(Internet Group Management Protocol) Menbership Report(通称JOIN)を送信する(ステップS201)。   The management host computer 2 transmits an Internet Group Management Protocol (IGMP) Membership Report (commonly called JOIN) in order to have the gateway host computer 5 transmit the multicast packet transmitted by the network device 1 (step S201).

そして、管理ホストコンピュータ2は、ネットワーク装置1が送信したマルチキャストパケットを受信するために、マルチキャストパケット受信待ちを行う(ステップS202)。   Then, the management host computer 2 waits for reception of the multicast packet in order to receive the multicast packet transmitted by the network device 1 (step S202).

次に、本発明の第2の実施の形態のネットワーク装置1の動作について、図面を参照して説明する。図6は、本発明の第2の実施の形態のネットワーク装置1の動作を説明するフローチャートである。   Next, the operation of the network device 1 according to the second embodiment of the present invention will be described with reference to the drawings. FIG. 6 is a flowchart for explaining the operation of the network device 1 according to the second embodiment of this invention.

ネットワーク装置1は、DHCPサーバ4に、ネットワークパラメータの送信を要求する(ステップS301)。   The network device 1 requests the DHCP server 4 to transmit network parameters (step S301).

ネットワーク装置1は、DHCPサーバ4が発見できない等の理由でネットワークパラメータを受信できなかったり、IPアドレスが枯渇等したりして、IPアドレスの割り当てが行われなかった場合には(ステップS302)、CPU101は、ネットワークパラメータを設定(特定)できないため、障害が発生したと判断して障害を示す情報を生成する。例えば、ネットワークパラメータを受信できなかった場合、CPU101は、障害を示す情報の中にネットワークパラメータを受信できなかったという内容を含める。ネットワーク制御部106は、障害を示す情報をマルチキャストで送信する(ステップS303)。   If the network device 1 cannot receive the network parameter because the DHCP server 4 cannot be found or the IP address is not allocated due to exhaustion of the IP address (step S302), Since the CPU 101 cannot set (specify) the network parameter, the CPU 101 determines that a failure has occurred and generates information indicating the failure. For example, when the network parameter cannot be received, the CPU 101 includes the content indicating that the network parameter could not be received in the information indicating the failure. The network control unit 106 transmits information indicating a failure by multicast (step S303).

また、ネットワーク装置1は、DHCPサーバ4からネットワークパラメータを受信してIPアドレスが割り当てられると、割り当てられたIPアドレスが使用中であるか否かを確認するために、割り当てられたIPアドレスにARP(Address Resolution Protocol)パケットを送信する(ステップS304)。   Further, when the network device 1 receives the network parameter from the DHCP server 4 and is assigned an IP address, the network device 1 sets the ARP to the assigned IP address in order to check whether the assigned IP address is in use. A (Address Resolution Protocol) packet is transmitted (step S304).

ネットワーク装置1のCPU101は、ARP応答を受信した場合(例えば、DHCPサーバ4は要求に応じてネットワークパラメータを送信したが、そのネットワークパラメータを他の機器が使用中であった場合)(ステップS305のY)、割り当てられたIPアドレスを使用することができないと判断して、ネットワーク制御部106に、障害を示す情報をマルチキャストで送信させる(ステップS303)。この場合、CPU101は、障害を示す情報の中に、受信したネットワークパラメータが使用中であるという内容を含める。   When the CPU 101 of the network device 1 receives an ARP response (for example, when the DHCP server 4 transmits a network parameter in response to a request but the other device is using the network parameter) (in step S305) Y) It is determined that the assigned IP address cannot be used, and the network control unit 106 is caused to transmit information indicating a failure by multicast (step S303). In this case, the CPU 101 includes the content indicating that the received network parameter is being used in the information indicating the failure.

ゲートウェイホストコンピュータ5は、ネットワーク装置1が送信した障害を示す情報を第1の通信ネットワーク6を介して受信すると、受信した障害を示す情報を、第2の通信ネットワーク7を介して管理ホストコンピュータ2に送信する。   When the gateway host computer 5 receives the information indicating the failure transmitted by the network device 1 via the first communication network 6, the gateway host computer 5 transmits the received information indicating the failure via the second communication network 7. Send to.

ネットワーク装置1のCPU101は、所定の時間が経過してもARP応答を受信しない場合(ステップS305のN)、割り当てられたIPアドレスを使用することができると判断して、DHCPサーバ4から受信したネットワークパラメータをネットワーク制御部106に設定する(ステップS306)。   If the CPU 101 of the network device 1 does not receive an ARP response even after a predetermined time has elapsed (N in step S305), the CPU 101 determines that the assigned IP address can be used and has received it from the DHCP server 4. Network parameters are set in the network control unit 106 (step S306).

なお、ステップS304およびS305で示したDHCPによって割り当てられたIPアドレスが使用中であるか否かを確認する方法は、非特許文献1に記載された方法にもとづいている。   The method for confirming whether the IP address assigned by DHCP shown in steps S304 and S305 is in use is based on the method described in Non-Patent Document 1.

以上に述べたように、この実施の形態によれば、ネットワーク装置1と管理ホストコンピュータ2とが異なる通信ネットワークに接続されていても、ネットワーク装置1は、管理ホストコンピュータ2に、障害を示す情報を送信することができる。   As described above, according to this embodiment, even when the network device 1 and the management host computer 2 are connected to different communication networks, the network device 1 informs the management host computer 2 of information indicating a failure. Can be sent.

本発明は、RAID装置などの外部記憶装置にネットワークパラメータを記憶させ、RAID装置制御部とCPUとを独立して交換可能なネットワーク装置に適用することができる。また、DHCPを使用し、サーバから動的にIPアドレスの割り当てを受けるネットワーク装置に適用することができる。   The present invention can be applied to a network device in which network parameters are stored in an external storage device such as a RAID device and the RAID device control unit and the CPU can be exchanged independently. Further, the present invention can be applied to a network device that uses DHCP and dynamically receives an IP address assignment from a server.

本発明の第1の実施の形態におけるコンピュータシステムの一構成例を示すブロック図である。It is a block diagram which shows one structural example of the computer system in the 1st Embodiment of this invention. 本発明の第1の実施の形態の動作を説明するフローチャートである。It is a flowchart explaining the operation | movement of the 1st Embodiment of this invention. 障害を示す情報のパケットの一例を示す説明図である。It is explanatory drawing which shows an example of the packet of the information which shows a failure. 本発明の第2の実施の形態の一構成例を示すブロック図である。It is a block diagram which shows one structural example of the 2nd Embodiment of this invention. 本発明の第2の実施の形態の管理ホストコンピュータの動作を説明するフローチャートである。It is a flowchart explaining operation | movement of the management host computer of the 2nd Embodiment of this invention. 本発明の第2の実施の形態のネットワーク装置の動作を説明するフローチャートである。It is a flowchart explaining operation | movement of the network apparatus of the 2nd Embodiment of this invention.

符号の説明Explanation of symbols

1 ネットワーク装置
2 管理ホストコンピュータ
3 通信ネットワーク
4 DHCPサーバ
5 ゲートウェイホストコンピュータ
6 第1の通信ネットワーク
7 第2の通信ネットワーク
101 CPU
102 マイクロコード格納部
103 内部バス
104 外部記憶装置制御部
105 外部記憶装置
106 ネットワーク制御部
DESCRIPTION OF SYMBOLS 1 Network apparatus 2 Management host computer 3 Communication network 4 DHCP server 5 Gateway host computer 6 1st communication network 7 2nd communication network 101 CPU
102 Microcode storage unit 103 Internal bus 104 External storage device control unit 105 External storage device 106 Network control unit

Claims (21)

通信ネットワークに接続され、障害が発生したネットワーク装置が、前記通信ネットワークを介してコンピュータに障害の発生を通知するコンピュータシステムにおいて、
前記ネットワーク装置は、
通信ネットワークに接続するためのパラメータであるネットワークパラメータを特定できないことを検出する障害検出手段と、
前記障害検出手段がネットワークパラメータを特定できないことを検出した場合に、障害が発生したことを示す障害情報を生成する障害情報生成手段と、
前記障害情報をマルチキャストで送信する送信手段とを含む
ことを特徴とするコンピュータシステム。
In a computer system that is connected to a communication network and a network device in which a failure has occurred notifies the computer of the occurrence of the failure via the communication network.
The network device is:
A failure detection means for detecting that a network parameter that is a parameter for connecting to a communication network cannot be specified;
A failure information generation unit that generates failure information indicating that a failure has occurred when the failure detection unit detects that a network parameter cannot be identified;
And a transmission means for transmitting the failure information by multicast.
ネットワーク装置は、前記ネットワーク装置を識別する情報を予め記憶する識別情報記憶手段を含み、
障害情報生成手段は、前記識別情報記憶手段が記憶している前記ネットワーク装置を識別する情報を含む障害情報を生成する
請求項1記載のコンピュータシステム。
The network device includes identification information storage means for storing in advance information for identifying the network device,
The computer system according to claim 1, wherein the failure information generation unit generates failure information including information for identifying the network device stored in the identification information storage unit.
ネットワーク装置は、ネットワークパラメータを記憶するネットワークパラメータ記憶手段を含み、
障害検出手段は、前記ネットワークパラメータ記憶手段にアクセスできないことを検出することで、ネットワークパラメータを特定できないことを検出する
請求項1または請求項2記載のコンピュータシステム。
The network device includes network parameter storage means for storing network parameters,
The computer system according to claim 1, wherein the failure detection unit detects that the network parameter cannot be specified by detecting that the network parameter storage unit cannot be accessed.
障害情報生成手段は、発生した障害を示す情報を含む障害情報を生成する
請求項1から請求項3のうちいずれか1項記載のコンピュータシステム。
The computer system according to any one of claims 1 to 3, wherein the failure information generation unit generates failure information including information indicating a failure that has occurred.
障害情報生成手段は、ネットワークパラメータ記憶手段にアクセスできないという障害を示す情報を含む障害情報を生成する
請求項4記載のコンピュータシステム。
The computer system according to claim 4, wherein the failure information generation unit generates failure information including information indicating a failure that the network parameter storage unit cannot be accessed.
ネットワーク装置の要求に応じて前記ネットワーク装置にネットワークパラメータを送信するネットワークパラメータ提供手段を備え、
前記ネットワーク装置は、
前記ネットワークパラメータ提供手段に対してネットワークパラメータの送信を要求し、前記ネットワークパラメータ提供手段からネットワークパラメータを受信するネットワークパラメータ受信手段を含み、
障害検出手段は、前記ネットワークパラメータ受信手段がネットワークパラメータを受信できなかったこと、または受信したネットワークパラメータが使用中であったことを検出することで、ネットワークパラメータを特定できないことを検出する
請求項1から請求項5のうちいずれか1項記載のコンピュータシステム。
Network parameter providing means for transmitting network parameters to the network device in response to a request from the network device;
The network device is:
Network parameter receiving means for requesting the network parameter providing means to transmit network parameters and receiving network parameters from the network parameter providing means;
The failure detection unit detects that the network parameter cannot be specified by detecting that the network parameter reception unit cannot receive the network parameter or that the received network parameter is in use. The computer system according to claim 5.
障害が発生したネットワーク装置が接続されている第1の通信ネットワークと、コンピュータが接続されている第2の通信ネットワークとを接続し、前記ネットワーク装置が送信した障害情報を前記第1の通信ネットワークを介して受信し、受信した前記障害情報を、前記第2の通信ネットワークを介して前記コンピュータに送信するゲートウェイ装置を備えた
請求項1から請求項6のうちいずれか1項記載のコンピュータシステム。
The first communication network to which the network device in which the failure has occurred is connected to the second communication network to which the computer is connected, and the failure information transmitted by the network device is transmitted to the first communication network. The computer system according to any one of claims 1 to 6, further comprising a gateway device that receives the failure information via the second communication network and transmits the received failure information to the computer via the second communication network.
通信ネットワークを介してコンピュータに障害の発生を通知するネットワーク装置において、
通信ネットワークに接続するためのパラメータであるネットワークパラメータを特定できないことを検出する障害検出手段と、
前記障害検出手段がネットワークパラメータを特定できないことを検出した場合に、障害が発生したことを示す障害情報を生成する障害情報生成手段と、
前記障害情報をマルチキャストで送信する送信手段とを含む
ことを特徴とするネットワーク装置。
In a network device that notifies a computer of a failure via a communication network,
A failure detection means for detecting that a network parameter that is a parameter for connecting to a communication network cannot be specified;
A failure information generation unit that generates failure information indicating that a failure has occurred when the failure detection unit detects that a network parameter cannot be identified;
And a transmission means for transmitting the failure information by multicast.
ネットワーク装置を識別する情報を予め記憶する識別情報記憶手段を含み、
障害情報生成手段は、前記ネットワーク装置を識別する情報を含む障害情報を生成する
請求項8記載のネットワーク装置。
Including identification information storage means for preliminarily storing information for identifying the network device,
The network device according to claim 8, wherein the failure information generation unit generates failure information including information for identifying the network device.
ネットワークパラメータを記憶するネットワークパラメータ記憶手段を含み、
障害検出手段は、前記ネットワークパラメータ記憶手段にアクセスできないことを検出することで、ネットワークパラメータを特定できないことを検出する
請求項8または請求項9記載のネットワーク装置。
Network parameter storage means for storing network parameters,
The network device according to claim 8 or 9, wherein the failure detection means detects that the network parameter cannot be specified by detecting that the network parameter storage means cannot be accessed.
障害情報生成手段は、発生した障害を示す情報を含む障害情報を生成する
請求項8から請求項10のうちいずれか1項記載のネットワーク装置。
The network device according to any one of claims 8 to 10, wherein the failure information generation unit generates failure information including information indicating a failure that has occurred.
障害情報生成手段は、ネットワークパラメータ記憶手段にアクセスできないという障害を示す情報を含む障害情報を生成する
請求項11記載のネットワーク装置。
The network device according to claim 11, wherein the failure information generation unit generates failure information including information indicating a failure that the network parameter storage unit cannot be accessed.
要求に応じてネットワークパラメータを送信するネットワークパラメータ提供手段に対してネットワークパラメータの送信を要求し、前記ネットワークパラメータ提供手段からネットワークパラメータを受信するネットワークパラメータ受信手段を含み、
障害検出手段は、前記ネットワークパラメータ受信手段がネットワークパラメータを受信できなかったこと、または受信したネットワークパラメータが使用中であったことを検出することで、ネットワークパラメータを特定できないことを検出する
請求項8から請求項12のうちいずれか1項記載のネットワーク装置。
Network parameter receiving means for requesting network parameter providing means for transmitting network parameters in response to a request and receiving network parameters from said network parameter providing means;
9. The failure detecting means detects that the network parameter cannot be specified by detecting that the network parameter receiving means cannot receive the network parameter or that the received network parameter is in use. The network device according to claim 12.
障害が発生したネットワーク装置が、通信ネットワークを介してコンピュータに障害の発生を通知する障害発生通知方法において、
前記ネットワーク装置の障害検出手段が、通信ネットワークに接続するためのパラメータであるネットワークパラメータを特定できないことを検出する障害検出ステップと、
前記障害検出手段がネットワークパラメータを特定できないことを検出した場合に、前記ネットワーク装置の障害情報生成手段が、障害が発生したことを示す障害情報を生成する障害情報生成ステップと、
前記ネットワーク装置の送信手段が、前記障害情報をマルチキャストで送信する送信ステップとを含む
ことを特徴とする障害発生通知方法。
In the failure occurrence notification method in which the network device in which the failure has occurred notifies the computer of the occurrence of the failure via the communication network.
A failure detection step of detecting that the failure detection means of the network device cannot identify a network parameter that is a parameter for connecting to a communication network;
A fault information generating step in which the fault information generating means of the network device generates fault information indicating that a fault has occurred when the fault detecting means detects that the network parameter cannot be specified;
A failure occurrence notification method comprising: a transmission step in which the transmission means of the network device transmits the failure information by multicast.
障害情報生成手段が、障害情報生成ステップで、識別情報記憶手段が予め記憶しているネットワーク装置を識別する情報を含む障害情報を生成する
請求項14記載の障害発生通知方法。
The failure occurrence notification method according to claim 14, wherein the failure information generation means generates failure information including information for identifying the network device stored in advance in the identification information storage means in the failure information generation step.
ネットワーク装置の障害検出手段が、障害検出ステップで、ネットワークパラメータを記憶しているネットワークパラメータ記憶手段にアクセスできないことを検出することで、ネットワークパラメータを特定できないことを検出する
請求項14または請求項15記載の障害発生通知方法。
16. The failure detection unit of the network device detects that the network parameter cannot be specified by detecting that the network parameter storage unit storing the network parameter cannot be accessed in the failure detection step. The failure notification method described.
障害情報生成手段が、障害情報生成ステップで、発生した障害を示す情報を含む障害情報を生成する
請求項14から請求項16のうちいずれか1項記載の障害発生通知方法。
The failure occurrence notification method according to any one of claims 14 to 16, wherein the failure information generation means generates failure information including information indicating the failure that has occurred in the failure information generation step.
障害情報生成手段が、障害情報生成ステップで、ネットワークパラメータ記憶手段にアクセスできないという障害を示す情報を含む障害情報を生成する
請求項17記載の障害発生通知方法。
The failure occurrence notification method according to claim 17, wherein the failure information generation means generates failure information including information indicating a failure that the network parameter storage means cannot be accessed in the failure information generation step.
ネットワーク装置のネットワークパラメータ受信手段が、前記ネットワーク装置の要求に応じてネットワークパラメータを送信するネットワークパラメータ提供手段に対してネットワークパラメータの送信を要求し、前記ネットワークパラメータ提供手段からネットワークパラメータを受信するネットワークパラメータ受信ステップを含み、
前記ネットワーク装置の障害検出手段が、障害検出ステップで、前記ネットワークパラメータ受信手段がネットワークパラメータを受信できなかったこと、または受信したネットワークパラメータが使用中であったことを検出することで、ネットワークパラメータを特定できないことを検出する
請求項14から請求項18のうちいずれか1項記載の障害発生通知方法。
The network parameter receiving unit of the network device requests the network parameter providing unit that transmits the network parameter in response to the request of the network device, and sends the network parameter from the network parameter providing unit. Including a receiving step,
The failure detection means of the network device detects the network parameter by detecting that the network parameter reception means cannot receive the network parameter or the received network parameter is in use in the failure detection step. The failure occurrence notification method according to any one of claims 14 to 18, wherein it is detected that identification is not possible.
障害が発生したネットワーク装置が接続されている第1の通信ネットワークと、コンピュータが接続されている第2の通信ネットワークとを接続するゲートウェイ装置が、前記ネットワーク装置が送信した障害情報を前記第1の通信ネットワークを介して受信し、受信した前記障害情報を、前記第2の通信ネットワークを介して前記コンピュータに送信する転送ステップを備えた
請求項14から請求項19のうちいずれか1項記載の障害発生通知方法。
The gateway device that connects the first communication network to which the network device in which the failure has occurred is connected to the second communication network to which the computer is connected, transmits the failure information transmitted by the network device to the first communication network. The failure according to any one of claims 14 to 19, further comprising a transfer step of receiving the failure information received via a communication network and transmitting the received failure information to the computer via the second communication network. Occurrence notification method.
通信ネットワークを介して他のコンピュータに障害の発生を通知するコンピュータに搭載される障害発生通知プログラムにおいて、
コンピュータに、
通信ネットワークに接続するためのパラメータであるネットワークパラメータを特定できないことを検出する障害検出処理と、
前記障害検出処理でネットワークパラメータを特定できないことを検出した場合に、障害が発生したことを示す障害情報を生成する障害情報生成処理と、
前記障害情報をマルチキャストで送信する送信処理とを実行させる
ための障害発生通知プログラム。
In a failure occurrence notification program installed in a computer for notifying other computers of the occurrence of a failure via a communication network,
On the computer,
A failure detection process for detecting that a network parameter that is a parameter for connecting to a communication network cannot be specified;
A failure information generation process for generating failure information indicating that a failure has occurred when the failure detection process detects that a network parameter cannot be identified; and
A failure occurrence notification program for executing transmission processing for transmitting the failure information by multicast.
JP2005309016A 2005-10-24 2005-10-24 Computer system, network device, failure occurrence notification method, and failure occurrence notification program Expired - Fee Related JP4367400B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005309016A JP4367400B2 (en) 2005-10-24 2005-10-24 Computer system, network device, failure occurrence notification method, and failure occurrence notification program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005309016A JP4367400B2 (en) 2005-10-24 2005-10-24 Computer system, network device, failure occurrence notification method, and failure occurrence notification program

Publications (2)

Publication Number Publication Date
JP2007123955A true JP2007123955A (en) 2007-05-17
JP4367400B2 JP4367400B2 (en) 2009-11-18

Family

ID=38147353

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005309016A Expired - Fee Related JP4367400B2 (en) 2005-10-24 2005-10-24 Computer system, network device, failure occurrence notification method, and failure occurrence notification program

Country Status (1)

Country Link
JP (1) JP4367400B2 (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011040980A (en) * 2009-08-11 2011-02-24 Fuji Xerox Co Ltd Device management system, management object device and program
JP2012257048A (en) * 2011-06-08 2012-12-27 Nec Infrontia Corp Fault information collection system, voice communication terminal and fault information collection method

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10271185A (en) * 1997-03-27 1998-10-09 Toshiba Corp Communication system and its fault management system
JP2000112677A (en) * 1998-10-09 2000-04-21 Canon Inc Communication controller, method for processing data of communication controller and storage medium in which program readable by computer is stored
JP2003289317A (en) * 2002-01-22 2003-10-10 Canon Inc Apparatus to be connected to network, and address determination program and method

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10271185A (en) * 1997-03-27 1998-10-09 Toshiba Corp Communication system and its fault management system
JP2000112677A (en) * 1998-10-09 2000-04-21 Canon Inc Communication controller, method for processing data of communication controller and storage medium in which program readable by computer is stored
JP2003289317A (en) * 2002-01-22 2003-10-10 Canon Inc Apparatus to be connected to network, and address determination program and method

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011040980A (en) * 2009-08-11 2011-02-24 Fuji Xerox Co Ltd Device management system, management object device and program
JP2012257048A (en) * 2011-06-08 2012-12-27 Nec Infrontia Corp Fault information collection system, voice communication terminal and fault information collection method

Also Published As

Publication number Publication date
JP4367400B2 (en) 2009-11-18

Similar Documents

Publication Publication Date Title
JP7009560B2 (en) Methods and equipment for providing redundancy for process control systems
JP4256825B2 (en) Automatic network configuration for monitoring
JP4860677B2 (en) Method and system for assigning multiple MACs to multiple processors
JP5281646B2 (en) Network conflict prevention apparatus and network conflict prevention method
JP4562196B2 (en) Highly available blade-based distributed computing system
JP4727537B2 (en) Relay agent device and proxy address lending device
CN111651291B (en) Method, system and computer storage medium for preventing split brain of shared storage cluster
JP4411222B2 (en) Network, network terminal device, IP address management method used therefor, and program thereof
JP5419907B2 (en) Network system and communication recovery method
CN103036702B (en) A kind of N+1 backup method of cross-network segment and device
JP2010103695A (en) Cluster system, cluster server and cluster control method
CN112738295B (en) IP address exception handling method, device, computer system and storage medium
JP2007306296A (en) Network communication system
JP4367400B2 (en) Computer system, network device, failure occurrence notification method, and failure occurrence notification program
JP2013172393A (en) Edge device redundant system, switching controller and edge device redundancy method
JP4340731B2 (en) Network fault monitoring processing system and method
JP2011203941A (en) Information processing apparatus, monitoring method and monitoring program
JP2002344450A (en) High availability processing method, and executing system and processing program thereof
JP4133738B2 (en) High-speed network address takeover method, network device, and program
WO2015100637A1 (en) Method and switching device for link alternation
JP2006319773A (en) Redundancy configuration apparatus and redundancy configuration method
JP2006039662A (en) Proxy response device when failure occurs to www server and www server device equipped with the proxy response device
JP2003115896A (en) Method and system for maintenance, and information processing system
KR20160028250A (en) Duplex control system and method for control in software defined network
JP7335049B1 (en) COMMUNICATION DEVICE, COMMUNICATION SYSTEM, COMMUNICATION DEVICE CONTROL METHOD AND PROGRAM

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20081208

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20081216

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090209

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20090804

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20090817

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120904

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130904

Year of fee payment: 4

LAPS Cancellation because of no payment of annual fees