WO2015198402A1 - 情報処理システム、接続支援方法及びプログラム - Google Patents

情報処理システム、接続支援方法及びプログラム Download PDF

Info

Publication number
WO2015198402A1
WO2015198402A1 PCT/JP2014/066734 JP2014066734W WO2015198402A1 WO 2015198402 A1 WO2015198402 A1 WO 2015198402A1 JP 2014066734 W JP2014066734 W JP 2014066734W WO 2015198402 A1 WO2015198402 A1 WO 2015198402A1
Authority
WO
WIPO (PCT)
Prior art keywords
network
computer
cable
information
assigned
Prior art date
Application number
PCT/JP2014/066734
Other languages
English (en)
French (fr)
Inventor
景扶 秋田
Original Assignee
富士通株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 富士通株式会社 filed Critical 富士通株式会社
Priority to PCT/JP2014/066734 priority Critical patent/WO2015198402A1/ja
Priority to JP2016528793A priority patent/JP6222358B2/ja
Publication of WO2015198402A1 publication Critical patent/WO2015198402A1/ja

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L12/00Data switching networks
    • H04L12/28Data switching networks characterised by path configuration, e.g. LAN [Local Area Networks] or WAN [Wide Area Networks]

Definitions

  • High performance computing is calculation processing with a huge amount of calculation per unit time. High performance computing is performed for the purpose of, for example, simulation of natural phenomena, simulation of collision of objects, or analysis of biological structures.
  • High performance computing is performed by an information processing system in which many (for example, several thousand) computers are connected.
  • Each computer is equipped with a CPU (Central Processing Unit) that executes calculation processing, and each CPU is connected to other CPUs by a dedicated network called an interconnect.
  • CPU Central Processing Unit
  • initial setting for example, address setting and physical position information setting
  • management network is separated from the interconnect.
  • the work of connecting the cable to each computer is performed.
  • the number of computers is very large, the amount of these operations becomes enormous.
  • the system starts operating without noticing an error in the work, and an error is noticed after the operation is started, a great loss occurs due to rework.
  • a DHCP Dynamic Host Configuration Protocol
  • IP Internet Protocol
  • MAC Media Access Control
  • an object of the present invention is to provide a technique for detecting a network cable connection error.
  • the information processing system includes a plurality of devices connected to a first network that is a lattice network. Then, the first device among the plurality of devices stores, for each of the plurality of cables of the second network, information on lattice points on the first network assigned to the device to which the cable is connected.
  • the first grid point assigned to the device to which the first cable is to be connected is The state of communication using the first network is determined from the specifying unit specified from the data storage unit, the second device, and the third device located at the lattice point adjacent to the specified first lattice point. And a determination unit that determines whether the second device and the third device can directly communicate with each other based on the acquired information.
  • network cable connection errors can be detected.
  • FIG. 1 is a diagram showing a system outline of the present embodiment.
  • FIG. 2 is a diagram showing a form of connection between computers.
  • FIG. 3 is a diagram illustrating a configuration example of a computer.
  • FIG. 4 is a functional block diagram of the service processor.
  • FIG. 5 is a diagram illustrating an example of setting data stored in the setting data storage unit.
  • FIG. 6 is a diagram showing a main processing flow.
  • FIG. 7 is a diagram showing a main processing flow.
  • FIG. 8 is a diagram showing a main processing flow.
  • FIG. 9 is a diagram for explaining detection of a connection error.
  • FIG. 10 is a diagram for explaining detection of a connection error.
  • FIG. 11 is a diagram for explaining detection of a connection error.
  • FIG. 10 is a diagram for explaining detection of a connection error.
  • FIG. 12 is a diagram for explaining detection of a connection error.
  • FIG. 13 is a diagram for explaining detection of a connection error.
  • FIG. 14 is a diagram for explaining detection of a connection error.
  • FIG. 15 is a diagram for explaining detection of a connection error.
  • FIG. 16 is a diagram for explaining detection of a connection error.
  • Fig. 1 shows the system outline of this embodiment.
  • a plurality of computers are mounted on each of the plurality of racks.
  • the physical position of each computer is represented by two-dimensional coordinates (x, y), and the physical position within the rack is represented by z-coordinates, whereby the physical position of each computer is represented by three-dimensional coordinates (x , Y, z).
  • the number of racks is 9, and the number of computers in each rack is 3, but the number is not limited.
  • the system of the present embodiment is provided with a hub 3 that is a line concentrator and a management device 5 that is connected to the hub 3.
  • the hub 3 and each computer are connected by a LAN (Local Area Network) cable, but the hub 3 and each computer are not connected in the initial state.
  • LAN Local Area Network
  • FIG. 2 shows the connection between computers.
  • each computer is connected to a network for high performance computing (hereinafter referred to as HPCN) which is an interconnect for HPC.
  • HPCN is a three-dimensional lattice type network, and each computer is located on a lattice point.
  • a computer whose coordinates are (x, y, z) includes a computer whose coordinates are (x-1, y, z), and a computer whose coordinates are (x + 1, y, z).
  • the computers are located at the end of the system, the number of adjacent computers is not six.
  • Fig. 3 shows an example of the configuration of a computer.
  • the computer includes a service processor 10 that monitors hardware in the computer, a power supply control unit 15, a power supply unit 16, a CPU 17, and an HPCN controller 18.
  • the service processor 10 includes a CPU 11, a RAM (Random Access Memory) 12, a LAN controller 13, and a ROM (Read Only Memory) 19.
  • the CPU 11 is connected to the power control unit 15, the RAM 12, the CPU 17, and the LAN controller 13 via the bus 14.
  • the power supply control unit 15 is, for example, an I2C (Inter-IntegratedIntegrCircuit) interface.
  • the power supply control unit 15 is connected to the power supply unit 16 and controls the supply of power from the power supply unit 16 to the service processor 10 and the computer main body.
  • the computer main body is a part other than the service processor 10 and includes a CPU 17 and an HPCN controller 18.
  • the LAN controller 13 transmits and receives data via a LAN that is a network for managing computers.
  • the CPU 17 is a CPU for HPC.
  • the HPCN controller 18 transmits and receives data via the HPCN.
  • the CPU 11 implements the functions shown in FIG. 4 by loading the program stored in the ROM 19 into the RAM 12 and executing it.
  • the service processor 10 includes an inquiry processing unit 100, a distribution unit 101, a power management unit 102, a setting data storage unit 103, and a communication management unit 104.
  • the service processors 10 other than the master service processor 10 do not have the setting data storage unit 103.
  • the master service processor 10 is a computer service processor 10 to which a LAN cable is first connected.
  • the inquiry processing unit 100 generates an inquiry about the IP address and the coordinates of the grid points on the HPCN, and transmits the inquiry to the master service processor 10.
  • the distribution unit 101 reads data from the setting data storage unit 103 and transmits the data to the service processor 10 that is the transmission source of the inquiry.
  • the power management unit 102 transmits to the power management unit 102 of another service processor 10 a supply instruction for instructing supply of power to the computer main body and a stop instruction for instructing stop of power supply to the computer main body.
  • the power management unit 102 controls the power supply unit 16 according to the received instruction.
  • the communication management unit 104 performs processing for confirming a communication state based on data acquired from a storage device (for example, a register of the CPU 17) of another computer.
  • FIG. 5 shows an example of setting data stored in the setting data storage unit 103.
  • an entry including an entry number, an IP address, and coordinates of a grid point is stored.
  • an administrator or the like connects a LAN cable to a computer on the coordinates included in an entry in order from the entry with the smallest entry number.
  • the distribution unit 101 distributes entries to computers in order from the entry with the smallest entry number.
  • Each computer executes communication and calculation for HPC using the received IP address and coordinates.
  • the setting data is generated in the management apparatus 5 and transmitted to the computer having the master service processor 10. For example, the administrator creates the setting data so that the entry number becomes smaller as the entry having a smaller coordinate value.
  • step S1 each computer in the system is connected to the HPCN by an administrator or the like (FIG. 6: step S1). Since step S1 is performed by an administrator or the like, the block of step S1 is indicated by a dotted line in FIG.
  • the power supply control unit 15 in the computer supplies power to the service processor 10 from the power supply unit 16 when an instruction to supply power to the service processor 10 is received from, for example, an administrator (step S3).
  • the service processor 10 starts to start, and sets the initial value of the IP address (here, 192.168.1.254) and the initial value of the coordinates in a predetermined area in the RAM 12 (step S5).
  • the service processor 10 waits until it detects that the LAN is in a link-up state (step S7). That the LAN is in the link-up state is detected by, for example, checking the value of a register that stores a value indicating the communication state.
  • the computer and the hub 3 can communicate with each other and shift to a link-up state.
  • the administrator or the like connects the LAN cable to a computer in accordance with a predetermined order (in this embodiment, the order specified in the setting data). Then, the service processor 10 of the computer to which the LAN cable is connected detects that the LAN is in a link-up state (step S9).
  • the service processor 10 determines whether it is the master service processor 10 (step S11). In step S11, a determination is made based on whether or not a response corresponding to the PING (Packet Internet Groper) issued for the IP address “192.168.1.1” is returned.
  • the IP address “192.168.1.1” is a computer to which a LAN cable is connected first. Therefore, the fact that no response is returned means that the service processor 10 of the computer that issued the PING is the master service processor 10.
  • step S11 If it is not the master service processor 10 (step S11: No route), the inquiry processing unit 100 of the service processor 10 generates an inquiry about the IP address and coordinates of the grid points on the HPCN. Then, the inquiry processing unit 100 transmits the generated inquiry to the master service processor 10 (step S13). The inquiry processing unit 100 then updates the initial IP address and coordinates stored in the RAM 12 with the IP address and coordinates received from the master service processor 10 (step S15). Then, the process ends.
  • step S11 Yes route
  • the service processor 10 stores the master service processor 10 in the RAM 12 with the IP address (ie, “192.168.1.1”) and coordinates (ie, (0, 0, 0)).
  • the initial IP address and coordinates are updated (FIG. 7: step S17).
  • the distribution unit 101 of the service processor 10 obtains an IP address (here, “192.168.1.2”) and coordinates (here, (0, 0, 1)) to be transmitted from the setting data storage unit 103. It is specified (step S19) and stored in the RAM 12.
  • the inquiry processing unit 100 stands by until an inquiry is received from another service processor 10 (here, the service processor 10 of the computer to which the LAN cable is newly connected) (step S21).
  • the inquiry processing unit 100 receives an inquiry from another service processor 10 (step S23), and notifies the distribution unit 101 that the inquiry has been received. In response to this, the distribution unit 101 reads the IP address and coordinates to be transmitted next from the RAM 12, and transmits them to the service processor 10 that is the transmission source of the inquiry (step S25).
  • the distribution unit 101 determines whether the setting data storage unit 103 has already assigned IP addresses and coordinates in addition to the IP addresses and coordinates transmitted in step S25 (step S27). For example, when the IP address and coordinates included in the third entry are transmitted in step S25, the IP address and coordinates included in the first entry and the IP address and coordinates included in the second entry are already Assigned. The reason for executing step S27 is that communication can be performed via a LAN cable with a computer to which an IP address and coordinates have already been assigned. If there is no IP address and coordinates already assigned (step S27: No route), the process proceeds to step S37 in FIG.
  • the distribution unit 101 executes the following processing. First, the distribution unit 101 specifies the coordinates assigned to the service processor 10 that transmitted the inquiry (that is, the coordinates transmitted in step S25). Then, the distribution unit 101 determines whether there is a coordinate whose distance from the coordinate assigned to the transmission source of the inquiry is 1 among the already assigned coordinates (step S29).
  • the value of the x component, the value of the y component, and the value of the z component are different by one, such as the computer at (x, y, z) and the computer at (x, y, z + 1). It is determined whether the values of the other components are the same.
  • the coordinates of the grid point adjacent to the grid point indicated by the coordinates assigned to the service processor 10 that sent the inquiry correspond.
  • the coordinates are already transmitted and the distance from (0, 0, 2) is 1 (0, 0, 1). Is applicable.
  • step S29 No route
  • the distribution unit 101 When there is a coordinate whose distance from the coordinate assigned to the transmission source of the inquiry is 1 among the already transmitted coordinates (step S29: Yes route), the distribution unit 101 identifies the coordinates. Then, the distribution unit 101 notifies the power management unit 102 of the IP address transmitted in step S25 (that is, the IP address of the inquiry transmission source) and the IP address corresponding to the specified coordinates.
  • the power management unit 102 transmits a supply instruction via the LAN to the IP address of the inquiry transmission source and the IP address corresponding to the specified coordinates (step S31).
  • the processing shifts to the processing in step S33 in FIG. If a plurality of coordinates correspond in step S29, a supply instruction is transmitted to a plurality of computers.
  • the power management unit 102 of the computer that has received the supply instruction causes the power control unit 15 to supply power to the computer main body. Thereby, the computer main body is activated, and processing for starting communication via HPCN is performed.
  • the communication management unit 104 acquires a value indicating the communication state of the HPCN from the register of the computer (for example, the register of the CPU 17) that has received the supply instruction transmitted in step S31 (FIG. 8: Step S33).
  • the communication management unit 104 determines whether the HPCN is in a link-up state between the computer that is the inquiry transmission source and the computer that is adjacent to the lattice point indicated by the coordinate assigned to the inquiry transmission source (Ste S35). That is, it is determined whether the computer at the inquiry transmission source and the computer at the lattice point adjacent to the lattice point indicated by the coordinates assigned to the inquiry transmission source can directly communicate with each other by HPCN. When there are a plurality of computers at the grid points adjacent to the grid point indicated by the coordinates assigned to the inquiry transmission source, it is determined whether any HPCN is in a link-up state.
  • the communication management unit 104 transmits an error notification indicating that an error has occurred to the service processor 10 that has transmitted the inquiry (step S37).
  • the service processor 10 of the computer that has received the error notification informs the administrator or the like that the LAN cable connection is incorrect, for example, by blinking an LED (Light Emitting Diode) provided in the computer.
  • the communication management unit 104 notifies the power management unit 102 that an error has occurred.
  • the power management unit 102 receives the supply instruction transmitted in step S31 at the grid point adjacent to the grid point indicated by the computer assigned to the inquiry transmission source and the coordinates assigned to the inquiry transmission source.
  • a stop instruction is transmitted to a certain computer (step S39).
  • the power management unit 102 of the computer that has received the stop instruction causes the power control unit 15 to stop supplying power to the computer main body. As a result, the computer main body is stopped, but power is still supplied to the service processor 10.
  • step S41 the LAN cable connection is redone by the administrator or the like (step S41).
  • the administrator or the like removes the last connected LAN cable and connects to the computer to which the LAN cable is to be connected. Since step S41 is performed by an administrator or the like, the block of step S41 is indicated by a dotted line in FIG. Then, the process returns to the process of step S21 in FIG.
  • the communication management unit 104 transmits a completion notification indicating that the LAN cable connection is correct to the service processor 10 that is the transmission source of the inquiry (Ste S43).
  • the service processor 10 of the computer that has received the notification of completion informs the administrator or the like that the LAN cable connection is correct, for example, by turning on an LED provided in the computer.
  • the communication management unit 104 reads the IP address and coordinates to be transmitted next to the IP address and coordinates transmitted in step S25 from the setting data storage unit 103 and stores them in the RAM 12.
  • the communication management unit 104 notifies the power management unit 102 that the LAN cable connection is correct.
  • the power management unit 102 receives the supply instruction transmitted in step S31 at the grid point adjacent to the grid point indicated by the computer assigned to the inquiry transmission source and the coordinates assigned to the inquiry transmission source.
  • a stop instruction is transmitted to a certain computer (step S45).
  • the power management unit 102 of the computer that has received the stop instruction causes the power control unit 15 to stop supplying power to the computer main body. As a result, the computer main body is stopped, but power is still supplied to the service processor 10.
  • the service processor 10 determines whether there is a computer to which the LAN cable is not connected (step S47). Whether there is a computer to which the LAN cable is not connected is determined by, for example, whether a completion notification has been transmitted to all the computers.
  • step S47: Yes route If there is a computer to which the LAN cable is not connected (step S47: Yes route), the processing returns to the processing of step S21 in FIG. On the other hand, when there is no computer to which the LAN cable is not connected (step S47: No route), the service processor 10 transmits an end notification indicating that the connection of the LAN cable to all the computers has been completed to the management device 5 (step S47). S49). Then, the process ends.
  • the IP address and coordinates for each computer can be set automatically. This eliminates the need for connecting a serial cable to each computer to perform setting, thereby preventing work errors and reducing the cost required for the work.
  • connection error The detection of a connection error will be described more specifically with reference to FIGS.
  • the initial state is the state shown in FIG.
  • computers A to C are mounted on a rack a
  • computers D to F are mounted on a rack b.
  • no LAN cable is connected to any computer in the stage of FIG.
  • the correct order of LAN cable connection is computer A, computer B, computer C, computer D, computer E, and computer F.
  • FIG. 9 is a diagram of the xz plane, showing the connection of HPCN in the x and z directions.
  • Computer A is connected to computer B and computer D by HPCN
  • computer B is connected to computer A and computer C by HPCN
  • computer C is connected to computer B and computer F by HPCN
  • computer D is computer A and computer E.
  • the computer E is connected to the computer B and the computer D by HPCN
  • the computer F is connected to the computer C and the computer E by HPCN.
  • the service processor 10 of the computer A is the master service processor 10.
  • the computer A is set with an IP address “192.168.1.1” and coordinates (0, 0, 0).
  • the computer C is set with an IP address “192.168.1.3” and coordinates (0, 0, 2). Electric power is supplied to the main body of the computer C, which is a computer to which a LAN cable is actually connected.
  • power is supplied to the main body of computer B, which is a computer located at a lattice point adjacent to the lattice point indicated by the coordinates assigned to computer C, for which an IP address has already been set.
  • HPCN between the computer B and the computer C will be in a link-up state.
  • a link-up state is established, a LAN cable connection error is not detected.
  • the computer D is set with an IP address “192.168.1.4” and coordinates (1, 0, 0). Power is supplied to the main body of the computer D, which is a computer to which a LAN cable is actually connected. In addition, power is supplied to the main body of the computer A, which is a computer located at a lattice point adjacent to the lattice point indicated by the coordinates assigned to the computer D and having an IP address already set. And it is confirmed whether HPCN between the computer A and the computer D will be in a link-up state. Here, since a link-up state is established, a LAN cable connection error is not detected.
  • the administrator or the like can connect correctly if the LAN cables are connected according to a predetermined order.
  • the service processor 10 of the computer B is the master service processor 10.
  • the computer B is set with an IP address “192.168.1.1” and coordinates (0, 0, 0).
  • the computer C is set with an IP address “192.168.1.2” and coordinates (0, 0, 1). Electric power is supplied to the main body of the computer C, which is a computer to which a LAN cable is actually connected.
  • power is supplied to the main body of computer B, which is a computer located at a lattice point adjacent to the lattice point indicated by the coordinates assigned to computer C, for which an IP address has already been set.
  • HPCN between the computer B and the computer C will be in a link-up state.
  • a link-up state is established, a LAN cable connection error is not detected.
  • the computer C is set with an IP address “192.168.1.3” and coordinates (0, 0, 2). Electric power is supplied to the main body of the computer D, which is a computer to which a LAN cable is actually connected. In addition, power is supplied to a computer C which is a computer of a lattice point adjacent to a lattice point indicated by coordinates set with an IP address and assigned to the computer D.
  • the link-up state is not established and a connection error is detected.
  • the present invention is not limited to this.
  • the functional block configuration of the service processor 10 described above may not match the actual program module configuration.
  • the data holding form described above is an example, and it does not have to be configured as described above. Further, in the processing flow, the processing order can be changed if the processing result does not change. Further, it may be executed in parallel.
  • the information processing system includes (A) a plurality of devices connected to a first network that is a lattice network. Then, the first device among the plurality of devices is (a1) information on lattice points on the first network assigned to the device to which the cable is connected for each of the plurality of cables of the second network. And (a2) when the first cable of the second network is connected to the second device among the plurality of devices, the first cable is assigned to the device to be connected.
  • the first And a determination unit that determines whether the second device and the third device can directly communicate with each other on the first network based on the acquired information.
  • the specifying unit described above transmits (a2-1) the information of the specified first grid point and the address assigned to the device to which the first cable is connected to the second device. May be. This eliminates the need to set grid point information and addresses for each device.
  • each of the plurality of devices may include (a4) a processing unit that transmits and receives data via the first network.
  • the first device described above further includes (a5) a transmission unit that transmits a first request that requests the second device and the third device to supply power to the processing unit. May be.
  • the determination unit described above may acquire information indicating the state of communication using the first network after the transmission unit (a3-1) transmits the first request. In this way, it is possible to prevent information from being acquired except for communication between the second device and the third device.
  • the transmission unit described above is (a5-1) when the determination unit determines that the second device and the third device can directly communicate with each other via the first network. You may transmit the 2nd request
  • the first device described above may further include (a6) a receiving unit that receives data indicating that the first cable is connected from the second device. In this way, it can be detected that the first cable is connected.
  • the third device described above may be a device that is at a lattice point adjacent to the first lattice point and has already received the address and information on the lattice point on the first network. If the device has already received the address and the information indicating the position on the lattice, the information indicating the communication state can be acquired from the device.
  • the information processing system may further include a line concentrator. And each cable of the 2nd network mentioned above may be connected to a concentrator. As a result, the second network can be a star network.
  • connection support method is executed in an information processing system having a plurality of devices connected in a grid pattern by the first network.
  • the first device among the plurality of devices is connected to the second device among the plurality of devices
  • the plurality of cables of the second network For each of the first to the first device assigned to the device to which the first cable is connected, from the data storage unit that stores the information of the grid points on the first network to be assigned to the device to which the cable is to be connected.
  • C Information indicating the state of communication using the first network from the second device and the third device at the lattice point adjacent to the specified first lattice point.
  • D based on the acquired information, a process for determining whether the second device and the third device can directly communicate with each other through the first network.
  • a program for causing the processor to perform the processing according to the above method can be created.
  • the program is, for example, a computer-readable storage medium such as a flexible disk, CD-ROM, magneto-optical disk, semiconductor memory, or hard disk. It is stored in a storage device.
  • the intermediate processing result is temporarily stored in a storage device such as a main memory.

Abstract

 本情報処理システムは、格子型ネットワークである第1のネットワークに接続された複数の装置を有する。そして、複数の装置のうち第1の装置が、第2のネットワークの複数のケーブルの各々について、当該ケーブルが接続されるべき装置に割り当てられる、第1のネットワーク上の格子点の情報を格納するデータ格納部と、第2のネットワークの第1のケーブルが、複数の装置のうち第2の装置に接続された場合、第1のケーブルが接続されるべき装置に割り当てられる第1の格子点を、データ格納部から特定する特定部と、第2の装置と、特定された第1の格子点に隣り合う格子点にある第3の装置とから、第1のネットワークを使用する通信の状態を示す情報を取得し、取得された情報に基づき、第2の装置と第3の装置とが第1のネットワークによって直接通信できるか判断する判断部とを有する。

Description

情報処理システム、接続支援方法及びプログラム
 接続作業の支援技術に関する。
 ハイパフォーマンスコンピューティングとは、単位時間当たりの計算量が膨大な計算処理のことである。ハイパフォーマンスコンピューティングは、例えば自然現象のシミュレーション、物体の衝突のシミュレーション、或いは生体構造の解析等を目的として行われる。
 ハイパフォーマンスコンピューティングは、多数(例えば数千台)の計算機が連結された情報処理システムによって行われる。各計算機は計算処理を実行するCPU(Central Processing Unit)を搭載し、各CPUはインターコネクトと呼ばれる専用のネットワークによって他のCPUと接続される。
 計算処理を開始する前の段階において、各計算機に対して初期設定(例えば、アドレスの設定及び物理的位置の情報の設定など)の作業が行われ、また、インターコネクトとは別に管理用のネットワークのケーブルを各計算機に接続する作業等が行われる。HPC用の情報処理システムの場合、計算機の数が非常に多いため、これらの作業の量は膨大になる。また、作業の誤りに気付かずにシステムの稼働を開始してしまい、稼働の開始後に誤りに気付くことになると、作業のやり直しによって多大な損失が発生する。
 或る文献においては、DHCP(Dynamic Host Configuration Protocol)サーバが、シャーシに実装された制御カードに対して、制御カードから受信したMAC(Media Access Control)アドレスに対応するIP(Internet Protocol)アドレスを付与する。但し、この文献はIPアドレスの設定に着目しており、ネットワークケーブル等を誤って接続する可能性については考慮されていない。
特開2005-260828号公報
 従って、1つの側面では、本発明の目的は、ネットワークケーブルの接続の誤りを検出するための技術を提供することである。
 本発明に係る情報処理システムは、格子型ネットワークである第1のネットワークに接続された複数の装置を有する。そして、複数の装置のうち第1の装置が、第2のネットワークの複数のケーブルの各々について、当該ケーブルが接続されるべき装置に割り当てられる、第1のネットワーク上の格子点の情報を格納するデータ格納部と、第2のネットワークの第1のケーブルが、複数の装置のうち第2の装置に接続された場合、第1のケーブルが接続されるべき装置に割り当てられる第1の格子点を、データ格納部から特定する特定部と、第2の装置と、特定された第1の格子点に隣り合う格子点にある第3の装置とから、第1のネットワークを使用する通信の状態を示す情報を取得し、取得された情報に基づき、第2の装置と第3の装置とが第1のネットワークによって直接通信できるか判断する判断部とを有する。
 1つの側面では、ネットワークケーブルの接続の誤りを検出できるようになる。
図1は、本実施の形態のシステム概要を示す図である。 図2は、計算機間の接続の形態を示す図である。 図3は、計算機の構成例を示す図である。 図4は、サービスプロセッサの機能ブロック図である。 図5は、設定データ格納部に格納される設定データの一例を示す図である。 図6は、メインの処理フローを示す図である。 図7は、メインの処理フローを示す図である。 図8は、メインの処理フローを示す図である。 図9は、接続の誤りの検出について説明するための図である。 図10は、接続の誤りの検出について説明するための図である。 図11は、接続の誤りの検出について説明するための図である。 図12は、接続の誤りの検出について説明するための図である。 図13は、接続の誤りの検出について説明するための図である。 図14は、接続の誤りの検出について説明するための図である。 図15は、接続の誤りの検出について説明するための図である。 図16は、接続の誤りの検出について説明するための図である。
 図1に、本実施の形態のシステム概要を示す。複数のラックの各々には、複数の計算機が搭載される。本実施の形態においては、ラックの物理的位置を二次元座標(x,y)で表し、ラック内の物理的位置をz座標で表すことにより、各計算機の物理的位置を三次元座標(x,y,z)で表す。図1においては、ラックの数が9であり、各ラック内の計算機の数は3であるが、数に限定は無い。
 また、本実施の形態のシステムには、集線装置であるハブ3と、ハブ3に接続される管理装置5とが設けられる。最終的にハブ3と各計算機とはLAN(Local Area Network)ケーブルによって接続されるが、初期状態においてはハブ3と各計算機とは接続されていない。
 図2に、計算機間の接続の形態を示す。本実施の形態において、各計算機はHPC用のインターコネクトであるハイパフォーマンスコンピューティング用ネットワーク(以下、HPCNと呼ぶ)に接続される。HPCNは三次元格子型のネットワークであり、各計算機は格子点上に位置する。図2に示すように、座標が(x,y,z)である計算機は、座標が(x-1,y,z)である計算機と、座標が(x+1,y,z)である計算機と、座標が(x,y-1,z)である計算機と、座標が(x,y+1,z)である計算機と、座標が(x,y,z-1)である計算機と、座標が(x,y,z+1)である計算機とに隣り合っている(すなわち、HPCNで直接接続される)。但し、計算機がシステムの端に位置するような場合には、隣り合う計算機の数は6ではない。
 図3に、計算機の構成例を示す。図3の例では、計算機は、計算機におけるハードウエアの監視等を行うサービスプロセッサ(Service Processor)10と、電源制御部15と、電源ユニット16と、CPU17と、HPCNコントローラ18とを有する。サービスプロセッサ10は、CPU11と、RAM(Random Access Memory)12と、LANコントローラ13、ROM(Read Only Memory)19とを含む。
 CPU11は、バス14を介して電源制御部15、RAM12、CPU17、及びLANコントローラ13に接続される。電源制御部15は、例えば、I2C(Inter-Integrated Circuit)のインタフェースである。電源制御部15は、電源ユニット16に接続されており、電源ユニット16からサービスプロセッサ10及び計算機本体への電力の供給を制御する。計算機本体とは、サービスプロセッサ10以外の部分であり、CPU17及びHPCNコントローラ18を含む。LANコントローラ13は、計算機を管理するためのネットワークであるLANを介してデータの送信及び受信を行う。CPU17は、HPC用のCPUである。HPCNコントローラ18は、HPCNを介してデータの送信及び受信を行う。
 CPU11は、ROM19に格納されているプログラムをRAM12にロードして実行することにより、図4に示すような機能を実現する。図4に示すように、サービスプロセッサ10は、問い合わせ処理部100と、配信部101と、電源管理部102と、設定データ格納部103と、通信管理部104とを含む。但し、マスタのサービスプロセッサ10以外のサービスプロセッサ10は、設定データ格納部103を有さない。マスタのサービスプロセッサ10とは、LANケーブルが最初に接続された計算機のサービスプロセッサ10である。
 問い合わせ処理部100は、IPアドレス及びHPCN上の格子点の座標についての問い合わせを生成し、マスタのサービスプロセッサ10に送信する。配信部101は、設定データ格納部103からデータを読み出し、問い合わせの送信元のサービスプロセッサ10に送信する。電源管理部102は、他のサービスプロセッサ10の電源管理部102に対し、計算機本体への電力の供給を指示する供給指示及び計算機本体への電力供給の停止を指示する停止指示を送信する。また、電源管理部102は、他のサービスプロセッサ10の電源管理部102から供給指示及び停止指示を受信した場合に、受信した指示に応じて電源ユニット16を制御する。通信管理部104は、他の計算機の記憶装置(例えばCPU17のレジスタ等)から取得したデータに基づき、通信状態を確認する処理を行う。
 図5に、設定データ格納部103に格納される設定データの一例を示す。図5の例では、エントリ番号と、IPアドレスと、格子点の座標とを含むエントリが格納される。本実施の形態においては、管理者等が、エントリ番号が小さいエントリから順に、エントリに含まれる座標上の計算機にLANケーブルを接続する。また、配信部101は、エントリ番号が小さいエントリから順に、エントリを計算機に配布する。各計算機は、受け取ったIPアドレス及び座標を用いて通信及びHPC用の計算等を実行する。設定データは、管理装置5において生成され、マスタのサービスプロセッサ10を有する計算機に送信される。管理者等は、例えば、座標の値が小さいエントリほどエントリ番号が小さくなるように、設定データを作成する。
 次に、図6乃至図8を用いて、計算機が実行する処理について説明する。初期状態においては、サービスプロセッサ10及び計算機本体には電力が供給されていない。また、ハブ3と各計算機とはLANケーブルで接続されていない。
 まず、管理者等により、システム内における各計算機がHPCNに接続される(図6:ステップS1)。ステップS1は管理者等により行われるので、図6においてステップS1のブロックは点線で示されている。
 そして、計算機における電源制御部15は、サービスプロセッサ10への電力供給の指示を、例えば管理者等から受け付けた場合、電源ユニット16からサービスプロセッサ10に電力を供給する(ステップS3)。
 サービスプロセッサ10は起動を開始し、IPアドレスの初期値(ここでは、192.168.1.254)及び座標の初期値をRAM12における所定の領域に設定する(ステップS5)。
 サービスプロセッサ10は、LANがリンクアップ状態であることを検出するまで待機する(ステップS7)。LANがリンクアップ状態であることは、例えば、通信状態を示す値を格納するレジスタの値を確認することにより検出される。本実施の形態においては、計算機にLANケーブルが接続されると、計算機とハブ3とが通信可能になり、リンクアップ状態に移行する。
 管理者等は、予め定められた順序(本実施の形態においては、設定データに規定された順序)に従い、LANケーブルを或る計算機に接続する。すると、LANケーブルが接続された計算機のサービスプロセッサ10は、LANがリンクアップ状態であることを検出する(ステップS9)。
 サービスプロセッサ10は、自身がマスタのサービスプロセッサ10であるか判断する(ステップS11)。ステップS11においては、IPアドレス「192.168.1.1」について発行したPING(Packet INternet Groper)に対応する応答が返ってくるか否かにより判断する。本実施の形態においては、IPアドレス「192.168.1.1」はLANケーブルが最初に接続される計算機である。よって、応答が返ってこないということは、PINGを発行した計算機のサービスプロセッサ10がマスタのサービスプロセッサ10であることを意味する。
 自身がマスタのサービスプロセッサ10ではない場合(ステップS11:Noルート)、サービスプロセッサ10の問い合わせ処理部100は、IPアドレス及びHPCN上の格子点の座標についての問い合わせを生成する。そして、問い合わせ処理部100は、生成された問い合わせをマスタのサービスプロセッサ10に送信する(ステップS13)。そして、問い合わせ処理部100は、マスタのサービスプロセッサ10から受信したIPアドレス及び座標で、RAM12に格納されている初期のIPアドレス及び座標を更新する(ステップS15)。そして処理を終了する。
 一方、自身がマスタのサービスプロセッサ10である場合(ステップS11:Yesルート)、処理は端子Aを介して図7のステップS17に移行する。
 図7の説明に移行し、サービスプロセッサ10は、マスタのサービスプロセッサ10のIPアドレス(すなわち「192.168.1.1」)及び座標(すなわち(0,0,0))で、RAM12に格納されている初期のIPアドレス及び座標を更新する(図7:ステップS17)。
 サービスプロセッサ10の配信部101は、次に送信すべきIPアドレス(ここでは「192.168.1.2」)及び座標(ここでは(0,0,1))を、設定データ格納部103から特定し(ステップS19)、RAM12に格納する。
 問い合わせ処理部100は、他のサービスプロセッサ10(ここでは、LANケーブルが新たに接続された計算機のサービスプロセッサ10)から問い合わせを受信するまで待機する(ステップS21)。
 問い合わせ処理部100は、他のサービスプロセッサ10から問い合わせを受信し(ステップS23)、問い合わせを受信したことを配信部101に通知する。これに応じ、配信部101は、次に送信すべきIPアドレス及び座標をRAM12から読み出し、問い合わせの送信元のサービスプロセッサ10に送信する(ステップS25)。
 配信部101は、設定データ格納部103に、ステップS25において送信したIPアドレス及び座標以外に、既に割り当てられたIPアドレス及び座標が有るか判断する(ステップS27)。例えば3番目のエントリに含まれるIPアドレス及び座標をステップS25において送信した場合には、1番目のエントリに含まれるIPアドレス及び座標と、2番目のエントリに含まれるIPアドレス及び座標とは、既に割り当てられている。ステップS27を実行する理由は、既にIPアドレス及び座標が割り当てられた計算機とはLANケーブルを介して通信を行えるからである。既に割り当てられたIPアドレス及び座標が無い場合(ステップS27:Noルート)、処理は端子Bを介して図8のステップS37に移行する。
 既に割り当てられたIPアドレス及び座標が有る場合(ステップS27:Yesルート)、配信部101は、以下の処理を実行する。まず、配信部101は、問い合わせの送信元のサービスプロセッサ10に割り当てられた座標(すなわち、ステップS25において送信された座標)を特定する。そして、配信部101は、既に割り当てられた座標の中に、問い合わせの送信元に割り当てられた座標との距離が1である座標が有るか判断する(ステップS29)。ここでは、例えば(x,y,z)にある計算機と(x,y,z+1)にある計算機のように、x成分の値、y成分の値、及びz成分の値のいずれかが1異なり、他の成分の値が同じであるかが判断される。すなわち、問い合わせの送信元のサービスプロセッサ10に割り当てられた座標が示す格子点に隣り合う格子点の座標が該当する。よって、例えばステップS25において(0,0,2)の値を送信した場合には、既に送信した座標であり且つ(0,0,2)との距離が1である(0,0,1)が該当する。
 既に送信された座標の中に、問い合わせの送信元に割り当てられた座標との距離が1である座標が無い場合(ステップS29:Noルート)、処理は端子Bを介して図8のステップS37に移行する。
 既に送信された座標の中に、問い合わせの送信元に割り当てられた座標との距離が1である座標が有る場合(ステップS29:Yesルート)、配信部101は、その座標を特定する。そして、配信部101は、ステップS25において送信されたIPアドレス(すなわち、問い合わせの送信元のIPアドレス)及び特定された座標に対応するIPアドレスを電源管理部102に通知する。
 これに応じ、電源管理部102は、問い合わせの送信元のIPアドレス及び特定された座標に対応するIPアドレスに、LANを介して供給指示を送信する(ステップS31)。処理は端子Cを介して図8のステップS33の処理に移行する。なお、ステップS29において複数の座標が該当する場合には、複数の計算機に供給指示が送信される。
 そして、供給指示を受信した計算機の電源管理部102は、電源制御部15に、計算機本体へ電力を供給させる。これにより、計算機本体が起動し、HPCNを介した通信を開始するための処理が行われる。
 図8の説明に移行し、通信管理部104は、ステップS31において送信した供給指示を受信した計算機のレジスタ(例えば、CPU17のレジスタ)から、HPCNの通信状態を示す値を取得する(図8:ステップS33)。
 通信管理部104は、問い合わせの送信元の計算機と、問い合わせの送信元に割り当てられた座標が示す格子点と隣り合う格子点にある計算機との間においてHPCNがリンクアップ状態であるか判断する(ステップS35)。すなわち、問い合わせの送信元の計算機と、問い合わせの送信元に割り当てられた座標が示す格子点に隣り合う格子点にある計算機とがHPCNによって直接通信できるか判断する。なお、問い合わせの送信元に割り当てられた座標が示す格子点と隣り合う格子点にある計算機の数が複数である場合には、いずれのHPCNについてもリンクアップ状態であるか判断する。
 HPCNがリンクアップ状態ではない場合(ステップS35:Noルート)、問い合わせの送信元の計算機(すなわち、LANケーブルが実際に接続された計算機)は、LANケーブルが接続されるべき計算機ではない。よって、通信管理部104は、問い合わせの送信元のサービスプロセッサ10に対し、エラーが発生したことを示すエラー通知を送信する(ステップS37)。エラー通知を受信した計算機のサービスプロセッサ10は、例えば計算機に設けられたLED(Light Emitting Diode)を点滅させることにより、LANケーブルの接続が誤っていることを管理者等に知らせる。
 通信管理部104は、エラーが発生したことを電源管理部102に通知する。これに応じ、電源管理部102は、ステップS31において送信した供給指示を受信した計算機(すなわち、問い合わせの送信元の計算機及び問い合わせの送信元に割り当てられた座標が示す格子点と隣り合う格子点にある計算機)に対して、停止指示を送信する(ステップS39)。停止指示を受信した計算機の電源管理部102は、電源制御部15に、計算機本体への電力供給を停止させる。これにより計算機本体は停止するが、サービスプロセッサ10には電力が供給されたままである。
 そして、管理者等により、LANケーブルの接続がやり直される(ステップS41)。例えば、管理者等は、最後に接続されたLANケーブルを取り外し、そのLANケーブルが接続されるべき計算機に接続する。なお、ステップS41は管理者等により行われるので、図8においてステップS41のブロックは点線で示されている。そして処理は端子Dを介して図7のステップS21の処理に戻る。
 一方、HPCNがリンクアップ状態である場合(ステップS35:Yesルート)、通信管理部104は、問い合わせの送信元のサービスプロセッサ10に対し、LANケーブルの接続が正しいことを示す完了通知を送信する(ステップS43)。完了通知を受信した計算機のサービスプロセッサ10は、例えば計算機に設けられたLEDを点灯させることにより、LANケーブルの接続が正しいことを管理者等に知らせる。また、通信管理部104は、ステップS25において送信したIPアドレス及び座標の次に送信すべきIPアドレス及び座標を設定データ格納部103から読み出し、RAM12に格納する。
 また、通信管理部104は、LANケーブルの接続が正しいことを電源管理部102に通知する。これに応じ、電源管理部102は、ステップS31において送信した供給指示を受信した計算機(すなわち、問い合わせの送信元の計算機及び問い合わせの送信元に割り当てられた座標が示す格子点と隣り合う格子点にある計算機)に対して、停止指示を送信する(ステップS45)。停止指示を受信した計算機の電源管理部102は、電源制御部15に、計算機本体への電力供給を停止させる。これにより計算機本体は停止するが、サービスプロセッサ10には電力が供給されたままである。
 サービスプロセッサ10は、LANケーブルが接続されていない計算機が有るか判断する(ステップS47)。LANケーブルが接続されていない計算機が有るか否かは、例えば、完了通知を全計算機に送信したか否かによって判断される。
 LANケーブルが接続されていない計算機が有る場合(ステップS47:Yesルート)、次の計算機について処理するため、処理は端子Dを介して図7のステップS21の処理に戻る。一方、LANケーブルが接続されていない計算機が無い場合(ステップS47:Noルート)、サービスプロセッサ10は、全計算機に対するLANケーブルの接続が終了したことを示す終了通知を管理装置5に送信する(ステップS49)。そして処理を終了する。
 以上のような処理を実行すれば、誤ってLANケーブルを接続した場合においても、誤りであることを管理者等が認識できるようになる。これにより、管理者等はLANケーブルを正しく接続できるようなる。
 また、LANケーブルの接続の際に、各計算機に対するIPアドレス及び座標の設定を自動的に行えるようになる。これにより、各計算機にシリアルケーブルを接続して設定を行う作業が不要になるので、作業の誤りを防ぎ、また作業に要するコストを削減できるようになる。
 図9乃至図16を用いて、接続の誤りの検出についてより具体的に説明する。
 初期状態は、図9に示す状態であるとする。図9においては、ラックaに計算機A乃至Cが搭載され、ラックbに計算機D乃至Fが搭載されている。図9の段階ではいずれの計算機にもLANケーブルが接続されていないとする。LANケーブルの接続の正しい順序は、計算機A、計算機B、計算機C、計算機D、計算機E及び計算機Fの順であるとする。
 図9はxz平面の図であり、x方向及びz方向におけるHPCNの接続が示されている。計算機Aは計算機B及び計算機DにHPCNで接続され、計算機Bは計算機A及び計算機CにHPCNで接続され、計算機Cは計算機B及び計算機FにHPCNで接続され、計算機Dは計算機A及び計算機EにHPCNで接続され、計算機Eは計算機B及び計算機DにHPCNで接続され、計算機Fは計算機C及び計算機EにHPCNで接続されている。実際にはy方向の接続も存在するが、説明を簡単にするため省略されている。
 ここで、図10に示すように、ハブ3と計算機AとがLANケーブルで接続されたとする。この場合、計算機Aのサービスプロセッサ10がマスタのサービスプロセッサ10である。計算機AにはIPアドレス「192.168.1.1」及び座標(0,0,0)が設定される。
 次に、図11に示すように、ハブ3と計算機BとがLANケーブルで接続されたとする。計算機BにはIPアドレス「192.168.1.2」及び座値(0,0,1)が設定される。実際にLANケーブルが接続された計算機である計算機Bの本体には、電力が供給される。また、IPアドレスが既に設定され且つ計算機Bに割り当てられた座標が示す格子点と隣り合う格子点にある計算機である計算機Aの本体に、電力が供給される。そして、計算機Aと計算機Bとの間のHPCNがリンクアップ状態になるかが確認される。ここでは、リンクアップ状態になるので、LANケーブルの接続の誤りは検出されない。
 次に、図12に示すように、ハブ3と計算機CとがLANケーブルで接続されたとする。計算機CにはIPアドレス「192.168.1.3」及び座標(0,0,2)が設定される。実際にLANケーブルが接続された計算機である計算機Cの本体には、電力が供給される。また、IPアドレスが既に設定され且つ計算機Cに割り当てられた座標が示す格子点と隣り合う格子点にある計算機である計算機Bの本体に、電力が供給される。そして、計算機Bと計算機Cとの間のHPCNがリンクアップ状態になるかが確認される。ここでは、リンクアップ状態になるので、LANケーブルの接続の誤りは検出されない。
 次に、図13に示すように、ハブ3と計算機DとがLANケーブルで接続されたとする。計算機DにはIPアドレス「192.168.1.4」及び座標(1,0,0)が設定される。実際にLANケーブルが接続された計算機である計算機Dの本体には、電力が供給される。また、IPアドレスが既に設定され且つ計算機Dに割り当てられた座標が示す格子点と隣り合う格子点にある計算機である計算機Aの本体に、電力が供給される。そして、計算機Aと計算機Dとの間のHPCNがリンクアップ状態になるかが確認される。ここでは、リンクアップ状態になるので、LANケーブルの接続の誤りは検出されない。
 このように、管理者等は予め定められた順序に従ってLANケーブルを接続すれば、正しく接続を行うことができる。
 しかし、図14に示すように、最初に計算機BにLANケーブルを接続したとする。この場合、計算機Bのサービスプロセッサ10がマスタのサービスプロセッサ10である。計算機BにはIPアドレス「192.168.1.1」及び座標(0,0,0)が設定される。
 次に、図15に示すように、ハブ3と計算機CとがLANケーブルで接続されたとする。計算機CにはIPアドレス「192.168.1.2」及び座標(0,0,1)が設定される。実際にLANケーブルが接続された計算機である計算機Cの本体には、電力が供給される。また、IPアドレスが既に設定され且つ計算機Cに割り当てられた座標が示す格子点と隣り合う格子点にある計算機である計算機Bの本体に、電力が供給される。そして、計算機Bと計算機Cとの間のHPCNがリンクアップ状態になるかが確認される。ここでは、リンクアップ状態になるので、LANケーブルの接続の誤りは検出されない。
 次に、図16に示すように、ハブ3と計算機DとがLANケーブルで接続されたとする。計算機CにはIPアドレス「192.168.1.3」及び座標(0,0,2)が設定される。実際にLANケーブルが接続された計算機である計算機Dの本体には電力が供給される。また、IPアドレスが設定され且つ計算機Dに割り当てられた座標が示す格子点と隣り合う格子点の計算機である計算機Cに電力が供給される。しかし、計算機Dと計算機Cとの間はHPCNで直接接続されていないため、リンクアップ状態にならず、接続の誤りが検出される。
 このように、本実施の形態においては、LANケーブルの接続が誤っていることを検出することができる。但し、図16に示したように、誤ってLANケーブルを接続した段階で誤りが検出されるとは限らない。
 以上本発明の一実施の形態を説明したが、本発明はこれに限定されるものではない。例えば、上で説明したサービスプロセッサ10の機能ブロック構成は実際のプログラムモジュール構成に一致しない場合もある。
 また、上で説明したデータ保持形態は一例であって、上記のような構成でなければならないわけではない。さらに、処理フローにおいても、処理結果が変わらなければ処理の順番を入れ替えることも可能である。さらに、並列に実行させるようにしても良い。
 以上述べた本発明の実施の形態をまとめると、以下のようになる。
 本実施の形態の第1の態様に係る情報処理システムは、(A)格子型ネットワークである第1のネットワークに接続された複数の装置を有する。そして、複数の装置のうち第1の装置が、(a1)第2のネットワークの複数のケーブルの各々について、当該ケーブルが接続されるべき装置に割り当てられる、第1のネットワーク上の格子点の情報を格納するデータ格納部と、(a2)第2のネットワークの第1のケーブルが、複数の装置のうち第2の装置に接続された場合、第1のケーブルが接続されるべき装置に割り当てられる第1の格子点を、データ格納部から特定する特定部と、(a3)第2の装置と、特定された第1の格子点に隣り合う格子点にある第3の装置とから、第1のネットワークを使用する通信の状態を示す情報を取得し、取得された情報に基づき、第2の装置と第3の装置とが第1のネットワークによって直接通信できるか判断する判断部とを有する。
 このようにすれば、実際にケーブルが接続された装置とケーブルが接続されるべき装置とが一致するか判断できるので、ケーブルを誤って接続したことを検出できるようになる。
 また、上で述べた特定部は、(a2-1)特定された第1の格子点の情報と、第1のケーブルが接続されるべき装置に割り当てられるアドレスとを、第2の装置に送信してもよい。このようにすれば、各装置に対して格子点の情報及びアドレスを設定する作業が不要になる。
 また、複数の装置の各々は、(a4)第1のネットワークを介してデータを送信及び受信する処理部を有してもよい。そして、上で述べた第1の装置は、(a5)第2の装置及び第3の装置に、処理部に電力を供給することを要求する第1の要求を送信する送信部をさらに有してもよい。そして、上で述べた判断部は、(a3-1)送信部が第1の要求を送信した後に、第1のネットワークを使用する通信の状態を示す情報を取得してもよい。このようにすれば、第2の装置と第3の装置との間の通信以外について情報を取得するのを防止できる。
 また、上で述べた送信部は、(a5-1)第2の装置と第3の装置とが第1のネットワークによって直接通信できると判断部により判断された場合に、第2の装置及び第3の装置に、処理部への電力の供給を停止することを要求する第2の要求を送信してもよい。このようにすれば、第2のネットワークについて新たにケーブルが接続された場合に備えることができるようになる。
 また、上で述べた第1の装置が、(a6)第2の装置から、第1のケーブルが接続されたことを示すデータを受信する受信部をさらに有してもよい。このようにすれば、第1のケーブルが接続されたことを検出できるようになる。
 また、上で述べた第3の装置は、第1の格子点に隣り合う格子点にあり、且つアドレスと第1のネットワーク上の格子点の情報とを既に受信した装置であってもよい。アドレスと格子上の位置を表す情報とを既に受信した装置であれば、その装置から通信の状態を示す情報を取得することができる。
 また、本情報処理システムは、集線装置をさらに有してもよい。そして、上で述べた第2のネットワークの各ケーブルは、集線装置に接続されてもよい。これにより、第2のネットワークをスター型のネットワークにすることができる。
 本実施の形態の第2の態様に係る接続支援方法は、第1のネットワークによって格子状に接続された複数の装置を有する情報処理システムにおいて実行される。そして、複数の装置のうち第1の装置が、(B)第2のネットワークの第1のケーブルが、複数の装置のうち第2の装置に接続された場合、第2のネットワークの複数のケーブルの各々について、当該ケーブルが接続されるべき装置に割り当てられる、第1のネットワーク上の格子点の情報を格納するデータ格納部から、第1のケーブルが接続されるべき装置に割り当てられる第1の格子点を特定し、(C)第2の装置と、特定された第1の格子点に隣り合う格子点にある第3の装置とから、第1のネットワークを使用する通信の状態を示す情報を取得し、(D)取得された情報に基づき、第2の装置と第3の装置とが第1のネットワークによって直接通信できるか判断する処理を含む。
 なお、上記方法による処理をプロセッサに行わせるためのプログラムを作成することができ、当該プログラムは、例えばフレキシブルディスク、CD-ROM、光磁気ディスク、半導体メモリ、ハードディスク等のコンピュータ読み取り可能な記憶媒体又は記憶装置に格納される。尚、中間的な処理結果はメインメモリ等の記憶装置に一時保管される。

Claims (9)

  1.  格子型ネットワークである第1のネットワークに接続された複数の装置
     を有し、
     前記複数の装置のうち第1の装置が、
     第2のネットワークの複数のケーブルの各々について、当該ケーブルが接続されるべき装置に割り当てられる、前記第1のネットワーク上の格子点の情報を格納するデータ格納部と、
     前記第2のネットワークの第1のケーブルが、前記複数の装置のうち第2の装置に接続された場合、前記第1のケーブルが接続されるべき装置に割り当てられる第1の格子点を、前記データ格納部から特定する特定部と、
     前記第2の装置と、特定された前記第1の格子点に隣り合う格子点にある第3の装置とから、前記第1のネットワークを使用する通信の状態を示す情報を取得し、取得された前記情報に基づき、前記第2の装置と前記第3の装置とが前記第1のネットワークによって直接通信できるか判断する判断部と、
     を有する情報処理システム。
  2.  前記特定部は、
     特定された前記第1の格子点の情報と、前記第1のケーブルが接続されるべき装置に割り当てられるアドレスとを、前記第2の装置に送信する
     請求項1記載の情報処理システム。
  3.  前記複数の装置の各々は、
     前記第1のネットワークを介してデータを送信及び受信する処理部
     を有し、
     前記第1の装置は、
     前記第2の装置及び前記第3の装置に、前記処理部に電力を供給することを要求する第1の要求を送信する送信部
     をさらに有し、
     前記判断部は、
     前記送信部が前記第1の要求を送信した後に、前記第1のネットワークを使用する通信の状態を示す情報を取得する
     請求項1又は2記載の情報処理システム。
  4.  前記送信部は、
     前記第2の装置と前記第3の装置とが前記第1のネットワークによって直接通信できると前記判断部により判断された場合に、前記第2の装置及び前記第3の装置に、前記処理部への電力の供給を停止することを要求する第2の要求を送信する
     請求項3記載の情報処理システム。
  5.  前記第1の装置が、
     前記第2の装置から、前記第1のケーブルが接続されたことを示すデータを受信する受信部
     をさらに有する請求項1乃至4のいずれか1つ記載の情報処理システム。
  6.  前記第3の装置は、前記第1の格子点に隣り合う格子点にあり、且つ前記アドレスと前記第1のネットワーク上の格子点の情報とを既に受信した装置である
     請求項2記載の情報処理システム。
  7.  集線装置
     をさらに有し、
     前記第2のネットワークの各ケーブルは、前記集線装置に接続される
     請求項1乃至6のいずれか1つ記載の情報処理システム。
  8.  第1のネットワークによって格子状に接続された複数の装置を有する情報処理システムにおいて、
     前記複数の装置のうち第1の装置が、
     第2のネットワークの第1のケーブルが、前記複数の装置のうち第2の装置に接続された場合、前記第2のネットワークの複数のケーブルの各々について、当該ケーブルが接続されるべき装置に割り当てられる、前記第1のネットワーク上の格子点の情報を格納するデータ格納部から、前記第1のケーブルが接続されるべき装置に割り当てられる第1の格子点を特定し、
     前記第2の装置と、特定された前記第1の格子点に隣り合う格子点にある第3の装置とから、前記第1のネットワークを使用する通信の状態を示す情報を取得し、
     取得された前記情報に基づき、前記第2の装置と前記第3の装置とが前記第1のネットワークによって直接通信できるか判断する、
     処理を実行する接続支援方法。
  9.  第1のネットワークの第1のケーブルが、格子型の第2のネットワークに接続された複数の装置のうち第1の装置に接続された場合、前記第1のネットワークの複数のケーブルの各々について、当該ケーブルが接続されるべき装置に割り当てられる、前記第2のネットワーク上の格子点の情報を格納するデータ格納部から、前記第1のケーブルが接続されるべき装置に割り当てられる第1の格子点を特定し、
     前記第1の装置と、特定された前記第1の格子点に隣り合う格子点にある第2の装置とから、前記第2のネットワークを使用する通信の状態を示す情報を取得し、
     取得された前記情報に基づき、前記第1の装置と前記第2の装置とが前記第2のネットワークによって直接通信できるか判断する、
     処理をコンピュータに実行させるためのプログラム。
PCT/JP2014/066734 2014-06-24 2014-06-24 情報処理システム、接続支援方法及びプログラム WO2015198402A1 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
PCT/JP2014/066734 WO2015198402A1 (ja) 2014-06-24 2014-06-24 情報処理システム、接続支援方法及びプログラム
JP2016528793A JP6222358B2 (ja) 2014-06-24 2014-06-24 情報処理システム、接続支援方法及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2014/066734 WO2015198402A1 (ja) 2014-06-24 2014-06-24 情報処理システム、接続支援方法及びプログラム

Publications (1)

Publication Number Publication Date
WO2015198402A1 true WO2015198402A1 (ja) 2015-12-30

Family

ID=54937539

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2014/066734 WO2015198402A1 (ja) 2014-06-24 2014-06-24 情報処理システム、接続支援方法及びプログラム

Country Status (2)

Country Link
JP (1) JP6222358B2 (ja)
WO (1) WO2015198402A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020065144A (ja) * 2018-10-16 2020-04-23 富士通株式会社 並列処理装置および光ファイバーケーブルの交換方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012073784A (ja) * 2010-09-28 2012-04-12 Fujitsu Ltd 計算処理システム、そのジョブ分散配置方法及びジョブ分散配置プログラム
WO2014010021A1 (ja) * 2012-07-09 2014-01-16 富士通株式会社 情報処理装置、情報処理システム、情報処理装置制御方法及び情報処理装置制御プログラム

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7277931B1 (en) * 1999-06-08 2007-10-02 International Business Machines Corporation Representing, configuring, administering, monitoring, and/or modeling connections using catalogs and matrixes
JP5608692B2 (ja) * 2011-02-17 2014-10-15 パナソニック株式会社 ネットワーク接続装置および方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012073784A (ja) * 2010-09-28 2012-04-12 Fujitsu Ltd 計算処理システム、そのジョブ分散配置方法及びジョブ分散配置プログラム
WO2014010021A1 (ja) * 2012-07-09 2014-01-16 富士通株式会社 情報処理装置、情報処理システム、情報処理装置制御方法及び情報処理装置制御プログラム

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020065144A (ja) * 2018-10-16 2020-04-23 富士通株式会社 並列処理装置および光ファイバーケーブルの交換方法
JP7035950B2 (ja) 2018-10-16 2022-03-15 富士通株式会社 並列処理装置および光ファイバーケーブルの交換方法

Also Published As

Publication number Publication date
JP6222358B2 (ja) 2017-11-01
JPWO2015198402A1 (ja) 2017-04-20

Similar Documents

Publication Publication Date Title
US9645956B2 (en) Delivering interrupts through non-transparent bridges in a PCI-express network
WO2016037503A1 (zh) PCIe拓扑的配置方法和装置
US8793351B2 (en) Automated configuration of new racks and other computing assets in a data center
US9563591B2 (en) Peripheral component interconnect express (PCIe) ping in a switch-based environment
US9525592B2 (en) Client/server network environment setup method and system
US20080065874A1 (en) System and method for dynamic determination of system topology in a multiple building block server system
US10127095B2 (en) Seamless automatic recovery of a switch device
US9588542B2 (en) Rack server system and method for automatically managing rack configuration information
TWI605344B (zh) 用於智慧插件節點管理之非臨時性電腦可讀取媒體、計算裝置及方法
CN109660391B (zh) 一种池化服务器系统固件升级方法、系统及相关装置
CN107659677A (zh) 一种基于bmc的ip地址自动配置的装置和方法
US8364871B2 (en) Providing virtual functions after an input/output adapter is moved from a first location to a second location
TW201828658A (zh) 偵測網際網路協定位址及實體位址的方法
US20150186317A1 (en) Method and apparatus for detecting the initiator/target orientation of a smart bridge
JP6222358B2 (ja) 情報処理システム、接続支援方法及びプログラム
US20090144476A1 (en) Hot plug in a link based system
US10073801B2 (en) Computer and method of controlling I/O switch of computer
US10936332B2 (en) Setting method, setting device, and storage medium
CN106550057B (zh) 用于确定设备的物理位置的方法和装置
CN115454896A (zh) 基于smbus的ssd mctp控制消息验证方法、装置、计算机设备及存储介质
US20160320993A1 (en) Control apparatus and storage system
CN106776315B (zh) 检测版本的方法和装置
JP6343991B2 (ja) 通信システム、通信制御方法および通信制御プログラム
JP2009276828A (ja) Usb接続装置、及びusb接続方法
US9639438B2 (en) Methods and systems of managing an interconnection

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 14896158

Country of ref document: EP

Kind code of ref document: A1

ENP Entry into the national phase

Ref document number: 2016528793

Country of ref document: JP

Kind code of ref document: A

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 14896158

Country of ref document: EP

Kind code of ref document: A1