WO2010084529A1 - 情報処理システム - Google Patents

情報処理システム Download PDF

Info

Publication number
WO2010084529A1
WO2010084529A1 PCT/JP2009/000260 JP2009000260W WO2010084529A1 WO 2010084529 A1 WO2010084529 A1 WO 2010084529A1 JP 2009000260 W JP2009000260 W JP 2009000260W WO 2010084529 A1 WO2010084529 A1 WO 2010084529A1
Authority
WO
WIPO (PCT)
Prior art keywords
switch
pcie
chassis
virtual
server
Prior art date
Application number
PCT/JP2009/000260
Other languages
English (en)
French (fr)
Inventor
八木伸夫
Original Assignee
株式会社日立製作所
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 株式会社日立製作所 filed Critical 株式会社日立製作所
Priority to JP2010547311A priority Critical patent/JPWO2010084529A1/ja
Priority to US13/145,065 priority patent/US20120005392A1/en
Priority to PCT/JP2009/000260 priority patent/WO2010084529A1/ja
Publication of WO2010084529A1 publication Critical patent/WO2010084529A1/ja

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F13/00Interconnection of, or transfer of information or other signals between, memories, input/output devices or central processing units
    • G06F13/38Information transfer, e.g. on bus
    • G06F13/40Bus structure
    • G06F13/4063Device-to-bus coupling
    • G06F13/409Mechanical coupling
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2213/00Indexing scheme relating to interconnection of, or transfer of information or other signals between, memories, input/output devices or central processing units
    • G06F2213/0026PCI express

Definitions

  • the present invention relates to an information processing system, and in particular, information processing that realizes IO aggregation, sharing, and expansion by connecting a computer and a plurality of input / output devices (IO) using PCIe (Peripheral Component Interconnect Interconnect Express) standards.
  • the present invention relates to a PCIe cable connection confirmation method in a system and an information processing system.
  • a large-scale information processing system when many IOs are connected to one computer, generally, a large number of IOs are mounted using an extended IO chassis.
  • a server chassis 240 having a memory 2401 and CPU 2402, a root complex 2403, and a PCIe slot 2404 to an expansion IO chassis 242 having a PCIe switch 2421 and a PCIe slot 2422
  • the pass-through card is connected to the PCIe slot 2404 of the server chassis 240, and the expansion of the IO is realized by connecting the pass-through card and the expansion IO chassis 242 with the PCIe cable 244.
  • one IO is shared from a plurality of server blades in the server chassis by using the multi-root PCIe technology.
  • a tag that indicates a computer that issued a transaction to a transaction issued from a plurality of computers
  • an IO that could only be exclusively used by a single computer can be shared from a plurality of computers.
  • one host CPU set 310 is connected to a PCIe endpoint 370-390 via a PC root complex 350 and a PCIe switch 360, and the PCI root complex
  • a computer system (FIG. 10) in which a plurality of host systems 1010 and 1020 are connected to their virtual planes 1040 and 1050 as endpoints via an MRA switch. ing.
  • Multi-root PCIe technology is a technology aimed at efficient use by sharing IO resources to reduce costs.
  • cable connection to a chassis with an expansion IO compatible with multi-root PCIe I could not expand the IO.
  • a configuration in which an extended IO chassis compatible with multi-root PCIe is connected to a plurality of server chassis via a cable is not realized.
  • no specific technical means for sharing the IO has been realized.
  • the data processing systems using the PCIe technology described in Patent Document 1 all relate to individual blades in the same multi-root blade cluster system, and a computer having the blades is connected to an IO.
  • An object of the present invention is to realize an information processing system using PCIe technology and a connection confirmation of a PCIe cable that can connect a large number of IOs and can share a large number of IOs from a plurality of servers. is there.
  • the present invention preferably includes a server chassis having a plurality of server blades having a processor, a memory, and a root complex, and a first multi-root capable PCIe switch connected to the server blades; A plurality of PCIe slots to which input / output devices are mounted; and an IO chassis having a second multi-root capable PCIe switch connected to the PCIe slot, the first multi-root capable PCIe switch and the second
  • This is an information processing system in which multi-route compatible PCIe switches are connected by a PCIe cable.
  • the first multi-root capable PCIe switch of one server chassis is connected to a second multi-root capable PCIe switch of a plurality of the IO chassis.
  • the first multi-root compatible PCIe switch of a plurality of the server chassis is connected to a second multi-root compatible PCIe switch of one IO chassis.
  • the first multi-root capable PCIe switches of the plurality of server chassis are connected to second multi-root capable PCIe switches of the plurality of IO chassis.
  • the first multi-root PCIe switch includes a plurality of upstream ports to which the server blade is connected, a plurality of downstream ports, a plurality of virtual switches, the plurality of upstream switches, and the plurality of ports.
  • An upstream switch that switches connections between virtual switches, a downstream switch that switches connections between the plurality of virtual switches and the plurality of downstream ports, and an upstream port that manages allocation of connections between the plurality of upstream switches and the plurality of virtual switches ⁇
  • a virtual switch allocation table, a virtual switch-downstream port allocation table that manages allocation of connections between the plurality of virtual switches and the plurality of downstream ports, the upstream port-virtual switch allocation table, and the virtual switch-downstream port allocation table A first management microcomputer for managing the settings of the upstream switch, and the upstream switch by the upstream port-virtual switch assignment table.
  • the virtual switch controls the switching of the downstream switch by the downstream port allocation table, connecting the second multi-root compliant PCIe switch of the IO chassis with the server chassis server blade.
  • the second multi-root compatible PCIe switch includes a plurality of upstream ports connected to the first multi-root compatible PCIe switch, and a plurality of downstream ports connected to a PCIe slot of the IO chassis.
  • a plurality of virtual switches an upstream switch that switches connections between the plurality of upstream switches and the plurality of virtual switches; a downstream switch that switches connections between the plurality of virtual switches and the plurality of downstream ports; and the plurality of upstream switches
  • an upstream port-virtual switch allocation table that manages connection allocation of the plurality of virtual switches, a virtual switch-downstream port allocation table that manages allocation of connections between the plurality of virtual switches and the plurality of downstream ports
  • Second management manager for managing settings of upstream port-virtual switch allocation table and virtual switch-downstream port allocation table And controlling the switching of the upstream switch by the upstream port-virtual switch allocation table, controlling the switching of the downstream switch by the virtual switch-downstream port allocation table, and controlling the switching of the server blade of the server chassis.
  • the first multi-root PCIe switch is connected to the PCIe slot of the IO chassis.
  • the first and second management microcomputers are connected to a management console via a LAN cable, and based on setting information input from the management console, the first and second management microcomputers are: The upstream port-virtual switch allocation table and the virtual switch-downstream port allocation table are created.
  • the PCIe cable connection confirmation method is preferably provided with a first multi-route compatible PCIe switch provided in a server chassis and connected to a server blade, and an I / O device provided in the IO chassis.
  • a PCIe cable connection confirmation method in an information processing system in which a second multi-route compatible PCIe switch connected to a plurality of PCIe slots is connected with a PCIe cable, wherein the first and second Under the execution of the management microcomputer possessed by the multi-route compatible PCIe switch, a preset first assignment table that prescribes the allocation of the upstream port-virtual switch and a second assignment table that prescribes the assignment of the virtual switch-downstream port Based on the above, check whether each port is properly connected to the target port, The result of the confirmation is displayed on the indicator mounted on the target port, and the method is configured as a PCIe cable connection confirmation method.
  • the first management table and the second management table are created by a management console connected to the server blade and the IO chassis, and
  • an information processing system using PCIe technology that can connect a large number of IOs and share a large number of IOs from one or a plurality of servers in accordance with system requirements.
  • PCIe cable wiring between the first MR-PCIe switch that aggregates a plurality of server blades in the server chassis and the second MR-PCIe switch that can connect a plurality of I / Os, 1
  • a plurality of server blades can share one or a plurality of IO chassis.
  • FIG. 1 shows a configuration example of an information processing system with IO expansion.
  • One server chassis 10 is connected to three IO chassis 121 to 123 (generically indicated as 12) via a PCIe cable 15.
  • the server chassis 10 mainly includes four server blades 201 to 204 and a multi-root (MR) -PCIe switch 25.
  • MR-PCIe switch 25 Connected to a plurality of IO chassis 12.
  • Each IO chassis 12 has an MR-PCIe switch 13 and eight PCIe slots 141 to 148 (generically indicated as 14) in which IOs are mounted.
  • Each MR-PCIe switch 13 of the IO chassis 12 is connected to the MR-PCIe switch 25 of the server chassis 10 by a PCIe cable 15. With this connection configuration, the server blades 201 to 204 in the server chassis 1 can access a maximum of 24 PCIe slots (8 PCIe slots ⁇ 3 IO chassis).
  • the MR-PCIe switches 25 and 13 of the server chassis 10 and the IO chassis 12 are connected to the management console 32 via the LAN switch 31.
  • the management console 32 is constituted by a personal computer, for example, and has storage means such as an input / output function and a hard disk. A user (system administrator) can operate the management console 32 to build a connection configuration between the server chassis 10 and the IO chassis 12 and monitor the mounting of the IO in the IO slot 14.
  • FIG. 2 shows a detailed configuration example of the server chassis 10.
  • the server chassis 10 includes four server blades 201 to 204 (generally indicated as 20), a backplane 24, and an MR-PCIe switch 25.
  • the server blade 20 has a memory 21, a processor (CPU) 22, and a root complex 23 having a plurality of PCIe ports for connecting a CUP.
  • the backplane 24 connects the root complex 23 in the server blade 20 and the MR-PCIe switch 25.
  • FIG. 3 is a configuration example of an information processing system in which a plurality of server chassis share one IO.
  • FIG. 4 is a configuration example of an information processing system in which a plurality of server chassis 101 to 103 share a plurality of IOs 121-123.
  • the configurations of the server chassis 10 and the IO chassis 13 are the same as those shown in FIGS. Illustration of the LAN switch 31 and the management console 32 is omitted. According to this configuration, one server blade 201 can be connected to a maximum of 24 IOs using each PCIe slot 14. Also, one PCIe slot 14 can be shared by a maximum of 12 server blades 20.
  • the MR-PCIe switch (first MR-PCIe switch) of the server chassis 10 and (second MR-PCIe switch) of the IO chassis 12 with a PCIe cable, according to the request of the system (user),
  • the number of server chassis to be connected and the number of expansion IO chassis can be flexibly changed.
  • the server blade and the PCIe slot can be flexibly connected by the two-stage MR-PCIe switch including the first and second.
  • FIG. 5 shows a detailed configuration of the MR-PCIe switch.
  • the multi-root PCIe switches 25 and 13 in the server chassis 10 and the IO chassis 12 have different port connection destinations, but have the same internal configuration.
  • the MR-PCIe switch includes a management microcomputer (micro CPU) 51 that manages switch settings and a switch LSI 52.
  • the switch LSI 52 has four upstream ports and eight downstream ports, and realizes the function of the MR-PCIe switch.
  • the internal configuration includes 16 virtual switches 57, an upstream connection switch 15 that connects the upstream port and the virtual switch 57, a downstream switch 16 that connects the virtual switch 57 and the downstream port, and an upstream port and the virtual switch 57.
  • the management microcomputer 51 has an upstream port-virtual switch allocation table 53 that manages allocation, and a virtual switch-downstream switch allocation table 54 that manages allocation of virtual switches 57 and downstream ports.
  • the management microcomputer 51 is also connected to the LAN switch 31, and the contents of the management tables 53 and 54 are set and changed under the control of the management microcomputer 51 in accordance with an instruction from the management console 32 according to a system (user) request.
  • switch assignment management in Embodiment 1 Next, switch allocation using the switch allocation management tables 53 and 54 in the information processing system (FIG. 1) according to the first embodiment will be described with reference to FIGS.
  • the MR-PCIe switch 25 of the server chassis 101 can be connected to four server blades using four upstream ports, and can be connected to four IO chassis using four downstream ports.
  • one server blade 201 is connected to the upstream port of the MR-PCIe switch 25, and three MR-PCIe switches 13 of the IO chassis 12 are connected using three downstream ports.
  • FIG. 6 is an upstream port-virtual switch allocation table 53 in the MR-PCIe switch 25 of the server chassis 101. It shows that the server blade 201 connected to one upstream port 1 uses one virtual switch 1.
  • FIG. 7 is also a virtual switch-downstream port assignment table 54 in the MR-PCIe switch 25 of the server chassis 101.
  • the virtual downstream ports 1 to 4 of the virtual switch 1 are connected to the physical downstream ports 1 to 4.
  • the server blade 201 can occupy the downstream ports 1 to 4 of the MR-PCIe switch 25 on the server chassis 10, for example.
  • FIG. 8 is an upstream port-virtual switch allocation table 53 in the MR-PCIe switch 13 in the IO chassis 121-123. Since the upstream port 1 of the IO chassis 121 is connected to the downstream port 1 of the server chassis 10, the server blade 201 uses the virtual switch 1 of the IO chassis 121. Similarly, the server blade 201 also uses the virtual switch 1 in the IO chassis 122 and 123.
  • FIG. 9 is a virtual switch-downstream port assignment table 54 in the MR-PCIe switch 13 in the IO chassis 121-123. Downstream ports 1 to 8 of the PCIe switch 13 on the IO chassis are connected to the PCIe slots 141 to 148. The virtual downstream ports 1 to 8 of the virtual switch of the IO chassis 121 are connected to the physical downstream ports 1 to 8.
  • Each of the allocation tables shown in FIGS. 6 to 8 is created by processing means (CPU and software executed therein) in the management console 32 and transferred to the management microcomputer 51 in the MR-PCIe switch.
  • one server blade 201 can use all PCIe slots (that is, a total of 24 IOs) of the three IO chassis 121 to 123.
  • switch assignment management in Embodiment 2 switch allocation using the switch allocation management tables 53 and 54 in the information processing system (FIG. 3) according to the second embodiment will be described with reference to FIGS.
  • FIG. 10 is an upstream port-virtual switch allocation table 53 in the MR-PCIe switch 25 on the server chassis 101-103.
  • the server blade 201 connected to the upstream port 1 uses the virtual switch 1.
  • the server blades 202, 203, and 204 connected to the upstream ports 2, 3, and 4 use the virtual switches 2, 3, and 4.
  • FIG. 11 is a virtual switch-downstream port assignment table 54 in the MR-PCIe switch 25 on the server chassis 101-102.
  • the virtual downstream ports 1 of the virtual switches 1 to 4 are connected to the virtual ports 1 to 4 of the physical downstream port 1.
  • the server blades 201 to 204 share the downstream port 1 of the MR-PCIe switch 53 on the server chassis 101-103, and the server blades 201 to 204 use the virtual ports 1 to 4. It becomes possible to do.
  • FIG. 12 is an upstream port-virtual switch allocation table 53 in the MR-PCIe switch 13 on the IO chassis 121. Since the upstream port 1 of the IO chassis 121 is connected to the downstream port 1 of the server chassis 101 and the downstream port 1 of the server chassis 101 is shared by the server blades 201 to 204, the virtual The switches 1 to 4 are used by the server blades 201 to 204 on the server chassis 101. Similarly, the server blades 201 to 204 on the server chassis 102 are used for the virtual switches 5 to 8, and the server blades 201 to 204 on the server chassis 103 are used for the virtual switches 9 to 12.
  • FIG. 13 is a virtual switch-downstream port assignment table in the MR-PCIe switch 54 on the IO chassis 121. Downstream ports 1 to 8 of the PCIe switch of the IO chassis 121 are connected to the PCIe slots 141 to 148. The virtual downstream ports 1 to 8 of the virtual switches 1 to 12 of the IO chassis 121 are connected to the physical downstream ports 1 to 8.
  • Each of the allocation tables shown in FIGS. 9 to 13 is created by processing means (CPU and software executed therein) in the management console 32 and transferred to the management microcomputer 51 in the MR-PCIe switch.
  • the server blades 201 to 204 of the server chassis 101 to 103 can share the PCIe slots 141 to 148 of the IO chassis 121.
  • switch Allocation Management in Example 3 switch allocation using the switch allocation management tables 53 and 54 in the information processing system (FIG. 4) according to the third embodiment will be described with reference to FIGS.
  • the downstream ports 1, 2, and 3 of the server chassis 101 are connected to the upstream ports 1 of the IO chassis 121, 122, and 123, respectively.
  • downstream ports 1, 2, and 3 of the server chassis 102 are connected to the upstream port 2 of the IO chassis 121, 122, and 123, respectively, and the downstream ports 1, 2, and 3 of the server chassis 103 are connected to the IO chassis 121, 122, respectively. , 123 are connected to upstream ports 3 respectively.
  • FIG. 14 is an upstream port-virtual switch allocation table 53 in the MR-PCIe switch 253 on the server chassis 101-103.
  • the server blade 201 connected to the upstream port 1 uses the virtual switch 1.
  • the server blades 202, 203, and 204 connected to the upstream ports 2, 3, and 4 use the virtual switches 2, 3, and 4, respectively.
  • FIG. 15 is a virtual switch-downstream port assignment table 54 in the MR-PCIe switch 25 on the server chassis 101-103.
  • the virtual downstream ports 1 of the virtual switches 1 to 4 are connected to the virtual ports 1 to 4 of the physical downstream port 1.
  • the virtual downstream ports 2, 3, and 4 of the virtual switches 1 to 4 are connected to the virtual ports 1 to 4 of the physical downstream ports 2, 3, and 4, respectively.
  • the server blades 201 to 204 share the downstream ports 1 to 3 of the MR-PCIe switch 25 on the server chassis 101 to 103, and the server blades 201 to 204 use the virtual ports 1 to 4. can do.
  • FIG. 16 is an upstream port-virtual switch allocation table 53 in the MR-PCIe switch 13 on the IO chassis 121-123. Since the upstream port 1 of the IO chassis 121 to 123 is connected to the downstream port 1 of the server chassis 101 and the downstream port 1 of the server chassis 101 is shared by the server blades 201 to 204, the virtual switch of the IO chassis 121 1 to 4 can be used by the server blades 201 to 204 on the server chassis 101. Similarly, the server blades 201 to 204 on the server chassis 102 can use the virtual switches 5 to 8 and the server blades 201 to 204 on the server chassis 103 can use the virtual switches 9 to 12.
  • FIG. 17 is a virtual switch-downstream port assignment table 54 in the MR-PCIe switch 13 on the IO chassis 121. Downstream ports 1-8 of the PCIe switch on the IO chassis are connected to PCIe slots 141-148. The virtual downstream ports 1 to 8 of the virtual switches 1 to 12 of the IO chassis 121 are connected to the physical downstream ports 1 to 8.
  • Each of the allocation tables shown in FIGS. 14 to 17 is created by processing means (CPU and software executed therein) in the management console 32 and transferred to the management microcomputer 51 in the MR-PCIe switch.
  • the server blades 201 to 204 of the server chassis 101 to 1-3 are set to share the PCIe slots of the IO chassis 121 to 8-3.
  • sharing of the PCIe cable and the PCIe wiring will be described.
  • Example 2 is cited.
  • the MR-PCIe switch adds a virtual port number 1802 as a tag to the PCIe packet 1801 shown in FIG. This virtual port number is added based on the virtual switch-downstream port assignment table 54 described above. For example, as shown in FIG. 19, the PCIe packet A issued from the server blade 201 on the server chassis 101 enters the upstream port 1 of the MR-PCIe switch 25.
  • the virtual switch 1 is entered according to the upstream port-virtual switch assignment table 53 and further sent to the virtual port 1 of the downstream port 1 according to the virtual switch-downstream port assignment table 54.
  • the PCIe packet A is issued with the virtual port “1” attached to the tag, and is sent to the PCIe cable between the server chassis 101 and the IO chassis 121.
  • the PCIe packet enters the MR-PCIe switch 13 on the IO chassis 121 and enters the virtual switch 1 according to the upstream port-virtual switch assignment table 53.
  • routing is performed by an address or RID according to the PCIe specification, and is sent to the virtual port 1, for example.
  • the PCIe packet B issued from the server blade 201 on the server chassis 101 is issued with the virtual port “2” attached to the tag and sent to the PCIe cable 15 between the server chassis 101 and the IO chassis 121. . Then, it is issued with the tag of the virtual port “2” and sent from the MR-PCIe switch 13 to the PCIe slot 141.
  • the PCIe packet C issued from the server blade 201 on the server chassis 102 is issued with a virtual port “1” attached to the tag, and is sent to the PCIe cable 15 between the server chassis 102 and the IO chassis 121.
  • the PCIe packet D issued from the server blade 202 on the server chassis 102 is issued with a virtual port “1” attached to the tag, and is sent to the PCIe cable 15 between the server chassis 102 and the IO chassis 121. From the MR-PCIe switch 13, the virtual port “6” is added to the PCIe slot 141.
  • the user operates the management console 32 and inputs the system configuration to be constructed to the switch management microcomputer.
  • the user inputs the ID and IP address of each server chassis and the ID and IP address of each IO chassis from the management console 32.
  • These assignments are as shown in FIG. 20 and are registered in the storage means in the management console 32.
  • the management console 32 checks the LAN connection to see if it can communicate with the management microcomputer 51 of each server chassis and IO chassis (FIG. 23).
  • the user inputs information related to the server chassis and expansion IO chassis belonging to the system (server group) from the management console 32, and registers the information in the storage means (FIG. 21).
  • the server group refers to a group of server chassis and expansion IO chassis connected by an MR-PCIe cable (each group as shown in FIG. 1, FIG. 3, or FIG. 4).
  • the user registers, from the management console 32, which server blade on which server chassis each PCIe slot on the IO chassis shares with the storage means (FIG. 22).
  • the management console 32 creates an upstream port-virtual switch allocation table 53 and a virtual switch-upstream port allocation table 54 based on the registration information, and stores these allocation tables in the MR-PCIe switch 25 on the server chassis 10, and This is distributed to each management microcomputer 51 in the MR-PCIe switch 13 on the IO chassis.
  • Each switch management microcomputer 51 determines the server chassis ID, IO chassis ID, and port number to which the connected switch belongs, based on this allocation table. Thereafter, the management microcomputer 51 on the server chassis displays the indicator (for example, LED) mounted on the port and the connection status of the PCIe cable to the user while communicating with the management microcomputer 51 on the IO chassis. Instruct.
  • the management microcomputer 51 on the server chassis refers to the server group port connection allocation table (FIG. 22) distributed from the management console, and the server chassis 101 downstream port “1” and the IO chassis 121 upstream port. Instructs connection of “1”.
  • the management microcomputer 51 checks the connection state of the link of these two ports to confirm whether they are connected correctly. This check is performed based on whether or not the management microcomputer 51 can recognize a unique ID preset in each port. As a result of the connection check, when the connection is correct, the green LED mounted on the port is turned off, and the process proceeds to the next cable check. That is, it instructs to connect the downstream port “1” of the server chassis 101 and the upstream port “2” of the IO chassis 121.
  • the green LED mounted on the two ports is turned on. Further, when the connection is wrong, the LED mounted on the two ports connected incorrectly is lit in red. When link down is confirmed by removing the cable, the green LEDs of the two ports to be originally connected are turned on. Thereafter, when the correct connection is confirmed, the green LED is turned off, and the next cable check, that is, the connection between the downstream port “1” of the server chassis 101 and the upstream port “2” of the IO chassis 121 is instructed. In this way, while updating the downstream port numbers 1 to i of the server chassis 101 and the upstream port numbers 1 to j of the IO chassis 121, all the upstream ports registered in the allocation table of FIG.
  • the management microcomputer 51 of the server chassis 101 instructs connection between the downstream port 2 of the server chassis 101 and the upstream port 1 of the IO chassis 122. Similarly, all the ports are connected by instructing the user to connect using the LEDs.
  • FIG. 1 is a configuration diagram of an information processing system according to Embodiment 1.
  • FIG. 1 is a configuration diagram of a server chassis 10 in an information processing system according to a first embodiment.
  • FIG. 6 is a configuration diagram of an information processing system according to a second embodiment.
  • FIG. 10 is a configuration diagram of an information processing system according to a third embodiment.
  • the block diagram of MR-PCIe switch. 6 is a diagram illustrating an upstream port-virtual switch allocation table 53 in the MR-PCIe switch 25 of the server chassis 10 according to the first embodiment.
  • FIG. FIG. 6 is a diagram showing a virtual switch-downstream port assignment table 54 in the MR-PCIe switch 25 of the server chassis 10 according to the first embodiment.
  • FIG. 6 is a diagram illustrating an upstream port-virtual switch allocation table 53 in the MR-PCIe switch 13 of the IO chassis 12 according to the first embodiment.
  • FIG. 6 is a diagram illustrating a virtual switch-downstream port assignment table 54 in the MR-PCIe switch 13 of the IO chassis 12 according to the first embodiment.
  • FIG. 10 is a diagram illustrating an upstream port-virtual switch allocation table 53 in the MR-PCIe switch 25 of the server chassis 10 according to the second embodiment. The figure which shows the virtual switch-downstream port allocation table 54 in MR-PCIe switch 25 of the server chassis 10 in Example 2.
  • FIG. 6 is a diagram illustrating an upstream port-virtual switch allocation table 53 in the MR-PCIe switch 13 of the IO chassis 12 according to the first embodiment.
  • FIG. 10 is a diagram illustrating an upstream port-virtual switch allocation table 53 in the MR-PCIe switch 25 of the server chassis 10 according to the second embodiment.
  • FIG. 10 is a diagram illustrating an upstream port-virtual switch allocation table 53 in the MR-PCIe switch 13 of the IO chassis 12 according to the second embodiment.
  • FIG. 10 is a diagram illustrating a virtual switch-downstream port assignment table 54 in the MR-PCIe switch 13 of the IO chassis 12 according to the second embodiment.
  • FIG. 10 is a diagram illustrating an upstream port-virtual switch allocation table 53 in the MR-PCIe switch 25 of the server chassis 10 according to the third embodiment.
  • FIG. 10 is a diagram illustrating a virtual switch-downstream port assignment table 54 in the MR-PCIe switch 25 of the server chassis 10 according to the third embodiment.
  • FIG. 10 is a diagram illustrating an upstream port-virtual switch allocation table 53 in the MR-PCIe switch 13 of the IO chassis 12 according to the third embodiment.
  • 10 is a diagram illustrating a virtual switch-downstream port assignment table 54 in the MR-PCIe switch 13 of the IO chassis 12 according to the third embodiment.
  • FIG. The figure which shows the structure of a multi-route transaction packet. The figure which shows the example of routing of a multi-route transaction packet. The figure which shows the allocation table of server chassis ID-IP address and IO chassis-IP address. The figure which shows the server chassis ID and IO chassis ID allocation table to a server group. The figure which shows the sharing map of a PCIe slot. The figure which shows the operation example of a connection check of a server chassis and IO chassis. The figure which shows the example of IO expansion in the conventional computer system.

Abstract

 単一の情報処理装置において、多くの入出力装置を接続可能なシステム、複数のサーバから入出力装置を共有する安価なシステムを柔軟に実現する。 サーバシャーシは、プロセッサ、メモリ、及びルートコンプレックスを持つ複数のサーバブレードと、各サーバブレードと接続される第1のマルチルート対応PCIeスイッチを有し、IOシャーシは、入出力装置が装着される複数のPCIeスロットと、各PCIe スロットと接続される第2のマルチルート対応PCIeスイッチを有する、情報処理システムにおいて、第1のマルチルート対応PCIeスイッチと第2のマルチルート対応PCIeスイッチをPCIeケーブルで接続する。

Description

情報処理システム
 本発明は、情報処理システムに係り、特に、PCIe(Peripheral Component Interconnect Express)規格を用いて、コンピュータと複数の入出力装置(IO)を接続して、IO集約や共有、拡張を実現する情報処理システム、及び情報処理システムにおけるPCIeケーブルの接続確認方法に関するものである。
 大規模な情報処理システムにおいて、1つコンピュータに多くのIOを接続する場合、一般的に、拡張IOシャーシを用いて多数のIOを搭載している。例えば、図24に示すような、コンピュータシステムにおいて、メモリ2401及びCPU2402、ルートコンプレックス2403、PCIeスロット2404を有するサーバシャーシ240と、PCIeスイッチ2421及びPCIeスロット2422を有する拡張IOシャーシ242を接続する場合、サーバシャーシ240のPCIeスロット2404に、パススルーカードを接続し、そのパススルーカードと拡張IOシャーシ242の間をPCIeケーブル244で接続することによって、IOの拡張を実現している。
 また、コンピュータシステムの原価を低減するために、1つのIOを複数のコンピュータで共有したいという要求がある。そのために、マルチルートPCIe技術を用いて、サーバシャーシ内にて複数のサーバブレードから1つのIOを共有する。例えば、従来、1つのコンピュータで専有することしか出来なかったIOを、複数のコンピュータから発行されたトランザクションに、そのトランザクションの発行元のコンピュータを示すタグをつけることにより、複数のコンピュータからの共有を実現する。
PCIe技術を使用した情報処理システムに関して、例えば、特許文献1には、1つのホストCPUセット310がPCルートコンプレックス350及びPCIeスイッチ360を介してPCIeエンドポイント370-390に接続して、PCIルートコンプレックスの入出力を仮想化する手法(図3)や、複数のホストシステム1010,1020がMRAスイッチを介して、そのエンドポイントである仮想プレーン1040,1050に接続したコンピュータシステム(図10)が開示されている。
特開2008-152783公報
マルチルートPCIe技術は、コスト削減のため、IOリソースを共有することで、効率的に使用することを目的とした技術であり、従来、マルチルートPCIeに対応した拡張IOを持つ筐体とケーブル接続をしてIOを拡張することが出来なかった。また、マルチルートPCIeに対応した拡張IOの筐体を複数のサーバシャーシとケーブル接続して共有する構成も実現されていない。また、拡張IOの筐体によってIOを拡張することは可能であるが、IOを共有する具体的な技術的手段は実現していない。
また、上記特許文献1に記載された、PCIe技術を利用したデータ処理システムはいずれも、同じマルチルート・ブレード・クラスタ・システム内の個別のブレードに関するものであり、当該ブレードを有するコンピュータが、IOシャーシとどのように接続される、及び複数のコンピュータと1つIOシャーシとの接続、更には1のコンピュータと複数のIOシャーシとの接続等については、何ら記載されていない。
本発明の目的は、多数のIOの接続を可能とし、かつ複数のサーバから多数のIOを共有することが可能な、PCIe技術を利用した情報処理システム及びPCIeケーブルの接続確認を実現することにある。
 本発明は、好ましくは、プロセッサ、メモリ、及びルートコンプレックスを持つ複数のサーバブレードと、該サーバブレードと接続される第1のマルチルート対応PCIeスイッチを有するサーバシャーシと、
入出力装置が装着される複数のPCIeスロットと、該PCIe スロットと接続される第2のマルチルート対応PCIeスイッチを有するIOシャーシとを備え、該第1のマルチルート対応PCIeスイッチと該第2のマルチルート対応PCIeスイッチをPCIeケーブルで接続してなる情報処理システムである。
好ましい例では、1台の前記サーバシャーシの前記第1のマルチルート対応PCIeスイッチは、複数の前記IOシャーシの第2のマルチルート対応PCIeスイッチに接続される。
また、好ましい他の例によれば、複数の前記サーバシャーシの前記第1のマルチルート対応PCIeスイッチは、1台の前記IOシャーシの第2のマルチルート対応PCIeスイッチに接続される。
また、好ましい他の例によれば、複数の前記サーバシャーシの前記第1のマルチルート対応PCIeスイッチは、複数の前記IOシャーシの第2のマルチルート対応PCIeスイッチに接続される。
また、好ましくは、前記第1のマルチルート対応PCIeスイッチは、前記サーバブレードが接続される複数の上流ポートと、複数の下流ポートと、複数の仮想スイッチと、該複数の上流スイッチと該複数の仮想スイッチの接続を切り替える上流スイッチと、該複数の仮想スイッチと該複数の下流ポートの接続を切り替える下流スイッチと、該複数の上流スイッチと該複数の仮想スイッチの接続の割当てを管理する上流ポート-仮想スイッチ割当表と、該複数の仮想スイッチと該複数の下流ポートの接続の割当てを管理する仮想スイッチ-下流ポート割当表と、該上流ポート-仮想スイッチ割当表及び該仮想スイッチ-下流ポート割当表の設定を管理する第1の管理マイコンを有し、該上流ポート-仮想スイッチ割当表によって該上流スイッチの切り替えを制御し、該仮想スイッチ-下流ポート割当表によって該下流スイッチの切り替えを制御して、該サーバシャーシのサーバブレードと前記IOシャーシの前記第2のマルチルート対応PCIeスイッチとを接続する。
また、好ましくは、前記第2のマルチルート対応PCIeスイッチは、前記第1のマルチルート対応PCIeスイッチと接続される複数の上流ポートと、該IOシャーシのPCIeスロットと接続される複数の下流ポートと、複数の仮想スイッチと、該複数の上流スイッチと該複数の仮想スイッチの接続を切り替える上流スイッチと、該複数の仮想スイッチと該複数の下流ポートの接続を切り替える下流スイッチと、該複数の上流スイッチと該複数の仮想スイッチの接続の割当てを管理する上流ポート-仮想スイッチ割当表と、該複数の仮想スイッチと該複数の下流ポートの接続の割当てを管理する仮想スイッチ-下流ポート割当表と、該上流ポート-仮想スイッチ割当表及び該仮想スイッチ-下流ポート割当表の設定を管理する第2の管理マイコンを有し、該上流ポート-仮想スイッチ割当表によって該上流スイッチの切り替えを制御し、該仮想スイッチ-下流ポート割当表によって該下流スイッチの切り替えを制御して、該サーバシャーシのサーバブレードの前記第1のマルチルート対応PCIeスイッチと該IOシャーシのPCIeスロットとを接続する。
また、好ましくは、前記第1及び第2の管理マイコンは、LANケーブルを介して管理コンソールに接続され、該管理コンソールから入力される設定情報に基づき、該第1及び第2の管理マイコンは、前記上流ポート-仮想スイッチ割当表及び前記仮想スイッチ-下流ポート割当表を作成する。
 本発明に係るPCIeケーブルの接続確認方法は、好ましくは、サーバシャーシに備えられた、サーバブレードと接続される第1のマルチルート対応PCIeスイッチと、IOシャーシに備えられた、入出力装置が装着される複数のPCIeスロットと接続される第2のマルチルート対応PCIeスイッチの間を、PCIeケーブルで接続してなる情報処理システムにおけるPCIeケーブルの接続確認方法であって、前記第1及び第2のマルチルート対応PCIeスイッチが有する管理マイコンの実行の下、予め設定された、上流ポート-仮想スイッチの割当てを規定する第1割当表と、仮想スイッチ-下流ポートの割当てを規定する第2割当表に基づいて、各ポートが対象となるポートに正しく接続されているかを順次確認し、
該確認の結果を、対象となるポートに実装された表示子に表示することを特徴とするPCIeケーブルの接続確認方法として構成される。
また、好ましい例では、前記第1管理表及び前記第2管理表は、該サーバブレード及びIOシャーシに接続された管理コンソールで作成され、該管理コンソールから各該サーバブレード及びIOシャーシへ配信される。
 本発明によれば、システムの要求に応じて、多数のIOの接続することが可能でかつ1又は複数のサーバから多数のIOを共有することが可能な、PCIe技術を利用した情報処理システムを実現することができる。すなわち、サーバシャーシ内の複数のサーバブレードを集約する第1のMR-PCIeスイッチと、複数のI/Oを接続可能な第2のMR-PCIeスイッチとをPCIeケーブル配線を接続することで、1又は複数のサーバブレードが1又は複数のIOシャーシを共有することが可能となる。
 以下、図面を用いて本発明の実施例を詳細に説明する。
[実施例1]
 図1はIO拡張した情報処理システムの構成例を示す。
1台のサーバシャーシ10は、PCIeケーブル15を介して3台のIOシャーシ121~123(総称して12と示す)と接続される。サーバシャーシ10の具体的な構成は後述するが、サーバシャーシ10は、主に4つのサーバブレード201~204と、マルチルート(MR)-PCIeスイッチ25を有し、このMR-PCIeスイッチ25によって、複数のIOシャーシ12と接続される。
IOシャーシ12は、それぞれMR-PCIeスイッチ13と、IOを搭載する8個のPCIeスロット141~148(総称して14と示す)を有する。IOシャーシ12の各MR-PCIeスイッチ13は、PCIeケーブル15によりサーバシャーシ10のMR-PCIeスイッチ25と接続される。
この接続構成によって、サーバシャーシ1内のサーバブレード201~204は、最大24個のPCIeスロット(8個のPCIeスロット×3台のIOシャーシ)に対しアクセスすることが可能となる。
また、サーバシャーシ10及びIOシャーシ12の各MR-PCIeスイッチ25,13は、LANスイッチ31を介して管理コンソール32に接続される。管理コンソール32は、例えばパーソナルコンピュータで構成され、入出力機能及びハードディスク等の記憶手段を有する。
ユーザ(システム管理者)は、管理コンソール32を操作して、サーバシャーシ10とIOシャーシ12との接続構成を構築し、またIOスロット14へのIOの装着を監視することができる。
  図2は、サーバシャーシ10の詳細な構成例を示す。
サーバシャーシ10は、4台のサーバブレード201~204(総称して20と示す)と、バックプレーン24と、MR-PCIeスイッチ25を有して構成される。サーバブレード20は、メモリ21、プロセッサ(CPU)22、CUPを接続するための複数のPCIeポートを持つルートコンプレックス23を有する。バックプレーン24は、サーバブレード20内のルートコンプレックス23とMR-PCIeスイッチ25を接続する。
サーバシャーシ10には最大4台のサーバブレード20が実装可能であるが、必ずしも最大4台のサーバブレードが装着されている必要はない。
[実施例2]
 図3は、複数のサーバシャーシが1台のIOを共有する情報処理システムの構成例である。
3台のサーバシャーシ101~103(総称して10と示す)が、PCIeケーブル15を介して1台のIOシャーシ121に接続して、情報処理システムが構成される。サーバシャーシ10及びIOシャーシ13の構成、LANスイッチ31、管理コンソール32等は、図1及び図2に示したものと同じである。
各サーバシャーシ10は、それぞれ4台のサーバブレード20を有するので、最大12台のサーバブレード20から、IOシャーシ121内の8個のPCIeスロット14(即ち8台のIO)を共有することが可能である。
[実施例3]
 図4は、複数のサーバシャーシ101~103が複数のIO121-123を共有する情報処理システムの構成例である。なお、サーバシャーシ10及びIOシャーシ13の構成は、図1及び図2に示したものと同じである。LANスイッチ31や管理コンソール32の図示は省略してある。
この構成によれば、1台のサーバブレード201が、それぞれのPCIeスロット14を使用して、最大24個のIOと接続することが可能である。また、1個のPCIeスロット14を最大12台のサーバブレード20で共有することが可能となる。
 サーバシャーシ10のMR-PCIeスイッチ(第1のMR-PCIeスイッチ)と、IOシャーシ12の(第2のMR-PCIeスイッチ)とをPCIeケーブルで接続することにより、システム(ユーザ)の要求により、接続するサーバシャーシ数、拡張IOシャーシ数を柔軟に変更することが出来る。また、第1及び第2からなる2段のMR-PCIeスイッチにより、サーバブレードとPCIeスロットの接続を柔軟に行えるようになる。
 図5は、MR-PCIeスイッチの詳細な構成を示す。
サーバシャーシ10及びIOシャーシ12内のマルチルートPCIeスイッチ25、13は、それぞれが持つポートの接続先が異なるが、内部の構成は同じである。
MR-PCIeスイッチは、スイッチの設定を管理する管理マイコン(マイクロCPU)51と、スイッチLSI52を有する。
スイッチLSI52は、4つの上流ポートと、8つの下流ポートを持ち、MR-PCIeスイッチの機能を実現する。その内部構成として、16個の仮想スイッチ57と、上流ポートと仮想スイッチ57を接続する上流接続スイッチ15と、仮想スイッチ57と下流ポートとを接続する下流スイッチ16と、上流ポートと仮想スイッチ57の割当てを管理する上流ポート-仮想スイッチ割当表53と、仮想スイッチ57と下流ポートの割当てを管理する仮想スイッチ-下流スイッチ割当表54を有する。
管理マイコン51は、またLANスイッチ31に接続され、システム(ユーザ)の要求により管理コンソール32からの指示によって、管理マイコン51の制御の下、管理表53,54の内容が設定、変更される。
[実施例1におけるスイッチの割当管理]
次に、図6~図9を参照して、実施例1の情報処理システム(図1)におけるスイッチ割当管理表53,54を用いたスイッチの割当てについて説明する。
ここで、サーバシャーシ101のMR-PCIeスイッチ25は4つの上流ポートを使用して4つのサーバブレードに接続可能であり、また4つの下流ポートを使用して4つのIOシャーシに接続可能であるが、以下の説明では、MR-PCIeスイッチ25の上流ポートには1つのサーバブレード201が接続され、また3つの下流ポートを使用して3つのIOシャーシ12のMR-PCIeスイッチ13が接続されるものとする。
 図6は、サーバシャーシ101のMR-PCIeスイッチ25内の上流ポート-仮想スイッチ割当表53である。1つの上流ポート1に接続されるサーバブレード201が、1つの仮想スイッチ1を使用することを示している。
 図7は、同じく、サーバシャーシ101のMR-PCIeスイッチ25内の仮想スイッチ-下流ポート割当表54である。仮想スイッチ1の各仮想下流ポート1~4が物理的な下流ポート1~4に接続されている。
 図6及び図7のポートの割当てにより、例えばサーバブレード201がサーバシャーシ10上のMR-PCIeスイッチ25の下流ポート1~4を占有することが可能となる。
 図8は、IOシャーシ121~123にあるMR-PCIeスイッチ13内の上流ポート-仮想スイッチ割当表53である。IOシャーシ121の上流ポート1がサーバシャーシ10の下流ポート1と接続されているため、IOシャーシ121の仮想スイッチ1はサーバブレード201が使用する。同様に、IOシャーシ122、123内の仮想スイッチ1もサーバブレード201が使用する。
 図9は、IOシャーシ121~123にあるMR-PCIeスイッチ13内の仮想スイッチ-下流ポート割当表54である。IOシャーシ上のPCIeスイッチ13の下流ポート1~8は、PCIeスロット141~148に接続される。IOシャーシ121の仮想スイッチの各仮想下流ポート1~8は、物理的な下流ポート1~8に接続されている。
図6~図8に示される各割当表は、管理コンソール32内の処理手段(CPU及びそこで実行されるソフトウェア)によって作成され、MR-PCIeスイッチ内の管理マイコン51に転送される。
 上記の割当てにより、1台のサーバブレード201は、3台のIOシャーシ121~123の全てのPCIeスロット(即ち合計24個のIO)を使用することが可能となる。
[実施例2におけるスイッチの割当管理]
次に、図10~図13を参照して、実施例2の情報処理システム(図3)におけるスイッチ割当管理表53,54を用いたスイッチの割当てについて説明する。
 図10は、サーバシャーシ101~103上のMR-PCIeスイッチ25内の上流ポート-仮想スイッチ割当表53である。上流ポート1に接続されるサーバブレード201が仮想スイッチ1を使用する。同様に、上流ポート2,3,4に接続されるサーバブレード202,203,204が仮想スイッチ2、3、4を使用することを示している。
 図11は、サーバシャーシ101~102上のMR-PCIeスイッチ25内の仮想スイッチ-下流ポート割当表54である。仮想スイッチ1~4の各仮想下流ポート1が物理的な下流ポート1の仮想ポート1~4に接続されている。
 図10、図11のポートの割当てにより、サーバブレード201~204がサーバシャーシ101-103上のMR-PCIeスイッチ53の下流ポート1を共有し、サーバブレード201~204が仮想ポート1~4を使用することが可能となる。
 図12は、IOシャーシ121上のMR-PCIeスイッチ13内の上流ポート-仮想スイッチ割当表53である。IOシャーシ121の上流ポート1がサーバシャーシ101の下流ポート1と接続されているため、また、サーバシャーシ101の下流ポート1は、サーバブレード201~204で共有されているため、IOシャーシ121の仮想スイッチ1~4はサーバシャーシ101上のサーバブレード201~204が使用する。同様に、仮想スイッチ5~8は、サーバシャーシ102上のサーバブレード201~204が使用し、仮想スイッチ9~12は、サーバシャーシ103上のサーバブレード201~204が使用する。
 図13は、IOシャーシ121上のMR-PCIeスイッチ54内の仮想スイッチ-下流ポート割当表である。IOシャーシ121のPCIeスイッチの下流ポート1~8は、PCIeスロット141~148に接続される。IOシャーシ121の各仮想スイッチ1~12の仮想下流ポート1~8は、物理的な下流ポート1~8に接続されている。
図9~図13に示される各割当表は、管理コンソール32内の処理手段(CPU及びそこで実行されるソフトウェア)によって作成され、MR-PCIeスイッチ内の管理マイコン51に転送される。
 以上の設定により、サーバシャーシ101~103のサーバブレード201~204はIOシャーシ121の各PCIeスロット141~148を共有することができる。
 [実施例3におけるスイッチの割当管理]
次に図14~17を参照して、実施例3の情報処理システム(図4)におけるスイッチ割当管理表53,54を用いたスイッチの割当てについて説明する。
この例では、サーバシャーシ101の下流ポート1,2,3が、IOシャーシ121,122,123の上流ポート1にそれぞれ接続している。同様に、サーバシャーシ102の下流ポート1,2,3が、IOシャーシ121,122,123の上流ポート2にそれぞれ接続し、サーバシャーシ103の下流ポート1,2,3が、IOシャーシ121,122,123の上流ポート3にそれぞれ接続している。
 図14は、サーバシャーシ101~103上のMR-PCIeスイッチ253内の上流ポート-仮想スイッチ割当表53である。上流ポート1に接続されるサーバブレード201が仮想スイッチ1を使用する。同様に、上流ポート2,3,4に接続されるサーバブレード202,203,204が、仮想スイッチ2,3,4をそれぞれ使用する。
 図15は、サーバシャーシ101~103上のMR-PCIeスイッチ25内の仮想スイッチ-下流ポート割当表54である。仮想スイッチ1~4の各仮想下流ポート1が、物理的な下流ポート1の仮想ポート1~4に接続されている。同様に、仮想スイッチ1~4の各仮想下流ポート2,3,4が、物理的な下流ポート2,3,4の仮想ポート1~4にそれぞれ接続されている。
 図14、図15の設定により、サーバブレード201~204がサーバシャーシ101~103上のMR-PCIeスイッチ25の下流ポート1~3を共有し、サーバブレード201~204が仮想ポート1~4を使用することができる。
 図16は、IOシャーシ121~123上のMR-PCIeスイッチ13内の上流ポート-仮想スイッチ割当表53である。IOシャーシ121~123の上流ポート1がサーバシャーシ101の下流ポート1に接続され、かつ、サーバシャーシ101の下流ポート1が、サーバブレード201~204で共有されているため、IOシャーシ121の仮想スイッチ1~4をサーバシャーシ101上のサーバブレード201~204が使用することができる。同様に、仮想スイッチ5~8をサーバシャーシ102上のサーバブレード201~204が使用し、仮想スイッチ9~12をサーバシャーシ103上のサーバブレード201~204が使用することができる。
 図17は、IOシャーシ121上のMR-PCIeスイッチ13内の仮想スイッチ-下流ポート割当表54である。IOシャーシ上のPCIeスイッチの下流ポート1~8は、PCIeスロット141~148に接続される。IOシャーシ121の各仮想スイッチ1~12の仮想下流ポート1~8は、物理的な下流ポート1~8に接続される。
図14~図17に示される各割当表は、管理コンソール32内の処理手段(CPU及びそこで実行されるソフトウェア)によって作成され、MR-PCIeスイッチ内の管理マイコン51に転送される。
 以上により、サーバシャーシ101~1-3のサーバブレード201~204がIOシャーシ121~8-3の各PCIeスロットを共有する設定となる。
[PCIeケーブル及びPCIe配線の共有化]
 次に、PCIeケーブル及びPCIe配線の共有化について説明する。この説明では、実施例2を引用する。
MR-PCIeスイッチは、図18に示す、PCIeパケット1801にタグとして仮想port番号1802を付加する。この仮想port番号は前記の仮想スイッチ-下流ポート割当表54に基づいて付加される。
例えば、図19に示すように、サーバシャーシ101上のサーバブレード201から発行されたPCIeパケットAは、MR-PCIeスイッチ25の上流ポート1に入る。上流ポート-仮想スイッチ割当表53に従って仮想スイッチ1に入り、さらに仮想スイッチ-下流ポート割当表54に従って下流ポート1の仮想ポート1に送られる。この時、PCIeパケットAはそのタグに仮想ポート「1」を付けて発行され、サーバシャーシ101とIOシャーシ121間のPCIeケーブルへ送出される。
更に、このPCIeパケットはIOシャーシ121上のMR-PCIeスイッチ13に入り、上流ポート-仮想スイッチ割当表53に従って仮想スイッチ1に入る。仮想スイッチ1内では、PCIeの仕様に従い、アドレスもしくはRIDによりルーティングされ、例えば、仮想ポート1に送られる。そして、仮想スイッチ-下流ポート割当表54に従って下流ポート1の仮想ポート1に送られる。
同様に、サーバシャーシ101上のサーバブレード201から発行されたPCIeパケットBは、そのタグに仮想ポート「2」を付けて発行され、サーバシャーシ101とIOシャーシ121間のPCIeケーブル15に送出される。そして、仮想ポート「2」のタグを付けて発行され、MR-PCIeスイッチ13からPCIeスロット141に送られる。
サーバシャーシ102上のサーバブレード201から発行されたPCIeパケットCは、そのタグに仮想ポート「1」を付けて発行され、サーバシャーシ102とIOシャーシ121間のPCIeケーブル15に送出される。そして、仮想ポート「5」のタグを付けて発行され、MR-PCIeスイッチ13からPCIeスロット141に送られる。
サーバシャーシ102上のサーバブレード202から発行されたPCIeパケットDは、そのタグに仮想ポート「1」を付けて発行され、サーバシャーシ102とIOシャーシ121間のPCIeケーブル15に送出され、IOシャーシ121のMR-PCIeスイッチ13から、仮想ポート「6」を付けてPCIeスロット141に送られる。
 次に、図22~図24を参照して、情報処理システムの構築する方法について説明する。例えば実施例2に(図3)において、ユーザは、管理コンソール32を操作して、構築したいシステム構成をスイッチ管理マイコンに入力する。そのために、ユーザは、管理コンソール32から各サーバシャーシのID及びIPアドレスの割当て、及び各IOシャーシのID及びIPアドレスの割当てを入力する。これらの割当ては、図20に示すようになり、管理コンソール32内の記憶手段に登録される。
管理コンソール32は、記憶手段に予め登録されたIPアドレスを基に、各サーバシャーシ、IOシャーシの管理マイコン51と通信できるかLANの接続チェックを行う(図23)。
次に、ユーザは、管理コンソール32からシステム(サーバグループ) に属するサーバシャーシ、拡張IOシャーシに関する情報を入力し、それらの情報を記憶手段に登録する(図21)。ここで、サーバグループとは、MR-PCIeケーブルで接続されているサーバシャーシ、拡張IOシャーシの纏まり(図1或いは図3、図4のようなそれぞれの纏まり)をいう。
さらに、ユーザは管理コンソール32からIOシャーシ上の各PCIeスロットがどのサーバシャーシ上のどのサーバブレードから共有するかを、記憶手段に登録する(図22)。
管理コンソール32は、上記登録情報を基に上流ポート-仮想スイッチ割当表53および仮想スイッチ-上流ポート割当表54を作成して、それらの割当表をサーバシャーシ10上のMR-PCIeスイッチ25、及びIOシャーシ上のMR-PCIeスイッチ13にある各管理マイコン51に配信する。各スイッチ管理マイコン51は、この割当表を基に、接続先のスイッチの属するサーバシャーシID、IOシャーシIDおよび、ポート番号を判断する。
その後、サーバシャーシ上の管理マイコン51は、IOシャーシ上の管理マイコン51と通信しながら、ユーザに対して、PCIeケーブルの接続状態を、ポートに実装された表示子(例えばLED)を表示することで指示する。
すなわち、サーバシャーシ上の管理マイコン51は、管理コンソールから配信されたサーバグループのポートの接続割当表(図22)を参照しながら、サーバシャーシ101の下流ポート“1”とIOシャーシ121の上流ポート“1”の接続を指示する。管理マイコン51は、この2つのポートのリンクの接続状態をチェックして、正しく接続されているか確認する。このチェックは、各ポートに予め設定された固有のIDが、管理マイコン51で認識できるか否かにより行われる。
上記接続チェックの結果、正しく接続されている時には、ポートに実装されている緑色LEDの点灯を消去して、次のケーブルのチェックに進む。即ち、サーバシャーシ101の下流ポート“1”とIOシャーシ121の上流ポート“2”の接続を指示する。
一方、上記接続チェックの結果、上記2つのポートがリンクしていない時は、上記2つのポートに実装されている緑色LEDを点灯させる。また、誤って接続している時には、誤って接続されている2つのポートに実装されているLEDを赤色点灯させる。ケーブル抜去により、リンクダウンが確認されたら、本来の接続すべき2つのポートの緑色LEDを点灯させる。その後、正しい接続が確認されたら、緑色LEDを消灯し、次のケーブルのチェック、即ち、サーバシャーシ101の下流ポート“1”とIOシャーシ121の上流ポート“2”の接続を指示する。
このようにして、サーバシャーシ101の下流ポートの番号1~iと、IOシャーシ121の上流ポートの番号1~jを順次更新しながら、図22の割当表に登録された全ての上流ポートと下流のポートについて接続チェックを行う。
次に、上記と同様にして、サーバシャーシ101の管理マイコン51はサーバシャーシ101の下流ポート2とIOシャーシ122の上流ポート1の接続を指示する。同様にLEDによりユーザに接続指示をすることで全ポート間の接続を行う。
実施例1による情報処理システムの構成図。 実施例1の情報処理システムにおけるサーバシャーシ10の構成図。 実施例2による情報処理システムの構成図。 実施例3による情報処理システムの構成図。 MR-PCIeスイッチの構成図。 実施例1におけるサーバシャーシ10のMR-PCIeスイッチ25内の上流ポート-仮想スイッチ割当表53を示す図。 実施例1におけるサーバシャーシ10のMR-PCIeスイッチ25内の仮想スイッチ-下流ポート割当表54を示す図。 実施例1におけるIOシャーシ12のMR-PCIeスイッチ13内の上流ポート-仮想スイッチ割当表53を示す図。 実施例1におけるIOシャーシ12のMR-PCIeスイッチ13内の仮想スイッチ-下流ポート割当表54を示す図。 実施例2におけるサーバシャーシ10のMR-PCIeスイッチ25内の上流ポート-仮想スイッチ割当表53を示す図。 実施例2におけるサーバシャーシ10のMR-PCIeスイッチ25内の仮想スイッチ-下流ポート割当表54を示す図。 実施例2におけるIOシャーシ12のMR-PCIeスイッチ13内の上流ポート-仮想スイッチ割当表53を示す図。 実施例2におけるIOシャーシ12のMR-PCIeスイッチ13内の仮想スイッチ-下流ポート割当表54を示す図。 実施例3におけるサーバシャーシ10のMR-PCIeスイッチ25内の上流ポート-仮想スイッチ割当表53を示す図。 実施例3におけるサーバシャーシ10のMR-PCIeスイッチ25内の仮想スイッチ-下流ポート割当表54を示す図。 実施例3におけるIOシャーシ12のMR-PCIeスイッチ13内の上流ポート-仮想スイッチ割当表53を示す図。 実施例3におけるIOシャーシ12のMR-PCIeスイッチ13内の仮想スイッチ-下流ポート割当表54を示す図。 マルチルートトランザクションパケットの構成を示す図。 マルチルートトランザクションパケットのルーティングの例を示す図。 サーバシャーシID―IPアドレス、IOシャーシ-IPアドレスの割当表を示す図。 サーバグループへのサーバシャーシID、IOシャーシID割当表を示す図。 PCIeスロットの共有マップを示す図。 サーバシャーシとIOシャーシの接続チェックの動作例を示す図。 従来のコンピュータシステムにおけるIO拡張の例を示す図。
符号の説明
10、101~103:サーバシャーシ
12,121~123:IOシャーシ 
201~204:サーバブレード 21:メモリ 22:CPU 23:ルートコンプレックス 24:バックプレーン
25,13:MR-PCIeスイッチ
14,141~148:PCIeスロット 15:PCIeケーブル
51:管理マイコン 52:MR-PCIeスイッチLSI
53:上流ポート-仮想スイッチ割当表
54:仮想スイッチ-下流ポート割当表
55:上流ポート-仮想スイッチ接続スイッチ
56:仮想スイッチ-下流ポート接続スイッチ
57:仮想スイッチ。

Claims (9)

  1.  プロセッサ、メモリ、及びルートコンプレックスを持つ複数のサーバブレードと、該サーバブレードと接続される第1のマルチルート対応PCIeスイッチを有するサーバシャーシと、
    入出力装置が装着される複数のPCIeスロットと、該PCIe スロットと接続される第2のマルチルート対応PCIeスイッチを有するIOシャーシとを備え、
    該第1のマルチルート対応PCIeスイッチと該第2のマルチルート対応PCIeスイッチをPCIeケーブルで接続してなる情報処理システム。
  2.  1台の前記サーバシャーシの前記第1のマルチルート対応PCIeスイッチは、複数の前記IOシャーシの第2のマルチルート対応PCIeスイッチに接続されることを特徴とする請求項1の情報処理システム。
  3.  複数の前記サーバシャーシの前記第1のマルチルート対応PCIeスイッチは、1台の前記IOシャーシの第2のマルチルート対応PCIeスイッチに接続されることを特徴とする請求項1の情報処理システム。
  4. 複数の前記サーバシャーシの前記第1のマルチルート対応PCIeスイッチは、複数の前記IOシャーシの第2のマルチルート対応PCIeスイッチに接続されることを特徴とする請求項1の情報処理システム。
  5. 前記第1のマルチルート対応PCIeスイッチは、前記サーバブレードが接続される複数の上流ポートと、複数の下流ポートと、複数の仮想スイッチと、該複数の上流スイッチと該複数の仮想スイッチの接続を切り替える上流スイッチと、該複数の仮想スイッチと該複数の下流ポートの接続を切り替える下流スイッチと、該複数の上流スイッチと該複数の仮想スイッチの接続の割当てを管理する上流ポート-仮想スイッチ割当表と、該複数の仮想スイッチと該複数の下流ポートの接続の割当てを管理する仮想スイッチ-下流ポート割当表と、該上流ポート-仮想スイッチ割当表及び該仮想スイッチ-下流ポート割当表の設定を管理する第1の管理マイコンを有し、
    該上流ポート-仮想スイッチ割当表によって該上流スイッチの切り替えを制御し、該仮想スイッチ-下流ポート割当表によって該下流スイッチの切り替えを制御して、該サーバシャーシのサーバブレードと前記IOシャーシの前記第2のマルチルート対応PCIeスイッチとを接続することを特徴とする請求項1乃至4のいずれかの項記載の情報処理システム。
  6. 前記第2のマルチルート対応PCIeスイッチは、前記第1のマルチルート対応PCIeスイッチと接続される複数の上流ポートと、該IOシャーシのPCIeスロットと接続される複数の下流ポートと、複数の仮想スイッチと、該複数の上流スイッチと該複数の仮想スイッチの接続を切り替える上流スイッチと、該複数の仮想スイッチと該複数の下流ポートの接続を切り替える下流スイッチと、該複数の上流スイッチと該複数の仮想スイッチの接続の割当てを管理する上流ポート-仮想スイッチ割当表と、該複数の仮想スイッチと該複数の下流ポートの接続の割当てを管理する仮想スイッチ-下流ポート割当表と、該上流ポート-仮想スイッチ割当表及び該仮想スイッチ-下流ポート割当表の設定を管理する第2の管理マイコンを有し、
    該上流ポート-仮想スイッチ割当表によって該上流スイッチの切り替えを制御し、該仮想スイッチ-下流ポート割当表によって該下流スイッチの切り替えを制御して、該サーバシャーシのサーバブレードの前記第1のマルチルート対応PCIeスイッチと該IOシャーシのPCIeスロットとを接続することを特徴とする請求項1乃至5のいずれかの項記載の情報処理システム。
  7. 前記第1及び第2の管理マイコンは、LANケーブルを介して管理コンソールに接続され、該管理コンソールから入力される設定情報に基づき、該第1及び第2の管理マイコンは、前記上流ポート-仮想スイッチ割当表及び前記仮想スイッチ-下流ポート割当表を作成することを特徴とする請求項5又は6の情報処理システム。
  8. サーバシャーシに備えられた、サーバブレードと接続される第1のマルチルート対応PCIeスイッチと、IOシャーシに備えられた、入出力装置が装着される複数のPCIeスロットと接続される第2のマルチルート対応PCIeスイッチの間を、PCIeケーブルで接続してなる情報処理システムにおけるPCIeケーブルの接続確認方法であって、
    前記第1及び第2のマルチルート対応PCIeスイッチが有する管理マイコンの実行の下、予め設定された、上流ポート-仮想スイッチの割当てを規定する第1割当表と、仮想スイッチ-下流ポートの割当てを規定する第2割当表に基づいて、各ポートが対象となるポートに正しく接続されているかを順次確認し、
    該確認の結果を、対象となるポートに実装された表示子に表示することを特徴とするPCIeケーブルの接続確認方法。
  9. 前記第1管理表及び前記第2管理表は、該サーバブレード及びIOシャーシに接続された管理コンソールで作成され、該管理コンソールから各該サーバブレード及びIOシャーシへ配信されることを特徴とする請求項8のPCIeケーブルの接続確認方法。
PCT/JP2009/000260 2009-01-23 2009-01-23 情報処理システム WO2010084529A1 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2010547311A JPWO2010084529A1 (ja) 2009-01-23 2009-01-23 情報処理システム
US13/145,065 US20120005392A1 (en) 2009-01-23 2009-01-23 Information processing system
PCT/JP2009/000260 WO2010084529A1 (ja) 2009-01-23 2009-01-23 情報処理システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2009/000260 WO2010084529A1 (ja) 2009-01-23 2009-01-23 情報処理システム

Publications (1)

Publication Number Publication Date
WO2010084529A1 true WO2010084529A1 (ja) 2010-07-29

Family

ID=42355609

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2009/000260 WO2010084529A1 (ja) 2009-01-23 2009-01-23 情報処理システム

Country Status (3)

Country Link
US (1) US20120005392A1 (ja)
JP (1) JPWO2010084529A1 (ja)
WO (1) WO2010084529A1 (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012150623A (ja) * 2011-01-19 2012-08-09 Hitachi Ltd 計算機システムおよびpciカードのhba識別子引き継ぎ方式
JP2014036240A (ja) * 2012-08-07 2014-02-24 Fujitsu Ltd 制御装置、方法及びプログラム、並びにシステム及び情報処理方法
JP2015516617A (ja) * 2012-03-15 2015-06-11 フジツウ テクノロジー ソリューションズ インタレクチュアル プロパティ ゲーエムベーハー モジュラサーバーシステム、i/oモジュール及びスイッチング方法
JP2016118955A (ja) * 2014-12-22 2016-06-30 富士通株式会社 通信システム,管理装置,制御装置及びプログラム
CN109190420A (zh) * 2018-09-11 2019-01-11 网御安全技术(深圳)有限公司 一种服务器加解密刀片、系统、及加解密方法

Families Citing this family (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011097497A (ja) * 2009-11-02 2011-05-12 Sony Corp データ転送装置
JP2012146235A (ja) * 2011-01-14 2012-08-02 Nec Corp 設置位置情報管理システム、ラック、管理対象機器および設置位置情報管理方法
US11308000B1 (en) * 2011-09-28 2022-04-19 Keysight Technologies, Inc. Configurable PCI-E interface module
US9197545B2 (en) 2012-05-18 2015-11-24 Benu Networks, Inc. Highly scalable modular system with high reliability and low latency
GB2502316A (en) * 2012-05-24 2013-11-27 Ibm Blade enclosure with interfaces for computer blades and conventional computers
US9086919B2 (en) 2012-08-23 2015-07-21 Dell Products, Lp Fabric independent PCIe cluster manager
US10380041B2 (en) 2012-08-23 2019-08-13 Dell Products, Lp Fabric independent PCIe cluster manager
US9519606B2 (en) * 2013-07-22 2016-12-13 GigaIO Networks, Inc. Network switch
JP6203272B2 (ja) * 2013-09-03 2017-09-27 株式会社アキブシステムズ I/oデバイスの仮想化のためのコンピュータシステム及びその運用方法並びにhub装置
WO2015123879A1 (zh) * 2014-02-23 2015-08-27 华为技术有限公司 实现网络虚拟化的方法及相关装置和通信系统
CN104765707A (zh) * 2015-04-15 2015-07-08 浪潮电子信息产业股份有限公司 一种基于Openpower平台的PCIe Gen3 IO扩展箱设计方法
US10615549B2 (en) * 2016-09-01 2020-04-07 Seagate Technology Llc Configured port-width indication for ganged-style connectors
TWI615720B (zh) * 2016-12-26 2018-02-21 創義達科技股份有限公司 資源分配系統、設備分配控制器以及設備識別方法
US11051422B2 (en) 2018-09-14 2021-06-29 Hewlett Packard Enterprise Development Lp Modular server design
US11537548B2 (en) * 2019-04-24 2022-12-27 Google Llc Bandwidth allocation in asymmetrical switch topologies
NL2029396B1 (en) * 2020-11-16 2022-11-09 Intel Corp Disaggregation of computing devices using enhanced retimers with circuit switching
US11714775B2 (en) * 2021-05-10 2023-08-01 Zenlayer Innovation LLC Peripheral component interconnect (PCI) hosting device

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004342109A (ja) * 2003-05-15 2004-12-02 Internatl Business Mach Corp <Ibm> 入出力ファブリックにおけるハードウェア・エラーからの自動回復
JP2007195166A (ja) * 2006-01-18 2007-08-02 Internatl Business Mach Corp <Ibm> 組み込みdidによるpciバス・アドレス・ベースのルーティング用ルーティング・テーブルを作成し、管理する方法、コンピュータ・プログラムおよび装置
JP2008152783A (ja) * 2006-12-19 2008-07-03 Internatl Business Mach Corp <Ibm> データ処理システム内で第1のホスト・システムと第2のホスト・システムとの間で通信するための方法、プログラム、およびシステム(トランザクション・プロトコルおよび共用メモリを使用するホスト・システム間の通信のためのシステムおよび方法)

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040223454A1 (en) * 2003-05-07 2004-11-11 Richard Schober Method and system for maintaining TBS consistency between a flow control unit and central arbiter in an interconnect device
JP4608559B2 (ja) * 2004-04-30 2011-01-12 株式会社日立製作所 ブレード割り当て方法及びブレード割り当てプログラム
JP4733399B2 (ja) * 2005-01-28 2011-07-27 株式会社日立製作所 計算機システム、計算機、ストレージ装置及び管理端末
US7694047B1 (en) * 2005-02-17 2010-04-06 Qlogic, Corporation Method and system for sharing input/output devices
JP4713902B2 (ja) * 2005-03-01 2011-06-29 株式会社日立製作所 ストレージシステム
US7293129B2 (en) * 2005-04-22 2007-11-06 Sun Microsystems, Inc. Flexible routing and addressing
JP4394624B2 (ja) * 2005-09-21 2010-01-06 株式会社日立製作所 計算機システム及びi/oブリッジ
US7599397B2 (en) * 2005-12-27 2009-10-06 International Business Machines Corporation Obtaining multiple port addresses by a fibre channel switch from a network fabric
US8543948B2 (en) * 2006-09-07 2013-09-24 Toshiba Global Commerce Solutions Holdings Corporation Structure for PCI-E based POS terminal
US7562176B2 (en) * 2007-02-28 2009-07-14 Lsi Corporation Apparatus and methods for clustering multiple independent PCI express hierarchies
US7783818B1 (en) * 2007-12-28 2010-08-24 Emc Corporation Modularized interconnect between root complexes and I/O modules
US7707346B2 (en) * 2008-03-12 2010-04-27 Lsi Corporation PCI express multi-root IOV endpoint retry buffer controller
US8359415B2 (en) * 2008-05-05 2013-01-22 International Business Machines Corporation Multi-root I/O virtualization using separate management facilities of multiple logical partitions
US8346997B2 (en) * 2008-12-11 2013-01-01 International Business Machines Corporation Use of peripheral component interconnect input/output virtualization devices to create redundant configurations

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004342109A (ja) * 2003-05-15 2004-12-02 Internatl Business Mach Corp <Ibm> 入出力ファブリックにおけるハードウェア・エラーからの自動回復
JP2007195166A (ja) * 2006-01-18 2007-08-02 Internatl Business Mach Corp <Ibm> 組み込みdidによるpciバス・アドレス・ベースのルーティング用ルーティング・テーブルを作成し、管理する方法、コンピュータ・プログラムおよび装置
JP2008152783A (ja) * 2006-12-19 2008-07-03 Internatl Business Mach Corp <Ibm> データ処理システム内で第1のホスト・システムと第2のホスト・システムとの間で通信するための方法、プログラム、およびシステム(トランザクション・プロトコルおよび共用メモリを使用するホスト・システム間の通信のためのシステムおよび方法)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012150623A (ja) * 2011-01-19 2012-08-09 Hitachi Ltd 計算機システムおよびpciカードのhba識別子引き継ぎ方式
JP2015516617A (ja) * 2012-03-15 2015-06-11 フジツウ テクノロジー ソリューションズ インタレクチュアル プロパティ ゲーエムベーハー モジュラサーバーシステム、i/oモジュール及びスイッチング方法
JP2014036240A (ja) * 2012-08-07 2014-02-24 Fujitsu Ltd 制御装置、方法及びプログラム、並びにシステム及び情報処理方法
JP2016118955A (ja) * 2014-12-22 2016-06-30 富士通株式会社 通信システム,管理装置,制御装置及びプログラム
CN109190420A (zh) * 2018-09-11 2019-01-11 网御安全技术(深圳)有限公司 一种服务器加解密刀片、系统、及加解密方法

Also Published As

Publication number Publication date
JPWO2010084529A1 (ja) 2012-07-12
US20120005392A1 (en) 2012-01-05

Similar Documents

Publication Publication Date Title
WO2010084529A1 (ja) 情報処理システム
JP6928189B2 (ja) 多重モードで動作するストレージ装置及びそれを含むシステム
US10148746B2 (en) Multi-host network interface controller with host management
CN108694021B (zh) 使用基板管理控制器配置存储设备的系统和方法
US9645956B2 (en) Delivering interrupts through non-transparent bridges in a PCI-express network
US8346912B2 (en) System and method of emulating a network controller within an information handling system
US8140719B2 (en) Dis-aggregated and distributed data-center architecture using a direct interconnect fabric
EP2498477B1 (en) Method and apparatus for shared I/O in a load/store switching fabric
EP1950666B1 (en) Method and apparatus for shared I/O in a load/store fabric
JP2014099847A (ja) PCIe構造でのホスト間メッセージをセキュア化し分離する方法及び装置
US9792240B2 (en) Method for dynamic configuration of a PCIE slot device for single or multi root ability
US8379541B2 (en) Information platform and configuration method of multiple information processing systems thereof
US11775464B2 (en) Computer system and a computer device
US20170118115A1 (en) Switching device, computer system, method, and program
US20130042019A1 (en) Multi-Server Consolidated Input/Output (IO) Device
US9928206B2 (en) Dedicated LAN interface per IPMI instance on a multiple baseboard management controller (BMC) system with single physical network interface
US20140149658A1 (en) Systems and methods for multipath input/output configuration
US7590108B2 (en) Composite computer apparatus and management method thereof
US9780960B2 (en) Event notifications in a shared infrastructure environment
JP2013137611A (ja) Usbハブコントローラ、usbホストコントローラ、およびシステム
JP2012093925A (ja) 計算機システムおよび計算機システムにおける計算機間デバイス共有方法

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 09838723

Country of ref document: EP

Kind code of ref document: A1

ENP Entry into the national phase

Ref document number: 2010547311

Country of ref document: JP

Kind code of ref document: A

NENP Non-entry into the national phase

Ref country code: DE

WWE Wipo information: entry into national phase

Ref document number: 13145065

Country of ref document: US

122 Ep: pct application non-entry in european phase

Ref document number: 09838723

Country of ref document: EP

Kind code of ref document: A1