WO2004051943A1 - Nas load distribution system - Google Patents

Nas load distribution system Download PDF

Info

Publication number
WO2004051943A1
WO2004051943A1 PCT/JP2002/012787 JP0212787W WO2004051943A1 WO 2004051943 A1 WO2004051943 A1 WO 2004051943A1 JP 0212787 W JP0212787 W JP 0212787W WO 2004051943 A1 WO2004051943 A1 WO 2004051943A1
Authority
WO
WIPO (PCT)
Prior art keywords
nas
address
client
node
load balancing
Prior art date
Application number
PCT/JP2002/012787
Other languages
French (fr)
Japanese (ja)
Inventor
Yoshitake Shinkai
Original Assignee
Fujitsu Limited
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Limited filed Critical Fujitsu Limited
Priority to PCT/JP2002/012787 priority Critical patent/WO2004051943A1/en
Priority to JP2004556814A priority patent/JP3949688B2/en
Publication of WO2004051943A1 publication Critical patent/WO2004051943A1/en
Priority to US11/114,217 priority patent/US8578053B2/en

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L69/00Network arrangements, protocols or services independent of the application payload and not provided for in the other groups of this subclass
    • H04L69/16Implementation or adaptation of Internet protocol [IP], of transmission control protocol [TCP] or of user datagram protocol [UDP]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/1001Protocols in which an application is distributed across nodes in the network for accessing one among a plurality of replicated servers

Definitions

  • the present invention provides a NAS client file storage (NAS) device comprising a plurality of nodes (for example, computers) designed to allow the same file to be accessed from any node.
  • the request issued by the NAS client is automatically routed to a specific node, taking into account the locality, and load distribution between real nodes is improved, and operability is improved.
  • technology for building NAS systems that can improve performance.
  • FIG. 1 shows a conventional NAS system in which NAS devices and NAS clients are connected via a network.
  • the NAS system shown in FIG. 1 includes a NAS 100, a network 110, and computers 111 and 112 113 that constitute a group of NAS clients.
  • the NAS device 100 includes a storage device 104, a plurality of nodes 101, 102 and 103, and a dispatcher device 105.
  • the dispatcher device 105 is known as a method for balancing the load of each of the nodes 101, 102, and 103.
  • one logical IP address (LIP1) is defined for the NAS device 100, and the NAS clients 111, 112, and 113 execute a file operation request to this logical IP address.
  • a special device for performing IP address conversion which is a dedicated computer called the above-described dispatcher device 105, is arranged.
  • the dispatcher device 105 assigns a logical IP address, which is the destination of the request issued by the NAS client 111, 112, or 113, to each node having a NAS device. To a different physical IP address (MAC1, MAC2 or MAC3). This causes the dispatcher device 105 to route the request to the destination node.
  • the NAS client can access ⁇ ft without knowing the configuration of the nodes in the NAS device, but at the same time, it increases the device cost, and furthermore, the NAS client has an ano-head associated with the IP address conversion.
  • FIG. 2 shows a NAS system in which a conventional NAS device and a group of NAS clients are connected via a network when the dispatcher device 105 of FIG. 1 is not used.
  • components denoted by the same reference numerals as those in FIG. 1 indicate the same components.
  • the NAS device 100 includes a plurality of nodes 101, 102 and 103, and a device 104. Each node 101, 102 and 103 has a unique IP address (IP1, IP2, and IP3).
  • IP1, IP2, and IP3 IP addresses assigned to the nodes 101, 102 or 103.
  • the NAS client 111 always accesses the storage device 104 via the node 101
  • the NAS client 112 always accesses the storage device 104 via the node 102
  • the NAS client 113 always accesses the node 103.
  • the storage device 104 is accessed via the server.
  • the present invention has been made in view of the above points, and in a NAS device composed of a plurality of nodes, a request issued from a NAS client without having a dispatcher device in the NAS device is transmitted to a specific node.
  • the purpose of the present invention is to provide a NAS load balancing method that can achieve load balancing between real nodes by automatically routing to a network.
  • the present invention has a NAS device and a plurality of nodes in a NAS device.
  • Each node has a NAS body, a statistical data collection structure, and a destination structure, respectively, and one node also has an actual IP structure.
  • the NAS itself processes the file operation request issued from the NAS client and returns a response.
  • the statistical data collection compiles statistics of requests issued from NAS clients for each destination logical IP address.
  • An asymmetric NAS device (a type of device that has the most suitable processing node (primary node) attribute for each file and increases processing costs when processed by other nodes after processing by the primary node) Calculate also for each destination logical IP address and for each primary node.
  • the physical IP configuration evaluates the data compiled by the statistical data collection system at regular intervals, and changes the NAS client's holding destination via the destination switching mechanism.
  • the destination switching mechanism notifies the NAS client of the real MAC address corresponding to the logical IP address of the NAS device held by the NAS client to the NAS client without using special dispatch nodeware.
  • the actual IP address of the request to be issued is switched on the NAS client side.
  • a request issued from a NAS client is automatically routed to a specific node using each of the above-described mechanisms, so that a dispatcher device or the like can be used without using a dispatcher device or the like.
  • the load can be distributed among the actual nodes.
  • FIG. 1 is a diagram showing a conventional NAS system in which a NAS device and a group of NAS clients are connected via a network.
  • FIG. 2 is a diagram showing a NAS system in which a conventional NAS device having no dispatcher in the NAS device and a group of NAS clients are connected via a network.
  • FIG. 3 is a diagram illustrating a NAS system in which the NAS device and the NAS client group according to the embodiment of the present invention are connected via a network.
  • FIG. 4 is a diagram showing a flowchart of the operation of the NAS body of the NAS device according to the present invention.
  • FIG. 5 is a flowchart showing the operation of the statistical data collection mechanism of the NAS device according to the present invention.
  • FIG. 6 is a diagram showing a flowchart of the operation of the actual IP determining mechanism of the NAS device according to the present invention.
  • FIG. 7 is a diagram showing a flowchart of the operation of the destination change mechanism of the NAS device according to the present invention.
  • FIG. 3 is a diagram showing a NAS system in which the NAS device 100 and the NAS clients 111, 112, and 113 constituting a NAS client group are connected by a network 110 according to the embodiment of the present invention.
  • the NAS clients 111, 112, and 113 constituting the NAS client count are computers that share and use the NAS device 100.
  • the NAS device 100 includes a plurality of nodes 101, 102 and 103, and a storage device 104.
  • Each of the nodes 101, 102, or 103 has a NAS body 121, 131, and 141, a statistical data structure 122, 132, and 142, and a destination change structure 123, 133, and 143, respectively.
  • Each of the nodes 103 further has a physical I address determination mechanism 144. The outline of the operation of each component will be described below.
  • Each of the NAS clients 111, 112, and 113 is composed of a computer widely distributed in general and an existing program running on the computer.
  • Each of the NAS clients 111, 112, and 113 is assigned a logical IP address, which is a representative IP address of the NAS device 100 as viewed from each computer, and an IP—X (X is a number determined for each NAS client).
  • Each NAS client 111, 112 and 113 accesses the NAS device 100: In ⁇ , each NAS client 111, 112 and 113 speaks a request towards its respective logical IP address.
  • the logical IP address corresponds to one of the MAC addresses or the physical addresses (MAC1, MAC2, MAC3) of each of the nodes 101, 102, and 103 of the NAS device 100.
  • the request from each of the NAS clients 111, 112, and 113 is sent to a node having a MAC address associated with each logical IP address. This association is performed in the same manner as a general mechanism for associating real IP addresses with MAC addresses.
  • the NA> S main units 121, 131, and 141 are programs for processing a file operation request sent from the NAS client 111, 112, or 113.
  • Each node 101, 102 and 103 of the NAS device 100 has the following structure: ⁇ indicates that there is no difference between the nodes 101, 102 and 103 of the NAS device 100.
  • 111, 112 or 113 can process all files at the same cost via any of the nodes 101, 102 and 103.
  • each of the nodes 101, 102, and 103 of the NAS device 100 determines which node among the nodes 101, 102, or 103 of the NAS device 100 depends on the file to be processed. Access via More appropriate, a set of pre-defined files can be processed with minimal cost, while other files are configured to cost extra. It is assumed that this ⁇ is recorded in the metadata (node number) that can be processed at the lowest cost for each file. The present invention is adjusted so that it can be applied even if it has any of the above-described configurations. Next, the statistical data collection structures 122, 132, and 142 of each of the nodes 101, 102, or 103 in the NAS device 100 will be described.
  • Each of the statistical data collection structures 122, 132, and 142 accumulates performance data notified from each of the NAS units 121, 131, and 141, and accumulates statistical data for each logical IP address. Then, at regular time intervals, the result of the accumulated statistical data is sent to the real IP decision Em structure 144 provided in the node 103.
  • the real IP determining mechanism 144 of the node 103 further compiles the statistical data sent from all the nodes 101, 102, and 103 included in the NAS device 100 from the statistical data collection structures 122, 132, and 142. Then, at regular time intervals, a “logical IP address-real IP address conversion table” indicating the correspondence between the optimal logical IP address and the real IP address is created, for example, according to the algorithm described later. This refers to the destination change mechanism of each of the nodes 101, 102, and 103 in 00.
  • the destination changing mechanisms 123, 133, and 143 of each of the nodes 101, 102, or 103 in the NAS device 100 will be described.
  • the destination change mechanism 123, 133, and 143 change the destination of the logical IP address according to the optimal “logical IP address-to-real IP address conversion table” described by the real IP resolution provided in node 103.
  • the processing of is performed.
  • each of the nodes 101, 102, or 103 of the above-described NAS device 100 has the NAS main bodies 121, 131, and 141, and the gun gauge data collection it structures 122, 132, and 142.
  • the algorithm of the operation of the physical IP address resolution structure 144 of the node 103 will be described in detail.
  • FIG. 4 shows an algorithm of the operation of the NAS bodies 121, 131 and 141. 4, the operation of the NAS bodies 121, 131, and 141 starts in step S401.
  • step S402 the NAS 121 receives a file operation request from any of the NAS clients 111, 112, or 113 via the network 110.
  • a file operation request is received from the NAS client 112 via the network 110.
  • each NAS main body 121, 131, or 141 obtains a file to be processed for each reception request.
  • step S403 it is determined whether or not the primary node (no de-P) of the file of 3 ⁇ 4 ⁇ exists.
  • the primary node is the processing node that has the lowest processing cost and is optimal for each file in an asymmetric NAS device. 3 ⁇ 4 If the primary node number (node_P) of the file does not exist ⁇ , the process proceeds to step S405. If the primary node number (node-P) of the file exists: ⁇ , the process proceeds to step S406. Next, in step S405, the own node number is substituted for the primary node number (no de-P).
  • the collected statistical data is sent to each of the statistical data collecting mechanisms 122, 132 and 142.
  • the collected statistical data includes the logical IP address of the destination from the NAS client, the IP address of the NAS client that made the request, and the primary node number (or symmetric: ⁇ indicates the node of the node that received the request) Number).
  • step S407 the NAS bodies 121, 131, and 141 execute a file operation requested by the NAS client for each node. Then, finally, in step S408, the NAS transmits a response to the file operation requested by the NAS client to the requesting NAS client. After this, the NAS itself waits for a file operation request to receive a request from the next NAS client.
  • FIG. 5 shows the algorithm of the operation of the gun gauge data collection ⁇ structures 122, 132 and 142.
  • step S501 the operations of the gun gauge data collection mechanisms 122, 132, and 142 start.
  • each of the statistical data collection mechanisms 122, 132, and 142 compiles the statistical data sent from each of the NAS units for each logical IP address and each primary node number (no dep). accumulate. That is, the number of file operation requests is accumulated as statistical data for each logical IP address and for each primary node number (no de-P). At the same time, the number of all file operation requests is accumulated as statistical data.
  • step S 503 it is determined whether or not a predetermined time has elapsed before sending the statistical data collected last time to the actual IP scheme 144 provided in the node 103. If it is determined that the predetermined time has not elapsed, the process proceeds to S506 and ends. If it is determined that the predetermined time has elapsed, the process proceeds to step S504. '
  • step S 504 the statistical data compiled this time is transmitted to the actual IP decision structure 144 set in the node 103.
  • step S505 the current time at which the statistical data collected this time is transmitted to the actual IP determining mechanism 144 provided in the node 103 is set as a new total time of the statistical data.
  • step S506 the process ends.
  • FIG. 6 shows an algorithm of the operation of the actual IP determination mechanism 144.
  • this algorithm will be described below for the case of the asymmetric type.
  • statistical data sent from the statistical data collection structure of each node is further aggregated, and at regular time intervals, an optimal “logical IP address-to-real IP address conversion table” is created. Send it back to the destination change mechanism.
  • step S601 the real IP Operation starts.
  • step S 602 the real IP determination mechanism 144 uses the statistical data collection structures 122, 132, and 142 of each of the nodes 101, 102, or 103 in the NAS device 100 to explain using FIG. Received statistical data.
  • step S603 the total number of destination requests is calculated for each logical IP address and for each primary node number (no de-P).
  • step S604 it is determined whether or not the force has passed a predetermined time since the previous aggregation. If it is determined that the predetermined time has not elapsed since the previous aggregation, the process returns to step S602, and the reception of the statistical data is continued. On the other hand, if it is determined that the predetermined time has elapsed since the previous aggregation, the process proceeds to step S605.
  • step S605 it is determined whether or not processing has been completed for all logical IP addresses. If it is determined that the processing has been completed; return to step S602 to continue receiving statistical data. On the other hand, if it is determined that there is an unprocessed logical IP address, the process advances to step S606 to perform processing on the logical IP address.
  • Step S606 includes steps S607, S608, and S609.
  • step S607 the total number of requests for the logical IP address (LIP-i) is obtained, and this is set as req-tota1.
  • steps S 608 and S 609 among the requests to the logical IP address (LIP-i), the primary node number (ne xt -pr) receiving the largest number of requests and the maximum number of requests (maxreq-no). That is, in S608, it is determined whether or not the force satisfies the condition of (maX-req-no> TOTAL [LIPi, p-node]). If the condition (maX—req_no> TOTAL [LIPi, p-node]) is satisfied, the process proceeds to step S610.
  • step S609 the destination of the logical IP address (LIP_i) is changed to the primary node number (next-pr).
  • the maximum number of requests Let (max x e qn o) be the total value of the number of requests for the r imary node ⁇ TOTAL [LIP i, p—no de].
  • step S610 cu r-pr is set as the node (L IP-i) to which the logical IP address is currently assigned.
  • step S611 it is determined whether or not the two primary node numbers cu r—pr and neXt ⁇ r are not equal. If cur—pr and next—pr are equal to ⁇ , the process proceeds to step S605. On the other hand, when cu_pr is not equal to next—pr, the process proceeds to step S612. Next, in step S612, it is determined whether or not a force that satisfies (max-req-no> 1/2 * req-tota1) is satisfied. If this condition is not satisfied, processing proceeds to step S605. On the other hand, if this condition holds, the process proceeds to Step S613.
  • step S613 the logical IP (LIP-i) of the logical IP (LIP-i) is transmitted to the destination changing mechanism of each of the nodes 101, 102, or 103 from the actual configuration of the node 103.
  • An instruction is given to change the destination from the current primary node number cur_pr to the primary node number next-pr described above.
  • the process advances to step S605 to continue processing of the next logical IP address.
  • the number of requests is calculated for each primary node, and if there is a large gap between them, the logical IP address-real IP address pair is calculated as follows: And send it to the destination change mechanism.
  • FIG. 7 shows an algorithm of the operation of the destination changing mechanisms 123, 133 and 143.
  • the destination change mechanism starts the process of changing the destination of the logical IP address.
  • step S702 a message is sent to the node using cu r -pr to suspend all sessions using the logical IP address (LIP_i). Stopping here means stacking requests addressed to the logical IP address (LIP-i).
  • step S703 in order to switch the destination of the specified logical IP address and IP-i to the MAC address corresponding to neXt_pr, (MAC address-one LIP-i pair) is used as an argument. Send an IP switching message to the network. Then, the optimum logical IP address-real IP address conversion table after the change is sent to the NAS client, and the NAS client can know that the real IP address corresponding to the logical IP address has been changed. After that, the NAS device can be accessed with this real IP address. However, the upper layer of the NAS client can access the NAS device with the old logical IP address.
  • This logical IP address can be switched by using a well-known method such as gratuit ou s ARP (address resolution protocol;; ⁇ how to use fe etc.)
  • gratuitous ARP is an ARP response when there is no ARP request. That is, if the ARP response is addressed to the broadcast hardware address ⁇ , all hosts on the network will receive the ARP response and refresh the ARP cache, such as refreshing the ARP cache. It is.
  • step S704 all sessions are closed toward LIP_i from all NAS clients. As a result, the suspended request is discarded, and the NAS client is notified that the session has been terminated. When this notification is received, the NAS client re-establishes the session for LIP-i and retransmits the file operation request, so that the request is directed from the NAS client to the new node next-pr.
  • step S705 the destination change mechanism ends.

Abstract

A NAS load distribution system capable of automatically routing a request issued by an NAS client to a particular node, thereby distributing load between actual nodes without having a dispatcher in an NAS apparatus. In order to achieve this object, in the NAS load distribution system for distributing the NAS load of the NAS apparatus consisting of a plurality of nodes accessed via a network by the NAS client, the NAS apparatus has a plurality of virtual IP addresses.

Description

NAS負荷分散システム 技術分野  NAS load balancing system
本発明は、 どのノードからも同じファイルをアクセスできるように設計された 複数のノード (例えば、 計算機) で構成される NAS (Ne two r k At t a che d S t o r a g e) 装置において、 NASクライアントのファイルァ クセスローカリティ (局在性) を加明味し、 NASクライアントから発行される要 求を、 特定のノードに自動的にルーティングすることにより、 実ノード間の負荷 分散を図り、 且つ、 運用性の向上と性能の向書上を可能とする NASシステムの構 築技術に関する。 背景技術  SUMMARY OF THE INVENTION The present invention provides a NAS client file storage (NAS) device comprising a plurality of nodes (for example, computers) designed to allow the same file to be accessed from any node. The request issued by the NAS client is automatically routed to a specific node, taking into account the locality, and load distribution between real nodes is improved, and operability is improved. And technology for building NAS systems that can improve performance. Background art
図 1は、 従来の NAS装置と NASクライアント群がネットワークで接続され た NASシステムを示す。図 1に示された NASシステムは、 NAS¾ l 00、 ネットワーク 110及ぴ NASクライアント群を構成する計算機 111、 112 113より構成される。  Figure 1 shows a conventional NAS system in which NAS devices and NAS clients are connected via a network. The NAS system shown in FIG. 1 includes a NAS 100, a network 110, and computers 111 and 112 113 that constitute a group of NAS clients.
NAS装置 100は、 記憶装置 104と、 複数のノード 101、 102及び 1 03、 及ぴデ:イスパッチャ装置 105カ ら構成される。 ディスパッチャ装置 10 5は、 各ノード 101、 102及ぴ 103の負荷分散をはかる方式として知られ ている。  The NAS device 100 includes a storage device 104, a plurality of nodes 101, 102 and 103, and a dispatcher device 105. The dispatcher device 105 is known as a method for balancing the load of each of the nodes 101, 102, and 103.
この方式では NAS装置 100に対し一つの論理 I Pアドレス (L I P1) を 定義し、 そして、 NASクライアント 111、 112及ぴ 113はこの論理 I P アドレスに向けて、 ファイル操作要求を宪行する。 上述のように、 NAS装置 1 00内には、 上述のディスパッチャ装置 105と呼ばれる専用の計算機である、 I Pァドレス変換をつかさどる特殊な装置が配置される。 ディスパッチャ装置 1 05は、 NASクライアント 111、 112又は、 113が発行した要求のあて 先である論理 I Pアドレスを、 NAS装置画有する各ノード毎に決まるユニーク な物理 I Pアドレス (MAC1、 MAC 2又は、 MAC 3) に変換する。 これに より、 ディスパッチャ装置 105は、 そのあて先のノードに要求をルーティング する。 In this method, one logical IP address (LIP1) is defined for the NAS device 100, and the NAS clients 111, 112, and 113 execute a file operation request to this logical IP address. As described above, in the NAS device 100, a special device for performing IP address conversion, which is a dedicated computer called the above-described dispatcher device 105, is arranged. The dispatcher device 105 assigns a logical IP address, which is the destination of the request issued by the NAS client 111, 112, or 113, to each node having a NAS device. To a different physical IP address (MAC1, MAC2 or MAC3). This causes the dispatcher device 105 to route the request to the destination node.
この従来;^:では、 NASクライアントに、 N AS装置内のノードの構成を意 識させないアクセスを^ ftできる反面、 装置コストの増加を招き、 更に、 I Pァ ドレス変換に伴うォーノヘッドのため、 NAS装置の処理能力に、 影響を与える という性能上の不利な点が存在する。 たとえば、 NASクライアントから N AS 装置に到着する要求の頻度が、 ディスパッチャ装置 105の処理能力を超えてし まうと、 NAS装置にノードがいくつあっても、 スケーラブノレに処理能力を高め ることはできないという問題点がある。  In the conventional; ^ :, the NAS client can access ^ ft without knowing the configuration of the nodes in the NAS device, but at the same time, it increases the device cost, and furthermore, the NAS client has an ano-head associated with the IP address conversion. There is a performance disadvantage that affects the processing power of the equipment. For example, if the frequency of requests arriving at the NAS device from the NAS client exceeds the processing capacity of the dispatcher device 105, it is not possible to increase the processing capacity in a scalable manner, regardless of the number of nodes in the NAS device. There is a problem.
図 2は、 図 1のディスパッチャ装置 105を使用しない場合の、 従来の N AS 装置と NASクライアント群がネットワークで接続された N A Sシステムを示す。 図 2におレヽて、 図 1と同一番号を付した構成要素は、 同一の構成要素を示すもの とする。  FIG. 2 shows a NAS system in which a conventional NAS device and a group of NAS clients are connected via a network when the dispatcher device 105 of FIG. 1 is not used. In FIG. 2, components denoted by the same reference numerals as those in FIG. 1 indicate the same components.
図 2においては、 NAS装置 100は、複数のノード 101、 102と 103、 及ぴ、 記 '隐装置 104力ら構成される。 各ノード 101、 102及び 103は、 それぞれ固有の I Pアドレス (I P1、 I P 2、 及び I P 3) を有する。 NAS クライアント群を構成する計算機 111, 112及ぴ 113は、 NAS装置 10 0をアクセスするときには、 ノード 101、 102又は、 103に割当てられた I Pアドレス (I Pl、 J P2、 及び I P3) のうちの何れかを固定的に使用し て、 常に同じ 1つのノードを経由して、 NAS装置 100内の蓄積装置 104に アクセスする。 例えば、 NASクライアント 111は、 常にノード 101を経由 して蓄積装置 104にアクセスし、 NASクライアント 112は、 常にノード 1 02を経由して蓄積装置 104にアクセスそして、 NASクライアント 113は、 常にノード 103を経由して蓄積装置 104にアクセスする。  In FIG. 2, the NAS device 100 includes a plurality of nodes 101, 102 and 103, and a device 104. Each node 101, 102 and 103 has a unique IP address (IP1, IP2, and IP3). When the computers 111, 112 and 113 constituting the NAS client group access the NAS device 100, the computers 111, 112 and 113, among the IP addresses (IP1, JP2 and IP3) assigned to the nodes 101, 102 or 103, The storage device 104 in the NAS device 100 is always accessed via the same one node by using any one of the above. For example, the NAS client 111 always accesses the storage device 104 via the node 101, the NAS client 112 always accesses the storage device 104 via the node 102, and the NAS client 113 always accesses the node 103. The storage device 104 is accessed via the server.
しかし、 このように、 各 NASクライアントが常に、 NAS装置 100内の同 じノードを経由してアクセスすると、 各ノードの負荷の 9¾が図れないという問 題もある。 発明の開示 However, as described above, if each NAS client always accesses via the same node in the NAS device 100, there is a problem that 9% of the load on each node cannot be achieved. Disclosure of the invention
本発明は上記の点に鑑みてなされたもので、 複数のノードから構成される N A S装置において、 N A S装置内にディスパッチャ装置を有することなしに、 NA Sクライアントから発行される要求を、 特定のノードに自動的にルーティングす ることにより、 実ノード間の負荷分散を図ることができる NA S負荷分散方式を することを目的とする。  The present invention has been made in view of the above points, and in a NAS device composed of a plurality of nodes, a request issued from a NAS client without having a dispatcher device in the NAS device is transmitted to a specific node. The purpose of the present invention is to provide a NAS load balancing method that can achieve load balancing between real nodes by automatically routing to a network.
この目的を達成するために、 本発明は、 NA S装置内に、 記'隐装置と、 複数の ノードを有する。 各ノードは、 それぞれ、 NA S本体、 統計データ収灘構、 及 ぴあて先切賺構を有し、そして、 1つのノードは更に実 I P決 構も有する。  In order to achieve this object, the present invention has a NAS device and a plurality of nodes in a NAS device. Each node has a NAS body, a statistical data collection structure, and a destination structure, respectively, and one node also has an actual IP structure.
NA S本体は、 NA Sクライアントから発行されたファィル操作要求を処理し、 応答を返す。  The NAS itself processes the file operation request issued from the NAS client and returns a response.
統計データ収^^構は、 NA Sクライアントから発行された要求の統計をその あて先論理 I Pアドレス毎に集計する。 非対称系 NA S装置 (ファイル単位に最 適な処理ノード (プライマリノード) 属性を持ち、 プライマリノードで処理した ょり他のノ一ドで処理した時に処理コストが増加するタィプの装置) の には、 あて先論理 I Pァドレス毎力つプライマリノード毎にも集計する。  The statistical data collection compiles statistics of requests issued from NAS clients for each destination logical IP address. An asymmetric NAS device (a type of device that has the most suitable processing node (primary node) attribute for each file and increases processing costs when processed by other nodes after processing by the primary node) Calculate also for each destination logical IP address and for each primary node.
物理 I P決 構は、 統計データ収灘構が集計したデータを一定時間毎に評 価し、 あて先切り替え機構を介して N A Sクライアント力 S保持するあて先を変更 する。  The physical IP configuration evaluates the data compiled by the statistical data collection system at regular intervals, and changes the NAS client's holding destination via the destination switching mechanism.
あて先切り替え機構は、 NA Sクライアントが保持する NA S装置の論理 I P アドレスに対応する実 M A Cアドレスを、 NA Sクライアントに広報することに より、 特殊なディスパッチノヽードウエアを使用せず、 NA Sクライアントが発行 する要求のあて先実 I Pアドレスを N A Sクライアント側で切りかえる。  The destination switching mechanism notifies the NAS client of the real MAC address corresponding to the logical IP address of the NAS device held by the NAS client to the NAS client without using special dispatch nodeware. The actual IP address of the request to be issued is switched on the NAS client side.
本発明によれば、 上述のような各機構を使用して、 NA Sクライアントから発 行される要求を、 特定のノードに自動的にルーティングすることにより、 デイス パッチャ装置等を使用することなしに、 実ノ一ド間の負荷分散を図ることができ る。 図面の簡単な説明 本発明の他の目的、 特徴及ひ ¾1点は、 添付の図面を参照しながら以下の詳細な 説明を読むことにより一層明瞭となるであろう。 According to the present invention, a request issued from a NAS client is automatically routed to a specific node using each of the above-described mechanisms, so that a dispatcher device or the like can be used without using a dispatcher device or the like. Thus, the load can be distributed among the actual nodes. BRIEF DESCRIPTION OF THE FIGURES Other objects, features and aspects of the present invention will become more apparent from the following detailed description when read in conjunction with the accompanying drawings.
図 1は、 従来の NAS装置と NASクライアント群がネットワークで接続され た NASシステムを示す図である。  FIG. 1 is a diagram showing a conventional NAS system in which a NAS device and a group of NAS clients are connected via a network.
図 2は、 NAS装置内にディスパッチャを有しない従来の NAS装置と NAS クライアント群がネットワークで接続された N A Sシステムを示す図である。 図 3は、 本発明の実施例の N AS装置と NASクライアント群がネットワーク で接続された N ASシステムを示す図である。  FIG. 2 is a diagram showing a NAS system in which a conventional NAS device having no dispatcher in the NAS device and a group of NAS clients are connected via a network. FIG. 3 is a diagram illustrating a NAS system in which the NAS device and the NAS client group according to the embodiment of the present invention are connected via a network.
図 4は、 本発明に従った N AS装置の N AS本体の動作のフローチャートを示 す図である。  FIG. 4 is a diagram showing a flowchart of the operation of the NAS body of the NAS device according to the present invention.
図 5は、 本発明に従った N AS装置の統計データ収集機構の動作のフローチヤ ートを示す図である。  FIG. 5 is a flowchart showing the operation of the statistical data collection mechanism of the NAS device according to the present invention.
図 6は、 本発明に従った N AS装置の実 I P決定機構の動作のフローチャート を示す図である。  FIG. 6 is a diagram showing a flowchart of the operation of the actual IP determining mechanism of the NAS device according to the present invention.
図 7は、 本発明に従った NAS装置の宛先変更機構の動作のフローチャートを 示す図である。 発明を実施するための最良の形態  FIG. 7 is a diagram showing a flowchart of the operation of the destination change mechanism of the NAS device according to the present invention. BEST MODE FOR CARRYING OUT THE INVENTION
以下に、本発明を実施するための実施の形態について、図面を用いて説明する。 図 3は、 本発明の実施例の N AS装置 100と' NASクライアント群を構成す る NASクライアント 111, 112及ぴ 113がネットワーク 110で接続さ れた N A Sシステムを示す図である。 N A Sクライアント郡を構成する N A Sク ライアント 111、 112及ぴ 113は、 NAS装置 100を共用して使用する 計算機である。  An embodiment for carrying out the present invention will be described below with reference to the drawings. FIG. 3 is a diagram showing a NAS system in which the NAS device 100 and the NAS clients 111, 112, and 113 constituting a NAS client group are connected by a network 110 according to the embodiment of the present invention. The NAS clients 111, 112, and 113 constituting the NAS client count are computers that share and use the NAS device 100.
NAS装置 100は、 複数のノード 101、 102及ぴ 103及び、 記憶装置 104より構成される。 各ノード 101、 102又は 103は、 それぞれ、 NA S本体 121, 131及び 141、 統計データ収 構 122, 132及び 14 2、 あて先変灘構 123、 133及び 143を有し、 各ノードの中の 1つのノ ード 103は、 更に物理 I Ρァドレス決定機構 144を有する。 以下に、 各構成要素の動作の概略を説明する。 The NAS device 100 includes a plurality of nodes 101, 102 and 103, and a storage device 104. Each of the nodes 101, 102, or 103 has a NAS body 121, 131, and 141, a statistical data structure 122, 132, and 142, and a destination change structure 123, 133, and 143, respectively. Each of the nodes 103 further has a physical I address determination mechanism 144. The outline of the operation of each component will be described below.
先ず最初に、 NASクライアント群を構成する NASクライアントについて説 明する。  First, the NAS clients that make up the NAS client group will be described.
各 NASクライアント 111、 112及ぴ 113は、 一般に広く流通している 計算機および、 その計算機上で動作する既存のプログラムより構成される。 各 N ASクライアント 111、 112及ぴ 113には、 それぞれの計算機からみた N AS装置 100の代表 I Pァドレスである論理 I Pァドレスし I P— X (Xは各 NASクライアント毎に決まる番号)が割り当てられる。  Each of the NAS clients 111, 112, and 113 is composed of a computer widely distributed in general and an existing program running on the computer. Each of the NAS clients 111, 112, and 113 is assigned a logical IP address, which is a representative IP address of the NAS device 100 as viewed from each computer, and an IP—X (X is a number determined for each NAS client).
各 NASクライアント 111、 112及び113カ NAS装置 100をァク セスする:^には、 各 NASクライアント 111、 112及ぴ 113は、 それぞ れの論理 I Pアドレスに向けて要求を 言する。 論理 I Pアドレスは NAS装置 100が有する各ノード 101、 102又は 103の、 いずれかの MACァドレ ス又は、 物理アドレス (MAC1、 MAC 2、 MAC 3) に対応している。 そし て、 各 NASクライアント 111、 112及ぴ 113からの要求は、 それぞれの 論理 I Pアドレスに対応付けられた MA Cアドレスを持つノードに送られる。 こ の対応付けは、 一般の実 I Pアドレスと MA Cアドレスの対応づけの機構と同様 に行われる。  Each NAS client 111, 112 and 113 accesses the NAS device 100: In ^, each NAS client 111, 112 and 113 speaks a request towards its respective logical IP address. The logical IP address corresponds to one of the MAC addresses or the physical addresses (MAC1, MAC2, MAC3) of each of the nodes 101, 102, and 103 of the NAS device 100. Then, the request from each of the NAS clients 111, 112, and 113 is sent to a node having a MAC address associated with each logical IP address. This association is performed in the same manner as a general mechanism for associating real IP addresses with MAC addresses.
次に、 NAS装置 100内の各ノード 101、 102又は 103が有する、 N AS本体 121、 131及ぴ 141について説明する。  Next, the NAS bodies 121, 131, and 141 of each node 101, 102, or 103 in the NAS device 100 will be described.
NA>S本体 121、 131及ぴ 141は、 NASクライアント 111、 112 又は 113から送られたファイル操作要求を処理するプログラムである。 NAS 装置 100が有する各ノード 101、 102及ぴ 103力 対觀の構成の:^ には、 NAS装置 100が有する各ノード 101、 102又は 103の間に、 全 く差がないので、 各 NASクライアント 111、 112又は、 113は、 どのノ ード 101、 102及ぴ 103を経由しても、 全てのファイルを同じコストで処 理できる。  The NA> S main units 121, 131, and 141 are programs for processing a file operation request sent from the NAS client 111, 112, or 113. Each node 101, 102 and 103 of the NAS device 100 has the following structure: ^ indicates that there is no difference between the nodes 101, 102 and 103 of the NAS device 100. 111, 112 or 113 can process all files at the same cost via any of the nodes 101, 102 and 103.
一方、 NAS装置 100が有する各ノード 101、 102及ぴ 103が、 非対 の には、 処理対象のファイルに依存して、 NAS装置 100が有する各 ノード 101、 102又は 103の中のどのノードを経由してアクセスするかに より、 適否があり、 あらかじめ決まった一群のファイルは最小コストで処理でき るが、 その他のファイルは余分のコストがかかるように構成される。 この^に は、 フアイル毎に最小コストで処理可能なノ一ド番号 (ブライマリノ一ド番号) 力 メタデータに記録されているものとする。 本発明は、 ファイルシステム本体 力 上記のいずれの構成を有する でも、 適用できるように調整される。 次に、 NAS装置 100内の各ノード 101、 102又は 103が有する、 統 計データ収^^構 122, 132及び 142について説明する。 各統計データ収 腿構 122, 132及び 142は、 各 NAS本体 121、 131及ぴ 141よ りそれぞれ通知される性能データを累積し、 各論理 I Pアドレス毎に統計データ を蓄積する。 そして、 一定時間毎に、 その累積された統計データの結果を、 ノー ド 103に設けられた、 実 I P決 Em構 144に送る。 On the other hand, each of the nodes 101, 102, and 103 of the NAS device 100 determines which node among the nodes 101, 102, or 103 of the NAS device 100 depends on the file to be processed. Access via More appropriate, a set of pre-defined files can be processed with minimal cost, while other files are configured to cost extra. It is assumed that this ^ is recorded in the metadata (node number) that can be processed at the lowest cost for each file. The present invention is adjusted so that it can be applied even if it has any of the above-described configurations. Next, the statistical data collection structures 122, 132, and 142 of each of the nodes 101, 102, or 103 in the NAS device 100 will be described. Each of the statistical data collection structures 122, 132, and 142 accumulates performance data notified from each of the NAS units 121, 131, and 141, and accumulates statistical data for each logical IP address. Then, at regular time intervals, the result of the accumulated statistical data is sent to the real IP decision Em structure 144 provided in the node 103.
次に、 ノード 103に設けられた実 I P決 ¾構 144について説明する。 ノ ード 103の実 I P決定機構 144は、 NA S装置 100が有する全ノード 10 1、 102及ぴ 103内の統計データ収鍾構 122, 132及び 142力ら送 られた統計データをさらに集計し、 そして、 一定時間毎に、 最適な論理 I Pアド レスと実 I Pアドレスの対応を示す、 「論理 I Pアドレス一実 I Pアドレス変換 表」 を、 例えば、 後述するアルゴリズムに従って作成し、 そして、 NAS装置 1 00内の各ノード 101、 102及ぴ 103が有する、 あて先変更機構に 言す る。  Next, the actual IP decision structure 144 provided in the node 103 will be described. The real IP determining mechanism 144 of the node 103 further compiles the statistical data sent from all the nodes 101, 102, and 103 included in the NAS device 100 from the statistical data collection structures 122, 132, and 142. Then, at regular time intervals, a “logical IP address-real IP address conversion table” indicating the correspondence between the optimal logical IP address and the real IP address is created, for example, according to the algorithm described later. This refers to the destination change mechanism of each of the nodes 101, 102, and 103 in 00.
次に、 NAS装置 100内の各ノード 101、 102又は 103が有する、 あ て先変更機構 123、 133及び 143について説明する。 あて先変更機構 12 3、 133及び 143は、 ノード 103に設けられた実 I P決 構力ら 言さ れた、 最適な 「論理 I Pアドレス一実 I Pアドレス変換表」 に従って、 論理 I P 了ドレスのあて先変更の処理を実行する。  Next, the destination changing mechanisms 123, 133, and 143 of each of the nodes 101, 102, or 103 in the NAS device 100 will be described. The destination change mechanism 123, 133, and 143 change the destination of the logical IP address according to the optimal “logical IP address-to-real IP address conversion table” described by the real IP resolution provided in node 103. The processing of is performed.
次に、 図 4から図 7を参照して、 上述の NAS装置 100の各ノード 101、 102又は 103が有する、 NAS本体 121、 131及ぴ 141、 銃計データ 収 it構 122、 132及ぴ 142、 あて先変^ 構 123、 133及び 143 及ぴ、 ノード 103の有する物理 I P了ドレス決 構 144の動作のアルゴリ ズムについて、 詳しく説明する。 先ず最初に、 NAS本体 121、 131及び 141の動作について説明する。 図 4は、 N A S本体 121、 131及ぴ 141の動作のァルゴリズムを示す。 図 4のァノレゴリズムにおいて、 ステップ S401で、 NAS本体 121、 13 1及び 141の動作が開始する。 Next, referring to FIG. 4 to FIG. 7, each of the nodes 101, 102, or 103 of the above-described NAS device 100 has the NAS main bodies 121, 131, and 141, and the gun gauge data collection it structures 122, 132, and 142. The algorithm of the operation of the physical IP address resolution structure 144 of the node 103 will be described in detail. First, the operation of the NAS bodies 121, 131, and 141 will be described. FIG. 4 shows an algorithm of the operation of the NAS bodies 121, 131 and 141. 4, the operation of the NAS bodies 121, 131, and 141 starts in step S401.
次にステップ S 402で、 例えば、 NAS^l 21は、 何れかの NASクラ イアント 111、 112又は、 113から、 ファイル操作の要求を、 ネットヮー ク 110を介して受信する。 例えば、 図 3においては、 NASクライアント 11 2力 ら、 ファイル操作の要求を、 ネットワーク 110を介して受信する。  Next, in step S402, for example, the NAS 121 receives a file operation request from any of the NAS clients 111, 112, or 113 via the network 110. For example, in FIG. 3, a file operation request is received from the NAS client 112 via the network 110.
次にステップ S 403で、 各 NAS本体 121、 131又は 141は、 それぞ れの受信要求毎に、 その対象となるファイルを求める。  Next, in step S403, each NAS main body 121, 131, or 141 obtains a file to be processed for each reception request.
次にステップ S 403では、 ¾ ^のファイルのプライマリーノード (no de -P) が存在する力否かが判断される。 プライマリーノードは、 上述のように、 非対称系 NAS装置の に、 処理コストが最も低い、 ファイル単位に最適な処 理ノードのことである。 ¾ ^ファイルのプライマリーノード番号(n o d e— P) が存在しない^には、 ステップ S405に進み、 ファイルのプライマリー ノード番号 (node— P) が存在する:^には、 ステップ S 406に進む。 次に、 ステップ S 405では、 プライマリーノード番号 (no de— P) に自 分のノード番号を代入する。  Next, in step S403, it is determined whether or not the primary node (no de-P) of the file of ¾ ^ exists. As described above, the primary node is the processing node that has the lowest processing cost and is optimal for each file in an asymmetric NAS device. ¾ If the primary node number (node_P) of the file does not exist ^, the process proceeds to step S405. If the primary node number (node-P) of the file exists: ^, the process proceeds to step S406. Next, in step S405, the own node number is substituted for the primary node number (no de-P).
次に、 ステップ S 406では、 各統計データ収集機構 122、 132及ぴ 14 2へ、 収集された統計データ.を送る。 収集された統計データは、 NASクライア ントからのあて先の論理 I Pアドレス、 要求を行った NASクライアントの I P アドレス及び、 プライマリノード番号 (又は、 対称型の: ^には、 要求を受けた ノードのノード番号) より構成される。  Next, in step S406, the collected statistical data is sent to each of the statistical data collecting mechanisms 122, 132 and 142. The collected statistical data includes the logical IP address of the destination from the NAS client, the IP address of the NAS client that made the request, and the primary node number (or symmetric: ^ indicates the node of the node that received the request) Number).
次に、 ステップ S 407で、 NAS本体 121、 131及び 141は、 各々の ノードに対して NASクライアントから要求されたフアイル操作を実行する。 そして、 最後に、 ステップ S 408で、 NAS本体は、 NASクライアントか ら要求されたフアイル操作にっレ、ての応答を、 要求元の N ASクライアントへ送 信する。 この後に、 NAS本体は、 次の NASクライアントから要求を受けるた めに、 フアイノレ操作要求の受信を待つ。 次に、統計データ収麵構 122、 132及び 142の動作について説明する。 図 5は、 銃計データ収 β構 122、 132及び 142の動作のァルゴリズムを 示す。 Next, in step S407, the NAS bodies 121, 131, and 141 execute a file operation requested by the NAS client for each node. Then, finally, in step S408, the NAS transmits a response to the file operation requested by the NAS client to the requesting NAS client. After this, the NAS itself waits for a file operation request to receive a request from the next NAS client. Next, the operation of the statistical data collection structures 122, 132 and 142 will be described. FIG. 5 shows the algorithm of the operation of the gun gauge data collection β structures 122, 132 and 142.
図 5のアルゴリズムにおいて、 ステップ S 501で、 銃計データ収集機構 12 2、 132及び 142の動作が開始する。  In the algorithm of FIG. 5, in step S501, the operations of the gun gauge data collection mechanisms 122, 132, and 142 start.
次に、 ステップ S 502で、 各統計データ収集機構 122, 132及び 142 は、 それぞれの各 N AS本体から送られる統計データを、 各論理 I Pアドレス及 ぴ各プライマリーノード番号 (no d e-P) 毎に蓄積する。 即ち、 各論理 I P アドレス毎に、 且つ、 各プライマリーノード番号 (no de—P) 毎に、 フアイ ル操作要求数を、 統計データとして蓄積する。 また、 同時に、 全ファイル操作要 求数も、 統計データとして蓄積する。  Next, in step S502, each of the statistical data collection mechanisms 122, 132, and 142 compiles the statistical data sent from each of the NAS units for each logical IP address and each primary node number (no dep). accumulate. That is, the number of file operation requests is accumulated as statistical data for each logical IP address and for each primary node number (no de-P). At the same time, the number of all file operation requests is accumulated as statistical data.
次に、 ステップ S 503で、 前回集計した統計データを、 ノード 103に設け られた実 I P決 構 144に送る前に、 所定の時間を経過したカゝ否かが判断さ れる。 所定の時間を経過していないと判断された には、 S 506に進み処理 を終了する。 所定の時間を経過したと判断された^^には、 ステップ S 504に 進む。 '  Next, in step S 503, it is determined whether or not a predetermined time has elapsed before sending the statistical data collected last time to the actual IP scheme 144 provided in the node 103. If it is determined that the predetermined time has not elapsed, the process proceeds to S506 and ends. If it is determined that the predetermined time has elapsed, the process proceeds to step S504. '
次に、 ステップ S 504では、 今回集計した統計データを、 ノード 103に設 けられた実 I P決 ¾構 144に送信する。  Next, in step S 504, the statistical data compiled this time is transmitted to the actual IP decision structure 144 set in the node 103.
次に、 ステップ S 505では、 今回集計した統計データを、 ノード 103に設 けられた実 I P決定機構 144に送信した現在の時刻を、 統計データの新たな集 計時刻とする。  Next, in step S505, the current time at which the statistical data collected this time is transmitted to the actual IP determining mechanism 144 provided in the node 103 is set as a new total time of the statistical data.
そして、 ステップ S 506で、 処理を終了する。  Then, in step S506, the process ends.
次に、 実 I P決定機構 144の動作について説明する。 図 6は、 実 I P決定機 構 144の動作のアルゴリズムを示す。 特に本実施例では、 非対称型の場合につ いて、 このアルゴリズムを以下に説明する。 このアルゴリズムでは、 各ノードの 統計データ収»構から送られた統計データをさらに集計し、 且つ、 一定時間毎 に、 最適な 「論理 I Pアドレス一実 I Pアドレス変換表」 を作成し、 各ノードの あて先変更機構に送り返す。  Next, the operation of the actual IP determination mechanism 144 will be described. FIG. 6 shows an algorithm of the operation of the actual IP determination mechanism 144. In particular, in the present embodiment, this algorithm will be described below for the case of the asymmetric type. In this algorithm, statistical data sent from the statistical data collection structure of each node is further aggregated, and at regular time intervals, an optimal “logical IP address-to-real IP address conversion table” is created. Send it back to the destination change mechanism.
図 6のアルゴリズムにおいて、 ステップ S 601で、 実 I P決定機構 144の 動作が開始する。 In the algorithm of FIG. 6, in step S601, the real IP Operation starts.
次に、 ステップ S 602で、 実 I P決定機構 144は、 NAS装置 100内の 各ノード 101、 102又は 103が有する、 各統計データ収»構 122, 1 32及び 142から、 図 5を用いて説明した、 統計データを受信する。  Next, in step S 602, the real IP determination mechanism 144 uses the statistical data collection structures 122, 132, and 142 of each of the nodes 101, 102, or 103 in the NAS device 100 to explain using FIG. Received statistical data.
次に、 ステップ S 603で、 各論理 I Pアドレス毎に、 且つ、 各プライマリー ノード番号 (no d e—P) 毎に、 あて先要求数の総数を求める。  Next, in step S603, the total number of destination requests is calculated for each logical IP address and for each primary node number (no de-P).
次に、 ステップ S 604で、 前回の集計から予め定められた時間が経過してい る力否かが判断される。 前回の集計から予め定められた時間が経過していないと 判断された場合には、 ステップ S 602に戻り、 統計データの受信を継続する。 一方、前回の集計から予め定められた時間が経過していると判断された には、 ステップ S 605に進む。  Next, in step S604, it is determined whether or not the force has passed a predetermined time since the previous aggregation. If it is determined that the predetermined time has not elapsed since the previous aggregation, the process returns to step S602, and the reception of the statistical data is continued. On the other hand, if it is determined that the predetermined time has elapsed since the previous aggregation, the process proceeds to step S605.
次に、 ステップ S 605では、 全ての論理 I Pァドレスについて、 処理を完了 したかどう力 IJ断する。完了したと判断した;^には、ステップ S 602に戻り、 統計データの受信を継続する。 一方、 まだ未処理の論理 I Pアドレスがあると判 断した場合には、 ステップ S606に進み、 その論理 I Pァドレスについての処 理を行う。  Next, in step S605, it is determined whether or not processing has been completed for all logical IP addresses. If it is determined that the processing has been completed; return to step S602 to continue receiving statistical data. On the other hand, if it is determined that there is an unprocessed logical IP address, the process advances to step S606 to perform processing on the logical IP address.
ステップ S 606は、 ステップ S 607、 S 608及び S 609より構成され る。  Step S606 includes steps S607, S608, and S609.
ステップ S 607では、 論理 I Pァドレス (L I P— i ) あての要求数の総数 を求め、 これを r e q— t o t a 1とする。  In step S607, the total number of requests for the logical IP address (LIP-i) is obtained, and this is set as req-tota1.
次に、 ステップ S 608と S 609では、 論理 I Pァドレス (L I P— i) あ ての要求のうち、 最も多くの数の要求を受けたプライマリーノード番号 (ne x t -p r) とその最大の要求数 (ma x-r e q-no) を求める。 即ち S 60 8では、 (ma X- r e q-n o >TOTAL[L I P i, p-n o d e])の条件 が成り立つ力否かが判断される。 (ma X— r e q_n o>TOTAL[L I P i, p-n o d e]) の条件が成り立つ場合には、処理はステップ S 610へ進む。 Next, in steps S 608 and S 609, among the requests to the logical IP address (LIP-i), the primary node number (ne xt -pr) receiving the largest number of requests and the maximum number of requests (maxreq-no). That is, in S608, it is determined whether or not the force satisfies the condition of (maX-req-no> TOTAL [LIPi, p-node]). If the condition (maX—req_no> TOTAL [LIPi, p-node]) is satisfied, the process proceeds to step S610.
-、 その条件が成り立たなレ、 には、 処理はステップ S 609へ進む。  If the condition is not satisfied, the process proceeds to step S609.
次に、 ステップ S 609では、 論理 I Pアドレス (L I P_ i) のあて先を、 プライマリーノード番号 (ne x t— p r) に変更する。 同時に、 最大の要求数 (ma x-r e q-n o) を、 この: r ima r yノード向け要求数の合計値∑ TOTAL[L I P i, p— no d e]とする。 Next, in step S609, the destination of the logical IP address (LIP_i) is changed to the primary node number (next-pr). At the same time, the maximum number of requests Let (max x e qn o) be the total value of the number of requests for the r imary node ∑ TOTAL [LIP i, p—no de].
次に、 ステップ S 610では、 c u r— p rを論理 I Pァドレスが現在割当て られているノード (L I P— i) とする。  Next, in step S610, cu r-pr is set as the node (L IP-i) to which the logical IP address is currently assigned.
次に、 ステップ S 611では、 2つのプライマリーノード番号 c u r—p rと n e X t - rが等しくないかどうかが判断される。 cu r— p rと ne x t— p rが等しい^^には、 処理はステップ S 605に進む。 一方、 c u r _ p rと ne x t— p rが等しくない場合には、 処理は、 ステップ S 612に進む。 次に、ステップ S 612では、(ma x— r e q-n o > 1/2 * r e q— t o t a 1) が成り立つ力否力が判断される。 この条件が成り立たない場合には、 処 理はステップ S 605に進む。 一方、 この条件が成り立つ には、 処理は、 ス テツプ S 613に進む。  Next, in step S611, it is determined whether or not the two primary node numbers cu r—pr and neXt−r are not equal. If cur—pr and next—pr are equal to ^^, the process proceeds to step S605. On the other hand, when cu_pr is not equal to next—pr, the process proceeds to step S612. Next, in step S612, it is determined whether or not a force that satisfies (max-req-no> 1/2 * req-tota1) is satisfied. If this condition is not satisfied, processing proceeds to step S605. On the other hand, if this condition holds, the process proceeds to Step S613.
次に、 ステップ S 613では、 ノード103の有する実1 ?決¾^構144か ら、 各ノード 101、 102又は 103が有する、 あて先変更機構に対して、 論 理 I P (L I P- i) のあて先を、 現在のプライマリーノード番号 c u r— p r 力ら上述のプライマリーノード番号 ne x t—p rへ、変更する指示がなされる。 そして、 次に、 処理は、 ステップ S 605に進み、 次の論理 I Pアドレスの処 理を継続する。  Next, in step S613, the logical IP (LIP-i) of the logical IP (LIP-i) is transmitted to the destination changing mechanism of each of the nodes 101, 102, or 103 from the actual configuration of the node 103. An instruction is given to change the destination from the current primary node number cur_pr to the primary node number next-pr described above. Then, the process advances to step S605 to continue processing of the next logical IP address.
以上は、 先述べたように、 非対称型の場合について、 このアルゴリズムを以下 'に説明した。一方、対薩の には、プライマリーノード毎に要求数を集計し、 その間に大きな隔たりがある場合に、 「論理 I Pアドレス一実 I Pアドレスのぺ ァ」 を各ノードの処理要求数が均一に近くなるように設定し、 あて先変更機構に 送る。  As described above, this algorithm is described below for the case of the asymmetric type. On the other hand, the number of requests is calculated for each primary node, and if there is a large gap between them, the logical IP address-real IP address pair is calculated as follows: And send it to the destination change mechanism.
本アルゴリズム例では、 説明を単純にするため、 処理コスト最小のノードに、 できるだけ NASクライアントからの要求を集めようとしている。 しかし、 処理 コストを考慮した上で、 各ノ一ドの処理負荷を平坦化するように、 ァルゴリズム を改良することは容易である。  In this algorithm example, in order to simplify the explanation, we try to collect requests from NAS clients as much as possible at the node with the lowest processing cost. However, it is easy to improve the algorithm so that the processing load of each node is flattened in consideration of the processing cost.
次に、 あて先変更機構 123、 133及び 143の動作について説明する。 図 7は、 あて先変更機構 123、 133及び 143の動作のアルゴリズムを示す。 図 7において、 ステップ S 701で、 あて先変更機構は、 論理 I Pアドレスの あて先変更の処理を開始する。 Next, the operation of the destination changing mechanisms 123, 133 and 143 will be described. FIG. 7 shows an algorithm of the operation of the destination changing mechanisms 123, 133 and 143. In FIG. 7, in step S701, the destination change mechanism starts the process of changing the destination of the logical IP address.
次に、 ステップ S 702で、 c u r— p rを使用しているノードに、 メッセ一 ジを送り、 論理 I Pアドレス (L I P_ i) を使用している全セッションを一時 停止させる。 ここで停止とは、 論理 I Pアドレス (L I P— i) 宛ての要求をス タックすることを意味する。  Next, in step S702, a message is sent to the node using cu r -pr to suspend all sessions using the logical IP address (LIP_i). Stopping here means stacking requests addressed to the logical IP address (LIP-i).
次に、 ステップ S 703で、 指定された論理 I Pァドレスし I P- iのあて先 を、 n e X t _p rに対応する MACアドレスに切りかえるため、 (MACァドレ ス一L I P- iペア)を引数にもつ I P切り替えメッセージをネットワークに送 出する。 そして、 変更後の最適な 「論理 I Pアドレス一実 I Pァドレス変換表」 力 NASクライアントに送られ、 NASクライアントは、 論理 I Pアドレスに 対応する実 I Pァドレスが変更されたことを知ることができる。そして、 後は、 この実 I Pアドレスで NAS装置にアクセスすることができる。 し力 し、 NAS クライアントの上位層は、 従前の論理 I Pアドレスのままで NAS装置にァクセ スすることができる。  Next, in step S703, in order to switch the destination of the specified logical IP address and IP-i to the MAC address corresponding to neXt_pr, (MAC address-one LIP-i pair) is used as an argument. Send an IP switching message to the network. Then, the optimum logical IP address-real IP address conversion table after the change is sent to the NAS client, and the NAS client can know that the real IP address corresponding to the logical IP address has been changed. After that, the NAS device can be accessed with this real IP address. However, the upper layer of the NAS client can access the NAS device with the old logical IP address.
この論理 I Pアドレスの切り替えは、例えば、 g r a t u i t ou s ARP(a d d r e s s r e s o l u t i o n p r o t o c o l; ¾·使用する方 feなど、 よく知られた方法を使えばよい。 g r a t u i t o u s ARPは、 ARP要求が ない場合の、 ARP応答である。 即ち、 ARP応答が、 一斉通報ハードウェアァ ドレス対してァドレス指定されている ^^には、 ネットワーク上の全てのホスト は、 ARP応答を受信し且つ ARPキヤッッシュをリフレッシュするような、 A RP応答である。  This logical IP address can be switched by using a well-known method such as gratuit ou s ARP (address resolution protocol;; · how to use fe etc.) Gratuitous ARP is an ARP response when there is no ARP request. That is, if the ARP response is addressed to the broadcast hardware address ^^, all hosts on the network will receive the ARP response and refresh the ARP cache, such as refreshing the ARP cache. It is.
次に、 ステップ S 704で、 全 NASクライアントからの L I P_ iに向け、 全セッションを閉塞する。 この結果、 一時停止していた要求が捨てられ、 NAS クライアントにセッションが切れたことが通知される。 この通知を受けると、 N ASクライアントが L I P— i向けセッションを再確立し、 ファイル操作要求を 再送するので、 NASクライアントからは、 新しいノード n e x t— p rに対し て、 要求が向けられるようになる。  Next, in step S704, all sessions are closed toward LIP_i from all NAS clients. As a result, the suspended request is discarded, and the NAS client is notified that the session has been terminated. When this notification is received, the NAS client re-establishes the session for LIP-i and retransmits the file operation request, so that the request is directed from the NAS client to the new node next-pr.
そして、 最後に、 ステップ S 705で、 あて先変更機構は、 は終了する。  Then, finally, in step S705, the destination change mechanism ends.

Claims

請 求 の 範 囲 The scope of the claims
1 . NA Sクライアントから、 ネットワークを介してアクセスされる、 複数の ノードから構成される NAS装置の NA S負荷を分散する NAS負荷分散システ ムにおレ、て、 当該 N A S装置が複数の仮想的な I Pアドレスを有することを特徴 とする N A S負荷分散システム。  1. In a NAS load distribution system that distributes the NAS load of a NAS device composed of multiple nodes, which is accessed via a network from a NAS client, the NAS device is connected to multiple virtual devices. NAS load balancing system with a unique IP address.
2. fiflBNA Sクライアント毎に、 ΙίίΐΕ複数の仮想的な I Pアドレスの中から 一つを静的に割り当てる手段を有することを特徴とする、 請求項 1に記載の N A S負荷分散システム。 2. The NAS load balancing system according to claim 1, further comprising means for statically assigning one of a plurality of virtual IP addresses to each fiflBNAS client.
3. ttf!BNA S装置は、 複数の論理 I Pアドレスを有し、 前記 NA Sクライア ントに、 複数の論理 I Pアドレスのうちのいずれかの論理 I Pアドレスを選択さ せることにより、 NA Sクライアントの、 ファイノレアクセスの局在†生に基づいた 負荷分散を行う手段を有することを特徴とする、 NA S負荷分散システム。 3. The ttf! BNAS device has a plurality of logical IP addresses, and allows the NAS client to select any one of the plurality of logical IP addresses so that the NAS client can select the logical IP address. A NAS load balancing system, comprising means for performing load balancing based on localization of file access.
4. 複数のノードから構成される前記 NAS装置において、 tiff己仮想的な I P 了ドレスに向けて、 NA Sクライアントがファイル操作要求を送信する手段を有 することを特徴とする、 請求項 2に記載の N A S負荷分散システム。 4. The NAS device comprising a plurality of nodes, wherein the NAS client has means for transmitting a file operation request to a tiff self-virtual IP address. The described NAS load balancing system.
.  .
5. 複数のノードから構成される前記 NAS装置において、 ttrlB仮想的な I P ァドレスを、 ΙΐίΐΒ各ノードに対応する実 I Ρァドレスに動的に変換する手段を有 することを特徴とする、 請求項 1に記載の NA S負荷分散システム。  5. The NAS device comprising a plurality of nodes, characterized in that the NAS device has means for dynamically converting a ttrlB virtual IP address into a real I address corresponding to each node. 2. The NAS load balancing system according to 1.
6 . NA Sクライアントから、 ネットワークを介してアクセスされる、 複数の ノードから構成される NA S装置において、 前記 NA S装置にアクセスするクラ イアント毎に、 アクセスするフアイルの統計情報を収集する手段を有することを 特徴とする N A S負荷分散システム。 6. In a NAS device composed of a plurality of nodes accessed from a NAS client via a network, a means for collecting statistical information of a file to be accessed is provided for each client accessing the NAS device. NAS load balancing system characterized by having.
7. ΙίίΐΒ I Pアドレスの変換手段は、 請求項 6に記載の前記統計情報を使用し て、 前記 N A Sクライアントのファイルァクセスの局在性に基づレヽた最適化を行 い、 前記仮想的な I Pアドレスを、 最適なノードの実 I Pァドレスに変換するこ とを特徴とする、 請求項 5に記載の N A S負荷分散方式。 7. The IP address conversion means performs optimization based on the locality of file access of the NAS client using the statistical information according to claim 6, and 6. The NAS load balancing method according to claim 5, wherein the IP address is converted to a real IP address of an optimal node.
8. Ιίίΐ己 NA Sクライアント毎のアクセスパターンに従って、 'ΙίΠΕ仮想的な I Ρアドレスを、 局在性が高いノードの実 I Ρアドレスに、 直接的に切り換えるよ うに変換することを特徴とする、 請求項 7に記載の NA S負荷分散方式。 8. Self-Nas According to the access pattern of each NAS client, the 'ΙίΠΕ virtual IΡ address is converted to be directly switched to the real I の address of a highly localized node, The NAS load balancing method according to claim 7.
9. 廳己仮想 I Ρアドレス力ら膽己実 I Ρアドレスへの変換の変更が必要な場 合には、 前記変換の変更に従って、 動作の変更される T C PZ I Ρセッションを 切断し、 tuiBNA sクライアントから tfriaセッションの再接続を行うことを特徴 とする、 請求項 7に N A S負荷分散方 9. If it is necessary to change the translation of the address to a virtual address I, such as the address of the host, I will change the operation of the TC PZ I according to the change of the translation. The method according to claim 7, wherein the s client reconnects the tfria session.
PCT/JP2002/012787 2002-12-05 2002-12-05 Nas load distribution system WO2004051943A1 (en)

Priority Applications (3)

Application Number Priority Date Filing Date Title
PCT/JP2002/012787 WO2004051943A1 (en) 2002-12-05 2002-12-05 Nas load distribution system
JP2004556814A JP3949688B2 (en) 2002-12-05 2002-12-05 NAS load balancing system
US11/114,217 US8578053B2 (en) 2002-12-05 2005-04-26 NAS load balancing system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2002/012787 WO2004051943A1 (en) 2002-12-05 2002-12-05 Nas load distribution system

Related Child Applications (1)

Application Number Title Priority Date Filing Date
US11/114,217 Continuation US8578053B2 (en) 2002-12-05 2005-04-26 NAS load balancing system

Publications (1)

Publication Number Publication Date
WO2004051943A1 true WO2004051943A1 (en) 2004-06-17

Family

ID=32449009

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2002/012787 WO2004051943A1 (en) 2002-12-05 2002-12-05 Nas load distribution system

Country Status (2)

Country Link
JP (1) JP3949688B2 (en)
WO (1) WO2004051943A1 (en)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006209294A (en) * 2005-01-26 2006-08-10 Hitachi Ltd Storage system for distributing access load
JP2007087266A (en) * 2005-09-26 2007-04-05 Hitachi Ltd Storage system and storage device
JP2016143249A (en) * 2015-02-02 2016-08-08 富士通株式会社 Storage system and storage control program
CN106790565A (en) * 2016-12-27 2017-05-31 中国电子科技集团公司第五十二研究所 A kind of network attached storage group system
US9813375B2 (en) 2014-10-23 2017-11-07 Fujitsu Limited Relay apparatus, relay system, and relay method

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1027148A (en) * 1996-07-10 1998-01-27 Hitachi Ltd Server systesm for internet
JPH10307783A (en) * 1997-05-07 1998-11-17 N T T Data:Kk Site access control system and recording medium
JP2002259354A (en) * 2001-03-01 2002-09-13 Hitachi Ltd Network system and load distributing method
JP2002305532A (en) * 2001-04-03 2002-10-18 Nec Commun Syst Ltd Load distributing system for ip server in lan emulation and its load distributing method

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000349823A (en) * 1999-06-09 2000-12-15 Nec Corp Available cluster system and available method for cluster system
JP2002288014A (en) * 2001-03-27 2002-10-04 Fujitsu Ltd File control system and file data writing method
JP3898498B2 (en) * 2001-12-06 2007-03-28 富士通株式会社 Server load balancing system

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1027148A (en) * 1996-07-10 1998-01-27 Hitachi Ltd Server systesm for internet
JPH10307783A (en) * 1997-05-07 1998-11-17 N T T Data:Kk Site access control system and recording medium
JP2002259354A (en) * 2001-03-01 2002-09-13 Hitachi Ltd Network system and load distributing method
JP2002305532A (en) * 2001-04-03 2002-10-18 Nec Commun Syst Ltd Load distributing system for ip server in lan emulation and its load distributing method

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
"Web Server no fuka Bunsan Tool URL Switch ya Session Kanri ni Taio, EC site ya intranet ni Donyu Susumu", NIKKEI INTERNET TECHNOLOGY, April 2000 (2000-04-01), pages 142 - 151, XP002979141 *
YOSHITAKE SHINKAI ET AL: "Cluster File System: HAMFS", FUJITSU, vol. 50, no. 4, July 1999 (1999-07-01), pages 210 - 214, XP002979140 *

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006209294A (en) * 2005-01-26 2006-08-10 Hitachi Ltd Storage system for distributing access load
JP4699768B2 (en) * 2005-01-26 2011-06-15 株式会社日立製作所 Storage system that distributes access load
JP2007087266A (en) * 2005-09-26 2007-04-05 Hitachi Ltd Storage system and storage device
US9813375B2 (en) 2014-10-23 2017-11-07 Fujitsu Limited Relay apparatus, relay system, and relay method
JP2016143249A (en) * 2015-02-02 2016-08-08 富士通株式会社 Storage system and storage control program
CN106790565A (en) * 2016-12-27 2017-05-31 中国电子科技集团公司第五十二研究所 A kind of network attached storage group system
CN106790565B (en) * 2016-12-27 2019-11-29 中国电子科技集团公司第五十二研究所 A kind of network attached storage group system

Also Published As

Publication number Publication date
JP3949688B2 (en) 2007-07-25
JPWO2004051943A1 (en) 2006-04-06

Similar Documents

Publication Publication Date Title
CN111464592B (en) Load balancing method, device, equipment and storage medium based on micro-service
US20050223096A1 (en) NAS load balancing system
US7051115B2 (en) Method and apparatus for providing a single system image in a clustered environment
US9083709B2 (en) Virtual internet protocol migration and load balancing
US7644159B2 (en) Load balancing for a server farm
US6965930B1 (en) Methods, systems and computer program products for workload distribution based on end-to-end quality of service
US6871347B2 (en) Method and apparatus for facilitating load balancing across name servers
US6397260B1 (en) Automatic load sharing for network routers
EP2652924B1 (en) Synchronizing state among load balancer components
CN107846358B (en) Data transmission method, device and network system
CN104618243B (en) Method for routing, apparatus and system, Scheduling of Gateway method and device
KR20030019900A (en) Parallel information delivery method based on peer-to-peer enabled distributed computing technology and the system thereof
CN102025630A (en) Load balancing method and load balancing system
KR20110002808A (en) Cooperative cache method and contents providing method and using request proportion apparatus
CN103458013A (en) Streaming media server cluster load balancing system and balancing method
CN111638957A (en) Method for realizing cluster sharing type public cloud load balance
WO2009036353A2 (en) Client affinity in distributed load balancing systems
JP2000307657A (en) Router monitor system for data transmission system using network dispatcher for host cluster
US20040193716A1 (en) Client distribution through selective address resolution protocol reply
Xie et al. Supporting seamless virtual machine migration via named data networking in cloud data center
JP2013090072A (en) Service provision system
CN100414936C (en) Method for balancing load between multi network cards of network file system server
KR20050071673A (en) Efficiently supporting multiple native network protocol implementations in a single system
WO2004051943A1 (en) Nas load distribution system
JP2012175351A (en) Service distribution method, service distribution device, and program

Legal Events

Date Code Title Description
AK Designated states

Kind code of ref document: A1

Designated state(s): JP US

AL Designated countries for regional patents

Kind code of ref document: A1

Designated state(s): AT BE BG CH CY CZ DE DK EE ES FI FR GB GR IE IT LU MC NL PT SE SI SK TR

121 Ep: the epo has been informed by wipo that ep was designated in this application
WWE Wipo information: entry into national phase

Ref document number: 2004556814

Country of ref document: JP

WWE Wipo information: entry into national phase

Ref document number: 11114217

Country of ref document: US

122 Ep: pct application non-entry in european phase