JP2008158844A - Resource management device and method - Google Patents

Resource management device and method Download PDF

Info

Publication number
JP2008158844A
JP2008158844A JP2006347461A JP2006347461A JP2008158844A JP 2008158844 A JP2008158844 A JP 2008158844A JP 2006347461 A JP2006347461 A JP 2006347461A JP 2006347461 A JP2006347461 A JP 2006347461A JP 2008158844 A JP2008158844 A JP 2008158844A
Authority
JP
Japan
Prior art keywords
resource
job
user device
network
resource management
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2006347461A
Other languages
Japanese (ja)
Inventor
Atsushi Taniguchi
篤 谷口
Yukio Chikushima
幸男 築島
Yasunori Samejima
康則 鮫島
Akira Hirano
章 平野
Kazuhisa Yamada
一久 山田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2006347461A priority Critical patent/JP2008158844A/en
Publication of JP2008158844A publication Critical patent/JP2008158844A/en
Pending legal-status Critical Current

Links

Images

Abstract

<P>PROBLEM TO BE SOLVED: To achieve the high efficiency of the management function of network resources or computer resources. <P>SOLUTION: This resource management device performs assignment of network resources or computer resources necessary for execution of a job by identifying a type of the job, and to refer to a job database showing a service class corresponding to the type of the job. Thus, it is possible for a user device to receive the provision of resources with quality corresponding to the service of the job only by transmitting job identification information. <P>COPYRIGHT: (C)2008,JPO&INPIT

Description

本発明は、ユーザにネットワーク資源またはコンピュータ資源を提供する資源管理システムのスケジューリングの効率性を提供する技術に関する。   The present invention relates to a technique for providing scheduling efficiency of a resource management system that provides network resources or computer resources to a user.

なお、本発明では、コンピュータ資源は、ネットワークに接続されたコンピュータ装置やサーバなどのジョブを実行する機能を有する資源を言い、ネットワーク資源は、ネットワーク上の伝送路またはこの伝送路に設定されるパスおよび当該パスを設定または管理する機能を有するノード装置を含み、コンピュータ資源相互間の接続を行うための資源のことを言う。また、単に「資源」と言えばコンピュータ資源およびネットワーク資源の双方あるいはいずれか一方を言うこととする。   In the present invention, the computer resource is a resource having a function of executing a job such as a computer device or a server connected to the network, and the network resource is a transmission path on the network or a path set in this transmission path. And a node device including a node device having a function of setting or managing the path, and a resource for connecting computer resources. In addition, simply speaking, “resources” refers to computer resources and / or network resources.

分散コンピューティングシステム(分散システム)は、コンピュータや記憶装置、ネットワーク等の多様な資源から構成される。このためある仕事(ジョブ)に必要なサービス品質(QoS:Quality of Service)を得るためには複数の資源にわたってサービス品質を保証するような資源管理技術が必要となる。   A distributed computing system (distributed system) includes various resources such as a computer, a storage device, and a network. For this reason, in order to obtain a quality of service (QoS) required for a certain job (job), a resource management technique that guarantees the service quality over a plurality of resources is required.

特に、独立して管理される複数ドメイン間で資源を共有するようなグリッドコンピューティングではシステム全体の資源を一元的に管理することが許容されないことが多い。この種のシステムでは複数の独立した資源管理機構を利用したQoS保証機能が必要になる。   In particular, in grid computing in which resources are shared among a plurality of domains managed independently, it is often not permitted to centrally manage the resources of the entire system. This type of system requires a QoS guarantee function using a plurality of independent resource management mechanisms.

分散システムにおいてQoSを保証する従来の機能として、資源の事前予約が知られている。事前予約とはジョブの実行に必要な個々の資源において一定の時間帯にQoSを保証する操作である。   As a conventional function for guaranteeing QoS in a distributed system, advance reservation of resources is known. Advance reservation is an operation for guaranteeing QoS in a certain period of time for each resource necessary for job execution.

図1および図2に従来の資源管理システムを示している(例えば、特許文献1参照)。図1は従来の資源管理システムの全体構成図である。図2は従来の資源管理装置とユーザ装置との間での通信手順を示すシーケンス図である。ユーザ装置1は資源管理装置2に予約要求を行う(S1)。予約が空いている場合は予約証明書をユーザ装置1に発行する(S2)。予約した時間に達すると資源管理装置2は、ユーザ装置1に対してコンピュータ資源3およびネットワーク資源4を提供し(S3)、これによりユーザ装置は、ネットワーク資源4を介してコンピュータ資源3を利用できる。   1 and 2 show a conventional resource management system (see, for example, Patent Document 1). FIG. 1 is an overall configuration diagram of a conventional resource management system. FIG. 2 is a sequence diagram showing a communication procedure between a conventional resource management device and a user device. The user device 1 makes a reservation request to the resource management device 2 (S1). If the reservation is available, a reservation certificate is issued to the user device 1 (S2). When the reserved time is reached, the resource management device 2 provides the computer resource 3 and the network resource 4 to the user device 1 (S3), so that the user device can use the computer resource 3 via the network resource 4. .

また、ユーザ装置1がジョブの開始時刻および終了時刻をグリッドスケジューラに入力することでグリッドスケジューラは資源管理装置2に資源を予約しジョブを実行させるグリッドサービスNW(ネットワーク)の実験が行われている(例えば、非特許文献1参照)。   In addition, an experiment of a grid service NW (network) in which the user device 1 inputs the job start time and end time to the grid scheduler so that the resource scheduler 2 reserves the resource and executes the job is performed. (For example, refer nonpatent literature 1).

特開2000−259537号公報JP 2000-259537 A T.Kudoh et al,“G−lambda:an interface for bandwidth reservation from applications and middleware”AGNM 2006T.A. Kudoh et al, "G-lamda: an interface for bandwidth reservation from applications and middleware" AGNM 2006

従来の技術ではユーザ装置は必要なときに必要な分だけ資源を予約することができるが、ユーザ装置では、例えば、ジョブの実行時間を予測できない。時間を実際の実行時間以上に見積もった場合には、時間が余るとそのユーザ装置が予約を開放して初めて、他のユーザ装置が予約できる状態になる。また、時間を実際の実行時間より短く見積もった場合には、現状の技術ではそれまで計算した結果を破棄してしまう可能性がある。   In the conventional technology, the user device can reserve the necessary amount of resources when necessary, but the user device cannot predict the job execution time, for example. When the time is estimated to be more than the actual execution time, the user device can only make a reservation when the user device releases the reservation when the time is over. Also, if the time is estimated to be shorter than the actual execution time, the current technology may discard the result calculated so far.

このような課題を解決するためには、ユーザ装置で必要な資源を正確に計算し、ユーザ装置が過不足無く資源を予約できればよいが、ユーザ装置にそのような負担を求めることは望ましいことではない。また、ユーザ装置では、ネットワーク全体の資源を全て把握することは困難であるから、ユーザ装置が正確に予約する資源の計算を行おうとしても計算の基となる資源情報を得ることが困難である。   In order to solve such a problem, it is only necessary to accurately calculate the necessary resources in the user device and to reserve the resource without excess or deficiency, but it is desirable to ask the user device for such a burden. Absent. In addition, since it is difficult for the user device to grasp all the resources of the entire network, it is difficult to obtain resource information that is the basis of the calculation even if the user device tries to accurately calculate the resource that is reserved. .

したがって、ネットワーク側でユーザ装置からの資源予約を管理する機能を有し、効率の良い資源割当てを行うことは有用である。   Therefore, it is useful to have a function of managing resource reservations from user devices on the network side and perform efficient resource allocation.

本発明は、このような背景の下に行われたものであって、ネットワーク資源やコンピュータ資源の管理機能の高効率化を実現することができる資源管理装置および方法を提供することを目的とする。   The present invention has been made under such a background, and it is an object of the present invention to provide a resource management apparatus and method capable of realizing a highly efficient management function of network resources and computer resources. .

上述したように、例えば、ジョブの種類を識別したり、ジョブの実行時間を予測することは資源を最大限活用するために有効である。そこで本発明ではジョブの種類を識別して最適な資源の割当てを行うことを特徴とする。これにより、例えば、ジョブを分割して実行できるものと、連続した予約が必要なものとを識別し、分割実行できるものに対しては、細切れに空いている予約タイムスロットに対し予約を入れるなどの処理により資源を有効利用することができるようになる。以下では、ジョブの種類や予測される実行時間や要求される信頼性に応じて資源を割当てる技術について説明する。   As described above, for example, identifying the type of job or predicting the execution time of the job is effective for maximizing the use of resources. Therefore, the present invention is characterized in that the type of job is identified and optimal resource allocation is performed. This makes it possible, for example, to distinguish between jobs that can be executed in a divided manner and those that require continuous reservations, and for those that can be executed in a divided manner, reservations are made for reservation time slots that are vacant. This makes it possible to effectively use resources. Hereinafter, a technique for allocating resources according to the type of job, the estimated execution time, and the required reliability will be described.

また、本発明では、資源管理装置がジョブの種類に対応したサービスクラスを示すジョブデータベースを参照することにより、ユーザ装置はジョブ識別情報を送るだけでジョブのサービスに応じた品質の資源の提供を受けることができる。   Further, in the present invention, the resource management device refers to the job database indicating the service class corresponding to the job type, so that the user device can provide quality resources according to the job service simply by sending job identification information. Can receive.

すなわち、本発明は、ユーザ装置から送信される資源予約要求を受け取って該当する資源の空きの有無を判定し、空きがある場合には、当該資源予約要求を満たす資源を前記ユーザ装置に割当てる資源管理装置である。   That is, the present invention receives a resource reservation request transmitted from a user device, determines whether or not the corresponding resource is free, and if there is a free resource, allocates a resource that satisfies the resource reservation request to the user device. It is a management device.

ここで、本発明の特徴とするところは、ジョブの種類を示す識別情報とジョブ毎に必要なサービスクラスの情報との対応関係が記録されたジョブデータベースと、ネットワーク資源とこのネットワーク資源の品質を示すサービスクラス情報とを保持する資源情報保持手段と、ユーザ装置からジョブの識別情報を含む資源予約要求を受け取ると前記ジョブデータベースを参照し当該ジョブの識別情報から当該ジョブのサービスクラスの情報を検索し検索したサービスクラスの要求品質を満たすネットワーク資源を前記資源情報保持手段に保持されているネットワーク資源の品質を示すサービスクラス情報に基づき決定して前記ユーザ装置に割当てる手段とを備えたところにある。   Here, the present invention is characterized by a job database in which correspondence information between identification information indicating the type of job and service class information necessary for each job is recorded, network resources, and quality of the network resources. Resource information holding means for holding the service class information shown, and when a resource reservation request including job identification information is received from the user apparatus, the job database is referred to and the service class information of the job is searched from the job identification information And a means for determining a network resource satisfying the required quality of the retrieved service class based on service class information indicating the quality of the network resource held in the resource information holding means and allocating it to the user apparatus. .

このように、前記ジョブデータベースを参照することより、ユーザに対して最適な品質の資源を提供することができ、ユーザのQoSを満足させることができる。   In this way, by referring to the job database, it is possible to provide resources of optimum quality to the user and satisfy the user's QoS.

例えば、前記ネットワーク資源は、ネットワーク上の伝送路または当該伝送路に設定されるパスを含み、前記サービスクラスの情報は、当該パスまたは伝送路の遅延量またはパケット損失許容量の情報を含む。このように、ジョブデータベースに、ネットワーク資源の遅延量またはパケット損失許容量の情報を含むことによってユーザのQoSを満足させることができる。   For example, the network resource includes a transmission path on the network or a path set in the transmission path, and the service class information includes information on a delay amount or packet loss tolerance of the path or transmission path. Thus, the user's QoS can be satisfied by including information on the delay amount of the network resource or the allowable packet loss amount in the job database.

また、前記ジョブデータベースは、ジョブのプロセスと当該ジョブのプロセス毎の過去の実行時間の履歴との対応関係を保持し、ユーザ装置から資源予約要求を受け取ると前記ジョブデータベースを参照し当該資源予約要求に含まれるジョブの識別情報に基づき当該ジョブとその実行時間の履歴との対応関係を参照し当該ジョブの実行時間を予測してこの予測した実行時間を満たす資源を決定して前記ユーザ装置に割当てる手段を備えることができる。   Further, the job database holds a correspondence relationship between a job process and a history of past execution times for each process of the job, and upon receiving a resource reservation request from a user device, the job database is referred to and the resource reservation request is referred to. Based on the identification information of the job included in the job, the correspondence relationship between the job and its execution time history is referred to, the execution time of the job is predicted, and a resource satisfying the predicted execution time is determined and allocated to the user device. Means may be provided.

このように、前記ジョブデータベースを参照することによりジョブの実行にかかる時間を事前に知ることができ、資源の効率化を図ることができる。   In this way, by referring to the job database, it is possible to know in advance the time required to execute a job, and it is possible to improve resource efficiency.

また、ユーザ装置に接続されたネットワーク資源のサービスクラスと当該ユーザ装置が実行中または実行予定のジョブのサービスクラスとを比較する手段と、前記比較する手段による比較結果に基づき前記ユーザ装置に接続されたネットワーク資源が当該ユーザ装置が実行中または実行予定のジョブの要求品質を満たせない場合には、当該ユーザ装置の要求品質を満たすネットワーク資源を有するコンピュータ資源を探索する手段と、前記探索する手段の探索結果に基づき前記ユーザ装置の要求品質を満たすネットワーク資源を有するコンピュータ資源が見つかったときには、前記ユーザ装置と当該コンピュータ資源との接続経路となるネットワーク資源を当該ユーザ装置に割当て、前記実行中または実行予定のジョブを当該コンピュータ資源に移行する手段とを備えることができる。   Further, the means for comparing the service class of the network resource connected to the user device and the service class of the job being executed or scheduled to be executed by the user device and the user device are connected based on the comparison result by the means for comparing. If the network resource cannot satisfy the required quality of the job being executed or scheduled to be executed by the user device, means for searching for a computer resource having the network resource that satisfies the required quality of the user device; and When a computer resource having a network resource that satisfies the required quality of the user device is found based on a search result, a network resource that becomes a connection path between the user device and the computer resource is allocated to the user device, and the execution or execution is being performed. Schedule the job to the computer resource It can comprise means to move to.

このように、ユーザ装置に接続されているネットワーク資源では、ユーザ装置のジョブが満足に実行できない場合でも、ユーザ装置のジョブが満足に実行可能なネットワーク資源およびコンピュータ資源を探索し、当該ユーザ装置の代理として当該コンピュータ資源を利用し、ユーザ装置と当該コンピュータ資源との接続経路としてのネットワーク資源を当該ユーザ装置に割当てることによって、ユーザ装置の要求品質を満たす資源を効率良く提供することができる。   In this way, even if the network resource connected to the user device cannot execute the job of the user device satisfactorily, the network resource and the computer resource that can execute the job of the user device satisfactorily are searched for. By using the computer resource as a proxy and allocating a network resource as a connection path between the user device and the computer resource to the user device, it is possible to efficiently provide a resource that satisfies the required quality of the user device.

また、ユーザ装置から計算結果の情報を収集する計算結果情報収集手段と、前記計算結果情報収集手段により収集された計算結果に基づきジョブの実行結果を判定する手段と、前記判定する手段による判定結果に基づき計算結果に異常を発見した場合には当該計算結果を破棄すると共に再計算を前記ユーザ装置に促す手段と、前記計算結果情報収集手段による計算結果情報収集過程でジョブの実行時間が予約時間を超過した場合には予約時間を延長または再予約を行う手段とを備えることができる。   A calculation result information collecting unit for collecting calculation result information from the user device; a unit for determining a job execution result based on the calculation result collected by the calculation result information collecting unit; and a determination result by the determining unit. If the calculation result is found to be abnormal based on the calculation result information discarding and prompting the user device to recalculate, and the execution time of the job in the calculation result information collecting process by the calculation result information collecting means Means for extending the reservation time or re-reserving when the time exceeds the limit.

これにより、無効となる計算結果を速やかに破棄することにより、ジョブ実行の効率化を図ると共に、計算結果の信頼性を向上させることができる。さらに、ジョブの途中で予約時間が終り、ジョブが無効となることを回避できる。   Thus, by quickly discarding invalid calculation results, it is possible to improve the efficiency of job execution and improve the reliability of the calculation results. Furthermore, it can be avoided that the reservation time ends in the middle of the job and the job becomes invalid.

また、ユーザ装置から信頼性向上要求を受け取ると一つのジョブの要求に対し、要求品質を満たす冗長なネットワーク資源を複数割当てる手段と、ネットワーク資源の障害発生時には障害が発生したネットワーク資源を迂回する他ネットワーク資源に切替える手段とを備えることができる。これにより、ネットワークの信頼性を向上させることができる。   In addition, upon receiving a reliability improvement request from a user device, a means for allocating a plurality of redundant network resources satisfying the required quality for one job request, and bypassing the failed network resource when a network resource failure occurs Means for switching to network resources. Thereby, the reliability of a network can be improved.

また、ユーザ装置から信頼性向上要求を受け取ると一つのジョブの要求に対し、冗長なコンピュータ資源を複数割当てる手段と、コンピュータ資源の障害発生時には障害が発生したコンピュータ資源を障害が発生していないコンピュータ資源に切り替える手段とを備えることができる。これにより、コンピュータ資源の信頼性を向上させることができる。   In addition, upon receiving a request for improving reliability from a user apparatus, means for allocating a plurality of redundant computer resources for one job request, and a computer in which a failure has not occurred in a computer resource in which a failure has occurred when a computer resource failure has occurred Means for switching to resources. Thereby, the reliability of computer resources can be improved.

また、本発明を資源管理方法として観点から観ることもできる。すなわち、本発明は、ユーザ装置から送信される資源予約要求を受け取って該当する資源の当該ユーザへの割当可否を判定し、割当可能である場合には、当該資源予約要求を満たす資源を前記ユーザ装置に割当てる資源管理装置が実行する資源管理方法である。   The present invention can also be viewed from a viewpoint as a resource management method. That is, the present invention receives a resource reservation request transmitted from a user device, determines whether or not the corresponding resource can be allocated to the user, and if the resource can be allocated, assigns the resource satisfying the resource reservation request to the user. This is a resource management method executed by a resource management device assigned to a device.

ここで、本発明の特徴とするところは、前記資源管理装置がジョブの種類を示す識別情報とジョブ毎に必要なサービスクラスの情報との対応関係をジョブデータベースに記録し、ネットワーク資源とこのネットワーク資源の品質を示すサービスクラス情報とを資源情報保持手段に保持し、ユーザ装置からジョブの識別情報を含む資源予約要求を受け取ると前記ジョブデータベースを参照し当該ジョブの識別情報から当該ジョブのサービスクラスの情報を検索し検索したサービスクラスの要求品質を満たす資源を前記資源情報保持手段に保持されている資源の品質を示すサービスクラス情報に基づき決定して前記ユーザ装置に割当てるところにある。   Here, a feature of the present invention is that the resource management device records a correspondence relationship between identification information indicating a job type and service class information necessary for each job in a job database, and the network resource and the network Service class information indicating the quality of the resource is held in the resource information holding means, and when a resource reservation request including job identification information is received from the user apparatus, the job database is referred to and the job class of the job is determined from the job identification information. The resource satisfying the required quality of the retrieved service class is determined based on the service class information indicating the quality of the resource held in the resource information holding means and allocated to the user apparatus.

また、本発明をプログラムとしての観点から観ることもできる。すなわち、本発明は、汎用の情報処理装置にインストールすることにより、その汎用の情報処理装置に、本発明の資源管理装置の機能に相応する機能を実現させるプログラムである。   The present invention can also be viewed from the viewpoint of a program. That is, the present invention is a program that, when installed in a general-purpose information processing apparatus, causes the general-purpose information processing apparatus to realize a function corresponding to the function of the resource management apparatus of the present invention.

本発明のプログラムは記録媒体に記録されることにより、前記汎用の情報処理装置は、この記録媒体を用いて本発明のプログラムをインストールすることができる。あるいは、本発明のプログラムを保持するサーバからネットワークを介して直接前記汎用の情報処理装置に本発明のプログラムをインストールすることもできる。   By recording the program of the present invention on a recording medium, the general-purpose information processing apparatus can install the program of the present invention using this recording medium. Alternatively, the program of the present invention can be directly installed on the general-purpose information processing apparatus via a network from a server that holds the program of the present invention.

これにより、汎用の情報処理装置を用いて、本発明の資源管理装置に相応する機能を実現することができる。   Thereby, the function corresponding to the resource management apparatus of this invention is realizable using a general purpose information processing apparatus.

なお、本発明のプログラムは、汎用の情報処理装置によって直接実行可能なものだけでなく、ハードディスクなどにインストールすることによって実行可能となるものも含む。また、圧縮されたり、暗号化されたりしたものも含む。   The program of the present invention includes not only a program that can be directly executed by a general-purpose information processing apparatus but also a program that can be executed by installing it on a hard disk or the like. Also included are those that are compressed or encrypted.

本発明によれば、ネットワーク資源やコンピュータ資源の管理機能の高効率化を実現することができる。   According to the present invention, it is possible to achieve high efficiency of management functions for network resources and computer resources.

本発明の資源管理装置は、ジョブの実行にかかる時間を予測し、サービスに応じた品質の資源を提供することにより資源を有効活用する技術を提供することができる。以下では、この資源管理装置について詳細に説明する。   The resource management apparatus according to the present invention can provide a technology for effectively utilizing resources by predicting the time required for job execution and providing resources of quality according to the service. Hereinafter, this resource management apparatus will be described in detail.

(第一の実施形態)
第一の実施形態を図3ないし図5を参照して説明する。図3は第一の実施形態における資源管理装置の機能ブロック図である。図4は第一の実施形態を説明するための資源管理システムの全体構成図である。図5は第一の実施形態を説明するためのシーケンス図である。
(First embodiment)
A first embodiment will be described with reference to FIGS. FIG. 3 is a functional block diagram of the resource management apparatus in the first embodiment. FIG. 4 is an overall configuration diagram of the resource management system for explaining the first embodiment. FIG. 5 is a sequence diagram for explaining the first embodiment.

本実施形態ではネットワークはMPLS(Multi Protocol Label
Switching)あるいはGMPLS(Generalized MPLS)においてパスの情報を提供する例である。また、資源管理装置2の中に資源を予約するスケジューラ部22の機能を含んだ構成例を示している。しかし、スケジューラ部22は非特許文献1にあるように資源管理装置2の外部にあってもよいので資源管理装置自体の必須要素ではない。
In this embodiment, the network is MPLS (Multi Protocol Label).
Switching) or GMPLS (Generalized MPLS) is an example of providing path information. In addition, a configuration example including the function of the scheduler unit 22 for reserving resources in the resource management device 2 is shown. However, since the scheduler unit 22 may be outside the resource management device 2 as described in Non-Patent Document 1, it is not an essential element of the resource management device itself.

ユーザ装置1は資源管理装置2のスケジューラ部22に対し、ジョブ開始時刻および終了時刻およびジョブの識別情報およびネットワーク帯域を含む資源の予約要求を送る(S10)。予約要求の送信は、ユーザ装置1のユーザが直接ユーザ装置1に指示してもよいし、あるいは、ユーザ装置1がジョブを実行すると自動的に資源管理装置2に必要となる資源を予約するようにしてもよい。   The user device 1 sends a resource reservation request including the job start time and end time, job identification information, and network bandwidth to the scheduler unit 22 of the resource management device 2 (S10). The transmission of the reservation request may be instructed by the user of the user device 1 directly to the user device 1 or, when the user device 1 executes a job, the resource management device 2 automatically reserves necessary resources. It may be.

資源管理装置2は、ユーザ装置1から受け取ったジョブ識別情報をジョブデータベース20に送り、要求されたジョブに対する必要なサービスクラスの情報を検索して取得する(S11、S12)。   The resource management device 2 sends the job identification information received from the user device 1 to the job database 20, and searches for and acquires information on the required service class for the requested job (S11, S12).

ジョブサービスクラスの情報は遅延量およびパケット損失許容量の他に、遅延変動量および分散量などにより決められ、例えば、映像配信ではリアルタイム性およびパケット損失も最小であることが要求されるためサービスクラス♯1で予約し、計算処理は、遅延およびパケット損失に対する要求が映像配信より軽いためサービスクラス♯1よりも制限が緩いサービスクラス♯5で予約するなどである。   Job service class information is determined not only by delay amount and packet loss tolerance, but also by delay variation and dispersion amount. For example, video distribution requires that real-time performance and packet loss be minimized. The reservation is made at # 1, and the calculation process is reserved at service class # 5, which is less restrictive than service class # 1 because the demand for delay and packet loss is lighter than video distribution.

ジョブサービスクラス情報を取得した資源管理装置2は、前記サービスクラス情報を満たすネットワーク資源を経路データベース24から検索し(S13)、そのネットワーク資源をユーザ装置1に表示する(S14)。ユーザ装置1がそのネットワーク資源を許可すれば(S15)、資源管理装置2は、当該提供を証明するための予約証明書を送信する(S16)。資源管理装置2はサービスクラスを満たすネットワーク資源をネットワーク制御部23からユーザ装置1に提供する(S17)。このようにして、資源管理装置2は、ジョブにあったサービスクラスの資源をユーザ装置1に提供することができる。   The resource management device 2 that has acquired the job service class information searches the route database 24 for network resources that satisfy the service class information (S13), and displays the network resources on the user device 1 (S14). If the user device 1 permits the network resource (S15), the resource management device 2 transmits a reservation certificate for certifying the provision (S16). The resource management device 2 provides network resources satisfying the service class from the network control unit 23 to the user device 1 (S17). In this way, the resource management device 2 can provide the user device 1 with service class resources suitable for the job.

図6にジョブデータベース20の一例を示す。ジョブデータベース20はジョブ名とサービスクラス情報(遅延、パケット損失、サービスクラスの識別情報(サービスクラスID))とが対応している。ジョブデータベース20の情報更新にはネットワーク運用者が情報をアップデートしたり、過去に提供したジョブとサービスクラスとの対応表を保存したり、他の資源管理装置のジョブデータベースと通信機能を持ち情報を同期することにより常にジョブデータベース20の内容をアップデートすることができる。   FIG. 6 shows an example of the job database 20. The job database 20 corresponds to job names and service class information (delay, packet loss, service class identification information (service class ID)). To update the information in the job database 20, the network operator updates the information, stores a correspondence table between jobs and service classes provided in the past, has a communication function with the job database of other resource management devices, and stores information. By synchronizing, the contents of the job database 20 can always be updated.

ここではユーザ装置1は直接、資源管理装置2に資源を予約しているが、スケジューラ部22を介してもよい。また、例えば、映像配信と計算とを同時に要求するなど、複数のジョブ識別子を同時に予約することもできる。   Here, the user device 1 directly reserves the resource in the resource management device 2, but it may be via the scheduler unit 22. Also, a plurality of job identifiers can be reserved simultaneously, for example, requesting video distribution and calculation simultaneously.

図7に経路データベース24の一例を示す。ジョブデータベース20はネットワーク資源であるパスの識別情報(パスID)とパスIDに対応するサービスクラスとパスIDに対応する経路情報とで構成される。   FIG. 7 shows an example of the route database 24. The job database 20 includes path identification information (path ID) that is a network resource, a service class corresponding to the path ID, and path information corresponding to the path ID.

なお、経路データベース24は経路情報はなくても各ノード間のdata linkの品質情報のみを保持しており、予約要求を受けるとそれを基にネットワーク制御部23が経路計算することによって要求を満たした経路を示してもよい。   Note that the route database 24 holds only data link quality information between nodes even if there is no route information. When a reservation request is received, the network controller 23 calculates the route based on the reservation request to satisfy the request. May indicate a route.

(第二の実施形態)
第二の実施形態を図8ないし図10を参照して説明する。グリッドコンピューティングシステムは物理計算や金融等様々な用途で使われる可能性があるが、同じ分野でジョブ中に利用されるプログラム中の関数は同じものが多く、関数等のジョブ内容がわかればジョブ実行にかかる計算時間を推測することができる。例えば、金融機関が行っている資産リスク計算ではモンテカルロ法を用いて乱数を用いた計算を何度も行うことで近似解を求めている。
(Second embodiment)
A second embodiment will be described with reference to FIGS. Grid computing systems may be used for various purposes such as physical calculation and finance, but many functions in programs used in jobs in the same field are the same, and if the job contents such as functions are known, jobs The calculation time required for execution can be estimated. For example, in an asset risk calculation performed by a financial institution, an approximate solution is obtained by repeatedly performing calculations using random numbers using the Monte Carlo method.

図8に第二の実施形態の資源管理装置2の機能ブロック図を示す。図9に第二の実施形態を説明するためのシーケンス図を示す。図10に第二の実施形態で用いるジョブデータベース20の例を示す。なお、資源管理システムの全体構成は図4と同じである。第二の実施形態で用いるジョブデータベース20は、第一の実施形態で説明したジョブデータベース20が有する情報に加え、図10に示すように、さらに過去に実施したジョブの関数、プロセス、サブルーティン等の履歴とその実行にかかった時間(時間/回数(秒):即ち1回当りの実行時間)との対応表を持っている。図10の例では、さらに繰り返し回数、精度、資源数も併せて記録されている。   FIG. 8 shows a functional block diagram of the resource management device 2 of the second embodiment. FIG. 9 shows a sequence diagram for explaining the second embodiment. FIG. 10 shows an example of the job database 20 used in the second embodiment. The overall configuration of the resource management system is the same as that shown in FIG. The job database 20 used in the second embodiment includes, in addition to the information of the job database 20 described in the first embodiment, functions, processes, subroutines, and the like of jobs executed in the past as shown in FIG. And a correspondence table of the time (time / number of times (seconds): that is, the execution time per one time) required for the execution. In the example of FIG. 10, the number of repetitions, accuracy, and number of resources are also recorded.

資源管理装置2のスケジューラ部22はユーザ装置1から以下に説明する ジョブ内容を含む情報を含む資源の予約要求を受け取る(S21)。すると実行時間計算部25に必要なパラメータを送り、実行時間計算部25を参照することで過去に実施したジョブからジョブ実行時間を予測する(S22、S23、S24)。   The scheduler unit 22 of the resource management device 2 receives from the user device 1 a resource reservation request including information including the job contents described below (S21). Then, necessary parameters are sent to the execution time calculation unit 25, and the job execution time is predicted from jobs executed in the past by referring to the execution time calculation unit 25 (S22, S23, S24).

資源管理装置2は、ジョブデータベース20から得られたジョブ実行時間とジョブのサービスクラスとを基に条件を満たす資源をスケジューラ部22により検索し(S25)、検索結果(予約可能資源一覧)をユーザ装置1に通知する(S26)。ユーザ装置1がこの資源を承認すれば(S27)、資源がユーザ装置1に提供され、当該提供を証明するための予約証明書が送信される(S28)。   The resource management device 2 searches the scheduler unit 22 for a resource that satisfies a condition based on the job execution time obtained from the job database 20 and the service class of the job (S25), and searches the search result (reservable resource list) for the user. The device 1 is notified (S26). If the user device 1 approves this resource (S27), the resource is provided to the user device 1, and a reservation certificate for certifying the provision is transmitted (S28).

図10にジョブデータベース20の一例を示す。ジョブデータベース20は上のように対応表のみを持っていても、過去の履歴を持っていてもよい。ジョブのプロセスの時間がわかれば右上にあるように計算(T=F(Y)×X)することでジョブ実行時間を予測することができる。ただし、Tはジョブ実行時間、Fはプロセス(ジョブの関数等)の処理に要する時間、Xは繰り返し回数、Yは資源の数である。   FIG. 10 shows an example of the job database 20. The job database 20 may have only a correspondence table as described above, or may have a past history. If the time of the job process is known, the job execution time can be predicted by calculating (T = F (Y) × X) as shown in the upper right. Here, T is the job execution time, F is the time required for processing the process (job function, etc.), X is the number of repetitions, and Y is the number of resources.

このジョブ中に含まれる関数、プロセス、サブルーティンなどを知る方法はユーザが直接入力する方法、資源管理装置2がジョブの中身を読み関数を抜き出す方法がある。これによりジョブ実行にかかる時間を予測することができ、資源の効率化が可能となる。   There are two methods for knowing the functions, processes, subroutines, and the like included in the job, and a method in which the user directly inputs, and a method in which the resource management device 2 reads the contents of the job and extracts the functions. As a result, the time required for job execution can be predicted, and resource efficiency can be improved.

ユーザ装置1の予約要求には以下のパラメータがある。
1.過去にジョブを実行したことがある場合はいつ実行したか。図10にあるように過去の履歴から実行にかかった時間を参照して計算することができる。
2.ジョブに含まれる関数、プロセス、サブルーティンやその繰り返し数。ジョブ実行時間計算のパラメータとなる。
3.ジョブ実行時間計算の精度。どのくらいの精度でジョブ実行予測時間を計算する必要があるかどうかを確認する。これにより効率よくジョブ実行時間を予測することができる。もちろん精度を高くするためには入力する関数を細かく入力する必要がある。
4.ユーザが希望するジョブ実行時間。資源管理装置2はユーザが希望する時間になるようにプロセス毎にジョブを分割して実行することで、ユーザがジョブを分割して入力する必要がなく、ユーザがプログラムを意識する必要がなくなる。ジョブの分割はジョブデータベースからサブルーティンやプロセスの時間がわかることでジョブを途中終了させることなくジョブを分割することができる。
The reservation request of the user device 1 has the following parameters.
1. When did you run the job in the past? As shown in FIG. 10, the calculation can be performed by referring to the time taken for execution from the past history.
2. Functions, processes, subroutines, and the number of repetitions included in the job. This is a parameter for job execution time calculation.
3. Accuracy of job execution time calculation. Check how accurately the estimated job execution time needs to be calculated. As a result, the job execution time can be predicted efficiently. Of course, in order to increase the accuracy, it is necessary to input the input function in detail.
4). The job execution time desired by the user. The resource management device 2 divides and executes the job for each process so that the time desired by the user is reached, so that the user does not need to divide and input the job and the user does not need to be aware of the program. The job can be divided without ending the job halfway by knowing the subroutine and process time from the job database.

予約を行う際は、推測時間からその信頼性にもよるが途中で計算が終了することを避けるため推測時間以上に保護時間を取る方法がある。   When making a reservation, depending on the reliability of the estimated time, there is a method of taking a protection time longer than the estimated time in order to avoid completion of the calculation in the middle.

(第三の実施形態)
大容量な映像配信等の場合には、ユーザ装置1からジョブを実行するとユーザ装置1も映像配信できるだけの十分な資源を持っている必要がある。
(Third embodiment)
In the case of large-capacity video distribution or the like, when a job is executed from the user device 1, the user device 1 also needs to have sufficient resources for video distribution.

図11に第三の実施形態を説明するための図を示す。ユーザ装置1の資源予約要求にジョブの識別情報とジョブの容量と一緒にユーザ装置1の持つネットワーク帯域や品質などのネットワーク資源の情報を入れ資源管理装置2のスケジューラ部22に送る。資源管理装置2はジョブのサービスクラスとユーザ装置1が持つ資源とを比較し、ユーザ装置1の資源の品質が低い場合は、資源管理装置2がユーザ装置1に対し、ジョブデータの移行要求を出す。例えば、図11では、ジョブが10Gbps(太い実線)の帯域が必要なのに対し、ユーザ側のネットワークは1Gbps(細い実線)である。   FIG. 11 is a diagram for explaining the third embodiment. Information on network resources such as network bandwidth and quality of the user apparatus 1 together with job identification information and job capacity is entered in the resource reservation request of the user apparatus 1 and sent to the scheduler unit 22 of the resource management apparatus 2. The resource management device 2 compares the service class of the job with the resources of the user device 1, and if the resource quality of the user device 1 is low, the resource management device 2 sends a job data transfer request to the user device 1. put out. For example, in FIG. 11, the job requires a bandwidth of 10 Gbps (thick solid line), whereas the network on the user side is 1 Gbps (thin solid line).

また、資源管理装置2は、ジョブを移行する空き容量があり、かつジョブのサービスクラスで与えられる十分なネットワークを提供できる資源があるかどうかを問い合わせるメッセージをCRM(クラスタ・リソース・マネージメント)、もしくは各コンピュータ資源に送る。これにより容量が空いていて、かつ十分な品質の資源を提供できるコンピュータ資源を探し出すことができる。   Also, the resource management device 2 sends a message (CRM (Cluster Resource Management)) for inquiring whether there is a resource capable of providing a sufficient network provided by the job service class and the job service class. Send to each computer resource. As a result, it is possible to find a computer resource that has free capacity and can provide a resource of sufficient quality.

ジョブデータの移行要求を受け取ったユーザ装置1は、ジョブデータを前記空きコンピュータ資源3に移行する。このときはリアルタイムな配信でないため、ネットワーク品質が悪くてもよい。資源管理装置2は、その移行したコンピュータ資源3にサービスクラスを満たすネットワーク資源4を提供することによりユーザ装置1の資源に依存せずに品質の高いサービスが提供可能となる。   Upon receiving the job data transfer request, the user device 1 transfers the job data to the free computer resource 3. At this time, since the distribution is not real-time, the network quality may be poor. The resource management device 2 can provide a high-quality service without depending on the resource of the user device 1 by providing the network resource 4 satisfying the service class to the migrated computer resource 3.

また、ユーザ装置1に、このユーザ装置1の代理としてジョブを実行するコンピュータ資源3との接続経路となるネットワーク資源を割当てることにより、ユーザ装置1は、コンピュータ資源3にジョブを移行したり、ジョブの実行状況を監視したり、コンピュータ資源3によって完了したジョブの実行結果を受け取ることができる。このようなジョブの移行や実行状況の監視やジョブの実行結果の受け取りには、サービスクラスの低いネットワーク資源であっても問題はない。   Further, by allocating a network resource serving as a connection path to the computer resource 3 that executes the job on behalf of the user device 1 to the user device 1, the user device 1 can transfer the job to the computer resource 3, The execution result of the job completed by the computer resource 3 can be received. For such job migration, execution status monitoring, and job execution result reception, there is no problem even with network resources having a low service class.

これは映像配信に限らずジョブデータベース20からジョブを実行するための十分な資源を提供できない場合は空き容量を持つコンピュータ資源にジョブを移行し、空き資源とジョブ実行資源とのネットワーク資源を接続することでサービスクラスに応じた資源を提供することができる。   This is not limited to video distribution. If sufficient resources for job execution cannot be provided from the job database 20, the job is transferred to a computer resource having free capacity, and the network resource of the free resource and the job execution resource is connected. Thus, resources according to the service class can be provided.

(第四の実施形態)
第四の実施形態を図12および図13を参照して説明する。第四の実施形態ではグリッドコンピューティングで計算を行った場合に、複数の資源で同時にジョブを実行させるため資源管理装置2はそれぞれの資源を管理することが困難なためジョブ実行結果の信頼性を保証することが難しいと考えられる。
(Fourth embodiment)
A fourth embodiment will be described with reference to FIGS. In the fourth embodiment, when calculation is performed by grid computing, a job is simultaneously executed with a plurality of resources, so that it is difficult for the resource management device 2 to manage each resource. It is considered difficult to guarantee.

また、資源の故障やデータの改竄などにより間違った計算結果がユーザ装置に出力される可能性もある。そこで資源管理装置2にジョブ計算結果監視部26を備えることで、ジョブの計算結果の信頼性を向上させる。   In addition, an erroneous calculation result may be output to the user device due to a resource failure or data falsification. Therefore, by providing the resource management apparatus 2 with the job calculation result monitoring unit 26, the reliability of the job calculation result is improved.

図12に第四の実施形態の資源管理装置2の機能ブロック図を示す。ユーザ装置1がネットワークを予約する際に計算結果の信頼性を確認するための情報を資源管理装置2に送り、資源管理装置2のジョブ計算結果監視部26はその情報を用いてジョブの実行結果を随時確認することによって計算結果の信頼性を上げることができる。   FIG. 12 shows a functional block diagram of the resource management device 2 of the fourth embodiment. When the user apparatus 1 reserves the network, information for confirming the reliability of the calculation result is sent to the resource management apparatus 2, and the job calculation result monitoring unit 26 of the resource management apparatus 2 uses the information to execute the job execution result. The reliability of the calculation result can be improved by confirming as needed.

図13に第四の実施形態を説明するためのフローチャートを示す。資源管理装置2のスケジューラ部22は、ユーザ装置1からa〜cの時間帯にジョブの予約要求を受け取る(S30)。資源管理装置2はユーザ装置1に対し、予約証明書を発行する(S31)。   FIG. 13 shows a flowchart for explaining the fourth embodiment. The scheduler unit 22 of the resource management device 2 receives a job reservation request from the user device 1 during the time period a to c (S30). The resource management device 2 issues a reservation certificate to the user device 1 (S31).

ユーザ装置1は、計算結果の信頼性を向上させるために信頼性向上要求を行い、計算結果を確認するための情報を資源管理装置2に送る(S32)。ジョブは実行時間a〜cになったときに実行され、計算結果は随時ジョブ計算結果監視部26によって確認される(S33、S34、S35)。計算結果が異なった場合は計算結果は破棄され(S36)、再計算が行われる。ジョブの実行が予約時間をオーバーした場合は、スケジューラ部22に予約時間の延長もしくは再予約を行う。   The user device 1 makes a request for improving reliability in order to improve the reliability of the calculation result, and sends information for confirming the calculation result to the resource management device 2 (S32). The job is executed when the execution time is ac, and the calculation result is confirmed by the job calculation result monitoring unit 26 at any time (S33, S34, S35). If the calculation results are different, the calculation results are discarded (S36) and recalculation is performed. When the execution of the job exceeds the reservation time, the reservation time is extended or re-reserved in the scheduler unit 22.

ユーザ装置1が入力するパラメータは、1つ目はジョブ実行結果を確認するための情報である。例えば、計算結果の桁数が4桁以下になることがわかっているならばその情報を入力することで4桁以上になった場合には、結果が出る前に破棄することができる。他にも偶数、奇数、少数などが考えられる。これにより実行結果を常に確認し実行結果の信頼性を向上させることができる。   The first parameter input by the user device 1 is information for confirming the job execution result. For example, if it is known that the number of digits of the calculation result will be 4 digits or less, if the information becomes 4 digits or more by inputting the information, it can be discarded before the result is obtained. Other examples include even numbers, odd numbers, and a small number. As a result, the execution result can always be confirmed and the reliability of the execution result can be improved.

さらに、計算結果を間違えたコンピュータ資源を資源管理装置2に登録し、統計データを取ることにより、運用者はコンピュータ単体の異常なのか、ネットワークの異常なのか、誰かに改竄されたデータなのか、あるいは、いつの時期に集中しているのかなどを知ることができ、トラブルを未然に防いだり、またはそれをユーザ装置に表示したりすることで、コンピュータ資源の信頼性を判断することができる。   Furthermore, by registering the computer resource with the wrong calculation result in the resource management device 2 and taking statistical data, whether the operator is an abnormality of the computer alone, an abnormality of the network, or the data falsified by someone, Alternatively, it is possible to know when it is concentrated, and it is possible to determine the reliability of the computer resources by preventing troubles or displaying them on the user device.

(第五の実施形態)
ジョブ結果の信頼性を向上させる一つの方法として複数資源を冗長して予約することにより信頼性を向上させることができる。この場合は、コンピュータ資源は一つでネットワーク資源を複数提供する方法と、コンピュータ資源もネットワーク資源も複数提供する方法とがある。
(Fifth embodiment)
As one method for improving the reliability of job results, it is possible to improve the reliability by reserving a plurality of resources redundantly. In this case, there are a method of providing a plurality of network resources with one computer resource, and a method of providing a plurality of computer resources and network resources.

1つ目の場合は資源管理装置2がユーザ装置1から資源予約要求時に信頼性向上要求を受け取ると、資源管理装置2はジョブデータベース20を参照しジョブを実行するのに必要なサービスクラスを提供できるネットワーク資源を複数本スケジューラ部22に予約する。   In the first case, when the resource management device 2 receives a reliability improvement request from the user device 1 when requesting resource reservation, the resource management device 2 refers to the job database 20 and provides a service class necessary for executing the job. A plurality of network resources are reserved in the scheduler unit 22.

図14に1つ目の信頼性向上方法を説明する図を示す。この際、予約するネットワーク資源(パス)は現用系(太い実線)および予備系(破線)共にサービスクラスを満たす必要がある。例えば、遅延変動が少ないことを要求されるサービスの場合には、資源管理装置2は経路切替時も遅延が変わらないパスを提供する必要がある。   FIG. 14 is a diagram for explaining the first reliability improvement method. At this time, the network resource (path) to be reserved needs to satisfy the service class for both the active system (thick solid line) and the standby system (dashed line). For example, in the case of a service that is required to have a small delay variation, the resource management device 2 needs to provide a path whose delay does not change even when the route is switched.

資源管理装置2は複数パスを生成後に遅延差補償手段(図示省略)を備えた、もしくは、遅延差補償装置(図示省略)との通信手段を備えたノード装置6に現用系および予備系の両パスの遅延補償要求を送る。遅延補償要求を受け取ったノード装置6は両パスを終端するノード装置5に対し、両パスから遅延測定用パケットを送り、両パスの遅延差を測定する。両パスの遅延差が異なる場合は遅延差補償手段によって遅延を補償することで同一遅延のパスを提供することができる。1つは現用系パス、他は予備系パスとし、ネットワーク障害発生時は資源管理装置2がネットワーク資源上のノード装置6にパス切替要求を送ることで経路を切替え、ネットワークの信頼性を向上させることができる。   The resource management device 2 includes delay difference compensation means (not shown) after generating a plurality of paths, or a node device 6 having communication means with the delay difference compensation device (not shown). Send path delay compensation request. The node device 6 that has received the delay compensation request sends a delay measurement packet from both paths to the node device 5 that terminates both paths, and measures the delay difference between both paths. When the delay difference between the two paths is different, the same delay path can be provided by compensating the delay by the delay difference compensating means. One is an active path, and the other is a backup path. When a network failure occurs, the resource management device 2 sends a path switching request to the node device 6 on the network resource, thereby switching the route and improving the reliability of the network. be able to.

遅延差補償装置は光信号の伝送経路を力学的、または熱学的に変動させ調整する装置でもよいし、VIPA(Virtual Phased Array)のような可変分散装置などを通し分散を与え遅延を制御してもよいし、バッファを用いて遅延を補償してもよいし、タグの遅延制御用フラグからパケットを読み取るときに調整、またはVirtual Concatenationの技術などを用いてもよい。   The delay difference compensator may be a device that adjusts the transmission path of an optical signal dynamically or thermodynamically, or controls dispersion by providing dispersion through a variable dispersion device such as VIPA (Virtual Phased Array). Alternatively, the delay may be compensated by using a buffer, adjustment may be performed when a packet is read from the tag delay control flag, or the technology of Virtual Connection may be used.

また、2つ目の場合は、ユーザ装置1から資源予約要求時に信頼性向上要求を受け取ると、資源管理装置2はCRM(クラスタ・リソース・マネージメント)もしくは各クラスタにメッセージを送り他拠点にある複数のコンピュータ資源を予約し、それぞれを繋ぐ複数パスを予約する。   In the second case, when a reliability improvement request is received from the user device 1 when a resource reservation request is received, the resource management device 2 sends a message to the CRM (cluster resource management) or each cluster, Reserve multiple computer resources and reserve multiple paths connecting them.

図15に2つ目の信頼性向上方法を説明する図を示す。資源管理装置2はサービス開始後に、コンピュータ資源もしくはCRMのコンピュータ資源の状態を定期的に監視する。信頼性向上手段には2つの方法があり、一つは現用系コンピュータ資源と予備系コンピュータ資源とで同じジョブを実行させる方法と、もう一つは現用系コンピュータ資源がジョブを実行し予備系コンピュータ資源は一定期間毎に現用系コンピュータ資源のバックアップをとる方法である。   FIG. 15 illustrates a second method for improving reliability. The resource management device 2 periodically monitors the state of computer resources or CRM computer resources after the service is started. There are two methods for improving the reliability. One is a method for executing the same job in the active computer resource and the spare computer resource, and the other is a backup computer in which the active computer resource executes the job. The resource is a method of backing up the working computer resources at regular intervals.

コンピュータ資源3−1から一定期間応答が無くなったときに資源管理装置2は障害が発生したと判断し、資源管理装置2が経路切替えを行うノード装置5に対し、コンピュータ資源3−1の切替要求を送ることで現用系のコンピュータ資源3−1から予備系のコンピュータ資源3−2に切り替わる。断が発生する場合には対向コンピュータ資源に対しても経路切替えの通知が必要である。また、資源管理装置2がユーザ装置1にコンピュータ資源切替えを行ったことを通知する。   When there is no response from the computer resource 3-1 for a certain period, the resource management device 2 determines that a failure has occurred, and the resource management device 2 requests the node device 5 for switching the route to switch the computer resource 3-1. Is switched from the active computer resource 3-1 to the standby computer resource 3-2. When disconnection occurs, it is necessary to notify the opposite computer resource of the path switching. Further, the resource management device 2 notifies the user device 1 that the computer resource has been switched.

これによりネットワーク資源の信頼性のみならずコンピュータ資源の信頼性も向上させることができる。   Thereby, not only the reliability of network resources but also the reliability of computer resources can be improved.

また、ジョブが計算の場合には同じコンピュータ資源に同じジョブを実行させることで資源管理装置2はジョブ実行結果の統計を取り、同じ結果が多い方を信頼性が高い値としてユーザ装置に出力させることもできる。   Further, when the job is a calculation, the resource management apparatus 2 takes the same job to execute the same job to collect the statistics of the job execution result, and outputs the higher result to the user apparatus as a more reliable value. You can also.

両方の場合で、資源管理装置2は計算結果を間違えたコンピュータ資源やトラブルが生じたネットワーク資源の情報をユーザ装置1から収集し、それらの資源の運用者にエラーを通知することで早いうちから資源の運用者はコンピュータ資源やネットワーク資源のトラブルを回避することができる。   In both cases, the resource management device 2 collects information about the computer resource with the wrong calculation result or information on the network resource in which the trouble has occurred from the user device 1, and notifies the operator of those resources of the error early on. Resource operators can avoid problems with computer resources and network resources.

また、計算結果を間違えたコンピュータ資源を資源管理装置2に登録し、統計データを取ることにより、運用者は、コンピュータ単体の異常なのか、ネットワークのトラブルなのか、いつの時期に集中しているのかを知ることができ、トラブルの原因を解析したり、または、その結果をユーザ装置に表示することで、どの資源の信頼性が高いかを知ることができる。   Also, by registering computer resources with the wrong calculation results in the resource management device 2 and collecting statistical data, the operator is concentrating on whether the computer is abnormal or a network problem, and when By analyzing the cause of the trouble or displaying the result on the user device, it is possible to know which resource has high reliability.

(第六の実施形態)
第六の実施形態は、汎用の情報処理装置にインストールすることにより、その汎用の情報処理装置に、第一〜第五の実施形態の資源管理装置2に相応する機能を実現させるプログラムである。
(Sixth embodiment)
The sixth embodiment is a program that, when installed on a general-purpose information processing apparatus, causes the general-purpose information processing apparatus to realize functions corresponding to the resource management apparatus 2 of the first to fifth embodiments.

本実施形態のプログラムは記録媒体に記録されることにより、前記汎用の情報処理装置は、この記録媒体を用いて本実施形態のプログラムをインストールすることができる。あるいは、本実施形態のプログラムを保持するサーバからネットワークを介して直接前記汎用の情報処理装置に本実施形態のプログラムをインストールすることもできる。   By recording the program of this embodiment on a recording medium, the general-purpose information processing apparatus can install the program of this embodiment using this recording medium. Alternatively, the program of the present embodiment can be directly installed on the general-purpose information processing apparatus via a network from a server that holds the program of the present embodiment.

これにより、汎用の情報処理装置を用いて、本実施形態の資源管理装置2に相応する機能を実現することができる。   Thereby, the function corresponding to the resource management apparatus 2 of this embodiment is realizable using a general purpose information processing apparatus.

なお、本実施形態のプログラムは、汎用の情報処理装置によって直接実行可能なものだけでなく、ハードディスクなどにインストールすることによって実行可能となるものも含む。また、圧縮されたり、暗号化されたりしたものも含む。   Note that the program according to the present embodiment includes not only a program that can be directly executed by a general-purpose information processing apparatus but also a program that can be executed by being installed on a hard disk or the like. Also included are those that are compressed or encrypted.

本発明によれば、ネットワーク資源やコンピュータ資源の管理機能の高効率化を実現することができるため、ネットワーク管理者およびユーザの双方にとって利便性およびサービス品質の向上を提供することができる。   According to the present invention, it is possible to improve the efficiency of the management function of network resources and computer resources, and therefore it is possible to provide convenience and improvement in service quality for both network administrators and users.

従来の資源管理システムの全体構成図。The whole block diagram of the conventional resource management system. 従来の資源管理装置とユーザ装置との間での通信手順を示すシーケンス図。The sequence diagram which shows the communication procedure between the conventional resource management apparatus and a user apparatus. 第一の実施形態における資源管理装置の機能ブロック図。The functional block diagram of the resource management apparatus in 1st embodiment. 第一の実施形態を説明するための資源管理システムの全体構成図。1 is an overall configuration diagram of a resource management system for explaining a first embodiment. FIG. 第一の実施形態を説明するためのシーケンス図。The sequence diagram for demonstrating 1st embodiment. ジョブデータベースの一例を示す図。The figure which shows an example of a job database. 経路データベースの一例を示す図。The figure which shows an example of a path | route database. 第二の実施形態の資源管理装置の機能ブロック図。The functional block diagram of the resource management apparatus of 2nd embodiment. 第二の実施形態を説明するためのシーケンス図。The sequence diagram for demonstrating 2nd embodiment. 第二の実施形態で用いるジョブデータベースの例を示す図。The figure which shows the example of the job database used by 2nd embodiment. 第三の実施形態を説明するための図。The figure for demonstrating 3rd embodiment. 第四の実施形態の資源管理装置の機能ブロック図。The functional block diagram of the resource management apparatus of 4th embodiment. 第四の実施形態を説明するためのフローチャート。The flowchart for demonstrating 4th embodiment. 1つ目の信頼性向上方法を説明する図。The figure explaining the 1st reliability improvement method. 2つ目の信頼性向上方法を説明する図。The figure explaining the 2nd reliability improvement method.

符号の説明Explanation of symbols

1 ユーザ装置
2 資源管理装置
3、3−1、3−2 コンピュータ資源
4 ネットワーク資源
5、6 ノード装置
20 ジョブデータベース
21 ユーザ装置通信部
22 スケジューラ部
23 ネットワーク制御部
24 経路データベース
25 実行時間計算部
26 ジョブ計算結果監視部
DESCRIPTION OF SYMBOLS 1 User apparatus 2 Resource management apparatus 3, 3-1, 3-2 Computer resource 4 Network resource 5, 6 Node apparatus 20 Job database 21 User apparatus communication part 22 Scheduler part 23 Network control part 24 Path | route database 25 Execution time calculation part 26 Job calculation result monitoring part

Claims (9)

ユーザ装置から送信される資源予約要求を受け取って該当する資源の当該ユーザ装置への割当可否を判定し、割当可能である場合には、当該資源予約要求を満たす資源を前記ユーザ装置に割当てる資源管理装置において、
ジョブの種類を示す識別情報とジョブ毎に必要なサービスクラスの情報との対応関係が記録されたジョブデータベースと、
ネットワーク資源とこのネットワーク資源の品質を示すサービスクラス情報とを保持する資源情報保持手段と、
ユーザ装置からジョブの識別情報を含む資源予約要求を受け取ると前記ジョブデータベースを参照し当該ジョブの識別情報から当該ジョブのサービスクラスの情報を検索し検索したサービスクラスの要求品質を満たすネットワーク資源を前記資源情報保持手段に保持されているネットワーク資源の品質を示すサービスクラス情報に基づき決定して前記ユーザ装置に割当てる手段と
を備えたことを特徴とする資源管理装置。
Resource management that receives a resource reservation request transmitted from a user apparatus, determines whether or not the corresponding resource can be allocated to the user apparatus, and if so, resource management that allocates a resource that satisfies the resource reservation request to the user apparatus In the device
A job database in which the correspondence between the identification information indicating the type of job and the service class information required for each job is recorded;
Resource information holding means for holding network resources and service class information indicating the quality of the network resources;
When a resource reservation request including job identification information is received from a user device, the job database is referred to, the service class information of the job is searched from the job identification information, and the network resource satisfying the requested quality of the service class is retrieved. A resource management apparatus comprising: means for determining based on service class information indicating the quality of network resources held in the resource information holding means and allocating to the user apparatus.
前記ネットワーク資源は、ネットワーク上の伝送路または当該伝送路に設定されるパスを含み、
前記サービスクラスの情報は、当該パスまたは伝送路の遅延量またはパケット損失許容量の情報を含む
請求項1記載の資源管理装置。
The network resource includes a transmission line on the network or a path set in the transmission line,
The resource management apparatus according to claim 1, wherein the service class information includes information on a delay amount or a packet loss tolerance of the path or transmission path.
前記ジョブデータベースは、ジョブのプロセスと当該ジョブのプロセス毎の過去の実行時間の履歴との対応関係を保持し、
ユーザ装置から資源予約要求を受け取ると前記ジョブデータベースを参照し当該資源予約要求に含まれるジョブの識別情報に基づき当該ジョブとその実行時間の履歴との対応関係を参照し当該ジョブの実行時間を予測してこの予測した実行時間を満たす資源を決定して前記ユーザ装置に割当てる手段を備えた
請求項1記載の資源管理装置。
The job database holds a correspondence relationship between a job process and a history of past execution times for each process of the job,
When a resource reservation request is received from a user device, the job database is referred to, and the execution time of the job is predicted by referring to the correspondence between the job and its execution time history based on the job identification information included in the resource reservation request. The resource management device according to claim 1, further comprising means for determining a resource satisfying the predicted execution time and allocating the resource to the user device.
ユーザ装置に接続されたネットワーク資源のサービスクラスと当該ユーザ装置が実行中または実行予定のジョブのサービスクラスとを比較する手段と、
前記比較する手段による比較結果に基づき前記ユーザ装置に接続されたネットワーク資源が当該ユーザ装置が実行中または実行予定のジョブの要求品質を満たせない場合には、当該ユーザ装置の要求品質を満たすネットワーク資源を有するコンピュータ資源を探索する手段と、
前記探索する手段の探索結果に基づき前記ユーザ装置の要求品質を満たすネットワーク資源を有するコンピュータ資源が見つかったときには、前記ユーザ装置と当該コンピュータ資源との接続経路となるネットワーク資源を当該ユーザ装置に割当て、前記実行中または実行予定のジョブを当該コンピュータ資源に移行する手段と
を備えた請求項1記載の資源管理装置。
Means for comparing a service class of a network resource connected to a user device and a service class of a job being executed or scheduled to be executed by the user device;
If the network resource connected to the user device based on the comparison result by the comparing means cannot satisfy the required quality of the job being executed or scheduled to be executed by the user device, the network resource satisfying the required quality of the user device Means for searching for computer resources comprising:
When a computer resource having a network resource that satisfies the required quality of the user device is found based on a search result of the means for searching, a network resource serving as a connection path between the user device and the computer resource is allocated to the user device, The resource management apparatus according to claim 1, further comprising: means for transferring the job being executed or scheduled to be executed to the computer resource.
ユーザ装置から計算結果の情報を収集する計算結果情報収集手段と、
前記計算結果情報収集手段により収集された計算結果に基づきジョブの実行結果を判定する手段と、
前記判定する手段による判定結果に基づき計算結果に異常を発見した場合には当該計算結果を破棄すると共に再計算を前記ユーザ装置に促す手段と、
前記計算結果情報収集手段による計算結果情報収集過程でジョブの実行時間が予約時間を超過した場合には予約時間を延長または再予約を行う手段と
を備えた請求項1記載の資源管理装置。
Calculation result information collecting means for collecting calculation result information from the user device;
Means for determining a job execution result based on the calculation result collected by the calculation result information collecting means;
Means for prompting the user device to recalculate and discard the calculation result when an abnormality is found in the calculation result based on the determination result by the determination unit;
The resource management apparatus according to claim 1, further comprising means for extending or re-reserving the reservation time when the execution time of the job exceeds the reservation time in the calculation result information collecting process by the calculation result information collecting means.
ユーザ装置から信頼性向上要求を受け取ると一つのジョブの要求に対し、要求品質を満たす冗長なネットワーク資源を複数割当てる手段と、
ネットワーク資源の障害発生時には障害が発生したネットワーク資源を迂回する他ネットワーク資源に切替える手段と
を備えた請求項1記載の資源管理装置。
Means for allocating a plurality of redundant network resources satisfying the required quality for one job request upon receiving a reliability improvement request from the user device;
The resource management apparatus according to claim 1, further comprising means for switching to another network resource that bypasses the network resource in which the failure has occurred when a failure occurs in the network resource.
ユーザ装置から信頼性向上要求を受け取ると一つのジョブの要求に対し、冗長なコンピュータ資源を複数割当てる手段と、
コンピュータ資源の障害発生時には障害が発生したコンピュータ資源を障害が発生していないコンピュータ資源に切り替える手段と
を備えた請求項1記載の資源管理装置。
Means for allocating a plurality of redundant computer resources in response to a request for one job upon receiving a reliability improvement request from a user device;
The resource management apparatus according to claim 1, further comprising means for switching a computer resource in which a failure has occurred to a computer resource in which no failure has occurred when a failure occurs in the computer resource.
ユーザ装置から送信される資源予約要求を受け取って該当する資源の当該ユーザ装置への割当可否を判定し、割当可能である場合には、当該資源予約要求を満たす資源を前記ユーザ装置に割当てる資源管理装置が実行する資源管理方法において、
前記資源管理装置が
ジョブの種類を示す識別情報とジョブ毎に必要なサービスクラスの情報との対応関係をジョブデータベースに記録し、
ネットワーク資源とこのネットワーク資源の品質を示すサービスクラス情報とを資源情報保持手段に保持し、
ユーザ装置からジョブの識別情報を含む資源予約要求を受け取ると前記ジョブデータベースを参照し当該ジョブの識別情報から当該ジョブのサービスクラスの情報を検索し検索したサービスクラスの要求品質を満たす資源を前記資源情報保持手段に保持されている資源の品質を示すサービスクラス情報に基づき決定して前記ユーザ装置に割当てる
ことを特徴とする資源管理方法。
Resource management that receives a resource reservation request transmitted from a user apparatus, determines whether or not the corresponding resource can be allocated to the user apparatus, and if so, resource management that allocates a resource that satisfies the resource reservation request to the user apparatus In the resource management method executed by the device,
The resource management device records the correspondence between the identification information indicating the type of job and the service class information required for each job in the job database,
The resource information holding means holds network resources and service class information indicating the quality of the network resources,
When a resource reservation request including job identification information is received from a user device, the resource that satisfies the required quality of the service class retrieved by referring to the job database and searching for the service class information of the job from the job identification information A resource management method comprising: determining based on service class information indicating the quality of a resource held in the information holding means and allocating it to the user device.
汎用の情報処理装置にインストールすることにより、その汎用の情報処理装置に、請求項1ないし7のいずれかに記載の資源管理装置の機能に相応する機能を実現させるプログラム。   A program that, when installed in a general-purpose information processing apparatus, causes the general-purpose information processing apparatus to realize a function corresponding to the function of the resource management apparatus according to any one of claims 1 to 7.
JP2006347461A 2006-12-25 2006-12-25 Resource management device and method Pending JP2008158844A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006347461A JP2008158844A (en) 2006-12-25 2006-12-25 Resource management device and method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006347461A JP2008158844A (en) 2006-12-25 2006-12-25 Resource management device and method

Publications (1)

Publication Number Publication Date
JP2008158844A true JP2008158844A (en) 2008-07-10

Family

ID=39659674

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006347461A Pending JP2008158844A (en) 2006-12-25 2006-12-25 Resource management device and method

Country Status (1)

Country Link
JP (1) JP2008158844A (en)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010152738A (en) * 2008-12-25 2010-07-08 Internatl Business Mach Corp <Ibm> Device, program and method for method managing method
JP2011018198A (en) * 2009-07-09 2011-01-27 Hitachi Ltd Management device and management method
KR101040193B1 (en) * 2008-10-09 2011-06-09 한국전자통신연구원 Method for offering service in pervasive computing environement and apparatus thereof
JP2012150567A (en) * 2011-01-17 2012-08-09 Nippon Telegr & Teleph Corp <Ntt> Resource reservation device, method and program
WO2016088414A1 (en) * 2014-12-05 2016-06-09 株式会社ソニー・インタラクティブエンタテインメント Information processing device and information processing method
KR101745707B1 (en) * 2015-09-07 2017-06-21 주식회사 케이티 Method for preventing resource collision in Transport SDN and the Transport SDN
CN112882826A (en) * 2019-11-30 2021-06-01 华为技术有限公司 Resource cooperative scheduling method and device

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101040193B1 (en) * 2008-10-09 2011-06-09 한국전자통신연구원 Method for offering service in pervasive computing environement and apparatus thereof
JP2010152738A (en) * 2008-12-25 2010-07-08 Internatl Business Mach Corp <Ibm> Device, program and method for method managing method
US8606919B2 (en) 2008-12-25 2013-12-10 International Business Machines Corporation Resource management tool
JP2011018198A (en) * 2009-07-09 2011-01-27 Hitachi Ltd Management device and management method
JP2012150567A (en) * 2011-01-17 2012-08-09 Nippon Telegr & Teleph Corp <Ntt> Resource reservation device, method and program
WO2016088414A1 (en) * 2014-12-05 2016-06-09 株式会社ソニー・インタラクティブエンタテインメント Information processing device and information processing method
JP2016110356A (en) * 2014-12-05 2016-06-20 株式会社ソニー・インタラクティブエンタテインメント Information processing device and information processing method
KR101745707B1 (en) * 2015-09-07 2017-06-21 주식회사 케이티 Method for preventing resource collision in Transport SDN and the Transport SDN
CN112882826A (en) * 2019-11-30 2021-06-01 华为技术有限公司 Resource cooperative scheduling method and device

Similar Documents

Publication Publication Date Title
JP2008158844A (en) Resource management device and method
US20030009582A1 (en) Distributed information management schemes for dynamic allocation and de-allocation of bandwidth
US8095935B2 (en) Adapting message delivery assignments with hashing and mapping techniques
US20050076336A1 (en) Method and apparatus for scheduling resources on a switched underlay network
JP4700738B2 (en) Communication node device, communication system, path resource allocation method, and program
US20010056459A1 (en) Service assignment apparatus
CN101822003A (en) Path management control method, path management control program, path management control device and path management control system
US8135837B2 (en) UPnP QoS network system and method for reserving path and resource
US20160205012A1 (en) Device and method for path calculation
WO2016143311A1 (en) Network control device, network control method, and recording medium for program
JP5666620B2 (en) Network system and service quality control method thereof
JP6982639B2 (en) Multi-edge cloud network communication control method and edge computing system
US20090180388A1 (en) Dynamic multi-objective grid resources access
US9450863B2 (en) Route request mediation apparatus, control apparatus, route request mediation method and program
JP2009071614A (en) Wavelength control network system, and wavelength control method
WO2019159875A1 (en) Arrangement constitution device and arrangement constitution method
US20120054812A1 (en) METHOD AND APPARATUS FOR MULTIPLEXING SERVICE DELIVERY WITH QUALITY OF SERVICE (QoS) GUARANTEE
KR101146742B1 (en) METHOD OF DISTRIBUTED SESSION MANAGEMENT IN SaaS AND SESSION MANAGEMENT SYSTEM THEROF
JP2017038111A (en) Batch management system, batch management method, and program
JP6322332B2 (en) Energy management system and business application execution method
EP1538793A2 (en) Tracing active connection modify failures
CN108306948B (en) Scheduling method and device
JP2022189262A (en) Operation device, program, and operation method
JP2008009852A (en) Load distribution control system and method, and server device
KR102105646B1 (en) Real-time distributed data pipeline system