KR20040075307A - System and method for policy quorum grid resource management - Google Patents
System and method for policy quorum grid resource management Download PDFInfo
- Publication number
- KR20040075307A KR20040075307A KR1020040061650A KR20040061650A KR20040075307A KR 20040075307 A KR20040075307 A KR 20040075307A KR 1020040061650 A KR1020040061650 A KR 1020040061650A KR 20040061650 A KR20040061650 A KR 20040061650A KR 20040075307 A KR20040075307 A KR 20040075307A
- Authority
- KR
- South Korea
- Prior art keywords
- resource
- quorum
- policy
- user
- grid
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 41
- 238000007726 management method Methods 0.000 claims description 51
- 238000012544 monitoring process Methods 0.000 claims description 12
- 230000006866 deterioration Effects 0.000 claims description 8
- 238000003860 storage Methods 0.000 claims description 8
- 238000005457 optimization Methods 0.000 claims description 7
- 238000004891 communication Methods 0.000 claims description 3
- 238000013507 mapping Methods 0.000 claims description 3
- 238000012805 post-processing Methods 0.000 claims description 3
- 238000013475 authorization Methods 0.000 claims 1
- 238000005516 engineering process Methods 0.000 description 4
- 238000012545 processing Methods 0.000 description 3
- 238000013528 artificial neural network Methods 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 238000013468 resource allocation Methods 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/50—Network service management, e.g. ensuring proper service fulfilment according to agreements
- H04L41/5003—Managing SLA; Interaction between SLA and QoS
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/08—Configuration management of networks or network elements
- H04L41/0896—Bandwidth or capacity management, i.e. automatically increasing or decreasing capacities
Abstract
Description
본 발명은 그리드 컴퓨팅(Grid computing) 미들웨어 시스템에 관한 것으로, 특히 사용자의 자원에 대한 요구 성능 및 그리드 서비스의 요구수준을 서비스 레벨어그리먼트(Service Level Agreements, SLA)로 정의하여 SLA와 사용자의 응용프로그램의 특성에 근거하여 자원 할당 및 작업 관리하는 정책 쿼럼 기반의 그리드 자원 관리 시스템 및 그 방법에 관한 것이다.The present invention relates to a grid computing middleware system. In particular, the SLA and the application of the user are defined by defining service level agreements (SLAs) as performance requirements and grid service requirements for user resources. A policy quorum-based grid resource management system and method for resource allocation and task management based on the characteristics of a program.
그리드 컴퓨팅은 인터넷에 연결된 PC나 다른 장비를 구동 시켰을 때 단순히 데스크톱(desktop)에 들어있는 자원에만 연결되는 것이 아니라 가상 컴퓨터의 자원을 공유하는 것을 의미한다. 가상 컴퓨터에는 컴퓨팅 파워, 스토리지, 애플리케이션, 데이터, I/O 디바이스 등이 포함되며 인터넷을 통한 곳이면 어디나 분산될 수 있다.Grid computing means that when you run a PC or other device connected to the Internet, you are not just connecting to the resources on your desktop, but sharing the resources of the virtual machine. Virtual computers include computing power, storage, applications, data, and I / O devices, and can be distributed anywhere over the Internet.
그리드 컴퓨팅은 지리적으로 분산된 고성능 컴퓨터, 대용량 저장장치, 첨단 장비 등의 자원을 고속 네트워크로 연결해 상호 공유하고 이용할 수 있도록 하는 차세대 디지털 신경망 서비스라 할 수 있다. 이러한 그리드 컴퓨팅은 인터넷을 자연스럽게 다음 단계로 진화시켜 분산되어 있는 컴퓨터 시스템들 간의 자원을 공유하는 가상 조직으로 발전시켜 나가게 된다.Grid computing is a next-generation digital neural network service that allows resources such as high-performance computers, mass storage devices, and advanced equipment, which are geographically dispersed, to be shared and used by high-speed networks. Grid computing naturally evolves the Internet to the next level, evolving into a virtual organization that shares resources among distributed computer systems.
통상적으로 그리드는 지리적으로 분산된 환경에서 고성능 컴퓨팅 또는 여러 네트워크 자원을 이용하여 수행할 수 있는 응용 또는 서비스를 제공하는 인프라가 되고 있다. 이러한 그리드를 지원하는 주요 요소 기술이 그리드 컴퓨팅 미들웨어이며, 그리드 컴퓨팅 미들웨어는 다양한 서비스 접근, 제어, 할당 등의 기능 블록으로 구성된다.Typically, grids become infrastructures that provide applications or services that can be performed using high performance computing or multiple network resources in geographically dispersed environments. Grid computing middleware is the main element technology supporting this grid, and grid computing middleware is composed of functional blocks such as various service access, control and allocation.
종래 그리드 컴퓨팅 미들웨어는 전반적으로 광범위하게 분산된 컴퓨터 네트워크형 환경 내에서 자원에 대한 요구를 감시, 제어, 분산시키기 위한 것이다.Conventional grid computing middleware is for monitoring, controlling, and distributing the demand for resources within a widely distributed computer networked environment.
종래 그리드 컴퓨팅 미들웨어 기술 중에서 국내특허출원 2000-30978호에 개시된 "인터넷 환경에서의 집적 부하 분산 및 자원 관리를 위한 시스템 및 방법"은 웹 객체에 대한 액세스를 제공하며, 웹 객체에 대한 예측 요구를 웹 서버 상의 가용 용량에 정합시키는 시스템이 제공된다."System and method for integrated load balancing and resource management in the Internet environment" disclosed in Korean Patent Application No. 2000-30978, among the conventional grid computing middleware technology, provides access to a web object, and provides a prediction request for the web object. A system is provided for matching available capacity on a server.
위의 시스템은 소정의 기준에 근거하여 요구 및 용량 모두를 동적으로 구성하는 방법을 구현하고, 도착 시간, 착신 지리, 가격 요건과 같은 기준에 근거하여 객체에 대한 요구를 동적으로 구성하는 방법을 제공한다.The above system implements a method of dynamically constructing both demand and capacity based on predetermined criteria, and provides a method of dynamically constructing requirements for an object based on criteria such as arrival time, destination geography, and price requirements. do.
이러한 자원 관리 시스템은 지역적인 환경에서 최적화되도록 설계되어져 있기 때문에 그리드 컴퓨팅 환경과 같이 인터넷상의 자원 공유를 위해서는 효율성이 떨어진다.Since these resource management systems are designed to be optimized in the local environment, they are less efficient for resource sharing on the Internet such as grid computing environment.
특히 수백, 수천 개의 자원이 가용할 경우에 사용자에게 가장 알맞은 자원을 선택하기 위해 기존의 선형계획법(Linear Programming, LP) 기반의 최적화 자원 관리 시스템은 시간 및 환경 변화에 유연하게 대처할 수 없는 문제점이 있다.In particular, when hundreds or thousands of resources are available, the existing linear programming (LP) -based optimized resource management system has a problem in that it cannot flexibly cope with changes in time and environment in order to select the most suitable resource for users. .
그리드 컴퓨팅 환경은 응용의 특성에 따라 요구하는 자원의 파라미터가 다르기 때문에 고려해야 할 사항 및 변화에 유연하게 적응할 필요성이 있다.Grid computing environments need to be flexible in adapting to changes and considerations, because the parameters of the required resources vary according to the characteristics of the application.
따라서 그리드 컴퓨팅 미들웨어 기술 중에서 자원 관리 기술은 그리드 컴퓨팅 환경의 복잡성과 불확실성을 고려하여 시간 및 공간적으로 변화는 자원의 상태를 감시하고 사용자가 필요로 하는 자원을 현 상태에서 적극적으로 발견해주고 요구하는 작업을 실행시키며, 작업이 완료될 때까지 신뢰성을 보장해주는 자원 관리 및 스케줄링 기법이 필요하며 구현될 필요성이 있다.Therefore, among the grid computing middleware technologies, the resource management technology monitors the status of resources that change in time and space in consideration of the complexity and uncertainty of the grid computing environment, and actively discovers and requires the resources that users need in the current state. There is a need for resource management and scheduling techniques that can be implemented and ensured reliability until the task is completed.
본 발명이 이루고자 하는 기술적 과제는 정책 쿼럼 기반의 자원 관리 시스템(Policy Quorum Resource Management System, PQRM)을 구축하여 선택된 자원 집합내의 자원들에게 작업을 할당하여 사용자의 SLA를 만족시킬 뿐만 아니라 자원의 재구성을 통해서 작업 완료 이전에 쿼럼 내에서 자원이 이탈될 때 작업을 재할당함으로써 작업의 실행에 대한 신뢰성을 보장하기 위한 정책 쿼럼 기반의 그리드 자원 관리 시스템 및 그 방법을 제공하는 것이다.The technical problem to be achieved by the present invention is to establish a policy quorum resource management system (PQRM) to allocate tasks to resources in the selected resource set to satisfy the user's SLA as well as reconfiguration of resources. Through this, it provides a policy quorum-based grid resource management system and method for ensuring reliability of the execution of a task by reallocating the task when the resource is released within the quorum before completing the task.
도 1은 본 발명의 실시예에 따른 정책 쿼럼 기반의 그리드 자원 관리 시스템의 전체 구성을 도시한 것이다.1 illustrates an overall configuration of a policy quorum based grid resource management system according to an embodiment of the present invention.
도 2는 본 발명의 실시예에 따른 정책 쿼럼 기반의 그리드 자원 관리 방법의 순서도를 도시한 것이다.2 is a flowchart illustrating a policy quorum based grid resource management method according to an embodiment of the present invention.
도 3은 도 1의 일부 구성요소인 쿼럼 관리자의 자원 획득 처리 방법의 순서도를 도시한 것이다.FIG. 3 is a flowchart illustrating a method of processing resource acquisition by a quorum manager, which is a part of FIG. 1.
도 4는 도 1의 일부 구성요소인 작업 관리자의 작업 스케줄링 및 자원 재구성 방법의 순서도를 도시한 것이다.FIG. 4 illustrates a flowchart of a method of job scheduling and resource reconfiguration of a job manager, which is a component of FIG. 1.
도 5는 본 발명의 실시예에 따른 정책 쿼럼 기반의 그리드 자원 관리 시스템에서의 그래픽 사용자 인터페이스를 도시한 것이다.5 illustrates a graphical user interface in a policy quorum based grid resource management system according to an embodiment of the present invention.
이러한 과제를 해결하기 위해 본 발명은 그리드 컴퓨팅 환경에서 작업의 실행을 위한 자원을 발견, 선정, 할당하는 기법에 있어서 전체 자원을 사용자의 SLA에 의해 제약되는 자원의 요구사항에 의해 결정된 정책 쿼럼을 정의하고, 시간의 변화에 따른 쿼럼 내의 상태 변화에 따라 쿼럼을 재구성함으로서 사용자에게 일정한 수준의 신뢰성을 제공하는 정책 쿼럼 기반의 자원관리 기법을 제공한다.In order to solve this problem, the present invention defines a policy quorum determined by resource requirements constrained by the user's SLA in the technique of discovering, selecting, and allocating resources for executing tasks in a grid computing environment. And, by reconfiguring the quorum according to the state change in the quorum over time, it provides policy quorum-based resource management technique that provides users with a certain level of reliability.
본 발명의 첫 번째 특징에 따른 정책 쿼럼 기반의 그리드 자원 관리 시스템은, 그리드 컴퓨팅 환경에서 사용자가 필요로 하는 그리드 자원을 발견, 선정, 할당하는 정책 쿼럼 기반의 그리드 자원 관리 방법에 있어서, a) 서버는 클라이언트의 세션 연결 시도를 통해 사용자 인증 및 자원 사용 권한 인증을 수행하는 단계; b) 상기 a) 단계에서 인증이 완료되면, 상기 서버는 사용자의 자원에 대한 요구 성능 및 그리드 서비스의 요구 수준을 서비스 레벨 어그리먼트(Service Level Agreements, SLA)로 정의하고, 상기 SLA, 응용 프로그램 특성, 최적화정책에 따른가용자원쿼럼을 생성하는 단계; c) 상기 b) 단계에서 생성된 가용자원쿼럼 내에서 획득된 자원을 통해 사용자가 요구한 작업을 스케줄링하여 실행하도록 하는 단계; d) 상기 c) 단계를 통해 실행중인 작업을 감시하여 사용자의 요구하는 자원의 일정 수준을 유지하도록 작업을 재할당하여 자원을 재구성하는 단계; 및 e) 상기 c) 단계를 통해 실행중인 작업이 완료되면 사용자에게 작업 완료를 통보하고 작업 기록을 저장하는 단계를 포함한다.In the policy quorum-based grid resource management system according to the first aspect of the present invention, a policy quorum-based grid resource management method for discovering, selecting, and allocating grid resources required by a user in a grid computing environment includes: a) a server; Performing user authentication and resource use authority authentication through a session connection attempt of the client; b) When the authentication is completed in the step a), the server defines the required performance of the user's resources and the required service level of the grid service as service level agreements (SLAs), and the SLA and application programs. Generating an available resource quorum according to characteristics and optimization policies; c) scheduling and executing a task requested by a user through the resources obtained in the available resource quorum generated in step b); d) reconfiguring resources by monitoring the work being executed through step c) and reallocating the work to maintain a certain level of the required resource of the user; And e) notifying the user of the completion of the job and storing the job record when the job being executed through the step c) is completed.
상기 b) 단계는, b-1) 상기 SLA와 자원 상태 정보를 통해 자원 벡터를 생성하는 단계; b-2) 상기 SLA를 기반으로 자원 획득 정책을 결정하여 서비스품질(QoS) 벡터를 생성하는 단계; b-3) 상기 자원 벡터와 서비스품질 벡터를 이진 맵핑(mapping)하여 자원의 수준을 결정하는 단계; 및 b-4) 상기 SLA를 기반으로 결정된 자원 획득 정책을 적용하여 가용자원쿼럼을 생성하는 단계를 포함하는 것이 바람직하다.The step b) may include b-1) generating a resource vector through the SLA and resource state information; b-2) generating a quality of service (QoS) vector by determining a resource acquisition policy based on the SLA; b-3) binary mapping the resource vector and the quality of service vector to determine a level of the resource; And b-4) generating an available resource quorum by applying the resource acquisition policy determined based on the SLA.
상기 c) 단계는, 사용자로부터 상기 작업의 병렬, 분산, 독립 특성, 및 작업의 디렉터리, 표준 입출력, 실행시간, 상태와 같은 환경을 입력받아 그리드 자원에 동적으로 할당하는 것이 바람직하다.In step c), it is preferable to dynamically allocate the grid resources to the grid resources by receiving a parallel, distributed, independent characteristic of the task, and an environment such as a directory, standard input / output, execution time, and status of the task.
상기 c) 단계는, c-1) 상기 가용자원쿼럼 내에서 획득한 자원에 사용자가 입력한 작업을 할당하여 작업 큐에 등록하는 단계; 및 c-2) 상기 작업 규는 응용의 특성에 따라 실행 방법을 결정하여 작업 실행을 요구하는 단계를 포함하는 것이 바람직하다.The step c) may include: c-1) allocating a job input by a user to a resource acquired in the available resource quorum and registering it in a job queue; And c-2) it is preferable that the task rule includes the step of requesting the task execution by determining the execution method according to the characteristics of the application.
상기 d) 단계는, 상기 c) 단계에서 실행중인 작업을 감시하여 자원의 악화나고장 상태가 감지되면 작업의 재실행 또는 자원의 재할당을 결정하고, 상기 자원을 재할당이 결정되면 새로 할당할 자원을 선택하는 것이 바람직하다.In step d), if the deterioration or failure condition of the resource is detected by monitoring the job being executed in step c), the task is re-executed or the reallocation of the resource is determined. It is preferable to select.
상기 e) 단계는, 상기 완료된 작업에 대한 실행 결과 데이터 및 로그 파일을 전송해주는 후처리 단계를 포함하는 것이 바람직하다.The step e) preferably includes a post-processing step of transmitting the execution result data and the log file for the completed job.
본 발명의 두 번째 특징에 따른 정책 쿼럼 기반의 그리드 자원 관리 시스템은, 그리드 컴퓨팅 환경에서 사용자가 필요로 하는 그리드 자원을 발견, 선정, 할당하는 정책 쿼럼 기반의 그리드 자원 관리 시스템에 있어서, 사용자와의 인터페이스 역할을 수행하면서 사용자가 필요로 하는 작업의 특성 및 환경을 입력하고, 자원의 특성을 결정하여 사용자의 요구 사항을 전송하는 클라이언트; 및 상기 클라이언트와 상호 통신하면서 사용자 인증 및 자원 사용 권한 인증을 수행하고, 사용자의 요구 사항을 자원에 대한 요구 성능 및 그리드 서비스의 요구 수준을 서비스 레벨 어그리먼트(Service Level Agreements, SLA) 형태로 수렴하여 가용자원쿼럼을 생성하며, 상기 가용자원쿼럼 내에 획득된 자원을 통해 사용자의 작업을 계획 및 실행하도록 하는 서버를 포함한다.The policy quorum-based grid resource management system according to the second aspect of the present invention is a policy quorum-based grid resource management system for discovering, selecting, and allocating grid resources required by a user in a grid computing environment. A client that performs a role of an interface, inputs characteristics and environments of a task required by a user, determines characteristics of resources, and transmits user requirements; And perform user authentication and resource usage authority authentication while communicating with the client, and converge user's requirements in terms of resource requirements and grid service requirements in the form of service level agreements (SLAs). And a server to generate an available resource quorum, and to plan and execute a user's work through the resources obtained in the available resource quorum.
상기 서버는, 상기 자원 상태 정보를 관리하는 자원상태 저장서버, 및 상기 자원 상태를 지속적으로 감시하여 자원의 악화나 고장을 감지하는 자원상태 감시서버와 외부 연결되는 것이 바람직하다.The server may be externally connected to a resource state storage server that manages the resource state information, and a resource state monitoring server that continuously monitors the resource state and detects deterioration or failure of resources.
상기 서버는 실행중인 작업을 감시하여 사용자의 요구 수준 이하로 자원 상태의 악화 및 고장을 감지하여 작업을 재할당하는 자원 재구성 기능을 포함하는 것이 바람직하다.The server preferably includes a resource reconfiguration function that monitors a running job and reassigns the job by detecting deterioration and failure of a resource state below a user's demand level.
상기 서버는, 상기 클라이언트와 소켓 통신을 수행하여 상기 SLA 기반의 자원 획득 정책을 결정하기 위한 정보를 제어 및 저장하는 클라이언트 연결 모듈; 상기 자원 상태 정보를 추출하여 사용자의 요구 사항을 만족하는 자원을 결정하는 쿼럼 관리자; 및 상기 쿼럼 관리자에서 획득한 자원에 사용자의 작업을 할당하고, 실행중인 작업을 감시하면서 사용자에게 일정한 수준의 작업 완료를 보장하는 작업 관리자를 포함하는 것이 바람직하다.The server may include: a client connection module configured to perform socket communication with the client to control and store information for determining the SLA-based resource acquisition policy; A quorum manager extracting the resource state information to determine a resource that satisfies a user requirement; And a task manager for allocating a user's task to the resource obtained by the quorum manager and ensuring a certain level of task completion to the user while monitoring a running task.
상기 쿼럼 관리자는, 상기 자원 상태 정보를 통해 자원벡터를 생성하고, 상기 자원의 요구사항에 의해 결정된 정책에 의해 서비스품질 벡터를 생성한 후에 상기 자원 벡터와 서비스품질 벡터 값의 수준을 이진수로 표현하여 자원의 수준을 결정하여 자원 관리하는 것이 바람직하다.The quorum manager generates a resource vector based on the resource state information, generates a service quality vector according to a policy determined by the resource requirement, and then expresses the level of the resource vector and the service quality vector value in binary. It is desirable to manage resources by determining the level of resources.
아래에서는 첨부한 도면을 참고로 하여 본 발명의 실시예에 대하여 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자가 용이하게 실시할 수 있도록 상세히 설명한다. 그러나 본 발명은 여러 가지 상이한 형태로 구현될 수 있으며 여기에서 설명하는 실시예에 한정되지 않는다. 도면에서 본 발명을 명확하게 설명하기 위해서 설명과 관계없는 부분은 생략하였다. 명세서 전체를 통하여 유사한 부분에 대해서는 동일한 도면 부호를 붙였다.DETAILED DESCRIPTION Hereinafter, exemplary embodiments of the present invention will be described in detail with reference to the accompanying drawings so that those skilled in the art may easily implement the present invention. As those skilled in the art would realize, the described embodiments may be modified in various different ways, all without departing from the spirit or scope of the present invention. In the drawings, parts irrelevant to the description are omitted in order to clearly describe the present invention. Like parts are designated by like reference numerals throughout the specification.
본 발명의 실시예에 따른 정책 쿼럼 기반의 그리드 자원 관리 시스템에 대하여 도 1을 참고로 하여 상세하게 설명한다.A policy quorum based grid resource management system according to an embodiment of the present invention will be described in detail with reference to FIG. 1.
도 1은 본 발명의 실시예에 따른 정책 쿼럼 기반의 그리드 자원 관리 시스템의 전체 구성을 도시한 것이다.1 illustrates an overall configuration of a policy quorum based grid resource management system according to an embodiment of the present invention.
도 1에 나타낸 바와 같이, 본 발명의 실시예에 따른 정책 쿼럼 기반의 그리드 자원 관리 시스템은 크게 클라이언트(100)와 서버(200)로 구성되며, 서버(200)는 클라이언트 연결모듈(210), 쿼럼 관리자(220), 작업 관리자(230)를 포함한다.As shown in FIG. 1, a policy quorum-based grid resource management system according to an embodiment of the present invention includes a client 100 and a server 200, and the server 200 includes a client connection module 210 and a quorum. The manager 220 and the job manager 230 are included.
정책 쿼럼 기반의 그리드 자원 관리 시스템의 외부 모듈에는 자원상태 저장서버(400)와 자원상태 감시서버(300)가 있다.An external module of the policy quorum-based grid resource management system includes a resource state storage server 400 and a resource state monitoring server 300.
클라이언트(100)는 서버(200)의 클라이언트 연결모듈(210)을 통해서 클라이언트/서버 소켓 통신을 하며 사용자와의 인터페이스 역할을 수행한다.The client 100 performs client / server socket communication through the client connection module 210 of the server 200 and serves as an interface with a user.
이러한 클라이언트(100)는 그리드포탈, SLA 계약자, 자원 테이블, 작업 테이블 등을 포함하는데, 그리드포탈은 웹 포탈 형태로서 사용자를 위한 웹페이지를 제공하고, SLA 계약자는 서버(200) 내의 정책저장소(212)와 상호 통신하면서 요구하는 자원의 특성을 결정하는데, SLA 계약자에 의해 사용자가 필요로 하는 자원의 쿼럼 관리자(220)가 결정된다.The client 100 includes a grid portal, an SLA contractor, a resource table, a work table, and the like. The grid portal provides a web page for a user in the form of a web portal, and the SLA contractor includes a policy repository 212 in the server 200. In order to determine the characteristics of the resources required while communicating with each other, the quorum manager 220 of the resources required by the user is determined by the SLA contractor.
작업테이블에서는 자원 테이블에서 나온 자원을 통해 사용자가 요구하는 작업을 서버(200)의 작업 관리자(230) 내 작업 스케줄러(231)로 보내게 된다.In the work table, the work requested by the user is sent to the work scheduler 231 in the work manager 230 of the server 200 through the resources from the resource table.
클라이언트 연결 모듈(210)은 세션 어드미션 제어자(211), 정책 저장소(212), SLA 계약자(213), 응용 특성 저장소(214)를 포함한다.The client connection module 210 includes a session admission controller 211, a policy store 212, an SLA contractor 213, and an application property store 214.
세션 어드미션 제어자(211)는 클라이언트로부터의 세션 연결을 제어하여 사용자 인증 및 자원 사용 권한 인증을 수행하도록 하고, 정책 저장소(212)는 사용자의 SLA에 의해 제약되는 자원의 요구사항에 의해 결정된 정책을 저장하며, SLA 계약자(213)는 사용자가 필요로 하는 자원의 특성을 결정하고, 응용 특성 저장소(214)는 사용자의 응용 프로그램 특성을 저장한다.The session admission controller 211 controls session connection from a client to perform user authentication and resource permission authentication, and the policy store 212 implements a policy determined by the requirements of the resource constrained by the user's SLA. The SLA contractor 213 determines the characteristics of the resource needed by the user, and the application characteristic store 214 stores the application characteristics of the user.
쿼럼 관리자(220)는 정책 쿼럼 생성자(221), 자원 테이블(222), 및 자원상태 쿼리 모듈(223)을 포함한다.The quorum manager 220 includes a policy quorum generator 221, a resource table 222, and a resource state query module 223.
정책 쿼럼 생성자(221)는 정책 저장소(214)와 자원상태 쿼리 모듈(223)을 통해서 자원테이블(222)을 생성하고, 자원상태 쿼리 모듈(223)은 자원상태 저장서버(400)의 자원 상태 정보를 불러온다.The policy quorum generator 221 generates the resource table 222 through the policy store 214 and the resource state query module 223, and the resource state query module 223 provides resource state information of the resource state storage server 400. Bring up
작업 관리자(230)는 작업 스케줄러(231), 작업 디스패쳐(dispatcher)(232), 자원 재구성 모듈(233), 및 작업 감시자(234)를 포함한다.The task manager 230 includes a task scheduler 231, a task dispatcher 232, a resource reconfiguration module 233, and a task monitor 234.
작업 스케줄러(231)는 작업 디스패쳐(232)에게 작업을 실행시킬 것을 요청하고, 작업 디스패쳐(232)는 사용자 질의 처리를 요구하며, 자원재구성모듈(233)에 작업을 등록하여 실행 과정을 작업 감시자(234)를 통해서 감시한다.The job scheduler 231 requests the job dispatcher 232 to execute the job, the job dispatcher 232 requests user query processing, and registers the job with the resource reconfiguration module 233 to execute the job. Monitor through the monitor 234.
자원 재구성 모듈(233)은 작업 및 자원의 감시를 통해서 자원 재구성 여부를 결정하고, 자원을 재구성할 경우에 작업 스케줄러(231)를 호출하여 재할당을 시도한다.The resource reconfiguration module 233 determines whether to reconfigure resources through monitoring of tasks and resources, and when reconfiguring resources, calls the task scheduler 231 to attempt reallocation.
다음, 도 2 내지 도 5를 참조하여 본 발명의 실시예에 따른 정책 쿼럼 기반의 그리드 자원 관리 시스템의 동작에 대하여 자세하게 설명한다.Next, the operation of the policy quorum-based grid resource management system according to an embodiment of the present invention will be described in detail with reference to FIGS. 2 to 5.
도 2는 본 발명의 실시예에 따른 정책 쿼럼 기반의 그리드 자원 관리 방법의 순서도를 도시한 것이다.2 is a flowchart illustrating a policy quorum based grid resource management method according to an embodiment of the present invention.
도 2에 도시된 바와 같이, 본 발명의 실시예에 따른 정책 쿼럼 기반의 그리드 자원 관리 방법은 먼저 클라이언트/서버 구조의 프록시 인증 기법을 통해 사용자 인증 및 자원 사용 권한 인증을 수행한 후, 사용자의 자원에 대한 요구 성능 및 그리드 서비스의 요구 수준, 및 작업에 대한 요구 사항들을 접수한다.As shown in FIG. 2, the policy quorum-based grid resource management method according to an embodiment of the present invention first performs user authentication and resource use authority authentication through a proxy authentication scheme of a client / server structure, and then a user resource. Receive requirements for performance, required levels of grid services, and requirements for work.
이때, 서버(200)는 사용자의 요구사항을 SLA로 정의 하여 SLA 형태로 수렴하고, 정책 쿼럼을 통해 사용자의 요구 수준, 응용 프로그램 특성, 최적화 정책에 따른 가용자원쿼럼을 생성한다.At this time, the server 200 defines the user's requirements as SLAs and converges them in the form of SLAs, and generates available resource quorum according to the user's requirement level, application characteristics, and optimization policy through policy quorum.
서버(200)에서는 사용자의 작업을 분석하여 가용 자원 쿼럼 내에 획득된 자원을 통해 사용자의 작업을 계획 및 실행하도록 하고, 실행중인 작업을 감시한다.The server 200 analyzes the user's work to plan and execute the user's work through the resources acquired in the available resource quorum, and monitors the running work.
이때, 서버(200)는 실행중인 작업이 사용자의 요구수준 이하인 경우에, 자원 상태의 악화 및 고장을 대비하여 자동적으로 작업을 재할당하는 자원 재구성 기능을 수행한다.At this time, the server 200 performs a resource reconfiguration function that automatically reassigns a job in preparation for deterioration and failure of a resource state when a running job is below a user's requirement level.
서버(200)는 실행중인 작업이 완료됨이 감지되면 이를 사용자에게 통보하고 작업 기록을 저장한다.When the server 200 detects that the running job is completed, the server 200 notifies the user and stores the job record.
도 3은 도 1의 일부 구성요소인 쿼럼 관리자의 자원 획득 처리 방법의 순서도를 도시한 것이다.FIG. 3 is a flowchart illustrating a method of processing resource acquisition by a quorum manager, which is a part of FIG. 1.
도 3에 나타나 있듯이, 쿼럼 관리자(220)는 자원상태 저장서버(400)와 연결되어 있어 자원의 상태에 대한 정보를 얻고 사용자의 요구를 만족하는 자원을 결정할 수 있다.As shown in FIG. 3, the quorum manager 220 is connected to the resource state storage server 400 to obtain information about the state of the resource and determine a resource that satisfies the user's request.
즉, 쿼럼 관리자(220)는 클라이언트(100)에서 얻은 SLA와 자원상태 저장서버(400)를 통해 얻은 자원의 상태 정보를 통해 자원집합을 결정하고, 이 자원 집합이 SLA를 만족하는 경우에 자원벡터로 표현한다.That is, the quorum manager 220 determines the resource set based on the SLA obtained from the client 100 and the state information of the resource obtained through the resource state storage server 400, and the resource vector when the resource set satisfies the SLA. Expressed as
또한 쿼럼 관리자(220)는 SLA와 서비스 클래스, QoS 정책에 의해서 가용한 QoS 벡터를 생성하고, 맵퍼(미도시)를 통해 자원벡터와 QoS 벡터를 이진 맵핑하여 자원의 수준을 결정하여 가용자원 쿼럼을 생성한다.In addition, the quorum manager 220 generates a QoS vector available by SLA, service class, and QoS policy, and determines the level of resources by binary mapping of the resource vector and the QoS vector through a mapper (not shown) to determine the available resource quorum. Create
이때, 쿼럼 관리자(220)는 성능과 비용의 두 단계의 최적화 정책을 적용하여 최종적으로 가용자원쿼럼을 최적화한다. 이렇게 생성된 가용자원쿼럼은 사용자에게 자원테이블로 표시되어 작업을 실행시킬 준비를 가능하게 한다.At this time, the quorum manager 220 finally optimizes the available resource quorum by applying an optimization policy of two levels of performance and cost. The generated resource quorum is then presented to the user as a resource table, ready to run the task.
도 4는 도 1의 일부 구성요소인 작업 관리자의 작업 스케줄링 및 자원 재구성 방법의 순서도를 도시한 것이다.FIG. 4 illustrates a flowchart of a method of job scheduling and resource reconfiguration of a job manager, which is a component of FIG. 1.
도 4에 도시된 바와 같이, 작업 관리자(230)는 쿼럼 관리자(220)에서 획득한 자원에 사용자의 작업을 할당하고 작업을 감시하며 최종적으로 작업이 완료되는 것을 보장하고 있다.As shown in FIG. 4, the task manager 230 allocates a user's task to a resource obtained from the quorum manager 220, monitors the task, and ensures that the task is finally completed.
즉, 작업 관리자(230)의 작업 스케줄러(231)는 쿼럼 관리자(220)로부터 최적화 가용자원쿼럼을 제공받는다. 그러면, 자원 재구성 모듈(233)은 사용자가 작업 테이블로부터 입력한 작업을 할당하여 작업 큐에 등록한다. 이때, 사용자는 작업의 특성(병렬, 분산, 독립) 및 환경(디렉터리, 표준 입출력, 실행시간, 상태 등)을 작업 테이블에 입력한다.That is, the task scheduler 231 of the task manager 230 is provided with the optimized available resource quorum from the quorum manager 220. Then, the resource reconfiguration module 233 allocates the work input by the user from the work table and registers the work in the work queue. At this time, the user inputs the characteristics of the job (parallel, distributed, independent) and the environment (directory, standard input / output, execution time, state, etc.) to the job table.
작업 큐는 응용의 특성에 따라서 RSL(Runtime System Library) 생성자(미도시) 혹은 MPICH-G2 호출자(미도시)를 호출하여 작업 디스패쳐(233)에게 GRAM 호출자를 통해 작업 실행을 요구한다.The job queue calls the runtime system library (RSL) generator (not shown) or the MPICH-G2 caller (not shown) according to the characteristics of the application, and requests the job dispatcher 233 to execute the job through the GRAM caller.
여기서, MPICH-G2는 글로버스의 자원관리나 시큐리티를 이용하는 미들웨어로서 MPI(Message-Passing Interface) 응용을 실행시키기 위한 것이다.The MPICH-G2 is a middleware that uses resource management and security of the global bus to execute a message-passing interface (MPI) application.
작업 감시자(234)는 위에서 실행이 시도된 작업의 상태를 감시하고, 자원 재구성 모듈(233)은 작업 상태를 확인하여 실행 악화나 고장 상태이면 자원의 재구성을 결정한다.The task monitor 234 monitors the status of the task attempted to be executed above, and the resource reconfiguration module 233 checks the status of the task to determine the reconfiguration of the resource if the execution worsens or fails.
작업 관리자(230)는 작업 실행이 완료되고, 응용 프로그램이 종료되면 최종적으로 사용자에게 작업이 완료되었음을 클라이언트(100)의 작업 테이블에 표시한다.The task manager 230 completes the execution of the task, and when the application is terminated, the task manager 230 displays to the user that the task is completed in the task table of the client 100.
도 5는 본 발명의 실시예에 따른 정책 쿼럼 기반의 그리드 자원 관리 시스템에서의 그래픽 사용자 인터페이스를 도시한 것이다.5 illustrates a graphical user interface in a policy quorum based grid resource management system according to an embodiment of the present invention.
도 5에 나타나 있듯이, 클라이언트(100)는 사용자 인증을 통해서 서버(200)와 세션 연결을 시도하며 사용자 인증 후에 그리드 자원 사용 권한 인증을 위해 프록시 인증 절차를 거친다.As shown in FIG. 5, the client 100 attempts a session connection with the server 200 through user authentication, and undergoes a proxy authentication procedure for grid resource use authority authentication after user authentication.
위에서 인증 절차를 성공적으로 완료하면 사용자는 쿼럼 관리자 사용 모듈(a-1) 과 쿼럼 관리자 비사용 모듈(a-2)을 선택하여 가용자원 발견(Discover)을 시도한다.After successfully completing the above authentication process, the user selects the quorum manager using module (a-1) and the quorum manager not using module (a-2) and attempts to discover available resources.
이렇게 발견된 가용자원은 자원테이블에 표시되어 사용자에게 보여지고, 자원이 결정되면 사용자는 작업의 관리를 위해서 자원 재구성 정책(b-1)과 자원 재구성 알고리즘(b-2)을 선택하고 작업을 제출하게 된다.The available resources are displayed in the resource table and shown to the user. Once the resources are determined, the user selects a resource reconfiguration policy (b-1) and a resource reconfiguration algorithm (b-2) and submits the task to manage the task. Done.
제출된 작업은 제출 작업 확인 부분을 통해서 사용자에게 재확인(confirm)을 받게 되고, 제출된 작업은 작업의 ID를 비롯하여 필요한 파라미터를 작업테이블에표시된다.The submitted job is confirmed by the user through the submit job confirmation part, and the submitted job is displayed in the job table with necessary parameters including the ID of the job.
이상에서 설명한 바와 같이, 본 발명의 실시예에 따른 정책 쿼럼 기반의 그리드 자원 관리 시스템 및 그 방법은 그리드에서 시간적, 공간적으로 변하는 자원의 상태에 따라서 사용자의 SLA를 만족시켜주는 자원의 집합을 발견할 수 있는 유연한 시스템 및 방법을 제시한다. 특히, 본 발명의 실시예에 따른 정책 쿼럼 기반의 그리드 자원 관리 시스템 및 그 방법은 사용자가 요구하는 자원의 일정수준을 지속적으로 유지시켜 QoS를 최적화할 수 있도록 제작 가능하다.As described above, the policy quorum-based grid resource management system and method according to an embodiment of the present invention can find a set of resources that satisfy the user's SLA according to the state of resources that change temporally and spatially in the grid. It provides a flexible system and method. In particular, the policy quorum-based grid resource management system and method according to an embodiment of the present invention can be manufactured to optimize QoS by continuously maintaining a certain level of resources required by a user.
이상에서 본 발명의 바람직한 실시예에 대하여 상세하게 설명하였지만 본 발명은 이에 한정되는 것은 아니며, 그 외의 다양한 변경이나 변형이 가능하다.Although the preferred embodiment of the present invention has been described in detail above, the present invention is not limited thereto, and various other changes and modifications are possible.
이와 같이, 본 발명에 의한 정책 쿼럼 기반의 그리드 자원 관리 시스템 및 그 방법은 그리드에서 시간적, 공간적으로 변하는 자원의 상태에 따라서 사용자의 SLA를 만족시켜주는 자원의 집합을 발견할 수 있고, 사용자가 요구하는 자원의 일정 수준을 지속적으로 유지시켜 QoS를 최적화할 수 있는 효과가 있다.As described above, the policy quorum-based grid resource management system and method according to the present invention can find a set of resources that satisfy the user's SLA according to the state of resources that change temporally and spatially in the grid, and the user requests QoS can be optimized by maintaining a certain level of resources.
또한, 본 발명에 의한 정책 쿼럼 기반의 그리드 자원 관리 시스템 및 그 방법은 작업을 자원에 할당시킨 후에 작업의 지속적인 감시를 통해 작업의 진행 상태를 확인할 수 있고, 자원의 악화나 고장 등에 유연하게 대처할 수 있도록 자원을 재구성함으로써 복잡한 자원 분포 환경에서 사용자에게 신뢰성 있는 작업 실행 환경을 보장할 수 있는 효과가 있다.In addition, the policy quorum-based grid resource management system and method according to the present invention can check the progress of the task through continuous monitoring of the task after assigning the task to the resource, and can flexibly cope with resource deterioration or failure. By reconfiguring resources so that users can have a reliable job execution environment in a complex resource distribution environment.
Claims (20)
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020040061650A KR100618159B1 (en) | 2004-08-05 | 2004-08-05 | System and method for policy quorum grid resource management |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020040061650A KR100618159B1 (en) | 2004-08-05 | 2004-08-05 | System and method for policy quorum grid resource management |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20040075307A true KR20040075307A (en) | 2004-08-27 |
KR100618159B1 KR100618159B1 (en) | 2006-08-29 |
Family
ID=37361661
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020040061650A KR100618159B1 (en) | 2004-08-05 | 2004-08-05 | System and method for policy quorum grid resource management |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR100618159B1 (en) |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100824298B1 (en) * | 2005-05-02 | 2008-04-23 | 엘지전자 주식회사 | Method for scheduling device management and terminal thereof |
KR100858205B1 (en) * | 2006-06-13 | 2008-09-10 | 주식회사 케이티 | System for offering application service provider service in grid-base and method thereof |
WO2009032711A1 (en) * | 2007-08-29 | 2009-03-12 | Nirvanix, Inc. | Policy-based file management for a storage delivery network |
KR100928032B1 (en) * | 2007-12-13 | 2009-11-24 | 한국전자통신연구원 | Control system and method for controlling multimedia broadcast multicast service using a grid service |
US7756056B2 (en) | 2006-12-01 | 2010-07-13 | Electronics And Telecommunications Research Institute | Apparatus and method for managing quality of service in integrated network of heterogeneous mobile network |
KR101040171B1 (en) * | 2007-07-30 | 2011-06-09 | 영남대학교 산학협력단 | Scalable Grid Resource Management based on WBEM with UPnP resource discovery |
KR101388367B1 (en) * | 2012-03-30 | 2014-04-23 | 한국과학기술원 | Adaptive quality level selection method for efficient quality-of-service based service composition and system thereof |
KR101653685B1 (en) * | 2015-11-27 | 2016-09-02 | 주식회사 비디 | Computer-excutable method for managing api |
CN107251007A (en) * | 2015-03-25 | 2017-10-13 | 英特尔公司 | PC cluster service ensures apparatus and method |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105740061B (en) * | 2016-01-29 | 2019-05-31 | 腾讯科技(深圳)有限公司 | A kind of method, user equipment and system that GPU resource is rebuild |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5754857A (en) * | 1995-12-08 | 1998-05-19 | Sun Microsystems, Inc. | Distributed asynchronous workflow on the net |
US6480879B1 (en) | 1998-03-13 | 2002-11-12 | Genuity Inc. | Framework for providing quality of service requirements in a distributed object-oriented computer system |
JP2002261818A (en) | 2001-03-01 | 2002-09-13 | Kddi Corp | Communication network resource allocation method |
KR100475668B1 (en) * | 2002-12-23 | 2005-03-10 | 한국과학기술정보연구원 | Apparatus and method of providing information for grid resources in grid network and computer readable recording medium of recording process thereof |
KR100609459B1 (en) * | 2003-03-26 | 2006-08-08 | 김기환 | parallel distributed processing system and method |
KR100621787B1 (en) * | 2003-12-31 | 2006-09-13 | 학교법인 한국정보통신학원 | Method for assigning dynamic source based on qos and application special quality of user's in grid |
-
2004
- 2004-08-05 KR KR1020040061650A patent/KR100618159B1/en not_active IP Right Cessation
Cited By (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100824298B1 (en) * | 2005-05-02 | 2008-04-23 | 엘지전자 주식회사 | Method for scheduling device management and terminal thereof |
KR100858205B1 (en) * | 2006-06-13 | 2008-09-10 | 주식회사 케이티 | System for offering application service provider service in grid-base and method thereof |
US7756056B2 (en) | 2006-12-01 | 2010-07-13 | Electronics And Telecommunications Research Institute | Apparatus and method for managing quality of service in integrated network of heterogeneous mobile network |
KR101040171B1 (en) * | 2007-07-30 | 2011-06-09 | 영남대학교 산학협력단 | Scalable Grid Resource Management based on WBEM with UPnP resource discovery |
US9705979B2 (en) | 2007-08-29 | 2017-07-11 | Oracle International Corporation | Policy-based file management for a storage delivery network |
US8315999B2 (en) | 2007-08-29 | 2012-11-20 | Nirvanix, Inc. | Policy-based file management for a storage delivery network |
WO2009032711A1 (en) * | 2007-08-29 | 2009-03-12 | Nirvanix, Inc. | Policy-based file management for a storage delivery network |
US10193967B2 (en) | 2007-08-29 | 2019-01-29 | Oracle International Corporation | Redirecting devices requesting access to files |
US10523747B2 (en) | 2007-08-29 | 2019-12-31 | Oracle International Corporation | Method and system for selecting a storage node based on a distance from a requesting device |
US10924536B2 (en) | 2007-08-29 | 2021-02-16 | Oracle International Corporation | Method and system for selecting a storage node based on a distance from a requesting device |
KR100928032B1 (en) * | 2007-12-13 | 2009-11-24 | 한국전자통신연구원 | Control system and method for controlling multimedia broadcast multicast service using a grid service |
KR101388367B1 (en) * | 2012-03-30 | 2014-04-23 | 한국과학기술원 | Adaptive quality level selection method for efficient quality-of-service based service composition and system thereof |
CN107251007A (en) * | 2015-03-25 | 2017-10-13 | 英特尔公司 | PC cluster service ensures apparatus and method |
CN107251007B (en) * | 2015-03-25 | 2021-10-01 | 英特尔公司 | Cluster computing service ensuring device and method |
KR101653685B1 (en) * | 2015-11-27 | 2016-09-02 | 주식회사 비디 | Computer-excutable method for managing api |
Also Published As
Publication number | Publication date |
---|---|
KR100618159B1 (en) | 2006-08-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11658916B2 (en) | Simple integration of an on-demand compute environment | |
US11175954B2 (en) | Multi-layer QoS management in a distributed computing environment | |
US8850429B2 (en) | Load balancing in multi-server virtual workplace environments | |
KR101994506B1 (en) | Decoupling paas resources, jobs, and scheduling | |
JP6165777B2 (en) | Computing system, computer storage memory, and computer-implemented method for automatic scaling | |
US10394475B2 (en) | Method and system for memory allocation in a disaggregated memory architecture | |
US8230438B2 (en) | Dynamic application placement under service and memory constraints | |
US7870568B2 (en) | Adaptive shared computing infrastructure for application server-based deployments | |
US7584281B2 (en) | Method for allocating shared computing infrastructure for application server-based deployments | |
US9716746B2 (en) | System and method using software defined continuity (SDC) and application defined continuity (ADC) for achieving business continuity and application continuity on massively scalable entities like entire datacenters, entire clouds etc. in a computing system environment | |
US8104038B1 (en) | Matching descriptions of resources with workload requirements | |
US20200250006A1 (en) | Container management | |
US11467874B2 (en) | System and method for resource management | |
KR20100126280A (en) | System and method for describing applications for manageability and efficient scale-up deployment | |
US20210334126A1 (en) | On-demand code execution with limited memory footprint | |
Vig et al. | An efficient distributed approach for load balancing in cloud computing | |
KR100618159B1 (en) | System and method for policy quorum grid resource management | |
US8743387B2 (en) | Grid computing system with virtual printer | |
Salehi et al. | Contention management in federated virtualized distributed systems: implementation and evaluation | |
KR20070041462A (en) | Grid resource management system and its method for qos-constrained available resource quorum generation | |
Sah et al. | Scalability of efficient and dynamic workload distribution in autonomic cloud computing | |
Vijayalakshmi et al. | Investigations on job scheduling algorithms in cloud computing | |
Burchard et al. | VRM: A failure-aware grid resource management system | |
KR20160063430A (en) | Method for managing and assigning available resourse by reservation of virtual machine | |
Ismail | Dynamic resource allocation mechanisms for grid computing environment |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20120730 Year of fee payment: 7 |
|
FPAY | Annual fee payment |
Payment date: 20120824 Year of fee payment: 8 |
|
FPAY | Annual fee payment |
Payment date: 20140724 Year of fee payment: 9 |
|
LAPS | Lapse due to unpaid annual fee |