KR101411563B1

KR101411563B1 - 리소스 지역성에 기초한 분산 처리 시스템 및 분산 처리 방법

Info

Publication number: KR101411563B1
Application number: KR1020130132303A
Authority: KR
Inventors: 송사광; 정한민; 정도헌; 황명권; 김진형; 김장원
Original assignee: 한국과학기술정보연구원
Priority date: 2013-11-01
Filing date: 2013-11-01
Publication date: 2014-06-25

Abstract

리소스 지역성에 기초한 분산 처리 방법이 개시된다. 분산 처리 방법은 기 설정된 기준에 기초하여 고빈도 참조 리소스를 추출하는 단계, 추출된 고빈도 참조 리소스를 복수의 노드 각각에 포함된 분산 저장부에 저장하는 단계 및 고빈도 참조 리소스에 관한 정보를 기초로 참조하려는 고빈도 참조 리소스가 저장된 분산 저장부에 태스크를 처리하는 프로세서를 연결하는 단계를 포함한다. 이에 따라, 분산 처리 방법은 리소스 데이터의 지역성을 확보하여 네트워크 오버헤드를 감소시킴에 따라 더 빠르게 분산 처리를 할 수 있다.

Description

리소스 지역성에 기초한 분산 처리 시스템 및 분산 처리 방법{DISTRIBUTED PROCESSING SYSTEM BASED ON RESOURCE LOCALITY AND DISTRIBUTED PROCESSING METHOD THEREOF}

본 발명은 분산 처리 시스템 및 분산 처리 방법에 관한 것으로서, 더욱 상세하게는, 리소스의 지역성(locality)을 고려한 분산 처리 시스템 및 분산 처리 방법에 관한 것이다.

최근, 네트워크 기술의 발전과 대용량 컨텐츠의 증가에 따라 서비스를 위해 수집, 처리, 관리해야 하는 데이터 양은 빠르게 증가하고 있다. 이와 같은 대용량 데이터의 관리를 위해 데이터를 분산 관리하고, 병렬 처리하는 기술에 대해 많은 연구가 진행되고 있다. 분산 병렬 처리 기술 중에서 맵리듀스(MapReduce) 모델이 대표적인 분산 병렬 처리 방법으로 주목을 받고 있다.

맵리듀스 모델은 대규모 노드로 구성된 클러스터의 대용량 데이터에 대한 분산 병렬 연산을 지원하기 위하여 제안된 분산 병렬 처리 프로그래밍 모델이다. 맵리듀스 모델은 대규모 분산 병렬 처리에 있어 데이터 증가에 따른 확장성을 제공하고, 노드 간 데이터 이동에 따른 네트워크 트래픽을 최소화하기 위해 구현되었다. 따라서, 맵리듀스 모델은 로컬 데이터의 지역성(locality)을 고려하여 데이터를 처리할 수 있다. 이와 같이, 맵리듀스 모델은 로컬 데이터의 지역성 및 트래픽을 최소화하도록 구현됨으로써 많은 로컬 데이터를 빠르게 처리할 수 있다.

그러나, 분산 병렬 프로그램 개발시 많은 분석 작업은 로컬 데이터만을 참조하는 것이 아니라 다양한 공통 리소스(resource)를 참조하여 수행한다. 이 과정에서 참조되는 리소스들은 지역성이 보장되지 않기 때문에 네트워크 오버헤드가 증가된다. 따라서, 맵리듀스 모델이 공통 참조 리소스를 억세스할 때 리소스 데이터의 지역성을 확보할 수 있는 기술에 대한 필요성이 대두되고 있다.

본 발명은 상술한 문제점을 해결하기 위해 안출된 것으로, 본 발명의 목적은 리소스 지역성을 확보할 수 있는 분산 처리 시스템 및 분산 처리 방법을 제공함에 있다.

본 발명의 상술한 목적을 달성하기 위한 일 실시 예로서, 리소스 지역성에 기초한 분산 처리 방법은 기 설정된 기준에 기초하여 고빈도 참조 리소스를 추출하는 단계, 상기 추출된 고빈도 참조 리소스를 복수의 노드 각각에 포함된 분산 저장부에 저장하는 단계 및 고빈도 참조 리소스에 관한 정보를 기초로 참조하려는 고빈도 참조 리소스가 저장된 분산 저장부에 태스크를 처리하는 프로세서를 연결하는 단계를 포함한다.

그리고, 상기 고빈도 참조 리소스에 관한 정보는 복사된 리소스 또는 저장 위치 포인터 중 적어도 하나일 수 있다.

한편, 리소스 지역성에 기초한 분산 처리 방법은 상기 분산 저장부에 저장된 각 고빈도 참조 리소스를 동기화하는 단계를 더 포함할 수 있다.

그리고, 리소스 지역성에 기초한 분산 처리 방법은 상기 저장된 고빈도 참조 리소스를 업데이트하는 단계를 더 포함할 수 있다.

한편, 기 설정된 기준은 리소스의 참조 횟수 또는 리소스 크기 중 적어도 하나일 수 있다.

또한, 리소스 지역성에 기초한 분산 처리 방법은 상기 분산 코디네이터는 복수 개 존재하고, 상기 복수 개의 분산 코디네이터들을 관리하는 단계를 더 포함할 수 있다.

본 발명의 상술한 목적을 달성하기 위한 일 실시 예로서, 리소스 지역성에 기초한 분산 처리 시스템은 기 설정된 기준에 기초하여 고빈도 참조 리소스를 추출하는 리소스 로더, 복수의 노드 각각에 포함된 분산 저장부 및 상기 추출된 고빈도 참조 리소스를 상기 분산 저장부에 저장하는 분산 코디네이터를 포함하며, 상기 분산 코디네이터는 고빈도 참조 리소스에 관한 정보를 포함하고, 상기 정보에 기초하여 참조하려는 고빈도 참조 리소스가 저장된 분산 저장부에 태스크를 처리하는 프로세서를 연결한다.

또한, 상기 분산 코디네이터는 상기 분산 저장부에 저장된 각 고빈도 참조 리소스를 동기화할 수 있다.

그리고, 상기 분산 코디네이터는 상기 저장된 고빈도 참조 리소스를 업데이트할 수 있다.

또한, 기 설정된 기준은 리소스의 참조 횟수 또는 리소스 크기 중 적어도 하나일 수 있다.

한편, 상기 분산 코디네이터는 복수 개 존재하고, 리소스 지역성에 기초한 분산 처리 시스템은 상기 복수 개의 분산 코디네이터들을 관리하는 분산 코디네이터 관리자를 더 포함할 수 있다.

상술한 다양한 실시 예에 따르면, 리소스 지역성에 기초한 분산 처리 시스템 및 분산 처리 방법은 리소스 데이터의 지역성을 확보하여 네트워크 오버헤드를 감소시킴에 따라 더 빠르게 분산 처리를 할 수 있다.

도 1은 본 발명의 일 실시 예에 따른 리소스 지역성에 기초한 분산 처리 시스템의 블록도.
도 2는 본 발명의 다른 실시 예에 따른 리소스 지역성에 기초한 분산 처리 시스템의 블록도.
도 3은 본 발명의 일 실시 예에 따른 고빈도 참조 리소스를 결정하는 기준을 설명하는 도면.
도 4는 본 발명의 일 실시 예에 따른 고빈도 참조 리소스의 처리 과정을 설명하는 도면.
도 5는 본 발명의 일 실시 예에 따른 리소스 지역성에 기초한 분산 처리 방법을 설명하는 흐름도.

이하 상기의 목적을 구체적으로 실현할 수 있는 본 발명의 바람직한 실시 예를 첨부한 도면을 참조하여 설명한다. 이때 도면에 도시되고 또 이것에 의해서 설명되는 본 발명의 구성과 작용은 적어도 하나의 실시 예로서 설명되는 것이며, 이것에 의해서 본 발명의 기술적 사상과 그 핵심 구성 및 작용이 제한되지는 않는다.

본 발명에서 사용되는 용어는 본 발명에서의 기능을 고려하면서 가능한 현재 널리 사용되는 일반적인 용어를 선택하였으나, 이는 당해 기술 분야에 종사하는 기술자의 의도 또는 관례 또는 새로운 기술의 출현 등에 따라 달라질 수 있다. 또한, 특정한 경우는 출원인이 임의로 선정한 용어도 있으며, 이 경우 해당되는 발명의 설명 부분에서 상세히 그 의미를 기재할 것이다. 따라서 본 발명에서 사용되는 용어는 단순한 용어의 명칭이 아닌 그 용어가 가지는 의미와 본 발명의 전반에 걸친 내용을 토대로 정의되어야 함을 밝혀두고자 한다.

도 1은 본 발명의 일 실시 예에 따른 리소스 지역성에 기초한 분산 처리 시스템의 블록도이다.

도 1을 참조하면, 리소스 지역성에 기초한 분산 처리 시스템(1000)은 분산 코디네이터(110), 복수의 분산 저장부(121, 122, 123, 124) 및 리소스 로더(resource loader)(130)를 포함한다.

리소스 로더(130)는 기 설정된 기준에 기초하여 고빈도 참조 리소스를 추출한다. 참조 리소스란 분산 병렬 처리시 분산 처리 시스템이 참조하는 리소스를 의미한다. 예를 들어, 참조 리소스는 기술(technology) 정보, 구조(organization) 정보, 용어사전, 전자사전, 온톨로지(ontology), 그래프 정보, 노드 관련 정보 등이 될 수 있다. 고빈도 참조 리소스란 분산 처리 시스템이 상대적으로 자주 참조하는 리소스를 의미한다. 고빈도 참조 리소스는 참조 횟수, 비율 등 일정한 기준에 따라 설정될 수 있다.

분산 코디네이터(110)는 리소스 로더(130)에서 추출된 고빈도 참조 리소스를 제1 내지 제4 분산 저장부(121, 122, 123, 124) 중 적어도 하나의 분산 저장부에 저장한다. 상술한 제1 내지 제4 분산 저장부(121, 122, 123, 124)는 일 실시 예이며, 더 적거나 더 많은 분산 저장부가 있을 수 있다. 제1 내지 제4 분산 저장부(121, 122, 123, 124)는 각각 서로 다른 노드에 포함된다. 노드는 맵리듀스(mapreduce) 태스크를 수행하는 장치를 의미한다.

분산 코디네이터(110)는 고빈도 참조 리소스에 관한 정보를 포함한다. 고빈도 참조 리소스에 관한 정보는 고빈도 참조 리소스의 복사본 또는 저장 위치 정보 등을 의미한다. 예를 들어, 분산 코디네이터(110)는 고빈도 참조 리소스를 제1 분산 저장부(121) 및 제2 분산 저장부(122)에 저장해 두고, 복사된 고빈도 참조 리소스 또는 저장 위치 포인터를 포함하는 고빈도 참조 리소스에 관한 정보를 저장한다. 분산 코디네이터(110)는 저장된 고빈도 참조 리소스에 관한 정보에 기초하여 맵 태스크 또는 리듀스 태스크에 따라 고빈도 참조 리소스가 저장된 분산 저장부에 태스크를 처리하는 프로세서를 연결할 수 있다. 분산 코디네이터(110)는 맵 태스크 또는 리듀스 태스크가 아니더라도 고빈도 참조 리소스를 억세스하는 태스크를 처리하는 프로세서를 고빈도 참조 리소스가 저장도니 분산 저장부에 연결할 수 있다.

그리고, 분산 코디네이터(110)는 서비스를 각 노드에 적절하게 분산시켜 각 노드들이 동시에 작업할 수 있도록 하며, 하나의 노드에서 처리된 결과가 다른 노드들과 동기화시킴으로써 데이터의 안정성을 보장해 줄 수 있다. 분산 코디네이터(110)는 어느 하나의 노드가 문제가 발생하여 서비스를 지속적으로 작업을 처리하지 못하는 경우, 다른 노드가 문제가 발생한 노드의 작업을 처리할 수 있도록 조정할 수 있다. 또한, 각각의 노드들에 관한 환경설정을 분산시키지 않고 통합적으로 관리할 수 있다. 예를 들어, 분산 코디네이터(110)는 쥬키퍼(zookeeper) 시스템일 수 있다.

이와 같이 분산 처리 시스템은 리소스 지역성(locality)을 확보하여 태스크를 수행함으로써 네트워크의 오버헤드(overhead)를 감소시키고 빠른 분산 처리를 할 수 있다.

도 2는 본 발명의 다른 실시 예에 따른 리소스 지역성에 기초한 분산 처리 시스템의 블록도이다.

도 2를 참조하면, 분산 처리 시스템은 제1 분산 코디네이터(111), 제2 분산 코디네이터(112), 리소스 로더(130), 분산 코디네이터 관리자(140), 제1 및 제2 맵 태스크(11, 13) 및 제1 및 제2 리듀스 태스크(12, 14)로 구성될 수 있다.

제1 분산 코디네이터(111), 제2분산 코디네이터(112)는 각각 일부 노드를 관리할 수 있다. 도 1에서 설명한 바와 유사하게 제1 분산 코디네이터(111) 및 제2 분산 코디네이터(112)는 추출된 고빈도 참조 리소스를 분산 저장부에 저장할 수 있다. 제1 및 제2 분산 코디네이터(111, 112)는 저장한 고빈도 참조 리소스에 관한 정보를 저장하고, 이 정보에 기초하여 맵 태스크 또는 리듀스 태스크에 따라 분산 저장부에 태스크를 처리하는 프로세서를 연결할 수 있다. 분산 코디네이터의 개수는 도 2에 도시된 바에 국한되지 않으며, 분산 처리 시스템은 더 많은 분산 코디네이터로 구현될 수 있다.

리소스 로더(130)는 기 설정된 기준에 기초하여 고빈도 참조 리소스를 추출할 수 있다. 고빈도 참조 리소스는 제1 또는 제2 분산 코디네이터(111, 112)에 의해 분산 저장부에 저장될 수 있다. 리소스 로더(130)는 고빈도 참조 리소스를 제외한 저빈도 참조 리소스를 분산 코디네이터 관리자를 통해 저장할 수 있다. 저빈도 참조 리소스는 기존 방식과 동일한 방식으로 저장되고 참조될 수 있다.

분산 코디네이터 관리자(140)는 제1 및 제2 분산 코디네이터(111, 112)들을 관리할 수 있다. 분산 코디네이터 관리자(140)는 더 많은 분산 코디네이터로 구현된 경우 더 많은 분산 코디네이터들을 관리할 수 있다. 또한, 분산 코디네이터 관리자(140)는 고빈도 참조 리소스 이외의 참조 리소스를 각 노드에 분할하여 저장할 수 있다. 분산 코디네이터 관리자(140)의 참조 리소스를 저장하고 관리하는 방법은 종래 방식으로 수행될 수 있다.

각 노드는 분산 코디네이터의 제어를 받고 맵 태스크 또는 리듀스 태스크를 실행할 수 있다. 예를 들어, 제1 분산 코디네이터(111)는 하나의 노드에 제1 맵 태스크(11)를 실행시키고, 제2 분산 코디네이터(112)는 또 다른 하나의 노드에 제2 맵 태스크(13)를 실행시킬 수 있다. 제1 및 제2 분산 코디네이터(111, 112)는 복수의 노드를 포함할 수 있으며, 복수의 맵 태스크를 실행시킬 수 있다. 이후 제1 분 코디네이터(111)는 하나의 노드에 제1 리듀스 태스크(12)를 실행시키고, 제2 분산 코디네이터(112)는 또 다른 하나의 노드에 제2 리듀스 태스크(14)를 실행시킬 수 있다. 맵 태스크 실행 노드와 리듀스 태스크 실행 노드는 동일한 노드일 수 있고, 다른 노드일 수 있다.

이와 같이, 분산 처리 시스템은 많은 억세스가 이루어지는 고빈도 참조 리소스의 지역성을 확보함으로써 효율적인 분산 처리를 할 수 있다. 아래에서는 고빈도 참조 리소스를 결정하는 방법에 대해 설명한다.

도 3은 본 발명의 일 실시 예에 따른 고빈도 참조 리소스를 결정하는 기준을 설명하는 도면이다.

도 3에 따르면 반비례 그래프가 도시되어 있다. x-축은 랭킹을 나타내고, y-축은 빈도를 나타낸다. 즉, 제일 왼쪽에 있는 리소스는 빈도 수가 제일 많은 리소스를 의미한다. 그래프는 오른쪽으로 갈수록 리소스의 빈도 수가 낮아지며, 빈도 수에 따라 순위가 정해진다.

일 실시 예로서, 리소스의 빈도는 지프의 법칙(Zipf's Law)을 적용하여 추출할 수 있다. 이 경우, 랭킹 상위 약 20% 이내의 리소스가 전체 참조 횟수의 80%를 차지할 수 있다. 따라서, 고빈도 참조 리소스는 랭킹순으로 20%인 기준 1(21)로 정해질 수 있다. 또는, 고빈도 참조 리소스는 빈도순으로 기준 2(22)로 정해질 수 있다. 다시 말해서, 고빈도 참조 리소스는 리소스의 참조 횟수(랭킹 또는 빈도수)를 기준으로 설정될 수 있다.

또는, 고빈도 참조 리소스는 리소스 크기를 기준으로 설정될 수 있다. 본 발명에서 고빈도 참조 리소스의 의미는 단순히 참조 횟수가 많은 리소스만을 의미하는 것이 아니라, 리소스의 지역성을 확보할 대상 리소스를 의미한다. 따라서, 소용량 리소스는 고빈도로 참조되지는 않지만 지역성을 확보하는 고빈도 참조 리소스에 포함시켜도 분산 처리 시스템의 부하에 영향을 거의 주지 않는다. 따라서, 본 발명의 고빈도 참조 리소스는 리소스의 참조 횟수 또는 리소스 크기 중 적어도 하나를 기준으로 설정될 수 있다.

고빈도 참조 리소스는 복수의 분산 저장부에 저장될 수 있다. 그 이유는 어느 하나의 분산 저장부에 문제가 발생해도 원활한 서비스를 제공하기 위해서이다. 따라서, 복수의 분산 저장부에 저장된 동일한 참조 리소스는 동기화가 필요하다.

도 4는 본 발명의 일 실시 예에 따른 고빈도 참조 리소스의 처리 과정을 설명하는 도면이다.

도 4(a)를 참조하면, 제1 분산 저장부(S1), 제2 분산 저장부(S2) 및 분산 코디네이터에 참조 리소스(ref1)가 3의 값으로 저장되어 있다. 분산 코디네이터에는 참조 리소스(ref1)의 저장 위치 포인터(S1, S2)도 함께 저장되어 있다. 분산 시스템은 분산 처리 과정에서 참조 리소스(ref1)의 값을 7로 변경하였다.

도 4(b)를 참조하면, 분산 코디네이터에 저장된 참조 리소스(ref1)의 값이 7로 변경된 도면이 도시되어 있다. 이와 같이, 분산 코디내이터는 저장된 고빈도 참조 리소스를 업데이트할 수 있다. 또한, 분산 코디네이터는 저장된 참조 리소스(ref1)의 저장 위치 포인터(S1, S2)에 기초하여 제1 및 제2 분산 저장부(S1, S2)에 저장된 참조 리소스(ref1)의 값을 3에서 7로 변경시킬 수 있다. 즉, 분산 코디네이터는 분산 저장부에 저장된 각 고빈도 참조 리소스를 동기화할 수 있다.

이와 같이, 분산 코디네이터는 참조 리소스의 변경에 따라 해당 참조 리소스의 값을 업데이트할 수 있고, 분산 저장부에 저장된 동일한 참조 리소스의 값을 동기화할 수 있다.

지금까지 분산 처리 시스템이 고빈도 리소스 설정하고 관리하는 과정에 대해 설명하였다. 아래에서는 분산 처리 방법에 대해 설명하겠다.

도 5는 본 발명의 일 실시 예에 따른 리소스 지역성에 기초한 분산 처리 방법을 설명하는 흐름도이다.

도 5를 참조하면, 분산 처리 시스템은 기 설정된 기준에 기초하여 고빈도 참조 리소스를 추출한다(S510). 본 발명에서 고빈도 참조 리소스의 의미는 단순히 참조 횟수가 많은 리소스만을 의미하는 것이 아니라, 리소스의 지역성을 확보할 대상 리소스를 의미한다. 따라서, 소용량 리소스는 고빈도로 참조되지는 않더라도 지역성을 확보하는 고빈도 참조 리소스에 포함시키는 것이 분산 처리 시스템의 효율을 높일 수 있다. 따라서, 고빈도 참조 리소스는 리소스의 참조 횟수 또는 리소스 크기 중 적어도 하나를 기준으로 설정될 수 있다.

분산 처리 시스템은 추출된 고빈도 참조 리소스를 복수의 노드 각각에 포함된 분산 저장부에 저장한다(S520). 이에 따라, 어느 하나의 노드에 문제가 발생해도 분산 처리 과정은 원활하게 수행될 수 있다.

분산 처리 시스템은 고빈도 참조 리소스에 관한 정보를 기초로 참조하려는 고빈도 참조 리소스가 저장된 분산 저장부에 태스크를 처리하는 프로세서를 연결한다(S530).

고빈도 탐조 리소스에 관한 정보는 복사된 리소스 또는 리소스가 저장된 저장 위치 포인터 중 적어도 하나일 수 있다. 또한, 분산 처리 시스템은 저장된 고빈도 참조 리소스를 업데이트할 수 있으며, 분산 저장부에 저장된 각 고빈도 참조 리소스를 동기화할 수 있다.

본 발명에 따른 분산 처리 방법은 상술한 실시 예들의 구성과 방법으로 한정되어 적용되는 것이 아니라, 각 실시 예들의 전부 또는 일부가 선택적으로 조합되어 다양한 변형이 이루어질 수 있다.

한편, 본 발명의 분산 처리 방법은 분산 처리 시스템에 구비된 프로세서가 읽을 수 있는 기록 매체에 프로세서가 읽을 수 있는 코드로서 구현하는 것이 가능하다. 프로세서가 읽을 수 있는 기록매체는 프로세서에 의해 읽혀질 수 있는 데이터가 저장되는 모든 종류의 기록장치를 포함한다. 프로세서가 읽을 수 있는 기록 매체의 예로는 ROM, RAM, CD-ROM, 자기 테이프, 플로피디스크, 광 데이터 저장장치 등이 있으며, 또한, 인터넷을 통한 전송 등과 같은 캐리어 웨이브의 형태로 구현되는 것도 포함한다. 또한, 프로세서가 읽을 수 있는 기록매체는 네트워크로 연결된 컴퓨터 시스템에 분산되어, 분산방식으로 프로세서가 읽을 수 있는 코드가 저장되고 실행될 수 있다.

또한, 이상에서는 본 발명의 바람직한 실시 예에 대하여 도시하고 설명하였지만, 본 발명은 상술한 특정의 실시 예에 한정되지 아니하며, 청구범위에서 청구하는 본 발명의 요지를 벗어남이 없이 당해 발명이 속하는 기술분야에서 통상의 지식을 가진자에 의해 다양한 변형실시가 가능한 것은 물론이고, 이러한 변형실시들은 본 발명의 기술적 사상이나 전망으로부터 개별적으로 이해돼서는 안 될 것이다.

1000 : 분산 처리 시스템
110, 111, 112 : 분산 코디네이터
121, 122, 123, 124 : 분산 저장부
130 : 리소스 로더 140 : 분산 코디네이터 관리자

Claims

리소스 리더가 기 설정된 기준에 기초하여 고빈도 참조 리소스를 추출하는 단계;
분산 코디네이터가 상기 추출된 고빈도 참조 리소스를 복수의 노드 각각에 포함된 분산 저장부에 저장하는 단계; 및
상기 분산 코디네이터가 고빈도 참조 리소스에 관한 정보를 기초로 참조하려는 고빈도 참조 리소스가 저장된 상기 분산 저장부와 태스크를 처리하는 프로세서를 연결하는 단계;를 포함하는 리소스 지역성에 기초한 분산 처리 방법.
제1항에 있어서,
상기 고빈도 참조 리소스에 관한 정보는,
복사된 리소스 또는 저장 위치 포인터 중 적어도 하나인 것을 특징으로 하는 리소스 지역성에 기초한 분산 처리 방법.
제1항에 있어서,
상기 분산 코디네이터가 상기 분산 저장부에 저장된 각 고빈도 참조 리소스를 동기화하는 단계;를 더 포함하는 리소스 지역성에 기초한 분산 처리 방법.
제1항에 있어서,
상기 분산 코디네이터가 상기 저장된 고빈도 참조 리소스를 업데이트하는 단계;를 더 포함하는 리소스 지역성에 기초한 분산 처리 방법.
제1항에 있어서,
기 설정된 기준은 리소스의 참조 횟수 또는 리소스 크기 중 적어도 하나인 것을 특징으로 하는 리소스 지역성에 기초한 분산 처리 방법.
제1항에 있어서,
복수 개의 상기 분산 코디네이터가 존재하는 경우, 분산 코디네이터 관리자가 상기 복수 개의 분산 코디네이터들을 관리하는 단계;를 더 포함하는 리소스 지역성에 기초한 분산 처리 방법.
기 설정된 기준에 기초하여 고빈도 참조 리소스를 추출하는 리소스 로더;
복수의 노드 각각에 포함된 분산 저장부; 및
상기 추출된 고빈도 참조 리소스를 상기 분산 저장부에 저장하는 분산 코디네이터;를 포함하며,
상기 분산 코디네이터는,
고빈도 참조 리소스에 관한 정보를 포함하고, 상기 정보에 기초하여 참조하려는 고빈도 참조 리소스가 저장된 분산 저장부에 태스크를 처리하는 프로세서를 연결하는, 리소스 지역성에 기초한 분산 처리 시스템.
제7항에 있어서,
상기 고빈도 참조 리소스에 관한 정보는,
복사된 리소스 또는 저장 위치 포인터 중 적어도 하나인 것을 특징으로 하는 리소스 지역성에 기초한 분산 처리 시스템.
제7항에 있어서,
상기 분산 코디네이터는,
상기 분산 저장부에 저장된 각 고빈도 참조 리소스를 동기화하는 것을 특징으로 하는 리소스 지역성에 기초한 분산 처리 시스템.
제7항에 있어서,
상기 분산 코디네이터는,
상기 저장된 고빈도 참조 리소스를 업데이트하는 것을 특징으로 하는 리소스 지역성에 기초한 분산 처리 시스템.
제7항에 있어서,
기 설정된 기준은 리소스의 참조 횟수 또는 리소스 크기 중 적어도 하나인 것을 특징으로 하는 리소스 지역성에 기초한 분산 처리 시스템.
제7항에 있어서,
상기 분산 코디네이터는 복수 개 존재하고,
상기 복수 개의 분산 코디네이터들을 관리하는 분산 코디네이터 관리자;를 더 포함하는 리소스 지역성에 기초한 분산 처리 시스템.