KR20150003024A

KR20150003024A - 서비스 자원 모니터링에서 발생하는 부하의 분산을 위한 시스템 구조 및 데이터 교환 방법

Info

Publication number: KR20150003024A
Application number: KR1020130075807A
Authority: KR
Inventors: 전운배
Original assignee: 주식회사 케이티
Priority date: 2013-06-28
Filing date: 2013-06-28
Publication date: 2015-01-08

Abstract

본 발명은 M2M/IoT 시스템에서 제공하는 서비스를 안정적으로 제공하기 위해 필요한 모니터링 방법에 관한 것으로, 보다 상세하게는 모니터링 서버 혹은 manager 측에 인가되는 부하를, M2M/IoT 서비스를 구성하는 서비스 자원들인 각 개별 node 에 분산시켜 모니터링 서버의 연산규모를 줄여줌으로써 비용을 절감하고 간편하게 모니터링 기능을 활용할 수 있는 방법에 관한 발명이다.

Description

서비스 자원 모니터링에서 발생하는 부하의 분산을 위한 시스템 구조 및 데이터 교환 방법{Method for distributing the load of monitoring activity to the service resources and its data exchanging method}

본 발명은 M2M/IoT 기술에 관한 것으로, M2M/IoT 서비스에 활용되는 서비스 자원들에 대한 모니터링을 위해, 대규모의 비용을 투입하지 않고도 적절하게 그 연산비용을 분산시키는 방법으로 M2M/IoT 표준의 management 분야에 속한다.

사물통신 혹은 사물지능통신 분야에 있어서 서비스를 제공하는 서비스 자원들에 대한 모니터링이 필요한 상황이다. 그러나 2015년까지 약 500억개의 디바이스가 M2M 서비스에 활용될 것으로 전망되고 있어 다수의 디바이스를 적은 저비용과 고효율성을 갖고 모니터링 하기 위한 기술이 필요한 상황이다.

M2M 서비스를 제공하기 위해 사용되는 자원들인 infrastructure node, intermediate node, node 등의 자원들 중 CSE 를 포함하는 자원에 있어서, 모니터링을 위해 소요되는 과도한 연산능력을 경감하기 위한 방법을 그 목적으로 한다.

모니터링 관련 작업을 관리하는 관리서버에 집중되어 과도한 비용이 발생하는 방식을 해결하기 위해 서비스를 구성하는 자원에 연산능력을 적절하게 분산시키는 방법을 제시한다.

본 발명은 과도하게 한 곳에 집중되는 연산능력을 적절하게 골고루 분산시킴으로써 모니터링을 위한 비용을 절감하는 효과를 가져온다.

도 1은 본 발명을 구성하는 시스템의 구성을 보여주는 도면이다.
도 2는 본 발명을 구성하는 iteration 에 따라 manifest 를 전달하는 방법들 중 동적인 구간분할 혹은 구간연속 전달방법에 관한 도면이다.
도 3은 본 발명을 구성하는 iteration 에 따라 manifest 를 전달하는 과정에 있어서 각 서비스 자원이 다음 iteration 을 위한 경로상에 존재하는 node 들의 방문 순서를 결정하는 우선순위를 동적으로 변경하는 방법에 관한 도면이다.
도4는 개별 node 가 manifest 를 전달받은 후 이루어지는 연산과정에 대한 설명이다.

이하 본 발명의 일실시 예를 도면을 통해 상세하게 설명한다. 본 발명이 실시예들은 M2M/IoT 를 기준으로 설명한다. M2M/IoT 서비스는 소형 혹은 그 이상 규모의 컴퓨터와 통신장치 및 각종 센서류와 같은 서비스 자원들을 결합하여 제공되는 서비스이다. 따라서, 이러한 컴퓨터, 통신장치 및 각종 센서류에 대한 정상동작 유무를 감시하는 모니터링 과정이 필요하다. 본 발명은 이러한 모니터링 과정에 있어서 장애 유무를 감지하는 방법에 적용될 수 있다.

본 발명에서 iteration 은 서비스를 구성하는 node 들 중, 특정 node 들 혹은 모든 node 들에 대해 장애발생 유무를 판별하는 과정을 의미한다.

본 발명에서 manifest 는 상기 iteration 을 수행하기 위해 iteration 에 포함되는 node 에서 다음 순서의 node 로 전달되는 작업지시 및 결과를 기록하는 파일 혹은 데이터이다.

본 발명에서 iteration initiator 는 상기 iteration 이 시작되는 node 로 manifest 를 전달하는, iteration 을 기동시키는 기능 혹은 장치이다.

Iteration interval 은 상기 iteration initiator 가 N 번째 iteration 을 위해 manifest 를 발행한 시점 t(N) 에서 N+1 번째 iteration 을 발행하는 t(N+1) 시점까지의 시간을 나타낸다.

Iteration alive time 은 상기 iteration initiator 가 manifest 를 발행한 시각을 기준으로 해당 manifest 를 다음 node 로 전달하는 일련의 과정을 지속할 수 있는 유효한 시간을 나타낸다.

Short iteration 은 상기 iteration 의 수행과정 중 특정 node 에서 장애가 발생할 경우 해당 iteration을 즉시 중단하고 manifest 를 iteration initiator 로 송신하는 방식을 의미한다.

Long iteration 은 상기 iteration 의 수행과정 중 특정 node 에서 장애가 발생하여도 예정된 다음 node 로 manifest 를 넘겨 iteration 과정을 계속하는 방식을 의미한다.

Iteration path 는 상기 iteration 을 완료하기 위해 iteration 에 참여하는 node 들로 이어지는 경로를 의미한다.

본 발명에서 iteration 에 참여하는 node 들의 manifest 를 전달받는 순서를 결정하는 방법에 있어서, 최초 iteration의 경우에는 최상위 레벨의 node 를 기준으로 그 하위레벨의 node 들을 먼저 나열한 후 최상위 레벨 node 와 동일한 레벨의 node 를 포함하며, 다시 해당 node 의 하위레벨 node 들을 포함하는 방식으로 결정한다.

Iteration 이 진행되는 과정 중에는 특정 node 의 장애발생 확률에 따라 그 순서가 동적으로 변경될 수 있다.

도 1은 OneM2M 이 정의하는 서비스 시스템의 구조를 나타낸다. 도1에서 Iteration initiator 는 CSE 101 에 포함된 기능이며, infrastructure node 102 와 Y reference point 로 연결된 iteration initiator node 103에 탑재된 기능 이다.

Iteration initiator node 103 에 탑재된 iteration initiator 는 최초 iteration 을 위한 manifest 를 생성한다. Manifest 가 전달되는 node 들의 순서는 특정 node 와 X reference point 로 연결된 node 를 먼저 기입하고, 특정 node 와 Y reference point 로 연결된 node 를 다음 순서의 node 로 기입한다.

도 1의 경우 최초 iteration 을 위한 manifest 에 표기되는 node 들의 순서는 102, 104, 105, 106, 107, 108, 109 와 같이 표기된다.

도2는 iteration initiator 에 의해 최초 발행되고, 각 node 를 거치며 해당 node의 장애유무 판결 결과가 기록되고, 각 node 의 장애발생횟수 및 우선순위에 따라 다음 번 iteration 에서 전달되는 node 들의 우선순위가 갱신되는 manifest 의 데이터 구조를 나타낸다.

발행번호 201 은 iteration initiator 에 의해 생성된 manifest 의 구분을 위한 아이디이며,

발행일시 202는 생성된 날짜와 시각을 나타내며,

발행한 iteration initiator id 203은 해당 manifest 를 생성하고 발행한 iteration initiator 의 아이디를 나타내며,

Iteration initiator address 204 는 iteration path 의 마지막 node 가 manifest 를 다시 iteration initiator 로 돌려주기 위해 필요한 통신 혹은 물리적 주소를 나타내며,

Current node info offset 205 는 해당 manifest 를 수신한 node 가 자신에게 전달되는 작업항목 207과 작업결과를 기록하기 위한 208, 209, 210, 211 등의 공간이 시작되는 지점을 manifest 발행번호 201 이 시작하는 지점으로부터 떨어진 거리를 바이트로 표시하며,

Check item in node 207 은 해당 node 에서 수행해야 할 장애판별 작업의 종류가 기록되어 전달되며,

Response 209 는 상기 장애판별 작업의 결과가 기록되는 필드이며,

Check data/time 208 은 장애판별 작업을 진행한 시각을 나타내며,

Response data/time 210 은 manifest 를 다음 node 로 전달하는 시각이다.

Iteration order no. 211 은 해당 필드가 속한 node 의 장애판별 결과에 따른 다음 번 iteration 에 있어서의 해당 node 가 iteration path 상에서 몇번째로 위치하는가를 표시하기 위한 필드이다.

도 3은 상기 도 2의 iteration order no 211 필드를 갱신하기 위한 계산방법을 나타낸다. 즉, 장애율 301 은 해당 node 에서 현재까지의 iteration 에 대한 장애발생회수의 백분율을 계산하고, 10단계로 나누어진 우선순위 302 를 곱하여 최종적인 iteration order no 303 을 계산한다. 이때 복수의 node 들이 동일한 iteration order no 를 갖게 된다면 이때는 우선순위가 높은 node 가 iteration order no 가 작은 것으로 계산한다. 즉, 먼저 장애검출 작업을 적용하기 위해 manifest 를 먼저 전달받는 것으로 계산한다.

예를 들어 10번의 iteration 을 통한 장애검출 결과 node A와 node B 의 장애발생 회수가 각각 4회와 8회이고, 각 node 의 우선순위가 10, 5,

이때 각 node 의 장애율은 40% 와 80% 이고 이에 따른 iteration order no 는 각각 4, 4 동일하게 계산되나, 우선순위는 node A 가 더 높음으로 node A, node B 와 같은 순서로 iteration order 가 결정된다.

도4는 개별 node 가 manifest 를 전달받은 후 이루어지는 연산과정에 대한 설명이다. Manager node 401 은 자신에 대한 장애검출 과정을 마치고 그 결과를 manifest 에 기록한 후 다음 node 인 agent node P 402 에 manifest 를 넘기는 역할을 담당하는 node 를 나타낸다.

우선 manager node 401 은 manifest 에 기록되어 있는 iteration path 상의 자신 다음 node 정보를 확인한다 403.

다음으로 manager node 401 은 agent node P 402 에 manifest 를 전송하기 위한 통신기능의 정상 작동 여부를 확인하기 위해 request 를 전송하고 응답을 기다린다 404.

만약 통신기능이 정상이고 manifest 를 전송받아 장애검출, 기록, 다음 node 로의 전달을 담당하는 기능을 포함하는 CSE 가 정상이고 이에 따라 정상적인 response 를 수신한다면 405,

Manager node 401 은 agent node P 402 에 manifest 406을 전달하고 iteration 참여를 종료한다 407, 408.

만약 상기 404 단계에서 응답이 없거나 비정상적이 응답이 돌아올 경우에는 manifest 상에 기록되어 있는 해당 장애 노드 402 의 장애검출 결과 필드를 실패로 기록하고, 상기 도3의 과정과 같은 iteration order no 를 계산하여 기록한 후 409,

Manifest 를 확인하여 agent node P+1 411 을 찾아 위의 404 에서 410 까지의 과정을 정상상태로 확인될 때 까지 반복한다.

Agent node P+1 에 대한 정상상태가 확인될 경우, manifest 406을 전달하고 iteration 참여를 종료한다 407, 408.

본 발명은 다음과 같이 구성된다. manager node가 manifest 에 기록되어 있는 iteration path 상의 자신 다음 node 정보를 확인하는 단계, 상기 manager node 가 agent node 에게 manifest 를 전송하기 위한 통신기능의 정상 작동 여부를 확인하기 위해 request 를 전송하고 응답을 기다리는 단계, 상기 확인 결과 통신기능이 정상이고 manifest 를 전송받아 장애검출, 기록, 다음 node 로의 전달을 담당하는 기능을 포함하는 CSE 가 정상이고 이에 따라 정상적인 response 를 수신한 경우, 상기 Manager node 는 agent node 에게 manifest를 전달하고 iteration 참여를 종료하거나 또는 상기 확인 결과 응답이 없거나 비정상적이 응답이 돌아올 경우에는 manifest 상에 기록되어 있는 해당 장애 노드의 장애검출 결과 필드를 실패로 기록하고, 상기 iteration order no 를 계산하여 기록하는 단계를 포함한다. 또한, 도 1에서 최초 manifest의 내용을 구성하는 방법과 도 2의 manifest 구성과 해당 필드의 값을 인정하는 방법, 그리고 장애율과 iteration order no. 계산하는 방법과 특정 node 가 manifest 를 수신하고 지정된 장애검출과정을 수행한 후 결과를 기록하고, iteration order no 를 변경한 후 다음 node 로 manifest 를 넘기는 일련의 과정을 포함한다.

이상의 설명은 본 발명의 기술 사상을 예시적으로 설명한 것에 불과한 것으로서, 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자라면 본 발명의 본질적인 특성에서 벗어나지 않는 범위에서 다양한 수정 및 변형이 가능할 것이다. 따라서, 본 발명에 개시된 실시 예들은 본 발명의 기술 사상을 한정하기 위한 것이 아니라 설명하기 위한 것이고, 이러한 실시 예에 의하여 본 발명의 기술 사상의 범위가 한정되는 것은 아니다. 본 발명의 보호 범위는 아래의 청구범위에 의하여 해석되어야 하며, 그와 동등한 범위 내에 있는 모든 기술 사상은 본 발명의 권리범위에 포함되는 것으로 해석되어야 할 것이다.

102: Infrastructure node
103: iteration initiator node
106, 108: intermediate node

Claims

manager node가 manifest 에 기록되어 있는 iteration path 상의 자신 다음 node 정보를 확인하는 단계;
상기 manager node 가 agent node 에게 manifest 를 전송하기 위한 통신기능의 정상 작동 여부를 확인하기 위해 request 를 전송하고 응답을 기다리는 단계;
상기 확인 결과 통신기능이 정상이고 manifest 를 전송받아 장애검출, 기록, 다음 node 로의 전달을 담당하는 기능을 포함하는 CSE 가 정상이고 이에 따라 정상적인 response 를 수신한 경우, 상기 Manager node 는 agent node 에게 manifest를 전달하고 iteration 참여를 종료하거나 또는 상기 확인 결과 응답이 없거나 비정상적이 응답이 돌아올 경우에는 manifest 상에 기록되어 있는 해당 장애 노드의 장애검출 결과 필드를 실패로 기록하고, 상기 iteration order no 를 계산하여 기록하는 단계를 포함하는 방법.