KR20030054447A

KR20030054447A - 워크스테이션에 상주하는 미들웨어 서버의 동작 상태감시방법

Info

Publication number: KR20030054447A
Application number: KR1020010084608A
Authority: KR
Inventors: 예병호; 김혜숙
Original assignee: 한국전자통신연구원; 주식회사 케이티
Priority date: 2001-12-26
Filing date: 2001-12-26
Publication date: 2003-07-02

Abstract

본 발명은 기능단위로 구분되는 미들웨어 서버를 대상으로 해당 서버에 정의된 동작 규격에 맞게 동작하는지를 실시간적으로 감시하여, 비정상적 상태인 서버를 재시동하여 복구할 수 있는 미들웨어 서버의 동작상태 감시방법에 관한 것으로, 워크스테이션에 상주하는 미들웨어 서버의 동작 상태 감시방법에 있어서, 감시 주기 타임이 아웃되면, 감시 대상이 되는 전체 블록 개수 정보를 읽는 제1 단계; 서버 상태 정보를 읽기 위한 응용프로그램인터페이스(API)를 호출하여 서버 상태 정보를 획득하기 위해 대기하는 제2 단계; 상기 대기 상태에서 결과가 접수되면 결과 분석 기능을 호출하여 결과를 분석하는 제3 단계; 상기 대기 상태에서 주어진 시간 내에 응답이 없이 타임아웃이 접수되면, 해당 블록에 대한 타임아웃 카운터를 증가시킨 후, 결과 분석 기능을 호출하여 결과를 분석하는 제4 단계; 및 전체 블록에 대한 상기 제2 단계 이하를 수행하고, 전체 블록에 대한 수행이 완료되면 다음 감시 수행을 위한 주기를 타이머에 등록하고 수행 대기 상태로 천이하는 제5 단계를 포함하는 것을 특징으로 한다.

Description

워크스테이션에 상주하는 미들웨어 서버의 동작 상태 감시방법{A Method of Middleware Server Status Supervision}

본 발명은 워크스테이션에 상주하는 미들웨어 서버의 동작 상태를 감시하는 방법에 관한 것이다.

분산 시스템의 응용 기능간 정보 교환을 목적으로 제공되는 미들웨어 기능은 하위 통신 프로토콜에 무관한 응용 소프트웨어 개발을 용이하게 하고, 개발된 소프트웨어의 재사용을 향상시킬 수 있는 방법을 제공한다. 이러한 분산구조에서 실시간적인 처리를 필요로 하는 부분은 기능의 목적에 맞게 제어 프로세서를 통하여 처리하고, 비실시간적인 운용관리 기능은 워크스테이션을 이용하여 처리하는 구조를 갖는다.

지금까지의 워크스테이션에 상주하는 응용기능의 대부분은 자체적인 기능수행만을 목적으로 하였으며, 종래에는 이러한 개별적인 응용기능의 오류 등의 원인으로 장시간 운용 시 워크스테이션 시스템의 동작에 심각한 영향을 미치는 요소를 사전에 방지할 수 있는 방법을 고려하지 못했다. 즉, 응용기능의 오류가 발생하면 그 영향이 워크스테이션 시스템 전체적으로 영향을 미치게 된다. 따라서, 이를 복구하기 위해서는 워크스테이션을 재시동해야만 하는 경우가 대부분이다. 따라서,워크스테이션이 정상적인 동작상태로 환원되기까지는 시스템 운용관리 기능수행을 하지 못할 뿐만 아니라 중요 데이터의 유실을 초래할 수 있다.

따라서, 본 발명은 기능단위로 구분되는 미들웨어 서버를 대상으로 해당 서버에 정의된 동작 규격에 맞게 동작하는지를 실시간적으로 감시하여, 비정상적 상태인 서버를 재시동하여 복구할 수 있는 미들웨어 서버의 동작상태 감시방법을 제공하는데 그 목적이 있다.

도1은 본 발명이 적용되는 교환시스템의 분산제어 구조도.

도2는 데이터베이스로 관리되는 미들웨어 서버단위의 관리를 위한 구성 정보를 나타낸 도면.

도3은 미들웨어 서버 감시를 위해 호출되는 API의 구성을 나타낸 도면.

도4는 본 발명에 따른 서버 상태 감시를 위한 주제어 처리 흐름도.

도5는 본 발명에 따른 서버 감시 결과에 상세 결과 분석 처리 과정을 나타낸 흐름도.

도6은 본 발명에 따른 미들웨어 서버의 상태정보를 읽어 전달하는 API의 처리를 나타낸 흐름도.

* 도면의 주요 부분에 대한 부호의 설명 *

1 : 워크스테이션

2 : ACC프로세서(Access Call Control Processor)

3 : SMC프로세서 (Switch Management Control Processor)

7: 미들웨어 마스터 8 : 데이터베이스 시스템(DBMS)

11,14 : 미들웨이 슬레이브 21 : 블럭번호

22 : 스래드 개수 한계치 23 : 메모리 크기 한계치

24 : Api 개수 한계치 25 : 버전 정보

26 : 타임아웃 개수 한계치

상기 목적을 달성하기 위한 본 발명은, 워크스테이션에 상주하는 미들웨어 서버의 동작 상태 감시방법에 있어서, 감시 주기 타임이 아웃되면, 감시 대상이 되는 전체 블록 개수 정보를 읽는 제1 단계; 서버 상태 정보를 읽기 위한 응용프로그램인터페이스(API)를 호출하여 서버 상태 정보를 획득하기 위해 대기하는 제2 단계; 상기 대기 상태에서 결과가 접수되면 결과 분석 기능을 호출하여 결과를 분석하는 제3 단계; 상기 대기 상태에서 주어진 시간 내에 응답이 없이 타임아웃이 접수되면, 해당 블록에 대한 타임아웃 카운터를 증가시킨 후, 결과 분석 기능을 호출하여 결과를 분석하는 제4 단계; 및 전체 블록에 대한 상기 제2 단계 이하를 수행하고, 전체 블록에 대한 수행이 완료되면 다음 감시 수행을 위한 주기를 타이머에 등록하고 수행 대기 상태로 천이하는 제5 단계를 포함하는 것을 특징으로 한다.

또한, 본 발명은 워크스테이션에 컴퓨터에서, 감시 주기 타임이 아웃되면, 감시 대상이 되는 전체 블록 개수 정보를 읽는 제1 단계; 서버 상태 정보를 읽기위한 응용프로그램인터페이스(API)를 호출하여 서버 상태 정보를 획득하기 위해 대기하는 제2 단계; 상기 대기 상태에서 결과가 접수되면 결과 분석 기능을 호출하여 결과를 분석하는 제3 단계; 상기 대기 상태에서 주어진 시간 내에 응답이 없이 타임아웃이 접수되면, 해당 블록에 대한 타임아웃 카운터를 증가시킨 후, 결과 분석 기능을 호출하여 결과를 분석하는 제4 단계; 및 전체 블록에 대한 상기 제2 단계 이하를 수행하고, 전체 블록에 대한 수행이 완료되면 다음 감시 수행을 위한 주기를 타이머에 등록하고 수행 대기 상태로 천이하는 제5 단계를 실행시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체를 제공한다.

일반적인 미들웨어 서버에서는 해당 응용기능이 처리하는 API(Application Programming Interface)들만으로 IDL(Interface Definition Language)을 구성하고, 이에 정의된 API를 호출하는 클라이언트에 대한 서비스를 제공하도록 하였다. 그러나, 본 발명에서는 워크스테이션에 상주하는 모든 응용 서버에 공통적으로 서버 상태정보를 제공할 수 있는 API를 선언하고, 이것을 이용하여 해당 서버가 갖는 동작 규격 정보와 현재 동작 중인 상태정보를 얻도록 하여, 개별적인 응용기능의 동작상태를 감시하여 응용기능 자체의 비정상적인 동작을 빠른 시간 내 검출하고, 신속하게 복구할 수 있도록 함으로써, 워크스테이션에 미칠 수 있는 영향을 사전에 방지할 수 있도록 한다.

이하, 첨부된 도면을 참조하여 본 발명에 따른 바람직한 실시 예를 상세히설명한다.

도1은 본 발명이 적용되는 미들웨어를 적용한 분산제어 시스템 구조의 교환시스템을 나타낸 것이다.

일반적으로 교환시스템은 운용관리 기능을 수행하는 워크스테이션(1)과 호 처리 기능을 제어하는 프로세서 ACC(Access Call Control Processor)(2) 및 스위칭 제어 기능을 수행하는 프로세서 SMC(Switch Management Control Processor)(3)로 구성된다. 여기서, 호 처리 용량에 따라 ACC는 늘어날 수 있는 구조이다. 이러한 분산구조에서 미들웨어는 워크스테이션(1)을 비롯한 제어 프로세서(2, 3)에 위치하며, 이들에 실장되는 각 응용기능에서 호출하여 분산된 다른 위치의 데이터를 읽고 쓰기 기능을 수행한다. 먼저, 운용자 요구에 의한 기능수행 과정을 살펴보면 운용자 정합 기능(HMI: Human-Machine Interface)(4)을 통해 입력된 명령어는 해당 응용기능(APPL: Application 30, 31)(5, 6)으로 전달되며, 응용기능에서는 기능의 목적에 따라 미들웨어 마스터(7)를 통하여 ACC(2)에 위치하는 데이터를 접근할 수 있다. 이때, ACC(2)에 위치하는 미들웨어 슬레이브(11)는 해당되는 프로그램을 수행하여 결과를 호출한 응용기능(5, 6)으로 되돌려 준다.

그리고, ACC(2)에 위치하는 응용기능(12, 13)에서 워크스테이션(1)의 데이터베이스 시스템(DBMS)(8)에 위치하는 데이터를 요구할 경우 ACC의 미들웨어 슬레이브(11)를 거쳐 미들웨어 마스터(7)를 통하여 데이터베이스(8) 정보를 읽어 응용기능으로 전달한다. 스위치 제어 프로세서(3)의 경우에도 위치하는 응용기능(15, 16)의 기능 목적은 다르지만, 미들웨어 슬레이브(14)를 통한 처리절차는 ACC(2)와동일한 과정으로 수행된다.

본 발명에서는 이상과 같은 분산 시스템에 적용되는 미들웨어 구조에서 워크스테이션(1)에 위치하는 다수의 미들웨어 서버(9, 10)를 대상으로 지정된 감시기능(17)을 이용하여 미리 규정된 규약에 따라 미들웨어 서버가 동작하는지를 감시한다.

도2는 미들웨어 서버 단위로 IDL컴파일 시에 적용되는 동작 환경을 설정하는 값들로부터 추출하여 데이터베이스로 구성한 기준 정보이다. 따라서 이 정보는 컴파일이 완료되어 미들웨어 서버가 워크스테이션에 상주하여 정상적으로 동작하는지를 감시하는데 필요한 기준 정보가 되는 것이다. 여기서, 블록번호(21)는 워크스테이션에 상주하는 모든 서버의 이름을 정의한 값이 되며, 스래드(thread) 개수 한계치(22)는 해당 서버가 기능 처리를 위하여 동시에 생성될 수 있는 최대 스래드(thread) 개수 값을 나타내며, memory size 한계치(23)는 해당 서버가 동작할 때 필요한 최대 스왑(swap) 영역의 메모리 크기를 나타낸다. API 개수 한계치(24)는 해당 서버에 정의된 전체 API의 개수를 나타내며, version 정보(25)는 해당 서버의 IDL을 컴파일할 때 주어지는 패키지 버전 정보를 나타내며, Timeout 개수 한계치(26)는 해당 서버에 대한 감시 API를 호출하였을 경우 연속해서 응답이 없을 경우의 최대 대기 회수이다.

도3은 미들웨어 서버에서 사용하는 API들을 정의하는 IDL 파일에서 서버 상태를 점검하기 위한 API를 나타낸 것이다.

이 IDL은 별도의 컴파일 과정을 통해 헤더 파일과 실행파일이 생성되어 응용서버의 컴파일 시에 적용된다. 기본적으로 서버별 IDL 파일은 기능을 구분하기 위한 블록명으로 구분되는 BlkName(31)으로 정의된다.

서버 상태 감시를 위해 응용 서버를 호출하는 API 이름은 W_W_BlkName_ServerStsRequest(44)으로 정의되며, API를 수행한 후 되돌려 주는 데이터의 형태는 M_ServerStsRequest(43)로 정의된다.

그리고, 개별적인 정보 요소는 S_ServerStsRequest(32)로 정의되며, 세부적인 정보요소는 서버가 최대로 생성할 수 있는 Thread 개수 정보인 MaxThread(33), 최대로 할당할 수 있는 메모리 크기인 MaxMemory(34), 해당 서버에 정의된 API 개수인 MaxApi(35), IDL이 컴파일된 적용 버전 정보인 Version(36), 그리고 현재 동작상태 정보에 해당되는 현재 동작중인 Thread 개수인 CurrentThread(37), 현재 할당된 메모리 크기인 CurrentMemory(38), 현재 호출중인 API 개수인 CurrentApi(39)로 구분된다.

그리고, 전 상태의 동작을 점검하기 위한 목적으로 이미 수행된 thread 중에서 최대 큰 값의 Thread 번호인 MaxRunnedThreadNo(40), 최대로 할당되었던 메모리 크기인 MaxRunnedMemorySize(41)로 정의된다. 그리고, 이러한 정보 요소들이 포함된 구조체 S_ServerStsRequest(32)는 M_ServerStsRequest(42)로 선언되어 W_W_BlkName_ServerStsRequest(44) API가 호출되어 수행한 후 되돌려 주는 데이터의 형태는 M_ServerStsRequest(43)로 사용된다.

도4는 본 발명에 따른 서버 상태 감시를 위한 주제어 처리 흐름을 나타낸 것이다.

서버 감시 기능이 동작하여 감시기능이 시작하면, 수행 대기 상태(101)로 천이한다. 이 상태에서 주기적인 동작을 위한 감시 주기가 타임아웃 처리되면(102) 감시 대상이 되는 전체 블록 개수 정보를 읽은 후(103), 서버 상태 정보를 읽기 위한 API를 호출하고(104) 응답 대기 상태로 천이한다(105). 이때 호출되는 API는 도3에서 설명한 W_W_BlkName_ServerStsRequest(44)이며, 수행 결과 정보는 M_ServerStsRequest(42)로 되돌려 받는다. 응답 대기 상태에서 결과가 접수되면(108), 결과 분석 기능을 호출한다(109). 그리고, 응답 대기 상태에서 주어진 시간 내에 응답이 없이 타임아웃이 접수되면(106), 해당 블록에 대한 타임아웃 카운터를 증가 시킨 후(107), 결과 분석을 위한 기능을 호출(409)한다. 이후, 전체 블록에 대한 수행이 완료되었는지를 확인하여(410), 완료된 상태이면 다음 감시 수행을 위한 주기를 타이머에 등록하고(112) 수행 대기 상태로 천이한다(113). 그리고 전체 블록에 대한 수행이 완료되지 않은 상태이면(110), 다음 감시 대상 블록에 대한 정보를 읽은 후(111), 서버 상태 정보를 읽기 위한 API을 호출하는 과정(104)을 반복적으로 수행하여 전체 블록에 대한 서버 상태 감시 기능을 수행한다.

도5는 도4의 주제어 처리 흐름에서 서버 상태 정보를 읽은 후 결과 분석 기능을 호출하는 과정(409)에서 호출되어 수행되는 감시 결과에 상세 결과 분석 처리 과정을 나타낸 것이다.

수행과정이 호출되어 기능이 시작되면, 도2에서 정의된 블록별 서버 정보를 읽은 다음(121) 현재 동작중인 스래드(thread) 개수가 한계치 정보를 초과하는지를점검한 후(122), 개수가 초과하면 스래드(Thread) 개수 비정상 상태를 통보하고(123), 다음 단계로써 현재 사용중인 메모리 크기가 한계치 정보를 초과하는지를 점검하여(124), 메모리 크기를 초과하면 메모리 크기 비정상 상태를 통보한다(125), 다음 과정으로 API 개수 정보가 한계치를 초과하는지를 점검하여(126), API 개수가 초과하면 비정상 상태를 통보하고(127), 버전 정보가 정상인지를 점검하여(128), 비정상 상태이면 버전 정보 비정상을 통보한다(129).

이때, 서버 상태를 읽기 위한 API를 호출한 후 서버로부터 응답이 없어 타임 아웃 처리된 경우에 대한 점검과정으로써 타임아웃 개수 정보가 한계치를 초과하였는지를 점검하여(130), 초과한 경우이면 연속 발생하였는지를 점검하여(133) 연속으로 발생한 경우이면 서버 재시동을 요구한 후(132), 타임아웃 개수 정보를 리셋하고(134), 호출한 주제어 기능으로 복귀한다. 한편, 타임아웃 개수가 한계치를 초과하지 않은 상태이면(130), 스래드(Thread) 개수 정보가 비정상이거나 메모리 크기가 비정상 상태인지를 점검한 후(131), 이에 해당되면 서버 재시동을 요구한 후(132), 타임아웃 개수 정보를 리셋하고(134), 호출한 주제어 기능으로 복귀한다. 한편, 133 단계에서 연속으로 발생한 것이 아니면, 타임아웃 개수 정보를 리셋하고(134), 주제어 기능으로 복귀한다.

도6은 미들웨어 서버의 동작상태 감시를 호출 받아 서버의 상태정보를 읽어 전달하는 API의 처리를 나타낸 것이다.

본 처리 과정은 도4의 주제어 처리 흐름의 서버 상태 API 호출(104)에 의하여 수행된다.

먼저, 서버가 시동하면, 서버 상태 호출을 받기 위한 수행 대기 상태로 천이한다(141). 이때 주기적인 서버 상태 요구를 접수받으면(142), 자신이 갖고 있는 최대로 생성할 수 있는 스래드(Thread) 개수 정보인 MaxThread, 최대로 할당할 수 있는 메모리 크기인 MaxMemory, 해당 서버에 정의된 API 개수인 MaxApi, IDL이 컴파일된 적용 버전 정보인 Version, 그리고 현재 동작중인 스래드(Thread) 개수인 CurrentThread, 현재 할당된 메모리 크기인 CurrentMemory, 현재 호출중인 API 개수인 CurrentApi, 이미 수행된 thread 중에서 최대 큰 값의 Thread 번호인 MaxRunnedThreadNo, 최대로 할당되었던 메모리 크기인 MaxRunnedMemorySize 정보를 각각 읽어(143 내지 151), 결과 정보를 응답하고(152), 다음 수행을 위한 대기 상태로 천이한다.

상기와 같은 본 발명은 워크스테이션에 상주하는 모든 응용 서버에 공통적으로 서버 상태정보를 제공할 수 있는 API를 선언하고, 이것을 이용하여 해당 서버가 갖는 동작 규격 정보와 현재 동작 중인 상태정보를 얻도록 하여, 개별적인 응용기능의 동작상태를 감시하여 응용기능 자체의 비정상적인 동작을 빠른 시간 내 검출하고 신속하게 복구함으로써, 서비스의 연속성을 보장하고, 미들웨어 응용 서버의 오류로 인하여 thread 및 메모리 자원의 고갈을 야기시켜 워크스테이션의 동작에 심각한 영향을 미칠 수 있는 요인들을 사전에 방지할 수 있다.

Claims

워크스테이션에 상주하는 미들웨어 서버의 동작 상태 감시방법에 있어서,

감시 주기 타임이 아웃되면, 감시 대상이 되는 전체 블록 개수 정보를 읽는 제1 단계;

서버 상태 정보를 읽기 위한 응용프로그램인터페이스(API)를 호출하여 서버 상태 정보를 획득하기 위해 대기하는 제2 단계;

상기 대기 상태에서 결과가 접수되면 결과 분석 기능을 호출하여 결과를 분석하는 제3 단계;

상기 대기 상태에서 주어진 시간 내에 응답이 없이 타임아웃이 접수되면, 해당 블록에 대한 타임아웃 카운터를 증가시킨 후, 결과 분석 기능을 호출하여 결과를 분석하는 제4 단계; 및

전체 블록에 대한 상기 제2 단계 이하를 수행하고, 전체 블록에 대한 수행이 완료되면 다음 감시 수행을 위한 주기를 타이머에 등록하고 수행 대기 상태로 천이하는 제5 단계를 포함하는 것을 특징으로 하는 워크스테이션에 상주하는 미들웨어 서버의 동작 상태 감시방법.
제 1 항에 있어서,

상기 제2 단계에서의 상기 서버 상태 정보를 읽기 위한 응용프로그램인터페이스(API)가 자신이 갖고 있는 최대로 생성할 수 있는 스래드 개수 정보, 최대로 할당할 수 있는 메모리 크기, 해당 서버에 정의된 API 개수, IDL이 컴파일된 적용 버전 정보, 현재 동작중인 스래드 개수, 현재 할당된 메모리 크기, 현재 호출중인 API 개수, 이미 수행된 스래드 중에서 최대 큰 값의 스래드 번호, 최대로 할당되었던 메모리 크기 정보를 각각 읽어, 그 결과 정보를 응답하는 것을 특징으로 하는 워크스테이션에 상주하는 미들웨어 서버의 동작 상태 감시방법.
제 2 항에 있어서,

상기 제3 단계는,

상기 응용프로그램인터페이스(API)에 의해 획득된 블록별 서버 정보를 읽어와 현재 동작중인 스래드 개수가 한계치 정보를 초과하였는지, 현재 사용중인 메모리 크기가 한계치 정보를 초과하였는지, API 개수 정보가 한계치를 초과하였는지, 버전 정보가 정상인지를 각각 확인하여, 그 결과를 통보하는 것을 특징으로 하는 워크스테이션에 상주하는 미들웨어 서버의 동작 상태 감시방법.
제 2 항에 있어서,

상기 제4 단계는,

타임아웃 개수 정보가 한계치를 초과하였는지를 점검하여, 초과하였으면 연속 발생하였는지를 확인하는 단계;

연속으로 발생한 경우이면 서버 재시동을 요구한 후, 타임아웃 개수 정보를 리셋하고, 호출한 주제어 기능으로 복귀하는 단계;

타임아웃 개수가 한계치를 초과하지 않았으면, 스래드 개수 정보가 비정상이거나 메모리 크기가 비정상 상태인지를 확인하는 단계;

스래드 개수 정보가 비정상이거나 메모리 크기가 비정상 상태이면 서버 재시동을 요구한 후, 타임아웃 개수 정보를 리셋하고, 호출한 주제어 기능으로 복귀하는 단계; 및

상기 타임아웃 개수가 연속으로 발생한 것이 아니면, 타임아웃 개수 정보를 리셋하고, 주제어 기능으로 복귀하는 단계를 포함하는 것을 특징으로 하는 워크스테이션에 상주하는 미들웨어 서버의 동작 상태 감시방법.
워크스테이션에 컴퓨터에서,

감시 주기 타임이 아웃되면, 감시 대상이 되는 전체 블록 개수 정보를 읽는 제1 단계;

서버 상태 정보를 읽기 위한 응용프로그램인터페이스(API)를 호출하여 서버 상태 정보를 획득하기 위해 대기하는 제2 단계;

상기 대기 상태에서 결과가 접수되면 결과 분석 기능을 호출하여 결과를 분석하는 제3 단계;

상기 대기 상태에서 주어진 시간 내에 응답이 없이 타임아웃이 접수되면, 해당 블록에 대한 타임아웃 카운터를 증가시킨 후, 결과 분석 기능을 호출하여 결과를 분석하는 제4 단계; 및

전체 블록에 대한 상기 제2 단계 이하를 수행하고, 전체 블록에 대한 수행이 완료되면 다음 감시 수행을 위한 주기를 타이머에 등록하고 수행 대기 상태로 천이하는 제5 단계를 실행시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체.