KR101436033B1

KR101436033B1 - 운용 관리 장치, 운용 관리 방법 및 운용 관리 프로그램을 기록한 컴퓨터 판독 가능한 기록 매체

Info

Publication number: KR101436033B1
Application number: KR1020127009331A
Authority: KR
Inventors: 도루 스즈키
Original assignee: 후지쯔 가부시끼가이샤
Priority date: 2009-11-04
Filing date: 2009-11-04
Publication date: 2014-09-01
Also published as: JPWO2011055436A1; KR20120052415A; WO2011055436A1; JP5532053B2; EP2498186A4; US20120192008A1; US8650444B2; EP2498186A1; CN102597966A; CN102597966B

Abstract

복수의 관리 대상의 장치가 구비하는 요소의 관리 데이터를 수신하고, 수신한 관리 데이터 중, 문제가 발생한 장치의 데이터인 문제 데이터의 종속 관계를 요소간의 종속 관계를 정의한 정의 정보에 따라서 구함과 함께, 문제가 발생하지 않은 장치의 데이터인 비(非)문제 데이터의 종속 관계를 정의 정보에 따라서 구하고, 문제 데이터와 비문제 데이터를 비교하여 공통되는 요소의 관리 데이터를 구하고, 공통되는 요소에 종속하는 요소의 관리 데이터에 대해서 문제 데이터와 비문제 데이터의 차분을 추출한다.

Description

운용 관리 장치, 운용 관리 방법 및 운용 관리 프로그램을 기록한 컴퓨터 판독 가능한 기록 매체{OPERATION MANAGEMENT DEVICE, OPERATION MANAGEMENT METHOD AND COMPUTER-READABLE RECORDING MEDIUM STORING OPERATION MANAGEMENT PROGRAM}

본 건은 장치의 운용을 관리하는 기술에 관한 것이다.

기업 등과 같이 많은 정보 처리 시스템을 이용하는 장소에서는, 시스템의 이용자와는 별도로, 시스템의 관리자가 존재하고, 고장이나 처리 이상 등, 시스템의 운용을 방해하는 혹은 그 우려가 있는 문제의 감시나, 당해 문제의 대처를 행하고 있다.

정보 처리 시스템은, 연산이나 기억, 표시, 통신 등의 처리를 행하는 하드웨어와, 당해 처리에 이용되는 OS(Operating System), 애플리케이션 프로그램, 펌웨어 등의 소프트웨어로 대별되는 많은 구성 요소를 갖고 있다. 이 때문에, 시스템의 관리자는, 고장이나 처리 이상 등의 문제가 발생했을 경우에, 어떠한 구성 요소가 원인이 되고 있는 것인지를 조사하는 작업이 부담이 되고 있었다.

그래서, 관리 작업의 부담을 경감하는 것을 목적으로 하여, 운용 관리 소프트웨어가 개발되어, 관리자에게 이용되고 있다.

예를 들면, 관리 대상의 정보 처리 시스템에 문제가 발생했을 경우, 운용 관리 소프트웨어는 팝업 메시지나 메일 등의 알람에 의해 관리자에게 문제를 통지하는 기능을 구비하고 있다.

도 1은 팝업 메시지에 의한 알람의 예를 나타낸다. 도 1에 나타내는 바와 같이, 운용 관리 소프트웨어는, 문제가 발생한 노드나 일시(日時), 중요성, 알람의 내용과 같은 정보를 표시한다.

알람에 의해 문제의 발생을 알게 된 관리자는, 운용 관리 소프트웨어의 로그 참조 기능을 이용하여, 문제의 내용이나 원인을 조사한다. 도 2는 운용 관리 소프트웨어에 의해 채취한 로그를 참조한 예를 나타낸다. 당해 로그는, 도 2에 나타내는 바와 같이, 이벤트가 발생한 일시, 발생한 노드, 이벤트의 내용을 나타내는 메시지 텍스트, 이벤트가 발생한 모듈, 에러 코드, 이벤트의 중요성, 발생한 컴포넌트, 유저, 식별 정보 등의 정보를 표시한다. 여기에서 이벤트란, 예를 들면, 운용 관리 소프트웨어가 검지한 정보 처리 시스템 내의 다양한 현상이다.

또한, 운용 관리 소프트웨어는, 로그를 참조할 때, 축적한 다수의 로그를 한정하는 기능이나 키워드로 검색하는 기능에 의해, 관리자의 조사를 지원한다.

도 3은 로그의 한정 조건의 설정예를 나타낸다. 예를 들면, 도 3에 나타내는 바와 같이, 일시가 08／10／08 04:15PM 이후이고, 중요성이 Warning인 이벤트를 검색한다.

그러나, 로그의 참조만으로는, 관리자가 문제의 현상이나 발생 개소를 알게 되는 데에 그치고, 원인을 밝혀내는 데에는 이르지 못하는 경우도 많다. 이 경우에, 관리자는, 문제가 발생하고 있는 시스템과 문제가 발생하지 않은 시스템을 비교하여, 그 차분으로부터, 문제의 원인을 밝혀내기 위한 단서를 찾는 경우가 있다. 문제가 발생하고 있는 시스템에 있고, 문제가 발생하지 않은 시스템에 없는 구성 요소가, 문제의 발생에 관여하고 있는 경우가 있기 때문이다.

이 때문에, 관리자는, 운용 관리 소프트웨어의 기능을 이용하여, 문제가 발생하고 있는 시스템과 문제가 발생하지 않은 시스템에 대해서 각각 시스템의 구성 요소나 속성값을 표시시켜 비교한다.

도 4는 하드웨어 구성의 표시예, 도 5는 소프트웨어 구성의 표시예, 도 6은 속성값의 표시예를 나타낸다.

예를 들면 하드웨어 구성은, 도 4와 같이, 노드(Partiton#1_0.124.22.70)에, 케이싱(Chassis components)이나 시스템 보드(SB#1) 등의 컴포넌트의 존재가 나타난다. 또한, 당해 케이싱에 전원(ACPDBH#0-#7)이나 팬(FAN_A#0-A#5,B#0,B#1) 등의 유닛의 존재가 나타난다.

또한, 소프트웨어 구성은, 도 5와 같이, 소프트웨어의 구성으로서, 소프트웨어의 패키지명, 소프트웨어가 속하는 노드명, 소프트웨어의 개요, 카테고리, 아키텍처, 버전 등이 나타난다.

또한, 속성은 도 6과 같이, 노드의 속성값으로서, 노드명, 통신 어드레스, 시스템 ID, 하드웨어명, OS명과 OS의 버전, 하드웨어의 상태, 통신 상태 등이 나타난다.

시스템의 구성 요소나 속성은 수가 많아, 2개 혹은 복수의 시스템을 비교했을 경우에, 어디에 차이가 있는지를 사람(관리자)이 추출하는 것은, 수고와 시간이 드는 작업이 된다.

이 때문에, 2개의 시스템간의 차분을 추출하는 소프트웨어가 있어, 당해 소프트웨어를 이용함으로써, 비교 작업의 효율화가 도모되어 있다.

도 7은 2개의 시스템을 비교했을 경우의 차분 개소의 표시예를 나타낸다. 도 7에서는, 시스템의 명칭, 모델, 프로세서 타입, 메모리 용량, OS, 설치 장소 등의 항목을 비교하고 있다. 또한, 2개의 시스템에서 같은 항목은, 1행에 그 내용을 표시하고, 배경색을 없음으로 하고 있다. 예를 들면, 도 7에서, 모델, 프로세서 타입, 캐쉬 용량이 같은 항목이다. 또한, 2개의 시스템에서 차이가 있는 항목은, 각각 1행씩 그 내용을 표시하고, 배경색을 바꾸고 있다. 예를 들면, 도 7에서 시스템의 명칭, 메모리 용량, OS가 다르며, SLES10SP1의 항목의 배경색을 사선, pq-rhl4u4의 항목의 배경색을 크로스 라인으로 하고 있다.

일본국 특개2002-55717호 공보 일본국 특개2004-101203호 공보 일본국 특개2005-63332호 공보

이치노세 외 : 계층적 지식간의 조정 규칙의 학습, 인공 지능 학회 논문지, 17권, 3호 F, PP.230-238(2002년)

시스템간의 차분을 추출했다고 해도, 수많은 차이 가운데에서 조사 대상의 문제의 발생에 관여할 것 같은 것과, 그렇지 않은 것을 선별하기 위해서는, 역시 많은 수고와 시간이 들고, 또한 관리자에게 높은 스킬이 요구된다.

예를 들면, 도 8에 나타내는 바와 같이, 문제가 발생하고 있는 A 시스템과, 문제가 발생하지 않은 B 시스템이 있었을 경우에, 관리자가 문제의 발생에 OS가 관여하고 있다는 가설을 세웠다고 한다. 그 관점에서 A 시스템과 B 시스템을 비교한 결과, OS의 버전 번호에 차이가 있으면, OS의 버전 번호가 문제의 발생에 관여하고 있을 가능성을 생각할 수 있다. 그러나, A 시스템과 문제가 발생하지 않은 C 시스템을 비교한 바, 그들의 OS 버전 번호가 같았다고 하면, 문제의 발생이 OS의 버전 번호에 의존하지 않을 가능성이 있다. 이 경우, 조사를 진행시키기 위해서는, 관점을 바꾸어 시스템의 비교를 행하여, 문제가 발생하고 있는 시스템에 보여지는 특징을 찾아낼 필요가 있다.

이 조사 방법으로부터 문제 발생의 원인 혹은 그 가설을 도출하기 위해서는, 보다 많은 시스템을 비교하는 것이 유효하다. 그러나, 수고와 시간을 생각하면, 사람(관리자)이 시스템의 비교를 행할 경우에는, 어느 시스템을 비교 대상으로 하여, 어떠한 관점에서 비교하는 것이 효과적인지를 추론하고, 비교 대상과 비교의 관점을 적절하게 설정하는 것이 중요하다. 그러므로, 조사의 진전은 관리자의 스킬에 의존하게 된다.

그래서, 개시의 일 실시형태는, 문제가 발생한 시스템의 특징을 용이하게 추출하는 기술을 제공한다.

과제를 해결하는 일 형태로서의 운용 관리 장치는,

복수의 관리 대상의 장치가 구비하는 요소의 관리 데이터를 수신하는 수집부와,

수신한 상기 관리 데이터 중, 문제가 발생한 장치의 데이터인 문제 데이터의 종속 관계를 상기 요소간의 종속 관계를 정의한 정의 정보에 따라서 구하는 한편, 문제가 발생하지 않은 장치의 데이터인 비(非)문제 데이터의 종속 관계를 상기 정의 정보로부터 구하는 분석부와,

상기 문제 데이터와 비문제 데이터를 비교하여, 공통되는 요소의 관리 데이터를 구하고, 당해 공통되는 요소에 종속하는 요소의 관리 데이터에 대해서 상기 문제 데이터와 상기 비문제 데이터의 차분을 추출하는 비교부를 구비한다.

개시의 일 실시형태는, 문제가 발생한 시스템의 특징을 용이하게 추출하는 기술을 제공할 수 있다.

도 1은 팝업 메시지에 의한 알람의 예를 나타내는 도면.
도 2는 운용 관리 소프트웨어에 의해 채취한 로그를 참조한 예를 나타내는 도면.
도 3은 로그의 한정 조건의 설정예를 나타내는 도면.
도 4는 하드웨어 구성의 표시예를 나타내는 도면.
도 5는 소프트웨어 구성의 표시예를 나타내는 도면.
도 6은 속성값의 표시예를 나타내는 도면.
도 7은 시스템을 비교했을 경우의 차분 개소의 표시예를 나타내는 도면.
도 8은 문제가 발생하고 있는 시스템과 문제가 발생하지 않은 시스템의 비교예를 나타내는 도면.
도 9는 문제가 발생하고 있는 시스템과 문제가 발생하지 않은 시스템의 비교예를 나타내는 도면.
도 10은 운용 관리 장치의 개략 구성도.
도 11은 관리 데이터의 트리 구조의 설명도.
도 12는 로그 데이터의 데이터 구조를 나타내는 도면.
도 13은 클라이언트의 블록도.
도 14는 감시 대상 시스템의 기능 블록도.
도 15는 매니저가 관리 데이터를 데이터 저장부에 기입하는 처리의 설명도.
도 16은 에이전트에 의한 관리 데이터의 송신 처리의 설명도.
도 17은 클라이언트에 의한 분석 결과의 수신 및 출력 처리의 설명도.
도 18은 매니저에 의한 분석 및 분석 결과의 송신 처리의 설명도.
도 19는 데이터 분석 처리의 설명도.
도 20은 문제 발생 공통 트리의 작성 처리의 구체예를 나타내는 도면.
도 21은 노드의 데이터 구조를 나타내는 도면.
도 22는 문제 발생 트리의 일례를 나타내는 도면.
도 23은 문제가 발생한 시스템의 특징을 추출하는 처리의 설명도.
도 24는 속성 노드의 설명도.
도 25는 운용 관리 시스템의 블록도.
도 26은 스키마의 설명도.
도 27은 분석 결과의 표시예를 나타내는 도면.

이하, 도면을 참조하여 본 발명을 실시하기 위한 형태에 대해서 설명한다. 이하의 실시형태의 구성은 예시이며, 본 발명은 실시형태의 구성에 한정되지 않는다.

실시형태 1의 정보 처리 시스템은, 문제가 발생한 시스템과 문제가 발생하지 않은 시스템의 단순한 차분을 추출하는 것이 아니고, 문제의 원인의 검출에 공헌할 것 같은 차분을 발견한다. 여기에서, 원인의 검출에 공헌할 것 같은 차분은, 예를 들면, 문제가 발생한 시스템과 일부의 구성이나 속성에 공통점이 있는 문제가 발생하지 않은 시스템과, 문제가 발생한 시스템의 구성 등의 차분이라고 생각할 수 있다.

도 9를 예로 하여, 발생한 문제의 원인의 검출에 공헌할 것 같은 차분에 대해서 설명한다. 도 9의 예에서는, 문제가 발생한 시스템 A와 문제가 발생하지 않은 시스템 B, C가 있다. 여기에서, 시스템 A에 발생하고 있는 문제는, OS에 포함되는 소프트웨어에 의존하는 문제였다고 한다. 그 경우, A 시스템과 B 시스템과 같이 적용하는 OS가 다르면, 각각의 OS에 포함되는 소프트웨어는 다르므로, OS의 차이로부터 파생하여 검출되는 OS 버전 번호나 구성 소프트웨어의 차이는 의미가 없는 정보이다.

한편으로, A 시스템과 C 시스템에서는 같은 OS가 사용되고 있다. 그 경우에, OS에 포함되는 소프트웨어의 차분에는 의미가 있다고 생각할 수 있다. 도 9의 예에서는, A 시스템과 C 시스템의 비교 결과로서, A 시스템에는 「Y package가 있다」, 「Z package가 없다」와 같은 특징을 추출할 수 있다. 이와 같이, 문제의 원인 조사에 있어서는, 문제가 발생한 시스템과 유사성을 가지고 있으면서 문제가 발생하지 않은 시스템과, 문제가 발생한 시스템을 비교하여, 그 차분을 추출하는 것이 유효하다.

즉, A 시스템과 C 시스템에서 공통적으로 이용되고 있는 OS「XOS」와 같이 , 문제가 발생한 시스템과 문제가 발생하지 않은 시스템에서 공통되는 데이터를 추출한 후에, OS에 종속하는 소프트웨어인 「Y package」 등과 같이, 공통되는 데이터에 종속하는 데이터에 대해서, 문제가 발생한 시스템과 문제가 발생하지 않은 시스템의 구성의 차분을 추출한다.

본 실시형태 1에서는, 운용 관리 장치가, 원인 조사의 대상인 문제가 발생한 시스템이 복수 있을 경우에는, 관리하는 모든 시스템 중, 우선 이들 문제가 발생한 시스템에 공통되는 구성이나 속성의 데이터(문제 발생 공통 데이터)를 추출한다. 다음으로 운용 관리 장치가, 관리하는 모든 시스템 중, 문제가 발생하지 않은 시스템의 구성이나 속성의 데이터(문제 비발생 데이터)를 모두 추출한다. 그리고, 운용 관리 장치는, 문제 발생 공통 데이터와 문제 비발생 데이터를 비교하고, 양자에서 공통되는 데이터(상기 XOS 등)를 추출하고, 추출한 공통되는 데이터에 종속하는 데이터(상기 Y package 등)의 차분을 추출한다. 이 방법에 의해 얻어진 결과 즉 차분은, 문제가 발생한 시스템과, 문제가 발생하는 시스템과 유사한 문제가 발생하지 않은 시스템의 차분이며, 단순한 시스템간의 구성 등의 차분보다 단적으로 문제가 발생한 시스템의 특징을 나타내게 된다.

<시스템 구성>

도 25는 운용 관리 시스템의 블록도이다. 본 실시형태 1의 운용 관리 시스템은, 네트워크나 케이블 등의 회선을 통해 접속한 운용 관리 장치(10), 클라이언트(20), 감시 대상 시스템(30)을 갖고 있다.

운용 관리 장치(10)는, 도 10에 나타내는 바와 같이, 데이터의 연산 처리를 행하는 데이터 처리부(1)와, 다른 장치와의 통신을 행하는 통신 처리부(2)와, 연산 처리를 위한 데이터나 소프트웨어를 기억하는 데이터 저장부(3)를 구비한 컴퓨터이며, 이하 매니저라고도 칭한다.

통신 처리부(2)는, 네트워크나 케이블 등의 회선을 통해 다른 컴퓨터와 통신을 행한다.

데이터 저장부(3)는, 하드디스크나 Solid State Drive, Solid State Disk(SSD)와 같은 기억부이며, 오퍼레이팅 시스템(OS)이나 애플리케이션 프로그램(일례로서 운용 관리 소프트웨어)을 기억하고 있다. 또한, 데이터 저장부(3)는, 감시 대상 시스템(30)의 에이전트로부터 수신한 구성 데이터나 로그 데이터, 분석 결과, 데이터의 스키마를 저장한다.

데이터 처리부(1)는, CPU나 메인 메모리를 갖고, OS나 애플리케이션 소프트웨어와 같은 프로그램을 데이터 저장부(3)로부터 메인 메모리에 읽어내고, 읽어낸 프로그램에 따라서 CPU가, 통신 처리부(2)에서 수신한 데이터 등의 연산 처리를 행한다. 이 연산 처리에 의해, CPU는, 정보 수집부(11)나, 묘화부(12), 알람부(13), 로그 필터부(14), 비교부(15), 분석부(16)로서도 기능한다.

정보 수집부(11)는, 클라이언트(20)로부터의 요구에 따라, 감시 대상의 장치, 즉 감시 대상 시스템(30)의 에이전트에 관리 데이터를 요구하고, 당해 에이전트로부터 감시 대상 시스템(30)의 관리 정보를 수신 즉 수집한다. 또한, 정보 수집부(11)는, 감시 대상 시스템(30)의 에이전트로부터 자발적으로 송신된 관리 데이터를 수신한다. 또한, 본 실시형태에 있어서, 관리 데이터는 구성 데이터 혹은 로그 데이터를 포함하는 데이터이며, 구성 데이터는 감시 대상 시스템(30)이 구비하는 각 구성 요소의 정보, 로그 데이터는 감시 대상 시스템(30)의 로그의 데이터이다.

묘화부(12)는, 분석부(16)의 분석 결과 등을 표시 장치(도시 생략)에 표시시킨다.

알람부(13)는, 정보 수집부(11)에서 수집한 데이터가 소정 조건을 충족시키고, 문제가 발생한 혹은 문제가 발생할 우려가 있다고 판정했을 경우에 알람을 출력한다. 예를 들면 알람부(13)는, 발생한 문제와 대응하는 메시지를 알람으로 하여, 통신 처리부(2)를 통해 클라이언트(20)에게 통지한다. 또한, 알람부(13)는, 알람을 전자 메일로서 관리자 등의 소정의 어드레스에 송신해도 된다.

로그 필터부(14)는, 정보 수집부(11)에서 수집한 데이터 중 로그 데이터를, 클라이언트(20)에 의해 지정된 조건에 따라 추출(필터링)한다.

분석부(16)는, 정보 수집부(11)에서 수신한 데이터에 의거하여 문제가 발생한 장치를 판별하고, 수신한 데이터 중 구성 데이터를 문제가 발생한 장치의 데이터인 문제 데이터와 문제가 발생하지 않은 장치의 데이터인 비문제 데이터로 분류한다. 그리고 분석부(16)는, 문제 데이터로 분류되어 있는 각 요소의 구성 데이터의 종속 관계를 소정의 정의 정보에 의거하여 결정함과 함께, 비문제 데이터로 분류되어 있는 각 요소의 구성 데이터의 종속 관계를 소정의 정의 정보에 의거하여 결정한다. 분석 결과는, 통신 처리부(2)를 통해 클라이언트(20)에게 송신된다.

비교부(15)는, 문제 데이터와 비문제 데이터를 비교하여, 공통되는 요소의 구성 데이터를 구하고, 공통되는 요소의 구성 데이터에 종속하는 구성 데이터에 대해서 문제 데이터와 비문제 데이터의 차분을 추출한다.

본 실시형태 1에 있어서, 정보 수집부(11)에서 수집하는 데이터는, 구성 데이터와 로그 데이터를 포함한다. 또한, 구성 데이터는, 분석부(16)에 의해, 소정의 정의 정보에 의거하여 다른 구성 데이터와의 종속 관계가 결정되어, 도 11에 나타내는 바와 같이, 트리 구조로 매핑된다.

도 11에서, 원으로 나타낸 노드가 구성 데이터에 의해 나타나는 시스템의 구성을 표시하고, 도 11의 최상부에 위치하는 노드가 루트 노드, 이 루트 노드와 링크하여 도 11의 하방에 위치하는 노드가, 루트 노드에 종속하는 노드이다. 예를 들면, 노드 N2, N3은, 루트 노드 N1에 종속하는 노드, 노드 N4, N5는 노드 N2에 종속하는 노드이다. 또한, 도 11에서, 1개선의 링크는, 종속하는 노드가 상위 노드의 속성을 나타내는 노드임을 나타내고, 2개선의 링크는, 종속하는 노드가, 시스템에 포함되는 구성 중, 상위 노드와 관련하는 구성을 나타내는 노드임을 나타내고 있다. 즉, 노드 N2는 노드 N1과 관련하는 구성이며, 노드 N3은 노드 N1의 속성을 나타내는 노드이다. 예를 들면, OS를 나타내는 노드와 OS의 버전(OS의 속성)을 나타내는 노드의 링크는 1개선으로 나타나고, OS를 나타내는 노드와 OS용의 패키지(OS에 관련하는 구성)를 나타내는 노드의 링크는 2개선으로 나타난다.

한편, 본 실시형태 1의 로그 데이터는, 예를 들면 도 12에 나타내는 바와 같이, 로그 ID, 문제의 데이터, 시스템의 데이터, 부대 데이터를 갖고 있다. 여기에서, 로그 ID는, 로그를 특정하기 위한 식별 정보이다. 문제의 데이터는, 시스템에 발생한 문제를 나타내는 데이터이며, 감시 대상 시스템(30)에 발생한 이벤트가 에러인지 경고인지 등을 나타내는 이벤트 타입이나, 발생한 이벤트를 특정하는 이벤트 ID, 이벤트가 발생한 모듈을 나타내는 이벤트 소스, 이벤트에 따른 메시지 등을 포함한다. 시스템의 데이터는, 당해 로그를 출력한 감시 대상 시스템을 나타내는 식별 정보이며, 예를 들면 Globally Unique Identifier(GUID)이다. 또한, 부대 정보는, 문제의 발생 시각과 같은, 발생한 문제에 부대하는 그 밖의 정보이다.

구성 데이터 및 로그 데이터는, 매니저(10)로부터의 요구에 대한 응답으로서 에이전트로부터 송신될 경우와, 에이전트로부터 자발적으로 송신될 경우가 있다.

도 13은 클라이언트(20)의 블록도이다. 클라이언트(20)는, 도 13에 나타내는 바와 같이, 데이터의 연산 처리를 행하는 데이터 처리부(21), 다른 장치와의 통신을 행하는 통신 처리부(22), 연산 처리를 위한 데이터나 소프트웨어를 기억하는 기억부(23), 입력부(24), 출력부(도 13의 예에서는 표시 장치)(25)를 구비한 컴퓨터이다.

통신 처리부(22)는, 네트워크나 케이블 등의 회선을 통해 다른 컴퓨터와 통신을 행한다.

기억부(23)는, 하드디스크나 SSD와 같은 보조 기억 장치이며, 오퍼레이팅 시스템(OS)이나 애플리케이션 프로그램(클라이언트 프로그램 등)을 기억하고 있다.

입력부(24)는, 데이터 처리부(21)에 정보를 입력하는 수단이며, 키보드나 포인팅 디바이스와 같은 유저 인터페이스나, 메모리 카드나 CD-ROM 등의 기억 매체로부터 정보를 판독하는 디바이스를 갖고 있다.

출력부(25)은, 데이터 처리부(21)의 처리 결과를 출력하는 수단이며, 분석 결과 등을 표시하는 표시 장치나, 알람 등의 음을 출력하는 스피커, 로그 등의 데이터를 인쇄하는 프린터를 갖고 있다.

데이터 처리부(21)는, CPU나 메인 메모리를 갖는다. CPU는, 상기 OS나 애플리케이션 프로그램을 기억부(23)로부터 메인 메모리에 읽어내고, 읽어낸 OS나 애플리케이션 프로그램에 따라서, 통신 처리부(22)에서 수신한 데이터 등의 연산 처리를 행한다. 이 연산 처리에 의해, CPU는, 입력 해석부(211)나, 팝업부(212), 로그 표시부(213), 필터 지정부(214), 하드웨어 표시부(215), 소프트웨어 표시부(216), 속성 표시부(217), 차분 표시부(218), 특징 표시부(219)로서도 기능한다.

입력 해석부(211)로서 CPU는, 관리자의 조작에 의해 입력부(24)로부터 입력된 입력 정보를 해석하고, 대응하는 명령을 각 부에 보낸다. 예를 들면, 입력 정보가 문제가 발생한 시스템의 분석을 요구하는 것이면, 입력 해석부(211)는, 통신 처리부(22)를 통해 매니저(10)에게 문제가 발생한 시스템의 특징을 요구한다. 또한, 입력 해석부(211)는, 입력 정보가 로그나 하드웨어, 소프트웨어, 속성의 표시를 요구하는 것이면, 이들의 표시 요구를 매니저(10)에게 송신한다.

팝업 표시부(212)로서 CPU는, 매니저(10)로부터 수신한 정보를 표시 장치에 팝업 표시한다. 예를 들면 매니저(10)로부터, 문제가 발생했다는 메시지를 수신했을 경우에, 당해 메시지를 팝업 표시한다.

로그 표시부(213)로서 CPU는, 매니저(10)로부터 로그 데이터를 수신했을 경우에, 당해 로그 데이터에 의거하여 감시 대상 시스템의 로그를 표시 장치상에 표시한다.

필터 지정부(214)로서 CPU는, 로그 표시나, 하드웨어 표시, 소프트웨어 표시를 행할 때에, 표시하는 항목을 한정하기 위해, 관리자가 선택한 필터(조건)를 매니저(10)에게 송신함으로써 필터를 지정한다.

하드웨어 표시부(215)로서 CPU는, 매니저(10)로부터 하드웨어의 데이터를 수신했을 경우에, 당해 데이터에 의거하여 관리 대상 시스템에 구비된 하드웨어에 관한 정보를 표시한다.

소프트웨어 표시부(216)로서 CPU는, 매니저(10)로부터 소프트웨어의 데이터를 수신했을 경우에, 당해 데이터에 의거하여 관리 대상 시스템에 이용되고 있는 소프트웨어에 관한 정보를 표시한다.

속성 표시부(217)로서 CPU는, 매니저(10)로부터 속성의 데이터를 수신했을 경우에, 당해 데이터에 의거하여 관리 대상 시스템에 이용되고 있는 요소의 속성에 관한 정보를 표시한다.

차분 표시부(218)로서 CPU는, 매니저(10)로부터 차분의 데이터를 수신했을 경우에, 당해 데이터에 의거하여 관리 대상 시스템에 이용되고 있는 요소간의 차분을 표시한다.

특징 표시부(219)로서 CPU는, 매니저(10)로부터 특징의 데이터를 수신했을 경우에, 당해 데이터에 의거하여 문제를 발생하는 시스템의 특징을 표시한다.

도 14는 감시 대상 시스템(30)의 블록도이다. 감시 대상 시스템(30)은, 도 14에 나타내는 바와 같이, 데이터의 연산 처리를 행하는 데이터 처리부(31), 다른 장치와의 통신을 행하는 통신 처리부(32), 연산 처리를 위한 데이터나 소프트웨어를 기억하는 기억부(33), 입력부(34), 출력부(35)를 구비한 컴퓨터이다.

통신 처리부(32)는, 네트워크나 케이블 등의 회선을 통해 다른 컴퓨터와 통신을 행한다.

기억부(33)는, 하드디스크나 SSD와 같은 보조 기억 장치이며, 오퍼레이팅 시스템(OS)이나 애플리케이션 프로그램(에이전트 프로그램)을 기억하고 있다. 에이전트 프로그램은, 관리 대상의 정보 처리 시스템에, 원래 설치되어 있는 펌웨어의 형태여도 되고, 시스템에 인스톨하는 소프트웨어의 형태여도 된다.

입력부(34)는, 데이터 처리부(31)에 정보를 입력하는 수단이며, 키보드나 포인팅 디바이스와 같은 유저 인터페이스나, 메모리 카드나 CD-ROM 등의 기억 매체로부터 정보를 판독하는 디바이스를 갖고 있다.

출력부(35)는, 데이터 처리부(31)의 처리 결과를 출력하는 수단이며, 분석 결과 등을 표시하는 표시 장치나, 알람 등의 음을 출력하는 스피커, 로그 등의 데이터를 인쇄하는 프린터를 갖고 있다.

데이터 처리부(31)는, CPU나 메인 메모리를 갖는다. CPU는, 상기 OS나 애플리케이션 프로그램을 기억부(33)로부터 메인 메모리에 읽어내고, 읽어낸 OS나 애플리케이션 프로그램에 따라서, 통신 처리부(32)에서 수신한 데이터 등의 연산 처리를 행한다. 이 연산 처리에 의해, CPU는, 로그 수집부(311)나, 하드웨어 정보 수집부(312), 소프트웨어 정보 수집부(313)로서도 기능한다. 또한, 에이전트 프로그램을 실행하는 CPU, 즉 기능부(311-313)를 에이전트라고도 칭한다. 도 14에는, 에이전트 프로그램에 따라서 실행되는 기능부(311-313)를 나타냈지만, 관리 대상 시스템(30)은, 데이터베이스나 웹 서버, 파일 서버 등, 다른 기능도 실현한다.

로그 수집부(311)는, 자(自)시스템의 로그를 수집하고, 로그 데이터로서 통신 처리부(32)를 통해 매니저(10)에게 송신한다. 예를 들면 로그 수집부(311)는, 새로운 로그가 출력될 때마다 혹은 정기적으로, 수집한 로그 데이터를 매니저(10)에게 송신한다. 또한, 로그 수집부(311)는, 매니저(10)로부터 로그 데이터의 요구를 수신했을 경우에, 시스템의 로그를 메인 메모리로부터 판독하고, 통신 처리부(32)를 통해 매니저(10)에게 송신한다.

하드웨어 정보 수집부(312)는, 매니저(10)로부터 하드웨어의 정보의 요구를 수신했을 경우에, 자시스템에 구비되어 있는 각 하드웨어로부터 각각의 정보를 읽어내고, 하드웨어의 정보로서 매니저(10)에게 회신한다. 또한, 하드웨어의 정보의 수집은, 매니저(10)로부터의 요구시에 한하지 않고, 당해 시스템에 하드웨어를 접속했을 때에 행해도 된다. 예를 들면, 하드웨어 정보 수집부(312)는, 플러그 앤 플레이의 기능에 의해 당해 시스템에 하드웨어가 접속되었음을 검지했을 경우에, 이 접속한 하드웨어에 구비된 ROM으로부터 당해 하드웨어의 정보를 읽어내서 메인 메모리에 기억시켜 둔다. 그리고, 매니저(10)로부터 하드웨어의 정보의 요구를 수신했을 경우에, 하드웨어 정보 수집부(312)는, 메인 메모리로부터 하드웨어의 정보를 읽어내서 매니저(10)에게 회신해도 된다. 또한, 하드웨어 정보 수집부(312)는, 각 하드웨어의 구성 관련의 정보 외에, 각 하드웨어의 속성도 수집하여, 하드웨어의 정보로서 매니저(10)에게 송신한다.

또한, 하드웨어 정보 수집부(312)는, 매니저(10)로부터의 요구에 의하지 않고, 하드웨어의 정보를 수집하여 매니저(10)에게 송신해도 된다. 예를 들면 하드웨어를 착탈했을 경우나, 하드웨어의 드라이브를 갱신했을 경우, 소정의 주기로, 하드웨어 정보 수집부(312)가 하드웨어의 정보를 수집하여 매니저(10)에게 송신해도 된다.

소프트웨어 정보 수집부(313)는, 매니저(10)로부터 소프트웨어의 정보의 요구를 수신했을 경우에, 자시스템에 구비되어 있는 각 소프트웨어의 정보를 소정의 기억 영역, 예를 들면 레지스트리로부터 읽어내서, 소프트웨어의 데이터로서 매니저(10)에게 회신한다. 또한, 소프트웨어 정보 수집부(313)는, 각 소프트웨어의 구성 관련의 정보 외에, 각 소프트웨어의 속성도 수집하여, 소프트웨어의 정보로서 매니저(10)에게 송신한다.

또한, 소프트웨어 정보 수집부(313)는, 매니저(10)로부터의 요구에 의하지 않고, 소프트웨어의 정보를 매니저(10)에게 송신해도 된다. 예를 들면, 소프트웨어를 인스톨했을 경우나, 언인스톨했을 경우, 소프트웨어를 갱신했을 경우, 소정의 주기로, 소프트웨어 정보 수집부(313)가 소프트웨어의 정보를 수집하여 매니저(10)에게 송신해도 된다.

<운용 관리 방법의 설명>

도 15는 매니저(10)가 감시 대상 시스템(30)의 에이전트로부터 관리 데이터를 수신하여 데이터 저장부(3)에 기입하는 처리의 설명도이다.

매니저(10)의 정보 수집부(11)는, 관리 데이터 즉 구성 데이터나 로그 데이터를 수신하기 위한 소정 조건을 충족시키고 있는지의 여부를 판정하여(S1), 조건을 충족시키고 있지 않으면 일정 시간 슬립하고(S2), 조건을 충족시킬 때까지 대기한다(S1, S2). 본 예에 있어서, S1의 조건은, 정기 폴링의 실행 시각에 달했는지, 클라이언트(20)로부터 관리 데이터의 갱신 혹은 분석의 요구를 받았는지, 또는 에이전트로부터 관리 데이터가 보내져 왔는지이다.

감시 대상 시스템(30)의 에이전트로부터 관리 데이터가 보내져 왔을 경우, 정보 수집부(11)는, 수신한 관리 데이터를 데이터 저장부(3)에 저장한다(S3).

또한, S1에서, 폴링의 실행 시각에 달했을 경우, 혹은 정보 갱신의 요구를 받았을 경우, 정보 수집부(11)는, 에이전트에 관리 데이터의 송신을 요구하는, 즉 관리 대상 시스템에 관리 데이터의 리퀘스트를 송신한다(S4). 정보 수집부(11)는, 이 정보 수집부(11)로부터의 리퀘스트에 따라 에이전트로부터 송신된 관리 데이터를 수신하여, 데이터 저장부(3)에 저장한다(S3).

도 16은 감시 대상 시스템(30)의 에이전트가, 관리 데이터를 매니저(10)에게 송신하는 처리의 설명도이다.

에이전트는, 관리 데이터 즉 구성 데이터 또는 로그 데이터를 송신하기 위한 소정 조건을 충족시키고 있는지의 여부를 판정하여(S11), 조건을 충족시키고 있지 않으면 일정 시간 슬립하고(S12), 조건을 충족시킬 때까지 대기한다(S11, S12). 본 예에 있어서, S11의 조건은, 관리 데이터의 리퀘스트를 수신했는지, 로그 데이터에 추가가 있는지, 구성 데이터에 변경이 있는지이다.

S11의 조건을 충족시켰을 경우(S11, Yes), 에이전트는 관리 데이터를 수집한다(S13). 즉, S11에서, 구성 데이터의 리퀘스트를 수신했을 경우, 리퀘스트된 구성 데이터를 하드웨어 정보 수집부(312) 또는 소프트웨어 정보 수집부(313)가 수집한다. 또한, 구성 데이터의 변경이 있었을 경우, 변경이 있었던 구성 데이터를 하드웨어 정보 수집부(312) 또는 소프트웨어 정보 수집부(313)가 수집한다. 또한, 로그 데이터에 추가가 있었을 경우, 로그 수집부(311)가 로그를 수집한다.

그리고, 에이전트는, S13에서 수집한 관리 데이터를 매니저(10)에게 송신한다(S14).

또한, 도 16에서는, 관리 데이터의 리퀘스트(S11)에 따라 관리 데이터를 수집하고(S13), 매니저(10)에게 송신하는 예를 나타냈지만(S14), 미리 관리 데이터를 수집해 두고, 리퀘스트에 따라 관리 데이터를 송신해도 된다.

도 17은 클라이언트(20)가 분석을 요구하고, 분석 결과를 수신하여 출력하는 처리의 설명도이다.

관리자는, 클라이언트(20)의 로그 표시부(213)에 의해 로그를 일람 표시시켜서 문제의 발생을 나타내는 로그를 선택하고, 당해 로그를 출력한 시스템, 즉 문제가 발생한 시스템의 분석의 요구를 클라이언트(20)에게 입력한다.

클라이언트(20)의 입력 해석부(211)는, 관리자로부터 문제가 발생한 시스템의 분석의 요구를 접수하면(S22), 관리자가 선택한 로그의 로그 ID를 포함하는 분석의 리퀘스트를 매니저(10)에게 송신한다(S23).

그리고, 클라이언트(20)는, 통신 처리부(22)를 통해 매니저(10)로부터 분석 결과를 수신하고(S24), 특징 표시부(219)가 당해 분석 결과를 표시 장치에 표시시킨다(S25).

도 18은 매니저(10)가 요구에 따라 분석을 행하고, 분석 결과를 클라이언트에게 송신하는 처리의 설명도이다.

매니저(10)의 분석부(16)는, 분석의 요구가 있는지의 여부를 판정하여(S31), 요구가 없으면(S31, No), 일정 시간 슬립하여(S32), 요구가 있을 때까지 대기한다.

분석의 요구가 있었을 경우(S31, Yes), 분석부(16)는, 에이전트로부터 수신한 관리 데이터에 의거하여 분석 처리를 행하고(S33), 분석 결과를 클라이언트에게 송신한다(S34).

도 19는 도 18에서의 분석 처리 S33을 상세하게 나타내는 도면이다.

매니저(10)의 분석부(16)는, 클라이언트(20)로부터 수신한 리퀘스트에 포함되는 로그 ID로부터 분석 대상의 로그를 구하고, 당해 분석 대상의 로그와, 데이터 저장부(3)에 유지되어 있는 로그를 순차적으로 비교한다(S41).

비교의 결과, 분석부(16)는, 분석 대상의 로그와 같은 문제가, 데이터 저장부(3)에 유지되어 있는 로그에 존재하고 있는지의 여부를 판정한다(S42). 여기에서 분석부(16)는, 분석 대상의 로그에 문제의 데이터로서 포함되는 이벤트 ID가, 데이터 저장부(3)에 유지되어 있는 로그에 존재하면, 분석 대상의 로그와 데이터 저장부(3)에 유지되어 있는 로그 사이에서 같은 이벤트가 생기고 있는, 즉 같은 문제가 존재한다고 판정한다. 즉 분석부(16)는, 분석 대상의 로그에 문제의 데이터로서 포함되는 이벤트 ID가, 데이터 저장부(3)에 유지되어 있는 로그에 존재하지 않으면, 분석 대상의 로그와 데이터 저장부(3)에 유지되어 있는 로그 사이에서 같은 문제가 존재하지 않는다고 판정한다. 또한, 분석부(16)는, 이벤트 ID에 한하지 않고, 이벤트 타입이나 이벤트 소스 등, 다른 정보를 이용하여 판정해도 된다.

분석 대상의 로그와, 데이터 저장부 내의 로그에 같은 문제가 존재하지 않으면(S42, No), 분석부(16)는, 비교하는 데이터 저장부 내의 로그를 다음으로 시프트하여, 분석 대상 로그와의 비교를 반복한다(S43, S41).

또한, 분석 대상 로그와 데이터 저장부 내의 로그에 같은 문제가 존재하면(S42, Yes), 분석부(16)는, 당해 분석 대상 로그로부터 시스템의 식별 정보를 추출하고, 메모리 혹은 데이터 저장부(3) 내에 저장한 문제 발생 리스트에 추출한 시스템의 식별 정보를 기입한다. 또한, 이미 문제 발생 리스트에 기입되어 있는 식별 정보와 중복하는 식별 정보는 기입 대상으로부터 제외된다.

그리고, 분석부(16)는, 데이터 저장부(3) 내의 모든 로그와 분석 대상의 로그와의 비교가 완료되었는지의 여부를 판정하여(S45), 완료되어 있지 않으면(S45, No), 비교하는 데이터 저장부 내의 로그를 다음으로 시프트하여 비교를 반복한다(S43, S41).

모든 로그의 비교를 끝내고, 문제 발생 리스트가 완성되었을 경우(S45, Yes), 분석부(16)는, 당해 문제 발생 리스트에 기재된 식별 정보, 즉 문제가 발생 한 적이 있는 시스템의 식별 정보와 대응하는 관리 데이터를 데이터 저장부(3)로부터 추출한다. 그리고, 분석부(16)는, 도 20을 이용하여 후술하는 바와 같이, 문제가 발생한 적이 있는 시스템 모두에 공통되는 데이터를 스키마에 따라 1개의 트리 구조로 매핑하여, 문제 발생 공통 트리를 작성한다(S46). 여기에서, 트리 구조의 스키마는, 운용 관리 시스템에 미리 정의되어 있는 것이어도 되고, 분석시에 관리자가 정의한 것이어도 된다. 데이터의 매핑에 있어서, 만일, 어느 노드에 대하여 공통되는 데이터가 없었을 경우에는, 당해 노드 및 그 이하의 자(子)노드는 삭제한다.

도 20은 문제 발생 공통 트리의 작성 처리의 구체예를 나타내는 도면이다.

분석부(16)는, 문제 발생 리스트에 기재된 식별 번호에 의거하여, 서로 문제가 발생한 적이 있는 시스템 A의 관리 데이터(101)와 시스템 B의 관리 데이터(102)를 데이터 저장부(3)로부터 추출하고, 비교한다.

관리 데이터끼리의 비교의 결과, 분석부(16)는, Machine : X series, CPU : X cpu, OS : X OS, Soft : Y package를 시스템 A와 시스템 B의 공통의 구성으로서 추출한다. 또한, 도 20에서, 관리 데이터의 각 항목은, (구성의 종별 : 데이터값)의 형식으로 나타나 있다. 예를 들면 Machine, CPU, OS가 구성의 종별이며, X series, X cpu, X OS가 데이터값이다.

스키마(103)는, 도 20에 나타내는 바와 같이, 구성의 종속 관계를 트리 구조로 정의하고 있다. 그리고, 분석부(16)는, 스키마(103)의 정의에 따라, 당해 데이터값과 대응하는 구성의 노드에 관리 데이터의 데이터값을 설정하고, 대응하는 데이터값이 없는 노드를 삭제하여, 문제 발생 공통 트리(104)를 작성한다. 즉, 분석부(16)는, X cpu를 CPU의 노드에 설정하고, X series를 Machine의 노드에 설정하며, X OS를 OS의 노드에 설정한다. 또한, 분석부(16)는, 대응하는 데이터값이 없는 MEM, OSver의 노드를 스키마(103)로부터 삭제한다.

또한, 스키마(103)는, 예를 들면 노드마다 도 21에 나타내는 바와 같이, 구성의 종별과 데이터값, 자노드를 나타내는 포인터 리스트를 가짐으로써, 노드간의 종속 관계를 특정할 수 있으므로 도 20이나 도 22에 나타낸 트리 구조를 정의할 수 있다. 구성의 종별은, Machine이나 OS와 같은 트리 구조의 노드가 되는 구성을 나타내는 정보이며, 자노드를 나타내는 포인터 리스트는 자노드의 데이터가 저장되어 있는 메모리 영역의 어드레스이다. 도 21에서는, OS의 노드에 종속하는 세 개의 자노드의 어드레스의 예가 나타나 있다.

다음으로 분석부(16)는, 데이터 저장부(3)로부터 추출한 문제가 발생한 적이 있는 시스템의 관리 정보의 모두를 스키마에 따라 1개의 트리 구조로 매핑한 문제 발생 트리를 작성한다(S47).

도 22는 문제 발생 트리의 예를 나타낸다. 문제 발생 트리(105)는, 문제 발생 공통 트리(104)와 비교하여 트리 구조로 매핑하는 데이터를 공통점으로 한정하지 않는 점이 다르고, 스키마(103)나 관리 데이터는 같다. 분석부(16)는, 문제 발생 리스트에 기재된 식별 번호에 의거하여, 문제가 발생한 적이 있는 시스템 A의 관리 데이터(101)와 시스템 B의 관리 데이터(102)를 데이터 저장부(3)로부터 추출하고, 한정하지 않고 모든 데이터를 스키마(103)에 따라 트리 구조로 매핑한다. 도 22에 나타내는 바와 같이, 문제 발생 트리에서는, 데이터를 공통점으로 한정하지 않기 때문에, Y mem, X mem과 같이, 데이터값이 다른 같은 데이터 종별의 노드가 복수 존재할 수 있다.

또한, 분석부(16)는, S44에서 작성한 문제 발생 리스트에 기재되어 있지 않은 식별 번호, 즉 문제가 발생하지 않은 시스템의 식별 정보와 대응하는 관리 데이터를 데이터 저장부(3)로부터 추출한다. 또한, 분석부(16)는 이 문제가 발생하지 않은 시스템의 관리 정보의 모두를 스키마(103)에 따라 1개의 트리 구조로 매핑한 문제 비발생 트리를 작성한다(S48).

그리고, 비교부(15)는, 문제 발생 공통 트리, 문제 발생 트리 및 문제 비발생 트리를 비교하여, 문제의 해석에 의미가 있는 차분, 즉 문제가 발생하는 시스템의 특징을 추출하고, 분석 결과로서 상술한 리스트에 더한다(S49).

매니저(10)의 비교부(15)는, 노드를 비교하여 특징을 탐색할 때의 기점이 되는 노드를 1개 결정하고, 그 노드의 자노드에 대해서 차분을 추출해 간다. 트리 구조의 탐색은, 문제 발생 공통 트리의 루트 노드로부터 시작해, 리프를 향하여 진행시켜 간다. 탐색 순서에 관한 알고리즘은, 특별히 제한되지 않는다. 예를 들면, 대표적인 폭 우선 탐색이나 깊이 우선 탐색 등의 방법이 이용된다. 소정의 알고리즘에 따라서 비교부(15)는, 문제 발생 공통 트리, 문제 발생 트리 및 문제 비발생 트리 중 어느 2개의 트리 구조가 공통해서 갖고 있는 노드에 대하여 탐색을 진행시켜 가서, 그 앞에 있는 차분을 특징으로서 추출한다.

도 23은 도 19의 S49에서 행하는 문제가 발생한 시스템의 특징을 추출하는 처리의 설명도이다.

비교부(15)는, 우선, 문제 발생 공통 트리의 루트 노드를 탐색의 기점으로 하는 노드, 즉 탐색 대상 노드에 설정한다(S51).

비교부(15)는, 탐색 대상 노드에 자노드가 있는지의 여부를 판정한다(S52).

탐색 대상 노드에 자노드가 있을 경우(S52, Yes), 비교부(15)는, 문제 발생 공통 트리의 탐색 대상 노드의 자노드 그룹 중 1개를 비교의 대상으로 하는 노드, 즉 비교 대상 노드로 하여, 당해 비교 대상 노드와 문제 비발생 트리에 있는 같은 종별의 노드 그룹을 비교한다(S53).

비교부(15)는, 비교의 결과, 비교 대상 노드와 같은 데이터값의 노드가 문제 비발생 트리에 있는지의 여부를 판정하여(S54), 같은 데이터값의 노드가 발견되었을 경우(S54, Yes), 당해 노드를 다음번 이후의 탐색 대상 노드를 선택하기 위한 리스트, 즉 탐색 대상 리스트에 기록한다(S55).

한편, 같은 데이터값의 노드가 문제 비발생 트리로부터 발견되지 않았을 경우(S54, No), 비교부(15)는, 당해 자노드, 즉 같은 데이터값의 노드가 문제 비발생 트리로부터 발견되지 않은 비교 대상 노드를 문제가 발생한 시스템의 특징으로서 분석 결과의 리스트에 기록한다(S56).

다음으로, 비교부(15)는, S53에서 비교 대상으로 하고 있는 문제 비발생 트리의 자노드가 친(親)노드와 관련하는 구성인지의 여부를 판정한다(S57). 문제 비발생 트리의 자노드와 친노드가 관련하는 구성이었을 경우, 비교부(15)는, 당해 문제 비발생 트리의 자노드와 데이터값이 일치하는 노드가 문제 발생 트리에 존재하는지를 검색한다. 그리고 비교부(15)는, 당해 문제 비발생 트리의 자노드와 데이터값이 일치하는 노드가 문제 발생 트리에 존재하지 않으면, 「문제가 발생한 시스템에 당해 문제 비발생 트리의 자노드가 없다」는 것을 특징으로 하여 분석 결과의 리스트에 기록한다(S58).

여기에서, 문제 발생 트리와 비교하는 것은 S57에서 문제 비발생 트리의 친노드와 관련하는 구성으로 판정한 자노드이며, 속성의 노드는 문제 발생 트리와의 비교 대상으로 하고 있지 않다. 이 이유는, 같은 데이터 종별의 속성 노드를 특징으로 하여 추출할 경우, 그 속성 노드가 문제가 발생한 시스템의 모두에 공통되어 있음에 의미가 있고, 그 밖의 속성 노드의 정보는 불필요하기 때문이다. 예를 들면, OS의 버전 번호를 비교 대상의 데이터 종별로 하고 있는 도 24를 예로 하면, 문제 발생 공통 트리에서는, 문제가 발생한 시스템에서 공통되는 데이터로 한정되어 있기 때문에, 버전 번호를 나타내는 노드는 하나이다. 한편, 문제 비발생 트리는, 문제가 발생하지 않은 시스템의 모든 데이터로 작성되어 있다. 도 24의 예에서는, 문제 발생 공통 트리에 존재하는 「V3」을 문제가 발생한 시스템의 특징으로서 추출하면 충분한 정보가 된다. 「V3」에 더하여, 「V4가 아니다」, 「V5가 아니다」와 같은 특징을 추출해도 장황해진다.

S57에서 자노드가 친노드와 관련하는 구성이 아니었을 경우(S57, No), 혹은 S55, S58의 처리 실행 후, 비교부(15)는, 문제 발생 공통 트리의 탐색 대상 노드 아래에 문제 비발생 트리의 노드와 비교하지 않은 자노드가 있는지의 여부를 판정한다(S59). 비교하지 않은 자노드가 있으면(S59, Yes), 비교부(15)는, 다음 자노드를 선택하여(S60), S53으로 돌아가 비교 처리를 반복한다.

그리고, 비교하지 않은 자노드가 없다고 판정되었을 경우(S59, No)나, 자노드가 없다고 판정되었을 경우(S52, No), 비교부(15)는, 탐색 대상 리스트에 S52 이후의 처리를 하지 않은 탐색 대상 노드가 있는지의 여부를 판정한다(S61). S52 이후의 처리를 하지 않은 탐색 대상 노드가 있을 경우(S61, Yes), 탐색 대상 리스트로부터 다음 탐색 대상 노드를 선택하여 S52로 돌아간다. 그리고, S52 이후의 처리를 하지 않은 탐색 대상 노드가 없을 경우(S61, No), 비교부(15)는, 탐색의 처리를 종료한다.

[실시예]

매니저(10)의 데이터 저장부(3)에 유지하는 데이터 형태로서, 여기에서는 릴레이셔널 데이터베이스로 실현한 예를 나타낸다. 도 26은 데이터 스키마(130)를 Infomation Engineering 형식의 ER도(entity-relationship diagram)로 나타낸 예이다.

각 테이블은, 시스템에 포함되는 구성을 나타내는 데이터, 즉 구성 데이터를 기억한 테이블이나, 로그 데이터를 기억한 테이블이다. 예를 들면, 시스템을 나타내는 구성 정보(System ID)를 기억한 System 테이블이나, 컴퓨터 등의 설비(Machine)를 나타내는 구성 정보를 기억한 Machine 테이블, CPU를 나타내는 구성 정보를 기억한 CPU 테이블, 메모리를 나타내는 구성 정보를 기억한 Memory 테이블, OS를 나타내는 구성 정보를 기억한 OS 테이블, 소프트웨어를 나타내는 구성 정보를 기억한 software 테이블, 로그를 기억한 Log 테이블이다. 이들 테이블에 기억되어 있는 각 구성 데이터는, 다른 구성 데이터와의 식별을 위한 ID를 프라이머리 키(41)로서 갖는다. 예를 들면, Machine 테이블의 Machine_ID는, 당해 Machine_ID가 부여된 Machine의 데이터와 다른 Machine의 데이터를 식별하기 위한 식별 정보이며, 또한 Machine_ID는, 종속 관계를 특정하기 위한 정보이며, CPU나 메모리의 친노드를 식별하는 식별 정보이다. 각 테이블은, 프라이머리 키 이외에, 테이블이 모델링하고 있는 구성의 속성, 예를 들면 : Machine 테이블의 Machine_Name, Model_No를 가질 수 있다. 또한, 루트 노드 이외의 테이블은, 당해 테이블이 모델링하고 있는 구성과 관련하는 구성, 본 예에서는 친노드를 나타내는 외부 키(42)를 포함한다. 예를 들면, System table이 외부 키(42)를 포함하지 않음으로써 루트 노드임을 나타내고, Machine 테이블이 System_ID를 저장하고 있음으로써, Machine이 System의 구성물임을 나타낸다.

또한, Log 테이블은, 로그 데이터를 나타내기 위한 테이블이며, System_ID에 의해 로그를 출력한 정보 시스템을 특정할 수 있도록 한다. 에이전트의 로그 수집부(311)는, 소속하는 시스템이 매니저(10)의 관리 대상으로서 매니저(10)에 등록될 때에 매니저로부터 송신되는 System_ID를 유지해 두고, Log 테이블에 System_ID를 기입한다. 에이전트의 로그 수집부(311)는, 소속하는 시스템의 로그를 감시하고, 신규로 로그가 시스템으로부터 출력되었을 때에, 스키마가 나타내는 포맷으로 로그 데이터를 매니저(10)에게 송신한다. 매니저(10)는, 에이전트로부터 수신한 로그 데이터를 축적하여 유지한다.

구성 데이터는, 매니저(10)가 정기적으로 폴링하여 취득하는 형태여도 되지만, 본 예에서는, 에이전트의 하드웨어 정보 수집부(312) 및 소프트웨어 정보 수집부(313)가 매니저(10)에게 송신하는 것으로 한다. 에이전트는, OS나 펌웨어에 액세스함으로써, 관리 대상으로 하고 있는 시스템의 구성 데이터를 취득한다. 그리고, 감시하고 있는 시스템 정보에 변화가 생겼을 경우에, 변화가 있었던 구성 데이터를 매니저(10)에게 송신한다.

매니저(10)는, 에이전트로부터 수신한 구성 데이터에서 데이터 저장부(3) 내의 기존의 데이터를 덮어쓴다. 그러나, 데이터 저장부(3)의 용량을 충분히 확보할 수 있을 경우에는, 수신한 데이터를 축적하여 유지하고, 1개의 시스템으로부터 시계열로 복수의 구성 데이터를 취할 수 있도록 할 수도 있다. 이와 같이 복수의 구성 데이터를 유지함으로써, 데이터 분석시에 많은 샘플링 데이터를 대상으로 할 수 있으므로, 분석 결과의 신뢰성의 향상을 기대할 수 있다.

관리자는, 클라이언트(20)가 표시하는 도 2와 같은 로그 참조 화면에 의해, 관리 대상 시스템에서 발생하고 있는 문제를 인식한다. 그리고, 관리자가, 로그 일람 중에서 데이터 분석의 대상으로 하는 로그를 선택하여, 문제가 발생하고 있는 시스템의 특징을 표시하도록 커맨드를 실행하면, 클라이언트(20)는, 당해 시스템에 대한 분석의 요구를 매니저(10)에게 송신한다.

매니저(10)의 분석부(16)에 의한 데이터 분석은, 릴레이셔널 데이터베이스의 연산을 이용함으로써 실현할 수 있다.

문제를 발생한 적이 있는 시스템의 추출은, 다음 SQL문(文)을 실행한다.

SELECT DISTINCT System_ID FROM Log

WHERE Log_ID＝<관리자가 선택한 로그의 Log_ID>

여기에서, 분석부(16)는, 상기의 SQL문의 실행 결과를 TROUBLE_SYSTEMS라는 이름의 일시(一時) 테이블에 보존한다.

문제를 발생한 적이 없는 시스템의 추출은, 다음 SQL문을 실행한다.

SELECT System_ID FROM System

WHERE System_ID NOT IN

(SELECT System_ID FROM TROUBLE_SYSTEMS)

여기에서, 분석부(16)는, 상기의 SQL문의 실행 결과를 NON_TROUBLE_SYSTEMS라는 이름의 일시 테이블에 보존한다.

다음으로, 분석부(16)는, 문제 발생 공통 트리, 문제 발생 트리 및 문제 비발생 트리를 작성하기 위해, Log 테이블 이외의 테이블을 결합시켜, 시스템의 일람표, 즉 시스템에 포함되는 구성의 일람을 작성한다. 여기에서는, System 테이블, OS 테이블 및 Software 테이블을 결합할 경우의 SQL문을 예로서 나타내지만, 실제로는, 분석부(16)가, 마찬가지의 식으로 Log 테이블 이외의 모든 테이블을 결합한다.

SELECT System.System_ID, OS_Name, OS_Ver, Soft_Name, Soft_Ver

FROM System, OS, Software

WHERE System.System_ID＝OS.System_ID AND OS.OS_ID＝Software.OS_ID

분석부(16)는, 여기에서, 얻어지는 시스템의 일람표를 SYSTEM_LIST라는 이름의 일시 테이블에 보존한다.

문제 발생 트리는, 시스템 일람표 SYSTEM_LIST로부터, TROUBLE_SYSTEMS에 기억되어 있는 System ID를 갖는 시스템, 즉 문제가 발생한 시스템을 추출함으로써 얻을 수 있다.

SELECT*FROM SYSTEM_LIST

WHERE System_ID IN(SELECT System_ID FROM TROUBLE_SYSTEMS)

분석부(16)는, 상기의 SQL문의 실행 결과로서 얻어지는 문제 발생 트리, 즉 문제가 발생한 시스템에 포함되는 구성을 나타내는 구성 데이터와 그 종속 관계를 나타내는 프라이머리 키(41) 및 외부 키(42)를 TROUBLE_SYSTEM_TREE라는 이름의 일시 테이블에 보존한다.

문제 발생 공통 트리는, 문제 발생 트리의 일시 테이블 TROUBLE_SYSTEM_TREE의 열마다, 구성 데이터의 종류가 보존되어 있을 경우에, 당해 테이블의 열의 요소가 1종류인 것, 즉 문제가 발생한 시스템 모두에 공통된 구성의 구성 데이터로서, TROUBLE_SYSTEM_TREE에 1종류만이 보존된 구성 데이터를 골라냄으로써 작성할 수 있다. 분석부(16)는, 열의 요소가 1종류인지 아닌지를 이하의 SQL문으로 조사할 수 있다. 이 예에서는, OS_Name의 종류 수가 조사된다.

SELECT COUNT(DISTINCT OS_Name) FROM TROUBLE_SYSTEM_TREE

상기의 결과가 1일 경우, 분석부(16)는, 이하의 SQL문에서 얻어지는 결과를 문제 발생 공통 트리의 구성 요소로 한다.

SELECT DISTINCT OS_Name FROM TROUBLE_SYSTEM_TREE

분석부(16)는, TROUBLE_SYSTEM_TREE의 각 열에 대하여 마찬가지의 식을 실행하여 얻어지는 결과로부터, 문제 발생 공통 트리를 작성할 수 있다.

문제 비발생 트리는, 시스템 일람표 SYSTEM_LIST로부터, TROUBLE_SYSTEMS에 기억되어 있지 않은 System ID를 갖는 시스템, 즉 문제가 발생한 적이 없는 시스템을 추출함으로써 얻을 수 있다.

SELECT*FROM SYSTEM_LIST

WHERE System_ID IN(SELECT System_ID FROM NON_TROUBLE_SYSTEMS)

이상에 의해 얻어진 데이터를 기초로, 도 23에 나타내는 순서로 문제가 발생한 시스템의 특징을 추출할 수 있다. 도 27은, 문제가 발생한 시스템의 특징을 수신한 클라이언트(20)가, 관리자를 향하여 나타내는 결과 화면의 예이다. 도 27의 예는, 문제가 발생한 시스템의 특징을, OS로서 「X OS」를 도입하고 있으며, 소프트웨어로서 「X package」와 「Y package」를 갖고 있지 않은 것으로 하고 있다.

이상과 같이, 본 실시형태에 의하면, 문제가 발생한 시스템의 특징을 용이하게 추출하는 기술을 제공할 수 있다.

특히, 본 실시형태에 의하면, 문제가 발생한 시스템과 유사하면서 문제가 발생하지 않은 시스템과, 문제가 발생한 시스템과의 차분을 추출하므로, 원인의 검출에 공헌할 가능성이 높은 차분을 추출할 수 있다. 이 때문에, 경험이 적은 관리자여도 문제의 원인을 특정하는 것이 용이해진다.

또한, 본 실시형태에서는 도 23에 나타내는 바와 같이, 탐색 대상 노드의 자노드의 차이, 즉 문제 발생 공통 트리와 문제 비발생 공통 트리에 공통되는 구성(탐색 노드)에, 종속하는 구성(자노드)의 차이를 특징으로서 추출한다. 여기에서, 종속하는 구성(자노드)이란, 공통되는 구성(탐색 노드)을 위해서만 이용되는 것에 한하지 않고, 스키마에 의해 종속 관계가 정의된 것이면, 유저가 임의로 추가 가능한 범용적인 구성 등이어도 된다.

<기타>

본 발명은, 상술한 도시예에만 한정되는 것이 아니라, 본 발명의 요지를 일탈하지 않는 범위 내에서 각종 변경을 더할 수 있는 것은 물론이다.

예를 들면, 상술한 운용 관리 소프트웨어나, 클라이언트 프로그램, 에이전트 프로그램은, 컴퓨터가 판독 가능한 기록 매체에 기록된 것이어도 된다.

여기에서, 컴퓨터가 판독 가능한 기록 매체란, 데이터나 프로그램 등의 정보를 전기적, 자기(磁氣)적, 광학적, 기계적, 또는 화학적 작용에 의해 축적하고, 컴퓨터로부터 판독할 수 있는 기록 매체를 말한다. 이와 같은 기록 매체 중 컴퓨터로부터 분리 가능한 것으로서는, 예를 들면 플렉시블 디스크, 광자기 디스크, CD-ROM, CD-R／W, DVD, DAT, 8㎜ 테이프, 메모리 카드 등이 있다.

또한, 컴퓨터에 고정된 기록 매체로서 하드 디스크나 ROM(리드 온리 메모리) 등이 있다.

Claims

복수의 관리 대상의 장치가 구비하는 하드웨어 또는 소프트웨어인 요소를 관리하기 위한 관리 데이터를 수신하고,
상기 요소간의 종속 관계를 정의한 정의 정보에 따라, 수신한 상기 관리 데이터를 이용해서, 운용을 방해하거나 방해할 우려가 있는 문제가 발생한 장치의 데이터로서, 상기 요소간의 종속 관계를 나타내는 문제 데이터를 구하는 한편, 상기 문제가 발생하지 않은 장치의 데이터로서, 상기 요소간의 종속 관계를 나타내는 비(非)문제 데이터를 구하고,
상기 문제 데이터와 비문제 데이터를 비교하여, 공통되는 요소의 관리 데이터를 구하고, 당해 공통되는 요소에 종속하는 요소에 대해서 상기 문제 데이터와 상기 비문제 데이터의 차분을 추출하는 프로세서를 구비하는 운용 관리 장치.
제1항에 있어서,
상기 프로세서가, 상기 복수의 관리 대상의 장치 중, 문제가 발생한 장치의 모두에 공통되는 요소를 문제 공통 데이터로서 분류하고,
상기 문제 공통 데이터와 상기 비문제 데이터를 비교하여, 상기 문제 공통 데이터와 상기 비문제 데이터의 차분을 더 추출하는 운용 관리 장치.
제1항 또는 제2항에 있어서,
상기 프로세서가, 상기 공통되는 요소에 종속하는 요소로서, 상기 비문제 데이터에 존재하고, 상기 문제 데이터에 존재하지 않는 요소를 추출하는 운용 관리 장치.
복수의 관리 대상의 장치가 구비하는 하드웨어 또는 소프트웨어인 요소를 관리하기 위한 관리 데이터를 수신하는 스텝과,
상기 요소간의 종속 관계를 정의한 정의 정보에 따라, 수신한 상기 관리 데이터를 이용해서, 운용을 방해하거나 방해할 우려가 있는 문제가 발생한 장치의 데이터로서, 상기 요소간의 종속 관계를 나타내는 문제 데이터를 구함과 함께, 상기 문제가 발생하지 않은 장치의 데이터로서, 상기 요소간의 종속 관계를 나타내는 비문제 데이터를 구하는 스텝과,
상기 문제 데이터와 비문제 데이터를 비교하여 공통되는 요소의 관리 데이터를 구하는 스텝과,
상기 공통되는 요소에 종속하는 요소에 대해서 상기 문제 데이터와 상기 비문제 데이터의 차분을 추출하는 스텝을 컴퓨터가 실행하는 운용 관리 방법.
제4항에 있어서,
상기 복수의 관리 대상의 장치 중, 문제가 발생한 장치의 모두에 공통되는 요소를 문제 공통 데이터로서 분류하고,
상기 문제 공통 데이터와 상기 비문제 데이터를 비교하여, 상기 문제 공통 데이터와 상기 비문제 데이터의 차분을 더 추출하는 운용 관리 방법.
제4항 또는 제5항에 있어서,
상기 공통되는 요소에 종속하는 요소로서, 상기 비문제 데이터에 존재하고, 상기 문제 데이터에 존재하지 않는 요소를 추출하는 운용 관리 방법.
복수의 관리 대상의 장치가 구비하는 하드웨어 또는 소프트웨어인 요소를 관리하기 위한 관리 데이터를 수신하는 스텝과,
상기 요소간의 종속 관계를 정의한 정의 정보에 따라, 수신한 상기 관리 데이터를 이용해서, 운용을 방해해거나 또는 방해할 우려가 있는 문제가 발생한 장치의 데이터로서, 상기 요소간의 종속 관계를 나타내는 문제 데이터를 구함과 함께, 상기 문제가 발생하지 않은 장치의 데이터로서, 상기 요소간의 종속 관계를 나타내는 비문제 데이터를 구하는 스텝과,
상기 문제 데이터와 비문제 데이터를 비교하여 공통되는 요소의 관리 데이터를 구하는 스텝과,
상기 공통되는 요소에 종속하는 요소에 대해서 상기 문제 데이터와 상기 비문제 데이터의 차분을 추출하는 스텝을 컴퓨터에 실행시키기 위한 운용 관리 프로그램을 기록한 컴퓨터 판독 가능한 기록 매체.
제7항에 있어서,
상기 복수의 관리 대상의 장치 중, 문제가 발생한 장치의 모두에 공통되는 요소를 문제 공통 데이터로서 분류하고,
상기 문제 공통 데이터와 상기 비문제 데이터를 비교하여, 상기 문제 공통 데이터와 상기 비문제 데이터의 차분을 더 추출하는 운용 관리 프로그램을 기록한 컴퓨터 판독 가능한 기록 매체.
제7항 또는 제8항에 있어서,
상기 공통되는 요소에 종속하는 요소로서, 상기 비문제 데이터에 존재하고, 상기 문제 데이터에 존재하지 않는 요소를 추출하는 운용 관리 프로그램을 기록한 컴퓨터 판독 가능한 기록 매체.