KR100745672B1 - 디지털 홈 서비스 시스템에서의 홈 서비스 장애 관리 방법및 시스템 - Google Patents

디지털 홈 서비스 시스템에서의 홈 서비스 장애 관리 방법및 시스템 Download PDF

Info

Publication number
KR100745672B1
KR100745672B1 KR1020050117150A KR20050117150A KR100745672B1 KR 100745672 B1 KR100745672 B1 KR 100745672B1 KR 1020050117150 A KR1020050117150 A KR 1020050117150A KR 20050117150 A KR20050117150 A KR 20050117150A KR 100745672 B1 KR100745672 B1 KR 100745672B1
Authority
KR
South Korea
Prior art keywords
failure
information
gateway
home
service
Prior art date
Application number
KR1020050117150A
Other languages
English (en)
Other versions
KR20070057550A (ko
Inventor
정찬미
박호진
이상옥
박광로
민옥기
Original Assignee
한국전자통신연구원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국전자통신연구원 filed Critical 한국전자통신연구원
Priority to KR1020050117150A priority Critical patent/KR100745672B1/ko
Publication of KR20070057550A publication Critical patent/KR20070057550A/ko
Application granted granted Critical
Publication of KR100745672B1 publication Critical patent/KR100745672B1/ko

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/069Management of faults, events, alarms or notifications using logs of notifications; Post-processing of notifications
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L12/00Data switching networks
    • H04L12/28Data switching networks characterised by path configuration, e.g. LAN [Local Area Networks] or WAN [Wide Area Networks]
    • H04L12/2803Home automation networks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/14Network analysis or design
    • H04L41/142Network analysis or design using statistical or mathematical methods
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/06Generation of reports

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Mathematical Physics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Pure & Applied Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Algebra (AREA)
  • Automation & Control Theory (AREA)
  • Debugging And Monitoring (AREA)
  • Computer And Data Communications (AREA)

Abstract

본 발명은, 홈 게이트웨이와 홈 서버에 다양한 서비스들을 설치 및 배포하는 디지털 홈 서비스를 위한 분배관리시스템에 포함되어 상기 설치 및 배포된 다양한 서비스들 중 임의의 서비스에 장애가 발생한 경우 상기 장애를 처리하기 위한 홈 서비스 장애 관리 시스템에서, 사용자로부터의 장애 접수에 따라 관리자로부터 장애 접수 정보를 요청받는 과정과, 상기 사용자에 대한 정보 및 장애가 발생한 홈 게이트웨이의 장애 게이트웨이 정보를 추출하는 과정과, 상기 장애 게이트웨이 정보를 이용하여 미리 저장된 통계 정보를 추출하는 과정과, 상기 장애가 발생한 홈 게이트웨이가 정상인 조건으로 장애 정보를 수집하고 상기 수집된 장애 정보를 상기 관리자에게 전송하는 과정과, 상기 장애 게이트웨이 정보, 상기 통계 정보 및 상기 장애 정보에 따라 상기 관리자로부터 결정된 장애 타입 및 장애 초치 정보들을 등록하고, 해당 장애 내역을 저장하여 장애 이력을 관리하는 과정과, 상기 결정된 장애 타입에 따라 미리 설정된 데이터 구조로 장애 레코드를 생성하여 저장하는 과정을 포함하는 것을 특징으로 한다.
분배관리시스템, 홈 서비스 장애 관리, 장애 게이트웨이 정보, 장애 레코드

Description

디지털 홈 서비스 시스템에서의 홈 서비스 장애 관리 방법 및 시스템{METHOD AND SYSTEM FOR HOME SERVICE FAULT MANAGEMENT IN DIGITAL HOME SERVICE SYSTEM}
도 1은 본 발명의 실시예에 따른 디지털 홈 서비스 시스템의 구조를 도시한 블록도,
도 2는 본 발명의 실시예에 따른 디지털 홈 서비스 시스템에서의 홈 서비스 장애 관리를 위한 장애 관리 시스템의 구조를 도시한 블록도,
도 3은 상기 도 2에 도시된 장애 관리 시스템을 구체적으로 도시한 블록도,
도 4는 본 발명의 실시예에 따라 장애 관리 시스템에서 홈서비스 장애 관리를 위한 동작을 도시한 흐름도,
도 5는 본 발명의 실시예에 따라 장애 관리 시스템에서 홈서비스 장애 관리를 위한 모듈간의 인터페이스를 도시한 흐름도,
도 6은 본 발명의 실시예에 따라 장애 관리를 위해 사용하는 데이터 구조를 도시한 도면,
도 7은 본 발명의 실시예에 따라 장애 관리 시스템에서 장애 레코드를 재활용하는 동작을 도시한 흐름도.
본 발명은 디지털 홈 서비스를 위한 시스템 및 방법에 관한 것으로서, 특히 디지털 홈 서비스를 위해 댁내의 서비스의 설치 및 관리를 주관하는 분배관리시스템에서의 홈 서비스 장애 관리를 위한 방법 및 시스템에 관한 것이다.
일반적으로 알려진 디지털 기술은 독자적인 첨단 서비스를 제공해 주는 가전제품에 국한되어 발전되어 왔다. 예를 들어 세탁기, 냉장고 등 백색 가전 및 오디오나 비디오 기기, 홈 시큐리티 장치 등에서는 이미 고성능 마이크로컴퓨터를 통한 디지털 기술이 실용화되었다.
그러나 이동통신 기술 및 가정 내 브로드밴드 네트워크 기술 등이 발달함에 따라 가전제품도 독자적인 서비스 뿐 아니라 디지털 통신기술로 보다 확장되고 연계된 서비스를 제공하는 기술들로 발전되고 있다. 이러한 기술 발전에 따라 최근에는 디지털 기술을 기반으로 방송, 통신, 가전, 컴퓨터 등이 융합돼 새로운 형태의 제품과 서비스가 개발되고 있으며, 이러한 제품들을 통해 가정에서 편리하게 디지털 기술을 이용할 수 있는 디지털 홈 서비스 기술이 실용화되고 있는 추세이다. 이러한 디지털 홈 서비스 기술은 예를 들어 인터넷 냉장고나 인터넷전화기 등 통신과 가전 및 컴퓨터 기술의 융합 및 인터넷 TV 셋톱박스와 같이 방송과 통신 기술이 융합된 기술을 통해 서비스를 제공한다.
이와 같은 홈 네트워크 시장의 활성화에 따라 가정내에서 여러 가지 서비스 를 제공하는 디지털 홈 서비스가 다양해지고 각 서비스의 제공자들 또한 증가될 수 있다. 그러나 이러한 다양한 서비스와 제공자 환경하에서는 장애 원인이 되는 서비스와 서비스 장애 요인을 규명하기가 갈수록 복잡해지며, 장애 요소를 정의하기 위해서는 좀 더 구체적이고 정확한 근거 자료가 요구된다. 즉, 홈네트워크 기반의 댁내에서 사용되는 다양한 서비스들을 고려할 때, 장애 원인이 다양하고 복합하므로 장애 요소를 분석하고 추출하여 이를 제거하는 것에 많은 어려움이 예상되며, 이러한 홈 서비스를 제공하는 주체들이 각기 다르다는 점 또한 장애 복구 및 재발 방지에 난관으로 작용된다는 문제점이 있다.
게다가 종래의 디지털 홈 서비스 시스템의 분배관리 시스템에서 서비스 장애를 관리하기 위한 방법에 대해서는 명시적으로 제공되고, 이는 운용 기능중에 내포되어 있으며, 관리자의 운용 방법에 따라 장애 원인이나 해결 방안이 유동적이었다. 따라서 적합한 시점의 장애 정보를 수집하고 분석하여 장애 원인 파악을 용이하게 하여 시스템의 안정화를 위한 방법이 필요하게 되었다.
한편, 종래의 장애 정보로 활용되었던 운용 정보는 로그 데이터, 게이트웨이 구성 정보, 서비스 상태 정보, GW 성능 정보가 있으며, 이러한 정보들은 단지 관리자에게 정보를 제공하고자 하는 목적으로 시스템에 산재해 있었다. 이로 인해 종래에는 관리자가 장애 발생 건을 사용자로부터 접수 받았을 때 처리와, 시스템의 어떤 정보를 활용하여 장애를 진단하고 파악하여 어떠한 조치를 취해야 하는 지등에 대한 통합적인 정보와 체계적인 기능이 제공되지 않았다. 때문에 산재된 데이터 및 기능 사이에서 운용 혼란을 초래하게 되었으며, 원격에서 홈서비스 장애를 진단하 여 처리할 수 없었다. 결국 장애가 발생하면 기술자를 직접 현장에 투입하여 처리해야하는 문제점이 있었다.
따라서, 본 발명의 목적은 디지털 홈 서비스 시스템의 분배관리 시스템에서 제공되는 다양한 댁내 서비스에서 발생할 수 있는 장애를 원격으로 진단하고 관리하기 위한 방법 및 시스템을 제공함에 있다.
본 발명의 다른 목적은 시스템 및 서비스의 안정화를 위해 운용 통계 데이타 중 관련 장애 빈도 데이타를 추출하여 연계시킴으로써 정확한 장애요소를 규명하고 장애를 제거하기 위한 디지털 홈 서비스 시스템에서의 홈 서비스 장애 관리 방법 및 시스템을 제공함에 있다.
본 발명의 또 다른 목적은 장애 내역에 대해 데이터 구조를 기반으로 장애레코드로 정의하고 관리하여 이를 유사 장애 발생 시 참고모델로 제공하거나 관리자가 서비스를 관리 시 운용에 적용할 수 있도록 활용하는 디지털 홈 서비스 시스템에서 홈 서비스 장애 관리 방법 및 시스템을 제공함에 있다.
상기 이러한 본 발명의 목적들을 달성하기 위한 방법은, 홈 게이트웨이와 홈 서버에 다양한 서비스들을 설치 및 배포하는 디지털 홈 서비스를 위한 분배관리시스템에 포함되어 상기 설치 및 배포된 다양한 서비스들 중 임의의 서비스에 장애가 발생한 경우 상기 장애를 처리하기 위한 홈 서비스 장애 관리 시스템에서, 사용자로부터의 장애 접수에 따라 관리자로부터 장애 접수 정보를 요청받는 과정과, 상기 사용자에 대한 정보 및 장애가 발생한 홈 게이트웨이의 장애 게이트웨이 정보를 추출하는 과정과, 상기 장애 게이트웨이 정보를 이용하여 미리 저장된 통계 정보를 추출하는 과정과, 상기 장애가 발생한 홈 게이트웨이가 정상인 조건으로 장애 정보를 수집하고 상기 수집된 장애 정보를 상기 관리자에게 전송하는 과정과, 상기 장애 게이트웨이 정보, 상기 통계 정보 및 상기 장애 정보에 따라 상기 관리자로부터 결정된 장애 타입 및 장애 초치 정보들을 등록하고, 해당 장애 내역을 저장하여 장애 이력을 관리하는 과정과, 상기 결정된 장애 타입에 따라 미리 설정된 데이터 구조로 장애 레코드를 생성하여 저장하는 과정을 포함하는 것을 특징으로 한다.
상기 본 발명의 목적들을 달성하기 위한 시스템은, 홈 게이트웨이와 홈 서버에 다양한 서비스들을 설치 및 배포하는 디지털 홈 서비스를 위한 분배관리시스템에서 상기 설치 및 배포된 다양한 서비스들 중 임의의 서비스에 장애가 발생한 경우 상기 장애를 처리하기 위한 홈 서비스 장애 관리 시스템으로서, 관리자로부터 장애 접수 정보 요청을 받으면 장애가 발생한 홈 게이트웨이의 장애 게이트웨이 정보 및 상기 사용자에 대한 정보를 추출하는 장애 게이트웨이 정보 추출부와, 상기 장애 게이트웨이 정보를 이용하여 미리 저장된 통계 정보를 추출하여 분석하는 통계 정보 분석부와, 상기 장애가 발생한 홈 게이트웨이가 정상인 조건으로 장애 정보를 수집하여 수집된 정보들을 상기 관리자에게 전송하는 장애 정보 분석부와, 상기 장애 게이트웨이 정보, 상기 통계 정보 및 상기 장애 정보에 따라 상기 관리자 로부터 결정된 장애 타입 및 장애 초치 정보들을 등록하고, 해당 장애 내역을 저장하여 장애 이력을 관리하는 장애 처리부를 포함하는 것을 특징으로 한다.
이하, 본 발명의 바람직한 실시 예를 첨부한 도면을 참조하여 상세히 설명한다. 우선 각 도면의 구성 요소들에 참조 부호를 부가함에 있어서, 동일한 구성 요소들에 한해서는 비록 다른 도면상에 표시되더라도 가능한 한 동일한 부호를 가지도록 하고 있음에 유의해야 한다. 그리고 본 발명을 설명함에 있어, 관련된 공지 기능 혹은 구성에 대한 구체적인 설명이 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우 그 상세한 설명을 생략한다.
본 발명에서는 종래의 평면적이던 장애처리 과정을 입체적으로 제공한다. 그리고 장애 진단을 위한 정보는 게이트웨이(Gateway : GW)나 홈 서버에서 실행되는 서비스의 자원(CPU, 메모리) 점유율을 수집하여 기능적 오류뿐만 아니라 게이트웨이 성능 대비 번들(osgi 프레임워크상에서 동작하는 서비스)의 성능을 측정하고 장애 원인을 규명하기 위한 정보로 활용하며, 실제로 기술자들이 현장에서 조작하는 프로세스를 적극 수용하여 적용한 데이터이다.
또한, 본 발명에서는 장애 정보를 제공함에 있어서, 장애 발생 시점에 입각한 데이터를 제공하고, 장애 발생 배경 및 원인, 조치 내역 등을 유기적인 장애 데이타로 정의하여 장애 레코드로 저장하여 관리한다. 따라서 추후에 발생할 수도 있는 유사 장애에 대비하고 유사 장애 발생시 장애 조치에 대한 참고모델로 제공한다.
한편, 본 발명에 따른 장애관리는 모든 네트웍 구성요소 공급자에 걸쳐 네트 웍이 일관되게 관리될 수 있도록 하는 표준인터페이스를 정의하고 있는 ITU-T(for Telecommunication Standardization Sector of the International Telecommunications Union)에서 공식 정의한 TMN(Telecommunication Management Network)의 그것과는 근본적으로 목표를 달리한다. 상기 TMN의 관리영역은 성능관리, 장애관리, 구성관리, 계정관리, 보안 관리의 5가지로 나눌 수 있으며, 이중 장애 관리는 경보 추적, 고장위치 판별, 시험 기능 등을 포함하는데 본 발명과는 그 목적 및 대상에 있어서 구분되어야 할 것이다. 본 발명은 망 장비에 대한 장애관리가 아닌, 가정이나 사무실 등의 개인적인 공간에서 사용되는 서비스에 대한 장애를 관리하는 것으로서, 분배관리시스템과 같은 기존의 동종 시스템에서는 홈서비스의 정보를 수집하여 이를 관리자에게 제공하는 단순한 정보제공 수준의 기능을 제공하였다.
그러면 본 발명의 실시예에 따라 디지털 홈 서비스 시스템의 분배관리시스템에서 서비스 시 발생하는 장애를 관리하기 위한 방법 및 시스템에 대해 설명하기로 한다. 우선, 본 발명의 실시예에 따른 장애 관리 시스템에 대해 첨부된 도면을 참조하여 구체적으로 설명하기로 한다.
도 1은 본 발명의 실시예에 따른 디지털 홈 서비스 시스템의 구조를 도시한 블록도이다.
상기 도 1을 참조하면, 디지털 홈 서비스 시스템은 분배 관리 시스템(10)과, 홈 게이트웨이(20)와, 홈 서버(30)와, 데이터베이스(40)를 포함한다.
상기 분배 관리 시스템(10)은 홈 서비스 시 발생되는 장애를 관리하는 홈 서 비스 장애 관리 시스템(100)을 포함하며, 홈 게이트웨이(20)와 홈 서버(30)에 서비스를 설치하고 장애가 발생하면 원격으로 장애 요소를 규명하고 조치를 취할 수 있도록 서비스 장애 관리를 한다. 여기서 서비스는 홈 게이트웨이(20) 또는 홈 서버(30)에 탑재되는 번들을 말한다.
상기 분배 관리 시스템(10)에 의해 관리되는 상기 홈 게이트웨이(20) 및 홈 서버(30)는 OSGi 프레임워크가 탑재되며, 번들은 OSGi 프레임워크상에서 동작하는 자바 응용으로 볼 수 있다. 여기서 OSGi 기반의 서비스를 제공하는 분배관리 시스템(10)의 서비스 장애 관리에 있어서, 서비스는 OSGi 프레임워크상에서 동작하는 번들을 말한다.
이와 같은 상기 분배 관리 시스템(10)에서 홈 서비스 장애 관리를 위해 포함된 홈 서비스 장애 관리 시스템(100)의 구체적은 구조를 첨부된 도면을 참조하여 설명하기로 한다.
도 2는 본 발명의 실시예에 따른 디지털 홈 서비스 시스템에서의 홈 서비스 장애 관리를 위한 장애 관리 시스템의 구조를 도시한 블록도이고, 도 3은 상기 도 2에 도시된 장애 관리 시스템을 구체적으로 도시한 블록도이다.
상기 도 2를 참조하면, 홈 서비스 장애 관리 시스템은 장애 게이트웨이 정보 추출부(110)와, 장애 정보 분석부(120)와, 통계 정보 분석부(130)와, 장애 처리부(140)를 포함하며, 상기 데이터베이스(40)에 포함된 분배 관리 데이터베이스(41)와, 통계 데이터베이스(42)와 연동하여 정보들을 데이터베이스화하여 저장한다.
상기 장애 게이트웨이 정보 추출부(110)는 사용자 정보와 게이트웨이 프로파 일 타입과 디바이스 타입등의 정보를 추출하여 장애 정보를 분석하는 기본 정보로 설정하고, 설정된 기본 정보를 장애 정보 분석부(120)로 전송한다. 그리고 상기 장애 케이트웨이 정보 추출부(110)는 상기 도 3에 도시된 바와 같이, 고장 게이트웨이로부터 사용자 정보를 추출하는 사용자 정보 추출부(111)와, 고장 게이트웨이의 프로파일 등의 기본 정보를 추출하는 기본 정보 추출부(112)를 포함한다.
상기 장애 정보 분석부(120)는 장애 GW 정보 추출부(110)로부터 기본 정보를 수신하여 장애 정보를 수집하고, 장애 데이터를 분석하여 관련 데이터만 추출한다. 그리고 상기 장애 정보 분석부(120)는 상기 도 3에 도시된 바와 같이, 서비스 장애로그 수집부(121)와, 번들 상태 정보 수집부(122)와, 자원 정보 수집부(123)와, 기타 정보 수집부(124)를 포함한다. 또한, 상기 장애 정보 분석부(120)는 상기 장애 게이트웨이 정보 추출부(110)로부터 기준 데이터를 제공받아 서비스 장애 로그, 해당 서비스 상태 정보, 해당 GW 관련 이벤트 정보, 해당 서비스가 사용하는 게이트웨이의 CPU 점유율 정보, 메모리 사용률 정보를 장애발생시간으로부터 추출하여 분석한다.
상기 통계 정보 분석부(130)는 상기 장애 정보 분석부(120)로부터 장애 게이트웨이 정보와, 서비스 정보를 수신하고, 운용 통계 정보 중 기본 정보를 기반으로 관련 있는 통계 정보를 상기 통계 데이터베이스(41)에서 추출하여 장애 진단 정보(참고 데이터)로 재표현하며, 상기 도 3에 도시된 바와 같이, 서비스 통계 추출부(131)와, 게이트웨이(GW) 운용 통계 추출부(132)를 포함한다.
상기 장애 처리부(140)는 상기 장애 정보들을 이용하여 관리자가 판단한 장 애 요인과 조치 사항을 등록하고, 해당 장애 내역을 저장하여 장애 이력을 관리하며, 이를 다시 운용 정보로 재활용한다. 그리고 상기 장애 처리부(140)는 상기 도 3에 도시된 바와 같이, 장애 데이터 구성부(141)와, 장애 저장 처리부(142)와, 유사 장애 관리부(143)를 포함한다. 또한 장애 처리부(140)는 해당 장애에 대한 운용자 정보를 포함한 장애 레코드를 저장하고, 각 레코드에 장애 식별자 및 장애 타입을 부여하여 관리하여 유사 장애 발생시에 대한 참고 모델로 이용한다.
이와 같은 구조를 갖는 분배관리시스템의 홈 서비스 장애 관리 시스템에서 홈 서비스 시 발생되는 장애를 관리하기 위한 방법을 첨부된 도면들을 참조하여 구체적으로 설명하기로 한다.
도 4는 본 발명의 실시예에 따라 장애 관리 시스템에서 홈서비스 장애 관리를 위한 동작을 도시한 흐름도이다.
상기 도 4를 참조하면, 관리자가 사용자로부터 장애 발생 접수를 받으면, 401단계에서 홈 서비스 장애 관리 시스템(100)은 관리자로부터 장애 발생 접수에 대한 정보를 수신하여 확인한다.
403단계에서 상기 홈 서비스 장애 관리 시스템(100)은 상기 장애 발생 접수 정보에 포함된 사용자 아이디를 이용하여 장애가 발생한 게이트웨의 장애 게이트웨이 정보를 추출한다. 여기서 장애 게이트웨이 정보는 구성 정보와 사용자 정보, 게이트웨이 상태 정보(시스템다운 여부)와 프로파일 정보 등을 포함한다. 여기서 상기 상태 정보 및 프로파일 정보는 서비스 식별자와 함께 통계 정보를 추출하거나 장애 정보를 수집할 때 키로서 이용된다.
405단계에서 홈 서비스 장애 관리 시스템(100)은 분배관리시스템이 갖고 있는 운용 통계 정보로부터 통계 정보를 추출한다. 이러한 통계 정보를 이용하여 게이트웨이 장애 빈도와 서비스 장애 빈도를 얻을 수 있다.
그러면 407단계에서 홈 서비스 장애 관리 시스템(100)은 장애 정보 분석부(120)를 통해 게이트웨이 상태가 정상인 조건하에서 서비스 장애로그와 상태정보를 수집하고, 이러한 수집된 정보들을 게이트웨이의 상태 및 통계정보를 얻은 관리자에게 알려준다.
409단계에서 홈 서비스 장애 관리 시스템(100)은 서비스 장애인지를 확인한다. 즉, 게이트웨이(20)에 설치된 번들의 메모리 사용률과 CPU 점유율 정보 중 비정상적인 사용이나 과도한 사용률을 발견하게 되었는지를 확인한다. 확인 결과 서비스 장애인 경우 423단계로 진행하고 상기 발견된 내용을 구체적으로 검토한다. 이때, 서비스 장애 인지를 학인하기 위한 키는 상기 403단계에서 추출된 장애 게이트웨이 정보에 포함되는 서비스 식별자와 장애 발생 시간대이다. 이때 관리자가 장애 요인을 찾아서 번들 장애 로그와 상태 값등을 마크하게 되면 홈 서비스 장애 관리 시스템(100)은 상기 마크된 번들 장애 로그와 상태 값등을 장애 요인으로 등록한다.
반면, 상기 409단계에서 확인한 결과 장애가 발생하지 않은 경우 411단계에서 상기 홈 서비스 장애 관리 시스템(100)은 자원 사용 정보를 수집한다.
그런 다음 413단계에서 홈 서비스 장애 관리 시스템(100)은 성능 장애가 발생하였는지를 확인하여 성능 장애 요인이 발생한 경우에는 423단계로 진행하고, 그 렇지 않은 경우에는 415단계에서 장애가 일어난 시간대에 발생된 게이트웨이 이벤트를 검토하여 이벤트 정보를 수집한다. 여기서 이벤트는 게이트웨이(20)에 설치된 서비스가 발생시킨 이벤트 및 그 동작에 대한 로그 데이타로서 상기 데이터와 통계 데이터등을 토대로 간접적인 요인에 의한 장애로 정의할 수 있다.
이후, 417단계에서 홈 서비스 장애 관리 시스템(100)은 기타 장애가 발생하였는지를 확인하여, 기타 장애가 발생한 경우 419단계에서 유사 장애 이력을 추출하고, 그렇지 않은 경우 421단계로 진행한다.
421단계에서 홈 서비스 장애 관리 시스템(100)은 장애 데이터를 구성하고, 423단계에서 장애 정보를 저장한 후 장애 처리를 한다. 즉, 홈 서비스 장애 관리 시스템(100)은 관리자에게 보다 정확한 장애 진단을 위해 지침을 제공하는데 각 단계별로 장애 원인이 파악되면 첨부된 도 6에 도시된 바와 같은 데이터 구조에 따라서 장애 레코드를 저장하고 근거 자료를 등록한다.
상기 장애 레코드는 상기 장애 데이터 구성부(141)에서 장애 식별자를 생성하고, 장애 타입을 정의함으로써 생성된다. 이러한 장애 식별자 및 장애 식별자를 부여 받은 장애 레코드는 유사 장애 발생시 검색되어 참고 모델로 활용되고 평상시에는 관리자가 서비스를 설치 및 배포 등의 운용기능을 수행할 때 운용 정보로 재활용될 수 있으며, 상기 운용 정보로 재활할 수 있도록 장애 이력을 신규 운용데이타로 재정의한다.
도 5는 본 발명의 실시예에 따라 장애 관리 시스템에서 홈서비스 장애 관리를 위한 모듈간의 인터페이스를 도시한 흐름도이다.
상기 도 5를 참조하면, 501단계에서 장애 관리 화면 처리부(105)는 사용자가 장애 접수를 함에 따라 관리자로부터 장애 정보 요청 메시지를 수신한다. 그러면 502단계에서 장애 관리 화면 처리부(105)는 사용자 정보 조회 메시지를 장애 게이트웨이 정보 추출부(110)로 전송하고, 503단계에서 게이트웨이 기본 정보 조회 메시지를 장애 게이트웨이 정보 추출부(110)로 전송한다. 이에 따라 504단계에서 장애 게이트웨이 정보 추출부(110)는 통계 정보 분석부(130)로 서비스 장애 통계 요청 메시지를 전송하고, 505단계에서 게이트웨이 운용 장애 통계 요청 메시지를 전송한다. 그런 다음 506단계에서 장애 게이트웨이 정보 추출부(110)는 장애 정보 분석부(120)로 서비스 장애 로그 요청 메시지를 전송한다.
그런 다음 511단계에서 장애 관리 화면 처리부(105)는 관리자가 서비스 장애 요인이 발생하였는지를 확인하여 서비스 장애 요인이 발생한 경우 전송한 서비스 장애 로그 요청을 받는다.
512단계에서 장애 관리 화면 처리부(105)는 장애 타입 및 서비스 장애 정보 저장 요청 메시지를 장애 처리부(140)로 전송한다. 이때, 513단계에서 장애 게이트웨이 정보 추출부(110)는 번들 상태 정보 요청 메시지를 장애 정보 분석부(130)로 전송한다.
한편, 521단계에서 장애 관리 화면 처리부(105)는 장애 요인이 발생한 경우 관리자로부터 번들 장애 정보 저장 요청을 받는다. 522단계에서 그러면 장애 관리 화면 처리부(105)는 장애 처리부(140)로 장애 타입 및 서비스 장애 정보 저장 요청 메시지를 전송하고, 523단계에서 자원 사용률 요청 메시지를 장애 정보 분석부 (120)로 전송한다.
그리고 531단계에서 장애 관리 화면 처리부(105)는 성능 장애 요인이 발생하였는지를 확인하여 발생한 경우 관리자로부터 자원 장애 정보 저장 요청을 받는다. 그러면 532단계에서 장애 관리 화면 처리부(105)는 장애 타입 및 성능 장애 정보 저장 요청 메시지를 장애 처리부(140)로 전송한다. 533단계에서 이벤트 로그 정보 요청 메시지를 장애 정보 분석부(130)로 전송한다.
541단계에서 장애 관리 화면 처리부(105)는 기타 장애 요인 분석 메시지를 수신하고, 551단계에서 유사 장애 이력 요청을 받으면 장애 처리부(140)로 유사 장애 이력 조회 메시지를 전송한다. 그러면 552단계에서 장애 처리부(140)는 상기 유사 장애 이력을 조회한다.
이후, 관리자는 장애에 대한 조치를 취하고, 사용자에게 장애를 알리고, 장애 관리 화면 처리부(105)로 장애 처리에 대한 내용을 입력한다. 이에 따라 561단계에서 장애 관리 화면 처리부(105)는 관리자로부터 장애 처리에 대한 내용을 입력받으면, 562단계에서 발생된 장애에 대한 내용을 포함하는 장애 내용 저장 요청 메시지를 장애 처리부(140)로 전송한다. 이에 따라 장애 처리부(140)는 상기 장애 내용을 분배관리 데이터베이스(42)에 저장한다.
다음은 본 발명의 실시예에 따라 장애 레코드를 재활용하기 위한 과정을 첨부된 도면을 참조하여 구체적으로 설명하기로 한다.
도 7은 본 발명의 실시예에 따라 장애 관리 시스템에서 장애 레코드를 재활용하는 동작을 도시한 흐름도이다.
상기 도 7을 참조하면, 701단계에서 홈 서비스 시스템(100)은 관리자로부터 장애 레코드 검색 요청 받음에 따라 703단계에서 장애 타입 및 키워드 입력을 요청하여 상기 관리자로부터 상기 장애 타입 및 장애 키워드를 입력받는다.
705단계에서 상기 홈 서비스 시스템(100)은 장애 저장 처리부(142)에 저장된 장애 레코드를 검색하고, 707단계에서 서비스 장애로그 수집부(121)와 번들 상태 정보 수집부(122)에서 각각 서비스 장애 로그 및 번들 상태를 수집한다.
그런 다음 709단계에서 홈 서비스 시스템(100)은 상기 검색된 장애 레코드의 검색 결과가 맞는지를 확인하여 맞지 않은 경우 상기 702단계로 진행하고, 맞는 경우에는 711단계에서 해당 장애 레코드의 근거가 되는 장애 정보 검색하기 위해 장애 정보 분석부(120)로 장애 정보 요청을 한다. 그러면 713단계에서 홈 서비스 시스템(100)은 상기 장애 정보 분석부(120)에서 장애 식별자를 이용하여 분배 관리 데이터베이스부(42)에 저장되어 있는 장애 정보를 검색한 후 해당 장애 정보를 추출한다.
715단계에서 홈 서비스 시스템(100)은 보고서 출력이 필요한지를 확인하여 필요하지 않은 경우 그대로 동작을 종료하고, 그렇지 않고 필요한 경우 717단계에서 상기 장애 레코드 검색에 대한 보고서를 출력한 후 동작을 종료한다.
상술한 바와 같은 본 발명의 실시예는 본 발명에 의하면 관리자는 원격에서 댁내 서비스 장애 원인을 진단하고 조치할 수 있고, 해당 장애 내역을 장애 레코드로 등록 및 관리함으로서 운용시에 적용할 수 있는 데이터로 활용가능하기 때문에 시간이 지날수록 증가하는 경험치를 기반으로 보다 정확하게 장애관리를 할 수 있 다.
또한, 기존에는 데이터가 산재되어 있고 장애측면에 입각하여 재구성되지 못 하였기 때문에 관리자는 서비스 장애가 발생하면 GW 관리기능에서 수십 가지의 서비스들 리스트나 수십, 수백 가지의 로그 데이타 사이에서 혼란스러워야했으며 서비스 관리 기능에서의 서비스 정보들만으로 장애에 신속히 대처하기에는 부족한 정보들을 다루어야했다. 그러나 본 발명의 실시예에서는 서비스분배관리시스템은 사용자로부터 장애가 접수된 후, 장애 정보를 수집하고 분석하여 장애 진단을 도우며, 운용 통계 데이타에서 관련 있는 장애 통계 데이타를 추출하고 장애레코드를 재활용하여 유사장애발생에 신속한 대처가 가능하도록 하는 학습에 의한 장애진단 기능을 제공한다. 그러므로 관리자는 장애에 대해 보다 신속한 처리가 가능해지며 운용을 하면 할수록 장애진단 능력이 향상되는 시스템을 기대할 수 있다.
한편, 본 발명의 상세한 설명에서는 구체적인 실시 예에 관하여 설명하였으나, 본 발명의 범위에서 벗어나지 않는 한도 내에서 여러 가지 변형이 가능함은 물론이다. 그러므로 본 발명의 범위는 설명된 실시 예에 국한되어 정해져서는 안되며 후술하는 발명청구의 범위뿐 만 아니라 이 발명청구의 범위와 균등한 것들에 의해 정해져야 한다.
상술한 바와 같이 본 발명은 원격으로 댁내 서비스 장애 원인을 진단하고 조치하고, 해당 장애 내역을 장애 레코드로 등록 및 관리함으로서 운용시에 적용할 수있는 데이터로 활용할 수 있으며, 장애 정보를 수집하고 분석하여 장애 진단을 도우며, 운용 통계 데이타에서 관련 있는 장애 통계 데이타를 추출하고 장애레코드를 재활용하여 유사장애발생에 신속한 대처가 가능하도록 하여 보다 정확하게 장애관리를 할 수 있는 효과가 있다.

Claims (12)

  1. 홈 게이트웨이와 홈 서버에 다양한 서비스들을 설치 및 배포하는 디지털 홈 서비스를 위한 분배관리시스템에 포함되어 상기 설치 및 배포된 다양한 서비스들 중 임의의 서비스에 장애가 발생한 경우 상기 장애를 처리하기 위한 홈 서비스 장애 관리 시스템에서,
    사용자로부터의 장애 접수에 따라 관리자로부터 장애 접수 정보를 요청받는 과정과,
    상기 사용자에 대한 정보 및 장애가 발생한 홈 게이트웨이의 장애 게이트웨이 정보를 추출하는 과정과,
    상기 장애 게이트웨이 정보를 이용하여 미리 저장된 통계 정보를 추출하는 과정과,
    상기 장애가 발생한 홈 게이트웨이가 정상인 조건으로 장애 정보를 수집하고 상기 수집된 장애 정보를 상기 관리자에게 전송하는 과정과,
    상기 장애 게이트웨이 정보, 상기 통계 정보 및 상기 장애 정보에 따라 상기 관리자로부터 결정된 장애 타입 및 장애 초치 정보들을 등록하고, 해당 장애 내역을 저장하여 장애 이력을 관리하는 과정과,
    상기 결정된 장애 타입에 따라 미리 설정된 데이터 구조로 장애 레코드를 생성하여 저장하는 과정을 포함하는 것을 특징으로 하는 홈 서비스 장애 관리 방법.
  2. 제1항에 있어서,
    상기 관리자로부터 유사 장애 이력에 대한 요청을 받으면 상기 장애 이력을 조회하여 유사 장애 이력을 추출하는 과정과,
    상기 장애 레코드를 상기 유사 장애 이력을 이용하여 신규 운용데이터로 재정의하는 과정을 더 포함하는 것을 특징으로 하는 홈 서비스 장애 관리 방법.
  3. 제1항에 있어서,
    상기 생성된 장애 레코드는 장애 식별자 및 상기 장애 타입이 부여되어 관리되며, 서비스 설치 및 배포 시에 운용 정보로 재활용되고, 유사 장애가 발생한 경우 참고 모델로 이용됨을 특징으로 하는 홈 서비스 장애 관리 방법.
  4. 제1항에 있어서,
    상기 장애 게이트웨이 정보는 구성 정보, 사용자 정보, 게이트웨이의 상태 정보 및 프로파일 정보를 포함함을 특징으로 하는 홈 서비스 장애 관리 방법.
  5. 제4항에 있어서,
    상기 상태 정보 및 상기 프로파일 정보는 서비스 식별자와 함께 상기 통계 정보를 추출 또는 상기 장애 정보를 수집 시에 키로서 이용됨으로 특징으로 하는 홈 서비스 장애 관리 방법.
  6. 제1항에 있어서,
    상기 장애 정보는 상기 장애 정보를 각각 서비스 장애 로그, 번들 상태 정보, 자원 정보 및 기타 정보로 구분되어 수집됨을 특징으로 하는 홈 서비스 장애 관리 방법.
  7. 홈 게이트웨이와 홈 서버에 다양한 서비스들을 설치 및 배포하는 디지털 홈 서비스를 위한 분배관리시스템에서 상기 설치 및 배포된 다양한 서비스들 중 임의의 서비스에 장애가 발생한 경우 상기 장애를 처리하기 위한 홈 서비스 장애 관리 시스템에 있어서,
    관리자로부터 장애 접수 정보 요청을 받으면 장애가 발생한 홈 게이트웨이의 장애 게이트웨이 정보 및 상기 사용자에 대한 정보를 추출하는 장애 게이트웨이 정보 추출부와,
    상기 장애 게이트웨이 정보를 이용하여 미리 저장된 통계 정보를 추출하여 분석하는 통계 정보 분석부와,
    상기 장애가 발생한 홈 게이트웨이가 정상인 조건으로 장애 정보를 수집하여 수집된 정보들을 상기 관리자에게 전송하는 장애 정보 분석부와,
    상기 장애 게이트웨이 정보, 상기 통계 정보 및 상기 장애 정보에 따라 상기 관리자로부터 결정된 장애 타입 및 장애 초치 정보들을 등록하고, 해당 장애 내역을 저장하여 장애 이력을 관리하는 장애 처리부를 포함하는 것을 특징으로 하는 상기 홈 서비스 장애 관리 시스템.
  8. 제7항에 있어서,
    사용자로부터의 장애 접수에 따라 관리자로부터 장애 접수 정보를 요청받아 상기 장애 게이트웨이로 상기 사용자 정보 및 상기 장애 게이트웨이 정보 조회를 요청하고, 상기 관리자로부터 결정된 장애 타입 및 장애 초치 정보들을 상기 장애 처리부로 전송하는 장애 관리 화면 처리부를 더 포함하는 것을 특징으로 하는 상기 홈 서비스 장애 관리 시스템.
  9. 제7항에 있어서, 상기 장애 처리부는,
    상기 결정된 장애 타입에 따라 미리 설정된 데이터 구조로 장애 레코드를 생성하는 장애 데이터 구성부와,
    상기 생성된 장애 데이터 및 상기 장애 게이트웨이 정보, 상기 통계 정보 및 상기 장애 정보에 따라 상기 관리자로부터 결정된 장애 타입 및 장애 초치 정보들을 등록하고, 해당 장애 내역을 저장하는 장애 저장 처리부와,
    상기 관리자로부터 유사 장애 이력에 대한 요청을 받으면 상기 장애 이력을 조회하여 유사 장애 이력을 추출하고, 상기 추출된 유사 장애 이력을 유사 장애 발생에 대한 참조 모델로 이용하는 유사 장애 관리부를 포함하는 것을 특징으로 하는 상기 홈 서비스 장애 관리 시스템.
  10. 제9항에 있어서,
    상기 생성된 장애 레코드는 장애 식별자 및 상기 장애 타입이 부여되어 관리되며, 서비스 설치 및 배포 시에 운용 정보로 재활용되고, 유사 장애가 발생한 경우 참고 모델로 이용됨을 특징으로 하는 상기 홈 서비스 장애 관리 시스템.
  11. 제7항에 있어서,
    상기 장애 정보 분석부는 상기 장애 정보를 각각 서비스 장애 로그, 번들 상태 정보, 자원 정보 및 기타 정보로 구분하여 수집함을 특징으로 하는 상기 홈 서비스 장애 관리 시스템.
  12. 제7항에 있어서,
    상기 장애 게이트웨이 정보는 구성 정보, 사용자 정보, 게이트웨이의 상태 정보 및 프로파일 정보를 포함함을 특징으로 하는 상기 홈 서비스 장애 관리 시스템.
KR1020050117150A 2005-12-02 2005-12-02 디지털 홈 서비스 시스템에서의 홈 서비스 장애 관리 방법및 시스템 KR100745672B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020050117150A KR100745672B1 (ko) 2005-12-02 2005-12-02 디지털 홈 서비스 시스템에서의 홈 서비스 장애 관리 방법및 시스템

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020050117150A KR100745672B1 (ko) 2005-12-02 2005-12-02 디지털 홈 서비스 시스템에서의 홈 서비스 장애 관리 방법및 시스템

Publications (2)

Publication Number Publication Date
KR20070057550A KR20070057550A (ko) 2007-06-07
KR100745672B1 true KR100745672B1 (ko) 2007-08-02

Family

ID=38354871

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020050117150A KR100745672B1 (ko) 2005-12-02 2005-12-02 디지털 홈 서비스 시스템에서의 홈 서비스 장애 관리 방법및 시스템

Country Status (1)

Country Link
KR (1) KR100745672B1 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102099553B1 (ko) * 2020-03-04 2020-04-09 최창열 자체 관리 기반의 무인포스단말 유지보수 시스템 및 그 방법

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106330587A (zh) * 2015-06-29 2017-01-11 中兴通讯股份有限公司 系统信息的获取方法及装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20030021569A (ko) * 2001-09-06 2003-03-15 정우석 통신망을 이용한 홈 오토메이션/지능형 네트워크 시스템 및 방법
KR20030032405A (ko) * 2001-10-18 2003-04-26 엘지전자 주식회사 홈 네트워크 시스템에서의 디바이스 장애관리 시스템
KR20030032406A (ko) * 2001-10-18 2003-04-26 엘지전자 주식회사 홈 네트워크 시스템에서의 디바이스 장애관리 방법
KR20040050140A (ko) * 2002-12-09 2004-06-16 한국전자통신연구원 라우터 시스템의 장애 및 상태 관리를 위한 망 관리시스템 및 그 방법
KR20050048927A (ko) * 2003-11-20 2005-05-25 한국전자통신연구원 디지털 홈서비스 분배 관리 시스템 및 이 시스템의 관리방법

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20030021569A (ko) * 2001-09-06 2003-03-15 정우석 통신망을 이용한 홈 오토메이션/지능형 네트워크 시스템 및 방법
KR20030032405A (ko) * 2001-10-18 2003-04-26 엘지전자 주식회사 홈 네트워크 시스템에서의 디바이스 장애관리 시스템
KR20030032406A (ko) * 2001-10-18 2003-04-26 엘지전자 주식회사 홈 네트워크 시스템에서의 디바이스 장애관리 방법
KR20040050140A (ko) * 2002-12-09 2004-06-16 한국전자통신연구원 라우터 시스템의 장애 및 상태 관리를 위한 망 관리시스템 및 그 방법
KR20050048927A (ko) * 2003-11-20 2005-05-25 한국전자통신연구원 디지털 홈서비스 분배 관리 시스템 및 이 시스템의 관리방법

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102099553B1 (ko) * 2020-03-04 2020-04-09 최창열 자체 관리 기반의 무인포스단말 유지보수 시스템 및 그 방법

Also Published As

Publication number Publication date
KR20070057550A (ko) 2007-06-07

Similar Documents

Publication Publication Date Title
US7647530B2 (en) Network fault pattern analyzer
US8738760B2 (en) Method and system for providing automated data retrieval in support of fault isolation in a managed services network
US8676945B2 (en) Method and system for processing fault alarms and maintenance events in a managed network services system
US7525422B2 (en) Method and system for providing alarm reporting in a managed network services environment
US8812649B2 (en) Method and system for processing fault alarms and trouble tickets in a managed network services system
US20060248407A1 (en) Method and system for providing customer controlled notifications in a managed network services system
US20060233312A1 (en) Method and system for providing automated fault isolation in a managed services network
US7835307B2 (en) Network discovery tool
WO2016118899A1 (en) Method and system for isp network performance monitoring and fault detection
US20130173965A1 (en) Fault tracing system and method for remote maintenance
JP2011210064A (ja) ログ情報収集システム、装置、方法及びプログラム
JP2008217735A (ja) 障害解析システム、方法、及び、プログラム
WO2010002760A1 (en) System for proactively troubleshooting set top box issues
CN113825164A (zh) 网络故障修复方法、装置、存储介质及电子设备
CN111258857A (zh) 一种服务器状态监测方法及系统
KR100745672B1 (ko) 디지털 홈 서비스 시스템에서의 홈 서비스 장애 관리 방법및 시스템
US20050198279A1 (en) Using trend data to address computer faults
US20060053021A1 (en) Method for monitoring and managing an information system
US7328452B2 (en) Method and device for coping with illegal accesses to a data server
US20080216057A1 (en) Recording medium storing monitoring program, monitoring method, and monitoring system
KR102341418B1 (ko) 네트워크품질 데이터 기반 실시간 고장원인분석 시스템 및 방법
KR100878024B1 (ko) 시청률 관리 시스템 및 방법
CN112835780A (zh) 一种业务检测方法及装置
KR101043134B1 (ko) 망 장애정보를 이용한 고장관리방법
CN116248350A (zh) 网络异常监测方法及装置

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
G170 Publication of correction
FPAY Annual fee payment

Payment date: 20100701

Year of fee payment: 4

LAPS Lapse due to unpaid annual fee