KR20180005098A - Method, apparatus and computer program for managing client network in managed service - Google Patents
Method, apparatus and computer program for managing client network in managed service Download PDFInfo
- Publication number
- KR20180005098A KR20180005098A KR1020160135720A KR20160135720A KR20180005098A KR 20180005098 A KR20180005098 A KR 20180005098A KR 1020160135720 A KR1020160135720 A KR 1020160135720A KR 20160135720 A KR20160135720 A KR 20160135720A KR 20180005098 A KR20180005098 A KR 20180005098A
- Authority
- KR
- South Korea
- Prior art keywords
- customer network
- customer
- network
- failure
- problem event
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 51
- 238000004590 computer program Methods 0.000 title claims abstract description 13
- 238000013480 data collection Methods 0.000 claims abstract description 16
- 238000003012 network analysis Methods 0.000 claims abstract description 15
- 238000004458 analytical method Methods 0.000 abstract description 37
- 238000007726 management method Methods 0.000 description 102
- 230000008569 process Effects 0.000 description 26
- 238000012545 processing Methods 0.000 description 24
- 230000004044 response Effects 0.000 description 9
- 238000010586 diagram Methods 0.000 description 6
- 230000006870 function Effects 0.000 description 6
- 238000012360 testing method Methods 0.000 description 6
- 238000010219 correlation analysis Methods 0.000 description 4
- 238000005259 measurement Methods 0.000 description 4
- 238000010606 normalization Methods 0.000 description 4
- 230000005540 biological transmission Effects 0.000 description 3
- 230000008859 change Effects 0.000 description 3
- 238000004891 communication Methods 0.000 description 3
- 238000003908 quality control method Methods 0.000 description 3
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000000903 blocking effect Effects 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000006866 deterioration Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000007480 spreading Effects 0.000 description 1
- 230000009897 systematic effect Effects 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
- G06Q10/06395—Quality analysis or management
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0633—Workflow analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0635—Risk analysis of enterprise or organisation activities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0633—Lists, e.g. purchase orders, compilation or processing
- G06Q30/0635—Processing of requisition or of purchase orders
- G06Q30/0637—Approvals
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W24/00—Supervisory, monitoring or testing arrangements
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W28/00—Network traffic management; Network resource management
- H04W28/02—Traffic management, e.g. flow control or congestion control
Landscapes
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Engineering & Computer Science (AREA)
- Strategic Management (AREA)
- Economics (AREA)
- Entrepreneurship & Innovation (AREA)
- General Physics & Mathematics (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Development Economics (AREA)
- Tourism & Hospitality (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Educational Administration (AREA)
- Game Theory and Decision Science (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
Abstract
Description
본 발명은 매니지드 서비스(managed service)에서 고객망을 관리하는 방법, 장치 및 컴퓨터 프로그램에 관한 것으로서, 보다 구체적으로는 다수의 고객망에 대하여 매니지드 서비스를 안정적으로 제공하기 위하여 다양한 도메인에서의 고객망 분석을 통하여 다수의 고객망 중 장애 발생 가능성이 높은 고객망들을 산출하여 선제적으로 관리함으로써 고객망에서의 장애 발생을 효과적으로 억제할 수 있도록 하는 매니지드 서비스에서 고객망을 관리하는 방법, 장치 및 컴퓨터 프로그램에 관한 것이다.The present invention relates to a method, apparatus, and computer program for managing a customer network in a managed service, and more particularly, to a method and apparatus for managing a customer network in various domains in order to stably provide a managed service to a plurality of customer networks A device and a computer program for managing a customer network in a managed service that can effectively prevent a failure in a customer network by calculating and preemptively managing customer networks with high probability of failure among a plurality of customer networks .
최근, 고객사의 네트워크, 서버 등에 대한 운용 및 관리 등을 대행하는 매니지드 서비스(managed service)가 확산되고 있다.In recent years, managed services for managing and managing clients' networks and servers have been spreading.
그런데, 매니지드 서비스의 운용 관리는, 단일망으로 이루어지는 통상적인 개별 사업자 망에 대한 운용 관리와는 달리, 매니지드 서비스망 종단에 독립된 다수의 고객망이 연동되는 구조를 가치며, 이에 따라 상기 다수의 고객망을 동시에 관리하는데 어려움이 따른다.Unlike operation management for a typical individual business network in which a single network is managed, the operation management of the managed service is worthy of a structure in which a plurality of independent customer networks are linked to the end of the managed service network, Which are difficult to manage at the same time.
보다 구체적으로, 상기 다수의 고객망 별로 다양한 서비스 프로파일이 존재하게 되며, 상기 서비스 프로파일에는 가입자 ID, 사용회선 정보 (회선수, 대역폭, 회선종류 등), 상위장비에 해당하는 사업자 장비 및 포트, IP 대역, 가입 서비스 (전송, IP, VoIP, 무선, 전원, 보안 등) 이 포함될 수 있다. 이에 따라, 각 고객들은, 매니지드 서비스망을 경유하여 본사와 지사의 고객망을 연결하거나, 네트워크/통신 서비스를 제공받거나, 고객망에 구비된 서버를 이용하여 외부로 소정의 서비스를 제공하는 등 다양한 서비스를 제공받을 수 있으며, 이에 대하여 매니지드 서비스 제공자는 상기 고객에게 안정적인 서비스를 제공하기 위하여 고객망에 대한 운용 관리를 대행하게 된다. More specifically, various service profiles exist for each of the plurality of customer networks, and the service profile includes a subscriber ID, used line information (eg, player, bandwidth, line type, etc.) Band, subscription service (transmission, IP, VoIP, wireless, power, security, etc.). Accordingly, each customer can connect a customer network of the head office and a branch office via a managed service network, receive a network / communication service, or provide a predetermined service to the outside using a server provided in the customer network And the managed service provider manages the management of the customer network in order to provide stable service to the customer.
이러한 환경에서, 다수의 고객망에서 발생하는 다양한 성능 및 장애 문제들을 매니지드 서비스 제공자가 동시에 관리하는 것은 쉽지 않은 문제이다. 보다 구체적으로, 매니지드 서비스 제공자들은 운용 관리 측면에서 종종 다음과 같은 어려움을 겪게 된다.In such an environment, it is not easy for managed service providers to manage various performance and failure problems occurring in a large number of customer networks at the same time. More specifically, managed service providers often encounter the following difficulties in their operational management:
먼저, 단일망으로 이루어지는 통상적인 개별 사업자 망에 대한 운용 관리와는 달리, 매니지드 서비스 제공자는 다수의 고객망을 한꺼번에 관리하여야 하는 바, 제한된 인력으로 다수의 고객망에 대한 관리를 동시에 수행하기는 어려우며, 또한 어떤 고객망에 대한 관리를 우선적으로 수행해야 하는지를 판단하기도 어렵다.Firstly, unlike the operation management for a typical individual business network, which is a single network, a managed service provider must manage a plurality of customer networks at once, and it is difficult to simultaneously manage a plurality of customer networks with limited manpower, It is also difficult to judge which customer network should be managed first.
또한, 단일망으로 이루어지는 통상적인 개별 사업자 망에 대한 운용 관리와는 달리, 다수 고객망의 수많은 장비에서 발생하는 다양한 이벤트들을 원격에서 매니지드 서비스 제공자가 즉시 파악하기는 어려우며, 이에 따라 다수의 고객망에 대한 운용 및 관리를 대행하는데 한계가 따른다.Also, unlike the operation management for a single individual business network, which is a single network, it is difficult for a managed service provider to immediately grasp various events occurring in many equipment of a plurality of customer networks remotely, There is a limit to the operation and management.
나아가, 각 고객망마다 운용 환경 및 규모 등이 다양하여 운용 및 관리를 위한 일률적인 기준을 설정하기도 어려우며, 소규모 고객망은 장애의 원인을 파악하는데 큰 어려움이 없지만, 대규모 고객망인 경우에는 고객망 내부의 서브 네트워크 상에 많은 장비를 구비하고 있어 장애의 원인을 파악하기가 더욱 어렵다.In addition, it is difficult to establish a uniform standard for operation and management due to various operating environments and sizes for each customer network. In the case of a large-scale customer network, Network, it is more difficult to identify the cause of the failure.
특히, 일단 고객망에 장애가 발생하면 다수의 고객 민원 등 대응해야 하는 다양한 문제가 따르게 되며, 이에 대한 대응 시간 및 인력 등도 부족하여 원인 분석 및 조치를 적절하게 취하기도 어렵다. In particular, once an obstacle occurs in a customer network, a variety of problems such as complaints of customers are followed, and the response time and manpower are also insufficient, and it is also difficult to appropriately take the cause analysis and measures.
따라서, 매니지드 서비스를 제공함에 있어서, 다양한 운용 환경을 가지는 다수의 고객망에 대한 품질 관리 및 장애 발생 예측을 통하여 선제적으로 대응하는 것이 적절하며, 이는 소요 비용 등 운용 효율성 측면에서도 보다 바람직한 것으로 평가되고 있다. Accordingly, in providing managed services, it is appropriate to preemptively respond to a plurality of customer networks having various operating environments through quality control and prediction of failure occurrence, and it is evaluated as preferable from the viewpoint of operating efficiency have.
이에 따라, 매니지드 서비스 제공자는 다수의 고객망 중 장애 발생 가능성이 높은 고객망 리스트를 산출하여 선제적으로 관리함으로써, 매니지드 서비스에서 다수의 고객망을 효과적으로 관리할 수 있도록 하는 방안이 지속적으로 요구되고 있으나, 아직 이에 대한 적절한 해결 방안이 제시되지 못하고 있다.Accordingly, there is a continuing need for a managed service provider to effectively manage a plurality of customer networks in a managed service by calculating and preemptively managing a list of customer networks with a high possibility of failure among a plurality of customer networks However, there is still no adequate solution to this problem.
본 발명은 상기와 같은 종래 기술의 문제점을 해결하기 위해 창안된 것으로, 매니지드 서비스 제공자가 다수의 고객망에 대한 매니지드 서비스를 제공함에 있어 다수의 고객망 중 장애 발생 가능성이 높은 고객망들을 산출하여 선제적으로 대응할 수 있도록 하는 매니지드 서비스에서의 고객망에 대한 관리 방법, 장치 및 컴퓨터 프로그램을 제공하는 것을 목적으로 한다.Disclosure of Invention Technical Problem [8] Accordingly, the present invention has been made keeping in mind the above problems occurring in the prior art, and it is an object of the present invention to provide a managed service providing system for a plurality of customer networks, And to provide a management method, apparatus, and computer program for a customer network in a managed service capable of responding to customer requests.
상기 과제를 해결하기 위한 본 발명의 한 측면에 따른 고객망에 대한 관리 방법은, 매니지드 서비스에서 복수의 고객망에 대한 관리를 수행하는 방법에 있어서, 서버가 상기 각 고객망에 대한 품질, 성능, 장애를 평가하기 위한 운용 관리 데이터를 수집하는 데이터 수집 단계; 상기 운용 관리 데이터를 이용하여, 미리 정해진 제1 기준치를 충족하는 각 고객망에 대한 품질 문제 이벤트의 발생 내역을 산출하고, 미리 정해진 제2 기준치를 충족하는 각 고객망에 대한 성능 문제 이벤트의 발생 내역을 산출하며, 미리 정해진 제3 기준치를 충족하는 각 고객망에 대한 장애 문제 이벤트의 발생 내역을 산출하는 고객망 분석 단계; 및 상기 각 고객망에 대한 품질 문제 이벤트, 성능 문제 이벤트 및 장애 문제 이벤트의 발생 내역을 고려하여 상기 복수의 고객망 중 우선 관리가 필요한 고객망을 선정하는 우선 관리 고객망 선정 단계;를 포함하는 것을 특징으로 한다.According to an aspect of the present invention, there is provided a method for managing a plurality of customer networks in a managed service, the method comprising: A data collecting step of collecting management management data for evaluating a fault; A generation history of a quality problem event for each customer network satisfying a first predetermined reference value is calculated using the operation management data and a generation history of a performance problem event for each customer network satisfying a predetermined second reference value A customer network analyzing step of calculating an occurrence history of failure trouble events for each customer network satisfying a predetermined third reference value; And a priority management customer network selection step of selecting a customer network requiring priority management among the plurality of customer networks considering a history of quality problem events, performance problem events and failure problem events for each customer network .
이때, 상기 고객망 분석 단계에서는, 상기 복수의 고객망에 대한 품질 문제 이벤트 발생 내역을 기준으로 제1 고객망 그룹을 선정한 후, 상기 제1 고객망 그룹에 대하여 성능 문제 이벤트 발생 내역을 산출하고, 이어서, 상기 제1 고객망 그룹 중에서 상기 성능 문제 이벤트 발생 내역을 기준으로 제2 고객망 그룹을 선정한 후, 상기 제2 고객망 그룹에 대하여 성능 문제 이벤트 발생 내역을 산출할 수 있다.At this time, in the customer network analysis step, the first customer network group is selected based on the quality problem event occurrence history of the plurality of customer networks, the performance problem event occurrence details are calculated for the first customer network group, Next, the second customer network group may be selected based on the performance problem event occurrence history among the first customer network groups, and the performance problem event occurrence details may be calculated for the second customer network group.
또한, 상기 고객망 분석 단계에서는, 각 고객망에 대하여 상기 품질 문제 이벤트, 성능 문제 이벤트, 장애 문제 이벤트가 소정의 단위 시간당 발생하는 빈도를 산출할 수 있다.In the customer network analysis step, the frequency of occurrence of the quality problem event, the performance problem event, and the failure problem event may be calculated for each customer network.
또한, 상기 우선 관리 고객망 선정 단계에서는, 동일한 원인에 의하여 상기 각 품질 문제 이벤트, 성능 문제 이벤트, 장애 문제 이벤트가 중복 발생되는 경우를 고려하여 상기 복수의 고객망 중 우선 관리가 필요한 고객망을 선정할 수 있다.In addition, in the step of selecting the preferred management customer network, a customer network requiring priority management among the plurality of customer networks is selected in consideration of the case where each of the quality problem event, the performance problem event, can do.
또한, 상기 우선 관리 고객망 선정 단계에서는, 상기 각 고객망의 규모를 고려하여 상기 복수의 고객망 중 우선 관리가 필요한 고객망을 선정할 수 있다.Also, in the step of selecting the preferred management customer network, a customer network requiring priority management among the plurality of customer networks can be selected in consideration of the size of each customer network.
또한, 상기 우선 관리 고객망 선정 단계에서는, 상기 품질 문제 이벤트, 성능 문제 이벤트, 장애 문제 이벤트 중 주로 발생한 이벤트 종류를 고려하여 상기 복수의 고객망 중 우선 관리가 필요한 고객망을 선정할 수 있다.In addition, in the selection of the priority management customer network, a customer network requiring priority management among the plurality of customer networks can be selected in consideration of the types of events mainly occurring among the quality problem event, the performance problem event, and the trouble problem event.
또한, 상기 데이터 수집 단계에서는, 상기 복수의 고객망에 대한 운용 관리 데이터를 수집한 후, 상기 미리 정해진 공통 규격의 운용 관리 데이터의 형식으로 변환할 수 있다.In the data collection step, the management management data for the plurality of customer networks may be collected and then converted into the management management data of the predetermined common standard.
본 발명의 다른 측면에 따른 컴퓨터 프로그램은, 컴퓨터에서 상기 고객망에 대한 관리 방법의 각 단계를 실행시킬 수 있도록 판독 가능한 기록 매체에 저장된 것을 특징으로 한다.The computer program according to another aspect of the present invention is characterized in that the computer program is stored in a readable recording medium so that each step of the management method for the customer network can be executed in the computer.
본 발명의 다른 측면에 따른 서버는, 매니지드 서비스에서 복수의 고객망에 대한 관리를 수행하는 서버에 있어서, 상기 각 고객망에 대한 품질, 성능, 장애를 평가하기 위한 운용 관리 데이터를 수집하는 데이터 수집부; 상기 운용 관리 데이터를 이용하여, 미리 정해진 제1 기준치를 충족하는 각 고객망에 대한 품질 문제 이벤트의 발생 내역을 산출하고, 미리 정해진 제2 기준치를 충족하는 각 고객망에 대한 성능 문제 이벤트의 발생 내역을 산출하며, 미리 정해진 제3 기준치를 충족하는 각 고객망에 대한 장애 문제 이벤트의 발생 내역을 산출하는 고객망 분석부; 및 상기 각 고객망에 대한 품질 문제 이벤트, 성능 문제 이벤트 및 장애 문제 이벤트의 발생 내역을 고려하여 상기 복수의 고객망 중 우선 관리가 필요한 고객망을 선정하는 우선 관리 고객망 선정부;를 포함하는 것을 특징으로 한다.According to another aspect of the present invention, there is provided a server for managing a plurality of customer networks in a managed service, the server comprising: a data collection unit for collecting operational management data for evaluating quality, part; A generation history of a quality problem event for each customer network satisfying a first predetermined reference value is calculated using the operation management data and a generation history of a performance problem event for each customer network satisfying a predetermined second reference value A customer network analysis unit for calculating the occurrence history of a failure problem event for each customer network satisfying a predetermined third reference value; And a priority management customer network selection unit for selecting a customer network requiring priority management among the plurality of customer networks in consideration of a quality problem event, a performance problem event, and a failure problem event for each customer network .
본 발명의 일 실시예에 따른 매니지드 서비스에서 고객망에 대한 관리 방법, 장치 및 컴퓨터 프로그램은, 다수의 고객망에 대한 품질 분석, 성능 분석, 장애 분석 등을 통하여, 장애 발생 가능성이 높은 고객망 리스트를 선정하여 선제적으로 대응할 수 있도록 함으로써, 매니지드 서비스에서 다수의 고객망에 대하여 효과적으로 장애 예측 및 품질 관리를 수행할 수 있게 된다.The management method, apparatus, and computer program for a customer network in a managed service according to an exemplary embodiment of the present invention includes a quality analysis, a performance analysis, and a failure analysis for a plurality of customer networks, It is possible to effectively perform failure prediction and quality control on a large number of customer networks in the managed service.
나아가, 본 발명은 다수의 고객망에 대한 효율적인 관리를 위하여, 선제적인 장애 예측 및 품질 관리를 통하여, 고객망의 장애 발생 요인을 사전에 차단하여 장애 발생을 효과적으로 억제할 수 있고, 고객망에 대한 서비스 품질을 효과적으로 개선할 수 있으며, 나아가 운용 인력 및 비용도 크게 절감할 수 있게 된다.Further, in order to efficiently manage a large number of customer networks, the present invention can effectively prevent the occurrence of faults by blocking pre-failure factors of the customer network through preemptive failure prediction and quality control, The service quality can be effectively improved, and further, the manpower and cost can be greatly reduced.
도 1은 통상적인 매니지드 서비스 제공 환경에 대한 설명도이다.
도 2은 본 발명의 일 실시예에 따른 매니지드 서비스에서의 고객망에 대한 관리 방법의 순서도이다.
도 3은 본 발명의 일 실시예에 따른 매니지드 서비스에서의 고객망에 대한 관리 시스템의 기능별 블록도이다.
도 4는 본 발명의 일 실시예에 따른 매니지드 서비스에서의 고객망에 대한 관리 시스템에서의 분석 분야별 상관도 및 중요 분석 분야 선정을 설명하기 위한 도면이다.
도 5는 본 발명의 일 실시예에 따른 매니지드 서비스에서의 고객망을 관리하기 위한 서버의 구성도이다.
도 6은 본 발명의 일 실시예에 따른 매니지드 서비스에서의 고객망을 관리하기 위한 서버에서의 우선 관리 고객망 선정 과정에 대한 흐름도이다.1 is an explanatory diagram of a conventional managed service providing environment.
2 is a flowchart of a method for managing a customer network in a managed service according to an exemplary embodiment of the present invention.
3 is a functional block diagram of a management system for a customer network in a managed service according to an exemplary embodiment of the present invention.
FIG. 4 is a diagram for explaining the selection of an analysis area and an important analysis field in a management system for a customer network in a managed service according to an embodiment of the present invention.
5 is a configuration diagram of a server for managing a customer network in a managed service according to an embodiment of the present invention.
6 is a flowchart illustrating a process of selecting a preferred management customer network in a server for managing a customer network in a managed service according to an exemplary embodiment of the present invention.
본 발명은 다양한 변환을 가할 수 있고 여러 가지 실시예를 가질 수 있는 바, 이하에서는 특정 실시예들을 첨부된 도면을 기초로 상세히 설명하고자 한다.BRIEF DESCRIPTION OF THE DRAWINGS The present invention is capable of various modifications and various embodiments, and specific embodiments will be described in detail below with reference to the accompanying drawings.
이하의 실시예는 본 명세서에서 기술된 방법, 장치 및/또는 시스템에 대한 포괄적인 이해를 돕기 위해 제공된다. 그러나 이는 예시에 불과하며 본 발명은 이에 제한되지 않는다.The following examples are provided to aid in a comprehensive understanding of the methods, apparatus, and / or systems described herein. However, this is merely an example and the present invention is not limited thereto.
본 발명의 실시예들을 설명함에 있어서, 본 발명과 관련된 공지기술에 대한 구체적인 설명이 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우에는 그 상세한 설명을 생략하기로 한다. 그리고, 후술되는 용어들은 본 발명에서의 기능을 고려하여 정의된 용어들로서 이는 사용자, 운용자의 의도 또는 관례 등에 따라 달라질 수 있다. 그러므로 그 정의는 본 명세서 전반에 걸친 내용을 토대로 내려져야 할 것이다. 상세한 설명에서 사용되는 용어는 단지 본 발명의 실시 예들을 기술하기 위한 것이며, 결코 제한적이어서는 안 된다. 명확하게 달리 사용되지 않는 한, 단수 형태의 표현은 복수 형태의 의미를 포함한다. 본 설명에서, "포함" 또는 "구비"와 같은 표현은 어떤 특성들, 숫자들, 단계들, 동작들, 요소들, 이들의 일부 또는 조합을 가리키기 위한 것이며, 기술된 것 이외에 하나 또는 그 이상의 다른 특성, 숫자, 단계, 동작, 요소, 이들의 일부 또는 조합의 존재 또는 가능성을 배제하도록 해석되어서는 안 된다. DETAILED DESCRIPTION OF THE PREFERRED EMBODIMENTS Hereinafter, exemplary embodiments of the present invention will be described in detail with reference to the accompanying drawings. In the following description, well-known functions or constructions are not described in detail since they would obscure the invention in unnecessary detail. The following terms are defined in consideration of the functions of the present invention, and may be changed according to the intention or custom of the user, the operator, and the like. Therefore, the definition should be based on the contents throughout this specification. The terms used in the detailed description are intended only to describe embodiments of the invention and should in no way be limiting. Unless specifically stated otherwise, the singular form of a term includes plural forms of meaning. In this description, the expressions "comprising" or "comprising" are intended to indicate certain features, numbers, steps, operations, elements, parts or combinations thereof, Should not be construed to preclude the presence or possibility of other features, numbers, steps, operations, elements, portions or combinations thereof.
또한, 제1, 제2 등의 용어는 다양한 구성요소들을 설명하는데 사용될 수 있지만, 상기 구성요소들은 상기 용어들에 의해 한정되는 것은 아니며, 상기 용어들은 하나의 구성요소를 다른 구성요소로부터 구별하는 목적으로만 사용된다.It is also to be understood that the terms first, second, etc. may be used to describe various components, but the components are not limited by the terms, and the terms may be used to distinguish one component from another .
아래에서는, 본 발명의 일 실시예에 따른 매니지드 서비스에서 고객망에 대한 관리 방법, 장치 및 컴퓨터 프로그램에 대한 예시적인 실시 형태들을 첨부된 도면을 참조하여 자세히 설명한다.Hereinafter, exemplary embodiments of a management method, apparatus, and computer program for a customer network in a managed service according to an exemplary embodiment of the present invention will be described in detail with reference to the accompanying drawings.
먼저, 본 발명과 관련하여 매니지드 서비스에 대하여 간략하게 설명한 후, 본 발명에 대하여 구체적으로 살핀다.First, the managed service will be briefly described with reference to the present invention, and then the present invention will be specifically discussed.
우선, 매니지드 서비스란 IT 자원이나 서비스 운영과 관리를 제삼자에게 대행하도록 하는 서비스를 말하며, 매니지드 서비스 제공자는 고객의 네트워크와 시스템을 지속적으로 모니터링하면서 장애가 발생하면 직접 출동하거나 온라인 상에어 상기 장애에 대응하여 문제를 해결하는 등 체계적으로 고객망을 운영 관리하거나 유지 보수하는 서비스를 말한다.First, managed service refers to a service that allows third parties to operate and manage IT resources and services. Managed service providers continuously monitor the customer's network and system, And to solve problems and manage the customer network systematically to maintain or maintenance services.
?즉, 매니지드 서비스는 기업 등에서 사용하는 서버 등 하드웨어와 네트워크 등 각종 시스템을 관리해 주는 서비스로서, 주로 통신 사업자가 통신 서비스의 제공과 함께 메니지드 서비스를 제공하는 경우가 많다. 다시 말해서, 매니지드 서비스는 네트워크 및 시스템 등의 운용 관리를 대행하는 서비스이므로, 네트워크 운용 관리(NMS), 시스템 운용 관리(SMS) 등의 기능을 포함하는 서비스를 제공하게 된다.In other words, managed service is a service that manages various systems such as hardware and network such as servers used by companies, and telecommunication service providers often provide managed services with communication services. In other words, since the managed service is a service for managing the operation of the network and the system, the managed service provides the service including the functions of the network operation management (NMS) and the system operation management (SMS).
예를 들어, 도 1에서 볼 수 있는 바와 같이 매니지드 서비스의 제공 환경은 다수의 독립적인 고객망(300)이 매니지드 서비스 제공자의 매니지드 서비스망(200)에 연동되어 있는 구조를 가질 수 있다.For example, as shown in FIG. 1, the managed service providing environment may have a structure in which a plurality of
보다 구체적으로, 매니지드 서비스 시스템은 고객망(300)은 전송, IP, 보안, 교환, 무선, 서버 등의 다양한 기능을 구현하는 장치들로 이루어질 수 있으며, 매니지드 서비스 제공자는 상기 고객망(300)에 대한 매니지드 서비스 관리를 위하여, 매니지드 서비스용 서버(100)를 구비하게 되며, 상기 매니지드 서비스 시스템은 매니지드 서비스망(200)을 포함하는 전체 네트워크를 운용하는 네트워크 운용 관리 시스템들과 연동될 수도 있다.More specifically, the managed service system may include devices that implement various functions such as transmission, IP, security, exchange, wireless, server, etc., and the managed service provider may be connected to the
그런데, 종래에는 고객망(300)을 관리함에 있어서, 네트워크 관리, 서버 관리, 보안 관리 등 개별 매니지드 서비스 별로 나뉘어 개별적 시스템으로 운용됨으로써 효율성이 떨어지는 문제가 있었다.Conventionally, in managing the
예를 들어, 매니지드 서비스는 네트워크를 기반으로 하는 서비스로서, 매니지드 서비스 제공자의 네트워크 정보에 기반한 고객망-사업자망-고객망의 E2E 장애 및 성능 관리가 필요하다. 그런데, 종래에는 이를 구현하기 위하여 통신 네트워크에 대한 네트워크 운용 관리 시스템(NMS)과 매니지드 서비스 제공을 위한 개별 서버 간의 중복적인 연동이 필요하였고, 이에 따라 리소스의 낭비를 초래할 뿐만 아니라 정확한 장애 진단이 어려워지는 문제점도 따르게 되었다.For example, a managed service is a network-based service that requires E2E failure and performance management of a customer network-provider network-customer network based on network information of a managed service provider. Conventionally, in order to realize this, a redundant interworking between a network operation management system (NMS) for a communication network and a separate server for providing a managed service is required, which causes waste of resources and makes it difficult to diagnose a fault accurately Problems also followed.
이에 대하여, 최근 서비스 환경의 변화와 운용비 절감 등 효율성 개선 요구 등으로 인하여, 네트워크, 서버, 보안 등 여러 도메인을 통합 제공하여 그 효율을 높이고자 하는 시도가 있으나, 이러한 환경에서는 각 도메인에서 발생되는 다양한 장애 등 이벤트들에 대한 상관성 분석이 요구된다. In recent years, attempts have been made to integrate various domains such as network, server, and security to improve efficiency by changing the service environment and reducing the operating cost. However, in such environments, Correlation analysis for events such as failure is required.
즉, 종래에는 개별 네트워크 운용 관리 시스템(NMS), 서버 운용 관리 시스템 (SMS) 등에서 개별적으로 각 도메인에서의 장애 등 이벤트를 처리하였던 반면, 통합 환경에서는 중복으로 발생하게 되는 다양한 장애 등 이벤트를 상호간의 상관성 분석을 통하여 (하나의) 근원 이벤트로서 파악하여 처리하는 것이 바람직하다.In other words, conventionally, individual network operation management system (NMS) and server operation management system (SMS) individually processed events such as failures in each domain. On the other hand, in the integrated environment, It is desirable to identify and process (one) source events through correlation analysis.
또한, 매니지드 서비스에서는 고객망(300) 등에서 발생하는 장애의 신속한 처리가 중요한 바, 고객이 서비스 오류 등으로 인한 장애 발생을 인지하고 이에 대한 해결을 요구하면, 매니지드 서비스 제공자는 이에 대한 원인을 신속하게 분석하고 이에 대한 대응 조치를 고객에게 제공하여야 한다. 이를 위하여 고객망(300)에서 발생되는 장애에 대하여, 매니지드 서비스 제공자는 장애 발생을 신속하게 감지할 수 있는 수단이 필요하며, 또한 장애 원인의 파악 및 이에 대한 조치를 신속하게 도출하기 위하여 상기 고객망(300)의 운용 로그 등 운용 데이터를 상시적으로 수집하는 것이 보다 바람직하게 된다.In addition, in the managed service, it is important to quickly deal with a failure occurring in the
이에 대하여, 본 발명의 일 실시예에 따른 매니지드 서비스에서 고객망에 대한 관리 방법, 장치 및 컴퓨터 프로그램에서는 매니지드 서비스 제공자가 고객망(300)에 대한 품질 관리 및 장애 예측 등을 통해 아래에서 설명하는 바와 같이 효과적으로 고객망을 관리할 수 있게 된다.On the other hand, in the management method, apparatus, and computer program for the customer network in the managed service according to the embodiment of the present invention, the managed service provider performs the quality management and the failure prediction for the
보다 구체적으로, 도 2에서는 본 발명의 일 실시예에 따른 매니지드 서비스에서의 고객망에 대한 관리 방법의 순서도를 도시하고 있다. 도 2에서 볼 수 있는 바와 같이, 본 발명의 일 실시예에 따른 매니지드 서비스에서의 고객망에 대한 관리 방법은, 서버(100)가 상기 각 고객망(300)에 대한 품질, 성능, 장애를 평가하기 위한 운용 관리 데이터를 수집하는 데이터 수집 단계(S110), 상기 운용 관리 데이터를 이용하여, 미리 정해진 제1 기준치를 충족하는 각 고객망(300)에 대한 품질 문제 이벤트의 발생 내역을 산출하고, 미리 정해진 제2 기준치를 충족하는 각 고객망(300)에 대한 성능 문제 이벤트의 발생 내역을 산출하며, 미리 정해진 제3 기준치를 충족하는 각 고객망(300)에 대한 장애 문제 이벤트의 발생 내역을 산출하는 고객망 분석 단계 (S120) 및 상기 각 고객망(300)에 대한 품질 문제 이벤트, 성능 문제 이벤트 및 장애 문제 이벤트의 발생 내역을 고려하여 상기 복수의 고객망(300) 중 우선 관리가 필요한 고객망(300)을 선정하는 우선 관리 고객망 선정 단계(S130) 를 포함할 수 있다.More specifically, FIG. 2 illustrates a flowchart of a method for managing a customer network in a managed service according to an exemplary embodiment of the present invention. 2, a method for managing a customer network in a managed service according to an exemplary embodiment of the present invention is a method in which a
나아가, 상기 상기 고객망 분석 단계(S120)에서는, 상기 복수의 고객망(300)에 대한 품질 문제 이벤트 발생 내역을 기준으로 제1 고객망 그룹을 선정한 후, 상기 제1 고객망 그룹에 대하여 성능 문제 이벤트 발생 내역을 산출하고, 이어서, 상기 제1 고객망 그룹 중에서 상기 성능 문제 이벤트 발생 내역을 기준으로 제2 고객망 그룹을 선정한 후, 상기 제2 고객망 그룹에 대하여 성능 문제 이벤트 발생 내역을 산출함으로써, 상기 복수의 고객망(300) 중 우선 관리가 필요한 고객망(300)을 선정할 수도 있다.In addition, in the customer network analysis step (S120), a first customer network group is selected based on the quality problem event occurrence history of the plurality of customer networks (300), and a performance problem And then selects a second customer network group based on the performance problem event occurrence history among the first customer network groups and then calculates a performance problem event occurrence history for the second customer network group
또한, 상기 고객망 분석 단계(S120)에서는, 각 고객망(300)에 대하여 상기 품질 문제 이벤트, 성능 문제 이벤트, 장애 문제 이벤트가 소정의 단위 시간당 발생하는 빈도를 산출하는 방식으로 각 고객망(300)에 대한 분석을 수행할 수도 있으며, 이를 통하여 각 도메인(예를 들어 품질, 성능, 장애 등) 별로 이벤트를 수집하여 정량적으로 통계치를 산출하고 보다 정확하게 처리할 수 있게 된다.In the customer network analysis step S120, each
나아가, 상기 우선 관리 고객망 선정 단계(S150)에서는 동일한 원인에 의하여 상기 각 품질 문제 이벤트, 성능 문제 이벤트, 장애 문제 이벤트가 중복 발생되는 경우를 고려하여, 상기 복수의 고객망(300) 중 우선 관리가 필요한 고객망(300)을 선정할 수도 있다. 즉, 종래에는 각 도메인(예를 들어 품질, 성능, 장애 등) 별로 개별적으로 관리를 수행하는 경우 하나의 원인에 의한 각 도메인별 이벤트를 중복적으로 처리하였던 것에 반하여, 본 발명에서는 각 도메인에서 감지된 복수의 이벤트를 상호간의 상관성 분석을 통하여 (하나의) 근원 이벤트로서 파악하여 처리함으로써, 보다 정확하고 효율적으로 이벤트를 처리할 수 있게 된다.In addition, in the step S150 of selecting the preferred management customer network, considering the case where each of the quality problem event, the performance problem event, and the failure problem event is duplicated due to the same cause, It is also possible to select a
또한, 상기 우선 관리 고객망 선정 단계(S150)에서는 상기 각 고객망(300)의 규모를 고려하거나, 상기 품질 이벤트, 성능 이벤트, 장애 이벤트 중 주로 발생한 이벤트 종류를 고려하여 상기 복수의 고객망(300) 중 우선 관리가 필요한 고객망을 선정할 수도 있다.In the priority management customer network selection step S150, the size of each
보다 구체적으로, 도 3에서는 본 발명의 일 실시예에 따른 매니지드 서비스에서의 고객망에 대한 관리 시스템의 기능별 블록도를 도시하고 있다. 상기 매니지드 서비스에서의 고객망에 대한 관리 시스템은 하나의 서버(100)로 구현될 수도 있으나, 본 발명이 반드시 이에 한정되는 것은 아니며 이외에 복수의 서버 및 장비들을 포함하여 구성되는 등 다양한 방법으로 구현될 수 있다.More specifically, FIG. 3 is a functional block diagram of a management system for a customer network in a managed service according to an exemplary embodiment of the present invention. The management system for the customer network in the managed service may be implemented by one
도 3에서 볼 수 있는 바와 같이, 본 발명의 일 실시예에 따른 매니지드 서비스에서의 고객망에 대한 관리 시스템은, 복수의 고객망(300)의 장비들을 실시간으로 모니터링하여 각 고객망(300)에 대한 운용 관리 데이터를 수집하는 데이터 수집부(110), 상기 운용 관리 데이터를 처리하여 각 고객망(300)에 대한 품질, 성능, 장애 관련 이벤트 발생 내역을 산출하는 고객망 분석부(120) 및 상기 각 고객망(300)에 대한 이벤트 발생 내역을 고려하여 상기 복수의 고객망(300) 중 우선 관리가 필요한 고객망(300)을 선정하는 우선 관리 고객망 선정부(130) 등을 포함하여 구성될 수 있다. As shown in FIG. 3, the management system for the customer network in the managed service according to the embodiment of the present invention monitors the devices of the plurality of
아래에서는 본 발명의 일 실시예에 따른 매니지드 서비스에서의 고객망에 대한 관리 시스템(100)의 구성 및 동작을 각 구성 요소별로 나누어 보다 자세하게 살핀다.Hereinafter, the configuration and operation of the
먼저, 데이터 수집부(110)에서는 각 고객망(300)의 서버, 프로세스, 네트워크 장비 등 리소스에 대한 주기적인 모니터링을 통해 각 고객망(300)에 대한 품질, 성능, 장애를 평가하기 위한 운용 관리 데이터를 수집할 수 있다. 수집 방법으로서는 SNMP(simple network management protocol) 폴링(Polling), 시스템 로그(Syslog) 데이터 수집, CLI(Command Line Interface)를 이용한 데이터 수집 등 다양한 방법이 사용될 수 있다. First, the
보다 구체적으로, 도 3에서 상기 데이터 수집부(110) 중 구성 수집/제어 모듈(111)은 각 서버, 프로세스, 네트워크 장비 등 리소스별 구성 정보에 대한 데이터를 수집하거나 각 리소스에 대한 설정의 변경 등을 수행할 수 있다.3, the configuration collection /
또한, 상기 데이터 수집부(110) 중 장애 수집 모듈(112)은 각 장비별로 운용상에 발생되는 각종 에러 정보 등 장애와 관련된 정보를 수집한다.In addition, the fault collection module 112 of the
예를 들어, 다음과 같은 경우 에러 정보를 수집할 수 있다.For example, you can collect error information in the following cases:
(1) 핑 테스트(ping test) : (연속 3회 시행하여) 핑 테스트 후 응답없이 요청 시간이 만료되는 경우(1) Ping test: (3 consecutive times) When the request time expires without response after ping test
(2) SNMP Trap 수집 : 네트워크 장비, 서버, 프로세스의 과부하/다운 정보 수집(2) SNMP Trap collection: Collecting overload / down information of network equipment, server, and process
(3) 시스템 로그(Syslog) 원격 수집 : 네트워크 장비, 서버, 프로세스의 과부하/다운 정보 수집(3) System log (Syslog) Remote collection: Overload / down information collection of network equipment, server, and process
또한, 상기 데이터 수집부(110) 중 로그 및 보안 수집 모듈(113)은 각 장비별로 운용상에 발생되는 로그 등을 SNMP Trap, 시스템 로그(Syslog), log 파일, 보안 이벤트 등을 수집할 수 있으며, 또한, 미리 지정된 특정 서버의 장애와 보안에 관련된 로그 패턴 값에 해당되는 내용을 수집할 수도 있다.In addition, the log and security collection module 113 of the
또한, 상기 데이터 수집부(110) 중 성능/품질 수집 모듈(114)에서는, 각 장비의 운용상에 CPU, 메모리(Memory), Disk 등 저장장치의 이용 정보 및 트래픽 정보 등의 성능 정보를 주기적으로 수집할 수 있다.The performance /
예를 들어, 다음과 같은 방법으로 성능 정보를 수집할 수 있다.For example, you can collect performance information in the following ways:
(1) 핑 테스트(Ping test) 의 응답 시간(Response time) 이 임계치 이상인 경우(1) When the response time of the ping test is equal to or more than the threshold value
(2) 네트워크 장비에 대한 CPU, Memory 이용량에 대한 정보를 수집(2) Collect information about CPU and memory usage for network equipment
(3) 서버에 대한 CPU, Memory, Disk 이용량에 대한 정보를 수집(3) Collect information about CPU, Memory, Disk usage for server
또한, 상기 성능/품질 수집 모듈(114)에서는 각 장비의 지연 시간(Delay), 지터(jitter), 손실(loss), 응답 시간(Response Time) 등의 품질 정보도 주기적으로 수집할 수 있다.In addition, the performance /
예를 들어, 다음과 같은 방법으로 품질 정보를 수집할 수 있다.For example, you can collect quality information in the following ways:
(1) 테스트 파일(Test file)의 다운로드 시간(또는 bps) 측정(1) Measuring download time (or bps) of test file (test file)
(2) 핑 테스트(Ping test)에서의 지연(delay), 지터(jitter), 손실(loss) 측정(2) Measurement of delay, jitter, and loss in the ping test
(3) 서버의 경우 WAS(Web application server), DB의 응답 시간(response time) 측정(3) Measuring response time of WAS (Web application server) and DB in case of server
(4) 프로세스의 경우 특정 프로세스의 응답 시간(Response time) 측정(4) Measuring the response time of a specific process in the case of a process
또한, 상기 데이터 수집부(110) 중 장애 및 로그 데이터 정규화 모듈(115) 및 성능 및 품질 데이터 정규화 모듈(116)은 수집된 원본(RAW) 데이터를 1차 처리하는 기능 모듈로서, 중복 데이터를 걸러내고 표준 형식의 이벤트 포맷으로 변환하여 전달하는 기능을 수행한다.In addition, the failure and log data normalization module 115 and the performance and quality data normalization module 116 of the
다음으로, 고객망 분석부(120)에서는 상기 데이터 수집부(110)에서 수집된 각 고객망(300)에 대한 운용 관리 데이터를 처리하여 각 고객망(300)에 대한 품질, 성능, 장애 관련 이벤트 발생 내역을 산출하게 된다.Next, the customer
보다 구체적으로, 상기 고객망 분석부(120) 중 품질 데이터 처리 모듈(121)은 상기 데이터 수집부(110)에서 수집된 네트워크, 서버, 프로세스에 관련된 품질 정보를 포함하는 운용 관리 정보를 소정의 시간 단위로 처리하게 된다. 이때, 상기 소정의 시간 단위는 관리자가 설정 가능하며, 예를 들어 5분 단위로 설정할 수 있다.More specifically, the quality
보다 구체적으로, 상기 품질 데이터 처리 모듈(121)에서는 미리 정해진 제1 기준치를 충족하는 각 고객망(300)에서의 품질 문제 이벤트 발생 내역을 산출하게 된다. 예를 들어, 상기 품질 데이터 처리 모듈(121)에서는 사용자의 서비스 요구에 대한 시간 지연(delay)가 미리 정해진 시간(예를 들어, 1초)이상인 경우 이를 품질 문제 이벤트로 산출하여 이에 대한 발생 내역을 기록하게 된다. 나아가, 상기 시간 지연(delay) 외에도 다운로드 시간, 지터(jitter), 패킷 손실(loss) 등 고객망(300)의 품질에 대한 다양한 항목들이 사용될 수 있다.More specifically, the quality
이어서, 성능 데이터 처리 모듈(122)은 상기 데이터 수집부(110)에서 수집된 네트워크, 서버, 프로세스 등에 관련된 성능 정보를 포함하는 운용 관리 정보를 소정의 시간 단위로 처리하게 된다.Then, the performance
보다 구체적으로, 상기 성능 데이터 처리 모듈(122)에서는 미리 정해진 제2 기준치를 충족하는 각 고객망(300)에서의 성능 문제 이벤트 발생 내역을 산출하게 된다. 예를 들어, 상기 성능 데이터 처리 모듈(122)에서는 고객망(300)에서 사용되는 서버나 네트워크 장비 등에서의 CPU 이용률(%)가 미리 정해진 기준치(예를 들어, 50%)이상인 경우 이를 성능 문제 이벤트로 산출하여 이에 대한 발생 내역을 기록하게 된다. 나아가, 상기 CPU 이용률 외에도 메모리 이용률, 디스크 여유율 등 고객망(300)의 성능을 반영하는 다양한 항목들이 사용될 수 있다.More specifically, the performance
또한, 장애 데이터 처리 모듈(123)은 상기 데이터 수집부(110)에서 수집된 네트워크, 서버, 프로세스 등에 관련된 장애 정보를 포함하는 운용 관리 정보를 소정의 시간 단위로 처리하게 된다.In addition, the failure
보다 구체적으로, 상기 장애 데이터 처리 모듈(123)에서는 미리 정해진 제3 기준치를 충족하는 각 고객망(300)에서의 장애 문제 이벤트 발생 내역을 산출하게 된다. 예를 들어, 상기 장애 데이터 처리 모듈(123)에서는 고객망(300)에서 사용되는 서버나 네트워크 장비 등에서 발생하는 SNMP Trap 이벤트가 미리 정해진 기준치(예를 들어, 10분에 5회 이상) 이상인 경우 이를 성능 문제 이벤트로 산출하여 이에 대한 발생 내역을 기록하게 된다. 나아가, 상기 SNMP Trap 이벤트 외에도 미리 등록된 Syslog 이벤트 등 고객망(300)의 장애 상태를 반영하는 다양한 항목들이 사용될 수 있다.More specifically, the failure
이에 따라, 관제 서비스 모듈(미도시)에서는 사용자 인터페이스 화면을 통하여 사용자 및 관리자에 대한 장애 알람을 통보하며 그 세부 내용을 확인할 수 있도록 실시간으로 데이터를 처리하여 제공할 수 있다. 이때, 네트워크, 서버, 프로세스의 장애 처리를 별도로 처리할 수 있다. Accordingly, the control service module (not shown) notifies the user and the manager of the failure alarm through the user interface screen, and can process and provide data in real time so that details of the alarm can be confirmed. At this time, failure handling of the network, server, and process can be handled separately.
또한, 통계 모듈(미도시)은 통계 데이터 생성 모듈로서 고객별로 장애/성능/품질/보안 분야의 통계 데이터를 이용하여 분석 결과를 생성, 제공할 수 있다.In addition, the statistical module (not shown) is a statistical data generation module, and it can generate and provide analysis results using statistical data in the field of failure / performance / quality / security for each customer.
다음으로, 우선 관리 고객망 선정부(130)에서는 매니지드 서비스 운용 상에 발생하는 품질/성능/장애 등에 대한 운용 관리 정보를 기반으로 각 고객망(300)에 대한 품질 및 성능을 분석하고 장애 발생 가능성이 있는 고객망(300)을 선별하게 된다.Next, the priority management customer
통상적으로 서버 등 장비가 정지되거나, 포트가 정지되는 등의 경우에는 서비스가 정지되는 긴급 상황으로서 관제 서비스 모듈(미도시)에서 신속히 장애 알람을 고객에게 통보하여 조치를 취하게 되지만, 네트워크 공사나 서버의 증설과 같은 특별한 상황 없이 서비스를 이용하던 고객에게 장애가 발생하는 경우에는 고객망(300)의 장비 등에 과부하가 걸리거나 성능이 저하되고, 이러한 현상이 반복되면서 시스템 로그 등에서 장애 관련 이벤트가 다수 발생하게 된다. In a case where a device such as a server is stopped or a port is shut down, the service service module (not shown) promptly notifies the customer of the failure alarm as an emergency situation in which the service is stopped. However, If a failure occurs in a customer who uses the service without special circumstances such as the expansion of the
본 발명에서는 상기와 같은 장애 발생의 징조를 시스템적으로 감지하고, 나아가 상기 장애 발생과 관련한 정보를 분석하여 제공함으로써, 선제적으로 고객망(300)에서의 장애 발생을 방지할 수 있도록 사전에 조치를 취할 수 있게 된다. 나아가, 본 발명에서는 소정의 기간을 설정하여 장애 발생 위험도를 기준으로 정렬하여 위험도가 높은 상위의 고객망(300)을 제시하는 기능을 포함할 수 있다. In the present invention, systematic detection of the occurrence of the above-mentioned failure, and analysis and provision of information related to the occurrence of the failure, . In addition, the present invention may include a function of presenting an upper-
보다 구체적으로, 상기 우선 관리 고객망 선정부(130)에서는 크게 품질 분석, 성능 분석, 장애 분석 등을 고려하여 우선 관리가 필요한 고객망(300)을 선정할 수 있다. 즉, 고객이 이용하는 서비스의 품질(예를 들어, 고객망(300)에서 구동되는 서버 등 장비의 반응 속도)이 저하되는 경우, 이는 관련 리소스(예를 들어, 상기 고객망(300)에서 구동되는 서버의 CPU나 메모리 등)의 성능에 문제가 있어 발생할 수 있으며, 이러한 성능 상의 문제가 지속이 되면 장애와 연관된 이벤트(예를 들어, SNMP Trap 이벤트)가 발생하면서 상기 이벤트가 누적되면서 시스템의 정지와 같은 심각한 문제가 초래될 수 있다. More specifically, in the preferred management customer
이에 대하여, 본 발명에서는 아래와 같은 일련의 과정을 통하여 각 고객망(300)에 대한 장애 발생 가능성을 예측함으로써 선제적으로 각 고객망(300)에 대한 품질을 개선하고 장애 발생을 효과적으로 억제할 수 있게 된다.On the other hand, in the present invention, the quality of each
(1단계) 먼저, 상기 우선 관리 고객망 선정부(130) 중 품질 분석 모듈(132)에서는 품질이 저하된 고객망(300)들을 선정하여 그 리스트를 생성하게 된다. 이를 위하여, 품질 분석 모듈(132)에서는 각 고객망(300)별 품질 관련 정보를 데이터베이스 등에서 읽어 올 수 있다. 이때, 상기 품질 관련 정보는 미리 설정된 소정의 기간에 해당하는 정보가 사용될 수 있다. (예를 들어, 1일/1주일/1개월 등)(Step 1) First, the quality analysis module 132 of the preferred management customer
이에 따라, 상기 품질 분석 모듈(132)에서는 상기 소정의 기간 동안에 발생한 품질 문제 이벤트 횟수를 기준으로 고객망(300)을 정렬하여 상위(Top N)의 고객망 리스트를 선정하게 된다. 이때, 다음과 같은 이벤트들을 고려할 수 있다.Accordingly, the quality analysis module 132 selects the top N customer network list by sorting the
(1) 다운로드 시간이 소정의 임계치(NN 초) 이상인 고객 사이트 → 네트워크 품질 저하(1) A customer site whose download time is above a predetermined threshold (NN seconds)
(2) 지연(Delay) 시간이 소정의 임계치(NN 초) 이상인 고객 사이트 → 네트워크 품질 저하(2) a customer site whose delay time is equal to or greater than a predetermined threshold value (NN seconds)
(3) 지터(Jitter) 시간이 소정의 임계치(NN 초) 이상인 고객 사이트 → 네트워크 품질 저하(3) A customer site whose jitter time is equal to or greater than a predetermined threshold value (NN seconds)
(4) 손실(Loss) 패킷 수가 소정의 임계치 이상인 고객 사이트 → 네트워크 품질 저하(4) Loss (loss) The number of packets is lower than a predetermined threshold.
(5) WAS, DB의 응답 시간(Response time)이 소정의 임계치(MM 초) 이상인 고객 사이트 → 서버 품질 저하(5) The customer site whose response time of the WAS and DB is equal to or greater than the predetermined threshold value (MM seconds)
(6) 등록된 특정 서버의 응답 시간(Response time)이 소정의 임계치(MM 초) 이상인 고객 사이트 → 프로세스 품질 저하(6) A customer site whose response time of a specific registered server is equal to or greater than a predetermined threshold value (MM seconds)
(2단계) 상기 우선 관리 고객망 선정부(130) 중 성능 분석 모듈(133)에서는 성능이 저하된 고객망(300)들을 선정하여 그 리스트를 생성하게 된다.(Step 2) The performance analysis module 133 of the preferred management customer
즉, 성능 저하가 지속되면 장애로 이어질 가능성이 높아지는 바, 이때 고객망(300)에 대하여 소정의 기간 동안에 발생한 네트워크/서버 등 리소스의 성능 관련 정보가 임계치 이상인 성능 문제 이벤트 횟수를 기준으로 각 고객망(300)을 정렬하여 상위 고객망(300)의 리스트(Top N)를 선정하게 된다. 이때, 다음과 같은 항목들을 고려할 수 있다.That is, if the performance deterioration continues, the likelihood of a failure may increase. At this time, based on the number of performance problem events in which performance related information of a resource such as a network / server generated during a predetermined period is not less than a threshold value, (Top N) of the
(1) CPU 평균 이용율 : 소정의 임계치(N%) 이상, (1) CPU average utilization rate: a predetermined threshold value (N%) or more,
(2) 메모리 평균 이용율 : 소정의 임계치(M%) 이상(2) Memory average utilization rate: a predetermined threshold value (M%) or more
(3) 디스크 여유율 : 소정의 임계치(K%) 이하(3) Disk margin rate: Not more than a predetermined threshold value (K%)
또한, 상기 소정의 기간 동안에 네트워크/서버 등 리소스의 성능 측정 정보의 최대값 및 지속 시간을 기준으로 상위 고객망(300)의 리스트(Top N)를 선정할 수도 있다. 이때, 다음과 같은 항목들이 고려될 수 있다.In addition, the list (Top N) of the
(1) CPU 최대 이용율이 소정의 임계치(AA) 이상인 상태가 소정의 지속시간(BB) 이상(1) When the state in which the CPU maximum utilization rate is equal to or greater than the predetermined threshold value (AA) is equal to or longer than the predetermined duration time (BB)
(2) 메모리 최대 이용율이 소정의 임계치(AA) 이상인 상태가 소정의 지속시간(BB) 이상(2) When the state in which the maximum memory utilization rate of the memory is equal to or greater than the predetermined threshold value (AA)
또한, 상기 소정의 기간 동안에 장비에 대한 성능 측정 정보의 편차를 기준으로 상위(Top N)의 고객망 리스트를 선정할 수도 있다. 이때, 다음과 같은 항목들을 고려할 수 있다.Also, it is possible to select the top N customer network list based on the deviation of the performance measurement information on the equipment during the predetermined period. At this time, the following items can be considered.
(1) CPU 최대 이용율이 소정의 임계치(AA) 이상인 상태가 소정의 지속시간(BB) 이상(1) When the state in which the CPU maximum utilization rate is equal to or greater than the predetermined threshold value (AA) is equal to or longer than the predetermined duration time (BB)
(2) 메모리 최대 이용율이 소정의 임계치(AA) 이상인 상태가 소정의 지속시간(BB) 이상(2) When the state in which the maximum memory utilization rate of the memory is equal to or greater than the predetermined threshold value (AA)
또한, 상기 소정의 기간 동안에 장비에 대한 평균 성능 측정 정보의 편차를 기준으로 상위 고객망(300)의 리스트(Top N)를 선정할 수도 있다. 이때, 다음과 같은 항목들을 고려할 수 있다.Also, a list (Top N) of the
(1) 부하 분산이 잘못되어 있거나, 유휴 장비가 존재하는 고객망(1) A customer whose load distribution is wrong or idle equipment exists
(2) CPU 이용율 편차값이 소정의 임계치(AA) 이상인 이벤트가 소정의 임계치(BB) 횟수 이상(2) When an event whose CPU utilization rate deviation value is equal to or greater than a predetermined threshold value (AA) exceeds a predetermined threshold value (BB)
(3) 메모리 이용율 편차값이 소정의 임계치(AA) 이상인 이벤트가 소정의 임계치(BB) 횟수 이상(3) If the event in which the memory utilization rate deviation value is equal to or greater than the predetermined threshold value (AA) exceeds the predetermined threshold value (BB)
(4) 디스트 이용률 편차값이 소정의 임계치(CC) 이상의 이벤트가 소정의 기준지(DD) 횟수 이상(4) If an event whose deviation rate utilization rate value exceeds a predetermined threshold value (CC) exceeds a predetermined reference value (DD) number of times
또한, 상기 소정의 기간 동안에 네트워크 및 서버의 대역폭(Bandwidth) 이용율을 기준으로 상위 고객망(300)의 리스트(Top N)를 선정할 수 있다. 이때, 다음과 같은 항목들을 고려할 수 있다.In addition, the list (Top N) of the
(1) 회선의 대역폭 대비 평균 이용율(예를 들어, bps)이 소정의 임계치 이상인 네트워크 부하가 높은 고객망(1) A customer network having a high network load with an average utilization rate (for example, bps)
(2) 회선의 대역폭 대비 평균 이용율(예를 들어, pps)이 소정의 임계치 이상인 네트워크 부하가 높은 고객망(2) a customer network having a high network load with an average utilization rate (e.g., pps)
(3) Bps (초당 바이트 수) 변화량이 임계치 이상(3) Bps (bytes per second) change exceeds threshold
(4) Pps (초당 패킷 수) 변화량이 임계치 이상(4) Pps (packets per second) change exceeds threshold
(5) 대역폭 대비 Bps 최대값이 소정의 임계치(AA) 이상인 상태가 소정의 지속시간(BB) 이상인 네트워크 부하가 높은 고객망(5) A client network having a high network load with a state in which the maximum value of Bps in terms of bandwidth is equal to or greater than a predetermined threshold value (AA)
(6) 대역폭 대비 pps 최대값이 소정의 임계치(AA) 이상인 상태가 소정의 지속시간(BB) 이상 인 네트워크 부하가 높은 고객망(6) A customer network having a high network load with a state in which the maximum value of the pps in bandwidth is equal to or greater than a predetermined threshold value (AA)
(7) 특정 서버의 네트워크 포트에 급격한 트래픽 증가를 일으키는 고객망(7) A customer network that causes a sudden increase in traffic on the network port of a specific server
(3단계) 상기 우선 관리 고객망 선정부(130) 중 장애 분석 모듈(134)에서는 수집된 장애 문제 이벤트를 기반으로 장애 발생 가능성이 높은 고객망(300)의 리스트를 생성하게 된다. (Step 3) The failure analysis module 134 of the priority management customer
장애 문제 이벤트가 지속되면 시스템의 정지 등 심각한 문제를 초래할 수 있는 바, 상기 소정의 기간에 대하여 네트워크/서버 등 리소스에서의 장애 문제 이벤트 횟수 등을 기준으로 상위 고객망(300)의 리스트(Top N)를 선정할 수 있다. 이때, 다음과 같은 항목들을 고려할 수 있다. If the failure trouble event is continued, it can cause a serious problem such as a system shutdown. Therefore, the list of the top customer network 300 (Top N ) Can be selected. At this time, the following items can be considered.
(1) 등록된 프로파일에 해당되는 SNMP Trap 이벤트가 소정의 임계치 이상 발생(1) An SNMP Trap event corresponding to the registered profile exceeds a predetermined threshold value
(2) 등록된 프로파일에 해당되는 Syslog 이벤트가 소정의 임계치 이상 발생(2) Syslog event corresponding to the registered profile exceeds a predetermined threshold value
(3) 등록된 서버 장애 프로파일에 해당되는 직접 수집 log 이벤트가 소정의 임계치 이상 발생 (DB, WAS)(3) A direct collection log event corresponding to the registered server failure profile exceeds a predetermined threshold value (DB, WAS)
(4) 등록된 프로세스 장애 프로파일에 해당되는 직접 수집 log 이벤트가 소정의 임계치 이상 발생(4) The direct acquisition log event corresponding to the registered process failure profile exceeds a predetermined threshold value
또한, 매니지드 서비스 제공자의 서비스 서버 (DNS, DHCP, AAA 등 )에서 장애를 일으킨 주소(IP)를 사용하고 있는 고객망(300)으로서, 장비 및 단말의 mis-configure 가 많은 고객망(300)을 선정할 수도 있다.Also, as a
또한, 보안 침해의 대상으로 의심이 되는 고객망(300)을 선정할 수도 있다. 이때, 다음과 같은 항목들을 고려할 수 있다.In addition, the
(1) 매니지드 서비스 제공자의 보안 관리 시스템에서 보안 침해의 이벤트가 발생한 주소(IP)를 사용하고 있는 고객망 → 심각한 보안 사고의 가능성이 존재(1) A customer using an address (IP) where a security breach event occurred in a managed service provider's security management system → Possibility of a serious security incident
(2) 내부 방화벽(Firewall)에서 발생하는 장애 이벤트 수가 소저의 임계치 이상인 고객망(사이트 규모별로 임계치는 달리 설정 가능)(2) The customer network whose number of failure events occurring in the internal firewall (Firewall) exceeds the threshold of the threshold (different thresholds can be set for each site size)
(3) 운용 서버의 로그에서 보안 이벤트 수가 소정의 임계치 이상인 고객망 (특정 주소(IP) 또는 불특정 주소(IP) 등에서 접근 시도 또는 실패가 급속히 증가하는 경우 등)(3) In the log of the operation server, when the number of security events in the customer network (the access attempt or failure rapidly increases at a specific address (IP) or unspecified address (IP), etc.)
또한, 상기 우선 관리 고객망 선정부(130) 중 임계치 및 설정관리 모듈(131)은 분석에 사용되는 각종 임계치를 관리하고, 분석 동작을 제어하게 된다. 즉, 품질, 성능, 장애 분석을 위한 임계치 설정, 변경하거나 삭제할 수 있다. The threshold and setting management module 131 of the preferred management customer
또한, 상기 임계치 및 설정관리 모듈(131)은 다음과 같이 분석 프로파일 관리 및 설정을 할 수 있다. Also, the threshold and setting management module 131 can perform analysis profile management and setting as follows.
(1) 1단계 품질 분석 결과 리스트 N 선정(1)
(2) 2단계 성능 분석 결과 리스트 M 선정(2) List M of 2nd step performance analysis result
(3) 3단계 장애 분석 결과 리스트 O 선정(3) List of three stages failure analysis result list
(4) 1단계의 리스트 N은 적정한 Pool을 확보할 수 있도록 설정(4) The list N in the first step is set so that a proper pool can be secured
(5) 2단계에서 선정된 M이 N의 2배 이상으로 아니면, 2단계에서는 전수 조사 가능(5) If the M selected in
(6) 3단계에서 선정된 O가 소정의 임계치(AA) 보다 작으며 전수 조사 가능(6) O in
(7) 최종적으로 AA 건의 리스트와 관련 정보를 리포트 모듈(135)로 전달하여, 고객별 분석 서비스 결과 리포트를 생성하여 저장(7) Finally, the AA list and related information are transmitted to the report module 135 to generate and store an analysis result report for each customer
또한, 우선 관리 고객망 선정부(130) 중 리포트 모듈(135)은 상기 임계치 및 설정관리 모듈(131)에서 설정한 상위(Top) AA 건에 대한 고객별 분석 결과를 데이터베이스(DB)에 저장하고, 리포트를 생성하게 된다.The report module 135 of the preferred management customer
도 4에서는 본 발명의 일 실시예에 따른 매니지드 서비스에서의 고객망에 대한 관리 시스템에서의 분석 분야(도메인)별 상관도 및 중요 분석 분야 선정을 설명하고 있다. FIG. 4 illustrates the correlation and critical analysis field selection in the management system for the customer network in the managed service according to an exemplary embodiment of the present invention.
앞서 살핀 바와 같이 본 발명의 일 실시예에 따른 매니지드 서비스에서의 고객망에 대한 관리 시스템에서, 품질 문제 이벤트, 성능 문제 이벤트, 장애 문제 이벤트 간의 상관도를 반영하여 각 고객망(300)에 대한 장애 발생 가능성을 산정함으로써, 종래 각 도메인(예를 들어 품질, 성능, 장애 등) 별로 개별적으로 관리를 수행하는 경우 하나의 문제에 대해서 복수의 도메인에서 별도의 이벤트로 중복적으로 처리되었던 것에 반하여, 본 발명에서는 각 도메인에서 감지된 복수의 이벤트를 상호간의 상관성 분석을 통하여 (하나의) 근원 이벤트로서 파악하여 처리함으로써, 보다 정확하고 효율적으로 이벤트를 처리할 수 있게 된다.As described above, in the management system for the customer network in the managed service according to the embodiment of the present invention, the degree of correlation between the quality problem event, the performance problem event, In the case where management is separately performed for each domain (for example, quality, performance, failure, and the like) by estimating the probability of occurrence, a single problem is duplicated in a plurality of domains as a separate event, According to the present invention, a plurality of events detected in each domain are identified and processed as (one) source events through mutual correlation analysis, thereby enabling to process events more accurately and efficiently.
이에 따라, 본 발명에서는 상기 품질 문제 이벤트, 성능 문제 이벤트, 장애 문제 이벤트 간의 상관도를 산출하고 이를 반영하여 각 고객망(300)에 대한 장애 발생 가능성을 산정할 수 있다. 이때, 상기 품질 이벤트, 성능 이벤트, 장애 이벤트 간의 상관도를 산출함에 있어서, 상기 품질 문제 이벤트, 성능 문제 이벤트, 장애 문제 이벤트 간의 상관도를 적절하게 산출할 수 있는 방법이라면 특별한 제한없이 적용될 수 있다.Accordingly, in the present invention, it is possible to calculate the degree of correlation between the quality problem event, the performance problem event, and the failure problem event, and to reflect the probability of occurrence of the fault occurrence for each
그런데, 본 발명에서는 방대한 분량의 이벤트 정보를 처리하여야 하는 바, 이에 대한 상관도를 산출하기 위하여 많은 전산 자원(computing resource)가 소요될 수 있다는 문제가 따른다.However, in the present invention, a large amount of event information must be processed, and a large amount of computing resources may be required to calculate the degree of correlation.
이에 대하여, 본 발명의 일 실시예로서 각 단위 시간 별로 각 품질 문제 이벤트, 성능 문제 이벤트, 장애 문제 이벤트가 중복 감지되는 경우, 상기 각 품질 문제 이벤트, 성능 문제 이벤트, 장애 문제 이벤트가 상관 관계를 가진다고 판단하여 처리할 수도 있다.On the other hand, when each quality problem event, performance problem event, and failure problem event are duplicatedly detected for each unit time according to an embodiment of the present invention, each of the quality problem event, performance problem event, and failure problem event has a correlation It can be judged and processed.
보다 구체적으로, 도 4에서 볼 수 있는 바와 같이 10:10 단위 시간에서는 품질 문제 이벤트와 성능 문제 이벤트가 발생한 바, 이에 대해서는 상관 계수를 2로 산정할 수 있으며, 10:15 단위 시간에서는 품질 문제 이벤트, 성능 문제 이벤트 및 장애 문제 이벤트가 발생한 바, 이에 대해서는 상관 계수를 3으로 산정할 수 있다. 이에 따라, 도 4의 경우에 상관도는 상기 각 상관 계수의 합으로써 5가 될 수 있다.More specifically, as shown in FIG. 4, when a quality problem event and a performance problem event occur at a unit time of 10:10, a correlation coefficient can be calculated to be 2, and at 10:15 unit time, , A performance problem event and a failure problem event are generated, and the correlation coefficient can be calculated to be 3. Accordingly, in the case of FIG. 4, the correlation may be 5 as the sum of the correlation coefficients.
또한, 도 4에서 품질 문제 이벤트는 총 3회 발생하였고, 성능 문제 이벤트는 총 9회 발생하였으며, 장애 문제 이벤트는 총 2회 발생한 바, 각 이벤트의 발생 회수를 소정의 임계치와 대비하여 각 분야별 심각도를 산정할 수 있으며, 나아가 가장 관심을 가져야 할(dominant) 중요 분석 분야를 선정할 수도 있다.(예를 들어, 도 4에서 성능 분야)In FIG. 4, the quality problem event occurred three times in total, the performance problem event occurred nine times in total, and the trouble problem event occurred twice in total, and the number of times of occurrence of each event was compared with a predetermined threshold, , And may even select the dominant critical areas of analysis (for example, the performance field in Figure 4).
또한, 도 5에서는 본 발명의 일 실시예에 따른 매니지드 서비스에서의 고객망(300)을 관리하기 위한 서버(100)의 구성도를 도시하고 있다. 도 5에서 볼 수 있는 바와 같이 본 발명의 일 실시예에 따른 매니지드 서비스에서의 고객망(300)을 관리하기 위한 서버(100)는, 데이터 수집부(110), 고객망 분석부(120) 및 우선 관리 고객망 선정부(130)를 포함하여 구성될 수 있다.5 is a block diagram of a
본 발명의 일 실시예에 따른 매니지드 서비스에서의 고객망(300)을 관리하기 위한 서버(300)는 앞서 살핀 매니지드 서비스에서의 고객망(300)을 관리하는 방법에 대한 설명을 참조할 수 있는 바, 아래에서는 다소 간략한 설명으로 갈음한다.The
먼저, 데이터 수집부(110)에서는 상기 복수의 각 고객망에 대한 품질, 성능, 장애를 평가하기 위한 운용 관리 데이터를 수집하여 제공하게 된다.First, the
또한, 고객망 분석부(120)에서는 상기 운용 관리 데이터를 이용하여, 미리 정해진 제1 기준치를 충족하는 각 고객망(300)에 대한 품질 문제 이벤트의 발생 내역을 산출하고, 미리 정해진 제2 기준치를 충족하는 각 고객망(300)에 대한 성능 문제 이벤트의 발생 내역을 산출하며, 나아가 미리 정해진 제3 기준치를 충족하는 각 고객망(300)에 대한 장애 문제 이벤트의 발생 내역을 산출하게 된다.In addition, the
마지막으로 상기 우선 관리 고객망 선정부(130)에서는 각 고객망(300)에 대한 품질 문제 이벤트, 성능 문제 이벤트 및 장애 문제 이벤트의 발생 내역을 고려하여 상기 복수의 고객망(300) 중 우선 관리가 필요한 고객망(300)을 선정하게 된다.The priority management customer
또한, 도 6에서는 본 발명의 일 실시예에 따른 매니지드 서비스에서의 고객망(300)을 관리하기 위한 서버(100)에서의 우선 관리 고객망 선정 과정에 대한 흐름도를 도시하고 있다. FIG. 6 is a flowchart illustrating a process of selecting a preferred management customer network in the
상기 도 5와 도 6을 참조하여 본 발명의 일 실시예에 따른 매니지드 서비스에서의 고객망(300)을 관리하기 위한 서버(100)에 의한 우선 관리 고객망 선정 과정을 살펴보면 다음과 같다.Referring to FIGS. 5 and 6, a process of selecting a preferred management customer network by the
먼저 매니지스 서비스의 관리자는 고객망(300)의 관리에 사용될 수 있는 다양한 임계치에 대한 프로파일을 설정하고, 분석을 수행할 도메인(IP/전송/서버/전원/BCN(Broadband convergence Network) 등)을 선정할 수 있다. 또한, 서버(100)의 데이터 수집부(110)에서는 각 고객망(300)에 대한 품질, 성능, 장애 평가를 수행하기 위한 운용 관리 데이터를 수집하고, 이에 대한 소정의 처리를 거쳐 산출되는 1차 통계 데이터를 데이터베이스에 저장하게 된다. 또한, 상기 데이터 수집부(110)는 각 고객망(300)에 회선 장애, 장비 구동 정지 등 긴급한 사유가 발생하는 경우 이를 감지하여 실시간으로 관리자 및 고객사 등에 통보할 수도 있다.First, the manager of the manager service sets a profile for various thresholds that can be used for managing the
이어서, 관리자가 하나 이상의 고객망(300)에 대한 장애 발생 가능성 등에 대한 분석을 요청(S210)하면, 품질 데이터 처리 모듈(121)에서는 고객망(300)의 네트워크, 서버, 프로세스 등에 대하여 수집된 품질 데이터를 분석(S220)하여 품질이 저하된 고객망(300)을 산출하고 분석 결과를 저장(S222)한 후, 성능 데이터 처리 모듈(122)로 성능 데이터의 분석을 요청(S224)하게 된다.When the administrator requests the analysis of the possibility of failure or the like of one or
이에 따라, 성능 데이터 처리 모듈(122)에서는 고객망(300)의 네트워크, 서버, 프로세스 등에 대하여 수집된 성능 데이터를 분석(S230)하여 성능이 저하된 고객망(300)을 산출하고 분석 결과를 저장(S232)한 후, 장애 데이터 처리 모듈(123)로 장애 데이터의 분석을 요청(S234)하게 된다.Accordingly, the performance
또한, 장애 데이터 처리 모듈(123)에서는 고객망(300)의 네트워크, 서버, 프로세스 등에 대하여 수집된 장애 데이터를 분석(S240)하여 장애 문제 이벤트가 다수 발생한 고객망(300)을 산출하고 분석 결과를 저장(S242)한 후, 우선 관리 고객망 선정부(130)로 우선적인 관리가 필요한 고객망(300)을 선정할 것을 요청(S244)하게 된다.In addition, the failure
이에 따라, 우선 관리 고객망 선정부(150)에서는 상기 품질 데이터 처리 모듈(121), 성능 데이터 처리 모듈(122), 장애 데이터 처리 모듈(123)에서 산출된 분석 결과를 바탕으로 우선 관리 고객망을 선정하게 되며, 이때 품질 문제 이벤트, 성능 문제 이벤트, 장애 문제 이벤트 간의 상관도를 고려하여 우선 관리 고객망을 선정하거나, 상기 품질 문제 이벤트, 성능 문제 이벤트, 장애 문제 이벤트 중 주로 발생한 이벤트 종류를 고려하여 고객망(300)의 장애 유형을 산출(S250)할 수도 있다.Accordingly, the priority management customer network selection unit 150 selects the priority management customer network based on the analysis results calculated by the quality
이어서, 상기한 일련의 과정을 거쳐 산출된 분석 결과 및 리포트는 관리자나 고객 등에게 제공될 수 있다(S260).Then, the analysis result and the report calculated through the series of processes described above may be provided to an administrator or a customer (S260).
본 발명의 또 다른 측면에 따른 컴퓨터 프로그램은 앞서 기재된 매니지드 서비스에서 고객망(300)에 대한 관리 방법의 각 단계를 컴퓨터에서 실행하기 위하여 컴퓨터로 판독가능한 기록 매체에 기록된 컴퓨터 프로그램인 것을 특징으로 한다. The computer program according to another aspect of the present invention is characterized by being a computer program recorded on a computer-readable recording medium for executing each step of the management method for the
상기 컴퓨터로 판독 가능한 프로그램이 기록된 매체는 프로그램 명령어, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 상기 컴퓨터 판독 가능한 매체에 기록되는 프로그램 명령어는 본 발명을 위하여 특별히 설계되고 구성된 것이거나 컴퓨터 소프트웨어 분야의 통상의 기술자에게 공지되어 사용 가능한 것일 수 있다. 컴퓨터 판독 가능한 기록 매체의 예에는, 하드 디스크, 플로피 디스크 및 자기테이프와 같은 자기 매체, CD-ROM 및 DVD와 같은 광 기록매체, 플롭티컬 디스크(floptical disk)와 같은 자기-광매체(magneto-optical medium) 및 ROM, RAM, 플래시 메모리 등과 같은, 프로그램 명령어를 저장하고 실행하도록 특별히 구성된 하드웨어 장치가 포함되며, PC 등 단말이나 서버 등의 저장 장치에 기록될 수도 있다. 프로그램 명령어의 예에는, 컴파일러에 의하여 만들어지는 것과 같은 기계어코드뿐만 아니라 인터프리터 등을 사용하여 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드도 포함된다. 하드웨어 장치는 본 발명에 따른 처리를 수행하기 위하여 하나 이상의 소프트웨어 모듈로 변경될 수 있으며, 그 역도 마찬가지이다.The medium on which the computer-readable program is recorded may include program commands, data files, data structures, and the like, alone or in combination. The program instructions recorded on the computer readable medium may be those specially designed and constructed for the present invention or may be known and used by those of ordinary skill in the computer software arts. Examples of computer-readable media include magnetic media such as hard disks, floppy disks and magnetic tape, optical recording media such as CD-ROM and DVD, magneto-optical media such as floptical disks, medium, and a hardware device specifically configured to store and execute program instructions, such as ROM, RAM, flash memory, and the like, and may be recorded in a storage device such as a terminal or a server such as a PC. Examples of program instructions include high-level language code that can be executed by a computer using an interpreter, as well as machine accords such as those produced by a compiler. The hardware device may be modified into one or more software modules for performing the processing according to the present invention, and vice versa.
이상의 설명은 본 발명의 기술 사상을 예시적으로 설명한 것에 불과한 것으로서, 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자라면 본 발명의 본질적인 특성에서 벗어나지 않는 범위에서 다양한 수정 및 변형이 가능할 것이다. 따라서 본 발명에 기재된 실시예들은 본 발명의 기술 사상을 한정하기 위한 것이 아니라 설명하기 위한 것이고, 이러한 실시예에 한정되는 것은 아니다. 본 발명의 보호 범위는 아래의 청구범위에 의해서 해석되어야 하며, 그와 동등한 범위 내에 있는 모든 기술 사상은 본 발명의 권리범위에 포함되는 것으로 해석되어야 할 것이다.The foregoing description is merely illustrative of the technical idea of the present invention, and various changes and modifications may be made by those skilled in the art without departing from the essential characteristics of the present invention. Therefore, the embodiments described in the present invention are not intended to limit the technical spirit of the present invention but to illustrate the present invention. The scope of protection of the present invention should be construed according to the following claims, and all technical ideas within the scope of equivalents thereof should be construed as being included in the scope of the present invention.
100 : 서버
110 : 데이터 수집부
111 : 구성 수집/제어 모듈
112 : 장애 수집 모듈
113 : 로그 및 보안 수집 모듈
114 : 성능/품질 수집 모듈
115 : 장애 및 로그 데이터 정규화 모듈
116 : 성능 및 품질 데이터 정규화 모듈
120 : 고객망 분석부
121 : 품질 데이터 처리 모듈
122 : 성능 데이터 처리 모듈
123 : 장애 데이터 처리 모듈
130 : 우선 관리 고객망 선정부
131 : 임계치 및 설정 관리 모듈
132 : 품질 분석 모듈
133 : 성능 분석 모듈
134 : 장애 분석 모듈
135 : 리포트 모듈
200 : 매니지드 서비스망
300 : 고객망100: Server
110: Data collecting unit
111: Configuration acquisition / control module
112: Fault collection module
113: Log and security collection module
114: Performance / quality acquisition module
115: Fault and Log Data Normalization Module
116: Performance and Quality Data Normalization Module
120: Customer Network Analysis Department
121: Quality data processing module
122: performance data processing module
123: Fault data processing module
130: Preferred management customer network selection unit
131: threshold and setting management module
132: Quality analysis module
133: Performance Analysis Module
134: Fault analysis module
135: Report module
200: Managed Services Network
300: customer network
Claims (9)
서버가, 상기 각 고객망에 대한 품질, 성능, 장애를 평가하기 위한 운용 관리 데이터를 수집하는 데이터 수집 단계;
상기 운용 관리 데이터를 이용하여, 미리 정해진 제1 기준치를 충족하는 각 고객망에 대한 품질 문제 이벤트의 발생 내역을 산출하고,
미리 정해진 제2 기준치를 충족하는 각 고객망에 대한 성능 문제 이벤트의 발생 내역을 산출하며,
미리 정해진 제3 기준치를 충족하는 각 고객망에 대한 장애 문제 이벤트의 발생 내역을 산출하는 고객망 분석 단계; 및
상기 각 고객망에 대한 품질 문제 이벤트, 성능 문제 이벤트 및 장애 문제 이벤트의 발생 내역을 고려하여 상기 복수의 고객망 중 우선 관리가 필요한 고객망을 선정하는 우선 관리 고객망 선정 단계;
를 포함하는 것을 특징으로 하는 고객망에 대한 관리 방법.A method for managing a plurality of customer networks in a managed service,
A data collecting step of collecting operational management data for evaluating quality, performance, and faults of each customer network;
A generation history of quality problem events for each customer network satisfying a first predetermined reference value is calculated using the operation management data,
Calculating a history of occurrence of a performance problem event for each customer network satisfying a predetermined second reference value,
A customer network analyzing step of calculating an occurrence history of failure trouble events for each customer network satisfying a predetermined third reference value; And
A priority management customer network selection step of selecting a customer network requiring priority management among the plurality of customer networks considering a history of a quality problem event, a performance problem event and a failure problem event for each customer network;
The method comprising the steps of:
상기 고객망 분석 단계에서는,
상기 복수의 고객망에 대한 품질 문제 이벤트 발생 내역을 기준으로 제1 고객망 그룹을 선정한 후, 상기 제1 고객망 그룹에 대하여 성능 문제 이벤트 발생 내역을 산출하고,
이어서, 상기 제1 고객망 그룹 중에서 상기 성능 문제 이벤트 발생 내역을 기준으로 제2 고객망 그룹을 선정한 후, 상기 제2 고객망 그룹에 대하여 성능 문제 이벤트 발생 내역을 산출하는 것을 특징으로 하는 고객망에 대한 관리 방법.The method according to claim 1,
In the customer network analysis step,
Selecting a first customer network group based on a quality problem event occurrence history of the plurality of customer networks, calculating a performance problem event occurrence history for the first customer network group,
And selecting a second customer network group based on the performance problem event occurrence history among the first customer network groups and calculating a performance problem event occurrence history for the second customer network group. How to manage.
상기 고객망 분석 단계에서는,
각 고객망에 대하여 상기 품질 문제 이벤트, 성능 문제 이벤트, 장애 문제 이벤트가 소정의 단위 시간당 발생하는 빈도를 산출하는 것을 특징으로 하는 고객망에 대한 관리 방법.The method according to claim 1,
In the customer network analysis step,
Wherein the frequency of occurrence of the quality problem event, the performance problem event, and the failure problem event per predetermined unit time is calculated for each customer network.
상기 우선 관리 고객망 선정 단계에서는,
동일한 원인에 의하여 상기 각 품질 문제 이벤트, 성능 문제 이벤트, 장애 문제 이벤트가 중복 발생되는 경우를 고려하여 상기 복수의 고객망 중 우선 관리가 필요한 고객망을 선정하는 것을 특징으로 하는 고객망에 대한 관리 방법.The method according to claim 1,
In the priority management customer network selection step,
And selects a customer network that requires priority management among the plurality of customer networks considering a case where each of the quality problem event, the performance problem event, and the trouble problem event is duplicated due to the same cause .
상기 우선 관리 고객망 선정 단계에서는,
상기 각 고객망의 규모를 고려하여 상기 복수의 고객망 중 우선 관리가 필요한 고객망을 선정하는 것을 특징으로 하는 고객망에 대한 관리 방법.The method according to claim 1,
In the priority management customer network selection step,
And selecting a customer network requiring priority management among the plurality of customer networks in consideration of the size of each customer network.
상기 우선 관리 고객망 선정 단계에서는,
상기 품질 문제 이벤트, 성능 문제 이벤트, 장애 문제 이벤트 중 주로 발생한 이벤트 종류를 고려하여 상기 복수의 고객망 중 우선 관리가 필요한 고객망을 선정하는 것을 특징으로 하는 고객망에 대한 관리 방법.The method according to claim 1,
In the priority management customer network selection step,
And selecting a customer network that requires priority management among the plurality of customer networks in consideration of the types of events mainly occurring among the quality problem event, the performance problem event, and the trouble problem event.
상기 데이터 수집 단계에서는,
상기 복수의 고객망에 대한 운용 관리 데이터를 수집한 후,
상기 미리 정해진 공통 규격의 운용 관리 데이터의 형식으로 변환하는 것을 특징으로 하는 고객망에 대한 관리 방법.The method according to claim 1,
In the data collection step,
Collecting operational management data for the plurality of customer networks,
And converting the data into a format of operation management data of the predetermined common standard.
상기 각 고객망에 대한 품질, 성능, 장애를 평가하기 위한 운용 관리 데이터를 수집하는 데이터 수집부;
상기 운용 관리 데이터를 이용하여, 미리 정해진 제1 기준치를 충족하는 각 고객망에 대한 품질 문제 이벤트의 발생 내역을 산출하고,
미리 정해진 제2 기준치를 충족하는 각 고객망에 대한 성능 문제 이벤트의 발생 내역을 산출하며,
미리 정해진 제3 기준치를 충족하는 각 고객망에 대한 장애 문제 이벤트의 발생 내역을 산출하는 고객망 분석부; 및
상기 각 고객망에 대한 품질 문제 이벤트, 성능 문제 이벤트 및 장애 문제 이벤트의 발생 내역을 고려하여 상기 복수의 고객망 중 우선 관리가 필요한 고객망을 선정하는 우선 관리 고객망 선정부;
를 포함하는 것을 특징으로 하는 서버.1. A server for managing a plurality of customer networks in a managed service,
A data collection unit for collecting operational management data for evaluating quality, performance, and faults of each customer network;
A generation history of quality problem events for each customer network satisfying a first predetermined reference value is calculated using the operation management data,
Calculating a history of occurrence of a performance problem event for each customer network satisfying a predetermined second reference value,
A customer network analysis unit for calculating the occurrence history of the failure problem event for each customer network satisfying a predetermined third reference value; And
A priority management customer network selecting unit for selecting a customer network requiring priority management among the plurality of customer networks considering a history of quality problem events, performance problem events and failure problem events for each customer network;
Lt; / RTI >
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020160084768 | 2016-07-05 | ||
KR20160084768 | 2016-07-05 |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20180005098A true KR20180005098A (en) | 2018-01-15 |
Family
ID=61001386
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020160135720A KR20180005098A (en) | 2016-07-05 | 2016-10-19 | Method, apparatus and computer program for managing client network in managed service |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR20180005098A (en) |
-
2016
- 2016-10-19 KR KR1020160135720A patent/KR20180005098A/en not_active Application Discontinuation
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11805143B2 (en) | Method and system for confident anomaly detection in computer network traffic | |
EP3379419B1 (en) | Situation analysis | |
US11552874B1 (en) | Methods, systems and computer readable media for proactive network testing | |
EP3436951B1 (en) | Systems and methods for measuring effective customer impact of network problems in real-time using streaming analytics | |
US8977886B2 (en) | Method and apparatus for rapid disaster recovery preparation in a cloud network | |
KR100561628B1 (en) | Method for detecting abnormal traffic in network level using statistical analysis | |
JP5877429B2 (en) | Method and apparatus for network analysis | |
US9680722B2 (en) | Method for determining a severity of a network incident | |
US20160087856A1 (en) | Resource Budget Determination for Communications Network | |
US20070168505A1 (en) | Performance monitoring in a network | |
Nguyen et al. | Absence: Usage-based failure detection in mobile networks | |
US9641247B2 (en) | System and method for monitoring unknown resources | |
US20130290224A1 (en) | System or Solution Index Fault - Assessment, Identification, Baseline, and Alarm Feature | |
KR20180005098A (en) | Method, apparatus and computer program for managing client network in managed service | |
US20100153543A1 (en) | Method and System for Intelligent Management of Performance Measurements In Communication Networks | |
AT&T | ||
KR100720285B1 (en) | End to end quality management system and method of wireless internet | |
US11477069B2 (en) | Inserting replay events in network production flows | |
CN115865612B (en) | Network fault processing method and device, storage medium and electronic equipment | |
Jain et al. | Application-layer QOS metrics to aid network performance monitoring and diagnostics for encrypted traffic | |
Chang et al. | Integrated monitoring mechanism to enhance the management of value-added services in mobile communication network | |
Yang et al. | A QoS Approach for Detecting and Managing a Fault Alarm Storm | |
Aravantinos et al. | An approach to a methodology and implementation of a Network Monitoring Analysis Tool | |
Lowman | Central issues in network management | |
Marukatat et al. | Applying C4. 5 Classification To The Monitoring Of Network Device Connectivity |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E601 | Decision to refuse application |