KR20120093545A - 소프트웨어 오류 실시간 모니터링 시스템 - Google Patents

소프트웨어 오류 실시간 모니터링 시스템 Download PDF

Info

Publication number
KR20120093545A
KR20120093545A KR1020110013172A KR20110013172A KR20120093545A KR 20120093545 A KR20120093545 A KR 20120093545A KR 1020110013172 A KR1020110013172 A KR 1020110013172A KR 20110013172 A KR20110013172 A KR 20110013172A KR 20120093545 A KR20120093545 A KR 20120093545A
Authority
KR
South Korea
Prior art keywords
error
module
software
errors
real
Prior art date
Application number
KR1020110013172A
Other languages
English (en)
Inventor
최용수
Original Assignee
(주)아이비데이타
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by (주)아이비데이타 filed Critical (주)아이비데이타
Priority to KR1020110013172A priority Critical patent/KR20120093545A/ko
Publication of KR20120093545A publication Critical patent/KR20120093545A/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/36Preventing errors by testing or debugging software

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Hardware Design (AREA)
  • Debugging And Monitoring (AREA)

Abstract

본 발명은 소프트웨어에서 발생되는 다양한 오류를 실시간으로 검출, 기록, 통지, 분석할 수 있는 실시간 오류모니터링 시스템에 관한 것으로 소프트웨어 사용시 발생된 오류를 실시간으로 수집하는 오류수집모듈과; 상기 오류수집모듈에서 수집된 오류를 날짜별, 시스템별, 개발자별로 분석하는 오류분석모듈과; 상기 오류분석모듈에서 분석된 오류를 발생 일시별, 위치별, 사용자 정보별로 기록하는 오류기록모듈과; 상기 오류기록모듈에 기록된 오류를 불러들여 이를 차트를 통해 제공하는 오류현황제공모듈과; 상기 오류현황제공모듈에서 제공되는 오류현황을 사용자와 시스템 개발자에게 실시간으로 제공하는 오류통지모듈로 구성된 것을 특징으로 한 소프트웨어 오류 실시간 모니터링 시스템을 구성상의 특징으로 한다.
상기한 구성의 본 발명은 소프트웨어의 사용시 발생되는 오류의 현황, 오류의 분석, 실시간 통지, 오류를 기록할 수 있으므로 사용자의 불만을 최소화할 수 있는 장점이 있다.

Description

소프트웨어 오류 실시간 모니터링 시스템{Real Time Monitoring System Error In Software}
본 발명은 소프트웨어에서 발생되는 다양한 오류를 실시간으로 검출, 기록, 통지, 분석할 수 있는 실시간오류모니터링 시스템에 관한 것이다.
일반적으로 소프트웨어나 프로그램을 사용하다보면 다양한 오류가 발생된다. 소프트웨어 오류(software fault)가 발생하는 주요 원인은 0으로 나누기와 같은 논리적 실수이거나, 예기치 않은 조건에 대한 미처리 등으로 잘못된 메모리 주소를 참조하여 발생한다.
이러한 소프트웨어 오류는 개발과정에서, 선택적으로 실시하는 일반적인 시험과정을 통해서 모두 찾아내기가 힘들며, 소프트웨어는 논리적으로 완벽성을 주장할 수 없는 경우가 대부분이기 때문에 근본적으로 해결하기 어렵다.
따라서, 소프트웨어 오류에 대한 문제는 완벽하게 해결하기 힘들다는 가정하에, 직접적인 오류를 일으킨 일부 서비스를 중단 혹은 중단 후 복구하는 것을 허용하되, 전체 서비스를 중단하지 않도록 하는 방안이 요구되고 있다.
종래의 소프트웨어 오류 처리 방법은, 프로세스 처리에 필요한 별도의 가상환경(Sandbox)을 만들어 그 속에서 처리된 결과가 지정된 영역 이외의 다른 영역에 영향을 주지 않도록 처리 결과를 감시한다.
이러한 종래의 오류 처리 방법은, 오류의 가능성이 있는 많은 서비스(기능)를 감시하고 그 결과를 검사해야 하므로, 상당한 오버헤드를 발생시켜 사실상 처리성능을 떨어뜨리는 문제점이 있다.
특히, 종래의 오류 처리 방법은 어플리케이션의 각 부분 기능을 복구하는 것이 아니라, 전체 어플리케이션이나 시스템 전체를 복구하는 단점이 있다.
특히 다중처리기(multi-processor) 및 다중코어(multi-core)와 같은 하드웨어 수준의 동시 처리(concurrent processing) 기술이 발달함에 따라 이를 효율적으로 활용하기 위해, 다중 스레드(multi-thread)를 이용한 소프트웨어의 개발이 점차 늘어나고 있다.
다중 스레드를 기반으로 개발된 소프트웨어는 프로세스의 동시 처리에 있어서, 운영체제로부터 독립된 관리를 받는 프로세스(process) 기반의 소프트웨어보다 처리기를 효율적으로 제어하지만, 개별 스레드에서 발생하는 오류로 인하여 전체 어플리케이션의 동작이 중단되는 심각한 문제를 유발한다.
특히, 이러한 문제가 다수의 클라이언트를 대상으로 서비스하는 서버 어플리케이션에서 발생했을 경우, 서비스 중단이라는 문제가 야기되어 서비스 이용자와 이를 제공하는 사업자에게 막대한 손실을 유발한다.
상기한 문제를 해결하기 위하여 제안된 기술로는 공개특허공보 10-2007-0062445을 들 수 있는데, 이것은
동작하고 있는 스레드 및 해당 스레드가 점유하고 있는 자원 정보를 관리하는 단계; 소프트웨어 오류가 발생함에 따라 해당 스레드 및 오류의 종류를 검출한 후 해당 스레드의 아이디를 이용하여 점유하고 있는 자원 정보를 확인하는 단계; 오류가 발생한 해당 스레드를 작업자 리스트에서 삭제하고 점유하고 있는 자원의 종류에 상응하는 함수를 이용하여 해당 스레드의 자원을 회수하는 단계; 및 오류가 발생한 해당 스레드를 종료하는 단계를 포함하여 실시간으로 소프트웨어의 오류를 검출하는 방법에 관한 것이다.
상기한 문헌은 오류가 발생했을 시 오류가 유발된 특정 클라이언트나 기능에 대해서만 서비스를 중단하고 전체 기능에 영향을 주지 않고 계속 서비스할 수 있도록 함으로써, 오류가 발생했을 당시의 자원의 사용현황을 알 수 있기 때문에 문제의 원인파악이 용이할 뿐만 아니라, 서비스를 중단시키지 않고 시간적 여유를 두고 장애에 대처할 수 있는 이점이 있다.
그러나 상기문헌 또한 소프트웨어 사용시 발생되는 오류의 현황, 오류의 분석, 실시간 통지, 오류를 기록, 수정할 수 있는 전반적인 오류처방 시스템이라고 보기에는 그 기능상에 미흡한 점이 많다. 아직까지 실시간으로 소프트웨어의 오류 발생을 확인하여 이를 통지하는 시스템에 대해서는 공지된 기술이 없다.
공개특허공보 10-2007-0062445
없음
본 발명에서는 소프트웨어 사용시 발생되는 오류의 현황, 오류의 분석, 실시간 통지, 오류를 기록할 수 있는 전반적인 오류처방 시스템을 제공하고자 한다.
상기한 과제를 해결하기 위하여 본 발명은
소프트웨어 사용시 발생된 오류를 감지하여 이를 실시간으로 수집하는 오류수집모듈과;
상기 오류수집모듈에서 수집된 오류를 실시간으로 제어하는 오류제어 시스템으로 구성되며,
상기 오류제어 시스템은
상기 오류수집모듈에서 수집된 오류를 날짜별, 시스템별, 개발자별로 분석하는 오류분석모듈과;
상기 오류분석모듈에서 분석된 오류를 발생 일시별, 위치별, 사용자 정보별로 기록하는 오류기록모듈과;
상기 오류기록모듈에 기록된 오류를 불러들여 이를 차트를 통해 제공하는 오류현황제공모듈과;
상기 오류현황제공모듈에서 제공되는 오류현황을 사용자와 시스템 개발자에게 실시간으로 제공하는 오류통지모듈;
로 구성된 것을 특징으로 한 소프트웨어 오류 실시간 모니터링 시스템으로 구성된 것을 특징으로 한다.
본 발명의 소프트웨어 오류 실시간 모니터링 시스템은 소프트웨어 사용시 발생되는 오류의 현황, 오류의 분석, 실시간 통지, 오류를 기록할 수 있으므로 사용자의 불만을 최소화할 수 있고,
오류를 수정하는 시간과 비용을 최소화시킬 수 있는 장점이 있다.
도 1은 본 발명의 시스템 개념도를 나타내는 도면이다.
도 2는 본 발명의 시스템을 이용한 소프트웨어 사용시 오류가 검출되는 과정을 나타내는 도면이다.
도 3은 본 발명의 오류수집모듈에서 수집된 오류가 표시되는 형태를 나타내는 도면이다.
도 4는 본 발명의 오류현황제공모듈에서 제공되는 오류현황을 나타내는 도면이다.
도 5는 본 발명의 오류통지모듈에서 사용자에게 제공되는 오류현황을 나타내는 도면이다.
이하 첨부된 도면을 바탕으로 본 발명을 더욱 상세히 설명한다. 도 1은 본 발명의 시스템 개념도를 나타내는 데, 도시된 바와 같이 본 발명은 오류수집모듈과; 오류제어 시스템으로 구성된다.
본 발명의 오류제어 시스템은 오류분석모듈과; 오류기록모듈과; 오류현황제공모듈과; 오류통지모듈;로 구성된다.
상기 오류수집모듈은 소프트웨어 사용시 발생된 오류를 감지하여 이를 실시간으로 수집한다.
상기 오류분석모듈은 상기 오류수집모듈에서 수집된 오류를 날짜별, 시스템별, 개발자별로 분석한다.
상기 오류기록모듈은 상기 오류분석모듈에서 분석된 오류를 발생 일시별, 위치별, 사용자 정보별로 기록한다.
상기 오류현황제공모듈은 상기 오류기록모듈에 기록된 오류를 불러들여 이를 차트를 통해 제공한다.
상기 오류통지모듈은 상기 오류현황제공모듈에서 제공되는 오류현황을 사용자와 시스템 개발자에게 실시간으로 제공한다.
이하 본 발명의 소프트웨어 오류 실시간 모니터링 시스템의 작동과정을 더욱 상세히 설명한다.
소프트웨어의 사용시 발생되는 오류는 프로그램 디버깅 작업 중이나 원래 설계 중에 밝혀지지 않은 일련의 조건이 발생하여 처리과정 중 실패를 유발하는 것으로 분류될 수 있다. 이 중에서 논리(소스코드) 오류, 데이터 오류, 시스템 오류는 대체로 사용자가 이를 적극적으로 발견하고 대처하지 않으면 파악되지 않는 경우가 많다. 본원 발명은 이러한 문제점을 해결하기 위하여 창안된 것으로 소프트웨어 사용시 발생되는 오류를 자동으로 감지하여 이를 통보할 수 있도록 구성된다.
도 2는 본 발명의 시스템을 이용한 소프트웨어 사용시 오류가 검출되는 과정을 나타내는 도면이다. 도시된 바와 같이 소프트웨어 사용시 발생되는 오류는 최상위 객체에 오류를 감지하는 메소드를 구현하고 하위 객체의 메소드에서 오류가 발생되면 이를 전달함으로써 감지된다. 이렇게 감지된 오류는 오류수집모듈로 전송되는 데, 여기에는 전술한 바와 같은 데이터 오류, 소스코드 오류, 시스템 오류 및 사용자 오류, 기타 오류 등이 포함될 수 있다.
도 3은 본 발명의 오류수집모듈에서 수집된 오류가 표시되는 형태를 나타낸다. 수집된 오류는 오류가 발생된 시스템, 사용자ID, 처리 담당자 등으로 구분될 수 있다. 오류가 발생된 시스템이란 작업과정을 말하는 것으로 인사관리, 재무관리, 자재관리 등 전산화할 수 있는 업무라면 어떤 것이든지 이에 해당될 수 있다. 상기 시스템에서 발생된 오류는 주로 데이터를 입력할 때 발생된다. 그러나 반드시 이에 한정되는 것은 아니다.
도 3에는 발생된 오류의 형태와 처리를 위한 방법이 구체적으로 나타나 있다. 발생된 오류를 클릭하면 하단부에 이에 대한 상세정보가 디스플레이되는 데, 여기에도 오류의 발생된 시스템, 사용자ID, 처리 담당자가 제시된다. 뿐만 아니라 오류의 명확한 메시지와 오류의 상세한 내용이 제시되고 오류를 발생시킨 사용자에 대한 연락처 등이 나타나기 때문에 처리 담당자가 신속하게 오류를 수정할 수 있다.
도 4는 본 발명의 오류현황제공모듈에서 제공되는 오류현황을 나타내는 도면이다. 발생된 오류는 도시된 바와 같이 오류현황제공모듈에서 시간별, 유형별, 시스템별로 구분된다. 시간별은 시간, 일(DAY), 주, 월, 년도별로 세팅할 수 있고, 유형별은 오류가 발생되는 유형 즉, 데이터 입력상의 오류, 소스코드상의 오류, 사용자의 업무처리 미숙에 따른 오류, 시스템상의 근본적인 오류 등으로 구분된다. 또한 시스템별은 해당 업무별로 구분되는 데, 여기에는 급여관리, 연구관리, 재무관리, 학사관리 등이 포함될 수 있다.
도 5는 본 발명의 오류통지모듈에서 사용자에게 제공되는 오류현황을 나타내는 도면이다. 상기 오류수집모듈에서 수집된 오류는 도 5에 표시된 형태로 사용자에게 제공되므로 사용자는 신속하게 오류의 발생사실을 통지받고 이를 수정할 수 있는 것이다.
없음.

Claims (1)

  1. 소프트웨어 사용시 발생된 오류를 감지하여 이를 실시간으로 수집하는 오류수집모듈과;
    상기 오류수집모듈에서 수집된 오류를 실시간으로 제어하는 오류제어 시스템으로 구성되며,
    상기 오류제어 시스템은
    상기 오류수집모듈에서 수집된 오류를 날짜별, 시스템별, 개발자별로 분석하는 오류분석모듈과;
    상기 오류분석모듈에서 분석된 오류를 발생 일시별, 위치별, 사용자 정보별로 기록하는 오류기록모듈과;
    상기 오류기록모듈에 기록된 오류를 불러들여 이를 차트를 통해 제공하는 오류현황제공모듈과;
    상기 오류현황제공모듈에서 제공되는 오류현황을 사용자와 시스템 개발자에게 실시간으로 제공하는 오류통지모듈;로 구성된 것을 특징으로 한 소프트웨어 오류 실시간 모니터링 시스템
KR1020110013172A 2011-02-15 2011-02-15 소프트웨어 오류 실시간 모니터링 시스템 KR20120093545A (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020110013172A KR20120093545A (ko) 2011-02-15 2011-02-15 소프트웨어 오류 실시간 모니터링 시스템

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020110013172A KR20120093545A (ko) 2011-02-15 2011-02-15 소프트웨어 오류 실시간 모니터링 시스템

Publications (1)

Publication Number Publication Date
KR20120093545A true KR20120093545A (ko) 2012-08-23

Family

ID=46884922

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020110013172A KR20120093545A (ko) 2011-02-15 2011-02-15 소프트웨어 오류 실시간 모니터링 시스템

Country Status (1)

Country Link
KR (1) KR20120093545A (ko)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101376726B1 (ko) * 2013-10-30 2014-04-01 주식회사 이글루시큐리티 전산시스템의 업무프로세스 감시장치
KR20140050333A (ko) * 2012-10-19 2014-04-29 에스케이플래닛 주식회사 크래시 로그 리포트 제어를 위한 시스템 및 방법
KR20170010148A (ko) * 2015-07-15 2017-01-26 주식회사 넥슨코리아 유저의 게시물 및 크래시 기반 버그감시방법, 버그감시장치 및 버그감시시스템
CN111193609A (zh) * 2019-11-20 2020-05-22 腾讯科技(深圳)有限公司 应用异常的反馈方法、装置及应用异常的监控系统
KR20220053170A (ko) * 2020-10-22 2022-04-29 주식회사 제이엘유 Ict 기반의 미용제품 관리장치

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20140050333A (ko) * 2012-10-19 2014-04-29 에스케이플래닛 주식회사 크래시 로그 리포트 제어를 위한 시스템 및 방법
KR101376726B1 (ko) * 2013-10-30 2014-04-01 주식회사 이글루시큐리티 전산시스템의 업무프로세스 감시장치
KR20170010148A (ko) * 2015-07-15 2017-01-26 주식회사 넥슨코리아 유저의 게시물 및 크래시 기반 버그감시방법, 버그감시장치 및 버그감시시스템
CN111193609A (zh) * 2019-11-20 2020-05-22 腾讯科技(深圳)有限公司 应用异常的反馈方法、装置及应用异常的监控系统
CN111193609B (zh) * 2019-11-20 2021-09-28 腾讯科技(深圳)有限公司 应用异常的反馈方法、装置及应用异常的监控系统
KR20220053170A (ko) * 2020-10-22 2022-04-29 주식회사 제이엘유 Ict 기반의 미용제품 관리장치

Similar Documents

Publication Publication Date Title
US8949671B2 (en) Fault detection, diagnosis, and prevention for complex computing systems
US7856575B2 (en) Collaborative troubleshooting computer systems using fault tree analysis
CN100498725C (zh) 用于最小化计算机应用程序中的丢失的方法和系统
CN111538634B (zh) 计算系统、方法及存储介质
US7254750B1 (en) Health trend analysis method on utilization of network resources
JP5267736B2 (ja) 障害検出装置、障害検出方法およびプログラム記録媒体
US9292402B2 (en) Autonomous service management
US20130185021A1 (en) Automated Performance Data Management and Collection
KR20120093545A (ko) 소프트웨어 오류 실시간 모니터링 시스템
US20170169342A1 (en) System and method for diagnosing at least one component requiring maintenance in an appliance and/or installation
KR20190021560A (ko) 빅데이터를 활용한 고장예지보전시스템 및 고장예지보전방법
JP4819014B2 (ja) ログ解析方法、ログ格納装置及びプログラム
US20180173583A1 (en) Systems and methods for real time computer fault evaluation
JP2011154526A (ja) 取引処理装置の予防保守システム及び予防保守サーバ
CN102521098A (zh) Cpu死机监控的处理方法和装置
Zabardast et al. Refactoring, bug fixing, and new development effect on technical debt: An industrial case study
Ghaleb et al. Studying the impact of noises in build breakage data
US20130091391A1 (en) User-coordinated resource recovery
US20130232192A1 (en) Operations task management system and method
CN114416826A (zh) 一种设备点检数据统计方法、分析方法及计算机存储介质
US11782753B2 (en) Node-local-unscheduler for scheduling remediation
Yan et al. Aegis: Attribution of control plane change impact across layers and components for cloud systems
EP2495660A1 (en) Information processing device and method for controlling information processing device
JP2009205208A (ja) 運用管理装置、運用管理方法ならびにプログラム
US20110145652A1 (en) Computer-Implemented Systems And Methods For An Automated Application Interface

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E601 Decision to refuse application