KR20170002025A - 자동 컴퓨터 시스템 장애 복구와 예방에 대한 방법 및 그 시스템 - Google Patents

자동 컴퓨터 시스템 장애 복구와 예방에 대한 방법 및 그 시스템 Download PDF

Info

Publication number
KR20170002025A
KR20170002025A KR1020150091876A KR20150091876A KR20170002025A KR 20170002025 A KR20170002025 A KR 20170002025A KR 1020150091876 A KR1020150091876 A KR 1020150091876A KR 20150091876 A KR20150091876 A KR 20150091876A KR 20170002025 A KR20170002025 A KR 20170002025A
Authority
KR
South Korea
Prior art keywords
user
computer
abnormal
operating system
pattern
Prior art date
Application number
KR1020150091876A
Other languages
English (en)
Inventor
엄인혁
Original Assignee
엄인혁
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 엄인혁 filed Critical 엄인혁
Priority to KR1020150091876A priority Critical patent/KR20170002025A/ko
Publication of KR20170002025A publication Critical patent/KR20170002025A/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3051Monitoring arrangements for monitoring the configuration of the computing system or of the computing system component, e.g. monitoring the presence of processing resources, peripherals, I/O links, software programs

Abstract

본 발명의 특징에 따르면, 본 발명은 사용자의 운용이 이루어지는 사용자 컴퓨팅 시스템과 그 시스템의 장애 복구 및 예방을 다루는 관제 서버부로 대별될 수 있다. 사용자 컴퓨팅 시스템인 컴퓨터는 다시 시스템이 운용되는 동안 이상이 발생되거나 징후가 발견될 시 관제 서버로 관련 정보를 전송하는 전송부; 현재 시스템의 모든 정보를 내부 저장장치에 저장하는 데이터 저장부로 구분할 수 있으며, 관제 서버부는 다시 시스템에서 전송된 이상이나 징후를 분석하여 패턴을 구성하고 이를 검침하는 이상 패턴 판단부; 구성된 이상 패턴과 사용자 컴퓨팅 시스템의 이상내역을 비교 및 분석하여 컴퓨팅 시스템의 장애를 사전에 방지할 수 있는 장애 예방 모듈부; 사용자 시스템의 모든 정보를 서버의 일정 저장공간에 저장하는 데이터 저장부; 이전에 저장된 정상 상태 데이터를 기반으로 사용자의 컴퓨팅 시스템을 정상 운영 상태로 복구시키는 복구부를 포함한다.

Description

자동 컴퓨터 시스템 장애 복구와 예방에 대한 방법 및 그 시스템{Method for prevention the error recovery in automatic computer system and system thereof}
본 발명은 컴퓨터 장애 자동 복구 시스템에 관한 것으로서, 시스템의 이상 징후가 발생하는 경우 시스템의 판단으로 자동적으로 정상 상태로 복구하는 기능과 지속적으로 수집되는 시스템의 이상 징후 패턴을 통해 장애를 사전에 예방할 수 있는 시스템 및 제공 방법에 관한 것이다.
규모의 경제로 인한 상품가격의 하락 및 개개인의 경제력 향상과 더불어 이루어진 컨텐츠의 증가로 PC의 보급률이 크게 향상되었으며, 이와 같은 PC의 보급 및 교육을 통한 접근성 증대는 다시 관련 컨텐츠 산업의 급성장 및 PC 성능에 대한 지속적인 발전을 이룰 수 있는 원동력이 되었다. 이와 같은 기술의 발전 및 보급으로 인한 긍정적인 부분 이외에, 다양한 업무와 일상을 통해 생활 가까이 들어온 PC는 고장에 대한 대응 능력이 현저히 떨어지며 관련 지식이 부족한 사용자나 노인층의 PC사용을 증대시켜 이와 관련된 사회적 비용을 증대시킴과 동시에 이를 이용한 악덕사후서비스 업체의 증가를 통해 더욱 많은 지출을 만드는 계기가 되었다. 본 발명은 그와 같은 PC 고장에 대한 대응 능력이 부족한 사용자 및 일반 사용자 모두에게 있어 원활한 컴퓨팅 환경에 대한 항상성을 보장할 수 있는 것으로, 자동적으로 사용자 컴퓨팅 디바이스 운영체제의 이상 징후를 파악하여 장애를 복구하거나 사전에 장애를 예방할 수 있는 시스템에 관한 것이다.
기존 사용자는 컴퓨터를 이용하는 도중 이상이 발견되었을 경우, 자체 수리 능력이 있는 사용자의 경우를 제외하고는 컴퓨터 제조사 또는 사설 수리업체에 연락하여 직접 수리기사가 이상 증상을 수리하는 것이 일반적이다. 그러나 이 방법에 있어, 이상 증상을 복구하기까지 소요되는 시간은 수리기사의 현장 방문 또는 PC 사용자의 직접적인 방문과 고장 사항에 대한 수리가 이루어지는 시간으로, 이와 같은 시간과 업무 차질, 초과된 수리 비용에 대한 사회적 비용이 증대되고 있다.
여기서 초과된 수리비용이라 함은 일반적인 사용자들은 구체적인 장애 부분에 대해 인지하기 어렵기 때문에 수리 비용 산정에 관여하지 못하여 과도한 비용 발생에 대한 문제점을 말한다. 또한 최근에 문제시되고 있는 랜섬웨어와 같이 시스템을 망가뜨리는 악성 코드 및 바이러스로부터 사용자 컴퓨팅 시스템의 운영체제를 안전하게 보호하거나 복원시키지 못하는 문제점이 있다.
지속적으로 발현되는 컴퓨터의 이상증상을 초기에 분석하고 고장에 대한 예측을 통해 사전 예방이 가능한 자동 복구 솔루션에 관한 본 발명은, 기존의 대부분의 사용자들이 인지하지 못하고 결국 PC의 심각한 오류로 인한 사회적/경제적 비용 지출을 감행하였던 데 대한 해결책이 될 것이다.
상술한 문제점을 해결하기 위해 도출된 본 발명의 목적은, 사용자 컴퓨팅 시스템의 이상 및 관련 정보를 관제 서버로 전송하고, 사용자 컴퓨팅 시스템의 운영체제 및 운영체제에 포함된 프로그램과 사용자 데이터를 사용자 컴퓨터 및 관제 서버에 안전하게 저장하여 추후 복원에 사용될 수 있도록 하는 것을 제1 목적으로 한다.
관제 서버에서 이상 징후에 따라 시스템 복구를 명령하여 기존에 저장된 사용자 컴퓨터의 운영체제 및 운영체제에 포함된 프로그램과 사용자 데이터를 이용하여 시스템을 장애로부터 복구할 수 있도록 하는 것을 제2 목적으로 한다.
또한 장애가 발생하는 이상 징후에 대한 패턴 분석을 통해 컴퓨터 시스템의 이상을 사전에 알리고 방지할 수 있도록 하는 것을 제3 목적으로 한다.
상술한 과제를 해결하기 위하여, 사용자 PC의 상태를 상시 감시하고 이상 징후가 발현되었을 때 이를 감지하기 위한 방법으로, 사용자 컴퓨터의 운영체제가 판단한 오류 및 이상정보를 포함하여 컴퓨터 시스템의 전기 사용량을 감시하여 사용량이 일정 수준 이상으로 이상한 패턴을 나타내는 경우와 CPU의 사용량이 이상 패턴을 나타내는 경우와, 그래픽 카드의 GPU의 사용량이 이상 패턴을 나타내는 경우와, 컴퓨터 운영 체제의 로그에 장애 코드가 발견되는 경우와, 사용자 컴퓨터 시스템과 연결된 네트워크 사용량이 일정 수준 이상을 초과하는 경우와, 사용자 컴퓨터 시스템의 메모리 사용량이 일정 수준 이상을 초과하는 경우와, 사용자 컴퓨터 시스템에 접속되어 있는 내/외부 입출력 장치들 간에 발생하는 입력 또는 출력 데이터 량이 특정시간 동안 일정수준을 초과하는 경우와, CPU의 온도가 일정 시간 동안 이상 패턴을 나타내는 경우와, 메인 보드의 온도가 일정 시간 동안 이상 패턴을 나타내는 경우와, 그래픽 카드의 GPU의 온도가 일정 시간 동안 이상 패턴을 나타내는 경우를 상시 감시하고 이를 관제센터에 전송하여 분석을 의뢰, 자동적인 시스템 복구를 가능토록 한다.
여기서 관제센터란 사용자 시스템의 이상 및 이상 징후 및 사용자 컴퓨터 시스템을 복구하기 위한 데이터를 받아들이며, 이를 분석 및 저장할 수 있다, 관제센터에 수집되는 사용자 컴퓨터의 이상 내용은 전주기에 걸쳐 패턴화 되며, 다양한 사용자 시스템의 오류와 고장에 대한 축적된 패턴과의 비교를 통해 고장 예측이 가능하다. 이에 관제센터는 실시간 분석 과정을 거쳐 사용자 시스템의 현재 상태를 원격에서 판단할 수 있으며, 이를 복구 또는 수정하기 위한 사용자 컴퓨터 복원 과정을 진행한다. 복원 과정에 있어 사용자 컴퓨터 시스템의 운영체제 및 운영체제에 포함된 프로그램 및 기타 사용자 데이터에 대한 데이터는 사용자 컴퓨터에 직접 저장된 것 또는 관제 서버에 저장된 동일한 내용 일 수 있다. 관제 서버는 이를 이용하여 사용자의 컴퓨팅 시스템을 이상증상 또는 문제가 발생하기 이전 시점으로 복구시킬 수 있다.
이상의 본 발명이 속하는 기술 분야에 대한 통상의 지식을 가진 자는 본 발명이 그 기술적 사상이나 필수적인 특징을 변경하지 않고서 다른 구체적인 형태로 실시될 수 있다는 것을 이해할 수 있을 것이다. 그러므로 이상에서 기술한 실시 예들은 모든 면에서 예시적인 것이며 한정적이 아닌 것으로 이해해야만 한다. 본 발명의 범위는 상기 상세한 설명보다는 후술하는 특허 청구의 범위에 위하여 나타내어지며, 특허 청구 범위의 의미 및 범위 그리고 그 균등 개념으로부터 도출되는 모든 변경 또는 변형된 형태가 본 발명의 범위에 포함되는 것으로 해석되어야 한다.
본 발명에 따르면, 사용자의 컴퓨팅 시스템이 운용되는 동안 시스템의 이상을 관제 센터로 전송하고 관제센터는 이를 바탕으로 한 분석을 통해 패턴 발생 여부를 판단하여 이상 징후가 발견되면 사용자 컴퓨팅 시스템을 이상이 발생하기 이전의 상태로 복원시킬 수 있고, 또한 사용자 컴퓨팅 시스템의 이상 패턴 정보를 저장하는 관제 서버에 의해 지속적인 유지관리가 가능하며, 이전에 저장된 사용자 컴퓨터 내부 또는 관제 서버에 존재하는 정상 상태의 데이터를 기반으로 사용자 컴퓨팅 시스템을 정상 운영 상태로 복구시킬 수 있고, 이와 같은 전반의 기능과 더불어 수집된 이상 상태를 통해 패턴을 검출하여 컴퓨팅 시스템의 장애를 사전에 방지할 수 있는 방법을 제공할 수 있다.
도 1은 발명의 개념을 간략하게 나타낸 구성도
도 2는 본 발명의 일 실시예에 따른 전체 흐름도
도 3은 도1, 도2의 제공장치 구성을 나타낸 블록도
이하, 첨부된 도면들을 참조하여 본 발명에 따른 ~방법 전반의 실시 예를 설명한다. 이 과정에서 도면에 도시된 선들의 두께나 구성요소의 크기 등은 설명의 명료성을 위해 편의상 과장되게 도시되어 있을 수 있다. 또한 사용된 용어들은 본 발명에서의 기능을 고려하여 정의된 용어들로서 이는 사용자, 운용자의 의도 또는 관례에 따라 달라질 수 있다. 그러므로 이러한 용어들에 대한 정의는 본 명세서 전반에 걸친 내용을 토대로 내려져야 할 것이다.
이하 본 발명의 실시예에 대하여 첨부된 도면을 참고로 그 구성 및 작용을 설명하기로 한다.
도 1은 본 발명의 개념을 간략하게 나타낸 구성도이고, 도 2는 본 발명의 일 실시예에 따른 전체 흐름도이며, 도 3은 도1, 도2의 제공장치 구성을 나타낸 블록도이다.

Claims (6)

  1. 사용자의 컴퓨터 시스템에서 운영체제가 구동되는 동안, 컴퓨터 시스템의 전기 사용량이 일정 수준 이상으로 이상한 패턴을 나타내는 경우와; CPU의 사용량이 이상 패턴을 나타내는 경우와; 그래픽 카드의 GPU 사용량이 이상 패턴을 나타내는 경우와; 컴퓨터 운영 체제의 로그에 장애 코드가 발견되는 경우와; 사용자 컴퓨터 시스템과 연결된 네트워크 사용량이 일정 수준 이상을 초과하는 경우와; 사용자 컴퓨터 시스템의 메모리 사용량이 일정 수준 이상을 초과하는 경우와; 사용자 컴퓨터 시스템에 접속되어 있는 외부 입출력 장치들 간에 발생하는 입력 또는 출력 데이터 량이 특정시간 동안 일정수준을 초과하는 경우와; CPU의 온도가 일정 시간 동안 이상 패턴을 나타내는 경우와; 메인 보드의 온도가 일정 시간 동안 이상 패턴을 나타내는 경우와; 그래픽 카드의 GPU 온도가 일정 시간 동안 이상 패턴을 나타내는 경우에 이를 감지하여 운영 체제(Operating System, OS) 및 운영체제에 포함된 모든 설정, 프로그램 및 기 저장된 사용자 데이터를 복제한 후, 복제된 데이터를 내부 시스템의 저장장치 또는 외부 시스템의 저장장치에 시스템이 자동으로 저장하는 방법 및 그 장치.
  2. 상기 청구항 1의 이상 증상이 발견된 경우 또는 컴퓨터 시스템의 사용이 불가능한 경우 이를 관제서버로 전송하는 방법 및 그 장치.
  3. 상기 청구항 1에서 저장하는 사용자 시스템의 운영체제 및 운영체제에 포함된 모든 설정, 프로그램 및 기 저장된 사용자 데이터를 복제함에 있어, 운영체제 및 운영체제에 포함된 모든 설정, 프로그램 이외의 사용자 데이터를 검색하여 이를 별도로 저장하는 방법 및 그 장치.
  4. 상기 청구항 1에 있어 복제된 데이터를 이용하여 사용자의 별도의 행위 없이 시스템이 자동으로 컴퓨터를 정상적으로 사용 가능한 상태로 복원하는 방법 및 그 장치.
  5. 상기 청구항 4에 있어서 시스템이 자동으로 컴퓨터를 정상적으로 사용 가능한 상태로 복구가 실패했을 경우, 상기 청구항 1의 이상정보를 수집하여 자동으로 관제서버로 이상정보를 송신하는 방법 및 그 장치.
  6. 관제서버가, 기 수집된 이상 데이터를 판단하고 이상상태 발생 전 공통패턴을 도출하여 유사패턴 발생 시 장애를 사전에 방지하는 방법 및 그 장치.
KR1020150091876A 2015-06-29 2015-06-29 자동 컴퓨터 시스템 장애 복구와 예방에 대한 방법 및 그 시스템 KR20170002025A (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020150091876A KR20170002025A (ko) 2015-06-29 2015-06-29 자동 컴퓨터 시스템 장애 복구와 예방에 대한 방법 및 그 시스템

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020150091876A KR20170002025A (ko) 2015-06-29 2015-06-29 자동 컴퓨터 시스템 장애 복구와 예방에 대한 방법 및 그 시스템

Publications (1)

Publication Number Publication Date
KR20170002025A true KR20170002025A (ko) 2017-01-06

Family

ID=57832437

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020150091876A KR20170002025A (ko) 2015-06-29 2015-06-29 자동 컴퓨터 시스템 장애 복구와 예방에 대한 방법 및 그 시스템

Country Status (1)

Country Link
KR (1) KR20170002025A (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110513252A (zh) * 2019-08-30 2019-11-29 湘电风能有限公司 一种风电场scada系统数据异常告警修复系统与方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110513252A (zh) * 2019-08-30 2019-11-29 湘电风能有限公司 一种风电场scada系统数据异常告警修复系统与方法

Similar Documents

Publication Publication Date Title
JP6008070B1 (ja) 運用管理装置、運用管理方法、及び、運用管理プログラムが記録された記録媒体
US10462027B2 (en) Cloud network stability
CN102713861B (zh) 操作管理装置、操作管理方法以及程序存储介质
JP6585482B2 (ja) 機器診断装置及びシステム及び方法
CN106789306B (zh) 通信设备软件故障检测收集恢复方法和系统
CN105095001B (zh) 分布式环境下虚拟机异常恢复方法
US8286034B2 (en) Accurate fault status tracking of variable access sensors
CN112685236A (zh) 数据管理系统的双机互备方法及系统
CN109284207A (zh) 硬盘故障处理方法、装置、服务器和计算机可读介质
CN105550012A (zh) 一种自定义恢复故障虚拟机的方法
US20160224033A1 (en) Computer monitoring system, apparatus and method for controlling appliance operation
US7823029B2 (en) Failure recognition, notification, and prevention for learning and self-healing capabilities in a monitored system
CN105068763A (zh) 一种针对存储故障的虚拟机容错系统和方法
CN109271270A (zh) 存储系统中底层硬件的故障排除方法、系统及相关装置
CN102006190B (zh) 一种高可用集群备份系统及其备份方法
CN111488050B (zh) 一种电源监控方法、系统及服务器
CN101790722A (zh) 监视与共享媒介连接的航空电子系统的设备与方法
KR20170002025A (ko) 자동 컴퓨터 시스템 장애 복구와 예방에 대한 방법 및 그 시스템
CN109219105B (zh) 路由切换方法以及路由切换系统
JP5322581B2 (ja) 駅務システム
CN104346233A (zh) 一种用于计算机系统的故障恢复方法及装置
JP6041727B2 (ja) 管理装置、管理方法及び管理プログラム
KR20170070568A (ko) 서버 통합 관리 시스템 및 방법
JP2015106226A (ja) 二重化システム
JP2009059204A (ja) コンピュータリモート制御システム