KR20210040861A - 고장 예측 방법, 장치, 전자 기기, 저장 매체 및 컴퓨터 프로그램 - Google Patents

고장 예측 방법, 장치, 전자 기기, 저장 매체 및 컴퓨터 프로그램 Download PDF

Info

Publication number
KR20210040861A
KR20210040861A KR1020210038355A KR20210038355A KR20210040861A KR 20210040861 A KR20210040861 A KR 20210040861A KR 1020210038355 A KR1020210038355 A KR 1020210038355A KR 20210038355 A KR20210038355 A KR 20210038355A KR 20210040861 A KR20210040861 A KR 20210040861A
Authority
KR
South Korea
Prior art keywords
failure
change
information
result
risk
Prior art date
Application number
KR1020210038355A
Other languages
English (en)
Inventor
왕 샤오렁
Original Assignee
베이징 바이두 넷컴 사이언스 앤 테크놀로지 코., 엘티디.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 베이징 바이두 넷컴 사이언스 앤 테크놀로지 코., 엘티디. filed Critical 베이징 바이두 넷컴 사이언스 앤 테크놀로지 코., 엘티디.
Publication of KR20210040861A publication Critical patent/KR20210040861A/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/079Root cause analysis, i.e. error or fault diagnosis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0706Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
    • G06F11/0709Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment in a distributed system consisting of a plurality of standalone computer nodes, e.g. clusters, client-server systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0751Error or fault detection not based on redundancy
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0766Error or fault reporting or storing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0766Error or fault reporting or storing
    • G06F11/0772Means for error signaling, e.g. using interrupts, exception flags, dedicated error registers
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/48Program initiating; Program switching, e.g. by interrupt
    • G06F9/4806Task transfer initiation or dispatching
    • G06F9/4843Task transfer initiation or dispatching by program, e.g. task dispatcher, supervisor, operating system
    • G06F9/4881Scheduling strategies for dispatcher, e.g. round robin, multi-level priority queues
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management
    • G06Q10/103Workflow collaboration or project management
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y04INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
    • Y04SSYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
    • Y04S10/00Systems supporting electrical power generation, transmission or distribution
    • Y04S10/50Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Strategic Management (AREA)
  • Biomedical Technology (AREA)
  • Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Computer Hardware Design (AREA)
  • Data Mining & Analysis (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Economics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Debugging And Monitoring (AREA)
  • Emergency Alarm Devices (AREA)
  • Testing, Inspecting, Measuring Of Stereoscopic Televisions And Televisions (AREA)

Abstract

본 출원은 고장 예측 방법, 장치, 전자 기기, 저장 매체 및 컴퓨터 프로그램을 개시하며, 클라우드 컴퓨팅, 고장 처리 분야에 관한 것이다. 구체적인 구현 방안은, 고장 경보 요청을 획득하고, 상기 고장 경보 요청은 클라우드의 실행으로 인해 발생하는 고장, 잠복해 있는 위험 및 단말 사용자 차원의 조작에서 발생하는 변경 중의 적어도 두가지 고장 트리거 파라미터에서 취득하며; 상기 고장 경보 요청을 해석하여, 상기 고장, 상기 잠복해 있는 위험 및 상기 변경 중의 적어도 두가지 고장 트리거 파라미터를 취득하고; 상기 고장, 상기 잠복해 있는 위험 및 상기 변경 중의 적어도 두가지 고장 트리거 파라미터 사이에 관련을 구축하여, 관련 결과를 취득하고; 상기 관련 결과에 따라 상기 고장 경보 요청을 일으키는 고장을 예측하고, 고장 예측 결과를 취득한다. 본 출원을 사용하면, 고장 예측의 정확성을 향상시킬 수 있다.

Description

고장 예측 방법, 장치, 전자 기기, 저장 매체 및 컴퓨터 프로그램{FAULT PREDICTION METHOD, APPARATUS, ELECTRONIC DEVICE AND STORAGE MEDIUM}
본 출원은 데이터 처리 분야에 관한 것이다. 본 출원은 특히 클라우드 컴퓨팅, 고장 처리 분야, 고장과 관련되는 고장 예측, 고장의 위치 결정, 고장 복구 등의 분야에 응용될 수 있다.
인터넷 기술, 통신 기술 및 단말 지능화의 발전에 따라, 기업 사용자이든, 개인 사용자이든, 일상적으로 데이터 인터랙션에 기반한 빅 데이터 처리는 폭발적인 추세를 보이고, 이에 대해, 대량의 빅 데이터 분석 및 데이터 운영이 필요하다.
빅 데이터 분석 및 데이터 운영을 위한 클라우드 컴퓨팅 서비스를 예로 들면, 클라우드 컴퓨팅 서비스는 인터넷에 의존하는 관련 서비스의 증가, 사용 및 교부 모식일 수 있다. 현재, 클라우드 컴퓨팅 서비스는 이미 기업 사용자 IT건설의 초석이 되였고, 기업 사용자를 위해 안정적이고 신뢰할 수 있는 클라우드 컴퓨팅 서비스를 제공하는 실행 환경이 매우 중요하다. 클라우드 컴퓨팅 서비스 환경의 안정성은, 상당 부분에서 고품질의 운영 작업에 달려있으며, 운영 작업에서 고장이 발생할 경우, 클라우드 컴퓨팅 서비스의 실행 환경이 불안정해 질 수 있으며, 이에 대해, 관련 기술에서는 효과적인 해결 방안을 제공하지 못하였다.
본 출원은 고장 예측 방법, 장치, 전자 기기 및 저장 매체를 제공한다.
본 출원의 일 측면에 따르면, 고장 예측 방법을 제공하고, 해당 방법은,
고장 경보 요청을 획득하는 것, 여기서, 상기 고장 경보 요청은 클라우드의 실행으로 인해 발생하는 고장, 잠복해 있는 위험 및 단말 사용자 차원의 조작에서 발생하는 변경 중의 적어도 두가지 고장 트리거 파라미터에서 취득함;
상기 고장 경보 요청을 해석하여, 상기 고장, 상기 잠복해 있는 위험 및 상기 변경 중의 적어도 두가지 고장 트리거 파라미터를 취득하는 것;
상기 고장, 상기 잠복해 있는 위험 및 상기 변경 중의 적어도 두가지 고장 트리거 파라미터 사이에 관련을 구축하여, 관련 결과를 취득하는 것; 및
상기 관련 결과에 따라 상기 고장 경보 요청을 일으키는 고장을 예측하고, 고장 예측 결과를 취득하는 것을 포함한다.
본 출원의 다른 측면에 따르면, 고장 예측 장치를 제공하고, 해당 장치는,
고장 경보 요청을 획득하기 위한 요청 획득 모듈, 여기서, 상기 고장 경보 요청은 클라우드의 실행으로 인해 발생하는 고장, 잠복해 있는 위험 및 단말 사용자 차원의 조작에서 발생하는 변경 중의 적어도 두가지 고장 트리거 파라미터에서 취득함;
상기 고장 경보 요청을 해석하여, 상기 고장, 상기 잠복해 있는 위험 및 상기 변경 중의 적어도 두가지 고장 트리거 파라미터를 취득하기 위한 요청 해석 모듈;
상기 고장, 상기 잠복해 있는 위험 및 상기 변경 중의 적어도 두가지 고장 트리거 파라미터 사이에 관련을 구축하여, 관련 결과를 취득하기 위한 관련 모듈; 및
상기 관련 결과에 따라 상기 고장 경보 요청을 일으키는 고장을 예측하고, 고장 예측 결과를 취득하기 위한 예측 모듈을 포함한다.
본 출원의 다른 측면에 따르면, 전자 기기를 제공하고, 해당 기기는,
적어도 하나의 프로세서; 및
해당 적어도 하나의 프로세서와 통신 연결된 메모리를 포함하고; 여기서,
해당 메모리에는 해당 적어도 하나의 프로세서에 의해 수행 가능한 명령이 저장되어 있으며, 해당 명령은 해당 적어도 하나의 프로세서에 의해 수행되여, 해당 적어도 하나의 프로세서로 하여금 본 출원의 임의의 실시예에서 제공되는 방법을 수행할 수 있도록 한다.
본 출원의 다른 측면에 따르면, 컴퓨터 명령이 저장되어 있는 비일시적 컴퓨터 판독 가능 저장 매체를 제공하고, 해당 컴퓨터 명령은 해당 컴퓨터로 하여금 본 출원의 임의의 실시예에서 제공되는 방법을 실행하도록 한다.
본 출원을 사용하면, 고장 경보 요청을 획득할 수 있고, 상기 고장 경보 요청은 클라우드의 실행으로 인해 발생하는 고장, 잠복해 있는 위험 및 단말 사용자 차원의 조작에서 발생하는 변경 중의 적어도 두가지 고장 트리거 파라미터에서 취득하며; 상기 고장 경보 요청을 해석하여, 상기 고장, 상기 잠복해 있는 위험 및 상기 변경 중의 적어도 두가지 고장 트리거 파라미터를 취득할 수 있고; 상기 고장, 상기 잠복해 있는 위험 및 상기 변경 중의 적어도 두가지 고장 트리거 파라미터 사이에 관련을 구축하여, 관련 결과를 취득할 수 있고; 상기 관련 결과에 따라 상기 고장 경보 요청을 일으키는 고장을 예측하고, 고장 예측 결과를 취득할 수 있다. 본 출원은 고장 경보 요청을 트리거하는 고장 자체, 및 고장과 관련된 예를 들어 잠복해 있는 위험 및 변경 중의 적어도 두가지 고장 트리거 파라미터에 기반하여 관련을 구축하고, 관련을 구축하여 취득한 관련 결과에 따라 해당 고장 경보 요청을 일으키는 고장에 대해 예측하므로, 고장 예측의 정확성을 향상시킬 수 있다.
본 부분에서 설명된 내용은 본 개시의 실시예의 핵심 또는 중요 특징을 식별하기 위한 것이 아니며, 본 개시의 범위를 한정하려는 의도가 아님을 이해해야 한다. 본 개시의 다른 특징은 아래 명세서를 통해 쉽게 이해될 것이다.
도면은 본 해결수단을 더 잘 이해하기 위한 것으로서, 본 출원에 대한 한정이 되지 않는다. 여기서,
도 1은 본 출원의 실시예에 따른 고장 예측 방법의 개략적인 흐름도이다.
도 2는 본 출원의 실시예에 따른 고장 예측 방법의 개략적인 흐름도이다.
도 3은 본 출원의 실시예에 따른 고장, 잠복해 있는 위험 및 변경의 관련 후의 전체적인 연동의 응용 예시의 개략도이다.
도 4는 본 출원의 실시예에 따른 고장 예측 장치의 구성 구조의 개략도이다.
도 5는 본 출원의 실시예의 고장 예측 방법을 구현하기 위한 전자 기기의 블록도이다.
이하, 첨부된 도면을 결부하여 본 출원의 예시적 실시예를 설명하되, 여기에는 이해를 돕기 위한 본 출원의 실시예의 다양한 세부 사항이 포함되며, 이는 단지 예시적인 것으로 간주되어야 한다. 따라서, 해당 분야 기술자는 본 출원의 범위와 사상을 벗어나지 않고, 여기서 설명되는 실시예에 대해 다양한 변경과 보정을 수행할 수 있다는 것을 인식하여야 한다. 마찬가지로, 명확하고 간결화하기 위해, 이하 설명에서 공지된 기능과 구조에 대한 설명을 생략한다.
본문에서 용어"및/또는"는, 단지 관련 대상의 관련 관계를 설명하는 것 뿐이고, 3가지의 관계가 존재할 수 있는 것을 표시하며, 예를 들어, A 및/또는 B는, A가 단독으로 존재하는 것, 동시에 A 및 B가 존재하는 것, B가 단독으로 존재하는 것 3가지 상황을 표시할 수 있다. 본문에서 용어"적어도 하나"는 여러가지 중의 임의의 하나 또는 복수 중의 적어도 두 개의 임의의 조합을 표시하고, 예를 들어, A, B, C중의 적어도 하나를 포함하는 것은, A, B 및 C로부터 구성된 집합 중에서 선택된 임의의 하나 또는 복수의 요소를 포함하는 것을 표시할 수 있다. 본문에서 용어"제1", "제2"는 복수의 유사한 기술 용어를 가리키고 이에 대해 구분하는 것을 표시하고, 순서를 제한하는 의미가 아니고, 또는 2개만 한정하는 의미가 아니며, 예를 들어, 제1 특징과 제2 특징은, 두가지 유형/두가지 특징이 있는 것을 가리키며, 제1 특징은 하나 또는 복수일 수 있고, 제2 특징도 하나 또는 복수일 수 있다.
또한, 본 출원을 더욱 잘 설명하기 위해, 다음의 구체적인 실시형태에서 많은 구체적인 세부 사항을 제공한다. 해당 분야 기술자는 일부 구체적인 세부 사항이 없어도, 본 출원은 마찬가지로 실시할 수 있음을 이해해야 한다. 일부 실예에서, 해당 분야 기술자가 익숙한 방법, 수단, 부품 및 회로에 대해서는 상세히 설명하지 않으며, 본 출원의 주지를 분명하게 표현하는데 편리하도록 한다.
본 출원에 나타나는 하기와 같은 기술 용어의 의미를 설명한다.
1, 대처방안은, 어느 한 고장에 대해, 미리 제정한 처리 방안을 가리키고, 해당 대처방안은 인위적으로 수행될 수도 있고, 자동적으로 수행될 수도 있다.
2, 표준 작업 프로세스(SOP, Standard Operating Procedure)는, 특정한 정경에 대해, 제정한 표준화 조작 매뉴얼을 가리킨다.
3, 문제 후속 관리률은, 명확한 후속 관리자가 있는 것, 및 후속 관리의 현재 상황에 대해 설명한 이미 해결된 것과 해결되지 않은 문제와 문제 총수 사이에서 제법 연산을 하는 것을 가리키고, "명확한 후속 관리자가 있는 것, 및 후속 관리의 현재 상황에 대해 설명한 이미 해결된 것과 해결되지 않은 문제"를 A1로 기록하고, "문제 총수"를 B1로 기록하고, "문제 후속 관리률"을 C1로 기록할 경우, C1=A1/B1이다.
4, 문제 해결률은, 명확한 후속 관리자와 근원이 있는 이미 해결된 고장 수와 문제 총수 사이에서 제법 연산을 하는 것을 가리키고, "명확한 후속 관리자와 근원이 있는 이미 해결된 고장 수 "를 A2로 기록하고, "문제 총수"를 B1로 기록하고, "문제 해결률"을 C2로 기록할 경우, C2=A2/B1이다.
5, 고장 가중치는, 변경 또는 잠복해 있는 위험이 고장을 일으키는 가능성을 가리키고, 고장 가중치의 값은 0으로 부터 1이다. 여기서, "0"은 고장을 일으키지 않는 것을 표시하고, "1"은 필연적으로 고장을 일으키는 것을 표시한다.
6, 잠복해 있는 위험 레벨은, 잠복해 있는 위험 레벨에 대해 문제의 우선 순위P(Priority)와 심각성 S(Severity)두개의 차원으로부터 문제를 분류하는 것을 가리킨다.
7, 문제 우선 순위는 하기의 우선 순위를 포함한다.
P1: 최고 우선 순위로서, 2주 내에 해결할 필요가 있거나, 또는 적어도 임시 손실 제한 방안을 산출한다.
P2: 높은 우선 순위로서, 1개월 내에 해결할 필요가 있거나, 또는 적어도 임시 손실 제한 방안을 산출한다.
P3: 중간 우선 순위로서, 1분기 내에 해결할 필요가 있다.
P4: 낮은 우선 순위로서, 2분기 내에 해결한다.
8, 문제 심각성
S1: 최고 심각성으로서, 사용자 업무가 이미 손상되었거나, 또는 곧 손상된다.
S2: 높은 심각성으로서, 아직 사용자 업무에 영향을 미치지 않았지만, 손상될 확률이 크다.
S3: 중간 심각성으로서, 잠복해 있는 위험이 존재하여, 고객 업무에 영향을 줄 수 있다.
S4: 낮은 심각성으로서, 일반적으로 주동적으로 발기한 안정성을 향상하는 작업이다.
관련 기술에서, 클라우드 컴퓨팅 서비스의 실행 환경에 대해 운영 작업을 수행하고, 주로 고장, 잠복해 있는 위험, 및 변경에 대해 목적성 있는 해결을 진행한다. 여기서, 고장에 대해, 클라우드 컴퓨팅 서비스에서의 모니터링 시스템을 통해 감지할 수 있고, 다음에 응답하는 대처방안을 배치하여 인위적, 반자동 또는 자동화의 고장 예측 등의 처리를 수행할 수 있다. 잠복해 있는 위험에 대해, 대부분은 피동적으로 감지하며, 잠복해 있는 위험의 내용에 따라 대응 내용의 전문 항목 처리를 수행할 수 있다. 변경에 대해, 인위적 또는 변경 플랫폼을 통해 조작할 수 있으며, 미리 설정된 검출 항목(checklist)에 따라 검사할 수 있다.
상술한 고장, 잠복해 있는 위험 및 변경은 모두 각자의 독립적인 해결 방안이므로, 다음과 같은 문제가 존재한다.
1. 고장의 처리는, 적시에 손실을 멈추는 것을 목적으로 하고, 일부 손실 멈춤 방안은 명확하지만 근원을 조사하기 어려운 고장에 대해서는, 일반적으로 적시에 손실 멈춤을 선택하고, 후속 근원의 추적 조사는 왕왕 실패로 끝나고, 이러한 방법은 표면적인 증상만 해결하고 근본적인 문제를 해결하지 못하며, 고장을 수렴하지 못하고 고장의 제거를 구현하기 어렵다.
2. 잠복해 있는 위험의 처리는, 잠복해 있는 위험을 근절하는 것만 중시하고, 일반적으로 시간이 비교적 오래 걸리고, 인력과 시간이 부족한 상황에서, 왕왕 잠복해 있는 위험을 잃어버리고, 놓치는 경우가 많다.
3. 변경의 처리는, 일반적으로 단말 사용자 차원 레벨이고, 예를 들어 사용자 프로그램에서의 변경에 의해 발생하며, 운영 인원은 그 품질에 대해 정확하게 평가하기 비교적 어렵고, 변경에 의해 발생되며, 특히 비 사용자 프로그램 등의 간접적인 원인으로 인해 발생하는 변경에 의해 초래되는 잠복해 있는 위험 및 고장은 발견, 위치 결정 및 추적하기 더욱 어렵다.
4. 운영 인원은 일반적으로 고장, 잠복해 있는 위험, 변경의 처리를 책임지고, 부동한 사람일 수 있으며, 복수의 운영 인원 사이에는 커뮤니케이션 코스트가 발생하여, 현재 상황을 해결하는데 피로를 초래하여, 효과적인 수렴과 고장의 제거를 구현할 수 없고, 고장이 발전하는 미래 가능성도 적시에 정확하게 예측하지 못한다.
본 출원의 하나의 예시에서, 상술한 클라우드 컴퓨팅 서비스의 응용 정경을 예로 들어, 클라우드 컴퓨팅 환경의 고장, 잠복해 있는 위험, 변경에 대해 서로 관련을 구축한 연동 처리를 수행하고, 표준화된 데이터 입력, 자동화의 지능 관리 및 예측의 도움을 빌어, 고장, 잠복해 있는 위험 및 변경의 관련 후의 폐쇄 루프 수렴, 즉 단단히 연결을 구현할 수 있고, 예를 들어, 고장은 자체로 인해 발생한 것이 아니라, 잠복해 있는 위험이 해결되지 않은 것으로 인해 고장을 초래할 수 있고, 또한, 고장은 단말 측 사용자 차원 레벨의 변경에 의해 발생할 수도 있으며, 백그라운드 측의 클라우드 컴퓨팅 자체 실행 환경 이상으로 인해 발생한 것이 아닐 수도 있다. 나아가, 고장, 잠복해 있는 위험, 변경의 입력, 처리, 분석, 후속 관리 등에 대해 표준화 정의, 데이터 건설 등을 수행함으로써, 데이터 입력을 접수하여 데이터(예를 들어 고장, 잠복해 있는 위험, 변경 등)관련 분석 및 예측을 수행하는 자동화 관리 플랫폼에 의탁하여, 고장, 잠복해 있는 위험, 변경을 가중치에 따라 가중 관련을 수행하고, 횡적으로 관통할 수 있어, 고장이 발생되는 근원을 공통으로 위치 결정하여, 고장, 잠복해 있는 위험 및 변경의 자동 수렴, 자동 예측의 목적을 달성할 수 있으며, 최종적으로, 상술한 데이터 관련 분석에 기반하여, 클라우드 컴퓨팅 환경의 전체적인 안정성 운영에 대해 건의와 예측을 제공할 수 있다. 따라서, 고장을 신속하게 제거할 수 있고, 고장을 초래할 수 있는 잠복해 있는 위험, 변경, 심지어 기타 원인을 제거할 수 있으며, 운영 작업의 품질을 주동적으로 파악하고 제어하여, 클라우드 컴퓨팅 서비스의 실행 환경이 안정적인 상태에 있도록 확보한다.
본 출원의 실시예에 따르면, 고장 예측 방법을 제공하고, 도 1은 본 출원의 실시예에 따른 고장 예측 방법의 개략적인 흐름도이며, 해당 방법은 고장 예측 장치에 응용될 수 있고, 예를 들어, 해당 장치는 단말 또는 서버 또는 기타 처리 기기에 배치되어 수행되는 상황에서, 고장 경보, 고장 분석, 고장 예측 및 조기 경보 등을 수행할 수 있다. 여기서, 단말은 사용자 기기(UE, User Equipment), 모바일 기기, 핸드폰, 무선 전화, 개인 휴대 정보 단말기(PDA, Personal Digital Assistant), 핸드 헬드 장치, 컴퓨팅 장치, 차량 탑재 장치, 웨어러블 장치 등일 수 있다. 일부 가능한 구현 방식에서, 해당 방법은 프로세서가 메모리에 저장된 컴퓨터 판독 가능 명령을 호출하는 방식을 통해 구현될 수도 있다. 도 1에 도시된 바와 같이, 하기와 같은 단계를 포함한다.
S101, 고장 경보 요청을 획득하고, 상기 고장 경보 요청은 클라우드의 실행으로 인해 발생하는 고장, 잠복해 있는 위험 및 단말 사용자 차원의 조작에서 발생하는 변경 중의 적어도 두가지 고장 트리거 파라미터에서 취득한다.
하나의 예시에서, 고장 경보 요청은, 고장 자체에 의해 초래되는 것일 수 있고; 고장 경보 요청은, 잠복해 있는 위험에 의해 초래되는 고장일 수도 있으며; 고장 경보 요청은, 단말 사용자 차원의 조작에서 발생하는 변경에 의해 초래되는 고장일 수도 있고; 고장 경보 요청은 고장 자체가 적시에 제거할 수 없어서 초래되는 잠복해 있는 위험일 수도 있으며, 잠복해 있는 위험은 고장에 의해 초래되는 고장의 가능성을 더 심화하고, 해당 고장 경보 요청이 고장, 잠복해 있는 위험 및 변경 중의 적어도 두가지 고장 트리거 파라미터에서 취득하는 것이라면, 모두 본 출원의 보호 범위 내에 있다.
S102, 상기 고장 경보 요청을 해석하여, 상기 고장, 상기 잠복해 있는 위험 및 상기 변경 중의 적어도 두가지 고장 트리거 파라미터를 취득한다.
하나의 예시에서, 고장 경보 요청에 대한 해석을 통해, 고장을 일으키는 각종 트리거 파라미터를 취득할 수 있고, 예를 들어, 고장 경보 요청에 대한 해석은, 고장 자체에 의해 초래되는 고장인지, 잠복해 있는 위험에 의해 초래되는 고장인지, 또는 단말 사용자 차원의 조작에서 발생하는 변경에 의해 초래되는 고장 등을 발견할 수 있다.
S103, 상기 고장, 상기 잠복해 있는 위험 및 상기 변경 중의 적어도 두가지 고장 트리거 파라미터 사이에 관련을 구축하여, 관련 결과를 취득한다.
하나의 예시에서, 고장, 잠복해 있는 위험 및 변경의 각자 가중치에 대해 가중 관련을 수행하는 것을 통해, 관련 결과를 취득할 수 있다.
다른 예시에서, 만약 이미 존재하는 역사 예측 결과가 해당 고장을 해결할 수 있으면, 그러면, 먼저 해당 고장을 해결하고 적시에 손실을 멈추게 한 후, 다시 해당 고장을 잠복해 있는 위험 및 변경과 관련시켜(각종 가중치에 대한 가중 관련일 수 있다), 해당 관련 결과를 취득하도록 한다.
S104, 상기 관련 결과에 따라 상기 고장 경보 요청을 일으키는 고장을 예측하고, 고장 예측 결과를 취득한다.
하나의 예시에서, 만약 고장 경보 요청이 고장 자체를 적시에 제거할 수 없어서 초래되는 잠복해 있는 위험에 의한 것이고, 또 잠복해 있는 위험이 고장에 의해 초래되는 새로운 고장 문제를 더 심화시키면, 그러면, 고장과 잠복해 있는 위험의 관련에 따라 취득한 관련 결과를 통해, 해당 고장 경보 요청을 일으키는 고장에 대해 예측하여, 고장이 "고장 자체 및 그가 초래한 잠복해 있는 위험"에 의해 일으킨 것이라는 고장 예측 결과를 취득하도록 한다.
다른 예시에서, 상술한 예시에서 관련 결과에 따라 상기 고장 경보 요청을 일으키는 고장을 예측하는 것 외에도, 상기 고장 예측 결과를 역사 예측값과 비교하고, 상기 역사 예측값을 결합하여 상기 고장 예측 결과를 수정하여, 수정 후의 예측 결과를 필요한 적어도 하나의 응용에 연결하도록 할 수 있으며(예를 들어, 기업 사용자에게 필요한 기업 내부 통신 안전 응용 정경의 하나 또는 복수의 응용에 연결한다); 또는, 상기 고장 예측 결과를 클라우드 컴퓨팅 서비스의 실행 환경의 실제 실행 데이터와 비교하고, 상기 실제 실행 데이터를 결합하여 상기 고장 예측 결과를 수정하여, 수정 후의 예측 결과를 필요한 적어도 하나의 응용에 연결하도록 할 수 있다(예를 들어, 기업 사용자에게 필요한 기업 내부 통신 안전 응용 정경의 하나 또는 복수의 응용에 연결한다).
본 출원을 사용하면, 고장 경보 요청을 획득할 수 있고, 상기 고장 경보 요청은 클라우드의 실행으로 인해 발생하는 고장, 잠복해 있는 위험 및 단말 사용자 차원의 조작에서 발생하는 변경 중의 적어도 두가지 고장 트리거 파라미터에서 취득하며; 상기 고장 경보 요청을 해석하여, 상기 고장, 상기 잠복해 있는 위험 및 상기 변경 중의 적어도 두가지 고장 트리거 파라미터를 취득할 수 있고; 상기 고장, 상기 잠복해 있는 위험 및 상기 변경 중의 적어도 두가지 고장 트리거 파라미터 사이에 관련을 구축하여, 관련 결과를 취득할 수 있고; 상기 관련 결과에 따라 상기 고장 경보 요청을 일으키는 고장을 예측하고, 고장 예측 결과를 취득할 수 있다. 본 출원은 고장 경보 요청을 트리거하는 고장 자체, 및 고장과 관련된 예를 들어 잠복해 있는 위험 및 변경 중의 적어도 두가지 고장 트리거 파라미터에 기반하여 관련을 구축하고, 관련을 구축하여 취득한 관련 결과에 따라 해당 고장 경보 요청을 일으키는 고장에 대해 예측하므로, 고장 예측의 정확성을 향상시킬 수 있다.
하나의 실시형태에서, 상기 고장, 상기 잠복해 있는 위험 및 상기 변경 중의 적어도 두가지 고장 트리거 파라미터 사이에 관련을 구축하여, 관련 결과를 취득하는 것은, 상기 고장, 상기 잠복해 있는 위험 및 상기 변경을 다대다의 관계에 따라 각자 가중치(예를 들어 각자가 설계 요구 또는 역사 예측값에 따라 취득한 가중치 디폴트 값을 사용한다.)의 가중 관련을 수행하여, 상기 관련 결과를 취득하는 것을 포함한다.
본 실시형태를 사용하면, 해당 가중 관련을 통해, 고장, 잠복해 있는 위험, 변경을 횡적으로 관련시키는 목적을 달성하여, 따라서 고장, 잠복해 있는 위험, 변경을 횡적으로 관통하고, 고장이 발생되는 근원을 더 빨리 위치 결정할 수 있고(예를 들어 고장 자체, 잠복해 있는 위험에 의해 초래되는 고장인지, 아니면 변경에 의해 초래되는 고장인지 등), 따라서, 고장의 문제점을 빨리 위치 결정하고, 고장을 적시에 해결하며(또는, 고장이 잠복해 있는 위험에 의해 발생된 것이 위치 결정되면, 잠복해 있는 위험을 제거하고, 잠복해 있는 위험이 제거되면 고장 문제도 해결되며, 또는 고장이 변경에 의해 발생된 것이 위치 결정되면, 단말이 이미 고장이 발생하였음을 제시하여, 단말로 하여금 자신의 사용자 차원에서의 변경 조작 등을 적시에 조정할 수 있도록 한다), 적시에 손실을 멈추도록 한다.
하나의 실시형태에서, 처리 정보에 따라 상기 각자 가중치에 대해 가중치 조정을 수행한 후 상기 가중 관련을 수행하여, 상기 관련 결과를 취득하는 것을 더 포함한다. 여기서, 처리 정보는 상기 고장, 상기 잠복해 있는 위험, 상기 변경에 대한 분석 및/또는 처리를 수행한 후 발생되는 관련 정보를 표징하기 위한 것이다.
하나의 실시형태에서, 상기의 상기 고장, 상기 잠복해 있는 위험 및 상기 변경 중의 적어도 두가지 고장 트리거 파라미터 사이에 관련을 구축하여, 관련 결과를 취득하는 것은, 상기 고장을 상기 역사 예측값에 관련시키는 것; 및 상기 역사 예측값에 따라 상기 고장을 예측한 후, 상기 고장을 상기 잠복해 있는 위험, 상기 변경과 동기화 관련을 하여, 상기 관련 결과를 취득하는 것을 포함한다.
실시형태를 사용하면, 역사 예측 결과가 이미 존재할 경우(예를 들어 역사 예측에 따라 취득한 추천 대처방안 등), 해당 고장을 먼저 해결할 수 있다. 먼저 해당 고장을 해결하고 적시에 손실을 멈추게 한 후, 다시 해당 고장을 잠복해 있는 위험 및 변경과 관련시켜(고장과 잠복해 있는 위험 및 변경의 각자 가중치의 가중을 관련시킬 수 있다), 해당 관련 결과를 취득하도록 한다. 다시 말하면, 고장 경보 후에, 고장 관련의 역사 추천 대처방안을 자동으로 추천하고 수행할 수 있고, 동시에 자동으로 해당 고장을 잠복해 있는 위험 및 변경에 관련시킬 수 있다.
해당 역사 추천 대처방안은 해당 고장을 예측한 것에 대한 것이므로, 기존의 방안은 해당 고장을 예측하여, 고장을 위치 결정하고 고장을 적시에 제거하도록 할 수 있다. 그 다음에 진일보로 고장, 잠복해 있는 위험 및 변경의 관련을 수행하여, 해당 관련을 통해 고장, 잠복해 있는 위험, 변경으로 하여금 횡적 관련의 목적을 달성한 것에 기반하여, 고장, 잠복해 있는 위험, 변경을 횡적으로 관통하고, 고장이 발생되는 근원을 더욱 빨리 위치 결정할 수 있으며(예를 들어 고장 자체, 잠복해 있는 위험에 의해 초래되는 고장인지, 변경에 의해 초래되는 고장인지 등), 따라서, 고장의 문제점을 빨리 위치 결정하고, 고장을 적시에 해결하며(또는, 고장이 잠복해 있는 위험에 의해 발생된 것을 위치 결정되면, 잠복해 있는 위험을 제거하고, 잠복해 있는 위험이 제거되면 고장 문제도 해결되며, 또는 고장이 변경에 의해 발생된 것이 위치 결정되면, 단말이 이미 고장이 발생하였음을 제시하여, 단말로 하여금 자신의 사용자 차원에서의 변경 조작 등을 적시에 조정할 수 있도록 한다), 적시에 손실을 멈추도록 한다.
본 출원의 실시예에 따르면, 고장 예측 방법을 제공하고, 도 2는 본 출원의 실시예에 따른 고장 예측 방법의 개략적인 흐름도이다. 도 2에 도시된 바와 같이, 하기의 단계를 포함한다.
S201, 데이터 수집 조작에 응답하여, 기초 정보, 처리 정보, 관련 정보 중의 적어도 하나를 입력한다.
하나의 예시에서, 기초 정보는 상기 고장, 상기 잠복해 있는 위험, 상기 변경의 다양한 자체 정보를 표징하기 위한 것이다. 처리 정보는 상기 고장, 상기 잠복해 있는 위험, 상기 변경에 대한 분석 및/또는 처리를 수행한 후 발생되는 관련 정보를 표징하기 위한 것이다. 관련 정보는 상기 고장에 대응되는 고장의 업스트림 및 다운스트림의 관련 정보를 표징하기 위한 것이다.
S202, 고장 경보 요청을 획득하고, 상기 고장 경보 요청은 클라우드의 실행으로 인해 발생하는 고장, 잠복해 있는 위험 및 단말 사용자 차원의 조작에서 발생하는 변경 중의 적어도 두가지 고장 트리거 파라미터에서 취득한다.
하나의 예시에서, 고장 경보 요청은, 고장 자체에 의해 초래되는 것 일 수 있고; 고장 경보 요청은, 잠복해 있는 위험에 의해 초래되는 고장일 수도 있고; 고장 경보 요청은, 단말 사용자 차원의 조작에서 발생하는 변경에 의해 초래되는 고장일 수도 있고; 고장 경보 요청은 고장 자체를 적시에 제거하지 못하여 초래되는 잠복해 있는 위험일 수도 있고, 잠복해 있는 위험은 고장에 의해 초래되는 등등의 가능성을 더욱 심화하고, 해당 고장 경보 요청이 고장, 잠복해 있는 위험 및 변경 중의 적어도 두가지 고장 트리거 파라미터에서 취득하는 것이라면, 모두 본 출원의 보호 범위 내에 있다.
S203, 상기 고장 경보 요청을 해석하여, 상기 고장, 상기 잠복해 있는 위험 및 상기 변경 중의 적어도 두가지 고장 트리거 파라미터를 취득한다.
하나의 예시에서, 고장 경보 요청에 대한 해석을 통해, 고장을 일으키는 각종 트리거 파라미터를 취득할 수 있고, 예를 들어, 고장 경보 요청에 대한 해석은, 고장 자체에 의해 초래되는 고장인지, 잠복해 있는 위험에 의해 초래되는 고장인지, 또는 단말 사용자 차원의 조작에서 발생하는 변경에 의해 초래되는 고장 등인지를 발견할 수 있다.
S204, 상기 고장, 상기 잠복해 있는 위험 및 상기 변경 중의 적어도 두가지 고장 트리거 파라미터 사이에 관련을 구축하여, 관련 결과를 취득한다.
하나의 예시에서, 고장, 잠복해 있는 위험 및 변경의 각자 가중치에 대해 가중 관련을 수행하는 것을 통해, 관련 결과를 취득할 수 있다.
다른 예시에서, 이미 존재하는 역사 예측 결과가 해당 고장을 해결할 수 있으면, 그러면, 먼저 해당 고장을 해결하고 적시에 손실을 멈추게 한 후, 다시 해당 고장을 잠복해 있는 위험 및 변경과 관련시켜(각종 가중치에 대한 가중 관련일 수 있다), 해당 관련 결과를 취득하도록 한다.
S205, 상기 관련 결과에 따라 상기 고장 경보 요청을 일으키는 고장을 예측하고, 고장 예측 결과를 취득한다.
S206, 상술한 가중 관련, 및/또는 상술한 고장 예측 및 SOP에 기반한 표준화 수행 처리에 따라, 고장, 잠복해 있는 위험 및 변경을 서로 관련시켜 형성된 폐쇄 루프 처리 과정이 수렴될 때까지, 고장 경보 요청을 일으킨 고장 수량을 계속 제거하여, 고장 예측을 종료한다.
하나의 예시에서, SOP는 특정한 정경에 대해 제정한 표준화 조작 매뉴얼이고, 상술한 데이터 수집 조작, 관련 및 고장 예측 등의 각 처리는, 모두 너무 많은 인위적인 개입이 필요없이, 해당 SOP에 따라 표준화된 자동 실행을 수행할 수 있다.
본 출원을 사용하면, 고장 경보 요청을 획득하고, 상기 고장 경보 요청은 클라우드의 실행으로 인해 발생하는 고장, 잠복해 있는 위험 및 단말 사용자 차원의 조작에서 발생하는 변경 중의 적어도 두가지 고장 트리거 파라미터에서 취득할 수 있다. 상기 고장 경보 요청을 해석하여, 상기 고장, 상기 잠복해 있는 위험 및 상기 변경 중의 적어도 두가지 고장 트리거 파라미터를 취득할 수 있다. 상기 고장, 상기 잠복해 있는 위험 및 상기 변경 중의 적어도 두가지 고장 트리거 파라미터 사이에 관련을 구축하여, 관련 결과를 취득할 수 있다. 상기 관련 결과에 따라 상기 고장 경보 요청을 일으키는 고장을 예측하고, 고장 예측 결과를 취득할 수 있다. 상술한 가중 관련, 및/또는 상술한 고장 예측 및 SOP에 기반한 표준화 수행 처리에 따라, 고장, 잠복해 있는 위험 및 변경을 서로 관련시켜 형성된 폐쇄 루프 처리 과정이 수렴될 때까지, 고장 경보 요청을 일으킨 고장 수량을 계속 제거하여, 고장 예측을 종료할 수 있다. 본 출원은 고장 경보 요청을 트리거하는 고장 자체, 및 고장과 관련된 예를 들어 잠복해 있는 위험 및 변경 중의 적어도 두가지 고장 트리거 파라미터에 기반하여 관련을 구축하고, 관련을 구축하여 취득한 관련 결과에 따라 해당 고장 경보 요청을 일으키는 고장에 대해 예측하므로, 고장 예측의 정확성을 향상시킬 수 있으며, 또한, 자동적인 관련 + 자동적인 고장 예측 대처방안, 및 SOP를 결합하여 수행하는 것을 통해, 전체 고장 예측의 폐쇄 루프 처리 과정이 계속 실행됨에 따라, 고장의 수량이 계속 수렴되고, 점점 적어지며, 또한 전체 폐쇄 루프 처리 과정이 너무 많은 인위적인 개입이 필요없고, 자동으로 수행되므로, 고장 예측이 정확할 뿐만 아니라, 안정성을 향상시키며, 인건비도 줄일 수 있다.
하나의 실시형태에서, 데이터 수집 조작에 응답하는 것 외에도 기초 정보, 처리 정보, 관련 정보 중의 적어도 하나를 입력할 수 있다. 고장, 잠복해 있는 위험 및 변경의 관련에 기반하여 관련 결과를 취득하는 조작에 응답하여, 기초 정보, 처리 정보, 관련 정보 중의 적어도 하나를 지속적으로 입력할 수도 있다. 전체 응답의 과정은, 또한 폐쇄 루프의 처리 과정이므로, 입력 데이터의 완전성, 정확성을 확보할 수 있고, 따라서 해당 입력 데이터에 기반하여 취득한 최종 고장 예측 결과의 정확성이 높으며, 클라우드 컴퓨팅 서비스의 실행 환경의 안정성을 향상시킨다.
고장, 잠복해 있는 위험 및 변경의 관련에 기반하여 관련 결과를 취득하는 조작에 응답하여, 기초 정보, 처리 정보, 관련 정보 중의 적어도 하나를 지속적으로 입력한 후에, 고장, 잠복해 있는 위험, 변경 또는 기타 원인으로 인해 고장 경보가 초래된 후에 지속적으로 관련시키는 것도, 또한 폐쇄 루프의 처리 과정일 수 있다.
본 실시형태를 사용하면, 기초 정보, 처리 정보, 관련 정보 중의 적어도 하나를 입력하는 것을 통해, 고장 경보가 트리거된 후, 고장, 잠복해 있는 위험, 변경 또는 기타 원인으로 인해 초래되는 고장 경보에 대해 계속 관련 분석을 수행하여, 더욱 정확한 고장 예측 결과(예를 들어 고장 예측 대처방안)를 취득하도록 할 수 있다.
하나의 실시형태에서, 입력 데이터에 대해 데이터 표준화의 처리를 구현할 수 있으며, 데이터 수집의 표준화 입력 조작에 응답하여, 적어도 표준화 옵션 또는 표준화 템플릿을 포함하는 입력 전략 및/또는 입력 업데이트 전략을 획득하고, 상기 입력 전략 및/또는 입력 업데이트 전략에 따라, 상기 고장, 상기 잠복해 있는 위험, 상기 변경의 각종 정보에 대한 표준화 입력을 수행할 수 있다.
응용 예시:
본 응용 예시에 적용하는 하나의 응용 정경은 클라우드 컴퓨팅에 대한 고장 처리 정경이고, 먼저, 클라우드 컴퓨팅을 소개하는 바, 빅 데이터 분석 및 데이터 운영을 위한 클라우드 컴퓨팅 서비스를 예로 들어, 클라우드 컴퓨팅 서비스는 인터넷에 의존한 관련 서비스의 증가, 사용 및 교부 모식일 수 있다. "클라우드"는 네트워크, 인터넷의 속칭이다. 클라우드는 원래 초기의 통신 기술에 기반하여 구축된 텔레콤 네트워크을 가리키고, 인터넷 기술의 발전에 따라, 현재 인프라 시설 (IaaS, Infrastructure as a Service)의 추상화와 같은, 인터넷과 기본 인프라 시설을 표시할 수도 있다. IaaS는 IT인프라 시설을 서비스로 네트워크를 통해 대외에 제공하고, 사용자가 리소스에 대한 실제 사용량 또는 점용량에 따라 요금을 계산하는 서비스 모식이다. 기업 사용자에게 안정적이고 신뢰할 수 있는 클라우드 컴퓨팅 서비스를 제공하는 실행 환경은 매우 중요하다. 한편, 클라우드 컴퓨팅 서비스 환경의 안정성은, 상당 부분이 고품질의 운영 작업(예를 들어 고장, 잠복해 있는 위험, 및 변경)에 달려있다. 컴퓨팅 환경에서 안정성 운영에 관련된 작업은 주로 고장, 잠복해 있는 위험, 및 변경의 세 부분으로 나눈다.
본 출원의 실시예를 응용하는 하나의 처리 과정은, 데이터 표준화(데이터 입력의 표준화), 자동화 관리(예를 들어 자동 관련) 및 지능화 분석(예를 들어 자동 예측 대처방안 취득)의 세 부분을 통해 구현할 수 있고, 하기와 같은 내용을 포함한다.
1. 데이터 표준화
본 응용 예시에서, 데이터 표준화에 대해 데이터 부분의 중점은 표준화, 규범화에 있고, 관련될 수 있는 하기와 같은 정보에 대해 표준화된 입력을 수행하여, 데이터 소스 데이터의 사용 가능성을 규범화하도록 한다. 해당 데이터 표준화는 하기와 같은 3개 부분을 포함한다.
1) 기초 정보, 즉 객관적이고, 직접 획득할 수 있는 데이터는, 하기와 같은 유형의 데이터일 수 있다.
1)) 고장: 고장 발생 시에 발생되는 객관적 정보로서, 일반적으로 직접 모니터링 시스템에서 발생되는 경보를 통해 획득 할 수 있고, 예를 들어 트리거 시간, 고장 내용, 관련 제품, 고장 레벨, 고장 부류 등이다.
2)) 잠복해 있는 위험: 예를 들어 발견 시간, 잠복해 있는 위험 현상, 관련 제품, 이미 발생된 영향(예를 들어 조성되는 고장) 및 관련된 인원이다.
3)) 변경: 변경 시간, 변경 시간의 장단, 변경 내용, 관련 범위, 관련 제품, 변경인, 스케줄, 롤백 방안이 있는지 여부이다.
2) 처리 정보, 즉 분석, 처리를 수행해야 한 후 발생되는 데이터이고, 하기와 같은 유형의 데이터일 수 있다.
1)) 고장: 고장 발생 후에 처리할 때 발생되는 정보이고, 예를 들어 고장 원인, 해결 방안, 현재 상태, 후속 관리자 등이다.
2)) 잠복해 있는 위험: 완전한 영향면, 잠복해 있는 위험 레벨(본문의 상술한 잠복해 있는 위험 레벨에 대한 설명을 참조), 담당자, 잠복해 있는 위험의 트리거 원인, 근본 원인, 해결 방안, 예상 제거 시간이다.
3)) 변경: 등급별 발표를 따를 것인지 여부, 변경 결과, 롤백할 것인지 여부, 즉시 고장이 발생하는지 여부이다.
3) 관련 정보, 즉 고장 문제의 업스트림 및 다운스트림의 관련 정보이다.
1)) 고장: 고장 처리, 후속 관리, 근절 등과 관련된 정보이며, 예를 들어 대응하는 대처방안, 관련될 수 있는 잠복해 있는 위험, 관련될 수 있는 변경 등이다.
2)) 잠복해 있는 위험: 잠복해 있는 위험이 일으킬 수 있는 고장, 가능한 출처의 변경이다.
3)) 변경: 변경으로 인해 도입될 수 있는 잠복해 있는 위험, 조성되는 고장이다.
2. 자동화 관리
상술한 데이터 표준화로부터 고장, 잠복해 있는 위험, 변경에서 쉽게 획득하는 기초 정보를 제외하고, 처리 정보와 관련 정보가 더욱 중요하지만, 지속적으로 획득하고 추적하기가 더욱 어렵다는 것을 알 수 있다. 이에 대해 자동화 관리 및 후속 지능형 분석에 사용되는 자동화 플랫폼을 개발하는 것을 통해, 제한된 인위적인 개입 하에서, 신속하고 정확하게 데이터에 대해 집중 관리, 처리, 분석 등의 자동화 관리 및 분석 작업을 진행하는 것을 구현할 수 있다. 자동화 관리는 하기와 같은 3개 부분을 포함한다.
1) 정보 자동 입력: 해당 자동화 플랫폼을 통해 모니터링, 순검, 변경 등의 조작 연동을 수행하고, 입력 정보에 대해, 제정된 표준에 따라 입력하고, 될 수 있는 한 규범화, 자동화하여, 사람의 효율을 향상시킨다.
1)) 모든 기초 정보는 모두 자동 입력된다.
2)) 모든 처리 정보 및 관련 정보는 될 수 있는 한 자동 입력되고, 인위적 개입이 필요할 경우, 표준 옵션 또는 템플릿을 제공하여, 인력을 절약하고, 간섭 정보를 감소하도록 한다.
2) 자동화 후속 관리: 상술한 정보(예를 들어 기초 정보, 처리 정보 및 관련 정보)에 대한 자동화 수집으로서, 나아가 정보 자동 업데이트의 전략을 설정할 수 있으며 자동화의 정보 입력 및 업데이트를 구현하도록 하고, 인력을 해방시켜, 특히 쉽게 잃어버리고 놓치는 문제에 대해 자동화의 후속 관리를 구현할 수 있으며, 하기와 같은 2개 부분의 내용을 포함한다.
1)) 각종 문제에 대해 후속 관리의 시효를 설정하고, 기한을 넘으면 담당자에게 경보를 보내고, 업그레이드 제도를 설정한다.
2)) 관건 정보가 완비한지 여부를 자동 검사하고, 예를 들어 누락된 것이 있으면, 관건 정보를 강제로 입력한다. 여기서, 관건 정보는 잠복해 있는 위험의 트리거 원인, 고장이 발생한 근본 원인, 고장 예측의 해결 대처방안 등일 수 있으며, 상대적으로, 비 관건 정보는 고장이 발생되는 시간 등일 수 있고, 관건 정보는 고장 예측의 정확성에 대해 영향이 있으므로, 예를 들어 관건 정보가 자동으로 입력되지 않은 것을 발견하면, 누락된 관건 정보를 인위적으로 입력할 수 있다.
3)) 후속 관리 총람을 정기적으로 (예를 들어 매달)산출하고, 문제 후속 관리률(본문의 상술한 잠복해 있는 위험 레벨에 대한 설명을 참조)과 문제 해결률(본문의 상술한 잠복해 있는 위험 레벨에 대한 설명을 참조) 지표에 근거하여, 후속 관리 효과를 계량화하고, 예를 들어, 고장 또는 고장이 발생하는 문제를 관찰하는 명확한 후속 관리자를 설정하고, 예를 들어 100개의 고장이 문제를 발생할 경우, 80개를 후속 관리하고, 10개를 해결하고, 10개를 누락한 것 등은 후속 관리 총람이다.
3) 횡적 관련: 고장, 잠복해 있는 위험, 변경 서로 사이에 관련을 구축하여, 고장, 잠복해 있는 위험, 변경의 서로 사이에 영향을 주는 심층적 근원을 횡적 관통함으로써, 고장 발생 근원을 위치 결정하는 것과 고장 문제를 해결하는 것을 가속화한다.
1)) 자동화의 관련, 예를 들어 자동 추천과 관련 대처방안의 수행, 즉 이미 알고 있는 대처방안이고, 고장 경보 후에, 이 고장인 것을 발견하면, 이 고장에 대응하여 이미 알고 있는 대처방안에 자동으로 관련시켜, 고장을 해결하도록 하고, 자동화 처리를 하여, 인력을 해방할 수 있으며, 나아가 고장과 잠복해 있는 위험 및 변경을 자동 관련시킬 수도 있다.
2)) 고장, 잠복해 있는 위험, 변경을 다대다로, 즉 N:N의 관계로 가중 관련을 수행하고, 여기서, N는 1보다 큰 정수이고, 고장, 잠복해 있는 위험, 변경의 각자 가중치는 디폴트 값을 설정할 수 있고, 처리 정보의 변동에 따라 조정할 수도 있다. 예를 들어 A변경은 B잠복해 있는 위험을 도입하고, C고장을 조성하는 확률이 50% 있으므로, 가중 관련의 관계 하기와 같다:
A -> B, 가중치가 1이고, 즉 B가 A에 상대한 가중치는 1이고;
A -> C, 가중치가 0.5이고, 즉 C가 A에 상대한 가중치는 0.5이며;
B -> C, 가중치가 0.5이고, 즉 C가 B에 상대한 가중치는 0.5이다.
3. 지능화 분석
지능화 분석은 상술한 데이터 표준화 및 상술한 자동화 관리의 기초하에서, 고장 경보 요청 데이터에 기반하여 고장, 잠복해 있는 위험, 변경 등의 복수의 차원으로부터 분석하여, 상응한 건의(예를 들어 고장 예측의 대처방안을 자동적으로 생성)를 산출하여, 고장 & 잠복해 있는 위험이 수렴 가능하고, 예측 가능하며, 변경 제어 가능한 목적을 달성하도록 함으로써, 클라우드 컴퓨팅 환경의 전체적인 안정성을 향상시킨다. 지능화 분석은 하기와 같은 3개의 내용을 포함한다.
1) 전체 분석의 기초는 데이터이며, 플랫폼 실행 시간이 길수록, 지능화 분석의 정확성이 더욱 높다.
2) 지능화 분석에 의해 발생되는 건의는 자동으로 수행될 수 있고, 리스크 제어 지표에 따라 인위적으로 수행될 수도 있다.
3) 지능화 분석의 예측 결과(예를 들어 상술한 예측 가중치에 대한 비교 및 수정)는 그 다음의 클라우드 컴퓨팅 서비스의 실행 환경의 실제 실행 데이터와 비교하고 수정할 수 있으며, 따라서 고장 예측의 정확성을 부단히 향상시킬 수 있다.
도 3은 본 출원의 실시예에 따른 고장, 잠복해 있는 위험 및 변경의 관련 후의 전체적인 연동의 응용 예시의 개략도이며, 도 3에 도시된 바와 같이, 하기와 같은 내용을 포함한다.
1. 고장이 발생한 후에(고장을 일으키는 것은 순검을 통해 고장을 발견할 수 있고, 고장은 자체 원인을 제외하고, 잠복해 있는 위험, 변경 또는 기타 원인으로 인해 해당 고장을 초래할 수도 있다) 고장 경보 요청을 일으킬 수 있고, 위에서 언급된 해당 자동화 플랫폼을 통해 기초 정보를 기록하고, 고장 경보 요청은 대처방안의 수행을 자동으로 트리거할 수 있으며, 예를 들어 고장을 이미 있는 대처방안과 관련시켜, 적시에 손실을 멈추게 한다.
2. 적시에 손실을 멈추게 한 후 근원을 위치 결정하여, 고장을 위치 결정하여 고장을 제거하는 동시에, 고장을 잠복해 있는 위험 및/또는 변경과 관련을 구축하고, 위치 결정하는 과정에서 실제 상황에 따라 기초 정보, 처리 정보 및 관련 정보를 입력할 수도 있다.
3. 잠복해 있는 위험을 등급화하고, 사용자 요구에 따라 개발하고 테스트하며 변경을 수행한다. 이미 알고 있는 잠복해 있는 위험 또는 변경일 경우, 이미 알고 있는 잠복해 있는 위험을 처리하고 대응하는 SOP를 호출하며, 이미 알고 있는 변경을 처리하고, 예를 들어 예상에 부합되지 않을 경우, 롤백 처리를 수행하여, 고장을 제거하고 변경을 종료하는 목적을 달성함으로써, 리스크를 제어한다. 동시에, 해당 잠복해 있는 위험 또는 변경의 고장 가중치를 각각 상향 조절하여, 해당 잠복해 있는 위험 및 변경의 실제 조성되는 고장의 리스크가 이미 증가하였음을 표명한다.
4. 새로운 잠복해 있는 위험으로 진단될 경우, 새로운 잠복해 있는 위험에 대해 잠복해 있는 위험 등급화 및 처리를 수행할 수도 있고, 처리 과정에서 역사 데이터를 빌어 해당 새로운 잠복해 있는 위험이 변경이 도입한 건지, 또는 제품 결함인지 여부를 분석할 수 있다.
여기서, 해당 새로운 잠복해 있는 위험 및 변경이 도입한 처리 과정을 분석하여 일단 이상을 발견하면, 주동으로 새로운 잠복해 있는 위험 및 변경을 고장에 관련시키고, 관련 정보를 입력한다. 제품 결함일 경우, 제품측의 복구를 추진하고, 다음에 서로 다른 변경의 고장 가중치에 대응하는 조작 등급에 따라 변경을 실시하여, 해당 제품측의 복구를 구현한다.
5. 새로운 잠복해 있는 위험 및 변경을 고장과 관련시키고 또 제품에 대해 복구를 수행하여, 잠복해 있는 위험을 제거할 수 있고, 나아가 관련된 고장을 제거할 수 있으며, 새로운 잠복해 있는 위험 및 변경이 일으키는 고장을 철저히 제거하고, 고장 총수를 감소하여, 수렴될 때까지, 고장을 모두 제거한다.
본 응용 예시를 사용하여, 클라우드 컴퓨팅 서비스의 실행 환경의 고장, 잠복해 있는 위험, 변경에 존재하는 단점에 대해, 완전한 폐쇄 루프 처리 과정을 제시하고, 잠복해 있는 위험, 변경 또는 기타 원인(예를 들어 제품 결함)이 고장을 초래한 후, 이런 트리거 고장의 파라미터와 고장을 주동으로 서로 관련시킴으로써, 발기한 고장 경보 요청에 응답하여, 고장의 근원을 위치 결정하고, 나아가 잠복해 있는 위험, 변경 또는 기타 원인까지 확대하여, 잠복해 있는 위험의 제거를 촉진하고, 변경을 안전하고 제어 가능하게 하며, 해당 고장(이미 있는 고장 및 새로운 고장의 도입)을 최종으로 제거하여 근절하며, 전체 흐름이 해당 자동화 플랫폼을 빌어 논리적인 폐쇄 루프를 형성하여, 클라우드 컴퓨팅 서비스의 실행 환경으로 하여금, 고장, 잠복해 있는 위험에 대해 폐쇄 루프의 수렴을 구현할 수 있고, 변경을 안전하고 제어 가능하게 함으로써, 이로 인해 발생하는 기업 고객의 업무 성능의 손상을 피하고, 클라우드 컴퓨팅 서비스의 안정성을 전체적으로 향상시킬 수 있다.
본 출원의 실시예에 따르면, 고장 예측 장치를 제공하고, 도 4는 본 출원의 실시예에 따른 고장 예측 장치의 구성 구조의 개략도이며, 도 4에 도시된 바와 같이, 해당 장치는, 고장 경보 요청을 획득하기 위한 요청 획득 모듈(41), 여기서, 상기 고장 경보 요청은 클라우드의 실행으로 인해 발생하는 고장, 잠복해 있는 위험 및 단말 사용자 차원의 조작에서 발생하는 변경 중의 적어도 두가지 고장 트리거 파라미터에서 취득함-; 상기 고장 경보 요청을 해석하여, 상기 고장, 상기 잠복해 있는 위험 및 상기 변경 중의 적어도 두가지 고장 트리거 파라미터를 취득하기 위한 요청 해석 모듈(42); 상기 고장, 상기 잠복해 있는 위험 및 상기 변경 중의 적어도 두가지 고장 트리거 파라미터 사이에 관련을 구축하여, 관련 결과를 취득하기 위한 관련 모듈(43); 및 상기 관련 결과에 따라 상기 고장 경보 요청을 일으키는 고장을 예측하고, 고장 예측 결과를 취득하기 위한 예측 모듈(44)을 포함한다.
하나의 실시형태에서, 상기 고장 예측 결과를 역사 예측값과 비교하고, 상기 역사 예측값을 결합하여 상기 고장 예측 결과를 수정하여, 수정 후의 예측 결과를 필요한 적어도 하나의 응용에 연결하도록 하기 위한 예측 비교 모듈을 더 포함한다.
하나의 실시형태에서, 상기 관련 모듈은, 상기 고장, 상기 잠복해 있는 위험 및 상기 변경을 다대다의 관계에 따라 각자 가중치의 가중 관련을 수행하여, 상기 관련 결과를 취득하기 위한 것이다. 여기서, 상기 각자 가중치는, 설계 요구 또는 역사 예측값에 따라 취득한 디폴트 값을 사용한다.
하나의 실시형태에서, 해당 장치는, 처리 정보에 따라 상기 각자 가중치에 대해 가중치 조정을 수행한 후 상기 가중 관련을 수행하기 위한 가중치 조정 모듈을 더 포함하고; 여기서, 상기 처리 정보는 상기 고장, 상기 잠복해 있는 위험, 상기 변경에 대한 분석 및/또는 처리를 수행한 후 발생되는 관련 정보를 표징하기 위한 것이다.
하나의 실시형태에서, 상기 관련 모듈은, 또한 상기 고장을 상기 역사 예측값에 관련시키고; 상기 역사 예측값에 따라 상기 고장을 예측한 후, 상기 고장을 상기 잠복해 있는 위험, 상기 변경과 동기화 관련을 하여, 상기 관련 결과를 취득하기 위한 것이다.
하나의 실시형태에서, 해당 장치는, 데이터 수집 조작 및/또는 상기 관련 결과의 취득 조작에 응답하여, 기초 정보, 처리 정보, 관련 정보 중의 적어도 하나를 입력하기 위한 제1 조작 응답 모듈을 더 포함한다. 여기서, 상기 기초 정보는, 상기 고장, 상기 잠복해 있는 위험, 상기 변경의 다양한 자체 정보를 표징하기 위한 것이고; 상기 처리 정보는, 상기 고장, 상기 잠복해 있는 위험, 상기 변경에 대한 분석 및/또는 처리를 수행한 후 발생되는 관련 정보를 표징하기 위한 것이고; 상기 관련 정보는, 상기 고장에 대응되는 고장의 업스트림 및 다운스트림의 관련 정보를 표징하기 위한 것이다.
하나의 실시형태에서, 해당 장치는, 데이터 수집의 표준화 입력 조작에 응답하여, 적어도 표준화 옵션 또는 표준화 템플릿을 포함하는 입력 전략 및/또는 입력 업데이트 전략을 획득하고; 상기 입력 전략 및/또는 입력 업데이트 전략에 따라, 상기 고장, 상기 잠복해 있는 위험, 상기 변경의 각종 정보에 대한 표준화 입력을 수행하기 위한 제2 조작 응답 모듈을 더 포함한다. 여기서, 상기 각종 정보는 기초 정보, 처리 정보, 관련 정보 중의 적어도 하나를 포함한다.
본 출원의 실시예의 각 장치 중의 각 모듈의 기능은 상술한 방법 중의 대응하는 설명을 참조할 수 있고, 여기서 다시 설명하지 않는다.
본 출원의 실시예에 따르면, 본 출원은 또한 전자 기기 및 판독 가능 저장 매체를 제공한다.
도 5에 도시된 바와 같이, 본 출원의 실시예의 고장 예측 방법을 구현하기 위한 전자 기기의 블록도이다. 해당 전자 기기는 전술한 배치 기기 또는 프록시 기기일 수 있다. 전자 기기는 랩톱 컴퓨터, 데스크톱 컴퓨터, 워크 스테이션, 개인용 정보 단말기, 서버, 블레이드 서버, 메인프레임 컴퓨터 및 기타 적합한 컴퓨터와 같은 다양한 형태의 디지털 컴퓨터를 나타내기 위한 것이다. 전자 기기는 개인용 디지털 처리, 셀룰러 폰, 스마트 폰, 웨어러블 기기 및 기타 유사한 컴퓨팅 장치와 같은 다양한 형태의 모바일 장치를 나타낼 수도 있다. 본문에 표시된 부재, 이들의 연결 및 관계 및 이들의 기능은 단지 예시적인 것으로서, 본문에서 설명되거나 및/또는 요구되는 본 출원의 구현을 한정하려는 의도가 아니다.
도 5에 도시된 바와 같이, 해당 전자 기기는 하나 또는 복수의 프로세서(801), 메모리(802), 및 고속 인터페이스 및 저속 인터페이스를 포함하는 각 부재를 연결하기 위한 인터페이스를 포함한다. 각각의 부재는 상이한 버스를 사용하여 상호 연결되고, 또한 공용 마더보드에 설치되거나 수요에 따라 다른 방식으로 설치될 수 있다. 프로세서는 전자 기기 내에서 실행되는 명령을 처리할 수 있고, 상기 명령은 메모리 내에 저장되거나 또는 메모리에 저장되어 외부 입력/출력 장치(예를 들어, 인터페이스에 결합된 디스플레이 기기)에 GUI를 표시하는 그래프 정보의 명령을 포함한다. 다른 실시형태에서, 수요되면, 복수의 프로세서 및/또는 복수의 버스를 복수의 메모리와 함께 사용할 수 있다. 마찬가지로, 복수의 전자 기기를 연결할 수 있으며, 각각의 기기는 일부 필요한 동작(예를 들어, 서버 어레이, 블레이드 서버 세트, 또는 멀티 프로세서 시스템으로 사용됨)을 제공한다. 도 5에서는 하나의 프로세서(801)를 예로 한다.
메모리(802)는 본 출원에서 제공된 비일시적 컴퓨터 판독 가능 저장 매체이다. 여기서, 상기 메모리에는 적어도 하나의 프로세서에 의해 실행 가능한 명령이 저장되며, 상기 적어도 하나의 프로세서로 하여금 본 출원의 실시예에서 제공된 고장 예측 방법을 수행하도록 한다. 본 출원의 비일시적 컴퓨터 판독 가능 저장 매체는 컴퓨터 명령을 저장하며, 해당 컴퓨터 명령은 컴퓨터로 하여금 본 출원에서 제공된 고장 예측 방법을 수행하도록 한다.
메모리(802)는 비일시적 컴퓨터 판독 가능 저장 매체로서, 비일시적 소프트웨어 프로그램, 비일시적 컴퓨터 실행 가능 프로그램 및 모듈, 예를 들어 본 출원의 실시예에서의 고장 예측 방법에 대응되는 프로그램 명령/모듈(예를 들어, 도 4에 도시된 요청 획득 모듈, 요청 해석 모듈, 관련 모듈, 예측 모듈 등의 모듈)을 저장하는데 사용될 수 있다. 프로세서(801)는 메모리(802)에 저장되어 있는 비일시적 소프트웨어 프로그램, 명령 및 모듈을 실행함으로써, 서버의 다양한 기능 응용 및 데이터 처리를 수행하며, 즉 상기 방법의 실시예에서의 고장 예측 방법을 구현한다.
메모리(802)는 프로그램 저장 구역 및 데이터 저장 구역을 포함할 수 있는 바, 여기서 프로그램 저장 구역은 운영 체제, 적어도 하나의 기능에 필요한 응용 프로그램을 저장할 수 있고; 데이터 저장 구역은 전자 기기의 사용에 의해 생성된 데이터를 저장할 수 있다. 이밖에, 메모리(802)는 고속 랜덤 액세스 메모리를 포함할 수 있고, 예를 들어 적어도 하나의 디스크 메모리, 플래시 메모리, 또는 기타 비일시적 솔리드 스테이트 메모리와 같은 비일시적 메모리를 더 포함할 수 있다. 일부 실시예에서, 메모리(802)는 프로세서(801)에 대해 원격으로 설치되는 메모리를 선택적으로 포함할 수 있고, 이러한 원격 메모리는 네트워크를 통해 전자 기기에 연결될 수 있다. 상기 네트워크의 구현예는 인터넷, 기업 인트라넷, 근거리 통신망, 이동 통신 네트워크 및 이들의 조합을 포함하지만 이에 한정되지 않는다.
본 출원의 실시예의 고장 예측 방법의 전자 기기는, 입력 장치(803) 및 출력 장치(804)를 더 포함할 수 있다. 프로세서(801), 메모리(802), 입력 장치(803) 및 출력 장치(804)는 버스 또는 기타 방식을 통해 연결될 수 있고, 도 5에서는 버스를 통한 연결을 예로 한다.
입력 장치(803)는 입력된 숫자 또는 문자 정보를 수신할 수 있고, 전자 기기의 사용자 설정 및 기능 제어와 관련된 키 신호 입력을 생성할 수 있으며, 예를 들어 터치 스크린, 키패드, 마우스, 트랙 패드, 터치 패드, 포인팅 스틱, 하나 또는 복수의 마우스 버튼, 트랙볼, 조이스틱 등 입력 장치일 수 있다. 출력 장치(804)는 디스플레이 기기, 보조 조명 장치(예를 들어, LED) 및 촉각 피드백 장치(예를 들어, 진동 모터) 등을 포함할 수 있다. 해당 디스플레이 기기는 액정 디스플레이 장치(LCD), 발광 다이오드(LED) 디스플레이 장치 및 플라즈마 디스플레이 장치를 포함할 수 있으나 이에 한정되지 않는다. 일부 실시형태에서, 디스플레이 기기는 터치 스크린일 수 있다.
여기에 설명되는 시스템 및 기술의 다양한 실시형태는 디지털 전자 회로 시스템, 집적 회로 시스템, 전용 ASIC (주문형 집적 회로), 컴퓨터 하드웨어, 펌웨어, 소프트웨어, 및/또는 이들의 조합에서 구현될 수 있다. 이러한 다양한 실시형태는 하나 또는 복수의 컴퓨터 프로그램에서 실시되는 것을 포함할 수 있고, 해당 하나 또는 복수의 컴퓨터 프로그램은 적어도 하나의 프로그래머블 프로세서를 포함한 프로그래머블 시스템에서 실행 및/또는 해석될 수 있으며, 해당 프로그래머블 프로세서는 전용 또는 일반 프로그래머블 프로세서로서, 저장 시스템, 적어도 하나의 입력 장치 및 적어도 하나의 출력 장치로부터 데이터 및 명령을 수신할 수 있으며, 또한, 데이터 및 명령을 해당 저장 시스템, 해당 적어도 하나의 입력 장치 및 해당 적어도 하나의 출력 장치로 전송할 수 있다.
이러한 컴퓨팅 프로그램(프로그램, 소프트웨어, 소프트웨어 애플리케이션 또는 코드로도 지칭됨)은 프로그래머블 프로세서의 기계 명령을 포함하고, 또한 고급 프로세스 및/또는 객체 지향 프로그래밍 언어, 및/또는 어셈블리/기계 언어를 사용하여 이러한 컴퓨팅 프로그램을 실시할 수 있다. 본문에 사용된 바와 같이, 용어 "기계 판독 가능 매체" 및 "컴퓨터 판독 가능 매체"는 기계 명령 및/또는 데이터를 프로그래머블 프로세서에 제공하기 위한 임의의 컴퓨터 프로그램 제품, 기기 및/또는 장치(예를 들어, 자기 디스크, 시디롬, 메모리, 프로그래머블 로직 장치(PLD))를 가리키며, 기계 판독 가능 신호로서의 기계 명령을 수신하는 기계 판독 가능 매체를 포함한다. 용어 "기계 판독 가능 신호"는 기계 명령 및/또는 데이터를 프로그래머블 프로세서에 제공하기 위한 임의의 신호를 가리킨다.
사용자와의 인터랙션을 제공하기 위해, 컴퓨터에서 여기에 설명되는 시스템 및 기술을 실시할 수 있으며, 해당 컴퓨터는, 사용자에게 정보를 디스플레이하기 위한 디스플레이 장치(예를 들어, CRT (음극선 관) 또는 LCD (액정 디스플레이) 모니터); 및 키보드 및 포인팅 장치(예를 들어, 마우스 또는 트랙볼)을 구비하고, 사용자는 해당 키보드 및 해당 포인팅 장치를 통해 컴퓨터에 입력을 제공할 수 있다. 기타 유형의 장치도 사용자와의 인터랙션을 제공하기 위해 사용될 수 있는 바, 예를 들어, 사용자에게 제공되는 피드백은 모든 형식의 감각 피드백(예를 들어, 시각 피드백, 청각 피드백 또는 촉각 피드백)일 수 있으며; 모든 형식(소리 입력, 음성 입력 또는 촉각 입력을 포함함)에 의해 사용자로부터의 입력을 수신할 수 있다.
여기에 설명되는 시스템 및 기술은 백그라운드 부재를 포함하는 컴퓨팅 시스템(예를 들어, 데이터 서버로 사용됨), 또는 미들웨어 부재를 포함하는 컴퓨팅 시스템(예를 들어, 애플리케이션 서버), 또는 프런트엔드 부재를 포함하는 컴퓨팅 시스템(예를 들어, 그래픽 사용자 인터페이스 또는 네트워크 브라우저를 구비한 사용자 컴퓨터로서, 사용자는 해당 그래픽 사용자 인터페이스 또는 해당 네트워크 브라우저를 통해 여기서 설명되는 시스템 및 기술의 실시형태와 인터랙션할 수 있음), 또는 이러한 백그라운드 부재, 미들웨어 부재, 또는 프런트엔드 부재를 포함하는 임의의 조합의 컴퓨팅 시스템에서 실시될 수 있다. 시스템의 부재는 모든 형태 또는 매체의 디지털 데이터 통신(예를 들어, 통신 네트워크)을 통해 서로 연결될 수 있다. 통신 네트워크의 예시는, 근거리 통신망(LAN), 광역 통신망(WAN) 및 인터넷을 포함한다.
컴퓨터 시스템은 클라이언트 및 서버를 포함할 수 있다. 클라이언트 및 서버는 일반적으로 서로 원격으로 설치되며, 일반적으로 통신 네트워크를 통해 인터랙션을 진행한다. 클라이언트와 서버 간의 관계는 대응되는 컴퓨터에서 실행되고 서로 클라이언트-서버 관계를 갖는 컴퓨터 프로그램을 통해 발생된다.
본 출원을 사용하면, 고장 경보 요청을 획득할 수 있고, 상기 고장 경보 요청은 클라우드의 실행으로 인해 발생하는 고장, 잠복해 있는 위험 및 단말 사용자 차원의 조작에서 발생하는 변경 중의 적어도 두가지 고장 트리거 파라미터에서 취득하며; 상기 고장 경보 요청을 해석하여, 상기 고장, 상기 잠복해 있는 위험 및 상기 변경 중의 적어도 두가지 고장 트리거 파라미터를 취득할 수 있고; 상기 고장, 상기 잠복해 있는 위험 및 상기 변경 중의 적어도 두가지 고장 트리거 파라미터 사이에 관련을 구축하여, 관련 결과를 취득할 수 있고; 상기 관련 결과에 따라 상기 고장 경보 요청을 일으키는 고장을 예측하고, 고장 예측 결과를 취득할 수 있다. 본 출원은 고장 경보 요청을 트리거하는 고장 자체, 및 고장과 관련된 예를 들어 잠복해 있는 위험 및 변경 중의 적어도 두가지 고장 트리거 파라미터에 기반하여 관련을 구축하고, 관련을 구축하여 취득한 관련 결과에 따라 해당 고장 경보 요청을 일으키는 고장에 대해 예측하므로, 고장 예측의 정확성을 향상시킬 수 있다.
상술한 설명에서 언급된 다양한 형태의 프로세스를 사용하여, 단계를 재배열, 추가 또는 삭제할 수 있음을 이해해야 한다. 예를 들어, 본 출원에 기재된 각 단계는 병렬로, 순차적으로, 또는 상이한 순서로 수행될 수 있으며, 본 출원에 개시된 기술적 해결수단이 예기한 결과를 구현할 수만 있다면, 본문은 여기서 한정되지 않는다.
상술한 구체적인 실시형태는 본 출원의 보호 범위를 한정하려는 것이 아니다. 해당 분야 기술자는, 설계 요구 및 기타 요소에 따라 다양한 수정, 조합, 하위 조합 및 대체가 이루어질 수 있음을 인식해야 할 것이다. 본 출원의 사상 및 원칙 이내에서 이루어진 그 어떤 수정, 균등 교체 및 개량 등은 모두 본 출원의 보호 범위 이내에 포함되어야 한다.

Claims (17)

  1. 고장 예측 방법에 있어서,
    고장 경보 요청을 획득하는 것, 여기서, 상기 고장 경보 요청은 클라우드의 실행으로 인해 발생하는 고장, 잠복해 있는 위험 및 단말 사용자 차원의 조작에서 발생하는 변경 중의 적어도 두가지 고장 트리거 파라미터에서 취득함;
    상기 고장 경보 요청을 해석하여, 상기 고장, 상기 잠복해 있는 위험 및 상기 변경 중의 적어도 두가지 고장 트리거 파라미터를 취득하는 것;
    상기 고장, 상기 잠복해 있는 위험 및 상기 변경 중의 적어도 두가지 고장 트리거 파라미터 사이에 관련을 구축하여, 관련 결과를 취득하는 것; 및
    상기 관련 결과에 따라 상기 고장 경보 요청을 일으키는 고장을 예측하고, 고장 예측 결과를 취득하는 것; 을 포함하는 것
    을 특징으로 하는 고장 예측 방법.
  2. 제1항에 있어서,
    상기 고장 예측 결과를 역사 예측값과 비교하고, 상기 역사 예측값을 결합하여 상기 고장 예측 결과를 수정하여, 수정 후의 예측 결과를 필요한 적어도 하나의 응용에 연결하는 것을 더 포함하는 것
    을 특징으로 하는 방법.
  3. 제1항에 있어서,
    상기의 상기 고장, 상기 잠복해 있는 위험 및 상기 변경 중의 적어도 두가지 고장 트리거 파라미터 사이에 관련을 구축하여, 관련 결과를 취득하는 것은,
    상기 고장, 상기 잠복해 있는 위험 및 상기 변경을 다대다의 관계에 따라 각자 가중치의 가중 관련을 수행하여, 상기 관련 결과를 취득하는 것을 포함하고;
    상기 각자 가중치는, 설계 요구 또는 역사 예측값에 따라 취득한 디폴트 값을 사용하는 것
    을 특징으로 하는 방법.
  4. 제3항에 있어서,
    처리 정보에 따라 상기 각자 가중치에 대해 가중치 조정을 수행한 후 상기 가중 관련을 수행하는 것을 더 포함하고,
    상기 처리 정보는 상기 고장, 상기 잠복해 있는 위험, 상기 변경에 대한 분석 및/또는 처리를 수행한 후 발생되는 관련 정보를 표징하기 위한 것
    을 특징으로 하는 방법.
  5. 제2항에 있어서,
    상기의 상기 고장, 상기 잠복해 있는 위험 및 상기 변경 중의 적어도 두가지 고장 트리거 파라미터 사이에 관련을 구축하여, 관련 결과를 취득하는 것은,
    상기 고장을 상기 역사 예측값에 관련시키는 것;
    상기 역사 예측값에 따라 상기 고장을 예측한 후, 상기 고장을 상기 잠복해 있는 위험, 상기 변경과 동기화 관련을 하여, 상기 관련 결과를 취득하는 것; 을 포함하는 것
    을 특징으로 하는 방법.
  6. 제1항 내지 제5항 중 어느 한 항에 있어서,
    데이터 수집 조작 및/또는 상기 관련 결과의 취득 조작에 응답하여, 기초 정보, 처리 정보, 관련 정보 중의 적어도 하나를 입력하는 것을 더 포함하고,
    상기 기초 정보는, 상기 고장, 상기 잠복해 있는 위험, 상기 변경의 다양한 자체 정보를 표징하기 위한 것이고;
    상기 처리 정보는, 상기 고장, 상기 잠복해 있는 위험, 상기 변경에 대한 분석 및/또는 처리를 수행한 후 발생되는 관련 정보를 표징하기 위한 것이고;
    상기 관련 정보는, 상기 고장에 대응되는 고장의 업스트림 및 다운스트림의 관련 정보를 표징하기 위한 것
    을 특징으로 하는 방법.
  7. 제1항 내지 제5항 중 어느 한 항에 있어서,
    데이터 수집의 표준화 입력 조작에 응답하여, 적어도 표준화 옵션 또는 표준화 템플릿을 포함하는 입력 전략 및/또는 입력 업데이트 전략을 획득하는 것; 및
    상기 입력 전략 및/또는 입력 업데이트 전략에 따라, 상기 고장, 상기 잠복해 있는 위험, 상기 변경의 각종 정보에 대한 표준화 입력을 수행하는 것; 을 더 포함하고,
    상기 각종 정보는 기초 정보, 처리 정보, 관련 정보 중의 적어도 하나를 포함하는 것
    을 특징으로 하는 방법.
  8. 고장 예측 장치에 있어서,
    고장 경보 요청을 획득하기 위한 요청 획득 모듈, 여기서, 상기 고장 경보 요청은 클라우드의 실행으로 인해 발생하는 고장, 잠복해 있는 위험 및 단말 사용자 차원의 조작에서 발생하는 변경 중의 적어도 두가지 고장 트리거 파라미터에서 취득함;
    상기 고장 경보 요청을 해석하여, 상기 고장, 상기 잠복해 있는 위험 및 상기 변경 중의 적어도 두가지 고장 트리거 파라미터를 취득하기 위한 요청 해석 모듈;
    상기 고장, 상기 잠복해 있는 위험 및 상기 변경 중의 적어도 두가지 고장 트리거 파라미터 사이에 관련을 구축하여, 관련 결과를 취득하기 위한 관련 모듈; 및
    상기 관련 결과에 따라 상기 고장 경보 요청을 일으키는 고장을 예측하고, 고장 예측 결과를 취득하기 위한 예측 모듈; 을 포함하는 것
    을 특징으로 하는 고장 예측 장치.
  9. 제8항에 있어서,
    상기 장치는,
    상기 고장 예측 결과를 역사 예측값과 비교하고, 상기 역사 예측값을 결합하여 상기 고장 예측 결과를 수정하여, 수정 후의 예측 결과를 필요한 적어도 하나의 응용에 연결하기 위한 예측 비교 모듈을 더 포함하는 것
    을 특징으로 하는 장치.
  10. 제8항에 있어서,
    상기 관련 모듈은,
    상기 고장, 상기 잠복해 있는 위험 및 상기 변경을 다대다의 관계에 따라 각자 가중치의 가중 관련을 수행하여, 상기 관련 결과를 취득하기 위한 것이고;
    상기 각자 가중치는, 설계 요구 또는 역사 예측값에 따라 취득한 디폴트 값을 사용하는 것
    을 특징으로 하는 장치.
  11. 제10항에 있어서,
    상기 장치는,
    처리 정보에 따라 상기 각자 가중치에 대해 가중치 조정을 수행한 후 상기 가중 관련을 수행하기 위한 가중치 조정 모듈을 더 포함하고;
    상기 처리 정보는 상기 고장, 상기 잠복해 있는 위험, 상기 변경에 대한 분석 및/또는 처리를 수행한 후 발생되는 관련 정보를 표징하기 위한 것
    을 특징으로 하는 장치.
  12. 제9항에 있어서,
    상기 관련 모듈은, 또한,
    상기 고장을 상기 역사 예측값에 관련시키고;
    상기 역사 예측값에 따라 상기 고장을 예측한 후, 상기 고장을 상기 잠복해 있는 위험, 상기 변경과 동기화 관련을 하여, 상기 관련 결과를 취득하기 위한 것
    을 특징으로 하는 장치.
  13. 제8항 내지 제12항 중 어느 한 항에 있어서,
    상기 장치는,
    데이터 수집 조작 및/또는 상기 관련 결과의 취득 조작에 응답하여, 기초 정보, 처리 정보, 관련 정보 중의 적어도 하나를 입력하기 위한 제1 조작 응답 모듈을 더 포함하고;
    상기 기초 정보는, 상기 고장, 상기 잠복해 있는 위험, 상기 변경의 다양한 자체 정보를 표징하기 위한 것이고;
    상기 처리 정보는, 상기 고장, 상기 잠복해 있는 위험, 상기 변경에 대한 분석 및/또는 처리를 수행한 후 발생되는 관련 정보를 표징하기 위한 것이고;
    상기 관련 정보는, 상기 고장에 대응되는 고장의 업스트림 및 다운스트림의 관련 정보를 표징하기 위한 것
    을 특징으로 하는 장치.
  14. 제8항 내지 제12항 중 어느 한 항에 있어서,
    상기 장치는,
    데이터 수집의 표준화 입력 조작에 응답하여, 적어도 표준화 옵션 또는 표준화 템플릿을 포함하는 입력 전략 및/또는 입력 업데이트 전략을 획득하고;
    상기 입력 전략 및/또는 입력 업데이트 전략에 따라, 상기 고장, 상기 잠복해 있는 위험, 상기 변경의 각종 정보에 대한 표준화 입력을 수행하기 위한 제2 조작 응답 모듈을 더 포함하고;
    상기 각종 정보는 기초 정보, 처리 정보, 관련 정보 중의 적어도 하나를 포함하는 것
    을 특징으로 하는 장치.
  15. 전자 기기에 있어서,
    적어도 하나의 프로세서; 및
    상기 적어도 하나의 프로세서와 통신 연결된 메모리를 포함하고,
    상기 메모리에는 상기 적어도 하나의 프로세서에 의해 실행 가능한 명령이 저장되어 있으며, 상기 명령은 상기 적어도 하나의 프로세서에 의해 실행되여, 상기 적어도 하나의 프로세서로 하여금 제1항 내지 제5항 중 어느 한 항의 방법을 실행 가능하도록 하는 것을 특징으로 하는 전자 기기.
  16. 컴퓨터 명령이 저장되어 있는 비일시적 컴퓨터 판독 가능 저장 매체에 있어서,
    상기 컴퓨터 명령은 상기 컴퓨터로 하여금 제1항 내지 제5항 중 어느 한 항의 방법을 실행하도록 하는 것을 특징으로 하는 컴퓨터 명령이 저장되어 있는 비일시적 컴퓨터 판독 가능 저장 매체.
  17. 컴퓨터 판독가능 저장 매체에 저장된 컴퓨터 프로그램에 있어서,
    상기 컴퓨터 프로그램 중의 명령이 프로세서에 의해 실행될 경우, 제1항 내지 제5항 중 어느 한 항의 방법을 구현하는 것을 특징으로 하는 컴퓨터 판독가능 저장 매체에 저장된 컴퓨터 프로그램.
KR1020210038355A 2020-07-20 2021-03-24 고장 예측 방법, 장치, 전자 기기, 저장 매체 및 컴퓨터 프로그램 KR20210040861A (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN202010700415.5A CN111858120B (zh) 2020-07-20 2020-07-20 故障预测方法、装置、电子设备及存储介质
CN202010700415.5 2020-07-20

Publications (1)

Publication Number Publication Date
KR20210040861A true KR20210040861A (ko) 2021-04-14

Family

ID=73000725

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020210038355A KR20210040861A (ko) 2020-07-20 2021-03-24 고장 예측 방법, 장치, 전자 기기, 저장 매체 및 컴퓨터 프로그램

Country Status (5)

Country Link
US (1) US11675649B2 (ko)
EP (1) EP3923140A3 (ko)
JP (1) JP7237110B2 (ko)
KR (1) KR20210040861A (ko)
CN (1) CN111858120B (ko)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115919544A (zh) * 2023-03-13 2023-04-07 威海东舟医疗器械股份有限公司 一种基于人工智能的鼓膜治疗仪故障预测系统
CN116502896A (zh) * 2023-06-25 2023-07-28 苏禹水务科技(南京)有限公司 一种基于bim+gis技术的泵站智能控制方法及系统

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112799868B (zh) * 2021-02-08 2023-01-24 腾讯科技(深圳)有限公司 一种根因确定方法、装置、计算机设备及存储介质
CN113643522B (zh) * 2021-08-31 2023-06-06 中国银行股份有限公司 报警预测方法、装置、设备和存储介质
CN114090411B (zh) * 2022-01-20 2022-09-16 山东中创软件商用中间件股份有限公司 一种应用数据分析方法、装置、设备及可读存储介质
CN114757380B (zh) * 2022-04-29 2024-02-20 西安热工研究院有限公司 一种火电厂故障预警系统、方法、电子设备及存储介质
US20240069999A1 (en) * 2022-08-31 2024-02-29 Microsoft Technology Licensing, Llc Detecting and mitigating cross-layer impact of change events on a cloud computing system
CN115801581B (zh) * 2022-11-12 2023-09-19 珠海易立方软件有限公司 电力现场的协同管理方法、系统、存储介质及电子设备
CN115840915B (zh) * 2022-11-22 2023-07-28 广州城轨科技有限公司 机电设备故障的自动识别方法、系统、终端及存储介质
CN115859058B (zh) * 2023-02-27 2023-05-30 中南大学湘雅医院 一种基于宽度学习网络的ups故障预测方法和系统
CN116258484B (zh) * 2023-05-16 2023-08-18 青岛创新奇智科技集团股份有限公司 设备的预测性运维方案生成方法、装置、终端设备和介质
CN116503975B (zh) * 2023-06-29 2023-09-12 成都秦川物联网科技股份有限公司 基于智慧燃气gis的安全隐患处置方法和物联网系统
CN116935234B (zh) * 2023-09-18 2023-12-26 众芯汉创(江苏)科技有限公司 一种输电线走廊点云数据自动分类和树障预警系统及方法

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008015596A (ja) * 2006-07-03 2008-01-24 Nec Fielding Ltd 管理サーバ及び修復プログラム送信方法
JP2008234351A (ja) * 2007-03-20 2008-10-02 Nec Corp 統合運用監視システム及びプログラム
JP5193533B2 (ja) * 2007-09-04 2013-05-08 株式会社東芝 遠隔監視システム及び遠隔監視方法
JP6065547B2 (ja) * 2011-11-28 2017-01-25 三菱化学株式会社 着色樹脂組成物、カラーフィルタ、液晶表示装置及び有機el表示装置
JP5910727B2 (ja) * 2012-03-14 2016-04-27 日本電気株式会社 運用管理装置、運用管理方法、及び、プログラム
US9542296B1 (en) * 2014-12-01 2017-01-10 Amazon Technologies, Inc. Disk replacement using a predictive statistical model
US9594624B2 (en) * 2015-06-12 2017-03-14 International Business Machines Corporation Resolving and preventing computer system failures caused by changes to the installed software
JP6524822B2 (ja) * 2015-07-01 2019-06-05 株式会社リコー 情報処理システム、故障予測モデル採用判定方法及びプログラム
CN106899436A (zh) 2017-02-22 2017-06-27 郑州云海信息技术有限公司 一种云平台故障预测诊断系统
CN107256457A (zh) * 2017-06-05 2017-10-17 国网江苏省电力公司电力科学研究院 一种电能表自动化检定车间智能巡检系统
JP2019053474A (ja) * 2017-09-14 2019-04-04 先智雲端數據股▲分▼有限公司ProphetStor Data Services, Inc. クラウドベースサービスのデータ保護方法
US10613962B1 (en) * 2017-10-26 2020-04-07 Amazon Technologies, Inc. Server failure predictive model
CN108256654B (zh) * 2018-01-02 2022-06-21 中电长城(长沙)信息技术有限公司 一种设备报障和故障诊断方法及系统
CN110096039A (zh) 2019-04-10 2019-08-06 珠海梅西互动技术有限公司 一种自动化设备机器互联系统及方法
CN110806730A (zh) * 2019-10-22 2020-02-18 重庆川仪自动化股份有限公司 大数据运维平台、服务器及存储介质
CN111258851B (zh) * 2020-01-14 2024-03-01 广州虎牙科技有限公司 一种集群的告警方法、装置、设置及存储介质

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115919544A (zh) * 2023-03-13 2023-04-07 威海东舟医疗器械股份有限公司 一种基于人工智能的鼓膜治疗仪故障预测系统
CN115919544B (zh) * 2023-03-13 2023-05-23 威海东舟医疗器械股份有限公司 一种基于人工智能的鼓膜治疗仪故障预测系统
CN116502896A (zh) * 2023-06-25 2023-07-28 苏禹水务科技(南京)有限公司 一种基于bim+gis技术的泵站智能控制方法及系统
CN116502896B (zh) * 2023-06-25 2023-09-19 苏禹水务科技(南京)有限公司 一种基于bim+gis技术的泵站智能控制方法及系统

Also Published As

Publication number Publication date
US11675649B2 (en) 2023-06-13
CN111858120A (zh) 2020-10-30
EP3923140A3 (en) 2022-04-13
JP2021121956A (ja) 2021-08-26
JP7237110B2 (ja) 2023-03-10
US20210311813A1 (en) 2021-10-07
EP3923140A2 (en) 2021-12-15
CN111858120B (zh) 2023-07-28

Similar Documents

Publication Publication Date Title
KR20210040861A (ko) 고장 예측 방법, 장치, 전자 기기, 저장 매체 및 컴퓨터 프로그램
US9946633B2 (en) Assessing risk of software commits to prioritize verification resources
US9697722B2 (en) Methods, systems, and devices for managing a plurality of alarms
US8832657B1 (en) Customer impact predictive model and combinatorial analysis
US20180253728A1 (en) Optimizing fraud analytics selection
US8813025B1 (en) Customer impact predictive model and combinatorial analysis
CN112199355B (zh) 数据迁移方法、装置、电子设备及存储介质
US10372572B1 (en) Prediction model testing framework
CN113269359A (zh) 用户财务状况预测方法、设备、介质及计算机程序产品
CN114911492A (zh) 推理服务部署方法、装置、设备以及存储介质
EP4194984A1 (en) Method and apparatus for early warning of failure
CN112379913A (zh) 基于风险识别的软件优化方法、装置、设备及存储介质
CN116414608A (zh) 异常检测方法、装置、设备及存储介质
CN115269315A (zh) 一种异常检测方法、装置、设备、介质
CN114693116A (zh) 代码评审有效性的检测方法及装置、电子设备
US10084743B2 (en) Methods and systems for adaptive and contextual collaboration in a network
JP2022127958A (ja) 業務改善支援装置、プログラムおよびプログラムを格納した記憶媒体
CN113434382A (zh) 数据库性能监控方法、装置、电子设备及计算机可读介质
CN112579402A (zh) 一种应用系统故障定位的方法和装置
CN115190008B (zh) 故障处理方法、故障处理装置、电子设备及存储介质
US20230359925A1 (en) Predictive Severity Matrix
CN118093368A (zh) 一种数据质量检测方法、装置、电子设备及存储介质
Kasai et al. Fault-prone module prediction using a prediction model and manual inspection
CN116483732A (zh) 一种基于多数据源的测试方法、装置及设备
CN117827587A (zh) 数据库异常节点确定方法、装置、设备、介质和程序产品

Legal Events

Date Code Title Description
E902 Notification of reason for refusal
E601 Decision to refuse application