KR20070049064A - 컴퓨팅 시스템의 자율적 능력의 양적 측정 - Google Patents

컴퓨팅 시스템의 자율적 능력의 양적 측정 Download PDF

Info

Publication number
KR20070049064A
KR20070049064A KR1020060105486A KR20060105486A KR20070049064A KR 20070049064 A KR20070049064 A KR 20070049064A KR 1020060105486 A KR1020060105486 A KR 1020060105486A KR 20060105486 A KR20060105486 A KR 20060105486A KR 20070049064 A KR20070049064 A KR 20070049064A
Authority
KR
South Korea
Prior art keywords
recovery
congestion
computing system
period
time required
Prior art date
Application number
KR1020060105486A
Other languages
English (en)
Other versions
KR100985959B1 (ko
Inventor
쯔-킨 라우
피터 킨 릉 셤
Original Assignee
인터내셔널 비지네스 머신즈 코포레이션
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 인터내셔널 비지네스 머신즈 코포레이션 filed Critical 인터내셔널 비지네스 머신즈 코포레이션
Publication of KR20070049064A publication Critical patent/KR20070049064A/ko
Application granted granted Critical
Publication of KR100985959B1 publication Critical patent/KR100985959B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3409Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment for performance assessment
    • G06F11/3419Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment for performance assessment by assessing time
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/08Error detection or correction by redundancy in data representation, e.g. by using checking codes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3409Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment for performance assessment
    • G06F11/3428Benchmarking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/36Preventing errors by testing or debugging software
    • G06F11/3668Software testing
    • G06F11/3672Test management
    • G06F11/3688Test management for test execution, e.g. scheduling of test suites
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/36Preventing errors by testing or debugging software
    • G06F11/3668Software testing
    • G06F11/3672Test management
    • G06F11/3692Test management for test results analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Hardware Design (AREA)
  • Debugging And Monitoring (AREA)
  • Test And Diagnosis Of Digital Computers (AREA)

Abstract

본 발명은 컴퓨팅 시스템의 자동 능력의 양적 측정에 관한 것이다. 본 발명의 실시예에 따른 방법은 컴퓨팅 시스템에 작업 부하가 걸리게 하는 단계; 컴퓨터 시스템에 혼잡을 도입하는 단계; 컴퓨팅 시스템이 상기 도입된 혼잡에 응답하여 문제를 검출했다는 통지를 제공하는 단계; 검출된 문제를 해결하기 위해 회복 과정을 초기화하는 데에 필요한 시간을 결정하는 단계; 및 회복 과정을 실행하는 데에 필요한 시간을 결정하는 단계를 포함한다.
컴퓨팅 시스템, 작업 부하, 벤치마크, 혼잡 도입, 문제 검출, 회복 초기화

Description

컴퓨팅 시스템의 자율적 능력의 양적 측정{QUANTITATIVE MEASUREMNET OF THE AUTONOMIC CAPABILITIES OF COMPUTING SYSTMES}
도 1은 종래 기술에 따라 혼잡 도입을 이용한 예시의 벤치마킹 시스템을 도시한다.
도 2는 종래 기술에 따른 예시의 혼잡 도입 방법을 도시한다.
도 3은 본 발명의 일 실시예에 따라 혼잡 도입을 이용한 예시의 벤치마킹 시스템을 도시한다.
도 4는 본 발명의 일 실시예에 따른 예시의 혼잡 도입 방법을 도시한다.
도 5는 본 발명의 일 실시예에 따른 방법을 구현하기 위한 예시의 컴퓨터 시스템을 도시한다.
<도면의 주요 부호에 대한 간단한 설명>
100 : 벤치마킹 시스템
104 : 테스트중인 시스템 (SUT)
106 : 작업 부하
108 : 응답
112 : 혼잡
114 : 콜백 시스템
118 : 경고/메시지
본 발명은 일반적으로 컴퓨팅 시스템에 관한 것이다. 더욱 특히, 본 발명은 컴퓨팅 시스템의 자율/자기 관리 능력의 양적 측정에 관한 것이다.
자율적 컴퓨팅 (AC)는 컴퓨팅 시스템의 자기 관리 능력을 말하여, 여기에서 구성 성분은 컴퓨팅 시스템의 필요성을 예측하여 최소한의 사람의 중재로 문제를 해결하려고 한다. 오늘날, 대부분의 주요 하드웨어와 소프트웨어 판매자는 AC에 크게 투자한다. 이렇게 컴퓨팅 시스템의 AC 능력을 양적화하는 것이 중요하다.
혼잡 도입 (예를 들어, 이상의 도입)은 자율적 시스템의 이용 가능성을 평가하기 위해 테스팅 기관에 의해 보통 이용되는 기술이다. 종래 기술과 관련한 혼잡 도입을 이용하는 예시의 벤치마킹 시스템(10)을 도 1에 도시한다. 벤치마킹 시스템(10)은 벤치마크 드라이버(12) 및 테스트중인 시스템(SUT; 14)을 포함한다. 벤치마크 드라이버(12)는 SUT(14)에 통상의 시스템 이용을 나타내도록 설계된 작업 부하(16)가 걸리게 하고 SUT(14)로부터 응답(18)을 수신한다. 벤치마크 결과(20)는 SUT(14)가 벤치마크 드라이버(12)에 의해 측정되어지는 부과된 작업 부하(16)를 얼마나 만족할 수 있는지로 유도된다. 혼잡 (이상; 22)은 벤치마크 드라이버(12)에 의해 SUT(14)에 도입되어 SUT(14)의 "자가 치료"의 능력을 평가한다.
종래 기술에 따른 예시의 혼잡 도입 방법(24)을 도 2에 도시한다. 혼잡 도입 방법(24)은 도 1에 설명되는 벤치마킹 시스템(10)의 구성 성분에 관하여 후술될 것이다. 나타낸 바와 같이, "도입 슬롯"(26) 동안에, 작업 부하(16)가 SUT(14)에 적용되는 동안, 하나 이상의 혼잡(22)이 벤치마크 드라이버(12)에 의해 SUT(14)에 도입되게 된다. 혼잡(22)은 예를 들어, 소프트웨어 이상, 조작자 이상, 고위 하드웨어 이상 등을 포함한다. 각 도입 슬롯(26)은 기동 기간(28), 도입 기간(30), 검출 기간(32), 회복 기간(34), 및 유지 기간(36)을 포함하는 복수의 여러 주기를 포함한다. 기동 기간(28) 동안, SUT(14)는 정지 상태 조건이 성취될 때 까지 작업 부하(16)가 적용되어 실행된다. 도입 기간(30) 동안, SUT(14)는 미리 정해진 기간 동안 정지 상태 조건에서 실행되고, 그 후 혼잡이 벤치마크 드라이버(12)에 의해 SUT(14)에 도입된다. 검출 기간(32)은 SUT(14)에의 혼잡(22)의 도입과 벤치마크 드라이버(12)에 의한 회복 과정의 초기화 사이의 시간이다. 회복 기간(34)은 회복 동작을 실행하기 위해 SUT(14)에 필요한 시간이다. 유지 기간(36) 동안, SUT(14)는 계속 실행된다 (정지 상태), SUT(14)에 미치는 도입 혼란(22)의 영향은 유지 기간(36)의 종료시 평가된다. 혼란(22)은 유지 기간(36)의 종료시 제거된다 (선택적).
세 유형의 AC 시스템이 있는데, 이들 각각은 혼잡에 대해 다른 유형의 응답을 제공한다:
1. 비자율적 - 수동 혼잡 검출 및 수동 회복 초기화. 예를 들어, 데이터베이스 시스템의 조작자는 특정 프로세스에 관한 여러 불만들이 수신된 것을 헬프 데 스크에 의해 공지받는다. 응답으로, 조작자는 데이터 베이스 시스템에서 바람직하지 않은 프로세스를 종료한다.
2. 완전 자율적 - 자동 혼잡 검출 및 자동 회복 초기화. 예를 들어, 자동 관리기는 시스템에 바람직하지 않은 프로세스가 있다고 판정하여 사람의 중재 없이 자동적으로 프로세스를 종료한다.
3. 부분 자율적 - 자동 혼잡 검출 및 수동 회복 초기화. 예를 들어, 자동 관리기는 시스템에 바람직하지 않은 프로세스가 있다고 판정하여 경고/메시지를 송출한다. 사람의 조작자는 컨솔이나 페이저에서 경고/메시지를 수신하여 이 문제를 검출하게 된다. 응답으로, 조작자는 경고/메시지에서 제공되는 정보에 기초하여 바람직하지 않은 프로세스를 위치 확인하여 이를 종료시킨다.
종래의 이상 도입 방법에서는, 혼잡(22)이 정지 상태 동작 동안 SUT(14)에 도입된다. 혼잡(22)의 도입 후에, 벤치마크 드라이버(12)는 혼잡(22)의 유형에 기초하여 미리 정해진 시간 (즉, 검출 기간(32))을 대기한 후에, 회복 과정을 초기화한다. 따라서, 종래의 이상 도입 방법에서의 유일한 변수는 회복 기간(34)의 길이이다.
상술된 종래의 방법에는 몇 가지 문제점이 있는데, 예를 들어:
문제 1: 검출된 문제와 이 검출된 문제를 해결하는 방법에 대한 정보에 관하여 조작자에게 경고/메시지를 제공하는 반자동 시스템을 취급하는 데에 있어 유연성이 있다. 이 유형의 반자동 시스템이 예를 들어, 많은 데이터 베이스 시스템에서 우세한데, 이 때, 페이저나 그 외 통신 장치를 통해 데이터 베이스 관리자에게 경고/메시지가 통신된다. 자동화된 경고/메시지의 제공은 문제의 검출을 위한 시간을 상당히 줄이게 되므로, 고정된 검출 기간(32) (예를 들어, 회복 평균 시간 (Mean Time To Recover (MTTR) - 이상을 수리하는 데에 걸리는 평균 시간에서 유도됨)은 이런 유형의 상황에서는 동작하지 않게 된다. 이렇게, 반자동화 특성의 존재시 고정된 검출 기간(32)의 이용은 AC 능력의 정확한 반복적 측정을 제공하지 않게 된다.
문제 2: 시스템이 전자동 자기 치료 시스템인 경우, 벤치마크 드라이버(12)는 문제의 검출이나 문제의 회복의 타이밍 동안 제어가 안된다. 일 예는 디스크 서브시스템이 디스크 이상을 자동으로 검출하여 자동적으로 이상 디스크를 바이패스하는 데이터 베이스 시스템의 RAID5 디스크 이상 허용이 있다.
따라서, 여러 정도의 자동화 (즉, 비자동, 전자동, 및 반자동)을 갖는 자동 능력의 시스템을 양적 측정하기 위한 개선된 방법의 필요성이 있다.
일반적으로, 본 발명은 컴퓨팅 시스템의 자동 능력의 양적 측정에 관한 것이다. 특히, 본 발명은 문제를 검출하는 데에 걸리는 시간을 시뮬레이트하는 별개의 조정 가능한 검출 기간 및 문제를 해결하기 위한 회복 과정을 초기화하는 데에 걸리는 시간을 시뮬레이트하는 개별의 조정 가능한 회복 초기화 기간을 이용하여 이상 검출을 실행함으로써, 모든 유형의 자동 컴퓨팅 시스템, 특히, 반자동 컴퓨팅 시스템의 자율적 능력을 양적으로 측정하도록 구성된다.
본 발명의 제1 형태는 컴퓨팅 시스템의 자율적 능력을 측정하기 위한 방법에 관한 것으로, 컴퓨팅 시스템에 작업 부하가 걸리게 하는 단계; 컴퓨터 시스템에 혼 잡을 도입하는 단계; 컴퓨팅 시스템이 도입된 혼잡에 응답하여 문제를 검출했다는 통지를 제공하는 단계; 검출된 문제를 해결하기 위해 회복 과정을 초기화하는 데에 필요한 시간을 결정하는 단계; 및 회복 과정을 실행하는 데에 필요한 시간을 결정하는 단계를 포함한다.
본 발명의 제2 형태는 컴퓨팅 시스템의 자율적 능력을 측정하기 위한 시스템에 관한 것으로, 컴퓨팅 시스템에 작업 부하가 걸리게 하기 위한 시스템; 컴퓨팅 시스템에 혼잡을 도입하기 위한 시스템; 컴퓨팅 시스템이 도입된 혼잡에 응답하여 문제를 검출했다는 통지를 제공하기 위한 시스템; 검출된 문제를 해결하기 위해서 회복 과정을 초기화하는 데에 필요한 시간을 결정하기 위한 시스템; 및 회복 과정을 실행하는 데에 필요한 시간을 결정하기 위한 시스템을 포함한다.
본 발명의 제3 형태는 컴퓨팅 시스템의 자율적 능력을 측정하기 위한 컴퓨터 판독 가능한 매체에 저장된 프로그램 제품에 관한 것으로, 컴퓨터 판독 가능한 매체는 컴퓨팅 시스템에 작업 부하가 걸리게 하는 단계; 컴퓨팅 시스템에 혼잡을 도입하는 단계; 컴퓨팅 시스템이 도입된 혼잡에 응답하여 문제를 검출했다는 통지를 제공하는 단계; 검출된 문제를 해결하기 위해 회복 과정을 초기화하는 데에 필요한 시간을 결정하는 단계; 및 회복 과정을 실행하는 데에 필요한 시간을 결정하는 단계를 실행하기 위한 프로그램 코드를 포함한다.
본 발명의 이들 및 그 외 특성들은 첨부한 도면을 참조한 본 발명의 여러 형태의 다음 상세 설명으로부터 더욱 용이하게 이해될 것이다.
도면은 본 발명의 특정 변수를 표현하고자 하는 것이 아니고, 단순히 개략적으로 도시한 것이다. 도면은 본 발명의 통상적인 실시예만을 도시하고자 한 것이므로, 본 발명의 영역을 제한하고자 하는 것은 아니다. 도면에서, 유사한 부호는 유사한 요소를 나타낸다.
일반적으로, 본 발명은 컴퓨팅 시스템의 자율적 능력의 양적 측정에 관한 것이다. 특히, 본 발명은 문제를 검출하는 데에 걸리는 시간을 시뮬레이트하는 별개의 조정 가능한 검출 기간 및 문제를 해결하기 위한 회복 과정을 초기화하는 데에 걸리는 시간을 시뮬레이트하는 개별의 조정 가능한 회복 초기화 기간을 이용하여 이상 검출을 실행함으로써, 모든 유형의 자동 컴퓨팅 시스템, 특히 반자동 컴퓨팅 시스템의 자율적 능력을 양적으로 측정하도록 구성된다.
본 발명의 일 실시예에 따른 혼잡 도입을 이용한 예시의 벤치마킹 시스템(100)을 도 3에 도시한다. 벤치마킹 시스템(100)은 벤치마크 드라이버(102) 및 테스트중인 시스템 (SUT; 104)을 포함한다. 벤치마크 드라이버(102)는 SUT(104)에 통상의 시스템 이용을 나타내게 설계된 작업 부하(106)가 걸리게 하고 SUT(104)로부터 응답(108)을 수신한다. 벤치마크 결과(100)는 SUT(104)가 벤치마크 드라이버(102)에 의해 측정되는 부과된 작업 부하(106)를 얼마나 빨리 만족할 수 있는지로부터 유도된다. 혼잡 (이상; 112)은 SUT(104)가 자가 치료하는 능력을 평가하기 위해 벤치마크 드라이버(102)에 의해 SUT(104)에 도입된다. 벤치마킹 시스템(100)은 SUT(104)가 혼잡(112)의 SUT(104)에의 도입에 응답하여 발생한 문제를 자가 검출할 때를 벤치마크 드라이버(102)에게 통지하기 위한 콜백 시스템(114)을 더 포함 한다. 도시하지는 않았지만, 콜백 시스템(114)은 벤치마크 드라이버(102)에 결합될 수 있다. 본 발명의 일 실시예에서, 콜백 시스템(114)는 문제의 검출에 응답하여 SUT(104)에 의해 형성된 경고/메시지(118)를 수신하거나 차단하도록 구성될 수 있다. 경고/메시지(118)는 예를 들어, SUT(104)에 의해 형성되는 이메일, 텍스트 메시지, 기록 공고 등을 포함할 수 있다. 다른 실시예에서, 콜백 시스템(114)은 시스템 관리자의 콘솔에 표시되거나 시스템 로그 파일에 포함된 텍스트 경고/메시지 정보를 모니터, 분석하도록 구성될 수 있다. 혼잡 계열의 문제가 SUT(104)에 의해 검출될 때를 결정하기 위한 많은 다른 기술들이 또한 가능하다.
본 발명의 일 실시예에 따른 예시의 혼잡 도입 방법(102)이 도 4에 도시된다. 혼잡 도입 방법(120)은 도 3에 도시된 벤치마킹 시스템(100)의 구성 성분에 관련하여 후술된다. 나타낸 바와 같이, 도입 슬롯(122) 동안에, 작업 부하(106)가 SUT(104)에 적용되는 동안, 하나 이상의 혼잡(112)이 벤치마크 드라이버(102)에 의해 SUT(104)에 도입된다. 각 도입 슬롯(122)은 기동 기간(124), 도입 기간(126), 검출 기간(128), 회복 초기화 기간(130), 회복 기간(132) 및 유지 기간(134)을 포함하는 복수의 여러 시주기를 포함한다.
기동 기간(124) 동안, SUT(104)는 정지 상태 조건이 성취될 때 까지 작업 부하(106)가 적용되어 실행된다. 도입 기간(126) 동안, SUT(104)는 소정의 시주기 동안 정지 상태 조건에서 실행되고, 그 후 혼잡(112)이 벤치마크 드라이버(102)에 의해 SUT(104)에 도입된다. 그러나, 종래의 혼잡 도입 방법(24)에 관련하여 상술된 검출 기간(30)과 달리, 본 발명에 따른 검출 기간(128)은 SUT(104)에의 혼 잡(112)의 도입과, SUT(104)에 의한 문제의 검출에 응답하여 SUT(104)에 의해 형성된 콜백 시스템(114)에 의한 경고/메시지(118)의 검출 간의 시간이다.
회복 초기화 기간(130)은 검출 기간(128) 이후 (즉, 도입된 혼잡(112)에 의해 초래된 문제가 SUT(104)에 의해 검출되고 경고/메시지(118)가 형성된 후) 제공된다. 회복 초기화 기간(130)은 SUT(104)에 의해 검출된 특정 문제를 해결하기 위해 사람이 회복 과정을 초기화하는 데에 걸리는 시간을 나타낸다. 즉, 회복 초기화 기간(130)은 혼잡(112)의 도입으로 초래된 문제의 검출에 응답하여 인간의 중재를 시뮬레이트하는 소정의 시간 지연이다. 일 예로, 회복 초기화 기간(130)은 경고/메시지(118)에 응답하여 시스템에서 실행되는 프로세스를 조작자가 종료하고, 문제의 속성을 결정하여, 이를 해결하도록 진단 루틴을 초기화하는 명령에 맞추는 데에 걸리는 총 시간을 포함한다. 특정 혼잡의 경우에 대한 회복 초기화 기간(130)은 예를 들어, SUT(104)에 의해 검출된 특정 문제를 해결하도록 사람이 회복 과정을 초기화하는 데에 걸리는 시간을 통계적으로 연구 (예를 들어, 평균화)한 것에서 유도될 수 있다. 다른 기술이 또한 가능하다.
임의의 회복 초기화 기간(130)의 길이는 벤치마크 드라이버(102)에 의해 SUT(104)에 적용된 특정한 혼잡(112) (또는 혼잡(112)의 세트)에 따라 달라진다. 예를 들어, 제1 혼잡(112) "A"과 관련된 회복 초기화 기간(130)은 1분이고, 제2 혼잡(112) "B"과 관련된 회복 초기화 기간(130)은 10분일 수 있다. 이는 혼잡(112) "B"과 관련된 특정 회복 과정을 초기화하는 데에 필요한 시간이 혼잡(112) "A"와 관련된 특정 회복 과정을 초기화하는 데에 필요한 시간 보다 더 긴 것을 (즉, 10 배) 나타낸다. 벤치마크 드라이버(102)는 SUT(104)에 도입된 임의의 혼잡 (112) (또는 혼잡(112) 세트)에 대해 정확한 회복 초기화 기간(130)을 설정하기 위해 표 등에 액세스할 수 있다.
도 4를 참조하여, 회복 기간(132)은 회복 초기화 기간(130)의 종료시 초기화된 회복 과정을 실행하기 위해 SUT(104)에 필요한 기간을 나타낸다. 유지 기간(134) 동안, SUT(104)는 계속 실행된다 (정지 상태). 도입된 혼잡(112)이 SUT(104)에 미치는 영향은 유지 기간(134)의 종료시 평가된다. 혼잡(112)은 유지 기간(134)의 종료시 제거된다 (선택적). 임의의 이상 시나리오/시스템 구성에 대한 여러 기간(124, 126, 128, 130, 132 및 134) 각각은 사후 테스팅 분석을 위해 기록될 수 있다 (예를 들어, 벤치마크 결과(110)).
본 발명의 벤치마킹 시스템(100)은 여러 정도의 자동화 (즉, 비자동, 전자동, 및 반자동)을 갖는 시스템의 AC 능력을 측정하는 데에 이용될 수 있다. 예를 들어, 본 발명의 벤치마킹 시스템(100)을 이용하여 비자동 SUT(104)의 AC 능력을 측정하는 간단한 경우를 생각한다. 혼잡(112)은 도입 기간(126)의 종료시 벤치마크 드라이버(102)에 의해 비자동 SUT(104)으로 도입된다. 벤치마크 드라이버(102)는 (MTTR로부터 유도되는 것이 가능한) 검출 기간(128) 및 회복 초기화 기간(130)에 일정한 시간 지연을 할당할 수 있다.
전자동의 경우, 전자동 SUT(104)가 사람의 중재 없이 1분 내에 회복 과정을 검출하여 초기화한다고 가정한다. 검출 기간(128)과 회복 초기화 기간(130)의 총 길이는 1분이다. 전자동 SUT(104)는 스스로 회복하기 때문에, 벤치마크 드라이 버(102)는 검출 기간(128)과 회복 초기화 기간(130) 동안 제어하지 않는다. 이 경우, 벤치마크 드라이버(102)는 간단히 아무 동작도 하지 않는다. 벤치마크 드라이버(102)는 전자동 SUT(104)가 스스로 회복하기 때문에, 실행 종료시 성공적인 트랜잭션의 개수를 모을 필요가 있다. 전자동 시스템의 스코어는 자율적 검출과 회복 초기화에 소요되는 시간이 MTTR로부터 유도된 상수값 보다 더 짧다고 가정되기 때문에, 비자동 시스템의 것 보다 더 커야한다. 이것은 전자동 시스템의 장점을 반영한다.
반자동화의 경우, 검출은 자동이지만 회복 초기화는 그렇지 않는다. MTTR 방법은 회복 시간이 문제의 자동 검출에 응답하여 반자동 SUT(104)에 의해 형성된 경고/메시지(118)로 인해 현재 더 짧기 때문에, 이 경우 작동하지 않게 된다. 이렇게, 본 발명의 벤치마크 드라이버(102)는 검출 기간(128)과 회복 초기화 기간(130)을 개별적으로 취급한다. 검출 기간(128)은 혼잡(112)이 반자동 SUT(104)에 도입될 때 시작하며 경고/메시지(118)가 반자동 SUT(104)에 의해 형성될 때 종료한다. 콜백 시스템(114)은 경고/메시지(118) 또는 그 외 문제에 관한 통지가 반자동 SUT(104)에 의해 검출될 때를 결정하기 위해 벤치마크 드라이버(102)에 의해 이용된다. 벤치마크 드라이버(102)는 검출된 문제에 응답하여 사람이 회복 초기화를 완성하는 데에 소요되는 시간 (예를 들어, 평균 시간)을 나타내는 회복 초기화 기간(130)에 일정한 시간 지연을 할당할 수 있다. 이로 인해 반자동 SUT(104)의 AC 능력을 더욱 정확하고 반복 가능하게 측정할 수가 있다.
컴퓨팅 시스템의 자율적 능력의 양적 측정을 위한 컴퓨터 시스템(200)을 도 5에 나타낸다. 컴퓨터 시스템(200)은 컴퓨터 인프라구조(202)로 제공된다. 컴퓨터 시스템(200)은 본 발명의 개시를 실행할 수 있는 어느 유형의 컴퓨터 시스템이나 나타내는 것이다. 예를 들어, 컴퓨터 시스템(200)은 랩톱 컴퓨터, 데스크톱 컴퓨터, 워크스테이션, 핸드헬드 장치, 서버, 컴퓨터의 클러스터 등일 수 있다. 부가하여, 후술되는 바와 같이, 컴퓨터 시스템(200)은 본 발명에 따른 컴퓨팅 시스템의 자율적 능력의 양적 측정을 제공하는 서비스 프로바이더에 의해 전개 및/또는 동작될 수 있다. 유저/관리자(204)가 컴퓨터 시스템(200)을 직접 액세스하거나, 네트워크(206) (예를 들어, 인터넷, 원거리 영역망(WAN), 근거리 영역망(LAN), 가상 개인사설망(VPN) 등)를 통해 컴퓨터 시스템(200)과 통신하는 컴퓨터 시스템을 동작할 수 있다. 후자의 경우, 컴퓨터 시스템(200)과 유저 운영 컴퓨터 시스템 간의 통신은 여러 유형의 통신 링크의 조합으로 발생할 수 있다. 예를 들어, 통신 링크는 유선 및/또는 무선 전송 방법의 조합을 이용할 수 있는 어드레스 가능한 연결을 포함할 수 있다. 통신이 인터넷을 통해 발생하는 경우, 종래의 TCP/IP 소켓 계열의 프로토콜에 의해 연결이 제공되며, 인터넷 서비스 프로바이더가 인터넷에의 연결을 설정하는 데에 이용된다.
컴퓨터 시스템(200)은 처리 유닛(208), 메모리(210), 버스(212), 및 입/출력 (I/O) 인터페이스(214)를 포함하여 도시된다. 또한, 컴퓨터 시스템(200)은 외부 장치/리소스(216) 및 하나 이상의 저장소 유닛(218)과 통신하게 나타나 있다. 일반적으로, 처리 유닛(208)은 메모리(210) 및/또는 저장소 유닛(218)에 저장된 벤치마킹 시스템(230) 등의 컴퓨터 프로그램 코드를 실행한다. 컴퓨터 프로그램 코드 를 실행하면서, 처리 유닛(208)은 데이터를 메모리(210), 저장소 유닛(218) 및/또는 I/O 인터페이스(214)에/로부터 기록 및/또는 판독할 수 있다. 버스(212)는 컴퓨터 시스템(200)에의 각 구성 성분 사이에 통신 링크를 제공한다. 외부 장치/리소스(216)는 유저가 컴퓨터 시스템(200)과 상호 작용할 수 있게 하는 임의의 장치 (예를 들어, 키보드, 포인팅 장치, 디스플레이 (예로, 디스플레이(220)), 프린터 등) 및/또는 컴퓨터 시스템(200)이 하나 이상의 다른 컴퓨팅 장치와 통신할 수 있게 하는 임의의 장치 (예를 들어, 네트워크 카드, 모뎀 등)를 포함할 수 있다.
컴퓨터 인프라구조(202)는 본 발명을 구현하는 데에 이용될 수 있는 여러 유형의 컴퓨터 인프라구조를 나타낸다. 예를 들어, 일 실시예에서, 컴퓨터 인프라구조(202)는 본 발명의 여러 프로세스 단계를 실행하도록 네트워크 (예를 들어, 네트워크(106))를 통해 통신하는 둘 이상의 컴퓨팅 장치 (예를 들어, 서버 클러스터)를 포함할 수 있다. 더구나, 컴퓨터 시스템(200)은 본 발명의 실행시 이용될 수 있는 많은 유형의 컴퓨터 시스템을 나타내며, 이들 각각은 여러 조합의 하드웨어/소프트웨어를 포함할 수 있다. 예를 들어, 처리 유닛(208)은 단일의 처리 유닛을 포함하가나, 하나 이상의 위치, 예를 들어, 클라이언트와 서버에서, 하나 이상의 처리 유닛을 통해 분산될 수 있다. 유사하게, 메모리(210) 및/또는 저장소 시스템(216)은 하나 이상의 물리적 위치에 존재하는 여러 유형의 데이터 저장소 및/또는 전송 매체 조합을 포함할 수 있다. 더욱, I/O 인터페이스(214)는 하나 이상의 외부 장치/리소스(216)와 정보를 교환하기 위한 시스템을 포함한다. 또 다르게, 도 5에 나타내지 않은 하나 이상의 부가의 성분이 컴퓨터 시스템(200)에 포함될 수 있다는 것 이 이해된다. 그러나, 컴퓨터 시스템(200)이 핸드헬드 장치 등을 포함하면, 하나 이상의 외부 장치/리소스(216) (예를 들어, 디스플레이) 및/또는 하나 이상의 저장소 유닛(218)이 나타낸 바와 같이 컴퓨터 시스템(200) 외부가 아니고, 내부에 포함될 수 있는 것이 이해될 것이다.
저장소 유닛(218)은 벤치마크 결과, 회복 초기화 기간 등과 같이, 본 발명 하에서 정보에 저장소를 제공할 수 있는 어느 유형의 시스템 (예를 들어, 데이터베이스)이나 가능하다. 이렇게, 저장소 유닛(218)은 자기 디스크 드라이브 또는 광 디스크 드라이브와 같은 하나 이상의 저장 장치를 포함할 수 있다. 다른 실시예에서, 저장소 유닛(218)은 예를 들어, 근거리 통신망 (LAN), 원거리 통신망 (WAN) 또는 저장 영역망 (SAN) (도시 생략)을 걸쳐 분산되는 데이터를 포함한다. 도시하지는 않았지만, 캐시 메모리, 통신 시스템, 시스템 소프트웨어 등의 부가의 성분이 컴퓨터 시스템(200)에 결합될 수 있다. 더구나, 도시하지는 않았지만, 유저/관리자(204)에 의해 운영되는 컴퓨터 시스템은 컴퓨터 시스템(200)과 관련하여 상술된 것과 유사한 컴퓨터화된 성분을 포함할 수 있다.
메모리(210) (예를 들어, 컴퓨터 프로그램 제품으로)에는 SUT(104)와 같이, 컴퓨팅 시스템의 자율적 능력의 양적 측정을 제공하기 위한 벤치마킹 시스템(230)이 나타나 있다. 벤치마킹 시스템(230)은 SUT(104)에 통상의 시스템 이용을 나타내도록 설계된 작업 부하(106)가 걸리게 구성되며 SUT(104)로부터 응답(108)을 수신하는 벤치마크 드라이버(102)를 포함한다. 벤치마크 결과(110)는 SUT(104)가 벤치마크 드라이버(102)에 의해 측정되어진 부과된 작업 부하(106)를 얼마나 빨리 만 족할 수 있는지로부터 유도된다. 혼잡(이상; 112)은 SUT(104)의 자가 치료 능력을 평가하기 위해 벤치마크 드라이버(102)에 의해 SUT(104)에 도입된다. 벤치마킹 시스템(230)은 SUT(104)가 SUT(104)에의 혼잡(112) 도입에 응답하여 발생한 문제를 자동 검출할 때를 벤치마크 드라이버(102)에 통지하기 위한 콜백 시스템(114)를 더 포함한다. 벤치마크 드라이버(102)는 도 4와 관련하여 상술된 혼잡 도입 방법(120)에 따라 동작하도록 구성된다.
본 발명은 가입이나 요금에 따른 비지니스 방법으로 제공될 수 있다. 예를 들어, 본 발명의 하나 이상의 구성 성분은 고객에 대해 여기 기재된 기능을 제공하는 서비스 프로바이더에 의해 형성, 유지, 지원 및/또는 전개될 수 있다. 즉, 서비스 프로바이더는 상술된 바와 같이, 컴퓨팅 시스템의 자율적 능력의 양적 측정을 제공하는 데에 이용될 수 있다.
또한 본 발명은 하드웨어, 소프트웨어, 전파된 신호 또는 이들의 조합으로 실현될 수 있다. 어느 유형의 컴퓨터/서버 시스템 - 또는 그 외 여기 기재된 방법을 실행하는 장치가 적합하다. 통상의 하드웨어와 소프트웨어 조합이 로딩 및 실행시 여기 기재된 각 방법을 실행하는 컴퓨터 프로그램을 갖는 범용 컴퓨터 시스템을 포함할 수 있다. 다르게, 본 발명의 기능적 태스크 중 하나 이상을 실행하기 위한 특수 하드웨어를 포함하는 특정 용도의 컴퓨터가 이용될 수 있다. 본 발명은 또한 여기 기재된 방법의 구현을 가능하게 하는 모든 각 특성들을 포함하고, 컴퓨터 시스템에 로딩시, 이들 방법을 실행할 수 있는 컴퓨터 프로그램 제품 또는 전파 신호에 내장될 수 있다.
본 발명은 완전한 하드웨어적 실시예, 완전한 소프트웨어적 실시예 또는 하드웨어와 소프트웨어 요소 둘다를 포함하는 실시예의 형태를 취할 수 있다. 바람직한 실시예에서, 본 발명은 이에만 제한되는 것은 아니지만, 펌웨어, 상주 소프트웨어, 마이크로코드 등을 포함하는 소프트웨어로 구현된다.
본 발명은 컴퓨터나 임의의 명령 실행 시스템에 이용되거나 이와 관련한 프로그램 코드를 제공하는 컴퓨터 이용 가능 또는 컴퓨터 판독 가능 매체로부터 액세스 가능한 컴퓨터 프로그램 제품의 형태를 취할 수 있다. 설명의 목적으로, 컴퓨터 이용 가능 또는 컴퓨터 판독 가능 매체는 명령 실행 시스템, 장치에 이용하거나 이와 관련한 프로그램을 포함, 저장, 통신, 전파, 또는 전송할 수 있는 어느 장치나 가능하다.
매체는 전자, 자기, 광학, 전자기, 적외선 또는 반도체 시스템 (또는 장치나 디바이스), 또는 전파 매체일 수 있다. 컴퓨터 판독 가능 매체의 예는 반도체나 고형 상태 메모리, 자기 테이프, 착탈 가능한 컴퓨터 디스켓, 랜덤 액세스 메모리 (RAM), 리드 온리 메모리 (ROM), 강성 자기 디스크 및 광학 디스크를 포함한다. 광 디스크의 예는 콤팩트 디스크 - 리드 온리 디스크 (CD-ROM), 콤팩트 디스크 - 판독/기록 디스크 (CD-R/W) 및 디지털 휘발성 디스크 (DVD)를 포함한다.
컴퓨터 프로그램, 전파된 신호, 소프트웨어 프로그램, 프로그램 또는 소프트웨어는, 본 컨텍스트에서 어느 언어로나, 정보 처리 능력을 갖는 시스템이 특정 기능을 직접적으로나 아니면 다음 중 어느 것이나 둘 다 이후에 실행할 수 있게 하는 명령의 세트의 표현을 의미한다: (a) 다른 언어, 코드 또는 주해로의 전환, 및/또 는 (b) 다른 재료 유형으로의 재생.
본 발명의 바람직한 실시예의 상기 설명은 설명의 목적으로 나타낸 것이다. 이는 본 발명을 개시된 특정한 형태로 제한하고자 하는 것이 아니고, 분명히 많은 변형들이 가능하다. 당업자에게는 명확한 변형들은 첨부한 청구범위에서 정의되는 본 발명의 영역 내에 포함되는 것이다.
본 발명은 문제를 검출하는데에 걸리는 시간을 시뮬레이트하는 별개의 조정 가능한 검출 시간 및 문제를 해결하기 위한 회복과정을 초기화하는데에 걸리는 시간을 시뮬레이트하는 개별의 조정 가능한 회복 초기화 기간을 이용하여 이상 검출을 실행함으로써, 모든 유형의 자동 컴퓨팅 시스템, 특히, 반자동 컴퓨팅 시스템의 자율적 능력을 양적으로 측정하도록 하는 효과가 있다.

Claims (21)

  1. 컴퓨팅 시스템의 자율적 능력을 측정하기 위한 방법에 있어서:
    상기 컴퓨팅 시스템에 작업 부하가 걸리게 하는 단계;
    상기 컴퓨터 시스템에 혼잡을 도입하는 단계;
    상기 컴퓨팅 시스템이 상기 도입된 혼잡에 응답하여 문제를 검출했다는 통지를 제공하는 단계;
    상기 검출된 문제를 해결하기 위해 회복 과정을 초기화하는 데에 필요한 시간을 결정하는 단계; 및
    상기 회복 과정을 실행하는 데에 필요한 시간을 결정하는 단계
    를 포함하는 방법.
  2. 제1항에 있어서, 상기 혼잡의 도입부터 상기 통지의 수신 까지의 시간은 검출 기간을 포함하는 방법.
  3. 제2항에 있어서, 상기 통지를 제공하는 단계는:
    상기 도입된 혼잡에 응답하여 발생한 문제의 표시를 위해 상기 컴퓨팅 시스템의 출력을 모니터링하는 단계를 더 포함하는 방법.
  4. 제1항에 있어서, 상기 검출된 문제를 해결하기 위해 상기 회복 과정을 초기 화하는 데에 필요한 시간은 회복 초기화 기간을 포함하는 방법.
  5. 제4항에 있어서, 상기 회복 초기화 기간은 상기 컴퓨팅 시스템에 도입된 혼잡에 따라 달라지는 방법.
  6. 제4항에 있어서, 상기 회복 과정을 실행하는 데에 필요한 시간은 회복 기간을 포함하는 방법.
  7. 제4항에 있어서, 상기 회복 초기화 기간은 상기 통지에 응답하여 사람의 중재를 시뮬레이트하는 미리 정해진 시간의 지연을 나타내는 방법.
  8. 제7항에 있어서, 상기 검출된 문제를 해결하기 위해 사람이 상기 회복 과정을 초기화하는 데에 필요한 시간을 분석함으로써 상기 회복 초기화 기간을 유도하는 단계를 더 포함하는 방법.
  9. 제1항에 있어서, 상기 혼잡의 도입부터 상기 통지의 수신 까지의 시간은 검출 기간을 포함하고, 상기 검출된 문제를 해결하기 위해 상기 회복 과정을 초기화하는 데에 필요한 시간은 회복 초기화 기간을 포함하고, 상기 초기화된 회복 과정을 실행하는 데에 필요한 시간은 회복 기간을 포함하고, 상기 검출 기간, 상기 회복 초기화 기간, 및 회복 기간은 상기 컴퓨팅 시스템의 상기 자율적 능력의 측정을 제공하는 방법.
  10. 제9항에 있어서, 나중의 분석을 위해 적어도 상기 검출 기간, 상기 회복 초기화 기간 및 상기 회복 기간을 기록하는 단계를 더 포함하는 방법.
  11. 제1항에 있어서, 상기 컴퓨팅 시스템은 비자동 컴퓨팅 시스템, 전자동 컴퓨팅 시스템, 및 반자동 컴퓨팅 시스템으로 이루어진 그룹에서 선택되는 방법.
  12. 컴퓨팅 시스템의 자율적 능력을 측정하기 위한 장치를 전개하는 방법에 있어서, 제1항의 방법을 실행하도록 동작 가능한 컴퓨터 인프라구조를 제공하는 단계를 포함하는 방법.
  13. 컴퓨팅 시스템의 자율적 능력을 측정하기 위해 전파 신호로 구현되는 컴퓨터 소프트웨어에 있어서, 상기 컴퓨터 소프트웨어는 컴퓨터 시스템이 제1항의 방법을 실행하도록 하는 명령을 포함하는 소프트웨어.
  14. 컴퓨팅 시스템의 자율적 능력을 측정하기 위한 시스템에 있어서:
    상기 컴퓨팅 시스템에 작업 부하가 걸리게 하기 위한 시스템;
    상기 컴퓨팅 시스템에 혼잡을 도입하기 위한 시스템;
    상기 컴퓨팅 시스템이 상기 도입된 혼잡에 응답하여 문제를 검출했다는 통지 를 제공하기 위한 시스템;
    상기 검출된 문제를 해결하기 위해서 회복 과정을 초기화하는 데에 필요한 시간을 결정하기 위한 시스템; 및
    상기 회복 과정을 실행하는 데에 필요한 시간을 결정하기 위한 시스템
    을 포함하는 시스템.
  15. 제14항에 있어서, 상기 혼잡의 도입부터 상기 통지의 수신 까지의 시간은 검출 기간을 포함하고, 상기 검출된 문제를 해결하기 위해 상기 회복 과정을 초기화하는 데에 필요한 시간은 회복 초기화 기간을 포함하고, 상기 회복 과정을 실행하는 데에 필요한 시간은 회복 기간을 포함하는 시스템.
  16. 제15항에 있어서, 상기 통지를 제공하기 위한 시스템은:
    상기 도입된 혼잡에 응답하여 발생한 문제의 표시를 위해 상기 컴퓨팅 시스템의 출력을 모니터링하기 위한 시스템을 더 포함하는 시스템.
  17. 제15항에 있어서, 상기 회복 초기화 기간은 상기 통지에 응답하여 사람의 중재를 시뮬레이트하는 미리 정해진 시간 지연을 나타내는 시스템.
  18. 제17항에 있어서, 상기 검출된 문제를 해결하기 위해 사람이 상기 회복 과정을 초기화하는 데에 필요한 시간을 분석하여 상기 회복 초기화 기간을 유도하기 위 한 시스템을 더 포함하는 시스템.
  19. 제15항에 있어서, 상기 검출 기간, 상기 회복 초기화 기간 및 상기 회복 기간은 상기 컴퓨팅 시스템의 자율적 능력의 측정을 제공하는 시스템.
  20. 제14항에 있어서, 상기 컴퓨팅 시스템은 비자동 컴퓨팅 시스템, 전자동 컴퓨팅 시스템, 반자동 컴퓨팅 시스템으로 이루어진 그룹에서 선택되는 시스템.
  21. 컴퓨팅 시스템의 자율적 능력을 측정하기 위한 컴퓨터 판독 가능한 매체에 저장된 프로그램 제품에 있어서, 상기 컴퓨터 판독 가능한 매체는:
    상기 컴퓨팅 시스템에 작업 부하가 걸리게 하는 단계;
    상기 컴퓨팅 시스템에 혼잡을 도입하는 단계;
    상기 컴퓨팅 시스템이 상기 도입된 혼잡에 응답하여 문제를 검출했다는 통지를 제공하는 단계;
    상기 검출된 문제를 해결하기 위해 회복 과정을 초기화하는 데에 필요한 시간을 결정하는 단계; 및
    상기 회복 과정을 실행하는 데에 필요한 시간을 결정하는 단계
    를 실행하기 위한 프로그램 코드를 포함하는 프로그램 제품.
KR1020060105486A 2005-11-07 2006-10-30 컴퓨팅 시스템의 자율적 능력의 양적 측정 KR100985959B1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US11/268,221 US7539904B2 (en) 2005-11-07 2005-11-07 Quantitative measurement of the autonomic capabilities of computing systems
US11/268,221 2005-11-07

Publications (2)

Publication Number Publication Date
KR20070049064A true KR20070049064A (ko) 2007-05-10
KR100985959B1 KR100985959B1 (ko) 2010-10-06

Family

ID=38082844

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020060105486A KR100985959B1 (ko) 2005-11-07 2006-10-30 컴퓨팅 시스템의 자율적 능력의 양적 측정

Country Status (5)

Country Link
US (1) US7539904B2 (ko)
JP (1) JP5147216B2 (ko)
KR (1) KR100985959B1 (ko)
CN (1) CN100478905C (ko)
TW (1) TWI393001B (ko)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4962239B2 (ja) * 2007-09-20 2012-06-27 大日本印刷株式会社 リソース使用量取得装置、リソース使用量取得方法、及びリソース使用量取得処理プログラム
WO2011094484A1 (en) 2010-01-28 2011-08-04 Drexel University Detection, diagnosis, and mitigation of software faults
US11204861B2 (en) * 2019-03-05 2021-12-21 Honeywell International Inc. Systems and methods for fault injection and ensuring failsafe FMS SaaS platforms
US11310680B2 (en) 2020-08-26 2022-04-19 Spirent Communications, Inc. Reusing provisioned resources during heterogeneous component-based testing in a portable automation framework
US11269712B1 (en) * 2020-08-26 2022-03-08 Spirent Communications, Inc. Customized categorial error handling framework for heterogeneous component-based testing in a portable automation framework
US12013777B2 (en) 2020-08-26 2024-06-18 Spirent Communications, Inc. Controlling heterogeneous component-based testing in a portable automation framework with test scripts in both API mode and UI mode
US11216347B1 (en) 2020-08-26 2022-01-04 Spirent Communications, Inc. Automatically locating resources using alternative locator expressions during heterogeneous component-based testing in a portable automation framework
US11449414B2 (en) 2020-08-26 2022-09-20 Spirent Communications, Inc. Mapping test parameter data elements during heterogeneous component-based testing in a portable automation framework in both API mode and UI mode
US11748242B2 (en) * 2021-02-17 2023-09-05 Atlassian Pty Ltd. Proactive monitoring of a software application framework

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6442694B1 (en) * 1998-02-27 2002-08-27 Massachusetts Institute Of Technology Fault isolation for communication networks for isolating the source of faults comprising attacks, failures, and other network propagating errors
US6971048B1 (en) * 1998-06-15 2005-11-29 Sun Microsystems, Inc. Testing device driver hardening
US6484276B1 (en) * 1999-10-25 2002-11-19 Lucent Technologies Inc. Method and apparatus for providing extensible object-oriented fault injection
US6442494B1 (en) * 2000-02-23 2002-08-27 Autoliv Asp, Inc. Method and circuit for detecting batteries in a distributed battery network
US6418068B1 (en) * 2001-01-19 2002-07-09 Hewlett-Packard Co. Self-healing memory
US7194445B2 (en) * 2002-09-20 2007-03-20 Lenovo (Singapore) Pte. Ltd. Adaptive problem determination and recovery in a computer system
JP2005004699A (ja) * 2003-06-16 2005-01-06 Trecenti Technologies Inc コンピュータシステム異常検出システム、コンピュータシステム異常検出方法およびコンピュータシステム
JP4189854B2 (ja) * 2003-07-28 2008-12-03 新日鉄ソリューションズ株式会社 障害時動作検証装置及び障害時動作検証方法
US7467333B2 (en) * 2005-09-01 2008-12-16 Hewlett-Packard Development Company, L.P. System and method for interposition-based selective simulation of faults for access requests to a data storage system

Also Published As

Publication number Publication date
CN100478905C (zh) 2009-04-15
CN1963779A (zh) 2007-05-16
JP2007133870A (ja) 2007-05-31
KR100985959B1 (ko) 2010-10-06
JP5147216B2 (ja) 2013-02-20
US20070168751A1 (en) 2007-07-19
TW200805049A (en) 2008-01-16
TWI393001B (zh) 2013-04-11
US7539904B2 (en) 2009-05-26

Similar Documents

Publication Publication Date Title
KR100985959B1 (ko) 컴퓨팅 시스템의 자율적 능력의 양적 측정
US6973415B1 (en) System and method for monitoring and modeling system performance
CN108287775A (zh) 一种服务器故障检测的方法、装置、设备及存储介质
US11093349B2 (en) System and method for reactive log spooling
JP5325230B2 (ja) 関連のネットワーク・トポロジを有する指定のトランザクション・サーバの動作をモニターするための方法、コンピュータ・プログラム、および装置(e‐ビジネス・システムのパフォーマンスおよび可用性をモニターするために動的にスケジュールされた合成トランザクションを使用するための方法)
US7496795B2 (en) Method, system, and computer program product for light weight memory leak detection
US20070203973A1 (en) Fuzzing Requests And Responses Using A Proxy
US10031831B2 (en) Detecting causes of performance regression to adjust data systems
US20110307742A1 (en) Method and apparatus for cause analysis involving configuration changes
US20160224400A1 (en) Automatic root cause analysis for distributed business transaction
US7197428B1 (en) Method for performance monitoring and modeling
US20080104578A1 (en) Using ghost agents in an environment supported by customer service providers
WO2015080742A1 (en) Production sampling for determining code coverage
US8910146B2 (en) Automated time-to-value measurement
Barbhuiya et al. A lightweight tool for anomaly detection in cloud data centres
US9195562B2 (en) Recording external processes
CN109284221B (zh) 一种预警系统及方法
JP2011113122A (ja) 障害影響分析装置及び業務システム及び障害影響分析方法
JP2016162428A (ja) 情報処理システム、管理装置、および情報処理システムの管理方法
US20210390005A1 (en) Delay cause identification method, non-transitory computer-readable storage medium, delay cause identification apparatus
CN111124774B (zh) 一种服务器开机过程稳定性的测试方法及相关装置
US20060230139A1 (en) Method and apparatus for running a test program in a computer system
CN107342917B (zh) 用于检测网络设备性能的方法和装置
Huffman Windows Performance Analysis Field Guide
CN112527594A (zh) 一种硬盘巡检方法、装置及系统

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20130827

Year of fee payment: 4

LAPS Lapse due to unpaid annual fee