KR100530710B1 - 이종 분할 시스템에서의 글로벌 에러 보고 방법 및 장치 - Google Patents

이종 분할 시스템에서의 글로벌 에러 보고 방법 및 장치 Download PDF

Info

Publication number
KR100530710B1
KR100530710B1 KR10-2004-0022916A KR20040022916A KR100530710B1 KR 100530710 B1 KR100530710 B1 KR 100530710B1 KR 20040022916 A KR20040022916 A KR 20040022916A KR 100530710 B1 KR100530710 B1 KR 100530710B1
Authority
KR
South Korea
Prior art keywords
error
unique identifier
data processing
partitions
processing system
Prior art date
Application number
KR10-2004-0022916A
Other languages
English (en)
Other versions
KR20040089485A (ko
Inventor
아비트맨로버트엠
비나이너스더글러스마빈
티저아써제임스
Original Assignee
인터내셔널 비지네스 머신즈 코포레이션
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 인터내셔널 비지네스 머신즈 코포레이션 filed Critical 인터내셔널 비지네스 머신즈 코포레이션
Publication of KR20040089485A publication Critical patent/KR20040089485A/ko
Application granted granted Critical
Publication of KR100530710B1 publication Critical patent/KR100530710B1/ko

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0766Error or fault reporting or storing
    • G06F11/0775Content or structure details of the error report, e.g. specific table structure, specific error fields
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B65CONVEYING; PACKING; STORING; HANDLING THIN OR FILAMENTARY MATERIAL
    • B65GTRANSPORT OR STORAGE DEVICES, e.g. CONVEYORS FOR LOADING OR TIPPING, SHOP CONVEYOR SYSTEMS OR PNEUMATIC TUBE CONVEYORS
    • B65G25/00Conveyors comprising a cyclically-moving, e.g. reciprocating, carrier or impeller which is disengaged from the load during the return part of its movement
    • B65G25/04Conveyors comprising a cyclically-moving, e.g. reciprocating, carrier or impeller which is disengaged from the load during the return part of its movement the carrier or impeller having identical forward and return paths of movement, e.g. reciprocating conveyors
    • B65G25/06Conveyors comprising a cyclically-moving, e.g. reciprocating, carrier or impeller which is disengaged from the load during the return part of its movement the carrier or impeller having identical forward and return paths of movement, e.g. reciprocating conveyors having carriers, e.g. belts
    • B65G25/065Reciprocating floor conveyors
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B65CONVEYING; PACKING; STORING; HANDLING THIN OR FILAMENTARY MATERIAL
    • B65GTRANSPORT OR STORAGE DEVICES, e.g. CONVEYORS FOR LOADING OR TIPPING, SHOP CONVEYOR SYSTEMS OR PNEUMATIC TUBE CONVEYORS
    • B65G27/00Jigging conveyors
    • B65G27/10Applications of devices for generating or transmitting jigging movements
    • B65G27/16Applications of devices for generating or transmitting jigging movements of vibrators, i.e. devices for producing movements of high frequency and small amplitude
    • B65G27/18Mechanical devices
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0706Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
    • G06F11/0712Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment in a virtual computing platform, e.g. logically partitioned systems
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B65CONVEYING; PACKING; STORING; HANDLING THIN OR FILAMENTARY MATERIAL
    • B65GTRANSPORT OR STORAGE DEVICES, e.g. CONVEYORS FOR LOADING OR TIPPING, SHOP CONVEYOR SYSTEMS OR PNEUMATIC TUBE CONVEYORS
    • B65G2207/00Indexing codes relating to constructional details, configuration and additional features of a handling device, e.g. Conveyors
    • B65G2207/32Noise prevention features
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B65CONVEYING; PACKING; STORING; HANDLING THIN OR FILAMENTARY MATERIAL
    • B65GTRANSPORT OR STORAGE DEVICES, e.g. CONVEYORS FOR LOADING OR TIPPING, SHOP CONVEYOR SYSTEMS OR PNEUMATIC TUBE CONVEYORS
    • B65G2812/00Indexing codes relating to the kind or type of conveyors
    • B65G2812/03Vibrating conveyors
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B65CONVEYING; PACKING; STORING; HANDLING THIN OR FILAMENTARY MATERIAL
    • B65GTRANSPORT OR STORAGE DEVICES, e.g. CONVEYORS FOR LOADING OR TIPPING, SHOP CONVEYOR SYSTEMS OR PNEUMATIC TUBE CONVEYORS
    • B65G2812/00Indexing codes relating to the kind or type of conveyors
    • B65G2812/12Conveyors with reciprocating means

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mechanical Engineering (AREA)
  • Mathematical Physics (AREA)
  • Debugging And Monitoring (AREA)
  • Hardware Redundancy (AREA)

Abstract

본 발명은 상이한 종류의 운영 체계들을 실행하는 복수의 파티션을 갖는 논리적 분할 데이터 처리 시스템에서 글로벌 에러를 보고하는 방법, 장치 및 컴퓨터 명령어에 관한 것이다. 글로벌 에러 검출에 응답하여, 상기 글로벌 에러에 유일한 식별자를 할당한다. 상기 유일한 식별자를 서비스 포컬 포인트에게 전송한다. 또한 상기 유일한 식별자를 상기 복수의 파티션에게도 전송한다. 상기 복수의 파티션으로부터의 에러 정보를 상기 서비스 포컬 포인트에게 보고한다. 상기 복수의 파티션은 상기 유일한 식별자와 관련하여 상기 서비스 포컬 포인트에게 에러 정보를 전송한다. 상기 서비스 포컬 포인트는 상기 유일한 식별자를 이용하여 상기 글로벌 에러에 대해 상기 복수의 파티션으로부터 전송된 에러 정보를 식별한다.

Description

이종 분할 시스템에서의 글로벌 에러 보고 방법 및 장치{METHOD AND APPARATUS FOR REPORTING GLOBAL ERRORS ON HETEROGENEOUS PARTITIONED SYSTEMS}
본 발명은 2001년 3월 1일에 제출된 "논리적으로 분할된 다중 처리 시스템에서의 중복 보고 에러 제거 방법 및 시스템(METHOD AND SYSTEM FOR ELIMINATING DUPLICATE REPORTED ERRORS IN A LOGICALLY PARTITIONED MULTIPROCESSOR SYSTEM)"이란 명칭의 미국 특허 출원 제09/798,207호(대리인 사건 번호 AUS920010073US1)와 관련되어 있으며, 이 출원은 동일한 양수인에게 양도되었고, 본 명세서 중에 그 전체가 참조로서 포함된다.
본 발명은 일반적으로 향상된 데이터 처리 시스템에 관한 것으로, 특히 데이터 처리 방법 및 장치에 관한 것이다. 더 구체적으로, 본 발명은 상이한 종류의 운영 체계들을 갖는 논리적으로 분할된(이하, '논리적 분할'로 약칭함) 데이터 처리 시스템에서 글로벌 에러를 보고하는 방법, 장치 및 컴퓨터 명령어를 제공한다.
데이터 처리 시스템(플랫폼) 내의 논리적 분할(LPAR) 기능은 단일 운영 체계(OS)의 다수의 카피나 다수의 이종 운영 체계를 단일 데이터 처리 시스템 플랫폼에서 동시에 실행할 수 있도록 해준다. 운영 체계 이미지가 실행되는 파티션은 플랫폼 자원들을 중복되지 않게 할당받는다. 이와 같이 할당 가능한 플랫폼 자원들에는 인터럽트 관리 영역을 갖는 하나 이상의 구조적으로 상이한 프로세서, 시스템 메모리 영역, 입력/출력(I/O) 어댑터 버스 슬롯 등이 있다. 파티션의 자원들은 그 OS 이미지에 대한 플랫폼 펌웨어에 의해 표현된다.
플랫폼 내에서 실행되는 각각의 상이한 OS 또는 OS 이미지는 어느 한 논리적 파티션의 소프트웨어 에러가 어떠한 다른 파티션의 정확한 동작에도 영향을 미칠 수 없도록 서로에게로부터 보호된다. 이것은 각각의 OS 이미지에게 플랫폼 자원들을 중복되지 않게 할당하여 직접 관리하게 하고, 자신에게 할당되지 않은 어떠한 자원도 제어할 수 없도록 보증하는 매커니즘을 제공함으로써 가능하다. 또한, 어느 한 운영 체계가 할당 자원을 제어할 때 발생한 소프트웨어 에러가 어떠한 다른 OS 이미지의 자원에 영향을 미치는 것이 방지된다. 이와 같이, 각각의 OS 이미지(또는 각각의 상이한 OS)는 플랫폼 내의 상이한 할당 가능한 자원들을 직접 제어한다.
LPAR 시스템의 하드웨어 자원들의 경우에는, 이러한 자원들을 중복되지 않게 다수의 파티션에게 분배하는데, 이러한 파티션들은 서로 중복되지 않으므로, 그 각각의 파티션이 독립형 컴퓨터처럼 보이게 된다. 이러한 자원들에는 입력/출력(I/O) 어댑터, 프로세서, 하드 디스크 드라이브 등이 있다. LPAR 시스템 내의 각각의 파티션은 전체 시스템을 파워 사이클(power-cycle)할 필요 없이 반복해서 부트 및 셧다운 가능하다.
논리적 분할 데이터 처리 시스템에서, "로컬 에러"라고 하는 종류의 에러는 할당된 또는 자신의 파티션의 운영 체계에게만 보고된다. 단일 파티션의 운영 체계에 할당된 I/O 어댑터의 장애가 로컬 에러의 일례이다. 글로벌 에러는 논리적 분할 데이터 처리 시스템에서 발생할 수 있는 또 다른 종류의 에러이다. 이러한 종류의 에러는 잠재적으로 각각의 파티션의 동작에 영향을 미칠 수 있기 때문에 모든 파티션들의 각각의 운영 체계에게 보고된다. 글로벌 에러는 다수의 파티션이 공유하는 자원에서 장애가 발생하는 경우에 발생한다. 전원 장치, 메모리, 팬, 호스트 브리지 및 프로세서 장애가 글로벌 에러의 예이다.
글로벌 에러의 보고에 의해 수리 조치가 취해진다. 현재의 논리적 분할 데이터 처리 시스템의 경우에는, 상이한 운영 체계가 상이한 파티션에서 실행될 수 있다. 예컨대, AIX, OS/400 및 LINUX는 각각 논리적 분할 데이터 처리 시스템의 상이한 파티션에서 실행될 수 있다. 그러한 시스템에게 서비스하는 것이 곤란할 수 있는데, 그 이유는 파티션에서 실행되는 상이한 운영 체계마다 상이한 보고 프로세스를 채용하고 있기 때문이다.
그러므로, 파티션에 상이한 종류의 운영 체계가 존재하는 논리적 분할 데이터 처리 시스템에서 글로벌 에러를 보고하는 향상된 방법, 장치 및 컴퓨터 명령어를 제공하는 것이 유리하다.
본 발명은 상이한 종류의 운영 체계들을 실행하는 복수의 파티션을 갖는 논리적 분할 데이터 처리 시스템에서 글로벌 에러를 보고하는 방법, 장치 및 컴퓨터 명령어를 제공한다. 글로벌 에러 검출에 응답하여, 상기 글로벌 에러에 유일한 식별자를 할당한다. 상기 유일한 식별자를 서비스 포컬 포인트에게 전송한다. 또한 상기 유일한 식별자를 상기 복수의 파티션에게도 전송한다. 상기 복수의 파티션으로부터의 에러 정보를 상기 서비스 포컬 포인트에게 보고한다. 상기 복수의 파티션은 상기 유일한 식별자와 관련하여 상기 서비스 포컬 포인트에게 에러 정보를 전송한다. 상기 서비스 포컬 포인트는 상기 유일한 식별자를 이용하여 상기 글로벌 에러에 대해 상기 복수의 파티션으로부터 전송된 에러 정보를 식별한다.
본 발명의 신규한 특징은 첨부된 특허 청구 범위에 기재되어 있다. 그러나, 본 발명의 양호한 실시예, 또 다른 목적 및 이점은 이하 상세한 설명과 첨부된 도면을 참조하면 보다 잘 이해될 것이다.
이제, 도면, 특히 도 1을 참조해 보면, 본 발명이 구현될 수 있는 데이터 처리 시스템의 블록도가 도시되어 있다. 데이터 처리 시스템(100)은 시스템 버스(106)에 접속되는 복수의 프로세서(101, 102, 103, 104)를 포함하는 대칭 다중 프로세서(SMP) 시스템일 수 있다. 예컨대, 데이터 처리 시스템(100)은 네트워크 내에서 서버로서 실행되는, 미국 뉴욕주 아몬크에 소재한 인터내셔널 비지네스 머신즈 코포레이션의 제품인 IBM e서버일 수 있다. 이와 달리, 단일 프로세서 시스템을 채용할 수 있도 있다. 또한, 시스템 버스(106)에는 복수의 로컬 메모리(160-163)에 대한 인터페이스를 제공하는 메모리 컨트롤러/캐시(108)가 접속된다. I/O 버스 브리지(110)도 시스템 버스(106)에 접속되어 I/O 버스(112)에 대한 인터페이스를 제공한다. 메모리 컨트롤러/캐시(108)와 I/O 버스 브리지(110)는 도시한 바와 같이 통합 가능하다.
데이터 처리 시스템(100)은 논리적 분할(LPAR) 데이터 처리 시스템이다. 그러므로, 데이터 처리 시스템(100)은 동시에 실행되는 다수의 이종 운영 체계(또는 단일 운영 체계의 다수의 인스턴스)를 가질 수 있다. 이 다수의 운영 체계의 각각은 그 안에서 실행되는 소프트웨어 프로그램을 얼마든지 가질 수 있다. 데이터 처리 시스템(100)은 상이한 PCI I/O 어댑터(120-121, 128-129, 136), 그래픽 어댑터(148) 및 하드 디스크 어댑터(149)가 상이한 논리적 파티션에 할당되도록 논리적으로 분할된다. 이 경우, 그래픽 어댑터(148)는 디스플레이 장치(도시 생략)에 대한 접속을 제공하고, 하드 디스크 어댑터(149)는 하드 디스크(150) 제어를 위한 접속을 제공한다.
그 일례로서, 데이터 처리 시스템(100)을 3개의 논리적 파티션(P1, P2, P3)으로 분할하는 것으로 가정한다. 각각의 PCI I/O 어댑터(120-121, 128-129, 136), 그래픽 어댑터(148), 하드 디스크 어댑터(149), 각각의 호스트 프로세서(101-104) 및 로컬 메모리(160-163)의 메모리가 3개의 논리적 파티션의 각각에 할당된다. 이러한 일례의 경우, 메모리(160-163)는 듀얼 인라인 메모리 모듈(DIMM)의 형태를 취할 수 있다. DIMM은 정상적으로 파티션마다 하나씩 할당되지 않는다. 대신에, 파티션마다 플랫폼의 전체 메모리의 일부분을 얻는다. 예컨대, 프로세서(101), 로컬 메모리(160-163)의 메모리의 일부분 및 PCI I/O 어댑터(120, 128, 129)가 논리적 파티션 P1에 할당되고; 프로세서(102-103), 로컬 메모리(160-163)의 메모리의 일부분 및 PCI I/O 어댑터(121, 136)가 논리적 파티션 P2에 할당되며; 프로세서(104), 로컬 메모리(160-163)의 메모리의 일부분, 그래픽 어댑터(148) 및 하드 디스크 어댑터(149)가 논리적 파티션 P3에 할당될 수 있다.
데이터 처리 시스템(100) 내에서 실행되는 각각의 운영 체계는 상이한 논리적파티션에 할당된다. 그러므로, 데이터 처리 시스템(100) 내에서 실행되는 각각의 운영 체계는 그 자신의 논리적 파티션 내에 존재하는 I/O 유닛에만 액세스 가능하다. 그 일례로서, AIX(advanced interactive executive) 운영 체계의 한 인스턴스가 논리적 파티션 P1 내에서 실행되고, AIX 운영 체계의 다른 한 인스턴스가 논리적 파티션 P2 내에서 실행되며, 윈도우 XP 운영 체계가 논리적 파티션 P3 내에서 실행될 수 있다. 윈도우 XP는 미국 워싱턴주 레드몬드에 소재한 마이크로소프트 코포레이션의 제품 및 상표이다.
I/O 버스(112)에 접속되는 PCI(peripheral component interconnect) 호스트 브리지(114)는 PCI 로컬 버스(115)에 대한 인터페이스를 제공한다. 다수의 PCI I/O 어댑터(120-121)는 PCI-TO-PCI 브리지(116), PCI 버스(118), PCI 버스(119), I/O 슬롯(170), I/O 슬롯(171)을 통해 PCI 버스(115)에 접속될 수 있다. PCI-TO-PCI 브리지(116)는 PCI 버스(118) 및 PCI 버스(119)에 대한 인터페이스를 제공한다. PCI I/O 어댑터(120, 121)는 각각 I/O 슬롯(170, 171)에 배치된다. 통상의 PCI 버스 수단은 4 내지 8개의 I/O 어댑터(즉, 애드 인(add-in) 커넥터용 확장 슬롯)를 지원한다. 각각의 PCI I/O 어댑터(120-121)는 데이터 처리 시스템(100)과 데이터 처리 시스템(100)에 대한 클라이언트인 다른 컴퓨터 등과 같은 입력/출력 장치 간의 인터페이스를 제공한다.
추가의 PCI 호스트 브리지(122)는 추가의 PCI 버스(123)에 대한 인터페이스를 제공한다. PCI 버스(123)는 복수의 PCI I/O 어댑터(128-129)에 접속된다. PCI I/O 어댑터(128-129)는 PCI-TO-PCI 브리지(124), PCI 버스(126), PCI 버스(127), I/O 슬롯(172), I/O 슬롯(173)을 통해 PCI 버스(123)에 접속될 수 있다. PCI-TO-PCI 브리지(124)는 PCI 버스(126) 및 PCI 버스(127)에 대한 인터페이스를 제공한다. PCI I/O 어댑터(128, 129)는 각각 I/O 슬롯(172, 173)에 배치된다. 이와 같이, 모뎀 또는 네트워크 어댑터 등과 같은 추가의 I/O 장치는 각각의 PCI I/O 어댑터(128, 129)를 통해 지원받을 수 있다. 이와 같이, 데이터 처리 시스템(100)은 다수의 네트워크 컴퓨터에 대한 접속을 허락한다.
I/O 슬롯(174)에 삽입되는 메모리 맵 그래픽 어댑터(148)는 PCI 버스(144), PCI-TO-PCI 브리지(142), PCI 버스(141), PCI 호스트 브리지(140)를 통해 I/O 버스(112)에 접속될 수 있다. 하드 디스크 어댑터(149)는 PCI 버스(145)에 접속되는 I/O 슬롯(175)에 배치될 수 있다. 그리고 이 PCI 버스(145)는 PCI 버스(141)를 통해 PCI 호스트 브리지(140)에 접속되는 PCI-TO-PCI 브리지(142)에 접속된다.
I/O 버스(112)에 접속되는 PCI 호스트 브리지(130)는 PCI 버스(131)에 대한 인터페이스를 제공한다. PCI I/O 어댑터(136)는 PCI 버스(133)를 통해 PCI-TO-PCI 브리지(132)에 접속되는 I/O 슬롯(176)에 접속된다. PCI-TO-PCI 브리지(132)는 PCI 버스(131)에 접속된다. 이 PCI 버스(131)는 또한 PCI 호스트 브리지(130)를 서비스 프로세서 메일박스 인터페이스 및 ISA 버스 액세스 패스 스루 로직(194)과 PCI-TO-PCI 브리지(132)에 접속시킨다. 서비스 프로세서 메일박스 인터페이스 및 ISA 버스 액세스 패스 스루 로직(194)은 정해진 PCI 액세스를 PCI/ISA 브리지(193)에 전송한다. NVRAM 스토리지(192)는 ISA 버스(196)에 접속된다. 서비스 프로세서(135)는 그의 로컬 PCI 버스(195)를 통해 서비스 프로세서 메일박스 인터페이스 및 ISA 버스 액세스 패스 스루 로직(194)에 접속된다. 서비스 프로세서(135)는 또한 복수의 JTAG/I2C 버스(134)를 통해 프로세서(101-104)에 접속된다. JTAG/I2C 버스(134)는 JTAG/scan 버스(IEEE 1149.1 참고)와 Phillips I2C 버스를 조합한 것이다. 그러나, 이와 달리, JTAG/I2C 버스(134)를 Phillips I2C 버스나 JTAG/scan 버스만으로 대체할 수도 있다. 호스트 프로세서(101, 102, 103, 104)의 모든 SP-ATTN 신호들은 서비스 프로세서의 인터럽트 입력 신호에 함께 접속된다. 서비스 프로세서(135)는 그 자신의 로컬 메모리(191)를 가지며, 하드웨어 OP 패널(190)에 액세스 가능하다.
데이터 처리 시스템(100)이 시동되면, 서비스 프로세서(135)는 JTAG/I2C 버스(134)를 통해 시스템의 (호스트) 프로세서(101-104), 메모리 컨트롤러/캐시(108) 및 I/O 브리지(110)에게 질의(interrogate)한다. 이 단계가 완료되면, 서비스 프로세서(135)는 데이터 처리 시스템(100)의 인벤토리 및 토폴로지를 파악하게 된다. 서비스 프로세서(135)는 또한 호스트 프로세서(101-104), 메모리 컨트롤러/캐시(108) 및 I/O 브리지(110)에게 질의하여 파악한 모든 요소들에 대해 내장된 자기 테스트(Built In Self Test : BIST), 기초 보증 테스트(Basic Assurance Test : BAT) 및 메모리 테스트를 실행한다. 서비스 프로세서(135)는 BIST, BAT 및 메모리 테스트 중에 검출한 장애에 대한 모든 에러 정보를 수집하여 보고한다.
BIST, BAT 및 메모리 테스트 중에 장애가 있는 것으로 파악된 요소들을 제외하고도 여전히 의미 있는/유효한 시스템 자원 구성이 가능하다면, 데이터 처리 시스템(100)은 실행 가능한 코드를 로컬 (호스트) 메모리(160-163)에 로드하기 시작한다. 다음에 서비스 프로세서(135)는 로컬 메모리(160-163)에 로드된 코드를 실행하도록 호스트 프로세서(101-104)를 해제시킨다. 호스트 프로세서(101-104)가 데이터 처리 시스템(100) 내의 각자의 운영 체계로부터 코드를 실행하는 동안에, 서비스 프로세서(135)는 에러 감시 및 보고 상태로 들어간다. 서비스 프로세서(135)가 감시하는 종류의 항목에는 냉각 팬 속도 및 동작, 열 센서, 전원 장치 조정기, 그리고 프로세서(101-104), 로컬 메모리(160-163) 및 I/O 브리지(110)가 보고하는 복구 가능한 에러 및 복구 불가능한 에러 등이 있다.
서비스 프로세서(135)는 데이터 처리 시스템(100)에서 감시된 항목 모두에 관한 에러 정보를 저장하고 보고할 책임이 있다. 서비스 프로세서(135)는 또한 에러의 종류 및 규정 임계값에 기초하여 조치를 취한다. 예컨대, 서비스 프로세서(135)는 프로세서의 캐시 메모리의 복구 가능한 과도한 에러에 주의하여 이것이 곤란한 장애의 전조가 되는 것으로 판정할 수 있다. 서비스 프로세서(135)는 이러한 판정에 기초하여, 그 자원을 현재의 실행 세션 및 미래의 초기 프로그램 로드(IPL) 중에 구성 불가능한 것으로 표시할 수 있다. IPL은 때때로 "부트"나 "부트스트랩"이라고도 한다.
데이터 처리 시스템(100)은 각종 상용 컴퓨터 시스템을 이용하여 구현될 수 있다. 예컨대, 데이터 처리 시스템(100)은 인터내셔널 비지네스 머신즈 코포레이션으로부터 입수 가능한 IBM e서버 i시리즈 모델 840 시스템을 이용하여 구현될 수 있다. 그러한 시스템은 또한 인터내셔널 비지네스 머신즈 코포레이션으로부터 입수 가능한 OS/400 운영 체계를 이용하여 논리적 분할을 지원할 수 있다.
당업자라면 도 1에 도시한 하드웨어를 변경할 수 있다는 것을 인식할 것이다. 예컨대, 도시한 하드웨어 외에도, 또는 그것 대신에, 광 디스크 드라이브 등과 같은 다른 주변 장치를 이용할 수 있다. 도시한 예는 본 발명을 구조적으로 한정하려는 것이 아니다.
이제 도 2를 참조해 보면, 본 발명이 구현될 수 있는 예시적인 논리적 분할 플랫폼의 블록도가 도시되어 있다. 논리적 분할 플랫폼(200)의 하드웨어는 예컨대 도 1의 데이터 처리 시스템(100)으로서 구현될 수 있다. 논리적 분할 플랫폼(200)은 분할된 하드웨어(230), 운영 체계(202, 204, 206, 208) 및 하이퍼바이저(hypervisor)(210)를 포함한다. 운영 체계(202, 204, 206, 208)는 플랫폼(200)에서 동시에 실행되는 단일 운영 체계의 다수의 카피나 다수의 이종 운영 체계일 수 있다. 이러한 운영 체계는 하이퍼바이저와 인터페이스되도록 설계된 OS/400을 이용하여 구현될 수 있다. 운영 체계(202, 204, 206, 208)는 파티션(203, 205, 207, 209)에 위치한다.
추가로, 이러한 파티션은 펌웨어 로더(211, 213, 215, 217)도 포함한다. 펌웨어 로더(211, 213, 215, 217)는 인터내셔널 비지네스 머신즈 코포레이션으로부터 입수 가능한 IEEE-1275 표준 오픈 펌웨어 및 실행 시간 추상화 소프트웨어(runtime abstraction software : RTAS)를 이용하여 구현될 수 있다. 파티션(203, 205, 207, 209)이 인스턴스화되는 경우, 그 오픈 펌웨어의 카피가 하이퍼바이저의 파티션 매니저에 의해 각각의 파티션으로 로드된다. 다음에 파티션에 관련 또는 할당된 프로세서가 파티션의 메모리에 디스패치되어 파티션 펌웨어가 실행된다.
분할된 하드웨어(230)는 복수의 프로세서(232-238), 복수의 시스템 메모리 유닛(240-246), 복수의 입력/출력(I/O) 어댑터(248-262) 및 스토리지 유닛(270)을 포함한다. 분할된 하드웨어(230)는 파티션의 에러 처리 등과 같은 각종 서비스를 제공하는 데에 이용될 수 있는 서비스 프로세서(290)도 포함한다. 각각의 프로세서(232-238), 메모리 유닛(240-246), NVRAM 스토리지(298) 및 I/O 어댑터(248-262)는 논리적 분할 플랫폼(200) 내의 다수의 파티션 중 하나에 할당될 수 있고, 그 각각은 운영 체계(202, 204, 206, 208) 중 하나에 대응한다.
파티션 관리 펌웨어(하이퍼바이저)(210)는 논리적 분할 플랫폼(200)의 분할을 생성 및 실시하는 파티션(203, 205, 207, 209)에 대한 다수의 기능 및 서비스를 수행한다. 하이퍼바이저(210)는 하위 하드웨어와 동일한 펌웨어로 구현된 가상 머신이다. 하이퍼바이저 소프트웨어는 인터내셔널 비지네스 머신즈 코포레이션으로부터 입수 가능하다. 펌웨어는 예컨대 ROM(Read Only Memory), PROM(Programmable ROM), EPROM(Erasable Programmable ROM), EEPROM(Electrically Erasable Programmable ROM), NV-RAM(non-volatile Random Access Memory) 등 전력 없이 내용을 유지하는 메모리 칩에 저장되는 "소프트웨어"이다. 그러므로, 하이퍼바이저(210)는 논리적 분할 플랫폼(200)의 모든 하드웨어 자원을 가상화함으로써 독립적인 OS 이미지(202, 204, 206, 208)의 동시 실행을 가능하게 한다.
상이한 파티션의 동작은 콘솔(264)과 같은 하드웨어 관리 콘솔에 의해 제어될 수 있다. 콘솔(264)은 시스템 관리자가 상이한 파티션에 자원을 재할당하는 등의 각종 기능을 수행할 수 있는 별도의 데이터 처리 시스템이다.
글로벌 에러의 보고와 관련하여, 공통 서비스 포컬 포인트를 채용하여 상이한 파티션 내의 각각의 운영 체계로부터 에러 리포트를 수집할 수 있다. 다음에 서비스 가능한 이벤트를 서비스 개체 또는 다른 사용자에게 표시할 수 있다. 이 예에서, 공통 서비스 포컬 포인트는 예컨대 논리적 파티션의 데이터 처리 시스템과 통신하는 데이터 처리 시스템일 수 있다. 이러한 공통 서비스 포컬 포인트는 도 2의 콘솔(264)과 같은 하드웨어 관리 콘솔에 위치할 수 있다. 상이한 운영 체계마다 상이한 종류의 에러 보고 프로세스를 채용하고 있는 것과 관련하여, 본 발명은 서비스 포컬 포인트가 에러 리포트를 상관시킬 수 있도록 해주는 향상된 방법, 장치 및 컴퓨터 명령어를 제공한다.
도시한 예에 있어서, 논리적 분할 데이터 처리 시스템에서 발생할 수 있는 글로벌 에러 종류마다 유일한 에러 ID라고도 하는 유일한 서비스 가능한 ID 세트를 생성한다. 플랫폼은 이 유일한 에러 ID를 서비스 포컬 포인트는 물론, 상이한 운영 체계에게도 보고한다. 이 유일한 에러 ID는 파티션이 서비스 포컬 포인트에게 제출하는 에러 리포트에 포함된다. 서비스 포컬 포인트는 이 유일한 에러 ID를 이용하여 글로벌 에러 리포트를 구성한다. 서비스 포컬 포인트는 이 유일한 에러 ID를 이용함으로써, 리포트 분석에 자원을 이용할 필요 없이 어떤 리포트가 어떤 에러에 대응하는지를 식별하고, 또한 어떤 것이 특정 글로벌 에러에 대응하는지를 식별할 수 있다.
이제 도 3을 참조해 보면, 본 발명의 바람직한 실시예에 따른 글로벌 에러 보고에 이용되는 구성 요소들을 도시한 도면이 도시되어 있다. 도 3에 도시한 구성 요소들은 도 1의 데이터 처리 시스템(100)과 같은 데이터 처리 시스템에서 구현될 수 있다.
이 예에 있어서, 플랫폼(300)은 서비스 프로세서(302) 및 파티션(304, 306, 308)을 포함하는 논리적 분할 데이터 처리 시스템이다. 파티션(304)은 운영 체계로서 OS/400을 실행하고, 파티션(306)은 운영 체계로서 AIX를 실행하며, 파티션(308)은 운영 체계로서 LINUX를 실행한다.
글로벌 에러가 발생하는 경우, 플랫폼(300)은 이 글로벌 에러를 서비스 프로세서(302)를 통해 서비스 포컬 포인트(310)에게 보고한다. 서비스 포컬 포인트(310)는 플랫폼(300)과 통신하는 임의의 데이터 처리 시스템을 이용하여 구현될 수 있다. 서비스 포컬 포인트(310)는 에러를 수집하여 사용자 또는 관리자에게 제출할 수 있는 단일 위치의 역할을 한다.
글로벌 에러는 유일한 에러 ID(312)로서 보고되는데, 가능한 종류의 글로벌 에러마다 유일한 식별자를 할당받는다. 예컨대, 플랫폼(300)이 프로세서 문제 및 메모리 문제를 검출하게 되면, 특정 프로세서 에러 ID(1256-7804) 및 특정 메모리 에러 ID(5678-1234)를 서비스 포컬 포인트(310)에게 전송한다. 플랫폼(300)이 종류는 동일하나 메모리 영역이 상이한 또 다른 메모리 문제를 검출하게 되면, 서비스 프로세서(302)는 이 추가의 메모리 에러를 식별하는 5678-1234를 보고할 수 있다. 공통 서비스 포컬 포인트(310)는 이들 유일한 에러 ID를 추적하고 그것들을 이용하여 상이한 파티션으로부터 접수한 어떤 다른 에러 리포트를 그룹화한다.
게다가, 이 유일한 에러 ID는 플랫폼의 각각의 에러 로그(314, 316, 318)에게도 보고된다. 추가로, 서로 떨어져 있는 현장 대체 가능 유닛(FRU)들을 구별하는 위치 코드도 서비스 포컬 포인트(310)에게 전송하는 유일한 에러 ID(312)와 함께 포함되거나, 유일한 에러 ID에 더하여 에러 로그에게 보고될 수 있다.
운영 체계(304, 306)는 에러 로그(314, 316)에 있는 유일한 에러 ID를 이용할 수 있다. 이 예에 있어서, 분석기(320, 322)는 유일한 에러 ID 주위에 운영 체계 특유 정보를 배치하여 에러 리포트(324)를 생성하고, 그것을 서비스 포컬 포인트(310)에게 제출한다. 이러한 추가 정보에는 예컨대 에러 보고 시의 소프트웨어 상태 등이 포함될 수 있다. 어느 한 파티션이 유일한 에러 ID를 이용할 수 없다면, 정규 보고가 이루어진다. 이 예에 있어서, 파티션(308)은 유일한 에러 ID를 이용하지 않는 운영 체계를 실행한다.
서비스 포컬 포인트(310)는 에러 리포트(324. 326)를 접수하고, 이것을 검사하여 유일한 에러 ID가 존재하는지를 판정한다. 유일한 에러 ID가 존재하면, 이 유일한 에러 ID를 이용하여 글로벌 에러에 대한 공통 또는 단일 리포트를 생성한다.
이 예에 있어서, 플랫폼(300)은 상이한 글로벌 에러에 대한 유일한 에러 ID 세트를 생성한다. 또한, 이러한 유일한 에러 ID들을 미리 생성하여 플랫폼(300)에게 보낼 수도 있다. 유일한 에러 ID들의 또 다른 이점은 서비스 포컬 포인트(310)가 이러한 유일한 에러 ID들을 이용하여 로컬 에러와 글로벌 에러를 구별할 수 있다는 점이다. 운영 체계가 보고하는 로컬 에러는 유일한 에러 ID를 포함하지 않는데, 그 이유는 글로벌 에러에 대해서만 유일한 에러 ID가 할당되기 때문이다. 서비스 포컬 포인트(310)는 이러한 유일한 에러 ID들을 이용함으로써, 데이터를 여과할 필요가 없을 뿐더러, 파티션이 보고하는 서비스 가능한 이벤트들 중 어떤 것이 글로벌 에러인지를 판정할 필요가 없다.
이제 도 4를 참조해 보면, 본 발명의 바람직한 실시예에 따른 에러 처리 프로세스의 흐름도가 도시되어 있다. 도 4에 도시한 프로세스는 도 3의 서비스 프로세서(302)와 같은 서비스 프로세서에서 구현될 수 있다.
이 프로세스는 글로벌 에러를 검출함으로써 시작된다(단계 400). 다음에, 그 에러를 식별한다(단계 402). 이러한 에러 식별 단계에서, 프로세스는 그 에러가 예컨대 메모리 에러인지 프로세서 에러인지를 판정할 수 있다. 게다가, FRU에 대한 식별도 이 단계에서 이루어질 수 있다. 그 다음에, 그 에러를 유일한 에러 ID와 관련시킨다(단계 404). 다음에, 그 에러를 서비스 포컬 포인트에게 보고한다(단계 406). 또한, 그 유일한 에러 ID를 각각의 파티션의 에러 로그에 기록한다(단계 408). 추가로, 프로세스는 FRU 식별자도 에러 로그에 배치할 수 있으며, 그 후에 프로세스는 종료된다.
다음에 도 5를 참조해 보면, 본 발명의 바람직한 실시예에 따른 에러 리포트 생성 프로세스의 흐름도가 도시되어 있다. 도 5에 도시한 프로세스는 도 3의 파티션(304)의 OS/400 운영 체계와 같이 파티션에서 구현될 수 있다.
이 프로세스는 에러 로그에서 에러를 검출함으로써 시작된다(단계 500). 다음에, 에러 로그로부터 유일한 에러 ID 및 다른 에러 정보를 검출한다(단계 502). 다음에, 에러 리포트에서 유일한 에러 ID에 운영 체계 특유 정보를 부가한다(단계 504). 그 후에, 그 에러 리포트를 서비스 포컬 포인트에게 제출하며(단계 506), 그 후에 프로세스는 종료된다.
이제 도 6을 참조해 보면, 본 발명의 바람직한 실시예에 따른 에러 리포트 처리 프로세스의 흐름도가 도시되어 있다. 도 6에 도시한 프로세스는 도 3의 서비스 포컬 포인트(310)와 같은 서비스 포컬 포인트에서 구현될 수 있다.
이 프로세스는 에러 정보를 접수함으로써 시작된다(단계 600). 그 에러 정보가 유일한 에러 ID인지에 관한 판정이 이루어진다(단계 602). 그 에러 정보가 유일한 에러 ID가 아니면, 이 에러 정보는 파티션 내의 운영 체계가 서비스 포컬 포인트에게 제출하는 로컬 에러의 에러 리포트이다.
다시 단계 602로 돌아가서, 그 에러 정보가 유일한 에러 ID이면, 이 유일한 에러 ID는 유일한 에러 ID 리스트에 부가된다(단계 608). 이와 같이, 서비스 포컬 포인트는 에러 리포트를 구성하여 처리 및 제출할 수 있다.
이제 도 7을 참조해 보면, 본 발명의 바람직한 실시예에 따른 에러 리포트 세트로부터 리포트를 생성하는 프로세스의 흐름도가 도시되어 있다. 도 7에 도시한 프로세스는 도 3의 서비스 포컬 포인트(310)와 같은 서비스 포컬 포인트에서 구현될 수 있다.
이 프로세스는 리포트 요청을 접수함으로써 시작된다(단계 700). 이 요청은 특정한 구현예에 따라 사용자 또는 소프트웨어에 의해 생성될 수 있다. 이 요청에는 하나 이상의 에러에 관한 정보가 포함되고 상이한 운영 체계로부터의 정보가 포함될 수 있다.
다음에, 처리하기 위한 유일한 에러 ID를 선택한다(단계 702). 그 후에, 그 유일한 에러 ID와 관련된 에러 리포트를 식별한다(단계 704). 다음에, 논리적 분할 데이터 처리 시스템의 상이한 운영 체계로부터 접수한 상이한 에러 리포트로부터의 정보를 이용하여 리포트를 생성한다(단계 706). 다음에, 처리하기 위한 추가의 유일한 에러 ID가 존재하는지에 관한 판정이 이루어진다(단계 708). 처리할 필요가 있는 추가의 유일한 에러 ID가 아직 존재한다면, 프로세스는 단계 702로 돌아간다. 그렇지 않은 경우에는, 리포트를 제출하며(단계 710), 그 후에 프로세스는 종료된다. 또한, 단계 710에 있어서, 이 단계는 사용자가 유일한 에러 ID를 갖는 플랫폼 발생 에러나 운영 체계 발생 에러를 갖는 로컬 발생 에러를 선택하고 이러한 에러의 상세 정보를 표시할 수 있도록 구현될 수 있다.
이와 같이, 본 발명은 논리적 분할 데이터 처리 시스템에서 상이한 종류의 운영 체계가 보고하는 글로벌 에러를 처리하는 방법, 장치 및 컴퓨터 명령어를 제공한다. 본 발명의 메커니즘은 서비스 포컬 포인트에서 에러를 수집하고 유일한 에러 ID를 이용하여 상이한 글로벌 에러에 상관시킬 수 있도록 해준다. 플랫폼에서 발생할 수 있는 가능한 글로벌 에러의 종류마다의 에러 ID 세트를 생성한다. 글로벌 에러가 발생하면, 플랫폼은 적절한 유일한 에러 ID를 식별하고 이 유일한 에러 ID를 서비스 포컬 포인트에게 보냄으로써 그 글로벌 에러를 보고한다.
추가로, 이 유일한 에러 ID는 상이한 파티션에게도 전송되어, 이 유일한 에러 ID를 포함하는 에러 리포트가 생성된다. 이러한 에러 리포트는 서비스 포컬 포인트에게 제출되어 처리된다. 서비스 포컬 포인트는 유일한 에러 ID를 이용하여 에러 리포트를 그룹화한다.
이와 같이, 본 발명의 메커니즘은 논리적 분할 데이터 처리 시스템에서 상이한 종류의 운영 체계가 보고하는 글로벌 에러에 대한 에러 리포트를 처리하는 것을 가능하게 한다. 이러한 메커니즘에 의하면, 서비스 포컬 포인트가 중복 데이터를 여과할 필요가 없을 뿐더러, 어떤 에러 리포트가 어떤 글로벌 에러에 속하는지를 판정할 필요가 없어진다.
본 발명을 충분한 기능을 하는 데이터 처리 시스템 환경 하에서 설명하였지만, 당업자라면 본 발명의 프로세스가 명령어를 기록한 컴퓨터로 판독 가능한 매체의 형태 및 다양한 형태로 배포될 수 있고, 이러한 배포용으로 실제로 이용되는 신호 저장 매체의 특정 타입과 상관없이 동등하게 본 발명을 적용할 수 있음을 인식할 수 있을 것이다. 컴퓨터로 판독 가능한 매체의 예로는 플로피 디스크, 하드 디스크 드라이브, RAM, CD-ROM, DVD-ROM 등의 기록 가능형 매체와, 디지털 및 아날로그 통신 링크, 유선 또는 무선 통신 링크, 예컨대 무선 주파수 및 광파 전송 등의 전송 형태를 이용하는 전송형 매체가 있다. 컴퓨터로 판독 가능한 매체는 특정 데이터 처리 시스템에서의 실제 사용을 위해 복호화되는 부호화된 포맷의 형태를 취할 수도 있다.
지금까지 제시한 본 발명에 대한 설명은 예시 및 설명을 위한 것이지, 본 발명을 상기 개시된 형태로 한정하려는 것이 아니다. 따라서, 본 발명을 당업자에게 명백하도록 다양하게 변형 및 변화시킬 수 있다. 상기 실시예들은 본 발명의 원리 및 그 실제 응용에 대한 올바른 이해를 위한 것이며, 또한 예상되는 특정 용도에 적합하게 다양하게 변형한 다양한 실시예의 본 발명을 당업자가 이해할 수 있도록 선택 기재된 것들이다.
본 발명에 의하면, 파티션에 상이한 종류의 운영 체계가 존재하는 논리적 분할 데이터 처리 시스템에서 글로벌 에러를 보고하는 향상된 방법, 장치 및 컴퓨터 명령어를 제공할 수 있다.
도 1은 본 발명이 구현될 수 있는 데이터 처리 시스템의 블록도.
도 2는 본 발명이 구현될 수 있는 예시적인 논리적 분할 플랫폼의 블록도.
도 3은 본 발명의 바람직한 실시예에 따른 글로벌 에러 보고에 이용되는 구성 요소들을 도시한 도면.
도 4는 본 발명의 바람직한 실시예에 따른 에러 처리 프로세스의 흐름도.
도 5는 본 발명의 바람직한 실시예에 따른 에러 리포트 생성 프로세스의 흐름도.
도 6은 본 발명의 바람직한 실시예에 따른 에러 리포트 처리 프로세스의 흐름도.
도 7은 본 발명의 바람직한 실시예에 따른 에러 리포트 세트로부터 리포트를 생성하는 프로세스의 흐름도.
<도면의 주요 부분에 대한 부호의 설명>
100 : 데이터 처리 시스템
101-104 : 프로세서
108 : 메모리 컨트롤러/캐시
110 : I/O 브리지
135 : 서비스 프로세서
160-163 : 로컬 메모리
200 : 논리적 분할 플랫폼
202, 204, 206, 208 : 운영 체계
203, 205, 207, 209 : 파티션
211, 213, 215, 217 : 펌웨어 로더
210 : 하이퍼바이저
230 : 분할된 하드웨어
232, 234, 236, 238 : 프로세서
290 : 서비스 프로세서
264 : 콘솔

Claims (23)

  1. 상이한 종류의 운영 체계들을 실행하는 복수의 파티션을 갖는 논리적 분할 데이터 처리 시스템에서 글로벌 에러를 보고하는 방법에 있어서,
    글로벌 에러 검출에 응답하여, 상기 글로벌 에러에 유일한 식별자를 할당하는 단계와;
    상기 유일한 식별자를 서비스 포컬 포인트에게 전송하는 단계와;
    상기 유일한 식별자를 상기 복수의 파티션에게 전송하는 단계와;
    상기 복수의 파티션으로부터의 에러 정보를 상기 서비스 포컬 포인트에게 보고하는 단계
    를 포함하며,
    상기 복수의 파티션은 상기 유일한 식별자와 관련하여 상기 서비스 포컬 포인트에게 에러 정보를 전송하고, 상기 서비스 포컬 포인트는 상기 유일한 식별자를 이용하여 상기 글로벌 에러에 대해 상기 복수의 파티션으로부터 전송된 에러 정보를 식별하는 것인 논리적 분할 데이터 처리 시스템에서의 글로벌 에러 보고 방법.
  2. 제1항에 있어서, 상기 서비스 포컬 포인트는 상기 논리적 분할 데이터 처리 시스템과 통신하는 하드웨어 콘솔에 위치하는 프로세스인 것인 논리적 분할 데이터 처리 시스템에서의 글로벌 에러 보고 방법.
  3. 제1항에 있어서, 상기 할당 단계와 상기 전송 단계들은 상기 논리적 분할 데이터 처리 시스템 상의 서비스 프로세서에 의해 수행되는 것인 논리적 분할 데이터 처리 시스템에서의 글로벌 에러 보고 방법.
  4. 제1항에 있어서, 상기 유일한 식별자는 복수의 유일한 식별자의 일부이며, 상기 복수의 유일한 식별자 내의 각각의 유일한 식별자는 특정 글로벌 에러와 관련되어 있는 것인 논리적 분할 데이터 처리 시스템에서의 글로벌 에러 보고 방법.
  5. 제1항에 있어서, 상기 글로벌 에러는 메모리 에러, 전원 장치 장애, 팬 장애 및 프로세서 장애 중 하나인 것인 논리적 분할 데이터 처리 시스템에서의 글로벌 에러 보고 방법.
  6. 제1항에 있어서, 상기 유일한 식별자를 이용하여 식별되는 상기 복수의 파티션에 의해 보고되는 에러 정보에 기초하여 상기 글로벌 에러에 대한 에러 리포트를 생성하는 단계를 더 포함하는 논리적 분할 데이터 처리 시스템에서의 글로벌 에러 보고 방법.
  7. 제1항에 있어서, 상기 에러 정보는 상기 복수의 파티션에서 실행되는 각각의 종류의 운영 체계에 특유한 정보를 포함하는 것인 논리적 분할 데이터 처리 시스템에서의 글로벌 에러 보고 방법.
  8. 제1항에 있어서, 상기 복수의 파티션 내의 어느 한 파티션은 상기 유일한 식별자를 이용할 수 없는 특정 종류의 운영 체계를 실행하고 상기 유일한 식별자 없이 에러 정보를 보고하는 것인 논리적 분할 데이터 처리 시스템에서의 글로벌 에러 보고 방법.
  9. 상이한 종류의 운영 체계들을 실행하는 복수의 파티션을 갖는 논리적 분할 데이터 처리 시스템에서 글로벌 에러를 보고하는 방법에 있어서,
    유일한 식별자 세트를 제공하는 단계로서, 상기 유일한 식별자 세트 내의 각각의 유일한 식별자는 특정 글로벌 에러와 관련되어 있는 것인 제공 단계와;
    단일 소스에서 상기 복수의 파티션으로부터 글로벌 에러 리포트를 접수하는 단계로서, 각각의 리포트는 상기 유일한 식별자 세트 중 어느 하나의 유일한 식별자를 포함하는 것인 접수 단계와;
    선택된 리포트만을 이용하여 특정 글로벌 에러를 처리하는 단계로서, 상기 선택된 리포트는 상기 특정 글로벌 에러에 대응하는 유일한 식별자를 포함하는 것인 처리 단계
    를 포함하는 논리적 분할 데이터 처리 시스템에서의 글로벌 에러 보고 방법.
  10. 제9항에 있어서, 상기 방법은 상기 논리적 분할 데이터 처리 시스템과 통신하는 하드웨어 콘솔에서 실행되는 것인 논리적 분할 데이터 처리 시스템에서의 글로벌 에러 보고 방법.
  11. 상이한 종류의 운영 체계들을 실행하는 복수의 파티션에 대한 글로벌 에러를 보고하는 논리적 분할 데이터 처리 시스템에 있어서,
    글로벌 에러 검출에 응답하여, 상기 글로벌 에러에 유일한 식별자를 할당하는 할당 수단과;
    상기 유일한 식별자를 서비스 포컬 포인트에게 전송하는 제1 전송 수단과;
    상기 유일한 식별자를 상기 복수의 파티션에게 전송하는 제2 전송 수단과;
    상기 복수의 파티션으로부터의 에러 정보를 상기 서비스 포컬 포인트에게 보고하는 보고 수단
    을 포함하며,
    상기 복수의 파티션은 상기 유일한 식별자와 관련하여 상기 서비스 포컬 포인트에게 에러 정보를 전송하고, 상기 서비스 포컬 포인트는 상기 유일한 식별자를 이용하여 상기 글로벌 에러에 대해 상기 복수의 파티션으로부터 전송된 에러 정보를 식별하는 것인 논리적 분할 데이터 처리 시스템.
  12. 제11항에 있어서, 상기 서비스 포컬 포인트는 상기 논리적 분할 데이터 처리 시스템과 통신하는 하드웨어 콘솔에 위치하는 프로세스인 것인 논리적 분할 데이터 처리 시스템.
  13. 제11항에 있어서, 상기 할당 단계와 상기 전송 단계들은 상기 논리적 분할 데이터 처리 시스템 상의 서비스 프로세서에 의해 수행되는 것인 논리적 분할 데이터 처리 시스템.
  14. 제11항에 있어서, 상기 유일한 식별자는 복수의 유일한 식별자의 일부이며, 상기 복수의 유일한 식별자 내의 각각의 유일한 식별자는 특정 글로벌 에러와 관련되어 있는 것인 논리적 분할 데이터 처리 시스템.
  15. 제11항에 있어서, 상기 글로벌 에러는 메모리 에러, 전원 장치 장애 및 프로세서 장애 중 하나인 것인 논리적 분할 데이터 처리 시스템.
  16. 제11항에 있어서, 상기 유일한 식별자를 이용하여 식별되는 상기 복수의 파티션에 의해 보고되는 에러 정보에 기초하여 상기 글로벌 에러에 대한 에러 리포트를 생성하는 생성 수단을 더 포함하는 논리적 분할 데이터 처리 시스템.
  17. 제11항에 있어서, 상기 에러 정보는 상기 복수의 파티션에서 실행되는 각각의 종류의 운영 체계에 특유한 정보를 포함하는 것인 논리적 분할 데이터 처리 시스템.
  18. 제11항에 있어서, 상기 복수의 파티션 내의 어느 한 파티션은 상기 유일한 식별자를 이용할 수 없는 특정 종류의 운영 체계를 실행하고 상기 유일한 식별자 없이 에러 정보를 보고하는 것인 논리적 분할 데이터 처리 시스템.
  19. 상이한 종류의 운영 체계들을 실행하는 복수의 파티션을 갖는 논리적 분할 데이터 처리 시스템에서 글로벌 에러를 보고하는 데이터 처리 시스템에 있어서,
    유일한 식별자 세트를 제공하는 수단으로서, 상기 유일한 식별자 세트 내의 각각의 유일한 식별자는 특정 글로벌 에러와 관련되어 있는 것인 제공 수단과;
    단일 소스에서 상기 복수의 파티션으로부터 글로벌 에러 리포트를 접수하는 수단으로서, 각각의 리포트는 상기 유일한 식별자 세트 중 어느 하나의 유일한 식별자를 포함하는 것인 접수 수단과;
    선택된 리포트만을 이용하여 특정 글로벌 에러를 처리하는 수단으로서, 상기 선택된 리포트는 상기 특정 글로벌 에러에 대응하는 유일한 식별자를 포함하는 것인 처리 수단
    을 포함하는 데이터 처리 시스템.
  20. 제19항에 있어서, 상기 데이터 처리 시스템은 상기 논리적 분할 데이터 처리 시스템과 통신하는 하드웨어 콘솔인 것인 데이터 처리 시스템.
  21. 상이한 종류의 운영 체계들을 실행하는 복수의 파티션에 대한 글로벌 에러를 보고하는 논리적 분할 데이터 처리 시스템에 있어서,
    버스 시스템과;
    상기 버스 시스템에 접속되고, 명령어 세트를 포함하는 메모리와;
    상기 버스 시스템에 접속되는 처리 유닛
    을 포함하며,
    상기 처리 유닛은 글로벌 에러 검출에 응답하여, 상기 글로벌 에러에 유일한 식별자를 할당하게 하는 명령어와; 상기 유일한 식별자를 서비스 포컬 포인트에게 전송하게 하는 명령어와; 상기 유일한 식별자를 상기 복수의 파티션에게 전송하게 하는 명령어와; 상기 복수의 파티션으로부터의 에러 정보를 상기 서비스 포컬 포인트에게 보고하게 하는 명령어를 실행하며,
    상기 복수의 파티션은 상기 유일한 식별자와 관련하여 상기 서비스 포컬 포인트에게 에러 정보를 전송하고, 상기 서비스 포컬 포인트는 상기 유일한 식별자를 이용하여 상기 글로벌 에러에 대해 상기 복수의 파티션으로부터 전송된 에러 정보를 식별하는 것인 논리적 분할 데이터 처리 시스템.
  22. 상이한 종류의 운영 체계들을 실행하는 복수의 파티션을 갖는 논리적 분할 데이터 처리 시스템에서 글로벌 에러를 보고하는 데이터 처리 시스템에 있어서,
    버스 시스템과;
    상기 버스 시스템에 접속되고, 명령어 세트를 포함하는 메모리와;
    상기 버스 시스템에 접속되는 처리 유닛
    을 포함하며,
    상기 처리 유닛은 유일한 식별자 세트를 제공하게 하는 명령어로서, 상기 유일한 식별자 세트 내의 각각의 유일한 식별자는 특정 글로벌 에러와 관련되어 있는 것인 명령어와; 단일 소스에서 상기 복수의 파티션으로부터 글로벌 에러 리포트를 접수하게 하는 명령어로서, 각각의 리포트는 상기 유일한 식별자 세트 중 어느 하나의 유일한 식별자를 포함하는 것인 명령어와; 선택된 리포트만을 이용하여 특정 글로벌 에러를 처리하게 하는 명령어로서, 상기 선택된 리포트는 상기 특정 글로벌 에러에 대응하는 유일한 식별자를 포함하는 것인 명령어를 실행하는 것인 데이터 처리 시스템.
  23. 제1항 내지 제10항 중 어느 한 항의 방법의 단계들을 수행하기 위한 프로그램을 기록한 컴퓨터로 판독 가능한 기록 매체.
KR10-2004-0022916A 2003-04-10 2004-04-02 이종 분할 시스템에서의 글로벌 에러 보고 방법 및 장치 KR100530710B1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US10/411,413 2003-04-10
US10/411,413 US7139940B2 (en) 2003-04-10 2003-04-10 Method and apparatus for reporting global errors on heterogeneous partitioned systems

Publications (2)

Publication Number Publication Date
KR20040089485A KR20040089485A (ko) 2004-10-21
KR100530710B1 true KR100530710B1 (ko) 2005-11-28

Family

ID=33130962

Family Applications (1)

Application Number Title Priority Date Filing Date
KR10-2004-0022916A KR100530710B1 (ko) 2003-04-10 2004-04-02 이종 분할 시스템에서의 글로벌 에러 보고 방법 및 장치

Country Status (3)

Country Link
US (1) US7139940B2 (ko)
JP (1) JP3962393B2 (ko)
KR (1) KR100530710B1 (ko)

Families Citing this family (35)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4125274B2 (ja) * 2004-08-26 2008-07-30 キヤノン株式会社 画像入出力装置および情報処理方法およびコンピュータが読み取り可能なプログラムを格納した記憶媒体およびプログラム
JP4357433B2 (ja) * 2005-02-15 2009-11-04 株式会社日立製作所 ストレージシステム
JP4831599B2 (ja) 2005-06-28 2011-12-07 ルネサスエレクトロニクス株式会社 処理装置
JP2007233687A (ja) * 2006-03-01 2007-09-13 Nec Corp 仮想計算機システム、仮想計算機の制御方法、および仮想計算機プログラム
US8327008B2 (en) * 2006-06-20 2012-12-04 Lenovo (Singapore) Pte. Ltd. Methods and apparatus for maintaining network addresses
JP4882736B2 (ja) * 2006-12-27 2012-02-22 富士通株式会社 情報処理装置,障害処理方法,障害処理プログラムおよび同プログラムを記録したコンピュータ読取可能な記録媒体
US20080307262A1 (en) * 2007-06-05 2008-12-11 Siemens Medical Solutions Usa, Inc. System for Validating Data for Processing and Incorporation in a Report
US8381033B2 (en) * 2009-10-30 2013-02-19 International Business Machines Corporation Fault management in virtual computing environments
US8151147B2 (en) * 2009-12-17 2012-04-03 Hewlett-Packard Development Company, L.P. Synchronize error handling for a plurality of partitions
US8635430B2 (en) 2010-06-23 2014-01-21 International Business Machines Corporation Translation of input/output addresses to memory addresses
US9342352B2 (en) 2010-06-23 2016-05-17 International Business Machines Corporation Guest access to address spaces of adapter
US8510599B2 (en) 2010-06-23 2013-08-13 International Business Machines Corporation Managing processing associated with hardware events
US8626970B2 (en) 2010-06-23 2014-01-07 International Business Machines Corporation Controlling access by a configuration to an adapter function
US8645606B2 (en) 2010-06-23 2014-02-04 International Business Machines Corporation Upbound input/output expansion request and response processing in a PCIe architecture
US8549182B2 (en) 2010-06-23 2013-10-01 International Business Machines Corporation Store/store block instructions for communicating with adapters
US8504754B2 (en) 2010-06-23 2013-08-06 International Business Machines Corporation Identification of types of sources of adapter interruptions
US8572635B2 (en) 2010-06-23 2013-10-29 International Business Machines Corporation Converting a message signaled interruption into an I/O adapter event notification
US8478922B2 (en) 2010-06-23 2013-07-02 International Business Machines Corporation Controlling a rate at which adapter interruption requests are processed
US9195623B2 (en) 2010-06-23 2015-11-24 International Business Machines Corporation Multiple address spaces per adapter with address translation
US8650335B2 (en) 2010-06-23 2014-02-11 International Business Machines Corporation Measurement facility for adapter functions
US8566480B2 (en) 2010-06-23 2013-10-22 International Business Machines Corporation Load instruction for communicating with adapters
US8918573B2 (en) 2010-06-23 2014-12-23 International Business Machines Corporation Input/output (I/O) expansion response processing in a peripheral component interconnect express (PCIe) environment
US8683108B2 (en) 2010-06-23 2014-03-25 International Business Machines Corporation Connected input/output hub management
US8650337B2 (en) 2010-06-23 2014-02-11 International Business Machines Corporation Runtime determination of translation formats for adapter functions
US8615645B2 (en) 2010-06-23 2013-12-24 International Business Machines Corporation Controlling the selectively setting of operational parameters for an adapter
US8615622B2 (en) 2010-06-23 2013-12-24 International Business Machines Corporation Non-standard I/O adapters in a standardized I/O architecture
US8745292B2 (en) 2010-06-23 2014-06-03 International Business Machines Corporation System and method for routing I/O expansion requests and responses in a PCIE architecture
US8645767B2 (en) 2010-06-23 2014-02-04 International Business Machines Corporation Scalable I/O adapter function level error detection, isolation, and reporting
US8468284B2 (en) 2010-06-23 2013-06-18 International Business Machines Corporation Converting a message signaled interruption into an I/O adapter event notification to a guest operating system
US8505032B2 (en) * 2010-06-23 2013-08-06 International Business Machines Corporation Operating system notification of actions to be taken responsive to adapter events
US9213661B2 (en) 2010-06-23 2015-12-15 International Business Machines Corporation Enable/disable adapters of a computing environment
US8621112B2 (en) 2010-06-23 2013-12-31 International Business Machines Corporation Discovery by operating system of information relating to adapter functions accessible to the operating system
US8639858B2 (en) 2010-06-23 2014-01-28 International Business Machines Corporation Resizing address spaces concurrent to accessing the address spaces
CN103793284B (zh) * 2012-10-29 2017-06-20 伊姆西公司 基于共同序列模式的、用于智能客户服务的分析系统和方法
KR102363718B1 (ko) * 2021-07-21 2022-02-17 국방과학연구소 실시간 운영체제에서 파티션 별 장치 리소스를 할당하는 방법 및 그 장치

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05120064A (ja) 1991-10-30 1993-05-18 Chubu Nippon Denki Software Kk トレース採取方式
JP3157655B2 (ja) 1993-07-20 2001-04-16 日本電気株式会社 メッセージ記録システム
US6918059B1 (en) * 1999-04-28 2005-07-12 Universal Music Group Method and system for handling errors in a distributed computer system
US20020124201A1 (en) 2001-03-01 2002-09-05 International Business Machines Corporation Method and system for log repair action handling on a logically partitioned multiprocessing system
US6792564B2 (en) 2001-03-01 2004-09-14 International Business Machines Corporation Standardized format for reporting error events occurring within logically partitioned multiprocessing systems
US20020124214A1 (en) 2001-03-01 2002-09-05 International Business Machines Corporation Method and system for eliminating duplicate reported errors in a logically partitioned multiprocessing system
US6842870B2 (en) * 2001-09-20 2005-01-11 International Business Machines Corporation Method and apparatus for filtering error logs in a logically partitioned data processing system
US6892330B2 (en) * 2001-11-28 2005-05-10 Inventec Corporation Cross-platform system-fault warning system and method

Also Published As

Publication number Publication date
US20040205413A1 (en) 2004-10-14
US7139940B2 (en) 2006-11-21
KR20040089485A (ko) 2004-10-21
JP2004318873A (ja) 2004-11-11
JP3962393B2 (ja) 2007-08-22

Similar Documents

Publication Publication Date Title
KR100530710B1 (ko) 이종 분할 시스템에서의 글로벌 에러 보고 방법 및 장치
JP5579354B2 (ja) 関連アプリケーションに対するトラック・データ・クロスリファレンスを保存する方法及び装置
JP3910554B2 (ja) 論理パーティション・データ処理システムでのエラーまたはイベントを処理する方法、コンピュータ・プログラム、データ処理システム
US6842870B2 (en) Method and apparatus for filtering error logs in a logically partitioned data processing system
US7103808B2 (en) Apparatus for reporting and isolating errors below a host bridge
US7055071B2 (en) Method and apparatus for reporting error logs in a logical environment
US7257734B2 (en) Method and apparatus for managing processors in a multi-processor data processing system
US20070260910A1 (en) Method and apparatus for propagating physical device link status to virtual devices
US20020124166A1 (en) Mechanism to safely perform system firmware update in logically partitioned (LPAR) machines
JP2006507561A (ja) 論理的に区分されたデータ処理システム中でプロセッサを動的に割り振りかつ割振り解除する方法および装置
JP4366336B2 (ja) 論理パーティション・データ処理システムにおいてトレース・データを管理するための方法、トレース・データを管理するための論理パーティション・データ処理システム、コンピュータにトレース・データを管理させるためのコンピュータ・プログラム、論理パーティション・データ処理システム
US7877643B2 (en) Method, system, and product for providing extended error handling capability in host bridges
US6976191B2 (en) Method and apparatus for analyzing hardware errors in a logical partitioned data processing system
US7266631B2 (en) Isolation of input/output adapter traffic class/virtual channel and input/output ordering domains
US20050268065A1 (en) Free resource error/event lot for autonomic data processing system
US8139595B2 (en) Packet transfer in a virtual partitioned environment
US8010838B2 (en) Hardware recovery responsive to concurrent maintenance
US6934888B2 (en) Method and apparatus for enhancing input/output error analysis in hardware sub-systems
US7260752B2 (en) Method and apparatus for responding to critical abstracted platform events in a data processing system
US7370240B2 (en) Method and apparatus for preserving trace data in a logical partitioned data processing system
US7275185B2 (en) Method and apparatus for device error log persistence in a logical partitioned data processing system

Legal Events

Date Code Title Description
A201 Request for examination
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20101102

Year of fee payment: 6

LAPS Lapse due to unpaid annual fee