KR20090056124A - 듀얼 프로세서 제어 장치의 고장 안전 구조 - Google Patents

듀얼 프로세서 제어 장치의 고장 안전 구조 Download PDF

Info

Publication number
KR20090056124A
KR20090056124A KR1020070123149A KR20070123149A KR20090056124A KR 20090056124 A KR20090056124 A KR 20090056124A KR 1020070123149 A KR1020070123149 A KR 1020070123149A KR 20070123149 A KR20070123149 A KR 20070123149A KR 20090056124 A KR20090056124 A KR 20090056124A
Authority
KR
South Korea
Prior art keywords
task
processors
processor
common memory
state
Prior art date
Application number
KR1020070123149A
Other languages
English (en)
Other versions
KR100928187B1 (ko
Inventor
조창희
손천돈
전진홍
김슬기
안종보
Original Assignee
한국전기연구원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국전기연구원 filed Critical 한국전기연구원
Priority to KR1020070123149A priority Critical patent/KR100928187B1/ko
Publication of KR20090056124A publication Critical patent/KR20090056124A/ko
Application granted granted Critical
Publication of KR100928187B1 publication Critical patent/KR100928187B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/202Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
    • G06F11/2043Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant where the redundant components share a common memory address space
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/3006Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system is distributed, e.g. networked systems, clusters, multiprocessor systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/3024Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system component is a central processing unit [CPU]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3055Monitoring arrangements for monitoring the status of the computing system or of the computing system component, e.g. monitoring if the computing system is on, off, available, not available
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F15/00Digital computers in general; Data processing equipment in general
    • G06F15/16Combinations of two or more digital computers each having at least an arithmetic unit, a program unit and a register, e.g. for a simultaneous processing of several programs
    • G06F15/163Interprocessor communication
    • G06F15/167Interprocessor communication using a common memory, e.g. mailbox

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • Mathematical Physics (AREA)
  • Computer Hardware Design (AREA)
  • Software Systems (AREA)
  • Hardware Redundancy (AREA)
  • Debugging And Monitoring (AREA)

Abstract

두 프로세서 간의 공통 메모리를 이용하여 상대편 프로세서의 동작 상태는 물론이고 내부의 여러 태스크의 상태를 개별적으로 감시할 수 있는 고장 안전 구조를 갖는 듀얼 프로세서 제어 장치의 고장 안정 구조가 제공된다. 듀얼 프로세서 제어 장치는 2개의 프로세서를 포함한다. 공통 메모리는 상기 2개의 프로세서 사이에 접속되어, 상기 2개의 프로세서의 동작 상태를 검지하고 상기 2개의 프로세서 중의 적어도 하나가 고장을 발생한 경우, 고장 복귀 신호를 발생하여 고장된 프로세서를 정상 상태로 회복시킨다.
듀얼 프로세서, 공통 메모리

Description

듀얼 프로세서 제어 장치의 고장 안전 구조{Fail safe architecture of dual processor controller}
본 발명은 듀얼 프로세서에 관한 것으로, 더욱 상세하게는 두 개의 프로세서로 구성된 제어 장치에 있어서 공통 메모리를 이용하여 상호 감시 방식의 고장 안전 동작을 수행하는 듀얼 프로세서 제어 장치의 고장 안전 구조에 관한 것이다.
간단한 시스템의 제어를 위해서는 하나의 프로세서로 모든 기능을 수행하지만, 다수의 복잡한 기능을 위해서는 사용자 인터페이스를 담당하는 저속의 8비트 프로세서와 신호처리 및 제어 등의 주요 기능을 담당하는 고속의 프로세서를 같이 사용하는 것이 일반적이다. 이와 같이 두 개의 프로세서로 구성되는 제어 장치의 경우 공통 메모리 (Common Memory)를 설치하여 각자의 정보를 교환한다.
시스템의 신뢰성을 향상시킬 목적으로 많이 사용되고 있는 방법으로 핫 스탠바이(Hot Standby)를 이용한 이중화 기법과 N-모듈화 기법(N-Modular Redundancy)의 다수결(Majority Voting)을 이용한 다중화 기법 등이 있다. 그러나 이런 다중화 방법은 제어 시스템의 복잡도가 증대되어 소형의 간단한 시스템에는 적합하지 않다.
단일 프로세서 시스템에서 많이 사용되는 고장 안전(Fail Safe) 기법으로 제어장치의 하트비트(Heartbeat) 신호를 이용하는 방법과 워치독 타이머(Watchdog Timer)를 사용하는 방법이 있다. 두 방법 모두 시스템의 고장으로부터의 복귀를 위해서 사용되는 기법으로 일정 기간 동안 모듈이 응답하지 않을 경우에 전체 시스템을 재 기동시키는 방식으로 고장 안전을 구현한다.
두 개의 프로세서로 구성된 시스템의 경우 고장 안전(Fail Safe) 시스템을 구성하기 위해서 기존에 많이 사용되는 워치독 타이머를 두 개의 프로세서에 각각 적용하는 방식이 가능하지만, 이 경우 워치독 타이머를 위한 별도의 하드웨어가 각각 필요하며 하나의 프로세서가 문제가 있어서 초기화되더라도 다른 프로세서가 그 상태를 파악하기 곤란한 문제점이 있다.
도 1은 단일 프로세서를 가지는 시스템의 기존 방식의 워치독 타이머 구성을 나타낸다. 일정 시간 내 응답성이 최우선 시 되는 실시간 제어 시스템에서 워치독 타이머(110)는 정해진 시간 내에 프로세서인 CPU(120)의 워치독 클리어(Clear) 신호가 없는 경우, 프로세서가 제대로 동작하지 못하는 것으로 판단하여 프로세서 리셋 신호를 발생시키는 방식으로 시스템을 고장으로부터 복구시킨다.
이러한 워치독 타이머 방식은 구조가 간단하고, 동작이 명료하여 광범위하게 사용되며 프로세서 내부에 기본 하드웨어로 포함되어 있기도 한다.
워치독 타이머를 기본으로 포함하고 있지 못한 저가 프로세서의 경우 별도의 워치독 타이머 회로를 설치해 주어야 한다. 두 개의 프로세서로 구성된 제어장치의 경우 각각 워치독 타이머를 설치하여야 한다. 별도 구성된 워치독 타이머는 각각의 프로세서의 고장을 검지하여 프로세서를 고장으로부터 복귀시키지만 상대편 프로세서는 시스템의 고장 여부의 판별을 위하여 별도의 구조를 필요로 한다.
또한 기존의 워치독 타이머는 전체 시스템이 정지되는 중대한 고장일 경우 문제없이 작동하나, 프로세서 내의 지역적인 태스크 문제시에는 고장을 검출하지 못하는 경우도 있다. 또한 워치독 리셋이 요청되어 시스템 복구를 하는 경우 하나의 태스크 고장에 의해서 문제가 없는 다른 모든 태스크들도 같이 초기화 과정을 거쳐야 하는 문제점이 있다.
본 발명은 상기와 같은 문제점을 해결하기 위하여 발명한 것으로서, 두 프로세서 간의 공통 메모리를 이용하여 상대편 프로세서의 동작 상태는 물론이고 내부의 여러 태스크의 상태를 개별적으로 감시할 수 있는 듀얼 프로세서 제어 장치의 고장 안전 구조를 제공함에 그 목적이 있다.
상기한 목적을 달성하기 위하여, 본 발명에 따른 듀얼 프로세서 제어 장치의 고장 안전 구조는 2개의 프로세서; 및 상기 2개의 프로세서 사이에 접속되어, 상기 2개의 프로세서의 동작 상태를 검지하고 상기 2개의 프로세서 중의 적어도 하나가 고장을 발생한 경우, 고장 복귀 신호를 발생하여 고장된 프로세서를 정상 상태로 회복시키는 공통 메모리를 포함하는 것을 특징으로 한다.
바람직하게는, 상기 2개 프로세서 각각은 상대편 프로세서의 동작 상태를 점검하고 상기 상대편 프로세서의 내부 태스크의 정상 동작 여부를 판별하여 인터럽트 신호를 발생시키고 그 이후에 지정된 태스크 복구 시간의 경과 후 상기 상대편 프로세서에 리셋 신호를 출력하는 상태 감시자; 상대편 상태 감시자의 인터럽트 신호를 받아서 자기 프로세서 내부의 고장난 태스크 만을 복구시켜주는 태스크 복구 인터럽트 서비스 루틴; 프로세서 자신의 여러 태스크 상태를 각각 감시하여 태스크의 상태를 상기 공통 메모리에 저장하여 상대편 감시자에게 자신의 동작 상태를 표시하는 태스크 감시자를 포함한다.
더욱 바람직하게는, 상기 공통 메모리는 상기 2개 프로세서 각각의 내부 태스크 상태를 저장하여 각 태스크 별 동작 상태를 개별적으로 점검한다. 가장 바람직하게는, 상기 공통 메모리는 상기 2개의 프로세서의 기본적인 데이터 교환을 위한 메모리 영역을 각각 가지며 두 프로세서 각각 태스크의 오동작 여부를 판별할 수 있는 태스크 동작 상태 레지스터를 포함한다.
별도의 하드웨어 추가 없이 기설치의 공통 메모리와 두 프로세서 사이의 각각 두 개의 신호선으로 고장 안전 시스템을 구축하여 편이성과 안정성을 동시에 확보하였다.
이러한 두 개의 프로세서로 구성된 시스템을 위한 새로운 고장 안전 구조는 기존의 데이터 통신용으로 사용되어지는 공통 메모리를 이용하므로 각각의 워치독 타이머를 설치하는 등 별도의 하드웨어가 필요 없어 제작비용의 절감과 시스템 고장 확률을 낮추는 효과가 있다.
프로세서 내의 단일 태스크의 고장으로 인한 문제 발생시에 상대편 프로세서의 감시에 의해 프로세서 리셋에 의한 전체 시스템 고장 복구 방식을 제공함과 동시에 문제가 있는 태스크 자체의 고장복구를 할 수 있는 기회를 더 줌으로써 시스템의 가용성을 높이는 효과가 있다.
위와 동일한 이유로 복구에 시간이 오래 걸리는 전체 시스템 리셋 방식 이전에 문제가 있는 태스크만 선택적으로 짧은 시간에 복구함으로서, 복구에 의한 시스템 제어 성능의 순간적인 악화를 방지하는 효과가 있다.
본 발명의 실시예에 따른 공통 메모리를 이용한 듀얼 프로세서 제어장치의 고장 안전 구조를 첨부도면을 참조하여 상세하게 설명한다.
도 2는 본 발명의 실시예에 따른 공통 메모리를 이용한 듀얼 프로세서 제어장치의 고장 안전 구조를 나타낸 블록도이다.
본 발명의 실시예에 따른 공통 메모리를 이용한 듀얼 프로세서 제어장치의 고장 안전 구조는 2개의 프로세서 및 공통 메모리(30)를 포함한다.
공통 메모리(30)는 상기 2개의 프로세서 사이에 접속되어, 상기 2개의 프로세서의 동작 상태를 검지하고 상기 2개의 프로세서 중의 적어도 하나가 고장을 발생한 경우, 고장 복귀 신호를 발생하여 고장난 프로세서를 정상 상태로 회복시킨다.
두 개의 프로세서는 일반적으로 사용자 인터페이스를 담당하는 저속의 마이크로 콘트롤 유니트(Micro Control Unit; 이하 'MCU'라 함, 10)와 고속의 신호 처리, 계측, 제어 등을 담당하는 디지털 신호 처리장치(Digital Signal Processor, 이하 'DSP'라 함, 20)로 구성된다. 두 개의 프로세서인 MCU(10) 및 DSP(20)는 각각 어드레스 버스(41 및 43)와 데이터 버스(42 및 44)를 통해서 공통 메모리(30)와 연결되어 프로세서 사이의 데이터를 공유한다. 이와 동시에 공유 메모리(30)에는 각 프로세서의 상태를 점검할 수 있는 레지스터(Register)를 구성하여 상대편 프로세서의 상태를 감시한다. 각각의 프로세서는 상대편을 제어하기 위한 2개의 신호선 (인터럽트, 리셋)을 가지고 고장으로 부터의 복귀 명령을 전달한다.
도 3은 도 2에 도시된 두 프로세서 중 하나인 MCU(10)의 내부 구성을 나타내는 상세도이다.
MCU(10)는 상태 감시자인 DSP 감시자(16), 태스크 복구 인터럽트 서비스 루틴(Interrupt Service Routine, 이하 'ISR'이라 함, 17), 및 태스크 감시자(15)를 포함한다.
DSP 감시자(16)는 상대편 프로세서인 DSP(20)의 동작 상태를 점검하고 DSP(20)의 내부 태스크의 정상 동작 여부를 판별하여 인터럽트 신호를 발생시키고 그 이후에 지정된 태스크 복구 시간의 경과 후 DSP(20)에 리셋 신호를 출력한다. ;
태스크 복구 ISR(17)는 상대편 상태 감시자인 MCU 감시자(27)의 인터럽트 신호를 받아서 자기 프로세서 내부의 고장난 태스크 만을 복구시켜 준다.
태스크 감시자(15)는 프로세서 자신의 여러 태스크 상태를 각각 감시하여 태스크의 상태를 상기 공통 메모리에 저장하여 상대 감시자에게 자신의 동작 상태를 표시한다.
MCU(10)는 본연의 임무를 위한 여러 태스크(11, 12, 및 13)를 수행 중이다. 각각의 태스크는 정해진 시간 내에 태스크 상태 레지스터(14)에 자기 태스크에 해당하는 비트(Bit)를 설정한다. 태스크 감시자(15)는 주기적으로 공통 메모리(30)에 태스크 상태 레지스터를 복사한다. DSP 감시자(16)는 공통 메모리(30)를 점검하여 지정된 시간에 상대편(DSP)의 태스크 상태 레지스터가 설정되어 있지 않으면 MCU 인터럽트 신호(45)를 DSP(20)에 인가하여 인터럽트 요청을 한다. 또한 DSP 감시자(16)가 인터럽트 신호를 인가한 후 태스크 복구를 위해 정해진 시간 동안에 DSP 태스크 상태가 변화가 없을 경우 MCU 리셋 신호를 인가하여 DSP(20)를 초기화시킨다. 태스크 복구 ISR(17)은 상대편인 DSP(20)의 인터럽트 요청 신호(47)에 의해서 동작되며 즉시 태스크 상태 레지스터의 내용을 확인하여 문제가 있는 태스크를 파악하며 해당 태스크를 초기화시킨다.
도 4는 도 2에 도시된 두 프로세서 중 하나인 DSP(20)의 내부 구성을 나타내는 상세도이다. DSP(20)의 고장 안전 동작 원리는 MCU(10)와 동일하며 내부 구조도 동일하다.
DSP(20)는 상태 감시자인 MCU 감시자(27), 태스크 복구 ISR(26), 및 태스크 감시자(25)를 포함한다.
DSP 감시자(27)는 상대편 프로세서인 MCU(10)의 동작 상태를 점검하고 MCU(20)의 내부 태스크의 정상 동작 여부를 판별하여 인터럽트 신호를 발생시키고 그 이후에 지정된 태스크 복구 시간의 경과 후 MCU(10)에 리셋 신호를 출력한다.
ISR(26)는 상대편 상태 감시자인 MCU 감시자(27)의 인터럽트 신호를 받아서 자기 프로세서 내부의 고장난 태스크 만을 복구시켜 준다.
태스크 감시자(25)는 프로세서 자신의 여러 태스크 상태를 각각 감시하여 태스크의 상태를 상기 공통 메모리(30)에 저장하여 상대 감시자에게 자신의 동작 상태를 표시한다.
도 5는 공통 메모리(30)의 내부 메모리 맵(Memory Map)을 나타낸다. 공통 메모리(30)는 MCU(10)의 데이터를 DSP(20)와 공유하기 위한 MCU 데이터 영역(31)과 DSP(20)의 데이터를 MCU(10)와 공유하기 위한 DSP 데이터 영역(32)을 포함한다. 그 리고 MCU(10)의 태스크 상태를 나타내기 위한 MCU 태스크 상태 레지스터의 복사본 (MCU TSR, 33)과 DSP의 태스크 상태를 나타내기 위한 DSP 태스크 상태 레지스터의 복사본 (DSP TSR, 34)를 포함한다.
각 프로세서의 상호 감시자는 지정된 기간 이내에 태스크 상태의 변화가 없는 경우 상대 프로세서에 인터럽트 신호를 인가하여 문제가 있는 태스크를 초기화 시키도록 명령하고, 지정된 복구 시간 이내에 상대 프로세서의 태스크가 정상을 회복하지 못하는 경우 상대 프로세서에 리셋 신호를 인가하여 시스템을 고장으로부터 복구시킨다. 이러한 새로운 고장 안전 구조를 통해서 전체 시스템의 고장으로부터의 복구 시간을 단축하였고 문제가 없는 태스크를 자주 초기화시키는 번거로움을 없애서 시스템의 안정성을 높였다.
본 발명에 따른 듀얼 프로세서 제어 장치의 고장 안전 구조는 듀얼 프로세서가 이용되는 분야에 적용될 수 있다.
도 1은 단일 프로세서를 가지는 시스템의 기존 방식의 워치독 타이머 구성을 나타낸다.
도 2은 본 발명의 실시예에 따른 듀얼 프로세서 제어 장치의 고장 안전 구조의 구성을 나타낸 블록도이다.
도 3은 도 2에 도시된 두 개의 프로세서 중 하나인 MCU 내부의 어플리케이션 태스크와 태스크 상태 레지스터의 관계를 도식화한 도면이다.
도 4는 도 2에 도시된 두 개의 프로세서 중 하나인 DSP 내부의 어플리케이션 태스크와 태스크 상태 레지스터의 관계를 도식화한 도면이다.
도 5는 도 2에 도시된 공통 메모리의 상세도이다.
도 6은 도 2 및 도 5에 도시된 공통 메모리를 이용한 고장 안전 구조의 실시 예를 나타낸 도면이다.
<도면 주요 부분에 대한 부호의 설명>
10: MCU
11, 12, 13: MCU의 태스크
14: MCU의 태스크 상태 레지스터
15: MCU의 태스트 감시자
16: DSP 감시자
17: MCU의 태스크 복구 ISR
20: DSP
21, 22, 23: DSP의 태스크
24: DSP의 태스크 상태 레지스터
25: DSP의 태스크 감시자
26: MCU 감시자
27: DSP의 태스크 복구 ISR
30: 공통 메모리 (Common Memory)
31: MCU 전송 데이터 영역
32: DSP 전송 데이터 영역
33: MCU 태스크 상태 레지스터
34: DSP 태스크 상태 레지스터
41,43: 어드레스 버스
42,44: 데이타 버스
45: DSP 인터럽트 신호
46: MCU의 DSP 리셋 신호
47: DSP의 MCU 인터럽트 신호
48: DSP의 MCU 리셋 신호

Claims (5)

  1. 2개의 프로세서; 및
    상기 2개의 프로세서 사이에 접속되어, 상기 2개의 프로세서의 동작 상태를 검지하고 상기 2개의 프로세서 중의 적어도 하나에 고장이 발생한 경우, 고장 복귀 신호를 발생하여 고장된 프로세서를 정상 상태로 회복시키는 공통 메모리를 포함하는 듀얼 프로세서 제어 장치의 고장 안전 구조.
  2. 제1 항에 있어서, 상기 2개 프로세서 각각은 상대편 프로세서의 동작 상태를 점검하고 상기 상대편 프로세서의 내부 태스크의 정상 동작 여부를 판별하여 인터럽트 신호를 발생시키고 그 이후에 지정된 태스크 복구 시간의 경과 후 상기 상대편 프로세서에 리셋 신호를 출력하는 상태 감시자;
    상대편 상태 감시자의 인터럽트 신호를 받아서 자기 프로세서 내부의 고장난 태스크 만을 복구시켜주는 태스크 복구 인터럽트 서비스 루틴;
    프로세서 자신의 여러 태스크 상태를 각각 감시하여 태스크의 상태를 상기 공통 메모리에 저장하여 상대편 감시자에게 자신의 동작 상태를 표시하는 태스크 감시자를 포함하는 듀얼 프로세서 제어 장치의 고장 안전 구조.
  3. 제1 항에 있어서, 상기 2개 프로세서 중 하나는 사용자 인터페이스를 담당하는 마이크로 콘트롤 유닛이고, 나머지는 하는 고속 신호 처리, 계측, 및 제어를 담 당하는 디지털 신호 처리 장치인 듀얼 프로세서 제어 장치의 고장 안전 구조.
  4. 제1 항에 있어서, 상기 공통 메모리는 상기 2개 프로세서 각각의 내부 태스크 상태를 저장하여 각 태스크별 동작 상태를 개별적으로 점검하는 듀얼 프로세서 제어 장치의 고장 안전 구조.
  5. 제1 항에 있어서, 상기 공통 메모리는 상기 2개의 프로세서의 기본적인 데이터 교환을 위한 메모리 영역을 각각 가지며 두 프로세서 각각 태스크의 오동작 여부를 판별할 수 있는 태스크 동작 상태 레지스터를 포함하는 듀얼 프로세서 제어 장치의 고장 안전 구조.
KR1020070123149A 2007-11-30 2007-11-30 듀얼 프로세서 제어 장치의 고장 안전 구조 KR100928187B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020070123149A KR100928187B1 (ko) 2007-11-30 2007-11-30 듀얼 프로세서 제어 장치의 고장 안전 구조

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020070123149A KR100928187B1 (ko) 2007-11-30 2007-11-30 듀얼 프로세서 제어 장치의 고장 안전 구조

Publications (2)

Publication Number Publication Date
KR20090056124A true KR20090056124A (ko) 2009-06-03
KR100928187B1 KR100928187B1 (ko) 2009-11-25

Family

ID=40987560

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020070123149A KR100928187B1 (ko) 2007-11-30 2007-11-30 듀얼 프로세서 제어 장치의 고장 안전 구조

Country Status (1)

Country Link
KR (1) KR100928187B1 (ko)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20180065882A (ko) * 2016-12-08 2018-06-18 한국전자통신연구원 멀티 코어 프로세서 및 그것의 동작 방법
KR20180065881A (ko) * 2016-12-07 2018-06-18 한국전자통신연구원 멀티 코어 프로세서 및 그것의 캐시 관리 방법
KR20190006262A (ko) * 2017-07-10 2019-01-18 현대오트론 주식회사 상대 프로세서를 감시하기 위한 방법 및 장치
CN110716822A (zh) * 2019-10-14 2020-01-21 深圳市网心科技有限公司 嵌入式设备、跨芯片监控方法、装置及存储介质
CN110825547A (zh) * 2019-09-23 2020-02-21 京信通信系统(中国)有限公司 一种基于smbus的pcie卡异常恢复装置及方法
KR20220084814A (ko) * 2020-12-14 2022-06-21 현대오토에버 주식회사 태스크 모니터링 방법, 그리고 이를 구현하기 위한 장치

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0920661A1 (en) * 1997-06-23 1999-06-09 Koninklijke Philips Electronics N.V. Slave dsp reboots stalled master cpu
KR20010028876A (ko) * 1999-09-27 2001-04-06 서평원 복수개의 프로세서를 갖는 장치의 데이터 백업 장치

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20180065881A (ko) * 2016-12-07 2018-06-18 한국전자통신연구원 멀티 코어 프로세서 및 그것의 캐시 관리 방법
KR20180065882A (ko) * 2016-12-08 2018-06-18 한국전자통신연구원 멀티 코어 프로세서 및 그것의 동작 방법
KR20190006262A (ko) * 2017-07-10 2019-01-18 현대오트론 주식회사 상대 프로세서를 감시하기 위한 방법 및 장치
CN110825547A (zh) * 2019-09-23 2020-02-21 京信通信系统(中国)有限公司 一种基于smbus的pcie卡异常恢复装置及方法
CN110825547B (zh) * 2019-09-23 2024-04-12 京信网络系统股份有限公司 一种基于smbus的pcie卡异常恢复装置及方法
CN110716822A (zh) * 2019-10-14 2020-01-21 深圳市网心科技有限公司 嵌入式设备、跨芯片监控方法、装置及存储介质
KR20220084814A (ko) * 2020-12-14 2022-06-21 현대오토에버 주식회사 태스크 모니터링 방법, 그리고 이를 구현하기 위한 장치
KR20220151146A (ko) * 2020-12-14 2022-11-14 현대오토에버 주식회사 태스크 모니터링 방법, 그리고 이를 구현하기 위한 장치

Also Published As

Publication number Publication date
KR100928187B1 (ko) 2009-11-25

Similar Documents

Publication Publication Date Title
KR100928187B1 (ko) 듀얼 프로세서 제어 장치의 고장 안전 구조
JP6098778B2 (ja) 冗長化システム、冗長化方法、冗長化システムの可用性向上方法、及びプログラム
US20020152425A1 (en) Distributed restart in a multiple processor system
US20060161714A1 (en) Method and apparatus for monitoring number of lanes between controller and PCI Express device
TWI529624B (zh) Method and system of fault tolerance for multiple servers
WO2020239060A1 (zh) 错误恢复的方法和装置
US20070128895A1 (en) Redundant automation system for controlling a techinical device, and method for operating such an automation system
CN104050061A (zh) 一种基于PCIe总线多主控板冗余备份系统
CA2530913A1 (en) Fault tolerant computer system and interrupt control method for the same
JP5790723B2 (ja) クラスタシステム、情報処理装置、クラスタシステムの制御方法及びプログラム
CN108958987B (zh) 一种低轨小卫星容错系统及方法
US20060242456A1 (en) Method and system of copying memory from a source processor to a target processor by duplicating memory writes
JP4487260B2 (ja) 多重系システム
JPH0934809A (ja) 高信頼化コンピュータシステム
JP3329986B2 (ja) マルチプロセッサシステム
CN102521086B (zh) 基于锁步同步的双模冗余系统及其实现方法
US20040139373A1 (en) System and method of checking a computer system for proper operation
KR101448013B1 (ko) 항공기용 다중 컴퓨터의 고장 허용 장치 및 방법
CN113791937A (zh) 一种数据同步冗余系统及其控制方法
CN109491842B (zh) 用于故障安全计算系统的模块扩展的信号配对
CN113867648A (zh) 一种服务器存储子系统及其控制方法
JPH08287030A (ja) 多重系計算機システムの自動再起動装置および方法
JP7056057B2 (ja) 情報処理装置、情報処理方法、情報処理システム、及び、コンピュータ・プログラム
Lee et al. NCU-HA: A lightweight HA system for kernel-based virtual machine
JP2001175545A (ja) サーバシステムおよび障害診断方法ならびに記録媒体

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20121107

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20131107

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20141105

Year of fee payment: 6

FPAY Annual fee payment

Payment date: 20160722

Year of fee payment: 7

R401 Registration of restoration
FPAY Annual fee payment

Payment date: 20160808

Year of fee payment: 8

FPAY Annual fee payment

Payment date: 20180806

Year of fee payment: 10

FPAY Annual fee payment

Payment date: 20190814

Year of fee payment: 11