KR101032000B1 - Self-repairing electronic circuit system and self-repairing method by mimicking cell differentiation - Google Patents
Self-repairing electronic circuit system and self-repairing method by mimicking cell differentiation Download PDFInfo
- Publication number
- KR101032000B1 KR101032000B1 KR1020090115787A KR20090115787A KR101032000B1 KR 101032000 B1 KR101032000 B1 KR 101032000B1 KR 1020090115787 A KR1020090115787 A KR 1020090115787A KR 20090115787 A KR20090115787 A KR 20090115787A KR 101032000 B1 KR101032000 B1 KR 101032000B1
- Authority
- KR
- South Korea
- Prior art keywords
- failure
- differentiation
- module
- sub
- unit
- Prior art date
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/16—Error detection or correction of the data by redundancy in hardware
- G06F11/20—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
- G06F11/202—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
- G06F11/2023—Failover techniques
- G06F11/2028—Failover techniques eliminating a faulty processor or activating a spare
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/16—Error detection or correction of the data by redundancy in hardware
- G06F11/1608—Error detection by comparing the output signals of redundant hardware
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/16—Error detection or correction of the data by redundancy in hardware
- G06F11/1629—Error detection by comparing the output of redundant processing systems
- G06F11/165—Error detection by comparing the output of redundant processing systems with continued operation after detection of the error
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/22—Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing
- G06F11/26—Functional testing
- G06F11/27—Built-in tests
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Quality & Reliability (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computer Hardware Design (AREA)
- Tests Of Electronic Circuits (AREA)
Abstract
Description
본 발명은 세포의 분화 기능을 모사한 자가 고장복구 전자회로 시스템 및 자가 고장복구 방법에 관한 것으로서, 특히, 프로그램 가능한 디바이스, 예를 들면, FPGA의 구성 반도체 단위에 고장이 발생하였을 경우, 생명체가 지니는 고유의 특성인 줄기 세포(stem cell)의 개념을 이용하여 이러한 고장을 스스로 진단하고 복구할 수 있는 자가 고장 복구 기능을 가지는 전자 회로 시스템 및 그 자가 고장 복구 방법에 관한 것이다. The present invention relates to a self-repairing electronic circuit system and a self-failure recovery method that simulate a cell differentiation function. More particularly, when a failure occurs in a semiconductor unit of a programmable device, for example, an FPGA, The present invention relates to an electronic circuit system having a self-failure recovery function capable of diagnosing and repairing such faults by utilizing the concept of a stem cell, which is an inherent characteristic, and a self-failure recovery method.
반도체 전자 회로의 고장 부분을 검출하고 이를 복구하기 위한 다양한 기법이 연구되어 왔다. 이러한 기법 중 하나는 유럽 특허 번호 제 EP1170666A3호 등에 개시된 것으로서, 구현되는 하드웨어 구조를 한쪽으로 형성하고 그 영역 외각에 수평과 수직으로 고장을 진단하는 영역을 설정한 것이다. 이 기법을 이용하면 외곽의 고장 진단 영역을 이용하여 고장 영역을 복구할 수 있다. 그러나, 이 기법은 고장 진단 영역을 포함하는 하드웨어에 국한하면, 복잡한 회로나 확장 가능성에 대해서 는 한정된다. 그러므로, 유동적으로 설계를 하지 못한다는 단점이 있다. 또한, 이러한 문제점을 해결하기 위해서 구현되는 회로를 나누어 설계하는 경우가 있지만 복잡한 회로를 설계하는데 어렵다는 단점이 있다.Various techniques for detecting and repairing faulty portions of semiconductor electronic circuits have been studied. One of these techniques is disclosed in European Patent No. EP1170666A3, in which a hardware structure to be implemented is formed on one side, and a region for diagnosing a fault in the horizontal and vertical directions is set on the outside of the area. Using this technique, the fault area can be recovered by using the fault diagnosis area on the outer side. However, this technique is limited to complex circuitry and scalability, as far as hardware is concerned, including fault diagnosis areas. Therefore, there is a disadvantage in that it can not be designed in a fluid manner. In order to solve such a problem, there is a disadvantage that it is difficult to design a complicated circuit although the circuit to be implemented is divided into two parts.
고장 복구에 대한 대한민국 특허 번호 제 10-0354437호에 따르면, 이는 "내장 메모리를 위한 자기 복구 회로를 구비하는 집적 회로 반도체 장치 및 메모리 복구 방법"으로서, 로우 및 칼럼 리던던시를 이용하여 내장 메모리에 발생된 불량 셀의 로우 및 칼럼의 복구를 수행하는 구조이다. 하지만 이 구조는 하나의 로우 또는 칼럼에서 불량 셀이 하나만 발생하더라도 그 로우 또는 칼럼을 전부 대체한다는 면에서 비효율적인 고장 복구 방법이라고 할 수 있다. According to Korean Patent No. 10-0354437 for failure recovery, this is an "integrated circuit semiconductor device having a magnetic recovery circuit for internal memory and a memory recovery method ", which uses row and column redundancy to generate And recovery of rows and columns of defective cells is performed. However, this structure is an inefficient failure recovery method in that even if only one bad cell occurs in one row or column, all the rows or columns are replaced.
이러한 문제점을 해결한 셀 단위의 자가 치유 방법은 P.K. Lala 등에 의해 발표된 논문 "On self-healing digital system design" ELSEVIER Microelectronics Journal에 개시된 것이다. 이 방법은 특정 하나의 여분 셀을 동, 서, 남, 북 방향으로 네 개의 기능 셀이 둘러싸는 구조이며 오류가 발생한 기능 셀에 대해서는 인근의 여분 셀이 오류가 난 기능 셀의 기능을 대신 수행하도록 한다. 그런데, 이 구조는 특정 하나의 기능 셀에 대하여 자가 고장 복구가 1회만 된다는 단점이 있다. 또한 P.K. Lala의 기법은 진리표 방식으로 각각의 기능 셀들이 맡고 있는 기능들을 구현한다. 그렇기 때문에, 조합 회로는 쉽게 구현이 가능하지만 순차 회로는 구현하기 어렵다는 단점을 가지고 있다. The cell-based self-healing method that solves this problem is described in P.K. Quot; on self-healing digital system design "published by Lala et al. In the ELSEVIER Microelectronics Journal. In this method, four functional cells surround one extra cell in the east, west, south, and north directions. For the functional cell in which the error occurs, the neighboring spare cell performs the function of the failed functional cell do. However, this structure has a disadvantage in that the self-failure recovery is performed only once for a specific functional cell. Also, P.K. Lala's technique implements the functions of each functional cell in a truth table format. Therefore, although the combinational circuit can be easily implemented, the sequential circuit has a disadvantage that it is difficult to implement.
자가 고장 복구에 대한 다른 기법 중에 고장난 회로를 새로운 영역으로 분화시키는 기법이 Gianluca Tempesti 등에 의해 발표된 논문 "The BioWall: an Electronic Tissue for Prototyping Bio-inspired systems", IEEE NANA/DOD Conference on Evolvable Hardware에 개시된 것이다. Tempesti 등에 의해 제시된 방법은 디지털 시계를 설계하는데 있어서 세포 하나를 기준으로 하나의 프로세서를 이용한 구조이며, 오류가 발생한 부분에 대해서는 옆의 새로운 프로세서가 이 기능을 수행하도록 한다. 이 기법은 프로그램 적으로 오류 발생 부분을 시뮬레이션 하던 것을 즉각적으로 하드웨어 구조 설계를 통해 확인할 수 있도록 하였다. A technique for differentiating a faulty circuit into a new area among other techniques for self-failure recovery is disclosed in Gianluca Tempesti et al., &Quot; The BioWall: an Electronic Tissue for Prototyping Bio-inspired systems ", IEEE NANA / DOD Conference on Evolvable Hardware will be. The method proposed by Tempesti et al. Uses a single processor based on a single cell to design a digital clock, and a new processor on the side of the error causes the new processor to perform this function. This technique allows the hardware structure design to instantaneously verify that the simulation of the error part is programmable.
그러나, 이 기법은 하나의 구현 회로에 대해서 많은 복잡한 프로세서를 지녀야 한다는 단점을 가지고 있다. However, this technique has a disadvantage in that it requires many complex processors for one implementation circuit.
그러므로, 고정된 하드웨어를 이용하는 것이 아니라 다양한 적용 가능성을 확보하면서도, 여러 번의 고장에 대해서는 반복적으로 고장을 복구할 수 있는 자가 고장 복구 기법이 절실히 요구된다. Therefore, there is a desperate need for a self-recovery method that can repair failures repeatedly for several faults while ensuring various applicability, rather than using fixed hardware.
본 발명의 다른 목적은 구현되는 디지털 회로의 전체 회로를 세부적 기능 단위별로 나누어 동작시 임의 부분에 발생하는 고장의 위치를 정확히 찾아내고, 고장 부분을 복수 회에 걸쳐서 복구함으로써 전자 회로의 동작 신뢰도를 증가시키는 것이다. It is another object of the present invention to provide a method and apparatus for dividing an entire circuit of an implemented digital circuit into detailed functional units to accurately locate a fault occurring in an arbitrary portion of the digital circuit, I will.
또한, 본 발명의 다른 목적은 디지털 회로의 고장 부분에 대하여 테스트를 거친 후 일시적 고장인지 영구적 고장인지 판단하고, 일시적 고장으로 판단된 고장 부분을 원래 구현된 회로의 리던던시(Redundancy)로서 이용함으로써 같은 회로의 연속된 고장을 빠르게 복구하는 것이다. Another object of the present invention is to determine whether a temporary failure or a permanent failure has occurred after testing a faulty portion of a digital circuit and to use the fault portion judged as a temporary failure as a redundancy of an originally implemented circuit, Lt; RTI ID = 0.0 > failure. ≪ / RTI >
또한, 본 발명의 또 다른 목적은 세부적 기능별로 나눈 디지털 회로에 고장이 발생된 경우, 고장회로에 대한 출력을 차단하고 이 기능을 수행하도록 같은 기능을 하는 회로를 새로운 다른 영역에 분화시킴으로써 반도체 회로의 동작 안정성을 향상시키는 것이다. It is still another object of the present invention to provide a semiconductor circuit which can prevent the output of a faulty circuit from being broken and divide a circuit having the same function into a different area to perform the function, Thereby improving operation stability.
상기와 같은 목적들을 달성하기 위한 본 발명의 일면은, 이중 모듈화(Double Modular Redundancy, DMR) 구조로 설계된 반도체 회로부를 포함하는 프로그램 가능한 전자 회로 시스템으로서, 반도체 회로부를 구성하는 복수 개의 서브 모듈에서 고장이 발생하는지 여부 및 고장이 발생된 서브 모듈의 위치를 파악하는 고장 판단/분화부, 및 고장 판단/분화부로부터 고장이 발생된 서브 모듈의 위치를 수신하고, 고장이 발생된 서브 모듈을 분화시킬 분화 영역을 결정하여 고장 판단/분화부로 전달하는 복구 관리부를 포함하는 전시에 관한 것이다. According to an aspect of the present invention, there is provided a programmable electronic circuit system including a semiconductor circuit unit designed in a double modular redundancy (DMR) structure, wherein a failure occurs in a plurality of submodules constituting a semiconductor circuit unit And the position of the sub-module in which the failure has occurred, and a position of the sub-module in which the failure has occurred from the failure determination / And a recovery management unit for determining the area and delivering it to the failure determination / differentiation unit.
본 발명의 또 다른 일면은, 이중 모듈화(Double Modular Redundancy, DMR) 구조로 설계된 반도체 회로부를 포함하는 프로그램 가능한 전자 회로 시스템에 있어서, 상기 반도체 회로부를 구성하는 복수 개의 서브 모듈에서 고장이 발생하는지 여부 및 고장이 발생된 서브 모듈의 위치를 파악하는 고장 판단 및 분화부; 및 상기 고장 판단 및 분화부로부터 고장이 발생된 서브 모듈의 위치를 수신하고, 고장이 발생된 서브 모듈을 분화시킬 분화 영역을 결정하여 상기 고장 판단 및 분화부로 전달하는 복구 관리부를 포함하며, 상기 고장 판단 및 분화부는 상기 복구 관리부로부터 수신된 분화 영역으로 상기 고장이 발생된 서브 모듈을 분화시키고, 상기 반도체 회로부는 각각의 서브 모듈 당 네 개의 고유 분화 영역 및 네 개의 공통 분화 영역을 포함하며, 상기 네 개의 공통 분화 영역은 16개의 서브 모듈에 의하여 공유되며, 여기에서 상기 고장 판단 및 분화부는, 16개의 서브 모듈로 이루어지는 각각의 동작 모듈을 공통적으로 관리하는 네 개의 관리 모듈들을 포함하며, 상기 관리 모듈은, DMR 구조로 이루어진 상기 서브 모듈의 두 가지 출력을 비교하여 고장을 검출하고, 고장 검출시 고장이 발생된 서브 모듈의 위치를 판단하는 고장 검출부; 고장이 발생된 서브 모듈에 동일한 입력을 인가한 후 출력 결과를 비교하여 불일치하는 결과가 반복될 경우 영구 고장으로서 판단하는 자가 테스트부; 및 상기 고장 판단 및 분화부로부터 수신된 분화 영역으로 상기 고장이 발생된 서브 모듈의 원본 패턴을 분화시키는 분화 실행부를 포함하는 것을 특징으로 하는 자가 고장 복 구 기능을 가지는 전자 회로 시스템에 관한 것이다.According to still another aspect of the present invention, there is provided a programmable electronic circuit system including a semiconductor circuit portion designed with a double modular redundancy (DMR) structure, wherein the semiconductor module includes a plurality of sub- A failure determination and classification unit for determining a location of a sub module where a failure occurs; And a recovery management unit that receives the location of the sub module where the failure has occurred from the failure determination and differentiation unit, determines a differentiation area for differentiating the sub module where the failure has occurred, and transmits the determination result to the failure determination and differentiation unit, Wherein the judging and erecting unit differentiates the submodule in which the failure has occurred to the differentiation region received from the recovery management unit, the semiconductor circuit unit includes four unique differentiation regions and four common differentiation regions for each submodule, Wherein the common failure region is shared by 16 submodules, wherein the failure determination and differentiation unit includes four management modules that commonly manage respective operation modules including 16 submodules, , Comparing the two outputs of the sub-module having the DMR structure to detect a failure, A failure detection unit for determining a position of a sub module in which a failure occurs when a failure is detected; A self test unit for comparing the output results after applying the same input to the sub module in which the failure occurs and judging the result as a permanent failure if a discrepancy result is repeated; And a differentiation unit for differentiating an original pattern of the sub-module in which the failure has occurred from the failure determination and differentiation unit to the differentiation area received from the failure determination and differentiation unit.
특히, 16개의 서브 모듈들의 현재 상태 정보는 네 개의 관리 모듈들에게 공통적으로 전달되며, 네 개의 관리 모듈 중 하나가 주된 관리 모듈(dominant management module)로서 서브 모듈들의 고장 여부 및 고장이 발생된 서브 모듈의 위치를 결정하는 것을 특징으로 한다. 바람직하게는, 16개의 서브 모듈들의 현재 상태 정보가 네 개의 관리 모듈들에게 공통적으로 전달되면, 관리 모듈들은 현재 상태 정보 및 자신의 주소를 각각 복구 관리부에 전달하고, 주된 관리 모듈로부터 수신된 현재 상태 정보가 다른 관리 모듈로부터 수신된 현재 상태 정보와 일치하지 않으면, 복구 관리부는 주된 관리 모듈에 고장이 발생한 것으로 판단하고 네 개의 관리 모듈 중 다른 관리 모듈을 새로운 주된 관리 모듈로서 설정한다. 뿐만 아니라, 자가 테스트부는 고장이 발생된 서브 모듈들 중에서 영구 고장인 것으로 판단된 서브 모듈들은 영구히 동작을 차단시키고, 영구 고장이 아닌 것으로 판단된 서브 모듈을 다시 정상 서브 모듈로서 설정하여 추후 리던던시 모듈(redundancy module)로서 동작하도록 하는 것을 특징으로 한다. 또한, 복구 관리부는 고장이 발생된 서브 모듈을 네 개의 고유 분화 영역 중 가용한 어느 하나로 분화시키고, 고유 분화 영역 모두가 가용하지 않은 경우에는 고장이 발생된 서브 모듈을 공통 분화 영역 중 가용한 어느 하나로 분화시키도록 고장 판단/분화부를 제어하는 것을 특징으로 한다. 특히, 반도체 회로부에서 서브 모듈은 고장 진단 및 복구의 최소 단위이고, 각각 네 개의 서브 모듈로 이루어진 동작 블록들 네 개가 각각 3x3 차원 행렬의 (1, 1), (1, 3), (3, 1) 및 (3, 3) 원소 위치에 배치되며, 각각 네 개의 분 화 영역으로 이루어진 분화 블록들 다섯 개가 각각 행렬의 나머지 원소 위치에 배치되고, 행렬의 (2, 2) 원소 위치에 배치된 분화 블록이 공통 분화 영역으로서 동작하는 것을 특징으로 한다. In particular, the current status information of the sixteen sub-modules is commonly transmitted to the four management modules, and one of the four management modules is a dominant management module, Is determined. Preferably, when the current state information of the sixteen sub-modules is commonly transmitted to the four management modules, the management modules deliver current state information and their own addresses to the recovery management unit, respectively, If the information does not match the current status information received from the other management module, the recovery management unit determines that a failure has occurred in the main management module and sets the other management module among the four management modules as a new main management module. In addition, the self-test unit may permanently suspend operation of the sub-modules determined to be a permanent failure among the sub-modules in which the failure has occurred, set the sub-module determined to be not a permanent failure back as a normal sub- redundancy module). In addition, the recovery management unit divides the failed submodule into any one of the four distinctive divisional areas, and if all of the distinctive divisional areas are not available, the restoration management unit allocates the failed submodule to any one of the common divisional areas And the failure judgment / differentiation unit is controlled so as to be differentiated. In particular, in the semiconductor circuit, the sub-module is the minimum unit for diagnosing and repairing faults, and four operation blocks, each consisting of four sub-modules, each have (1, 1), (1, 3) ), And (3, 3), and each of the five differentiation blocks, each of which is made up of four differentiation regions, is disposed at each of the remaining element positions of the matrix, and the differentiation blocks arranged at the (2, 2) Is operated as a common differentiation region.
상기와 같은 목적들을 달성하기 위한 본 발명의 다른 면은, 이중 모듈화(DMR) 구조로 설계된 반도체 회로부를 포함하는 프로그램 가능한 전자 회로 시스템의 자가 고장 복구 방법에 관한 것으로서, 각각의 서브 모듈 당 네 개의 고유 분화 영역 및 네 개의 공통 분화 영역을 포함하고, 네 개의 공통 분화 영역이 16개의 서브 모듈에 의하여 공유되는 상기 반도체 회로부를 구성하는 복수 개의 서브 모듈에서 고장이 발생하는지 판단하는 고장 여부 판단 단계; 고장이 발생되었을 경우 고장이 발생된 서브 모듈의 위치를 파악하는 고장 위치 판단 단계; 고장이 발생된 서브 모듈을 분화시킬 분화 영역을 결정하는 분화 영역 결정 단계; 및 결정된 상기 분화 영역으로 상기 고장이 발생된 서브 모듈의 원본 패턴을 분화시키는 분화 단계를 포함하며, 상기 분화 영역 결정 단계는, 상기 모듈의 리던던시가 있는지 확인한 후, 이를 우선적으로 사용하고, 만약 모듈의 리던던시가 없으면, 상기 서브 모듈을 상기 고유 분화 영역으로 분화시키며, 만약 가용한 고유 분화 영역이 존재하지 않을 경우 상기 공통 분화 영역으로 분화시키는 것을 특징으로 한다.According to another aspect of the present invention, there is provided a method for repairing a failure of a programmable electronic circuit system including a semiconductor circuit portion designed in a dual modularity (DMR) structure, Determining whether a failure occurs in a plurality of submodules constituting the semiconductor circuit portion including four different division regions and four common division regions shared by the sixteen submodules; A failure location determination step of determining a location of a sub module in which a failure occurs if a failure occurs; Determining a differentiation region for differentiating the submodule in which a failure has occurred; And a differentiating step of differentiating an original pattern of the submodule in which the failure has occurred in the determined differentiation area, wherein the step of determining the differentiation area determines whether there is redundancy of the module and then preferentially uses the redundancy, And if there is no redundancy, differentiates the submodule into the unique differentiation region, and if the available unique differentiation region does not exist, differentiates into the common differentiation region.
상기 고장 여부 판단 단계는, DMR 구조로 이루어진 상기 서브 모듈의 두 가지 출력을 비교하여 고장을 검출하는 단계; 고장이 발생된 서브 모듈에 동일한 입력을 인가한 후 출력 결과를 비교하는 단계; 및 출력 결과가 하나 이상의 입력에서 불일치할 경우 상기 고장이 발생된 서브 모듈을 영구 고장으로서 판단하는 자가 테 스트 단계를 더 포함한다.Determining whether the failure occurs by comparing two outputs of the submodule having a DMR structure to detect a failure; Comparing the output result after applying the same input to the sub module where the failure occurs; And a self test step of determining the submodule in which the failure has occurred as a permanent failure when the output result is inconsistent with one or more inputs.
또한, 고장 여부 판단 단계는, DMR 구조로 이루어진 서브 모듈의 두 가지 출력을 비교하여 고장을 검출하는 단계, 고장이 발생된 서브 모듈에 동일한 입력을 인가한 후 출력 결과를 비교하는 단계, 및 출력 결과가 하나이상의 입력에서 불일치할 경우 고장이 발생된 서브 모듈을 영구 고장으로서 판단하는 자가 테스트 단계를 더 포함하는 것을 특징으로 한다. 더 나아가, 고장 여부 판단 단계는, 16개의 서브 모듈들의 현재 상태 정보를 네 개의 관리 모듈들에게 공통적으로 전달하는 단계, 및 네 개의 관리 모듈 중 하나가 주된 관리 모듈로서 서브 모듈들의 고장 여부 및 고장이 발생된 서브 모듈의 위치를 결정하는 단계를 더 포함하는 것을 특징으로 한다. 바람직하게는, 고장 여부 판단 단계는 16개의 서브 모듈들의 현재 상태 정보가 네 개의 관리 모듈들에게 공통적으로 전달되면, 관리 모듈들이 현재 상태 정보 및 자신의 주소를 각각 복구 관리부에 전달하는 단계, 주된 관리 모듈로부터 수신된 현재 상태 정보를 다른 관리 모듈로부터 수신된 현재 상태 정보와 비교하는 단계, 및 비교 결과 일치하지 않으면, 주된 관리 모듈에 고장이 발생한 것으로 판단하는 단계, 및 네 개의 관리 모듈 중 다른 관리 모듈을 새로운 주된 관리 모듈로서 설정하는 단계를 더 포함하는 것을 특징으로 한다. 특히, 자가 테스트 단계는 고장이 발생된 서브 모듈들 중에서 영구 고장인 것으로 판단된 서브 모듈들의 동작을 영구히 차단시키는 단계, 및 영구 고장이 아닌 것으로 판단된 서브 모듈을 다시 정상 서브 모듈로서 설정하여 추후 리던던시 모듈로서 동작하도록 하는 단계를 더 포함한다. 더 나아가, 분화 영역 결정 단계는 고장이 발생된 서브 모듈을 네 개의 고 유 분화 영역 중 가용한 어느 하나로 분화시키고, 고유 분화 영역 모두가 가용하지 않은 경우에는 고장이 발생된 서브 모듈을 공통 분화 영역 중 가용한 어느 하나로 분화시키도록 분화 영역을 결정하는 단계를 더 포함한다. The failure determination step may include detecting a failure by comparing two outputs of a submodule having a DMR structure, comparing output results after applying the same input to the failed submodule, Further comprising a self-testing step of determining that the submodule in which the failure has occurred is a permanent failure if the mismatch occurs in one or more inputs. In addition, the step of determining whether or not the failure is caused includes the steps of: transferring current status information of the 16 sub modules to the four management modules in common; and, if one of the four management modules is the main management module, And determining the position of the generated sub-module. Preferably, when the current state information of the sixteen sub-modules is commonly transmitted to the four management modules, the failure determination step may include the steps of the management modules transmitting the current state information and the own address to the recovery management module, Comparing current state information received from the module with current state information received from another management module; and determining that a failure has occurred in the main management module if the comparison result does not match, As a new main management module. In particular, the self-test step may include permanently blocking the operation of the sub-modules determined to be permanent failures among the failed sub-modules, setting the sub-module determined not to be a permanent failure as a normal sub- And operating as a module. Further, in the step of determining the differentiation region, the sub-module in which the failure occurs is differentiated into one of the four high-density differentiation regions, and when all of the unique differentiation regions are not available, the sub- And determining the differentiation region so as to differentiate into one which is usable.
상기 목적을 달성하기 위한 본 발명의 또 다른 면은 상기 전자 회로 시스템의 자가 고장 복구 방법이 구현가능한 반도체 회로부를 제공한다.According to another aspect of the present invention, there is provided a semiconductor circuit unit capable of implementing a self-failure recovery method of the electronic circuit system.
본 발명에 의하여, 반도체 회로의 고장 부분을 세부적 기능 단위별로 파악할 수 있으므로 신속히 고장 부분을 복구할 수 있다. According to the present invention, since the faulty portion of the semiconductor circuit can be grasped by detailed functional units, the faulty portion can be quickly recovered.
또한, 본 발명에 의하여 일시적인 고장을 영구적 고장과 비교할 수 있고, 일시적 고장으로 판단된 고장 부분을 원래 구현된 회로의 리던던시로 이용함으로써 고장을 위해 필요한 하드웨어 영역을 줄이는 것은 물론, 반복되는 고장에도 효율적으로 대처할 수 있다. Also, according to the present invention, it is possible to compare a temporary failure with a permanent failure, and use a failure portion judged as a temporary failure as a redundancy of an originally implemented circuit, thereby reducing a hardware area required for a failure, Can cope.
더 나아가, 본 발명에 의하여 영구적 고장이 발생된 회로 영역에 의한 출력을 차단시키는 대신에, 고장이 발생된 회로 영역의 원본 패턴을 분화 영역에 복제시킴으로써 회로 동작의 신뢰성을 향상시킬 수 있다. Further, according to the present invention, it is possible to improve the reliability of the circuit operation by replicating the original pattern of the circuit region in which the failure occurs in the differentiation region, instead of cutting off the output by the circuit region in which the permanent failure has occurred.
본 발명과 본 발명의 동작상의 이점 및 본 발명의 실시에 의하여 달성되는 목적을 충분히 이해하기 위해서는 본 발명의 바람직한 실시예를 예시하는 첨부 도면 및 첨부 도면에 기재된 내용을 참조하여야만 한다. In order to fully understand the present invention, operational advantages of the present invention, and objects achieved by the practice of the present invention, reference should be made to the accompanying drawings and the accompanying drawings which illustrate preferred embodiments of the present invention.
이하, 첨부한 도면을 참조하여 본 발명의 바람직한 실시예를 설명함으로서, 본 발명을 상세히 설명한다. 그러나, 본 발명은 여러 가지 상이한 형태로 구현될 수 있으며, 설명하는 실시예에 한정되는 것이 아니다. 그리고, 본 발명을 명확하게 설명하기 위하여 설명과 관계없는 부분은 생략되며, 도면의 동일한 참조부호는 동일한 부재임을 나타낸다. Hereinafter, the present invention will be described in detail with reference to the preferred embodiments of the present invention with reference to the accompanying drawings. However, the present invention can be implemented in various different forms, and is not limited to the embodiments described. In order to clearly describe the present invention, parts that are not related to the description are omitted, and the same reference numerals in the drawings denote the same members.
명세서 전체에서, 어떤 부분이 어떤 구성요소를 “포함”한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성요소를 제외하는 것이 아니라, 다른 구성요소를 더 포함할 수 있는 것을 의미한다. 또한, 명세서에 기재된 “...부”, “...기”, “모듈”, “블록” 등의 용어는 적어도 하나의 기능이나 동작을 처리하는 단위를 의미하며, 이는 하드웨어나 소프트웨어 또는 하드웨어 및 소프트웨어의 결합으로 구현될 수 있다. Throughout the specification, when an element is referred to as " including " an element, it does not exclude other elements unless specifically stated to the contrary. The terms "part", "unit", "module", "block", and the like described in the specification mean units for processing at least one function or operation, And a combination of software.
도 1은 본 발명의 일면에 의한 전자 회로 시스템의 구조를 개념적으로 도시하는 도면이다. 1 is a view conceptually showing the structure of an electronic circuit system according to one aspect of the present invention.
도 1에 도시된 바와 같이, 본 발명에 의한 전자 회로 시스템은 세 개의 개념적 계층(110, 120, 130)으로 구분될 수 있다. 설명의 편의를 위하여, 도 1에서 복구 관리부(110)는 16개의 동작 영역(동작 1 내지 동작 16) 및 16개의 관리 영역(관리 1 내지 관리 16)을 담당하는 것으로 예시된다. 하지만, 하나의 전자 회로 시스템에 포함되는 관리 영역 및 동작 영역의 개수는 더 많거나 적을 수 있음은 물론이다. 도 1에서 25개의 관리 영역에 1 내지 16까지의 첨자만이 붙은 이유는 관리 영역들이 순환적(cyclic)으로 배치될 수 있기 때문이다. As shown in FIG. 1, the electronic circuit system according to the present invention can be divided into three
도 1의 고장 판단/분화부(120)를 참조하면, 하나의 동작 영역이 네 개의 관 리 영역에 의하여 공통 관리될 수 있음을 알 수 있다. 예를 들어, ‘동작 1’은 네 개의 관리 영역인 ‘관리 1’, ‘관리 4’, ‘관리 15’, 및 ‘관리 16’에 의해 관리될 수 있다. 이 중 하나의 관리 영역이 주된 관리 영역으로 동작하고, 주된 관리 영역에 고장이 발생할 경우 다른 관리 영역이 주된 관리 영역으로서 동작할 수 있다. Referring to FIG. 1, referring to the failure determination /
또한, 도 1을 참조하면, 각각의 동작 영역은 3x3 차원의 행렬(130)로 분할될 수 있으며, 한 행렬(130)에는 네 개의 세부 기능을 하는 서브 모듈(회로 0 내지 회로 3) 및 다섯 개의 분화 영역(분화 4 내지 분화 8)이 포함된다. 이 중 ‘분화 4’ 내지 ‘분화 7’은 고유 분화 영역이고, ‘분화 8’은 공통 분화 영역인데 이에 대해서는 해당 부분에서 상세히 후술된다. 1, each of the operating regions may be divided into a
고장 판단/분화부(120)는 하부 디지털 회로(130)의 관리와 고장난 회로에 대하여 새로운 영역으로 회로를 분화시키는 분화 기능을 담당한다. 또한, 복구 관리부(110)는 고장 판단/분화부(120)를 제어한다. 고장 판단/분화부(120)는 여러 하부 디지털 회로 중 고장난 부분을 검출하고, 고장이라고 판단된 회로에 대하여 일시적 고장인지 영구적 고장인지 판단하는 기능을 한다. 복구 관리부(110)는 자가 고장복구 방법에 있어서, 자가 고장 복구에 대한 전체 흐름을 관리하는 기능을 수행한다. The failure determination /
디지털 회로에 대하여 반도체 회로부(130)는 반도체 회로를 먼저 분리 가능한 모듈 단위로 나누고 이 각 모듈들을 세부 기능별로 나누게 된다. 반도체 회로부(130)를 세부 기능별로 분리시키지 않을 경우, 회로에 고장이 발생되면 기능을 담당하는 부분을 교체하거나, 시스템 전체를 바꾸게 되므로, 이 반도체 회로 부(130)에서는 세부 기능별로 나누어 회로를 설계한다. With respect to the digital circuit, the
세부 기능별로 나눈 회로가 정상적으로 동작하는지 판단하기 위해 같은 회로를 이중으로 놓아 출력을 비교하는 이중 모듈화(Double Modular Redundancy, DMR) 구조로 설계하고 고장 판단/분화부(120)에서 고장 여부를 판단한다. 고장 판단/분화부(120)에 포함되는 동작 영역 각각에 하나의 관리 영역이 할당될 수 있으며, 세 개의 관리 영역이 동일한 동작 영역에 대해 같은 관리 기능을 동시에 수행하는 구조이다. In order to judge whether a circuit divided by the detailed function is operating normally, a double modular redundancy (DMR) structure for comparing the outputs of the same circuits is designed and the failure judgment / One management area may be allocated to each of the operation areas included in the failure determination /
도 1에서, 서브 모듈(예를 들어, 130의 회로 0 내지 회로 3)의 DMR 출력들은 이러한 서브 모듈을 담당하는 관리 영역(예를 들어, 관리 9, 관리 10, 관리 14, 및 관리 15)으로 동시에 전달된다. 그러면, 고장 판단/분화부(120)는 수신된 출력값들을 분석하여 고장이 발생한 서브 모듈의 위치를 결정하고 이러한 고장난 회로(130)의 정보를 복구 관리부(110)에 전달한다. In Figure 1, the DMR outputs of a submodule (e.g.,
복구 관리부(110)에서는 하나의 고장난 회로에 대한 정보를 고장 판단/분화부(120)의 관리 영역을 통해 받게 된다. 복구 관리부(110)는 주된 관리 영역이 전해주는 값과 이웃하는 세 개의 관리 영역이 전해주는 값을 비교하여 현재의 주된 관리 영역의 고장 여부를 판단한다. 고장 여부를 판단하기 위하여 네 개의 수신 값 중 다수를 차지하는 값을 참으로 간주하고, 소수의 값을 오류가 발생하였다고 판단할 수 있다. 주된 관리 영역의 값 및 다른 관리 영역의 값들이 같을 경우 주된 관리 영역을 변경하지 않고 진행한다. 반면에, 주된 관리 영역의 값과 이웃하는 다른 관리 영역의 값이 다를 경우, 주된 관리 영역에 고장이 발생하였다고 판단하고 다 른 관리 영역 중 하나를 주된 관리 영역으로 설정한다. 이때 새롭게 주된 관리 영역으로 설정된 관리 영역은 원래 담당하던 관리 기능과 이전 주된 관리 영역이 수행하던 관리 기능을 동시에 수행한다. The
도 2는 본 발명의 일면에 의한 전자 회로 시스템 중 반도체 회로부의 구조를 개념적으로 도시하는 도면이다. 2 is a view conceptually showing a structure of a semiconductor circuit part of an electronic circuit system according to one aspect of the present invention.
도 2에 도시된 바와 같이 반도체 회로부는 세부 기능별로 16개의 서브 모듈로 분할될 수 있다. 반도체 회로부를 분할함으로써 고장이 발생하였을 경우 신속하고 효과적으로 대응할 수 있음은 전술된 바와 같다. As shown in FIG. 2, the semiconductor circuit portion can be divided into 16 sub-modules according to detailed functions. As described above, when a failure occurs by dividing the semiconductor circuit part, it can cope with it promptly and effectively.
구현되는 전체 구조는 입력부(210), 출력부(230), 구현 회로(220)로 나누어진다. The overall structure to be implemented is divided into an
구현 회로(220)는 설계하고자 하는 기능별로 4 가지 영역(도 2의 A(240), B(250), C(260), D(270))으로 분리된다. 여기서 네 개의 영역으로 나누었지만 구현 디지털 회로(220)에서 복잡성에 따라 더 많은 기능별로 나누게 되면 그 영역의 수는 늘어나게 된다. The
구현 회로(220)에서 기능별로 나누어진 A(240)는 다시 세부 기능별로 4가지 영역인 (240a), (240b), (240c), (240d)로 나뉜다. 또한, B(250)는 세부 기능별로 4가지 영역인 (250a), (250b), (250c), (250d)로 나뉘고, C(260)는 세부 기능별로 4가지 영역인 (260a), (260b), (260c), (260d)로 나뉜다. 마지막으로, D(270)는 세부 기능별로 4가지 영역인 (270a), (270b), (270c), (270d)로 나뉜다.A 240 divided into functions in the
세부적으로 나뉜 16 개의 영역은 구현 회로가 동작하는 부분으로 이 부분에 고장이 발생하면 각각 새로운 5개 분화 영역에 고장난 회로를 분화 시킨다. 예를 들어, A영역의 예를 들면 A11(240a)에 고장이 발생하면, (240e)로 분화가 되고, A12(240b)에 고장이 발생하면, (240f)로 분화가 되고, A21(240c)에 고장이 발생하면, (240h)로 분화가 되고, A22(240d)에 고장이 발생하면, (240g)로 분화가 된다. 만일 이 영역에 더 이상 분화 영역이 없을 경우 공통 분화영역(240i)으로 분화된다. 즉, 새로운 분화영역은 A영역의 경우는 (240e), (240f), (240g), (240h), (240i) 이며, B영역의 경우는 (250e), (250f), (250g), (250h), (250i) 이며, C영역의 경우는 (260e), (260f), (260g), (260h), (260i) 이며, D영역의 경우는 (270e), (270f), (270g), (270h), (270i)이다. 도 4에서 후술되는 바와 같이, 이러한 분화 영역들 중 (240i), (250i), (260i), 및 (270i)는 공통 분화 영역이고 나머지 분화 영역들은 고유 분화 영역들이다. The 16 areas that are divided in detail are the parts where the implementation circuit operates. If a failure occurs in this part, the circuit breaks down into the new five differentiation areas. For example, when a failure occurs in A11 (240a), for example, a failure occurs in A12 (240b), and a failure occurs in A12 (240b) (240 h), and when a failure occurs in A 22 (240 d), it is differentiated into (240 g). If there is no further differentiation region in this region, it is differentiated into the common differentiation region 240i. That is, the new differentiation region is 240e, 240f, 240g, 240h, and 240i in the case of the A region, and 250e, 250f, 250g, 260h, 260h and 260i in the case of the C region and 270e, 270f and 270g in the case of the D region, , (270h), and (270i). As described later in FIG. 4, among these differentiation regions, (240i), (250i), (260i), and (270i) are common differentiation regions and the remaining differentiation regions are unique differentiation regions.
또한, 세부 기능 별로 나누어진 영역들(예를 들어 240a)도 다시 분할되어 16개의 영역으로 분할될 수도 있다. 최종적으로 분할된 최소 단위가 각각 4개씩 묶어진 블록이 도 2의 최하단에 도시된다. 즉, 도 2의 (240a-1), (240a-2), (240a-3) 및 (240a-4)는 각각 도 4의 410(0 내지 3)과 상응한다. 이를 더욱 상세히 설명하기 위하여 도 2 및 도 4를 참조하면, 도 2의 A11(240a)이 더 분할되어 도 4의 매크로블록(410)이 된다. 도 4에 도시된 매크로블록(400)은 6x6 행렬 형식으로 분할된 정사각형들을 도시하는데, 분할된 각 정사각형에 기재된 번호는 해당 사각형의 주소를 예시한다. 도 4에서, 410, 420, 430, 및 440은 각각 동작 영역 0, 동작 영역 1, 동작 영역 2, 및 동작 영역 3을 나타내고, 450, 460, 470, 480, 및 490은 각각 분 화 영역 4, 분화 영역 5, 분화 영역 6, 분화 영역 7, 및 분화 영역 8을 나타낸다. 도 4의 동작 영역이 분화 영역으로 분화되는 과정에 대해서는 도 3을 이용하여 상세히 후술된다. In addition, regions (for example, 240a) divided by detailed functions may be divided again and divided into 16 regions. A block in which four final minimum units are bundled is shown at the bottom of Fig. That is, (240a-1), (240a-2), 240a-3, and 240a-4 in FIG. 2 correspond to 410 (0-3) in FIG. To explain this in more detail, referring to FIG. 2 and FIG. 4,
도 3은 본 발명의 일면에 의한 전자 회로 시스템에서 고장이 발생된 서브 모듈이 분화되는 과정을 개념적으로 설명하는 도면이다. 도 3에서 6비트로 이루어진 한 행은 주소를 나타낸다. 즉, A 분화 영역(310a)의 제1 행은 주소 16을 의미하며, A 동작 영역(310)의 제1 행은 주소 0을 의미한다. 마찬 가지로, B 분화 영역(320a)의 제1 행은 주소 24를, B 동작 영역(320)의 제1 행은 주소 8을 의미한다. 3 is a diagram conceptually illustrating a process of dividing a sub module in which a failure occurs in an electronic circuit system according to an embodiment of the present invention. In Fig. 3, one line consisting of 6 bits indicates an address. That is, the first row of the
자가 고장 복구 방법에 대한 기본 절차는 크게 제1 단계(S360), 제2 단계(S370), 및 제3 단계(S380)를 포함한다. The basic procedure for the self-failure recovery method includes a first step (S360), a second step (S370), and a third step (S380).
우선, 디지털 회로에 고장이 발생하면 먼저 자신의 모듈에 대한 리던던시가 있는지 점검하고, 리던던시가 없을 경우 분화하기 위하여 분화영역을 찾아야 한다. 분화 영역을 찾는 순서에 대해서는 해당 부분에서 상세히 후술한다. 각 자신의 A 회로구현 영역(310), B 회로구현 영역(320), C 회로구현 영역(330), D 회로구현 영역(340)에 대하여 자신에 대한 리던던시 영역이 있는지를 검토한다(S360). 구현되는 디지털회로는 A 회로구현 영역(310), B 회로구현 영역(320), C 회로구현 영역(330), D 회로구현 영역(340)을 포함한다. 이러한 각 영역에 대한 고장이 발생한 뒤 이곳에 리던던시가 없다면, A 회로구현 영역 회로는 A회로 분화 영역(310a)으로, B 회로구현 영역 회로는 B회로 분화 영역(320a)으로, C 회로구현 영역 회로는 C회로 분화 영역(330a)으로, 그리고, D 회로구현 영역 회로는 D회로 분화 영 역(340a)으로 각각 분화된다(S370). 여기서, 310a, 320a, 330a, 340a는 각각 310, 320, 330, 및 340의 고유 분화 영역에 해당한다. 즉, 동작 영역에서 고장이 발생하면, 우선적으로 해당 동작 영역에 자신에 대한 리던던시가 있는지 확인하고 고유한 고유 분화 영역으로 분화된다. 현재 동작 회로에 대한 고장에 대해서는 현재 동작 위치에 따라 다르지만 처음 회로를 구현한 동작영역 또는 분화 영역, 공통 분화 영역에 리던던시를 우선적으로 찾는다.First, if a failure occurs in a digital circuit, it is first checked whether there is redundancy for the own module, and if there is no redundancy, the differentiation region must be searched to differentiate. The order of finding the differentiation region will be described later in detail in the corresponding section. It is checked whether there exists a redundancy area for each of the A
디지털 구현회로에 고장이 발생하여 새로운 분화 영역으로 분화된 뒤 이 영역에 다시 고장이 발생하며, 가용 분화 영역이 더 이상 없는 경우에는 공통분화 영역(350)으로 분화한다(S380). 즉, 공통 분화 영역은 4 개의 동작 영역에 대한 각각의 고유 분화 영역 중에서 가용 분화 영역이 더 이상 존재하지 않을 경우 이용된다. When a failure occurs in the digital implementation circuit to differentiate into a new differentiated region, a failure occurs again in this new region, and when there is no more available differentiated region, it is differentiated into a common differentiated region 350 (S380). That is, the common differentiation region is used when the available differentiation region no longer exists among the respective distinctive regions for the four operation regions.
도 4는 동작 블록 및 분화 블록의 배치를 예시하는 도면이다. 하나의 어플리케이션을 4개의 블록으로 나누게 되며, 동작 모듈은 0-3번으로 이것은 동작을 하는 블록에 해당한다. 4-8번의 블록은 고장난 회로에 대하여 분화를 위한 블록이다. 기본 어플리케이션의 블록은 하나 모듈에 대하여 2x2 배열로 나누며 분화 방향은 시계 방향이고 복구 관리부에 의하여 분화 과정이 제어된다. Figure 4 is a diagram illustrating the placement of an operating block and a differentiating block. One application is divided into four blocks, and the operation module is 0-3, which corresponds to the operating block. Blocks 4-8 are blocks for differentiating against a failed circuit. The block of the basic application is divided into 2x2 array for one module, the direction of the division is clockwise, and the division process is controlled by the recovery management section.
동작 영역 0 중 0번 주소에 고장이 발생하면, 우선 자신의 리던던시 영역이 있는지 검토한 후, 없다면 분화 영역 4 중 16번 주소로 분화한다. 만일, 16번 주소에 고장이 발생하거나 16번 주소가 가용하지 않다면, 이번에는 17번 주소로 분화한다. 이와 같이, 0번 주소가 분화할 수 있는 고유 분화 영역은 모두 4개(주소 16, 17, 18, 19)가 된다. 만일, 모든 고유 분화 영역이 가용하지 않다면, 추가적으로 공통 분화 영역인 분화 8의 32번 주소로 분화한다. 32번 주소도 가용하지 않다면, 이번에는 공통 분화 영역의 33번 주소로 분화할 수 있다. 즉, 0번 주소가 분화할 수 있는 공통 분화 영역은 모두 4개(주소 32, 33, 34, 및 35)가 된다. 그러므로, 고장이 발생하면 하나의 동작 서브 모듈에 대하여 분화할 수 있는 분화 영역은 모두 8개가 된다. 따라서 본 발명은 반복되는 고장에 대해서 여러 번 복구할 수 있는 장점을 가진다. If a failure occurs in the
도 5는 본 발명의 다른 면에 의한 전자 회로 시스템의 자가 고장 복구 방법을 개념적으로 설명하는 흐름도이다. FIG. 5 is a flowchart conceptually illustrating a self-failure recovery method of an electronic circuit system according to another aspect of the present invention.
세부 기능별로 나눈 회로가 정상적으로 동작할 경우, DMR 구조로 구현된 회로로부터 이중으로 출력값을 수신한다. 그러면, 수신한 출력값일 비교하여 고장 여부를 판단한다(S510). 이때 고장 여부는 도 1에 도시된 고장 판단 및 분화부에서 판단할 수 있음은 전술된 바와 같다. When the circuit divided by the detailed function operates normally, the output value is received from the circuit implemented by the DMR structure. Then, the received output value is compared with each other to determine whether the failure has occurred (S510). At this time, it is as described above that the failure can be determined by the failure determination and differentiation unit shown in FIG.
세부 기능별로 나눈 회로에 고장이 발생하면, 그것이 분화 영역에서 발생하였는지 동작 영역에서 발생하였는지 판단한다(S520). 판단 결과 동작 영역에서 고장이 발생하였다면, 우선, 고장 회로에 대하여 출력단의 출력부분을 차단(S530)시킨다. 또한, 고장난 회로에 대해서는 정상적으로 회로 기능을 수행하기 위하여 새로운 분화 영역에 원래 기능을 수행하는 모듈을 복구하는 분화 과정(S540)을 수행한다. If a failure occurs in the circuit divided by the detailed function, it is determined whether it has occurred in the differentiation region or in the operation region (S520). As a result of the determination, if a failure occurs in the operation area, first, the output portion of the output stage is blocked (S530) with respect to the failure circuit. In addition, in order to perform a circuit function normally, a differentiation process (S540) is performed to recover a module that performs an original function in a new differentiation region for a failed circuit.
그러면, 고장난 회로에 대해서는 출력을 차단하고 회로에 구현된 자가 진단 테스트 회로를 통하여 일시적 오류인지, 영구적인 오류인지 판단하는 과정(S550)을 수행한다. 이때 정상적이라 판단되는 회로는 원래 구현 회로의 기능을 수행 하도록 리던던시(Redundancy)가 되고 영구적인 고장에 대해서는 더 이상 기능을 수행하지 못하도록 차단된다. Then, the output of the failed circuit is cut off, and a process of determining whether it is a temporary error or a permanent error through the self-diagnostic test circuit implemented in the circuit (S550) is performed. In this case, the circuit determined to be normal is redundant to perform the function of the originally implemented circuit, and is prevented from performing the function for the permanent failure.
고장난 정보에 대하여 확인(S520)한 결과가 고장이 발생한 부분이 분화 기능을 담당하는 관리 영역이라면, 우선 관리 영역을 차단(S560)하는 과정을 거친다. 차단된 관리 영역에 대하여 이 관리 영역이 담당하던 하부 구현부에 대하여 이웃하는 다른 관리 모듈이 이 기능을 대신(S570)한다. 네 개의 관리 영역에서 고장이 계속되어 더 이상 대신할 수 있는 관리 영역이 없다면 이 경우에는 시스템이 멈추게 되어 하드웨어 교체 과정이 필요하다. Confirmation of the failed information (S520) If the result of the check is a management area in which the failure occurs, the management area is firstly blocked (S560). The other management module neighboring to the lower implementation unit in which the management area is responsible for the blocked management area replaces this function (S570). If the four management areas continue to fail and there is no management area to replace them, then the system will stop and a hardware replacement process will be required.
도 6 내지 도 12는 도 5에 도시된 자가 고장 복구 방법의 각 구성 단계들을 상세히 설명하는 흐름도들이다. FIGS. 6 to 12 are flowcharts for explaining each configuration step of the self-failure recovery method shown in FIG. 5 in detail.
우선, 도 6은 도 5에서 ‘1단계’로 표시된 자가 고장 복구를 위한 고장 검출 단계에 대해 도시한 것이다. 고장 여부 검출을 위하여, 세부 기능별로 나눈 디지털 회로 출력의 데이터 값이 같은지 다른지 판단한다(S610). DMR의 출력값들이 같다면 고장이 발생하지 않았다는 것을 의미한다. 그러므로, 정상 동작으로 판단하고 다시 DMR 값을 비교한다. 비교 결과 다른 결과값이 나타날 경우, 고장 회로 처리를 위한 제2단계(S620)로 진행한다. First, FIG. 6 shows a failure detection step for self-recovery indicated by '1' in FIG. In order to detect the failure, it is determined whether the data values of the digital circuit outputs divided by the detailed functions are the same or not (S610). If the output values of the DMR are the same, it means that the failure does not occur. Therefore, it is judged as a normal operation and the DMR value is compared again. If another comparison result is found, the process proceeds to the second step S620 for fault circuit processing.
도 7은 도 5에서 ‘2단계’로 표시된 고장 위치 판단 단계(S520)를 상세히 도시한 것이다. 전술된 바와 같이, 하나의 관리 영역은 네 개의 동작 영역을 담당 한다. 또한, 하나의 동작 영역에 대한 정보는 네 개의 관리 영역에 동시에 전달된다. FIG. 7 illustrates details of the fault location determination step (S520) indicated by '2' in FIG. As described above, one management area is responsible for four operation areas. Further, information on one operation area is simultaneously transmitted to four management areas.
도 7을 참조하면, 고장이 발생되었다고 판단되면 고장이 어느 위치에서 발생하였는지 판단하기 위하여 현재 고장이 발생한 위치 정보를 수신한다(S710). 이를 이용하여, 세부 기능별로 나눈 디지털 회로의 고장인지, 분화 기능을 담당하는 부분에서 고장인지를 판단한다(S720). S720을 보면, 4개의 관리 영역으로부터 수신된 정보들을 비교하여 서로 동일한지 여부를 판단한다. 판단 결과 모든 정보가 일치하면 관리 영역에서 고장이 발생하지 않았다는 것을 나타내므로 동작 영역에서 고장이 발생하였다고 판단할 수 있다(S730). 반면에, 모든 정보가 일치하지 않으면 관리 영역에서 고장이 발생하였다고 판단할 수 있다(S740). Referring to FIG. 7, if it is determined that a failure has occurred, the location information of the current failure is received to determine where the failure occurred (S710). In step S720, it is determined whether a failure of the digital circuit divided by the detailed function or a failure in the part responsible for the differentiation function is detected. In S720, information received from the four management areas is compared to determine whether they are identical to each other. As a result of the determination, if all pieces of information match, it is determined that a failure has not occurred in the management area, so that it is determined that a failure occurs in the operation area (S730). On the other hand, if all pieces of information do not match, it can be determined that a failure has occurred in the management area (S740).
동작 영역의 고장의 경우 동작 영역 처리 단계로 이동(S730)하고, 관리 영역에서 고장이 발생하였을 경우 관리 영역 처리 단계(S740)로 이동한다. If the failure occurs in the operation area, the process moves to the operation area process step (S730). If a failure occurs in the management area, the process moves to the management area process step (S740).
도 8은 도 5에서 ‘3단계’로 표시된 고장 회로 차단 과정을 상세하게 도시한 것이다. FIG. 8 is a detailed circuit diagram of the fault circuit blocking process indicated by '3' in FIG.
우선, 고장난 회로의 정보에 대하여 정확한 위치 정보를 파악(S810)해야 한다. 고장난 회로는 먼저 출력을 차단하는 단계(S820)를 거친 후 구현 회로에 대하여 일시적 고장인지 영구적인 고장인지 알기위한 고장난 회로의 고장 복구 과정(S830)을 거친다. First, it is necessary to grasp the accurate positional information on the information of the broken circuit (S810). The failed circuit first goes through a step S820 of interrupting the output (S820), and then proceeds to a failure recovery process (S830) of the failed circuit to determine whether it is a temporary failure or a permanent failure for the implementation circuit.
도 9는 도 5에서 ‘4단계’로 표시된 바와 같은, 자가 고장 복구에 대하여 고장난 영역 회로를 새로운 영역에 분화시키는 고장 회로에 대한 자가 고장복구에 대해 도시한 것이다. FIG. 9 illustrates a self-failure recovery for a fault circuit that differentiates a faulty area circuit into a new area for a self-fault repair, as shown in FIG.
우선, 세부 기능별로 나눈 디지털 회로에 대해 고장난 정확한 위치 정보(S910)를 분화 기능을 담당하는 고장 판단 및 분화부에서 확인한다. 그러면, 하부 구현부의 새로운 영역에 고장난 영역의 원래 기능을 분화시키는 분화 동작을 개시한다(S920). 또한, 동작 영역에서 고장이 발생하였다는 정보가 수신된 경우에, 해당 고장이 일시적인지 영구적인지 여부를 판단하기 위한 자가 테스트 동작(S930)이 수행된다. First, the malfunction determining and distinguishing unit responsible for the malfunctioning function confirms the malfunctioning precise position information (S910) for the digital circuit divided by the detailed function. Then, a differentiation operation for differentiating the original function of the failed region into the new region of the lower implementation unit is started (S920). Also, when information indicating that a failure has occurred in the operation area is received, a self test operation (S930) is performed to determine whether the failure is temporary or permanent.
도 10은 도 5에서 ‘5단계’로 표시한 바와 같이 자가 고장 복구에 대하여 고장난 회로의 자가 고장복구(S1010)를 거친 후 결과 처리에 대해 도시한 것이다. FIG. 10 illustrates a result process after the self-failure recovery of the failed circuit (S1010) is performed for the self-failure recovery as indicated by '5th step' in FIG.
고장난 회로라는 정보가 확인되면 출력을 차단시키고 자가 진단 테스트 단계(S1010)를 수행하게 된다. 테스트를 거친 후 정상이라고 판단되면 이는 일시적인 고장이라는 것을 의미한다. 그러므로, 이제 정상 동작하는 동작 영역을 정상회로로 설정한다(S1020). 새롭게 정상 회로로 설정된 동작 영역은 연속된 같은 회로의 고장에 대해 리던던시(Redundancy) 역할을 하게 되어 자가 고장 복구 기능을 더 빨리 수행 할 수 있게 된다. When the information of a circuit which is faulty is confirmed, the output is cut off and a self-diagnosis test step S1010 is performed. If it is judged normal after the test, it means that it is a temporary failure. Therefore, a normal operating region is set as a normal circuit (S1020). The operation area newly set as the normal circuit can serve as a redundancy for the failure of the same continuous circuit, so that the self-failure recovery function can be performed more quickly.
자가 진단 테스트를 거친 결과 영구적인 고장이라고 판단되면, 이를 비정상회로로 간주하고 회로 기능을 하는 영역에서 배제 시키는 차단 동작(S1030)을 수행 시키게 된다. If it is determined as a permanent failure as a result of the self-diagnostic test, it is regarded as an abnormal circuit and a blocking operation (S1030) is performed to exclude it from the circuit functioning area.
도 11은 자가 고장 복구에 대하여 관리 영역에 고장이 발생한 경우를 도시한 것이다.FIG. 11 shows a case where a failure occurs in the management area for the self-failure recovery.
도 11은 도 5에서 ‘6단계’로 표시된 바와 같이, 자가 고장 진단 방법에 있어서 세부 기능별로 나눈 디지털 회로의 고장이 아닌 분화 기능을 담당하는 고장 판단/분화부를 도시한 것이다. FIG. 11 shows a failure determination / differentiation unit which is responsible for a differentiation function, not a failure of a digital circuit divided into detailed functions in the self-failure diagnosis method, as indicated by "6th step" in FIG.
우선, 세부 기능별로 나눈 디지털 회로에서 고장이 발생하면, 분화 기능을 담당하는 고장 판단/분화부로 전달되고, 새로운 분화영역으로 변경된 상태 정보가 전체 관리기능을 담당하는 복구 관리부로 전달된다(S1130). First, when a failure occurs in the digital circuit divided by detailed functions, the failure information is transferred to the failure determination / differentiation unit that performs the differentiation function, and the changed state information is transferred to the recovery management unit responsible for the overall management function (S1130).
전술된 바와 같이, 세부 기능별로 나눈 디지털 회로에서 일시적인 고장과 영구적인 고장에 따라 새로운 영역에 분화시키기 위한 위치 정보 및 분화 기능을 담당하는 이웃하는 네 개의 관리 영역의 정보가 복구 관리부로 보고된다. 그러면, 복구 관리부는 다수 의사 결정방식(Majority)에 의해 고장이 발생한 관리 영역을 판단한다. 즉, 현재 담당하는 주된 분화 영역의 출력값이 다른 관리 영역의 출력값과 다르다면 주된 관리 영역에 고장이 발생한 것으로 판단한다. 이와 같이 고장이 발생하면, 고장이 발생한 관리 영역을 교체한다(S1120). As described above, in the digital circuit divided into detailed functions, the information of the four neighboring management areas which are responsible for the position information and the differentiation function for differentiating into the new area according to the temporary failure and the permanent failure are reported to the recovery management unit. Then, the recovery management unit determines a management area in which a failure has occurred by a plurality of decision methods (Majority). That is, if the output value of the main differentiated area currently in charge differs from the output value of the other management area, it is determined that a failure occurs in the main management area. If such a failure occurs, the management area in which the failure occurs is replaced (S1120).
도 12는 도 5에서 ‘7단계’로 표시된 바와 같이, 자가 고장 복구에 대하여 관리 영역의 역할 담당 변경과 연속되는 고장에 대한 결과 처리 방법을 도시한 것이다.FIG. 12 shows a result of processing a result of a change in the role of the management area and successive failures in the self-failure recovery, as indicated by '7 step' in FIG.
우선, 관리 영역의 값이 다르다고 판단되면 현재 담당했던 관리 영역을 차단시킨다. 이 때, 이웃하는 세 개의 관리 영역이 같은 기능을 동시에 수행하고 있으므로 인접한 관리 영역으로 역할을 변경(S1210)시킨다. First, if it is determined that the value of the management area is different, the management area that is currently in charge is blocked. At this time, since three neighboring management areas perform the same function at the same time, a role is changed to an adjacent management area (S1210).
역할을 담당하는 순서는 동작 영역이 네 개일 경우 관리 영역의 수도 네 개 가 된다. 관리 영역 1번은 동작 영역 1번을 주로 담당하고 2번, 3번, 4번 동작 영역을 동시에 관리하는 역할을 한다. 관리 영역 2번은 동작 영역 2번을 주로 담당하고 3번, 4번, 1번 동작 영역을 동시에 관리한다. 관리 영역 3번은 동작 영역 3번을 주로 담당하고 4번, 1번, 2번 동작 영역을 동시에 관리하는 역할을 한다. 또한, 관리 영역 4번은 동작 영역 4번을 주로 담당하고 1번, 2번, 3번 동작 영역을 동시에 관리한다. 관리영역 고장에 대한 역할 변경은 이와 같이 시계 방향으로 수행될 수 있다. The order of roles is four in the management area when there are four operation areas.
다시 도 12를 참조하면, 다른 관리 영역의 기능이 정상적으로 동작하는 지를 판단하고(S1220), 판단 결과 정상적으로 동작한다면 해당 관리영역으로 분화시키고 이를 이용하여 현재 담당하는 관리 영역이 어디인지 복구 관리부에 알려준다(S1230). 만일 네 개의 관리영역에 모두 고장이 발생한다면 시스템 오류가(S1240)되고 하드웨어 교체를 실행해야 한다. Referring again to FIG. 12, it is determined whether the function of the other management area is normally operated (S1220). If it is determined that the function of the other management area is normal, the management area is classified into the management area and the management area is informed to the recovery management part S1230). If all four management areas fail, a system error (S1240) and a hardware replacement must be performed.
본 발명은 도면에 도시된 실시예를 참고로 설명되었으나 이는 예시적인 것에 불과하며, 본 기술 분야의 통상의 지식을 가진 자라면 이로부터 다양한 변형 및 균등한 타 실시예가 가능하다는 점을 이해할 것이다. 따라서, 본 발명의 진정한 기술적 보호 범위는 첨부된 등록청구범위의 기술적 사상에 의해 정해져야 할 것이다. While the present invention has been particularly shown and described with reference to exemplary embodiments thereof, it is evident that many alternatives, modifications and variations will be apparent to those skilled in the art. Accordingly, the true scope of the present invention should be determined by the technical idea of the appended claims.
본 발명은 구현된 디지털 회로를 세부적으로 기능별로 나누어 고장 부분에 대한 위치를 빠르고 정확하게 찾을 수 있으므로, 프로그램 가능한 모든 전자 회로에 적용될 수 있다. The present invention can be applied to all programmable electronic circuits because the implemented digital circuit can be divided into functions in detail to locate the position of the fault portion quickly and accurately.
또한, 본 발명은 고장난 회로에 대하여 새로운 영역으로 고장 회로 역할 부분을 분화를 시킨 뒤 고장난 회로는 자가 진단 과정을 수행하며 이 회로가 일시적인 고장이라 판명되면 리던던시(Redundancy)가 되어 연속되는 고장에 대하여 분화 과정을 거치지 않고 바로 복구될 수 있으므로 전자 회로의 동작 신뢰성을 향상시키기 위하여 적용될 수 있다. Also, according to the present invention, a faulty circuit is divided into a new area for a faulty circuit, a malfunctioning circuit performs a self-diagnosis process, and if the circuit is found to be a temporary fault, redundancy is generated, It can be directly recovered without going through the process, so that it can be applied to improve the operation reliability of the electronic circuit.
도 1은 본 발명의 일면에 의한 전자 회로 시스템의 구조를 개념적으로 도시하는 도면이다. 1 is a view conceptually showing the structure of an electronic circuit system according to one aspect of the present invention.
도 2는 본 발명의 일면에 의한 전자 회로 시스템 중 반도체 회로부의 구조를 개념적으로 도시하는 도면이다. 2 is a view conceptually showing a structure of a semiconductor circuit part of an electronic circuit system according to one aspect of the present invention.
도 3은 본 발명의 일면에 의한 전자 회로 시스템에서 고장이 발생된 서브 모듈이 분화되는 과정을 개념적으로 설명하는 도면이다. 3 is a diagram conceptually illustrating a process of dividing a sub module in which a failure occurs in an electronic circuit system according to an embodiment of the present invention.
도 4는 동작 블록 및 분화 블록의 배치를 예시하는 도면이다. Figure 4 is a diagram illustrating the placement of an operating block and a differentiating block.
도 5는 본 발명의 다른 면에 의한 전자 회로 시스템의 자가 고장 복구 방법을 개념적으로 설명하는 흐름도이다. FIG. 5 is a flowchart conceptually illustrating a self-failure recovery method of an electronic circuit system according to another aspect of the present invention.
도 6 내지 도 12는 도 5에 도시된 자가 고장 복구 방법의 각 구성 단계들을 상세히 설명하는 흐름도들이다. FIGS. 6 to 12 are flowcharts for explaining each configuration step of the self-failure recovery method shown in FIG. 5 in detail.
Claims (15)
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020090115787A KR101032000B1 (en) | 2009-11-27 | 2009-11-27 | Self-repairing electronic circuit system and self-repairing method by mimicking cell differentiation |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020090115787A KR101032000B1 (en) | 2009-11-27 | 2009-11-27 | Self-repairing electronic circuit system and self-repairing method by mimicking cell differentiation |
Publications (1)
Publication Number | Publication Date |
---|---|
KR101032000B1 true KR101032000B1 (en) | 2011-05-02 |
Family
ID=44365432
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020090115787A KR101032000B1 (en) | 2009-11-27 | 2009-11-27 | Self-repairing electronic circuit system and self-repairing method by mimicking cell differentiation |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR101032000B1 (en) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101374326B1 (en) | 2013-03-28 | 2014-03-26 | 한국과학기술원 | Self-reparable digital device inspired from biological molecular network |
US9780787B2 (en) | 2013-03-28 | 2017-10-03 | Korea Advanced Institute Of Science And Technology | Self-reparable digital device for multiple faults based on biological attractor concepts |
KR20180115188A (en) * | 2017-04-12 | 2018-10-22 | 한국과학기술원 | Self-repairing digital device with real-time circuit switching inspired by attractor-conversion characteristics of a cancer cell |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR19980036479A (en) * | 1996-11-18 | 1998-08-05 | 김광호 | Partial fault relief device in memory |
KR20030017885A (en) * | 2001-08-23 | 2003-03-04 | 플래시스 주식회사 | Equipment and Method for Repair of Semiconductor Memory |
-
2009
- 2009-11-27 KR KR1020090115787A patent/KR101032000B1/en not_active IP Right Cessation
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR19980036479A (en) * | 1996-11-18 | 1998-08-05 | 김광호 | Partial fault relief device in memory |
KR20030017885A (en) * | 2001-08-23 | 2003-03-04 | 플래시스 주식회사 | Equipment and Method for Repair of Semiconductor Memory |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101374326B1 (en) | 2013-03-28 | 2014-03-26 | 한국과학기술원 | Self-reparable digital device inspired from biological molecular network |
US9780787B2 (en) | 2013-03-28 | 2017-10-03 | Korea Advanced Institute Of Science And Technology | Self-reparable digital device for multiple faults based on biological attractor concepts |
KR20180115188A (en) * | 2017-04-12 | 2018-10-22 | 한국과학기술원 | Self-repairing digital device with real-time circuit switching inspired by attractor-conversion characteristics of a cancer cell |
KR101939387B1 (en) | 2017-04-12 | 2019-04-11 | 한국과학기술원 | Self-repairing digital device with real-time circuit switching inspired by attractor-conversion characteristics of a cancer cell |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7362697B2 (en) | Self-healing chip-to-chip interface | |
US7389460B1 (en) | Runtime-competitive fault handling for reconfigurable logic devices | |
Abramovici et al. | Roving STARs: an integrated approach to on-line testing, diagnosis, and fault tolerance for FPGAs in adaptive computing systems | |
US3805039A (en) | High reliability system employing subelement redundancy | |
Stroud et al. | BIST-based diagnostics of FPGA logic blocks | |
Mitra et al. | Reconfigurable architecture for autonomous self-repair | |
JPS5940666Y2 (en) | Fault detection and identification system | |
US7328384B1 (en) | Method and apparatus using device defects as an identifier | |
JP2001216797A (en) | Integrated circuit semiconductor device provided with self-restoration circuit for built in memory, and memory restoring method | |
US5260946A (en) | Self-testing and self-configuration in an integrated circuit | |
KR101032000B1 (en) | Self-repairing electronic circuit system and self-repairing method by mimicking cell differentiation | |
US20040078101A1 (en) | Plant protective instrumentation equipment | |
Belli et al. | An approach to the reliability optimization of software with redundancy | |
JPH0212533A (en) | Apparatus containing majority circuit means, coincidence circuit means and self inspection means in combination | |
KR100998314B1 (en) | LOGIC CIRCUIT FOR DETECTING AND RECOVERING ERROR IN SRAM-based FIELD PROGRAMMABLE GATE ARRAY | |
JP2010134678A (en) | Electronic device, failure detection method for electronic device and failure recovery method for electronic device | |
US6018812A (en) | Reliable wafer-scale integrated computing systems | |
KR101137771B1 (en) | Self-repairable digital circuit system and digital circuit self-repairing method inspired from endocrine cellular communication | |
Pontarelli et al. | Reliability evaluation of repairable/reconfigurable FPGAs | |
US20180267099A1 (en) | A Reconfigurable Hardware Device for Providing a Reliable Output Signal as well as a Method for Providing Said Reliable Output | |
US8458545B2 (en) | Method and apparatus for testing of a memory with redundancy elements | |
Pontarelli et al. | System-on-chip oriented fault-tolerant sequential systems implementation methodology | |
Elshafey | Embedding fault tolerance via reconfiguration in configurable systems | |
Wongyai et al. | Improving reliability in cell-based evolve hardware architecture using fault tolerance control | |
Wongyai | Improve fault tolerance in cell-based evolve hardware architecture |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
LAPS | Lapse due to unpaid annual fee |