KR100433649B1 - Method for imposing the fail-silent characteristic in a distributed computer system and distribution unit in such a system - Google Patents

Method for imposing the fail-silent characteristic in a distributed computer system and distribution unit in such a system Download PDF

Info

Publication number
KR100433649B1
KR100433649B1 KR10-2002-7001668A KR20027001668A KR100433649B1 KR 100433649 B1 KR100433649 B1 KR 100433649B1 KR 20027001668 A KR20027001668 A KR 20027001668A KR 100433649 B1 KR100433649 B1 KR 100433649B1
Authority
KR
South Korea
Prior art keywords
distributor unit
computer
distributor
fault
computer system
Prior art date
Application number
KR10-2002-7001668A
Other languages
Korean (ko)
Other versions
KR20020029914A (en
Inventor
코페즈헤르만
코페즈게오르그
Original Assignee
에프티에스 콤퓨터테크니크 게엠바하
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from AT0139599A external-priority patent/AT407582B/en
Application filed by 에프티에스 콤퓨터테크니크 게엠바하 filed Critical 에프티에스 콤퓨터테크니크 게엠바하
Publication of KR20020029914A publication Critical patent/KR20020029914A/en
Application granted granted Critical
Publication of KR100433649B1 publication Critical patent/KR100433649B1/en

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/2002Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where interconnections or communication control functionality are redundant
    • G06F11/2005Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where interconnections or communication control functionality are redundant using redundant communication controllers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L12/00Data switching networks
    • H04L12/28Data switching networks characterised by path configuration, e.g. LAN [Local Area Networks] or WAN [Wide Area Networks]
    • H04L12/40Bus networks
    • H04L12/40006Architecture of a communication node
    • H04L12/40026Details regarding a bus guardian
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L12/00Data switching networks
    • H04L12/66Arrangements for connecting between networks having differing types of switching systems, e.g. gateways

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)
  • Computer And Data Communications (AREA)

Abstract

내(耐)장해성 분산 컴퓨터 시스템의 원격 통신 컴퓨터(111, ...., 114)의 시간 영역에서 고장-휴지 속성을 실행시키기 위한 방법은 복수의 원격 통신 컴퓨터가 분배기 유닛(101, 102)을 통해서 접속되고, 각 원격 컴퓨터는 그 통신 채널(121)에 대한 접속에 상응하는 독립적인 통신 콘트롤러를 가지며, 통신 채널에 대한 억세스가 주기적 시분할 다중접속방법에 따라 행해진다. 적어도 하나의 분배기 유닛은, 선행성(실행 우선순위)이 알려진 원격 컴퓨터의 정확한 전송동작에 의해서, 원격 컴퓨터가 정적으로 할당된 타임 슬라이스내에서 다른 원격 컴퓨터로 전송만을 할 수 있는 것을 보증한다.Fault Tolerance A method for implementing a fault-stop attribute in the time domain of a telecommunications computer 111,... 114 of a distributed computer system is provided in which a plurality of telecommunications computers are configured to operate the distributor unit 101, 102. Connected through, each remote computer has an independent communication controller corresponding to the connection to its communication channel 121, and access to the communication channel is done according to a periodic time division multiple access method. At least one distributor unit ensures that the remote computer can only transmit to another remote computer within a statically allocated time slice by the correct transmission operation of the remote computer whose priorities (execution priorities) are known.

Description

분산 컴퓨터 시스템에서 고장-휴지 속성을 실행하는 방법 및 그 시스템의 분배기 유닛{METHOD FOR IMPOSING THE FAIL-SILENT CHARACTERISTIC IN A DISTRIBUTED COMPUTER SYSTEM AND DISTRIBUTION UNIT IN SUCH A SYSTEM}METHODS FOR IMPOSING THE FAIL-SILENT CHARACTERISTIC IN A DISTRIBUTED COMPUTER SYSTEM AND DISTRIBUTION UNIT IN SUCH A SYSTEM}

안전을 중시하는 기술적 어플리케이션, 즉 특히 장해가 재해를 가져올 수 있는 그러한 어플리케이션은 분산된 내장해성 실시간 컴퓨터 시스템에 의한 관리가 증가되는 추세이다.Safety-critical technical applications, especially those where failure can lead to disaster, tend to be increasingly managed by distributed embedded real-time computer systems.

다수의 원격 통신 컴퓨터들과 실시간 통신 시스템으로 이루어져 있는 내장해성 실시간 컴퓨터 시스템에 있어서, 원격 컴퓨터의 고장은 허용되어져야만 한다. 이러한 컴퓨터 아키텍쳐의 중심에는 예상 가능할 정도로 빠르고 안전하게 메시지를 교환하기 위한 내장해성 실시간 커뮤니케이션 시스템이 있다.In a built-in real-time computer system consisting of multiple telecommunication computers and a real time communication system, failure of the remote computer must be allowed. At the heart of this computer architecture is a built-in, real-time communication system for exchanging messages quickly and safely, as expected.

이러한 요구를 충족시키는 하나의 통신 프로토콜이 EP 0 658 275 A (WO 94/06080)호에 기재되어 있다. 이 프로토콜은“TTP/C(TTP=Time-Triggered Protocol/C) 프로토콜”이란 명칭으로 본 기술분야에 공지되어 있으며, 이것은 선행적으로(priori) 구축된 타임 슬라이스(Time-slices)를 갖는 주지의 주기적 시분할 다중접속방법을 기반으로 하고 있다. TTP/C 프로토콜은 미국특허 제 4,866,606호에 개시된 내장해성 시간 동기방법을 사용한다.One communication protocol that meets this need is described in EP 0 658 275 A (WO 94/06080). This protocol is known in the art under the name “TTP / Time-Triggered Protocol / C (TTP / C) Protocol”, which is a well-known technique having time-slices built up prior to it. It is based on the periodic time division multiple access method. The TTP / C protocol uses the intrinsic resolution time synchronization method disclosed in US Pat. No. 4,866,606.

TTP/C 프로토콜은 통신 시스템이 논리적인 방송 토폴로지를 지원하고, 수용관점으로부터 원격 통신 컴퓨터들이 "고장-휴지(fail-silence)"(kopetz, p.121) 장해 동작, 즉 원격 컴퓨터가 값들의 범위나 시간 영역에서 정확하게 작동하거나 휴지 상태로 되는 것을 나타낸다. 이것은 Kopetz, H. (1997), "Real-Time Systems, Design Principles for Distributed Embedded Applications"; ISBN: 0-7923-9894-7, Boston, Kluwer Academic Publishers에 기재되어 있다. 시간영역에서의 장해 즉, 이른바 "베이블링 이디오트(babbling idiot)" 장해(Kopetz, p. 130, and also Annual Int. Symposium on Fault-Tolerant Computing, 23 June 1998, pages 218-277, IEEE computer Soc., Los Alamitos, CA, US; Temple C∴ "Avoiding the Babbling-idiot Failure in a Time-Triggered Communications system")의 방지는 소위 "보호기(guardian)"인 독립적 결함 승인유닛에 의한 TTP/C 프로토콜에서 달성되며, 이 승인유닛은 독립적인 시간 베이스를 가지며, 원격 컴퓨터의 시간 동작을 지속적으로 확인한다. 내장해성을 달성하기 위해서, 몇 개의 고장-휴지 원격 컴퓨터는 내장해성 유닛(fault-tolerant unit; FTU)에 조립되어, 통신 시스템을 응답한다. 하나의 FTU 원격 컴퓨터와 하나의 통신 시스템의 응답이 작동하는 한, FTU의 서비스는 시간 영역과 값의 범위내에서 적절하게 제공된다.The TTP / C protocol allows the communication system to support a logical broadcast topology, and from the point of view the telecommunications computers “fail-silence” (kopetz, p.121) the disturbance operation, ie the range of values by the remote computer. B indicates correct operation in the time domain or idle state. This is described in Kopetz, H. (1997), "Real-Time Systems, Design Principles for Distributed Embedded Applications"; ISBN: 0-7923-9894-7, Boston, Kluwer Academic Publishers. Obstacles in the time domain, so-called "babbling idiot" disorders (Kopetz, p. 130, and also Annual Int. Symposium on Fault-Tolerant Computing, 23 June 1998, pages 218-277, IEEE computer Soc , Los Alamitos, CA, US; Temple C∴ prevention of "Avoiding the Babbling-idiot Failure in a Time-Triggered Communications system" in the TTP / C protocol by an independent fault acknowledgment unit, a so-called "guardian". This acknowledgment unit has an independent time base and continuously checks the time operation of the remote computer. To achieve fault tolerance, several fault-tolerant remote computers are assembled in a fault-tolerant unit (FTU) to respond to the communication system. As long as the response of one FTU remote computer and one communication system operates, the services of the FTU are appropriately provided within the time domain and range of values.

통신의 논리적인 방송 토폴로지는 분산 버스 시스템(분산 링 시스템) 또는 분배기 유닛 예컨대, 이들 토폴리지의 조합이나 원격 컴퓨터들로의 점대점 접속을 갖는 스타 커플러에 의해 물리적으로 구축할 수 있다. 분배 버스 시스템 또는 분배 링 시스템이 구축되면, 각 원격 컴퓨터는 자신의 보호기를 구비해야 한다. 한편, 분배기 유닛이 채용되면, 모든 보호기는 이 분배기 유닛에 통합될 수 있으며, 분배기 유닛은 모든 원격 컴퓨터 행동의 포괄적인 관찰에 의해 시간 영역에서의 정확한 전송 동작을 효과적으로 실행할 수 있다. 또한, 본 발명은 그같은 분배기 유닛에 의한 보호기 통합에 관한 것이다.The logical broadcast topology of the communication can be physically established by a distributed bus system (distributed ring system) or a distributor unit such as a star coupler having a combination of these topologies or a point-to-point connection to remote computers. Once a distribution bus system or distribution ring system is established, each remote computer must have its own protector. On the other hand, if a distributor unit is employed, all protectors can be integrated into this distributor unit, which can effectively execute the correct transmission operation in the time domain by comprehensive observation of all remote computer behavior. The invention also relates to the protector integration by such a distributor unit.

본 발명은 복수의 원격 통신 컴퓨터가 적어도 하나의 분배기 유닛을 통해서 접속되고, 각 원격 컴퓨터는 그 통신 채널에 대한 접속에 상응하는 독립적인 통신 콘트롤러를 가지며, 통신 채널에 대한 억세스가 주기적 시분할 다중접속방법에 따라 행해지는, 내(耐)장해성 분산 컴퓨터 시스템의 원격 통신 컴퓨터의 시간 영역에서 고장-휴지 속성을 실행시키기 위한 방법에 관한 것이다. 또한, 본 발명은 복수의 원격 컴퓨터가 상호 접속되고, 각 원격 컴퓨터는 그 통신 채널에 대한 접속에 상응하는 독립적 통신 콘트롤러를 가지며, 통신 채널에 대한 억세스가 주기적 시분할 다중접속방법에 의해 행해지는, 내장해성 분산 컴퓨터 시스템의 분배 유닛에 관한 것이다.The present invention relates to a method in which a plurality of telecommunication computers are connected through at least one distributor unit, each remote computer having an independent communication controller corresponding to a connection to the communication channel, and access to the communication channel being periodically time-division multiplexed. And a method for implementing fault-to-failure attributes in the time domain of a telecommunications computer of a fault-tolerant distributed computer system. In addition, the present invention provides a built-in in which a plurality of remote computers are interconnected, each remote computer has an independent communication controller corresponding to a connection to the communication channel, and access to the communication channel is performed by a cyclic time division multiple access method. A dispensing unit of a decentralized distributed computer system.

도 1은 본 발명의 2개의 응답 분배기 유닛을 통해 결합되는 4개의 원격 컴퓨터를 갖는 분산 컴퓨터 시스템의 구조를 나타내는 도면,1 illustrates the structure of a distributed computer system having four remote computers coupled via two response distributor units of the present invention;

도 2는 통신 네트워크 인터페이스(CNI)에 의해 통신이 행해지는 통신 콘트롤러와 호스트 컴퓨터로 이루어진 원격 컴퓨터의 구조를 나타내는 도면,2 is a diagram showing the structure of a remote computer comprising a communication controller and a host computer on which communication is performed by a communication network interface (CNI);

도 3은 통합 보호기를 갖는 분배기 유닛의 구조를 나타내는 도면,3 shows the structure of a distributor unit with an integrated protector,

도 4는 분배기 유닛이 선행성을 포함하는 정보의 데이터 구조를 나타내는 도면,4 shows a data structure of information in which the distributor unit includes precedence;

도 5는 초기화 메시지의 구조를 나타내는 도면,5 is a diagram illustrating a structure of an initialization message;

도 6은 분배기 유닛의 내부 상태를 나타내는 도면이다.6 is a view showing an internal state of the distributor unit.

본 발명의 목적은 분산 시간제어 컴퓨터 시스템의 내장해성을 증가시키고, 코스트를 줄이는 데 있다.An object of the present invention is to increase the built-in resolution of a distributed time control computer system and to reduce the cost.

이 목적은 서두에 언급한 종류의 벙법에 의해 달성되며, 본 발명에 따르는 적어도 하나의 분배기 유닛은, 선행성(실행 우선순위)이 알려진 원격 컴퓨터의 정확한 전송동작에 의해서, 원격 컴퓨터가 정적으로 할당된 타임 슬라이스내에서 다른 원격 컴퓨터로 전송만을 할 수 있는 것을 보증한다.This object is achieved by a method of the kind mentioned at the beginning, wherein at least one distributor unit according to the invention is statically assigned by the remote computer by the correct transfer operation of the remote computer of known precedence (execution priority). It ensures that only transmissions to other remote computers can be made within a given time slice.

"보호기"를 인텔리전트 분배기 유닛과 결합함으로써, 원격 컴퓨터의 "베이브링 이디오트(babbling idiot)”즉, 틀린 시간에 메시지를 송신하는 것을 방지하는 것이 가능해진다.분배기 유닛이 본 발명에 따라 채용된다면, 모든 보호기는 이 분배기 유닛내에 통합할 수 있으며, 이것은 모든 원격 컴퓨터의 동작의 포괄적인 관찰에 의해서 시간 영역에서 정확한 전송 동작을 효과적으로 강화할 수 있다.통합 보호기를 갖는 그같은 분배기 유닛은 다음과 같은 이점을 제공한다.(ⅰ) 포괄적 중요 장해에 대한 내장해 지역이 분배기 유닛에 대한 원격 컴퓨터의 점대점(point-to-point)접속에 의해 감소되는 바, 즉, EMI(electromagnetic immission)에 의해 이들 점대점 접속에 도입되는 장해를 하나의 원격 컴퓨터에 명확하게 할당할 수 있으며, 어떠한 포괄적인 영향도 주지 않는다.(ⅱ) 응답된 포괄적 중요 분배기 유닛은 보호 영역내의 공간 분리로써 인스톨할 수 있으며, 물리적으로 콤팩트한 구조를 갖는다. 이것은 장해 유발 요소가 모든 포괄적 중요 분배기 유닛을 붕괴시킬 가능성을 현저하게 감소시킨다.(ⅲ) 분배기 유닛의 보호기는 원격 컴퓨터내의 분산된 보호기로 교체된다. 이것은 보호기 진동자와 같은 원격 컴퓨터용 하드웨어를 절약한다.(ⅳ) 물리적인 점대점 접속은 광섬유의 도입에 매우 적합하며, 꼬인 케이블에 대한 임피던스 매칭에 이점을 가져온다.By combining the "protector" with the intelligent distributor unit, it becomes possible to prevent the "babbling idiot" of the remote computer, i.e. sending the message at the wrong time. If the distributor unit is employed according to the invention, All protectors can be integrated within this distributor unit, which can effectively enhance the correct transmission operation in the time domain by comprehensive observation of the operation of all remote computers. Such a distributor unit with an integrated protector has the following advantages: (I) The built-in area of damage for comprehensive critical disturbances is reduced by the point-to-point connection of the remote computer to the distributor unit, ie these point-to-point by electromagnetic immission (EMI). Obstacles introduced into a connection can be explicitly assigned to a single remote computer and have no comprehensive effect. Ii) The responded generic critical distributor unit can be installed as a spatial separation in the protected area, and has a physically compact structure, which significantly reduces the likelihood that the fault causing element will collapse all comprehensive critical distributor units. The protector of the distributor unit is replaced by a distributed protector in the remote computer, which saves the hardware for the remote computer, such as the protector oscillator. (Iii) The physical point-to-point connection is well suited for the introduction of optical fibers and for twisted cables It brings advantages in impedance matching.

또, 본 발명의 목적은 상술한 종류의 분배기 유닛으로 달성되며, 본 발명에 따르는 적어도 하나의 분배기 유닛은, 선행성이 알려진 원격 컴퓨터의 정확한 전송동작에 의해서, 원격 컴퓨터가 정적으로 할당된 타임 슬라이스내의 다른 원격 컴퓨터로 전송만을 할 수 있는 것을 보증하도록 설계된다.It is also an object of the present invention to achieve a distributor unit of the kind described above, wherein at least one distributor unit according to the present invention is a time slice in which the remote computer is statically assigned by an accurate transfer operation of the remote computer of which priorities are known. It is designed to ensure that only transmissions to other remote computers in the network can be made.

분배기 유닛의 기능은 각 원격 컴퓨터의 전송시간 위임에 대한 정적인 선행성 정보와 시간 제어 통신시스템의 메시지에 의한 분배기 유닛의 동적인 동기화의 조합의 평가를 토대로 한다.The function of the distributor unit is based on the evaluation of a combination of static precedence information for transmission time delegation of each remote computer and dynamic synchronization of the distributor unit by messages of the time control communication system.

본 발명에 따른 장점은 이하 기술되는 실시예에서 도면을 참조하여 보다 상세하게 설명한다.The advantages according to the invention are explained in more detail with reference to the drawings in the embodiments described below.

다음에, 본 발명의 일실시예는 예로서 2개의 응답 분배기 유닛을 통해 접속되는 4개의 원격 컴퓨터를 나타낸다. 도면 내의 구성요소는, 3자리 참조번호의 첫 번째 숫자는 해당 도면번호를 의미하는 식으로 번호가 부여된다.Next, one embodiment of the present invention shows, by way of example, four remote computers connected via two response distributor units. Components in the figures are numbered in such a way that the first digit of the three digit reference number represents the corresponding figure.

도 1에 도시된 바와 같이, 4개의 원격 통신 컴퓨터(111, 112, 113, 114) 시스템이 도시되어 있고, 각 원격 컴퓨터는 상호 교환 가능한 유닛으로 이루어지며, 2개의 응답 분배기 유닛(101, 102)과 점대점 접속을 통해 접속된다. 제 1분배기 유닛(101)으로부터의 단방향성 통신 채널(151)은 다른 제 2분배기 유닛(102)으로 유도된다. 반면에, 제 2분배기 유닛(102)으로부터의 단방향성 통신채널(152)은 제 1분배기 유닛(101)으로 보내진다. 이들 단방향 통신채널을 통해, 첫 번째 분배기 유닛(101)은 두 번째 분배기 유닛(102)에 대한 통신량 및 그 역으로도 관찰할 수 있으며, 만일 그 자신의 접속(121)에서 어떠한 메시지 교류도 없다면, 그 분배기 유닛(101)은 냉시동(cold start) 또는 시간 동기화를 수행한다. 표시된 접속(141, 142)은 전용 통신채널들로, 이것은 분배기 유닛의 매개변수화를 확립할 수 있으며, 분배기 유닛의 적절한 기능을 연속적으로 감시할 수 있는 유지보수 컴퓨터(도시 생략)와 연결된다.As shown in FIG. 1, four telecommunication computer systems 111, 112, 113, 114 are shown, each remote computer consisting of interchangeable units, and two response distributor units 101, 102. Is connected via a point-to-point connection. The unidirectional communication channel 151 from the first distributor unit 101 is directed to another second distributor unit 102. On the other hand, the unidirectional communication channel 152 from the second distributor unit 102 is sent to the first distributor unit 101. Through these unidirectional communication channels, the first distributor unit 101 can also observe the amount of communication to the second distributor unit 102 and vice versa, if there is no message exchange in its own connection 121, The distributor unit 101 performs a cold start or time synchronization. The connections 141, 142 indicated are dedicated communication channels, which can establish parameterization of the distributor unit and are connected with a maintenance computer (not shown) which can continuously monitor the proper functioning of the distributor unit.

도 2는 원격 통신 컴퓨터(111)의 내부 구성을 도시한다. 그 원격 통신 컴퓨터(111)는 2개의 서브시스템, 즉, 응답 통신 채널(201, 202: 도 1의 121과 상응)과 접속되는 통신 콘트롤러(210)와, 원격 컴퓨터의 응용 프로그램이 실행되는 호스트 컴퓨터(220)로 구성된다. 이들 2개의 서브 시스템은 통신 네트워크 인터페이스(CNI: 241)와 신호선(242)를 통해 상호 접속된다. 인터페이스(241)는 2개의 서브 시스템 모두가 억세스할 수 있는 메모리(듀얼 포트 램=DPRAM)를 포함한다. 또, 2개의 서브 시스템은 이 공통 메모리와 인터페이스(241)를 통해 통신 데이터를 서로 교환한다. 신호선(242)은 시간 동기화를 위한 신호를 전송한다. 이때, 신호선은 미국특허 제4,866,606A호에 명확하게 기재되어 있다. 한편, 자동으로 구동되는 통신 콘트롤러(210)는 데이터의 송수신 시점을 지시하기 위한 통신 제어유닛(211)과, 데이터 스트럭쳐(212)로 이루어진다. 이 데이터 스트럭쳐(212)는 메시지 기술자 리스트(MEDL: message descriptor list)에 의해 설계된다.2 shows an internal configuration of a telecommunications computer 111. The telecommunications computer 111 is a communication controller 210 connected with two subsystems, namely, the response communication channels 201 and 202 (corresponding to 121 in FIG. 1), and a host computer on which a remote computer application program is executed. It consists of 220. These two subsystems are interconnected via a communication network interface (CNI) 241 and a signal line 242. The interface 241 includes memory (dual port RAM = DPRAM) that both subsystems can access. In addition, the two subsystems exchange communication data with each other via the common memory and the interface 241. The signal line 242 transmits a signal for time synchronization. The signal line is clearly described in US Pat. No. 4,866,606A. Meanwhile, the automatically driven communication controller 210 includes a communication control unit 211 and a data structure 212 for indicating a time point at which data is transmitted and received. This data structure 212 is designed by a message descriptor list (MEDL).

도 3은 통합 보호기를 갖는 분배기 유닛의 구조를 도시한 도면이다. 분배기유닛은 입력포트(311)와, 출력포트(312), 데이터 분배기(330)와 제어 컴퓨터(340)로 구성된다. 원격 컴퓨터(도 1의 121과 상응)의 데이터 접속(301)은 분배기 유닛의 입력포트(311)와, 출력포트(312)와 연결되며, 다른 데이터 접속(302, 303, 304)도 동일하게 이루어진다. 또한, 단방향 통신선의 경우, 2개의 포트(311, 312)는 데이터 접속(301)을 갖는 원격 컴퓨터의 대응되는 포트와 개별적으로 접속될 수 있다. 또한, 필요한 경우 커스터머리 필터(customary filters)와 포텐셜 세퍼레이션(potential separation)과 인접한 각 입력포트(311)내에는 신호선(314)를 통해 분배기 유닛의 제어 컴퓨터(340)에 의해 스위칭될 수 있는 스위치(313)가 구성되며, 그 스위치(313)는 언제 해당 포트로부터 수신하여야 하지를 제어 컴퓨터(340)에 알려준다. 상기 입력포트(311)로 도착한 데이터는 데이터 분배기(330)을 통해 출력포트(312)로 중계되어지고, 데이터선(331)을 통해 제어 컴퓨터(340)로 중계되어지며, 채널(351)을 통해 다른 분배기 유닛들로 중계된다. 또한, 그 제어 컴퓨터(340)는 제어 컴퓨터(340)의 상태를 위해 유지보수 컴퓨터로 주기적으로 진단 보고 데이터를 전송하는 직렬 입/출력 채널(341)을 가지며, 고정 데이터의 구조는 도 4에 나타낸다. 필요한 경우에 그 출력포트(312)상의 데이터는 출력 전단에서 증폭할 수도 있다. 통상의 증폭기는 도 3에서 도시를 생략했다.3 shows the structure of a distributor unit with an integrated protector. The distributor unit is composed of an input port 311, an output port 312, a data distributor 330 and a control computer 340. The data connection 301 of the remote computer (corresponding to 121 in FIG. 1) is connected to the input port 311 and the output port 312 of the distributor unit, and the other data connections 302, 303, 304 are also made the same. . In addition, in the case of a unidirectional communication line, the two ports 311 and 312 may be individually connected to corresponding ports of a remote computer having a data connection 301. In addition, a switch that can be switched by the control computer 340 of the distributor unit via a signal line 314 in each input port 311 adjacent to custom filters and potential separation, if necessary. 313 is configured, and the switch 313 tells the control computer 340 when to receive from that port. Data arriving at the input port 311 is relayed to the output port 312 through the data distributor 330, and relayed to the control computer 340 through the data line 331, through the channel 351 Relayed to other distributor units. The control computer 340 also has a serial input / output channel 341 that periodically sends diagnostic report data to the maintenance computer for the state of the control computer 340, the structure of the fixed data being shown in FIG. . If necessary, the data on the output port 312 may be amplified at the output front end. Conventional amplifiers are not shown in FIG.

도 4는 제어 컴퓨터(340)에 대한 선행성(중계시간 전)을 이용할 수 있는 데이터 구조를 나타내는 도면이다. 그 데이터 구조는 각 포트 또는 상기 분배기 유닛의 원격 컴퓨터(111, 112, 113, 114)용 특정 데이터 레코드(411, 412, 413, 414)를 포함한다. 상기 데이터 레코드(411)의 제 1필드(401)에는 그 데이터 레코드가 속하는 포트 번호가 포함된다. 제 2필드(402)에는 MEDL(212) 리스트에 개재된 포트와 연관되는 노드의 송신시간 길이 정보가 포함된다. 제 3필드(403)에는 그 포트와 연관된 노드의 최신 전송의 끝점과 그 다음 전송의 시작점에 대한 시간 간격의 길이 정보가 포함된다. 제 4필드(404)에는 이어질 다음 포트번호가 포함된다. 제 5필드(405)에는 이어질 다음 포트에서 노드의 최신 전송의 시작점과 끝점 사이의 시간간격의 길이 정보가 포함된다. 제 6필드(406)에는 최근 포트로 수신되는 초기화 메시지의 길이 정보가 포함된다. 도 4에 도시된 데이터 구조의 항목은 메시지 기술자 리스트(212)와 동등한 개발 툴에 의해 확립되고, 채널(341)을 매개로 중계시간 이전에 상기 제어 컴퓨터(340)에 탑재된다.4 is a diagram showing a data structure that can use the precedence (before the relay time) for the control computer 340. The data structure includes specific data records 411, 412, 413, 414 for each port or remote computer 111, 112, 113, 114 of the distributor unit. The first field 401 of the data record 411 includes a port number to which the data record belongs. The second field 402 includes transmission time length information of a node associated with a port included in the MEDL 212 list. The third field 403 contains length information of the time interval for the end point of the latest transmission of the node associated with that port and the start point of the next transmission. The fourth field 404 includes the next port number to be followed. The fifth field 405 includes the length information of the time interval between the start point and the end point of the latest transmission of the node at the next port to be followed. The sixth field 406 includes length information of an initialization message received at a recent port. The items of the data structure shown in FIG. 4 are established by a development tool equivalent to the message descriptor list 212 and loaded into the control computer 340 before the relay time via the channel 341.

도 5는 초기화 메시지 구조를 나타내는 도면이다. 그 초기화 메시지는 헤더(501)내에 초기화 메시지라는 것을 인식할 수 있는 특정 비트(510)를 포함하여야 한다. 초기화 메시지의 데이터 필드(502)는 하나의 분배기 유닛의 기능으로 그다지 중요치 않은 추가적인 정보를 나타낸다. 초기화 메시지의 마지막은 CRC 필드(503)이다. 고성능의 분배기 유닛은 장해 인식의 가능성을 더욱 높이기 위해 초기화 메시지의 상기 데이터 필드(502)내에 포함된 정보를 평가할 수 있다. 예컨대, 그러한 고성능 분배기 유닛은 그들이 포함한 클럭에 대한 송신자의 클럭 상태를 비교하기 위해 TTP/C 초기화 메시지의 시간 필드를 평가할 수 있다.5 is a diagram illustrating an initialization message structure. The initialization message must include a specific bit 510 in the header 501 that can be recognized as an initialization message. The data field 502 of the initialization message represents additional information that is of little importance to the function of one distributor unit. The last of the initialization message is the CRC field 503. The high performance distributor unit may evaluate the information contained in the data field 502 of the initialization message to further increase the likelihood of fault recognition. For example, such a high performance distributor unit may evaluate the time field of the TTP / C initialization message to compare the sender's clock state against the clock they contain.

도 6은 분배기 유닛(101)에 구성되는 제어 컴퓨터(340)의 2개의 가장 중요한 내부상태를 나타내는 것으로, 크게 "동기화(synchronized)"(601)와 "동기화(synchronized)"(602)로 대별된다. 전원을 투입하면, 사기 제어컴퓨터(340)는 비동기(602) 상태가 된다. 그 상태에서, 모든 입력포트(311)는 데이터 분배기(330)와 접속된다. 상기 데이터선(331) 또는 채널(352)을 통해 제어 컴퓨터(340)로부터 그 입력포트에 정확한 메시지가 수신되면, 수신에 이용된 신호선(314) 포트에 의해 구축된 상기 제어 컴퓨터(340)는 메모리에 수신시점을 저장하고, 상기 필드(406)에 저장된 길이를 비교함에 따라 메시지의 길이를 확인한다. 그리고, 메시지 길이의 확인결과가 긍정적이면 동기화(602) 상태가 되고, 메모리된 초기화 메시지의 수신시점에 동기화 이벤트가 발생된다. 동기화(602) 상태에, 상기 제어 컴퓨터(340)는 상기 시간정보(403)에 개재된 시간동안만 입력포트에 대응되어 접속된다. 개별 메시지가 정확한 시간에 도착되면, 인코딩 시스템의 인코딩 룰에 의해 인코딩된다. 상기 제어 컴퓨터는 메시지의 관찰된 도착시간과 예상된 도착 시간동안 검출된 시차를 이용하여, 신뢰도 있는 내장해성 알고리즘(예컨대, Kopetz 1997, p.61 참조)에 이용되는 시간을 재동기시킨다. 다수의 채널(301∼304 또는 352)중 어느 하나의 채널을 통해 설정된 시간간격 dfault-1동안 정확한 메시지가 도착되지 않으면, 상기 분배기 유닛이나 그 제어 컴퓨터(340)는 비동기화(601) 상태로 스위칭된다. 만약, 이러한 스위칭이 적어도 다음의 평가동작을 실행시킬 수 있다면 동기화(602) 상태내의 메시지는 정확하다. 그 메시지는 정확한 CRC 필드(503)를 가지므로 대략 예상된 시간에 입력 포트에 도착되고, 상기 필드(406)에 의해 정확한 길이를 갖게 된다.FIG. 6 shows the two most important internal states of the control computer 340 that are configured in the distributor unit 101, and are roughly divided into "synchronized" 601 and "synchronized" 602. . When the power is turned on, the fraud control computer 340 is in an asynchronous 602 state. In that state, all the input ports 311 are connected to the data distributor 330. When the correct message is received from the control computer 340 through the data line 331 or the channel 352 at its input port, the control computer 340 constructed by the signal line 314 port used for reception is stored in memory. Store the receiving point in time and check the length of the message by comparing the length stored in the field 406. If the confirmation result of the message length is affirmative, it is in a synchronization 602 state, and a synchronization event is generated when a memory initialization message is received. In the synchronization 602 state, the control computer 340 is connected in correspondence with the input port only for the time interposed in the time information 403. If an individual message arrives at the correct time, it is encoded by the encoding rules of the encoding system. The control computer resynchronizes the time used for a reliable embedded resolution algorithm (see, eg, Kopetz 1997, p. 61), using the observed time difference of the message and the time difference detected during the expected time of arrival. If the correct message does not arrive during the set time interval d fault-1 over any one of the multiple channels 301-304 or 352, the distributor unit or its control computer 340 is in an unsynchronized state (601). Switching. If this switching is capable of executing at least the following evaluation operation, the message in the synchronization 602 state is correct. The message has the correct CRC field 503 so it arrives at the input port at approximately the expected time and has the correct length by the field 406.

상기 제어 컴퓨터(340)는 입/출력선(341; 도 1에 도시된 입출력선 141, 142와 동일)을 통해 제어 컴퓨터(340)에 설정된 파라미터를 관리하고, 그 동작 중에 제어 컴퓨터를 모니터링하는 유지보수 컴퓨터와 통신을 행한다.The control computer 340 manages the parameters set in the control computer 340 through input / output lines 341 (same as the input / output lines 141 and 142 shown in FIG. 1), and maintains the monitoring of the control computer during its operation. Communicate with the maintenance computer.

원격 컴퓨터(예컨대, 111) 클럭내의 하나의 에러는 원격 컴퓨터(111)의 각 채널(201, 202)상 물리적 신호의 불충분한 인코딩 오류를 야기할 수 있다. 2개의 분배기 유닛을 통해 메시지의 수신측에 이러한 에러가 증가되는 것을 방지하기 위해, 분배기 유닛은 각 분배기 유닛내에서 이어서 실행될 물리적인 신호를 수신한 다음, 분배기 유닛의 로컬 클럭으로 사용된 디지털 신호로 변환시킨다. 그리고, 송신 직전에 다시 물리적 형태 분배기 유닛(분배기 유닛에 의해 재조합되는 신호)으로 변환시킨다. 상기한 방식을 통해, 불충분한 인코딩 오류를 정확한 인코딩이나 잘못된 인코딩으로 일관되게 나타낼 수 있다. TDMA 환경내에서 단지 하나의 에러 소스가 발생되었다고 가정하면, 시스템내에서 불일치가 발생될 것이므로 상기한 방식의 과정을 통해 시간 영역 또는 값의 범위에서의 싱글 에러가 각 채널상의 인코딩을 방해하는 것을 방지할 수 있다.One error in the remote computer (eg, 111) clock can result in insufficient encoding error of the physical signal on each channel 201, 202 of the remote computer 111. In order to prevent this error from increasing on the receiving side of the message via the two distributor units, the distributor unit receives the physical signal to be subsequently executed within each distributor unit and then uses the digital signal used as the local clock of the distributor unit. Convert Then, just before transmission, it is converted back into a physical form distributor unit (a signal recombined by the distributor unit). In this way, insufficient encoding errors can be consistently represented with the correct or incorrect encoding. Assuming that only one error source occurs in the TDMA environment, inconsistencies will occur in the system, thus preventing a single error in the time domain or range of values from interfering with the encoding on each channel. can do.

상기 제어 컴퓨터(340)는 단지 상기 스위치(313)의 개폐를 제어할 뿐, 전송 메시지의 내용을 변환한다거나, 신규 메시지를 삽입하지는 않는다. 그러므로, 분배기 유닛의 오류 형태는 통신 채널의 고장-휴지 오류로 남게 된다. 더불어, 내장해성의 구성에서는 항상 두 번째 독립 통신 채널을 이용할 수 있다.The control computer 340 merely controls the opening and closing of the switch 313, and does not convert the contents of the transmission message or insert a new message. Therefore, the error form of the distributor unit remains a fault-fault error of the communication channel. In addition, a second independent communication channel can always be used in a built-in solution.

마지막으로, 본 발명은 본 발명에서 제시하는 실시예 즉, 4개의 원격 컴퓨터와 2개의 분배기 유닛을 갖는 실시예에 한정되지 않고, 더 넓은 의미로 확대 가능하다. 또한, 본 발명은 TTP/C 프로토콜을 사용하지 않고 다른 시간 제어 프로토콜을 사용할 수도 있다.Finally, the present invention is not limited to the embodiment presented in the present invention, that is, the embodiment having four remote computers and two distributor units, and can be expanded in a broader sense. In addition, the present invention may use other time control protocols without using the TTP / C protocol.

Claims (17)

삭제delete 삭제delete 삭제delete 삭제delete 삭제delete 삭제delete 삭제delete 삭제delete 적어도 하나의 분배기 유닛(101,102)에 의해 연결된 다수의 네트워크 노드-컴퓨터(111...114)를 가지며, 각각의 네트워크-노드 컴퓨터는 통신 채널(201,202)에 대응하는 연결을 가진 자율적인 통신 제어 유닛(211)을 가지며 상기 통신 채널들은 사이클 시간 슬라이스 과정에 따라 억세스되는 오류 허용 분배 컴퓨터 시스템에 있어서,An autonomous communication control unit having a plurality of network node-computers 111 ... 114 connected by at least one distributor unit 101,102, each network-node computer having a connection corresponding to the communication channel 201,202. An error-tolerant distributed computer system having 211 and wherein the communication channels are accessed according to a cycle time slice process, 적어도 하나의 분배기 유닛(101,102)은 상기 네트워크-노드 컴퓨터(111...114)의 규칙적인 전송 거동 때문에 상기 제어 컴퓨터는 오직 통계적으로 할당된 타임 슬라이스내에서 네트워크-노드컴퓨터가 다른 네트워크-노드 컴퓨터들에 대해 야기하는 선행성을 아는 제어 컴퓨터(340-313)를 포함하는 것을 특징으로 하는 오류 허용 분배 컴퓨터 시스템.At least one distributor unit (101, 102) is a network-node computer that differs from the network-node computer within a statistically allocated time slice because of the regular transmission behavior of the network-node computer (111 ... 114). Fault-tolerant distributed computer system comprising a control computer (340-313) that knows the priorities that cause them. 삭제delete 제 9항에 있어서,The method of claim 9, 적어도 하나의 분배기 유닛(101, 102)의 제어 컴퓨터(340-131)는, 정확한 메시지를 수신한 다음, 모든 입력포트(311)를 통해 수신 가능한 "비동기화(unsynchronized)"상태로부터, 이 입력포트에 통계적으로 할당된 타임 슬라이스(time slice) 동안, 하나의 입력포트를 통해 수신 가능한 "동기화(synchronized)"상태로 변환하는 것을 특징으로 하는 오류 허용 분배 컴퓨터 시스템.The control computers 340-131 of the at least one distributor unit 101, 102 receive this correct port and then, from the " unsynchronized " state which can be received through all of the input ports 311. A fault-tolerant distributed computer system for translating into a "synchronized" state receivable through one input port during a time slice statistically assigned to. 제 11항에 있어서,The method of claim 11, 적어도 하나의 분배기 유닛(101, 102)의 제어컴퓨터(340-131)는, 선행성이 미리 설정된 시간간격 내에서 그의 입력포트(311) 중 하나를 통해 최종 초기화 메시지이래로 어떠한 정확한 메시지도 수신되지 않았을 때, "동기화" 상태로부터 "비동기화" 상태로 변환하는 것을 특징으로 하는 오류 허용 분배 컴퓨터 시스템.The control computers 340-131 of the at least one distributor unit 101, 102 have not received any correct messages since the last initialization message via one of its input ports 311 within a predetermined time interval. And when transitioning from a "synchronized" state to a "unsynchronized" state. 제 9항에 있어서,The method of claim 9, 유입 메시지의 내용은 상기 적어도 하나의 분배기 유닛(101, 102)의 제어 컴퓨터(340-131)에 의해 추가적인 에러 인식의 의미로 평가되는 것을 특징으로 하는 오류 허용 분배 컴퓨터 시스템.The content of the incoming message is assessed in the sense of further error recognition by the control computer (340-131) of the at least one distributor unit (101, 102). 제 9 항에 있어서,The method of claim 9, 적어도 하나의 분배기 유닛의 제어 컴퓨터(340-131)는, 전원의 투입(power-up) 후에, 비동기된 상태로 추정하는 것을 특징으로 하는 오류 허용 분배 컴퓨터 시스템.The control computer (340-131) of the at least one distributor unit, after power-up, assumes an asynchronous state. 제 9 항에 있어서,The method of claim 9, 적어도 하나의 분배기 유닛(101, 102)은, 분배기 유닛의 로컬 클럭을 사용하여 도착되는 물리적인 신호를 디지털 신호로 변환하고, 전송 전에 그들을 물리적인 형태로 반환하는 것을 특징으로 하는 오류 허용 분배 컴퓨터 시스템.At least one distributor unit (101, 102) converts the physical signals arriving using the local clock of the distributor unit into digital signals and returns them in physical form prior to transmission. . 제 9 항에 있어서,The method of claim 9, 상기 분배기 유닛(101, 102)은, 그 자신의 접속에 대해 유입하는 메시지도 없을 때도 분배기 유닛의 시동 및 클럭 동기화가 가능하도록 하기 위해, 통신 채널(201, 202)을 경유하여 서로 접속되는 것을 특징으로 하는 오류 허용 분배 컴퓨터 시스템.The distributor units (101, 102) are connected to each other via communication channels (201, 202) in order to enable starter and clock synchronization of the distributor unit even when there are no incoming messages for its own connection. Fault-tolerant distributed computer system. 제 9항에 있어서,The method of claim 9, 분배기 유닛(101,102)은, 전용 통신채널(141, 142)을 통해, 동작중에 분배기 유닛의 변수화(parametrisation)를 수행하고 분배기 유닛의 정확한 동작을 감시하기 위하여 적어도 하나의 유지보수 컴퓨터에 접속되는 것을 특징으로 하는 오류 허용 분배 컴퓨터 시스템.The distributor units 101, 102 are connected to at least one maintenance computer via dedicated communication channels 141, 142 to perform parametrisation of the distributor unit during operation and to monitor the correct operation of the distributor unit. Fault-tolerant distributed computer system.
KR10-2002-7001668A 1999-08-13 2000-06-26 Method for imposing the fail-silent characteristic in a distributed computer system and distribution unit in such a system KR100433649B1 (en)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
AT0139599A AT407582B (en) 1999-08-13 1999-08-13 MESSAGE DISTRIBUTION UNIT WITH INTEGRATED GUARDIAN TO PREVENT '' BABBLING IDIOT '' ERRORS
ATA1395/99 1999-08-13

Publications (2)

Publication Number Publication Date
KR20020029914A KR20020029914A (en) 2002-04-20
KR100433649B1 true KR100433649B1 (en) 2004-06-01

Family

ID=49381939

Family Applications (1)

Application Number Title Priority Date Filing Date
KR10-2002-7001668A KR100433649B1 (en) 1999-08-13 2000-06-26 Method for imposing the fail-silent characteristic in a distributed computer system and distribution unit in such a system

Country Status (1)

Country Link
KR (1) KR100433649B1 (en)

Also Published As

Publication number Publication date
KR20020029914A (en) 2002-04-20

Similar Documents

Publication Publication Date Title
JP4099332B2 (en) Distributed computer system and method for improving fault tolerance performance in a distributor unit of the system
US5359594A (en) Power-saving full duplex nodal communications systems
Limb et al. Description of Fasnet—A unidirectional local-area communications network
US4696001A (en) Reconfigurable high-speed integrated local network
US5539734A (en) Method of maintaining PVC status packetized communication system
US8473656B2 (en) Method and system for selecting a communications bus system as a function of an operating mode
US9137042B2 (en) Cluster coupler in a time triggered network
US6636478B1 (en) Configurable scalable communications equipment protection method system
US8064347B2 (en) System and method for redundant switched communications
US20050044137A1 (en) Protected ethernet backplane communication
US6421710B1 (en) Coupling arrangement for a master-slave bus system
KR100433649B1 (en) Method for imposing the fail-silent characteristic in a distributed computer system and distribution unit in such a system
JPH09130408A (en) Network interface device
EP0300778A2 (en) Ring shaped local area network
US7184394B2 (en) Routing system providing continuity of service for the interfaces associated with neighboring networks
US6115391A (en) Method and apparatus for integrating multiple repeaters into a single collision domain
CN100574288C (en) The data link layer device that is used for serial communication bus
US5323145A (en) Alarm collection architecture with redundant bus
US20190215386A1 (en) Low cost, high bandwidth redundant communication network
JP2001308893A (en) Dynamic reconfiguration system for routing information in loop-type topology network
JP2867865B2 (en) Protection line switching control method
KR100771915B1 (en) Digital protection relay and communication duplex method
JP4760927B2 (en) Network system and communication device
EP0300607A2 (en) Ring shaped local area network for digital audio
US20040039850A1 (en) Apparatus and method for automatically configuring network media connection

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20130424

Year of fee payment: 10

FPAY Annual fee payment

Payment date: 20140416

Year of fee payment: 11

FPAY Annual fee payment

Payment date: 20150422

Year of fee payment: 12

FPAY Annual fee payment

Payment date: 20160420

Year of fee payment: 13

FPAY Annual fee payment

Payment date: 20170412

Year of fee payment: 14

FPAY Annual fee payment

Payment date: 20180405

Year of fee payment: 15

LAPS Lapse due to unpaid annual fee