KR20090074447A - Method of changing a switch board - Google Patents
Method of changing a switch board Download PDFInfo
- Publication number
- KR20090074447A KR20090074447A KR1020080000233A KR20080000233A KR20090074447A KR 20090074447 A KR20090074447 A KR 20090074447A KR 1020080000233 A KR1020080000233 A KR 1020080000233A KR 20080000233 A KR20080000233 A KR 20080000233A KR 20090074447 A KR20090074447 A KR 20090074447A
- Authority
- KR
- South Korea
- Prior art keywords
- switch board
- message
- switch
- board
- chassis
- Prior art date
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04Q—SELECTING
- H04Q1/00—Details of selecting apparatus or arrangements
- H04Q1/18—Electrical details
- H04Q1/30—Signalling arrangements; Manipulation of signalling currents
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04Q—SELECTING
- H04Q1/00—Details of selecting apparatus or arrangements
- H04Q1/18—Electrical details
- H04Q1/20—Testing circuits or apparatus; Circuits or apparatus for detecting, indicating, or signalling faults or troubles
Abstract
Description
본 발명은 ATCA 플랫폼 장치에 관한 것으로서, 특히, ATCA 플랫폼 장치의 스위치 보드를 변경하는 방법에 관한 것이다. The present invention relates to an ATCA platform device, and more particularly, to a method of changing a switch board of an ATCA platform device.
일반적으로 네트워크 장비 업체들은 각각 다양한 네트워크 장비들을 출시하고 있기 때문에, 통신 사업자들의 입장에서는 다양한 제품을 관리하는데 따른 복잡성과 관리비용 증가라는 문제가 발생하고 있다.In general, as network equipment companies release various network equipments, there is a problem of increasing complexity and management costs for managing various products from a carrier's point of view.
이러한 문제점을 극복하고자 통신 업계는, 컴퓨터 업계가 표준화를 통해 상호 호환성을 증가시킴으로써 수직 계열화된 공급체계를 수평적 협력 모델로 전환하여 효율성을 극대화한 방법을 도입하고 있는데, 이를 위한 대표적인 예가 전세계적으로 40개 이상의 회사들이 표준화에 참여하고 있는 ATCA(Advanced Telecom Computing Architecture)(이하, 간단히 'ATCA'라 함) 플랫폼이다. 이러한 ATCA 플랫폼은 재사용이 가능한 섀시, 보드, 스위치, CPU, 프로그래밍이 가능한 네트워크 프로세서들을 사용함으로써, 장비 제조업체들이 표준에 근거한 제품들을 대량으로 생산할 수 있도록 하고 있다.To overcome this problem, the telecommunications industry is introducing a method by which the computer industry maximizes efficiency by converting a vertically integrated supply system into a horizontal cooperative model by increasing mutual compatibility through standardization. It is an Advanced Telecom Computing Architecture (ATCA) platform with more than 40 companies participating in standardization. The ATCA platform uses reusable chassis, boards, switches, CPUs, and programmable network processors to enable equipment manufacturers to mass produce standards-based products.
즉, ATCA 플랫폼은 PICMG(PCI Industrial Computer Manufacturers Group)의 표준화된 규격에 따라 네트워크 시스템을 설계할 수 있도록 함으로써, 네크워크 시스템 개발에 있어서의 기간단축과 경제성을 실현할 수 있게 하고 있다.In other words, the ATCA platform enables network systems to be designed in accordance with the PCI Industrial Computer Manufacturers Group (PICMG) standardized specifications, thereby realizing the time savings and economics in developing network systems.
이러한 ATCA 플랫폼에서, 스위치 보드와 다수의 서비스 보드들 간에는 패킷 전달을 위한 패브릭 인터페이스 규격이 정의되어 있으며, 이러한 패브릭 인터페이스 규격은 스위치 보드를 중심으로 스타 토폴로지, 듀얼 스타 토폴로지, 풀 메쉬 토폴로지 등의 토폴로지들이 정의되고 있다.In this ATCA platform, a fabric interface specification for packet forwarding is defined between the switch board and a plurality of service boards, and the fabric interface specification is based on the switch boards such as star topology, dual star topology, and full mesh topology. It is defined.
도 1은 일반적인 ATCA 플랫폼 장치의 구조를 블럭도로 나타낸 예시도이다. 1 is a block diagram illustrating a structure of a general ATCA platform device.
상기한 바와 같은 ATCA 플랫폼을 이용한 ATCA 플랫폼 장치는, 도 1에 도시된 바와 같이, 섀시 관리부(메인 프로세서 장치라고도 함)(이하, 간단히 '섀시 관리부'라 함)(10), 스위치 보드(패킷 스위치 장치라고도 함)(이하, 간단히 '스위치 보드'라 함)(20) 및 다수의 서비스 보드(패킷처리장치, 사용자 정합 보드, 패킷 처리부, I/O 장치라고도 함)(이하, 간단히 '서비스 보드'라 함)(30-1 내지 30-m, 40-1 내지 40-n)를 포함한다. 여기서, 상기 섀시 관리부 및 스위치 보드는 이중 구조(10-1, 10-2, 20-1, 20-2)로 이루어질 수 있다. 또한, 서비스 보드들은 스위치 보드를 경계로 하여 제1 서비스 보드부(30)와 제2 서비스 보드부(40)로 구분될 수 있으며, 각각의 서비스 보드부에는 다수의 서비스 보드들이 구비되어 있다.The ATCA platform device using the ATCA platform as described above, as shown in Figure 1, the chassis management unit (also referred to as the main processor device) (hereinafter, simply referred to as 'chassis management unit') 10, switch board (packet switch 20) and a number of service boards (also referred to as packet processing devices, user matching boards, packet processing units, and I / O devices) (hereinafter simply referred to as 'service boards') (30-1 to 30-m, 40-1 to 40-n). Here, the chassis management unit and the switch board may be of a dual structure (10-1, 10-2, 20-1, 20-2). In addition, the service boards may be divided into the first
한편, 상기한 바와 같은 ATCA 플랫폼 장치에서, 서비스 보드 간 통신은 ICMP 패킷을 이용한 IP Bonding(또는 Link Aggregation)이라는 기술로 이중화되어 있다. 그러나, IP Bonding으로 구현된 포트 이중화 방법은 스위치 보드의 장애를 감지하여 포트를 변경하는 시간이 길다는 문제점이 있다. 즉, ATCA 플랫폼 장치의 특성상 섀시에 장착된 모든 보드들은 쉽게 탈장(Eject)/실장(Insert, Mount)될 수 있는데, 이러한 구조는, 하드웨어 측면에서 보면 확장성이 용이하다는 장점이 있지만, 서비스 가용성 측면에서 보면 보드(Blaede)의 탈/실장으로 인해 서비스의 중지 시간(Service down time)이 길어진다(Low available)는 문제점이 있다. On the other hand, in the ATCA platform device as described above, communication between service boards is duplicated by a technique called IP bonding (or link aggregation) using ICMP packets. However, the port duplication method implemented by IP bonding has a problem in that it takes a long time to change a port by detecting a failure of a switch board. In other words, due to the nature of ATCA platform devices, all boards mounted in the chassis can be easily ejected / inserted (mounted). This structure has the advantage of being scalable in terms of hardware, but in terms of service availability. In this case, the service down time of the service is long due to the detachment / mounting of the board.
특히, 모든 서비스 보드에 대해서 IP 통신의 매개자 역할을 하는 스위치 보드의 탈장은 서비스 측면에서 보면 큰 타격임에도 불구하고, 상기한 바와 같은 종래의 방법으로는, ATCA 플랫폼 장치의 외관을 형성하는 섀시에서 스위치 보드의 탈/실장 등과 같은 장애 여부를 ICMP 패킷으로 정확히 판단하는 것이 불가능하다는 문제점이 있다.In particular, although the hernia of the switch board which acts as an intermediary of IP communication for all the service boards is a big hit from the service side, the conventional method as described above, the switch in the chassis forming the appearance of the ATCA platform device There is a problem in that it is impossible to accurately determine whether a fault such as a board removal or mounting is performed using an ICMP packet.
이하에서는, 서비스 보드들 간의 패킷 교환을 수행하고 있는 제1 스위치 보드의 탈장(Eject) 여부를 판단하여, 제1 스위치 보드를 제2 스위치 보드로 변경하여 서비스 보드들 간의 패킷 교환을 수행하도록 하고 있는 종래의 방법이, 도 1 및 도 2를 참조하여 설명된다.Hereinafter, by determining whether the first switch board performing the packet exchange between the service boards (Eject), by changing the first switch board to the second switch board to perform the packet exchange between the service boards The conventional method is described with reference to FIGS. 1 and 2.
도 2는 종래의 스위치 보드 변경 방법의 일실시예 흐름도이다.Figure 2 is a flow diagram of one embodiment of a conventional switch board change method.
ATCA 플랫폼 장치가 특별한 장애 없이 일반적으로 구동되고 있는 경우, 도 1에 도시된 바와 같이, 제m 서비스 보드(30-m)가 제n 서비스 보드(40-n)와 통신할 때, 제1 스위치 보드를 경유하여 IP 통신을 수행한다(72).When the ATCA platform device is generally driven without particular obstacles, as shown in FIG. 1, when the mth service board 30-m communicates with the nth service board 40-n, the first switch board IP communication is performed via (72).
한편, 제1 스위치 보드가 교체 또는 수리를 위해 탈장(Eject)되거나 또는 제 1 스위치 보드의 OS가 Shutdown되는 경우(74), 제m 서비스 보드와 제n 서비스 보드는 제1 스위치 보드로부터 ICMP 응답 패킷이 오지 않음을 감지하게 된다(76). 즉, 제m 서비스 보드 또는 제n 서비스 보드는 IP 통신의 원활한 수행여부를 확인하기 위해 제1 스위치 보드로부터 ICMP 응답 패킷을 수신하게 되는데, 제1 스위치 보드가 탈장되거나 기타 장애가 발생된 경우에는 상기와 같은 ICMP 응답 패킷이 제1 스위치 보드로부터 전송되지 않게 되므로, 서비스 보드는 소정의 시간이 경과되면 ICMP 응답 패킷이 수신되지 않은 것으로 확정하게 된다. 이때, 서비스 보드가 상기와 같은 ICMP 응답 패킷이 수신되지 않음을 확정하는 대기 시간은 각 시스템마다 다르게 설정될 수 있으나, 시스템 자체의 부하 등을 고려하여 일반적으로 패킷 전송 후 10초 정도의 시간으로 설정되고 있다.Meanwhile, when the first switch board is ejected for replacement or repair, or when the OS of the first switch board is shut down (74), the m-th service board and the n-th service board are ICMP response packets from the first switch board. It is sensed that this is not coming (76). That is, the m-th service board or the n-th service board receives an ICMP response packet from the first switch board to check whether IP communication is performed smoothly. When the first switch board is detached or other failure occurs, Since the same ICMP response packet is not transmitted from the first switch board, the service board determines that the ICMP response packet has not been received after a predetermined time has elapsed. At this time, the wait time for the service board to determine that the above ICMP response packet is not received may be set differently for each system, but generally set to about 10 seconds after packet transmission in consideration of the load of the system itself. It is becoming.
상기한 바와 같이, 기 설정된 대기 시간이 경과하여도 ICMP 응답 패킷이 수신되지 않은 경우(76), 제m 서비스 보드와 제n 서비스 보드는 제2 스위치 보드를 통하여 통신하기로 결정하고, 내부의 통신 포트를 제2 스위치 보드로 변경한다(78).As described above, when the ICMP response packet is not received even after the preset waiting time elapses (76), the m-th service board and the n-th service board determine to communicate through the second switch board, and internal communication Change the port to the second switch board (78).
그러나, 상기한 바와 같은 종래의 방법은, 제1 스위치 보드의 장애 발생 시 제2 스위치로 통신 포트를 변경하는 시간이 오래 거릴 뿐만 아니라, 단순히 ICMP 패킷 응답이 없음을 이용하여 스위치 보드를 변경하는 것이므로, 서비스 보드의 탈/실장 및 장애 여부를 정확히 판단하여 통신 포트 변경을 수행할 수 없다는 문제점이 있다. However, the conventional method as described above not only takes a long time to change the communication port to the second switch when a failure of the first switch board occurs, but also simply changes the switch board using no ICMP packet response. There is a problem in that the communication port cannot be changed by accurately determining whether the service board is removed or mounted.
예를 들어, 실제의 ATCA 플랫폼 장치 운영환경에서는, 스위치 보드를 경유하 는 네트워크 패킷이 많아지면, 서비스 보드간 ICMP 패킷 로스(Packet loss) 현상이 심해지게 되는데, 상기한 바와 같은 종래의 방법은, 단순한 ICMP 패킷 로스 현상을 스위치 보드의 장애로 판단하여 불필요하게 스위치 보드를 변경하게 된다. 즉, 상기한 바와 같은 종래의 방법은, 스위치 보드가 탈장된 것이 아니고, 단지 네트워크 트레픽이 많아져 대기 시간이 경과한 경우에도, 서비스 보드의 입장에서는 스위치 보드가 탈장 또는 장애(fault) 상태인 것으로 여겨 스위치 보드에 대한 변경을 수행하게 되는데, 이런 경우는 스위치 보드를 변경한다고 하더라도 네트워크 상의 근본적인 문제가 해결되지는 않으므로, 불필요한 스위치 보드 변경이 이루어진 것이라고 할 수 있다.For example, in an actual ATCA platform device operating environment, when a large number of network packets are passed through a switch board, ICMP packet loss between service boards becomes severe. In the conventional method as described above, A simple ICMP packet loss phenomenon is regarded as a failure of the switch board, and the switch board is unnecessarily changed. That is, in the conventional method as described above, even if the switch board is not hermetic and only the network traffic increases and the waiting time elapses, the switch board is in the hermetic or fault state from the standpoint of the service board. In this case, changing the switch board does not solve the fundamental problem on the network. Therefore, unnecessary switch board change is made.
상기와 같은 문제점을 해결하기 위한 본 발명의 목적은, 스위치 보드의 장애 발생 신호를 수신한 섀시 관리부가, 서비스 보드로 상기 장애 발생 신호를 전송하면, 서비스 보드가 스위치 보드를 변경하여 통신을 수행하도록 할 수 있는, 스위치 보드 변경 방법을 제공하는 것이다. An object of the present invention for solving the above problems is, when the chassis management unit receives the failure signal of the switch board, and transmits the failure signal to the service board, the service board changes the switch board to perform communication One way to do this is to provide a switchboard change method.
상기 목적을 달성하기 위한 본 발명은, 섀시 관리부, 다수의 서비스 보드, 활성화 상태의 제1 스위치 보드, 비활성화 상태의 제2 스위치 보드를 포함하는 ATCA 플랫폼 장치에 적용되는 스위치 보드 변경 방법에 있어서, 상기 서비스 보드들 각각이, 상기 섀시 관리부로부터 전송된 메시지를 수신한 경우, 상기 메시지가 상기 제1 스위치 보드와 관련된 메시지인지의 여부를 판단하는 단계; 상기 관련 여부 판단결과, 상기 메시지가 상기 제1 스위치 보드와 관련된 메시지가 아닌 경우, 상기 각 서비스 보드들이 상기 제1 스위치 보드를 경유한 통신을 지속적으로 수행하는 단계; 및 상기 관련 여부 판단결과, 상기 메시지가 상기 제1 스위치 보드와 관련된 메시지인 경우, 상기 각 서비스 보드들이, 상기 메시지가 상기 제1 스위치 보드의 장애와 관련된 것인지의 여부를 판단하여, 상기 제1 스위치 보드를 경유한 통신을 지속적으로 이용할 것인지 또는 제2 스위치 보드를 경유한 통신으로 변경할 것인지를 결정하는 단계를 포함한다.In order to achieve the above object, the present invention provides a switch board change method applied to an ATCA platform device including a chassis management unit, a plurality of service boards, an activated first switch board, and an inactive second switch board. When each of the service boards receives a message transmitted from the chassis manager, determining whether the message is a message related to the first switch board; If the message is not related to the first switch board, as a result of determining whether the message is related, continuing each communication board via the first switch board; And if the message is a message related to the first switch board, determining whether or not the message is related to a failure of the first switch board. Determining whether to continue using communication via the board or change to communication via the second switch board.
본 발명은 각 서비스 보드들이 제1 스위치 보드의 이상 발생 정보를 섀시 관리부로부터 직접 수신한 후 직접 제2 스위치 보드로 통신 포트를 변경하도록 함으로써, 보다 신속하게 포트 변경이 이루어질 뿐만 아니라, 네트워크를 통한 서비스가 중단없이 이루어지도록 할 수 있다는 우수한 효과가 있다. According to the present invention, the service boards receive the error occurrence information of the first switch board directly from the chassis management unit and then directly change the communication port to the second switch board. There is an excellent effect that can be made without interruption.
또한, 본 발명은 각 서비스 보드들이 제1 스위치 보드의 장애 발생 정보를 섀시 관리부로부터 직접 수신하여 그에 따른 포트 변경을 수행하도록 함으로써, 불필요하게 포트 변경이 이루어지는 것을 방지할 수 있다는 우수한 효과가 있다. In addition, the present invention has an excellent effect that each service board receives the failure information of the first switch board directly from the chassis management unit to perform the port change accordingly, thereby preventing unnecessary port changes.
이하, 첨부된 도면을 참조하여 본 발명이 상세히 설명된다.Hereinafter, the present invention will be described in detail with reference to the accompanying drawings.
도 3은 본 발명이 적용되는 ATCA 플랫폼 장치의 구조를 블럭도로 나타낸 예시도이다. 또한, 도 4는 본 발명에 따른 스위치 보드 변경 방법이 적용되는 ATCA 플랫폼 장치의 사용 상태를 나타낸 예시도로서, 각 보드가 슬롯 방식으로 섀시에 탑재되어 있는 상태를 나타낸 예시도이다. 3 is a block diagram illustrating a structure of an ATCA platform apparatus to which the present invention is applied. In addition, Figure 4 is an exemplary view showing a state of use of the ATCA platform device to which the switch board change method according to the present invention is applied, it is an exemplary view showing a state that each board is mounted in the chassis in a slot manner.
본 발명이 적용되는 ATCA 플랫폼 장치는, 도 3에 도시된 바와 같이, ATCA 플랫폼 장치 내에서 패킷전달에 필요한 라우팅 정보, 각종 상태 정보, ATCA 플랫폼 장치의 전반적인 제어 기능을 수행하는 섀시 관리부(110), 다수의 서비스 보드들 간에 고속의 패킷 교환을 수행하는 스위치 보드(120), 네트워크로부터 수신되는 IP 패킷에 대하여 전달 경로를 결정하고 패킷 헤더를 변경하여 상기 스위치 보드로 전달하며, 역으로 상기 스위치 보드로부터 수신된 패킷에 대하여 패킷을 재조립하고 해당 패킷의 전송을 위한 패킷 트래픽에 대한 제어를 수행하여 네트워크 측으로 전달하는 다수의 서비스 보드(130-1 내지 130-m, 140-1 내지 140-n) 및 스위치 보드의 탈장(Eject)/실장(Insert) 여부를 감지하여 섀시 관리부로 전송하기 위한 감지부(150)를 포함한다. 여기서, 상기 섀시 관리부(110) 및 스위치 보드(120)는 이중 구조로 이루어질 수 있다. 즉, 이중 구조의 섀시 관리부 또는 스위치 보드에 있어서, 어느 하나의 섀시 관리부 또는 스위치 보드가 활성화(active)되어 사용되고 있다면, 다른 하나의 섀시 관리부 또는 스위치 보드는 활성화 상태의 스위치 보드가 정상동작할 수 없는 경우 대체되어 동작할 수 있도록 대기(standby)상태로 섀 시(160)의 슬롯(161)에 연결되어 있다. 또한, 서비스 보드들은 스위치 보드를 경계로 하여 제1 서비스 보드부(130)와 제2 서비스 보드부(140)로 구분될 수 있으며, 각각의 서비스 보드부에는 다수의 서비스 보드들이 구비되어 있다.ATCA platform device to which the present invention is applied, as shown in Figure 3, the
스위치 보드(120)는 다수의 서비스 보드들 간에 고속의 패킷 스위칭 기능을 수행하며, 활성화/비활성화(active/stand-by)의 이중화 구조로 구성된다. 스위치 보드는 일반적으로 프로그램 업로드가 어렵기 때문에, 도 4에 도시된 바와 같은 섀시(160)의 슬롯(161)에 장착된 상태에서 사용 중에 프로그램 업로드가 필요한 경우에는, 섀시로부터 탈장(Eject)된 후 새로운 스위치 보드로 교체된다. 한편, 스위치 보드는 지능형 플랫폼 관리 버스(IPMB : Intelligent Platform Management Bus)를 통해 섀시 관리부와 통신을 수행함으로써, 스위치 보드의 장애 발생 정보를 섀시 관리부로 전송할 수 있다. 이하에서는, 제1 스위치 보드(120-1)가 활성화되어 있고, 제2 스위치 보드(120-2)가 비활성화되어 있는 것으로 설명된다. The
서비스 보드(130-1 내지 130-m, 140-1 내지 140-n)는 외부로부터 수신되는 IP 패킷에 대하여 전달 경로를 결정하고 패킷 헤더 변경 기능을 수행하여 스위치 보드로 전달하며, 스위치 보드로부터 수신된 패킷에 대하여 패킷의 재조립 기능과 패킷 트래픽에 대한 제어 기능을 가진다. 한편, 서비스 보드는 지능형 플랫폼 관리 인터페이스(IPMI : Intelligent Platform Management Interface)를 통해 섀시 관리부와 통신을 수행함으로써, 스위치 보드의 탈장, OS의 셧다운, 부하발생 등과 같은 장애 발생 정보를 제공받을 수 있다. 또한, 서비스 보드는 도 4에 도시된 바와 같은 섀시(160)의 슬롯(161)에 장착된 상태로 프로그램 업로드가 가능하기 때문에, 일단 슬롯(161)에 장착되면 특별한 경우를 제외하고는, 섀시로부터 탈장(Eject)되지 않는다.The service boards 130-1 to 130-m and 140-1 to 140-n determine the forwarding path for IP packets received from the outside, perform packet header change functions, and transfer them to the switch board, and receive them from the switch board. It has a packet reassembly function and a control function for packet traffic. On the other hand, the service board communicates with the chassis management unit through an Intelligent Platform Management Interface (IPMI), thereby providing failure occurrence information such as switch board shutdown, OS shutdown, and load generation. In addition, since the service board is capable of uploading a program while being mounted in the
섀시 관리부(110)는 장치 내부에서 패킷 전달에 필요한 라우팅 정보, 각종 상태 정보 및 장치 내부의 전반적인 제어 기능을 수행하며 활성화/비활성화(active/stand-by)의 이중화 구조로 구성된다. 또한, 섀시 관리부는 서비스 보드 또는 스위치 보드들 각각의 장착 여부 및 동작상태를 확인하고, 파워 온/오프 상태를 제어하는 역할을 수행할 수도 있다. 즉, 섀시 관리부는 장치의 전반적인 기능을 관리하는 것으로서, 도면에 도시되어 있지는 않지만 사용자에 의해 모니터링되고 있는 관리 시스템으로, 장치의 전반적인 동작 상태 정보를 제공하는 기능을 수행할 수도 있다. 한편, 섀시 관리부는 상기한 바와 같이, IPMB 및 IPMI를 이용하여 스위치 보드 및 서비스 보드와 통신을 수행할 수 있다. 즉, IPMB 인터페이스는 섀시(160) 내부의 모든 슬롯에 대해 직렬로 연결되어, 각 보드의 상태 정보, 센서 값 및 파워 온/오프를 관리하는 기능을 수행하고 있다. 이하에서는, 제1 섀시 관리부(110-1)가 활성화되어 있고, 제2 섀시 관리부(110-2)가 비활성화(대기상태)되어 있는 것으로 설명된다.The
감지부(150)는 스위치 보드의 탈장(Eject)/실장(Insert) 여부를 감지하여 섀시 관리부로 전송하기 위한 것으로서, 도 4에 도시된 바와 같이, 슬롯의 래치(Latch)를 이용하여 구성될 수도 있다. 즉, 사용자가 제1 스위치 보드의 교환을 위해 슬롯의 래치(150)를 해제시키게 되면, 래치의 해제 정보가 IPMB를 통해 섀시 관리부로 전송되고, 섀시 관리부는 상기 해제 정보를 IPMI를 통해 서비스 보드로 전송하게 되며, 상기 해제 정보를 수신한 서비스 보드는 통신 포트를 제1 스위치 보드로부터 제2 스위치 보드로 변경하게 된다. 즉, 래치(150)가 해제되었다는 것은 제1 스위치 보드가 탈장될 수 있다는 것을 의미하므로, 서비스 보드는 원활한 통신 수행을 위해 스위치 보드를 변경하게 된다. 한편, 감지부는 상기한 바와 같은 래치뿐만 아니라, 슬롯 내부에서의 스위치 보드의 이동을 감지할 수 있는 센서로 구성될 수도 있다. 즉, 감지부는 스위치 보드의 탈장/실장을 감지할 수 있는 다양한 형태로 구성될 수 있다.The
한편, 도 4는 본 발명에 따른 스위치 보드 변경 방법이 적용되는 ATCA 플랫폼 장치의 사용 상태를 나타낸 예시도로서, ATCA 플랫폼 장치를 구성하는 보드 형태의 각 구성요소들이 슬롯(161) 형태의 섀시(160)에 탑재되어 있는 상태를 나타낸 예시도이다. On the other hand, Figure 4 is an exemplary view showing a state of use of the ATCA platform device to which the switch board change method according to the present invention is applied, each component of the board form constituting the ATCA
섀시(160)는 중앙에 위치하는 스위치 슬롯과, 상기 스위치 슬롯의 양옆에 형성되는 노드 슬롯으로 구성된다.The
여기서, 스위치 슬롯에는 이중화된 스위치 보드(120)가 장착되며, 노드 슬롯에는 이중화된 섀시 관리부(110) 및 다수의 스위치 보드(130, 140)가 장착된다.Here, a
한편, 도 4에서는 섀시 관리부가 스위치 보드와 같은 형태로 슬롯에 삽입되어 있는 것으로 도시되어 있으나, 섀시 관리부는 슬롯 상단에 수평방향으로 놓여질 수도 있다. Meanwhile, in FIG. 4, the chassis manager is inserted into the slot in the form of a switch board, but the chassis manager may be placed in the horizontal direction at the top of the slot.
또한, 보다 크고 복잡한 ATCA 플랫폼 장치인 경우에는, 도 4에 도시된 바와 같은 섀시가 이중으로 겹쳐져 이용될 수도 있는데, 이 경우, 상단의 섀시를 셀프 1(Shelf1), 하단의 섀시를 셀프2(Shelf2)라고 할 수 있다. 이때, 섀시 관리부(CMM : Chassis Management Module)는 셀프1에 배치될 수 있는데, 두 개의 셀프를 관리하고 있기 때문에 셀프 메니저라고도 할 수 있다.In addition, in the case of a larger and more complex ATCA platform device, the chassis as shown in FIG. 4 may be overlapped and used. In this case, the upper chassis is self 1 (Shelf1) and the lower chassis is self2 (Shelf2). It can be said. At this time, the Chassis Management Module (CMM) may be disposed on the
도 5는 본 발명에 따른 스위치 보드 변경 방법의 일실시예 흐름도이다.5 is a flowchart illustrating one embodiment of a method for changing a switch board according to the present invention.
상기한 바와 같이 본 발명이 적용되는 ATCA 플랫폼 장치는 다수의 보드로 구성될 수 있으며, 이 보드들은 도 4에 도시된 바와 같은 섀시(Chassis)(160)의 슬롯(161)에 장착되고, 섀시 관리부에 의해서 제어를 받는다.As described above, the ATCA platform apparatus to which the present invention is applied may be composed of a plurality of boards, which are mounted in the
한편, 모든 보드에서 발생하는 HW, OS 등의 장애 정보와 탈/실장 정보는 IPMB를 통해서 제1 섀시 관리부(이하, 간단히 '섀시 관리부'라 함)에 통보되고, 섀시 관리부는 수집된 섀시 전체의 관리 정보를 가지고 있을 뿐만 아니라 관리 정보를 필요로 하는 보드에게 정보를 공유시켜 주는데, 이때 사용되는 논리적 통신 채널(인터페이스)이 IPMI이다. 즉, 섀시 관리부는 실시간으로 수집한 각 보드의 장애 정보를 IPMI 인터페이스를 통해서 모든 보드에 전달할 수 있다.On the other hand, fault information such as HW, OS, etc. occurring in all boards and detach / mounting information are notified to the first chassis management unit (hereinafter, simply referred to as 'chassis management unit') through IPMB, and the chassis management unit of the collected chassis is In addition to having management information, it also shares information to boards that require management information. The logical communication channel (interface) used is IPMI. In other words, the chassis manager can transmit fault information of each board collected in real time to all boards through the IPMI interface.
상기한 바와 같은 구성 및 기능을 포함하는 ATCA 플랫폼 장치에서 본 발명에 따른 스위치 보드 변경 방법이 구현되는 과정을 설명하면 다음과 같다. A process of implementing the switchboard changing method according to the present invention in an ATCA platform device including the configuration and function as described above is as follows.
ATCA 플랫폼 장치가 특별한 장애 없이 일반적으로 구동되고 있는 경우, 도 3에 도시된 바와 같이, 제1 서비스 보드부(130)의 제m 서비스 보드(130-m)가 제2 서비스 보드부(140)의 제n 서비스 보드(140-n)와 통신할 때, 제1 스위치 보드를 경유하여 IP 통신을 수행한다(502). 즉, 각 서비스 보드들은 활성화 상태인 제1 스위치 보드를 통해 패킷을 교환하고 있으며, 제2 스위치 보드는 제1 스위치 보드를 보조 하기 위하여 비활성 상태로 대기하고 있다. When the ATCA platform device is generally driven without any special obstacles, as shown in FIG. 3, the m-th service board 130-m of the first
제1 스위치 보드를 경유하여 각 서비스 보드 간의 통신이 이루어지는 상태에서, 각 서비스 보드는 섀시 관리부로부터 IPMI 이벤트 메시지(또는 SNMP Trap 메시지)가 수신되면(504), 상기 메시지가 제1 스위치 보드와 관련된 메시지인지의 여부를 판단한다(506). 즉, 상기한 바와 같이 섀시 관리부는 IPMB를 통해 섀시(160) 전체의 관리 정보를 수집하는 기능을 수행하는 것으로서, 제1 스위치 보드의 탈장 또는 이동정보 역시 IPMB를 통해 제1 스위치 보드로부터 전송받는 한편, 전송된 제1 스위치 보드의 탈장 또는 이동정보를 가공하여 IPMI를 통해 모든 서비스 보드들에게 전달하고 있는바, 각 서비스 보드는 우선 IPMI를 통해 전송된 메시지가 제1 스위치 보드와 관련된 것인지를 판단하게 된다.In a state where communication is performed between each service board via the first switch board, when each service board receives an IPMI event message (or an SNMP trap message) from the chassis management unit (504), the message is a message related to the first switch board. It is determined whether or not (506). That is, as described above, the chassis manager performs a function of collecting the management information of the
상기 관련 여부 판단결과(506), 제1 스위치 보드와 관련된 메시지가 아니라면, 각 서비스 보드들은 제1 스위치 보드를 경유한 통신을 지속적으로 수행하게 된다(502).If it is determined that the
상기 관련 여부 판단결과(506), 제1 스위치 보드와 관련된 메시지가 아니라면, 각 서비스 보드들은 상기 메시지가 제1 스위치 보드의 탈장(Eject)과 관련된 메시지인지의 여부를 판단한다(508). 즉, 상기한 바와 같이 제1 스위치 보드가 실장되는 섀시의 슬롯에는 래치(Latch) 또는 센서 등이 구비되어 있어서 제1 스위치 보드의 탈장을 위해 래치가 해제되거나 또는 제1 스위치 보드가 외부로 탈장되기 위해 슬롯 내부에서 이동되면, 탈장 또는 이동정보가 IPMB를 통해 섀시 관리부로 전송된다. 이때, 섀시 관리부는 IPMI를 통해 상기 정보를 가공하여 각 서비스 보드 들로 전송해 주게 된다. 따라서, 각 서비스 보드들은 IPMI를 통해 수신된 메시지가 제1 스위치 보드의 탈장 또는 이동정보인지의 여부를 판단한다.If it is determined that the
상기 탈장 또는 이동정보 여부 판단결과(508), 제1 스위치 보드의 탈장 또는 이동정보와 관련된 메시지가 아니라면, 각 서비스 보드들은 상기 메시지가 제1 스위치 보드의 오에스(OS : Operating System)의 셧다운(Shutdown)과 관련된 메시지인지의 여부를 판단한다(510). 즉, 본 발명이 각 서비스 보드 간의 패킷 교환용으로 이용되고 있는 제1 스위치 보드를 제2 스위치 보드로 변경하는 경우는, 상기한 바와 같이 제1 스위치 보드가 섀시로부터 탈장되는 경우뿐만 아니라, 제1 스위치 보드의 OS가 셧다운 되어 제1 스위치 보드가 정상적인 동작을 수행하지 못하는 경우도 포함하고 있다. 따라서, 각 서비스 보드들은 상기 메시지가, 제1 스위치 보드의 탈장과 관련된 정보가 아니라면, 제1 스위치 보드가 정상적인 동작을 수행하지 못한다는 셧다운 메시지인지의 여부를 판단하게 된다. 한편, 본 발명이 적용되는 ATCA 플랫폼 장치는, 제1 스위치 보드의 셧다운 정보가 IPMB를 통해 섀시 관리부로 전송되면, 섀시 관리부가 각 서비스 보드들로 상기 셧다운 정보를 전송할 수 있도록 구성되어 있다.If the determination result of the hernia or
상기 셧다운 정보 여부 판단결과(510), 제1 스위치 보드의 셧다운과 관련된 메시지가 아니라면, 각 서비스 보드들은 상기 메시지가 제1 스위치 보드의 네트워크 부하와 관련된 메시지인지의 여부를 판단한다(512). 즉, 본 발명은 제1 스위치 보드가 부하로 인해 정상적인 동작 수행이 불가능하다고 판단되는 경우에도 제1 스위치 보드를 제2 스위치 보드로 변경하도록 하고 있는바, 각 스위치 보드들은 상기 메시지가, 제1 스위치 보드의 탈장 또는 셧다운과 관련되어 있지 않은 경우에는 최종적으로, 네트워크 부하와 관련된 것인지의 여부를 판단하게 된다. 네트워크 부하와 관련된 정보 역시 상기한 과정을 통해 섀시 관리부로부터 각 서비스 보드들로 전송된다.As a result of determining whether the shutdown information is 510, if the message is not related to the shutdown of the first switch board, each service board determines whether the message is a message related to the network load of the first switch board (512). That is, the present invention allows the first switch board to be changed to the second switch board even when it is determined that the first switch board cannot perform normal operation due to the load. If it is not related to the board's dismounting or shutdown, then it is finally determined whether it is related to network load. Information related to the network load is also transmitted from the chassis manager to each service board through the above process.
상기 부하관련 여부 판단결과(512), 제1 스위치 보드의 부하와 관련된 메시지가 아니라면, 각 서비스 보드들은 제1 스위치 보드를 경유한 통신을 지속적으로 수행하게 된다(502).As a result of determining whether the load is related (512), if it is not a message related to the load of the first switch board, each service board continuously performs communication via the first switch board (502).
한편, 상기 탈장 또는 이동정보 여부 판단결과 제1 스위치의 탈장 또는 이동정보와 관련된 메시지이거나(508), 상기 셧다운정보 여부 판단결과 제1 스위치의 셧다운과 관련된 메시지이거나(510), 상기 부하관련 여부 판단결과 제1 스위치의 부하와 관련된 메시지인 경우(512), 각 서비스 보드들은 섀시 관리부로부터 전송되는 정보들을 통해 제2 스위치 보드가 사용 가능 상태인지의 여부를 판단하게 된다(514). 즉, 섀시 관리부는 활성화 상태에 있는 제1 스위치 보드의 각종 정보를 모든 서비스 보드들로 전송할 뿐만 아니라, 비활성화 상태에서 대기 모드로 있는 제2 스위치 보드에 대한 정보도 수집하여 모든 서비스 보드들로 전송하게 된다. 제2 스위치 보드가 실장된 섀시의 슬롯에도 상기한 바와 같은 래치 또는 센서로 구성된 감지부가 구비되어 있기 때문에, 섀시 관리부는 제2 스위치의 실장여부를 감지할 수 있으며, OS의 정상 동작 여부 등도 감지할 수 있다. 한편, 상기에서는 각 서비스 보드들이 섀시 관리부로부터 전송되는 정보들을 통해 제2 스위치 보드가 사용 가능 상태인지의 여부를 판단하고 있으나 또 다른 방법이 적용될 수도 있다. 즉, 각 서비스 보드들이, 제2 스위치 보드가 사용 가능 상태인지의 여부를 IPMI 또는 SNMP Get 메시지를 이용하여 섀시 관리부로 질의한 후, 섀시 관리부로부터 그에 대한 응답 메시지를 전송받아 확인하는 방법이 적용될 수도 있다.Meanwhile, as a result of determining whether the hernia or movement information is determined as a message related to a hernia or movement information of the first switch (508), or as a result of determining whether the shutdown information is determined as a message related to shutdown of the first switch (510) or determining whether the load is related As a result of the message related to the load of the first switch (512), each service board determines whether the second switch board is in an available state through information transmitted from the chassis manager (514). That is, the chassis manager not only transmits the various information of the first switch board in the activated state to all the service boards, but also collects and transmits the information about the second switch board in the standby mode in the inactive state to all the service boards. do. Since the slot of the chassis in which the second switch board is mounted is provided with the sensing unit configured as the latch or the sensor as described above, the chassis manager can detect whether the second switch is mounted and also detect whether the OS is operating normally. Can be. Meanwhile, in the above, the service boards determine whether the second switch board is in a usable state through information transmitted from the chassis manager, but another method may be applied. That is, each service board may inquire whether the second switch board is available or not by using the IPMI or SNMP Get message to the chassis management unit, and then receive and confirm a response message from the chassis management unit. have.
상기 제2 스위치 보드 사용 상태 판단결과(514), 제2 스위치 보드가 사용가능한 상태인 경우, 각 서비스 보드들은 통신 포트를 제1 스위치 보드에서 제2 스위치 보드로 변경하여, 타 스위치 보드들과의 통신을 수행하게 된다. 즉, 본 발명은 각 서비스 보드들이 제1 스위치 보드의 장애 발생 정보를 섀시 관리부로부터 직접 수신한 후 직접 제2 스위치 보드로 통신 포트를 변경하도록 함으로써, 네트워크를 통한 서비스 제공이 중단없이 이루어지도록 한다는 특징을 가지고 있다.As a result of determining the use state of the
상기 제2 스위치 보드 사용 상태 판단결과(514), 제2 스위치 보드가 사용 가능한 상태가 아닌 경우, 각 서비스 보드들은 제2 스위치의 장애 발생 정보를 섀시 관리부로 전송하게 되며, 장애 발생 정보를 수신한 섀시 관리부는 장애 발생 정보를 모니터링 시스템으로 전송함으로써, 관리자가 직접 제2 스위치 보드의 상태를 체크해보도록 할 수 있다. 그러나, 제2 스위치 보드에 대한 상태는 상기한 바와 같이 섀시 관리부에서 수시로 모니터링되고 있으며, 모니터링 결과 제2 스위치 보드에 장애(탈장, OS 셧다운, 파워 오프 등)가 발생된 경우에는, 섀시 관리부가 자체적으로 모니터링 시스템으로 장애 정보를 전송할 수 있기 때문에, 상기한 바와 같은 과정(514, 518)은 생략될 수 있다. 즉, 본 발명은 제1 스위치 보드와 관련된 상기 각 판단결과(508, 510, 512), 제1 스위치의 탈장, 셧다운 또는 부하와 관련된 메시지인 경우, 각 서비스 보드들이 별도의 판단 과정 없이 바로 통신 포트를 제1 스위치 보드에서 제2 스위치 보드로 변경하여, 타 스위치 보드들과 통신을 수행하도록 할 수도 있다. As a result of determining the use state of the
한편, 상기에서는 본 발명이 제1 스위치 보드의 탈장, 셧다운, 부하 여부를 순차적으로 판단하는 것으로 설명되어져 있으나, 본 발명이 이에 한정되는 것은 아니다. 따라서, 본 발명은 상기 세 개의 판단 과정 중 적어도 어느 하나를 수행하도록 구성될 수도 잇다.Meanwhile, although the present invention has been described as sequentially determining whether the first switch board is hermetic, shutdown, or loaded, the present invention is not limited thereto. Accordingly, the present invention may be configured to perform at least one of the three determination processes.
이상 설명한 내용을 통해 당업자라면 본 발명의 기술사상을 일탈하지 아니하는 범위에서 다양한 변경 및 수정이 가능함을 알 수 있을 것이다. 따라서, 본 발명의 기술적 범위는 명세서의 상세한 설명에 기재된 내용으로 한정되는 것이 아니라 특허 청구의 범위에 의해 정하여 져야만 할 것이다.Those skilled in the art will appreciate that various changes and modifications can be made without departing from the technical spirit of the present invention. Therefore, the technical scope of the present invention should not be limited to the contents described in the detailed description of the specification but should be defined by the claims.
도 1은 일반적인 ATCA 플랫폼 장치의 구조를 블럭도로 나타낸 예시도. 1 is a block diagram showing the structure of a general ATCA platform device.
도 2는 종래의 스위치 보드 변경 방법의 일실시예 흐름도.Figure 2 is a flow diagram of one embodiment of a conventional switch board change method.
도 3은 본 발명이 적용되는 ATCA 플랫폼 장치의 구조를 블럭도로 나타낸 예시도.Figure 3 is an exemplary diagram showing a structure of an ATCA platform device to which the present invention is applied.
도 4는 본 발명에 따른 스위치 보드 변경 방법이 적용되는 ATCA 플랫폼 장치의 사용 상태를 나타낸 예시도.4 is an exemplary view showing a state of use of the ATCA platform device to which the switch board change method according to the present invention is applied.
도 5는 본 발명에 따른 스위치 보드 변경 방법의 일실시예 흐름도.5 is a flowchart illustrating one embodiment of a method for changing a switch board according to the present invention;
<도면의 주요 부호에 대한 설명><Description of Major Symbols in Drawing>
110 : 섀시 관리부 120 : 스위치 보드110: chassis management unit 120: switch board
130 : 제1 서비스 보드부 140 : 제2 서비스 보드부130: first service board unit 140: second service board unit
130-1 내지 130-m, 140-1 내지 140-n : 서비스 보드130-1 to 130-m, 140-1 to 140-n: service board
150 : 감지부 160 : 섀시150: detection unit 160: chassis
161 : 슬롯161: slot
Claims (8)
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020080000233A KR100950555B1 (en) | 2008-01-02 | 2008-01-02 | Method of changing a switch board |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020080000233A KR100950555B1 (en) | 2008-01-02 | 2008-01-02 | Method of changing a switch board |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20090074447A true KR20090074447A (en) | 2009-07-07 |
KR100950555B1 KR100950555B1 (en) | 2010-03-31 |
Family
ID=41331732
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020080000233A KR100950555B1 (en) | 2008-01-02 | 2008-01-02 | Method of changing a switch board |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR100950555B1 (en) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103687028A (en) * | 2013-12-30 | 2014-03-26 | 大唐移动通信设备有限公司 | Source alive-keeping method and resource releasing method |
KR20180071941A (en) * | 2016-12-20 | 2018-06-28 | 삼성전자주식회사 | A management controller and an operating method of chassis comprising the management controller |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100655599B1 (en) | 2005-11-04 | 2006-12-08 | 한국전자통신연구원 | Atca platform apparatus for supporting 20gbps packet switching bandwidth per node |
KR100694297B1 (en) | 2005-11-10 | 2007-03-14 | 한국전자통신연구원 | Providing apparatus of shelf manager for duplicating the ethernet port in the atca system |
KR100850351B1 (en) * | 2005-12-07 | 2008-08-04 | 한국전자통신연구원 | Method for providing a redundant structure of ATCA system through base interface |
US7706259B2 (en) | 2005-12-07 | 2010-04-27 | Electronics And Telecommunications Research Institute | Method for implementing redundant structure of ATCA (advanced telecom computing architecture) system via base interface and the ATCA system for use in the same |
-
2008
- 2008-01-02 KR KR1020080000233A patent/KR100950555B1/en not_active IP Right Cessation
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103687028A (en) * | 2013-12-30 | 2014-03-26 | 大唐移动通信设备有限公司 | Source alive-keeping method and resource releasing method |
KR20180071941A (en) * | 2016-12-20 | 2018-06-28 | 삼성전자주식회사 | A management controller and an operating method of chassis comprising the management controller |
Also Published As
Publication number | Publication date |
---|---|
KR100950555B1 (en) | 2010-03-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20030137934A1 (en) | System and method for providing management of fabric links for a network element | |
US7827442B2 (en) | Shelf management controller with hardware/software implemented dual redundant configuration | |
US20050058063A1 (en) | Method and system supporting real-time fail-over of network switches | |
CN102299846B (en) | Method for transmitting BFD (Bidirectional Forwarding Detection) message and equipment | |
CN101207408A (en) | Apparatus and method of synthesis fault detection for main-spare taking turns | |
JP2002368769A (en) | Loop network and its operating method | |
CN100362481C (en) | Main-standby protection method for multi-processor device units | |
CN103428114A (en) | ATCA (advanced telecom computing architecture) 10-gigabit switching board and system | |
WO2011137797A1 (en) | Method and system for data transmission in ethernet | |
CN101488101A (en) | CPCI redundancy stand-by system | |
US10298520B2 (en) | Relay apparatus | |
CN102026042A (en) | Keep-alive and self-healing method and device for advanced telecom computing architecture control surface | |
KR100950555B1 (en) | Method of changing a switch board | |
US7103504B1 (en) | Method and system for monitoring events in storage area networks | |
CN111628944B (en) | Switch and switch system | |
CN116340058A (en) | Master-slave switching method and device | |
KR100690042B1 (en) | The embodiment of ip interface pyh level duplication in ip based using dual active device | |
KR100617306B1 (en) | Apparatus for Duplication Control Using Base Interface in ATCA Platform and Method Therefor | |
CN101410808A (en) | Method of latent fault checking a management network | |
CN111880999B (en) | High-availability monitoring management device for high-density blade server and redundancy switching method | |
JP2010245589A (en) | Communication system, communication device, method for specifying suspect portion, and program | |
JP5176914B2 (en) | Transmission device and system switching method for redundant configuration unit | |
KR100895463B1 (en) | Method and apparatus for controlling duplicated control module in ATCA platform and ATCA system using the same | |
JP2007214796A (en) | Atm network system, and obstacle excluding method | |
JP4779948B2 (en) | Server system |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
AMND | Amendment | ||
E601 | Decision to refuse application | ||
AMND | Amendment | ||
J201 | Request for trial against refusal decision | ||
B701 | Decision to grant | ||
GRNT | Written decision to grant | ||
LAPS | Lapse due to unpaid annual fee |