KR100950555B1 - 스위치 보드 변경 방법 - Google Patents

스위치 보드 변경 방법 Download PDF

Info

Publication number
KR100950555B1
KR100950555B1 KR1020080000233A KR20080000233A KR100950555B1 KR 100950555 B1 KR100950555 B1 KR 100950555B1 KR 1020080000233 A KR1020080000233 A KR 1020080000233A KR 20080000233 A KR20080000233 A KR 20080000233A KR 100950555 B1 KR100950555 B1 KR 100950555B1
Authority
KR
South Korea
Prior art keywords
switch board
message
board
switch
service
Prior art date
Application number
KR1020080000233A
Other languages
English (en)
Other versions
KR20090074447A (ko
Inventor
정보영
Original Assignee
텔코웨어 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 텔코웨어 주식회사 filed Critical 텔코웨어 주식회사
Priority to KR1020080000233A priority Critical patent/KR100950555B1/ko
Publication of KR20090074447A publication Critical patent/KR20090074447A/ko
Application granted granted Critical
Publication of KR100950555B1 publication Critical patent/KR100950555B1/ko

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04QSELECTING
    • H04Q1/00Details of selecting apparatus or arrangements
    • H04Q1/18Electrical details
    • H04Q1/30Signalling arrangements; Manipulation of signalling currents
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04QSELECTING
    • H04Q1/00Details of selecting apparatus or arrangements
    • H04Q1/18Electrical details
    • H04Q1/20Testing circuits or apparatus; Circuits or apparatus for detecting, indicating, or signalling faults or troubles

Abstract

본 발명은 ATCA 플랫폼 장치의 스위치 보드를 변경하는 방법에 관한 것으로서, 본 발명의 목적은, 스위치 보드의 장애 발생 신호를 수신한 섀시 관리부가, 서비스 보드로 상기 장애 발생 신호를 전송하면, 서비스 보드가 스위치 보드를 변경하여 통신을 수행하도록 할 수 있는, 스위치 보드 변경 방법을 제공하는 것이다. 이를 위해 본 발명은, 섀시 관리부, 다수의 서비스 보드, 제1 스위치 보드, 제2 스위치 보드를 포함하는 ATCA 플랫폼 장치에 적용되는 스위치 보드 변경 방법에 있어서, 서비스 보드들 각각이, 섀시 관리부로부터 전송된 메시지를 수신한 경우, 메시지가 제1 스위치 보드와 관련된 메시지인지의 여부를 판단하는 단계; 상기 판단결과, 상기 메시지가 제1 스위치 보드와 관련된 메시지가 아닌 경우, 각 서비스 보드들이 제1 스위치 보드를 경유한 통신을 지속적으로 수행하는 단계; 및 상기 판단결과, 상기 메시지가 제1 스위치 보드와 관련된 메시지인 경우, 각 서비스 보드들이, 상기 메시지가 제1 스위치 보드의 장애와 관련된 것인지의 여부를 판단하여, 제1 스위치 보드를 경유한 통신을 지속적으로 이용할 것인지 또는 제2 스위치 보드를 경유한 통신으로 변경할 것인지를 결정하는 단계를 포함한다.
ATCA, 스위치 보드, IPMI, IPMB

Description

스위치 보드 변경 방법{METHOD OF CHANGING A SWITCH BOARD}
본 발명은 ATCA 플랫폼 장치에 관한 것으로서, 특히, ATCA 플랫폼 장치의 스위치 보드를 변경하는 방법에 관한 것이다.
일반적으로 네트워크 장비 업체들은 각각 다양한 네트워크 장비들을 출시하고 있기 때문에, 통신 사업자들의 입장에서는 다양한 제품을 관리하는데 따른 복잡성과 관리비용 증가라는 문제가 발생하고 있다.
이러한 문제점을 극복하고자 통신 업계는, 컴퓨터 업계가 표준화를 통해 상호 호환성을 증가시킴으로써 수직 계열화된 공급체계를 수평적 협력 모델로 전환하여 효율성을 극대화한 방법을 도입하고 있는데, 이를 위한 대표적인 예가 전세계적으로 40개 이상의 회사들이 표준화에 참여하고 있는 ATCA(Advanced Telecom Computing Architecture)(이하, 간단히 'ATCA'라 함) 플랫폼이다. 이러한 ATCA 플랫폼은 재사용이 가능한 섀시, 보드, 스위치, CPU, 프로그래밍이 가능한 네트워크 프로세서들을 사용함으로써, 장비 제조업체들이 표준에 근거한 제품들을 대량으로 생산할 수 있도록 하고 있다.
즉, ATCA 플랫폼은 PICMG(PCI Industrial Computer Manufacturers Group)의 표준화된 규격에 따라 네트워크 시스템을 설계할 수 있도록 함으로써, 네크워크 시스템 개발에 있어서의 기간단축과 경제성을 실현할 수 있게 하고 있다.
이러한 ATCA 플랫폼에서, 스위치 보드와 다수의 서비스 보드들 간에는 패킷 전달을 위한 패브릭 인터페이스 규격이 정의되어 있으며, 이러한 패브릭 인터페이스 규격은 스위치 보드를 중심으로 스타 토폴로지, 듀얼 스타 토폴로지, 풀 메쉬 토폴로지 등의 토폴로지들이 정의되고 있다.
도 1은 일반적인 ATCA 플랫폼 장치의 구조를 블럭도로 나타낸 예시도이다.
상기한 바와 같은 ATCA 플랫폼을 이용한 ATCA 플랫폼 장치는, 도 1에 도시된 바와 같이, 섀시 관리부(메인 프로세서 장치라고도 함)(이하, 간단히 '섀시 관리부'라 함)(10), 스위치 보드(패킷 스위치 장치라고도 함)(이하, 간단히 '스위치 보드'라 함)(20) 및 다수의 서비스 보드(패킷처리장치, 사용자 정합 보드, 패킷 처리부, I/O 장치라고도 함)(이하, 간단히 '서비스 보드'라 함)(30-1 내지 30-m, 40-1 내지 40-n)를 포함한다. 여기서, 상기 섀시 관리부 및 스위치 보드는 이중 구조(10-1, 10-2, 20-1, 20-2)로 이루어질 수 있다. 또한, 서비스 보드들은 스위치 보드를 경계로 하여 제1 서비스 보드부(30)와 제2 서비스 보드부(40)로 구분될 수 있으며, 각각의 서비스 보드부에는 다수의 서비스 보드들이 구비되어 있다.
한편, 상기한 바와 같은 ATCA 플랫폼 장치에서, 서비스 보드 간 통신은 ICMP 패킷을 이용한 IP Bonding(또는 Link Aggregation)이라는 기술로 이중화되어 있다. 그러나, IP Bonding으로 구현된 포트 이중화 방법은 스위치 보드의 장애를 감지하여 포트를 변경하는 시간이 길다는 문제점이 있다. 즉, ATCA 플랫폼 장치의 특성상 섀시에 장착된 모든 보드들은 쉽게 탈장(Eject)/실장(Insert, Mount)될 수 있는데, 이러한 구조는, 하드웨어 측면에서 보면 확장성이 용이하다는 장점이 있지만, 서비스 가용성 측면에서 보면 보드(Blaede)의 탈/실장으로 인해 서비스의 중지 시간(Service down time)이 길어진다(Low available)는 문제점이 있다.
특히, 모든 서비스 보드에 대해서 IP 통신의 매개자 역할을 하는 스위치 보드의 탈장은 서비스 측면에서 보면 큰 타격임에도 불구하고, 상기한 바와 같은 종래의 방법으로는, ATCA 플랫폼 장치의 외관을 형성하는 섀시에서 스위치 보드의 탈/실장 등과 같은 장애 여부를 ICMP 패킷으로 정확히 판단하는 것이 불가능하다는 문제점이 있다.
이하에서는, 서비스 보드들 간의 패킷 교환을 수행하고 있는 제1 스위치 보드의 탈장(Eject) 여부를 판단하여, 제1 스위치 보드를 제2 스위치 보드로 변경하여 서비스 보드들 간의 패킷 교환을 수행하도록 하고 있는 종래의 방법이, 도 1 및 도 2를 참조하여 설명된다.
도 2는 종래의 스위치 보드 변경 방법의 일실시예 흐름도이다.
ATCA 플랫폼 장치가 특별한 장애 없이 일반적으로 구동되고 있는 경우, 도 1에 도시된 바와 같이, 제m 서비스 보드(30-m)가 제n 서비스 보드(40-n)와 통신할 때, 제1 스위치 보드를 경유하여 IP 통신을 수행한다(72).
한편, 제1 스위치 보드가 교체 또는 수리를 위해 탈장(Eject)되거나 또는 제 1 스위치 보드의 OS가 Shutdown되는 경우(74), 제m 서비스 보드와 제n 서비스 보드는 제1 스위치 보드로부터 ICMP 응답 패킷이 오지 않음을 감지하게 된다(76). 즉, 제m 서비스 보드 또는 제n 서비스 보드는 IP 통신의 원활한 수행여부를 확인하기 위해 제1 스위치 보드로부터 ICMP 응답 패킷을 수신하게 되는데, 제1 스위치 보드가 탈장되거나 기타 장애가 발생된 경우에는 상기와 같은 ICMP 응답 패킷이 제1 스위치 보드로부터 전송되지 않게 되므로, 서비스 보드는 소정의 시간이 경과되면 ICMP 응답 패킷이 수신되지 않은 것으로 확정하게 된다. 이때, 서비스 보드가 상기와 같은 ICMP 응답 패킷이 수신되지 않음을 확정하는 대기 시간은 각 시스템마다 다르게 설정될 수 있으나, 시스템 자체의 부하 등을 고려하여 일반적으로 패킷 전송 후 10초 정도의 시간으로 설정되고 있다.
상기한 바와 같이, 기 설정된 대기 시간이 경과하여도 ICMP 응답 패킷이 수신되지 않은 경우(76), 제m 서비스 보드와 제n 서비스 보드는 제2 스위치 보드를 통하여 통신하기로 결정하고, 내부의 통신 포트를 제2 스위치 보드로 변경한다(78).
그러나, 상기한 바와 같은 종래의 방법은, 제1 스위치 보드의 장애 발생 시 제2 스위치로 통신 포트를 변경하는 시간이 오래 거릴 뿐만 아니라, 단순히 ICMP 패킷 응답이 없음을 이용하여 스위치 보드를 변경하는 것이므로, 서비스 보드의 탈/실장 및 장애 여부를 정확히 판단하여 통신 포트 변경을 수행할 수 없다는 문제점이 있다.
예를 들어, 실제의 ATCA 플랫폼 장치 운영환경에서는, 스위치 보드를 경유하 는 네트워크 패킷이 많아지면, 서비스 보드간 ICMP 패킷 로스(Packet loss) 현상이 심해지게 되는데, 상기한 바와 같은 종래의 방법은, 단순한 ICMP 패킷 로스 현상을 스위치 보드의 장애로 판단하여 불필요하게 스위치 보드를 변경하게 된다. 즉, 상기한 바와 같은 종래의 방법은, 스위치 보드가 탈장된 것이 아니고, 단지 네트워크 트레픽이 많아져 대기 시간이 경과한 경우에도, 서비스 보드의 입장에서는 스위치 보드가 탈장 또는 장애(fault) 상태인 것으로 여겨 스위치 보드에 대한 변경을 수행하게 되는데, 이런 경우는 스위치 보드를 변경한다고 하더라도 네트워크 상의 근본적인 문제가 해결되지는 않으므로, 불필요한 스위치 보드 변경이 이루어진 것이라고 할 수 있다.
상기와 같은 문제점을 해결하기 위한 본 발명의 목적은, 스위치 보드의 장애 발생 신호를 수신한 섀시 관리부가, 서비스 보드로 상기 장애 발생 신호를 전송하면, 서비스 보드가 스위치 보드를 변경하여 통신을 수행하도록 할 수 있는, 스위치 보드 변경 방법을 제공하는 것이다.
상기 목적을 달성하기 위한 본 발명은, 섀시 관리부, 다수의 서비스 보드, 활성화 상태의 제1 스위치 보드, 비활성화 상태의 제2 스위치 보드를 포함하는 ATCA 플랫폼 장치에 적용되는 스위치 보드 변경 방법에 있어서, 상기 서비스 보드들 각각이, 상기 섀시 관리부로부터 전송된 메시지를 수신한 경우, 상기 메시지가 상기 제1 스위치 보드와 관련된 메시지인지의 여부를 판단하는 단계; 상기 관련 여부 판단결과, 상기 메시지가 상기 제1 스위치 보드와 관련된 메시지가 아닌 경우, 상기 각 서비스 보드들이 상기 제1 스위치 보드를 경유한 통신을 지속적으로 수행하는 단계; 및 상기 관련 여부 판단결과, 상기 메시지가 상기 제1 스위치 보드와 관련된 메시지인 경우, 상기 각 서비스 보드들이, 상기 메시지가 상기 제1 스위치 보드의 장애와 관련된 것인지의 여부를 판단하여, 상기 제1 스위치 보드를 경유한 통신을 지속적으로 이용할 것인지 또는 제2 스위치 보드를 경유한 통신으로 변경할 것인지를 결정하는 단계를 포함한다.
본 발명은 각 서비스 보드들이 제1 스위치 보드의 이상 발생 정보를 섀시 관리부로부터 직접 수신한 후 직접 제2 스위치 보드로 통신 포트를 변경하도록 함으로써, 보다 신속하게 포트 변경이 이루어질 뿐만 아니라, 네트워크를 통한 서비스가 중단없이 이루어지도록 할 수 있다는 우수한 효과가 있다.
또한, 본 발명은 각 서비스 보드들이 제1 스위치 보드의 장애 발생 정보를 섀시 관리부로부터 직접 수신하여 그에 따른 포트 변경을 수행하도록 함으로써, 불필요하게 포트 변경이 이루어지는 것을 방지할 수 있다는 우수한 효과가 있다.
이하, 첨부된 도면을 참조하여 본 발명이 상세히 설명된다.
도 3은 본 발명이 적용되는 ATCA 플랫폼 장치의 구조를 블럭도로 나타낸 예시도이다. 또한, 도 4는 본 발명에 따른 스위치 보드 변경 방법이 적용되는 ATCA 플랫폼 장치의 사용 상태를 나타낸 예시도로서, 각 보드가 슬롯 방식으로 섀시에 탑재되어 있는 상태를 나타낸 예시도이다.
본 발명이 적용되는 ATCA 플랫폼 장치는, 도 3에 도시된 바와 같이, ATCA 플랫폼 장치 내에서 패킷전달에 필요한 라우팅 정보, 각종 상태 정보, ATCA 플랫폼 장치의 전반적인 제어 기능을 수행하는 섀시 관리부(110), 다수의 서비스 보드들 간에 고속의 패킷 교환을 수행하는 스위치 보드(120), 네트워크로부터 수신되는 IP 패킷에 대하여 전달 경로를 결정하고 패킷 헤더를 변경하여 상기 스위치 보드로 전달하며, 역으로 상기 스위치 보드로부터 수신된 패킷에 대하여 패킷을 재조립하고 해당 패킷의 전송을 위한 패킷 트래픽에 대한 제어를 수행하여 네트워크 측으로 전달하는 다수의 서비스 보드(130-1 내지 130-m, 140-1 내지 140-n) 및 스위치 보드의 탈장(Eject)/실장(Insert) 여부를 감지하여 섀시 관리부로 전송하기 위한 감지부(150)를 포함한다. 여기서, 상기 섀시 관리부(110) 및 스위치 보드(120)는 이중 구조로 이루어질 수 있다. 즉, 이중 구조의 섀시 관리부 또는 스위치 보드에 있어서, 어느 하나의 섀시 관리부 또는 스위치 보드가 활성화(active)되어 사용되고 있다면, 다른 하나의 섀시 관리부 또는 스위치 보드는 활성화 상태의 스위치 보드가 정상동작할 수 없는 경우 대체되어 동작할 수 있도록 대기(standby)상태로 섀 시(160)의 슬롯(161)에 연결되어 있다. 또한, 서비스 보드들은 스위치 보드를 경계로 하여 제1 서비스 보드부(130)와 제2 서비스 보드부(140)로 구분될 수 있으며, 각각의 서비스 보드부에는 다수의 서비스 보드들이 구비되어 있다.
스위치 보드(120)는 다수의 서비스 보드들 간에 고속의 패킷 스위칭 기능을 수행하며, 활성화/비활성화(active/stand-by)의 이중화 구조로 구성된다. 스위치 보드는 일반적으로 프로그램 업로드가 어렵기 때문에, 도 4에 도시된 바와 같은 섀시(160)의 슬롯(161)에 장착된 상태에서 사용 중에 프로그램 업로드가 필요한 경우에는, 섀시로부터 탈장(Eject)된 후 새로운 스위치 보드로 교체된다. 한편, 스위치 보드는 지능형 플랫폼 관리 버스(IPMB : Intelligent Platform Management Bus)를 통해 섀시 관리부와 통신을 수행함으로써, 스위치 보드의 장애 발생 정보를 섀시 관리부로 전송할 수 있다. 이하에서는, 제1 스위치 보드(120-1)가 활성화되어 있고, 제2 스위치 보드(120-2)가 비활성화되어 있는 것으로 설명된다.
서비스 보드(130-1 내지 130-m, 140-1 내지 140-n)는 외부로부터 수신되는 IP 패킷에 대하여 전달 경로를 결정하고 패킷 헤더 변경 기능을 수행하여 스위치 보드로 전달하며, 스위치 보드로부터 수신된 패킷에 대하여 패킷의 재조립 기능과 패킷 트래픽에 대한 제어 기능을 가진다. 한편, 서비스 보드는 지능형 플랫폼 관리 인터페이스(IPMI : Intelligent Platform Management Interface)를 통해 섀시 관리부와 통신을 수행함으로써, 스위치 보드의 탈장, OS의 셧다운, 부하발생 등과 같은 장애 발생 정보를 제공받을 수 있다. 또한, 서비스 보드는 도 4에 도시된 바와 같은 섀시(160)의 슬롯(161)에 장착된 상태로 프로그램 업로드가 가능하기 때문에, 일단 슬롯(161)에 장착되면 특별한 경우를 제외하고는, 섀시로부터 탈장(Eject)되지 않는다.
섀시 관리부(110)는 장치 내부에서 패킷 전달에 필요한 라우팅 정보, 각종 상태 정보 및 장치 내부의 전반적인 제어 기능을 수행하며 활성화/비활성화(active/stand-by)의 이중화 구조로 구성된다. 또한, 섀시 관리부는 서비스 보드 또는 스위치 보드들 각각의 장착 여부 및 동작상태를 확인하고, 파워 온/오프 상태를 제어하는 역할을 수행할 수도 있다. 즉, 섀시 관리부는 장치의 전반적인 기능을 관리하는 것으로서, 도면에 도시되어 있지는 않지만 사용자에 의해 모니터링되고 있는 관리 시스템으로, 장치의 전반적인 동작 상태 정보를 제공하는 기능을 수행할 수도 있다. 한편, 섀시 관리부는 상기한 바와 같이, IPMB 및 IPMI를 이용하여 스위치 보드 및 서비스 보드와 통신을 수행할 수 있다. 즉, IPMB 인터페이스는 섀시(160) 내부의 모든 슬롯에 대해 직렬로 연결되어, 각 보드의 상태 정보, 센서 값 및 파워 온/오프를 관리하는 기능을 수행하고 있다. 이하에서는, 제1 섀시 관리부(110-1)가 활성화되어 있고, 제2 섀시 관리부(110-2)가 비활성화(대기상태)되어 있는 것으로 설명된다.
감지부(150)는 스위치 보드의 탈장(Eject)/실장(Insert) 여부를 감지하여 섀시 관리부로 전송하기 위한 것으로서, 도 4에 도시된 바와 같이, 슬롯의 래치(Latch)를 이용하여 구성될 수도 있다. 즉, 사용자가 제1 스위치 보드의 교환을 위해 슬롯의 래치(150)를 해제시키게 되면, 래치의 해제 정보가 IPMB를 통해 섀시 관리부로 전송되고, 섀시 관리부는 상기 해제 정보를 IPMI를 통해 서비스 보드로 전송하게 되며, 상기 해제 정보를 수신한 서비스 보드는 통신 포트를 제1 스위치 보드로부터 제2 스위치 보드로 변경하게 된다. 즉, 래치(150)가 해제되었다는 것은 제1 스위치 보드가 탈장될 수 있다는 것을 의미하므로, 서비스 보드는 원활한 통신 수행을 위해 스위치 보드를 변경하게 된다. 한편, 감지부는 상기한 바와 같은 래치뿐만 아니라, 슬롯 내부에서의 스위치 보드의 이동을 감지할 수 있는 센서로 구성될 수도 있다. 즉, 감지부는 스위치 보드의 탈장/실장을 감지할 수 있는 다양한 형태로 구성될 수 있다.
한편, 도 4는 본 발명에 따른 스위치 보드 변경 방법이 적용되는 ATCA 플랫폼 장치의 사용 상태를 나타낸 예시도로서, ATCA 플랫폼 장치를 구성하는 보드 형태의 각 구성요소들이 슬롯(161) 형태의 섀시(160)에 탑재되어 있는 상태를 나타낸 예시도이다.
섀시(160)는 중앙에 위치하는 스위치 슬롯과, 상기 스위치 슬롯의 양옆에 형성되는 노드 슬롯으로 구성된다.
여기서, 스위치 슬롯에는 이중화된 스위치 보드(120)가 장착되며, 노드 슬롯에는 이중화된 섀시 관리부(110) 및 다수의 스위치 보드(130, 140)가 장착된다.
한편, 도 4에서는 섀시 관리부가 스위치 보드와 같은 형태로 슬롯에 삽입되어 있는 것으로 도시되어 있으나, 섀시 관리부는 슬롯 상단에 수평방향으로 놓여질 수도 있다.
또한, 보다 크고 복잡한 ATCA 플랫폼 장치인 경우에는, 도 4에 도시된 바와 같은 섀시가 이중으로 겹쳐져 이용될 수도 있는데, 이 경우, 상단의 섀시를 셀프 1(Shelf1), 하단의 섀시를 셀프2(Shelf2)라고 할 수 있다. 이때, 섀시 관리부(CMM : Chassis Management Module)는 셀프1에 배치될 수 있는데, 두 개의 셀프를 관리하고 있기 때문에 셀프 메니저라고도 할 수 있다.
도 5는 본 발명에 따른 스위치 보드 변경 방법의 일실시예 흐름도이다.
상기한 바와 같이 본 발명이 적용되는 ATCA 플랫폼 장치는 다수의 보드로 구성될 수 있으며, 이 보드들은 도 4에 도시된 바와 같은 섀시(Chassis)(160)의 슬롯(161)에 장착되고, 섀시 관리부에 의해서 제어를 받는다.
한편, 모든 보드에서 발생하는 HW, OS 등의 장애 정보와 탈/실장 정보는 IPMB를 통해서 제1 섀시 관리부(이하, 간단히 '섀시 관리부'라 함)에 통보되고, 섀시 관리부는 수집된 섀시 전체의 관리 정보를 가지고 있을 뿐만 아니라 관리 정보를 필요로 하는 보드에게 정보를 공유시켜 주는데, 이때 사용되는 논리적 통신 채널(인터페이스)이 IPMI이다. 즉, 섀시 관리부는 실시간으로 수집한 각 보드의 장애 정보를 IPMI 인터페이스를 통해서 모든 보드에 전달할 수 있다.
상기한 바와 같은 구성 및 기능을 포함하는 ATCA 플랫폼 장치에서 본 발명에 따른 스위치 보드 변경 방법이 구현되는 과정을 설명하면 다음과 같다.
ATCA 플랫폼 장치가 특별한 장애 없이 일반적으로 구동되고 있는 경우, 도 3에 도시된 바와 같이, 제1 서비스 보드부(130)의 제m 서비스 보드(130-m)가 제2 서비스 보드부(140)의 제n 서비스 보드(140-n)와 통신할 때, 제1 스위치 보드를 경유하여 IP 통신을 수행한다(502). 즉, 각 서비스 보드들은 활성화 상태인 제1 스위치 보드를 통해 패킷을 교환하고 있으며, 제2 스위치 보드는 제1 스위치 보드를 보조 하기 위하여 비활성 상태로 대기하고 있다.
제1 스위치 보드를 경유하여 각 서비스 보드 간의 통신이 이루어지는 상태에서, 각 서비스 보드는 섀시 관리부로부터 IPMI 이벤트 메시지(또는 SNMP Trap 메시지)가 수신되면(504), 상기 메시지가 제1 스위치 보드와 관련된 메시지인지의 여부를 판단한다(506). 즉, 상기한 바와 같이 섀시 관리부는 IPMB를 통해 섀시(160) 전체의 관리 정보를 수집하는 기능을 수행하는 것으로서, 제1 스위치 보드의 탈장 또는 이동정보 역시 IPMB를 통해 제1 스위치 보드로부터 전송받는 한편, 전송된 제1 스위치 보드의 탈장 또는 이동정보를 가공하여 IPMI를 통해 모든 서비스 보드들에게 전달하고 있는바, 각 서비스 보드는 우선 IPMI를 통해 전송된 메시지가 제1 스위치 보드와 관련된 것인지를 판단하게 된다.
상기 관련 여부 판단결과(506), 제1 스위치 보드와 관련된 메시지가 아니라면, 각 서비스 보드들은 제1 스위치 보드를 경유한 통신을 지속적으로 수행하게 된다(502).
상기 관련 여부 판단결과(506), 제1 스위치 보드와 관련된 메시지가 아니라면, 각 서비스 보드들은 상기 메시지가 제1 스위치 보드의 탈장(Eject)과 관련된 메시지인지의 여부를 판단한다(508). 즉, 상기한 바와 같이 제1 스위치 보드가 실장되는 섀시의 슬롯에는 래치(Latch) 또는 센서 등이 구비되어 있어서 제1 스위치 보드의 탈장을 위해 래치가 해제되거나 또는 제1 스위치 보드가 외부로 탈장되기 위해 슬롯 내부에서 이동되면, 탈장 또는 이동정보가 IPMB를 통해 섀시 관리부로 전송된다. 이때, 섀시 관리부는 IPMI를 통해 상기 정보를 가공하여 각 서비스 보드 들로 전송해 주게 된다. 따라서, 각 서비스 보드들은 IPMI를 통해 수신된 메시지가 제1 스위치 보드의 탈장 또는 이동정보인지의 여부를 판단한다.
상기 탈장 또는 이동정보 여부 판단결과(508), 제1 스위치 보드의 탈장 또는 이동정보와 관련된 메시지가 아니라면, 각 서비스 보드들은 상기 메시지가 제1 스위치 보드의 오에스(OS : Operating System)의 셧다운(Shutdown)과 관련된 메시지인지의 여부를 판단한다(510). 즉, 본 발명이 각 서비스 보드 간의 패킷 교환용으로 이용되고 있는 제1 스위치 보드를 제2 스위치 보드로 변경하는 경우는, 상기한 바와 같이 제1 스위치 보드가 섀시로부터 탈장되는 경우뿐만 아니라, 제1 스위치 보드의 OS가 셧다운 되어 제1 스위치 보드가 정상적인 동작을 수행하지 못하는 경우도 포함하고 있다. 따라서, 각 서비스 보드들은 상기 메시지가, 제1 스위치 보드의 탈장과 관련된 정보가 아니라면, 제1 스위치 보드가 정상적인 동작을 수행하지 못한다는 셧다운 메시지인지의 여부를 판단하게 된다. 한편, 본 발명이 적용되는 ATCA 플랫폼 장치는, 제1 스위치 보드의 셧다운 정보가 IPMB를 통해 섀시 관리부로 전송되면, 섀시 관리부가 각 서비스 보드들로 상기 셧다운 정보를 전송할 수 있도록 구성되어 있다.
상기 셧다운 정보 여부 판단결과(510), 제1 스위치 보드의 셧다운과 관련된 메시지가 아니라면, 각 서비스 보드들은 상기 메시지가 제1 스위치 보드의 네트워크 부하와 관련된 메시지인지의 여부를 판단한다(512). 즉, 본 발명은 제1 스위치 보드가 부하로 인해 정상적인 동작 수행이 불가능하다고 판단되는 경우에도 제1 스위치 보드를 제2 스위치 보드로 변경하도록 하고 있는바, 각 스위치 보드들은 상기 메시지가, 제1 스위치 보드의 탈장 또는 셧다운과 관련되어 있지 않은 경우에는 최종적으로, 네트워크 부하와 관련된 것인지의 여부를 판단하게 된다. 네트워크 부하와 관련된 정보 역시 상기한 과정을 통해 섀시 관리부로부터 각 서비스 보드들로 전송된다.
상기 부하관련 여부 판단결과(512), 제1 스위치 보드의 부하와 관련된 메시지가 아니라면, 각 서비스 보드들은 제1 스위치 보드를 경유한 통신을 지속적으로 수행하게 된다(502).
한편, 상기 탈장 또는 이동정보 여부 판단결과 제1 스위치의 탈장 또는 이동정보와 관련된 메시지이거나(508), 상기 셧다운정보 여부 판단결과 제1 스위치의 셧다운과 관련된 메시지이거나(510), 상기 부하관련 여부 판단결과 제1 스위치의 부하와 관련된 메시지인 경우(512), 각 서비스 보드들은 섀시 관리부로부터 전송되는 정보들을 통해 제2 스위치 보드가 사용 가능 상태인지의 여부를 판단하게 된다(514). 즉, 섀시 관리부는 활성화 상태에 있는 제1 스위치 보드의 각종 정보를 모든 서비스 보드들로 전송할 뿐만 아니라, 비활성화 상태에서 대기 모드로 있는 제2 스위치 보드에 대한 정보도 수집하여 모든 서비스 보드들로 전송하게 된다. 제2 스위치 보드가 실장된 섀시의 슬롯에도 상기한 바와 같은 래치 또는 센서로 구성된 감지부가 구비되어 있기 때문에, 섀시 관리부는 제2 스위치의 실장여부를 감지할 수 있으며, OS의 정상 동작 여부 등도 감지할 수 있다. 한편, 상기에서는 각 서비스 보드들이 섀시 관리부로부터 전송되는 정보들을 통해 제2 스위치 보드가 사용 가능 상태인지의 여부를 판단하고 있으나 또 다른 방법이 적용될 수도 있다. 즉, 각 서비스 보드들이, 제2 스위치 보드가 사용 가능 상태인지의 여부를 IPMI 또는 SNMP Get 메시지를 이용하여 섀시 관리부로 질의한 후, 섀시 관리부로부터 그에 대한 응답 메시지를 전송받아 확인하는 방법이 적용될 수도 있다.
상기 제2 스위치 보드 사용 상태 판단결과(514), 제2 스위치 보드가 사용가능한 상태인 경우, 각 서비스 보드들은 통신 포트를 제1 스위치 보드에서 제2 스위치 보드로 변경하여, 타 스위치 보드들과의 통신을 수행하게 된다. 즉, 본 발명은 각 서비스 보드들이 제1 스위치 보드의 장애 발생 정보를 섀시 관리부로부터 직접 수신한 후 직접 제2 스위치 보드로 통신 포트를 변경하도록 함으로써, 네트워크를 통한 서비스 제공이 중단없이 이루어지도록 한다는 특징을 가지고 있다.
상기 제2 스위치 보드 사용 상태 판단결과(514), 제2 스위치 보드가 사용 가능한 상태가 아닌 경우, 각 서비스 보드들은 제2 스위치의 장애 발생 정보를 섀시 관리부로 전송하게 되며, 장애 발생 정보를 수신한 섀시 관리부는 장애 발생 정보를 모니터링 시스템으로 전송함으로써, 관리자가 직접 제2 스위치 보드의 상태를 체크해보도록 할 수 있다. 그러나, 제2 스위치 보드에 대한 상태는 상기한 바와 같이 섀시 관리부에서 수시로 모니터링되고 있으며, 모니터링 결과 제2 스위치 보드에 장애(탈장, OS 셧다운, 파워 오프 등)가 발생된 경우에는, 섀시 관리부가 자체적으로 모니터링 시스템으로 장애 정보를 전송할 수 있기 때문에, 상기한 바와 같은 과정(514, 518)은 생략될 수 있다. 즉, 본 발명은 제1 스위치 보드와 관련된 상기 각 판단결과(508, 510, 512), 제1 스위치의 탈장, 셧다운 또는 부하와 관련된 메시지인 경우, 각 서비스 보드들이 별도의 판단 과정 없이 바로 통신 포트를 제1 스위치 보드에서 제2 스위치 보드로 변경하여, 타 스위치 보드들과 통신을 수행하도록 할 수도 있다.
한편, 상기에서는 본 발명이 제1 스위치 보드의 탈장, 셧다운, 부하 여부를 순차적으로 판단하는 것으로 설명되어져 있으나, 본 발명이 이에 한정되는 것은 아니다. 따라서, 본 발명은 상기 세 개의 판단 과정 중 적어도 어느 하나를 수행하도록 구성될 수도 잇다.
이상 설명한 내용을 통해 당업자라면 본 발명의 기술사상을 일탈하지 아니하는 범위에서 다양한 변경 및 수정이 가능함을 알 수 있을 것이다. 따라서, 본 발명의 기술적 범위는 명세서의 상세한 설명에 기재된 내용으로 한정되는 것이 아니라 특허 청구의 범위에 의해 정하여 져야만 할 것이다.
도 1은 일반적인 ATCA 플랫폼 장치의 구조를 블럭도로 나타낸 예시도.
도 2는 종래의 스위치 보드 변경 방법의 일실시예 흐름도.
도 3은 본 발명이 적용되는 ATCA 플랫폼 장치의 구조를 블럭도로 나타낸 예시도.
도 4는 본 발명에 따른 스위치 보드 변경 방법이 적용되는 ATCA 플랫폼 장치의 사용 상태를 나타낸 예시도.
도 5는 본 발명에 따른 스위치 보드 변경 방법의 일실시예 흐름도.
<도면의 주요 부호에 대한 설명>
110 : 섀시 관리부 120 : 스위치 보드
130 : 제1 서비스 보드부 140 : 제2 서비스 보드부
130-1 내지 130-m, 140-1 내지 140-n : 서비스 보드
150 : 감지부 160 : 섀시
161 : 슬롯

Claims (8)

  1. 섀시 관리부, 다수의 서비스 보드, 활성화 상태의 제1 스위치 보드, 비활성화 상태의 제2 스위치 보드를 포함하는 ATCA 플랫폼 장치에 적용되는 스위치 보드 변경 방법에 있어서,
    상기 서비스 보드들 각각이, 상기 섀시 관리부로부터 전송된 메시지를 수신한 경우, 상기 메시지가 상기 제1 스위치 보드와 관련된 메시지인지의 여부를 판단하는 단계;
    상기 관련 여부 판단결과, 상기 메시지가 상기 제1 스위치 보드와 관련된 메시지가 아닌 경우, 상기 각 서비스 보드들이 상기 제1 스위치 보드를 경유한 통신을 지속적으로 수행하는 단계; 및
    상기 관련 여부 판단결과, 상기 메시지가 상기 제1 스위치 보드와 관련된 메시지인 경우, 상기 각 서비스 보드들이, 상기 메시지가 상기 제1 스위치 보드의 장애와 관련된 것인지의 여부를 판단하여, 상기 제1 스위치 보드를 경유한 통신을 지속적으로 이용할 것인지 또는 제2 스위치 보드를 경유한 통신으로 변경할 것인지를 결정하는 스위치 보드 변경 결정 단계를 포함하고,
    상기 장애는,
    상기 제1 스위치 보드가 실장되어 있는 섀시로부터의 상기 제1 스위치 보드의 탈장, 상기 제1 스위치 보드의 오에스(OS)의 셧다운, 상기 제1 스위치 보드의 부하발생 중 적어도 어느 하나인 것을 특징으로 하는 스위치 보드 변경 방법.
  2. 삭제
  3. 제 1 항에 있어서,
    상기 스위치 보드 변경 결정 단계는,
    상기 관련 여부 판단결과, 상기 메시지가 상기 제1 스위치 보드와 관련된 메시지인 경우, 상기 각 서비스 보드들이, 상기 메시지가, 상기 제1 스위치 보드가 실장되어 있는 섀시로부터의 상기 제1 스위치 보드의 탈장과 관련된 메시지인지의 여부를 판단하는 단계;
    상기 탈장 여부 판단결과, 상기 메시지가 상기 제1 스위치의 탈장과 관련된 메시지가 아닌 경우, 상기 각 서비스 보드들이 상기 제1 스위치 보드를 경유한 통신을 지속적으로 수행하는 단계; 및
    상기 탈장 여부 판단결과, 상기 메시지가 상기 제1 스위치의 탈장과 관련된 메시지인 경우, 상기 각 서비스 보드들이 상기 제1 스위치 보드와 연결되어 있는 통신포트를 상기 제2 스위치 보드로 연결시켜, 상기 제2 스위치 보드를 경유한 통신을 수행하는 단계
    를 포함하는 스위치 보드 변경 방법.
  4. 제 3 항에 있어서,
    상기 메시지가 상기 제1 스위치의 탈장과 관련된 메시지가 아닌 경우, 상기 제1 스위치 보드를 경유한 통신을 지속적으로 수행하는 단계 이후에,
    상기 탈장 여부 판단결과, 상기 메시지가 상기 제1 스위치의 탈장과 관련된 메시지가 아닌 경우, 상기 각 서비스 보드들이 상기 메시지가 상기 제1 스위치 보드의 오에스(OS)의 셧다운과 관련된 메시지인지의 여부를 판단하는 단계;
    상기 셧다운 여부 판단결과, 상기 메시지가 상기 제1 스위치의 오에스의 셧다운과 관련된 메시지가 아닌 경우, 상기 각 서비스 보드들이 상기 제1 스위치 보드를 경유한 통신을 지속적으로 수행하는 단계; 및
    상기 셧다운 여부 판단결과, 상기 메시지가 상기 제1 스위치의 오에스의 셧다운과 관련된 메시지인 경우, 상기 각 서비스 보드들이 상기 제1 스위치 보드와 연결되어 있는 통신포트를 상기 제2 스위치 보드로 연결시켜, 상기 제2 스위치 보드를 경유한 통신을 수행하는 단계
    를 포함하는 스위치 보드 변경 방법.
  5. 제 4 항에 있어서,
    상기 메시지가 상기 제1 스위치의 오에스의 셧다운과 관련된 메시지가 아닌 경우, 상기 제1 스위치 보드를 경유한 통신을 지속적으로 수행하는 단계 이후에,
    상기 셧다운 여부 판단결과, 상기 메시지가 상기 제1 스위치의 오에스의 셧다운과 관련된 메시지가 아닌 경우, 상기 각 서비스 보드들이 상기 메시지가 상기 제1 스위치 보드의 부하와 관련된 메시지인지의 여부를 판단하는 단계;
    상기 부하 여부 판단결과, 상기 메시지가 상기 제1 스위치의 부하와 관련된 메시지가 아닌 경우, 상기 각 서비스 보드들이 상기 제1 스위치 보드를 경유한 통신을 지속적으로 수행하는 단계; 및
    상기 부하 여부 판단결과, 상기 메시지가 상기 제1 스위치의 부하와 관련된 메시지인 경우, 상기 각 서비스 보드들이 상기 제1 스위치 보드와 연결되어 있는 통신포트를 상기 제2 스위치 보드로 연결시켜, 상기 제2 스위치 보드를 경유한 통신을 수행하는 단계
    를 포함하는 스위치 보드 변경 방법.
  6. 제 1 항 및 제 3 항 및 제 4 항 및 제 5 항 중 어느 한 항에 있어서,
    상기 제1 스위치 보드의 장애와 관련된 메시지는,
    지능형 플랫폼 관리 버스(IPMB)를 통해 상기 제1 스위치 보드로부터 상기 섀시 관리부로 전송된 정보가 상기 섀시 관리부에서 가공된 후, 상기 각 서비스 보드로 전송된 것임을 특징으로 하는 스위치 보드 변경 방법.
  7. 제 6 항에 있어서,
    상기 메시지는,
    지능형 플랫폼 관리 인터페이스(IPMI)를 통해 상기 섀시 관리부로부터 상기 각 서비스 보드로 전송된 것임을 특징으로 하는 스위치 보드 변경 방법.
  8. 제 6 항에 있어서,
    상기 제1 스위치 보드의 장애가 상기 제1 스위치 보드가 실장되어 있는 섀시로부터의 상기 제1 스위치 보드의 탈장과 관련된 것인 경우, 상기 메시지는,
    상기 섀시의 슬롯 중 상기 제1 스위치 보드가 실장되어 있는 슬롯에 구비되어 있는 래치 또는 센서로부터 상기 지능형 플랫폼 관리 버스를 통해 상기 섀시 관리부로 전송된 것임을 특징으로 하는 스위치 보드 변경 방법.
KR1020080000233A 2008-01-02 2008-01-02 스위치 보드 변경 방법 KR100950555B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020080000233A KR100950555B1 (ko) 2008-01-02 2008-01-02 스위치 보드 변경 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020080000233A KR100950555B1 (ko) 2008-01-02 2008-01-02 스위치 보드 변경 방법

Publications (2)

Publication Number Publication Date
KR20090074447A KR20090074447A (ko) 2009-07-07
KR100950555B1 true KR100950555B1 (ko) 2010-03-31

Family

ID=41331732

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020080000233A KR100950555B1 (ko) 2008-01-02 2008-01-02 스위치 보드 변경 방법

Country Status (1)

Country Link
KR (1) KR100950555B1 (ko)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103687028B (zh) * 2013-12-30 2018-05-04 大唐移动通信设备有限公司 资源保活方法以及资源释放方法
US10496566B2 (en) * 2016-12-20 2019-12-03 Samsung Electronics Co., Ltd. Method and apparatus for data recovering during a board replacement

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100655599B1 (ko) 2005-11-04 2006-12-08 한국전자통신연구원 노드별 20Gbps 패킷 스위칭 대역폭을 지원하는ATCA 플랫폼 장치
US20070104091A1 (en) 2005-11-10 2007-05-10 Sang Yeoun Lee Apparatus for providing shelf manager having duplicate Ethernet port in ATCA system
US20070127365A1 (en) 2005-12-07 2007-06-07 Yong Tae Method for implementing redundant structure of ATCA (advanced telecom computing architecture) system via base interface and the ATCA system for use in the same
KR20070059883A (ko) * 2005-12-07 2007-06-12 한국전자통신연구원 베이스 인터페이스를 통한 atca 시스템의 이중화 구현방법 및 이를 구현한 atca 시스템

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100655599B1 (ko) 2005-11-04 2006-12-08 한국전자통신연구원 노드별 20Gbps 패킷 스위칭 대역폭을 지원하는ATCA 플랫폼 장치
US20070104091A1 (en) 2005-11-10 2007-05-10 Sang Yeoun Lee Apparatus for providing shelf manager having duplicate Ethernet port in ATCA system
US20070127365A1 (en) 2005-12-07 2007-06-07 Yong Tae Method for implementing redundant structure of ATCA (advanced telecom computing architecture) system via base interface and the ATCA system for use in the same
KR20070059883A (ko) * 2005-12-07 2007-06-12 한국전자통신연구원 베이스 인터페이스를 통한 atca 시스템의 이중화 구현방법 및 이를 구현한 atca 시스템

Also Published As

Publication number Publication date
KR20090074447A (ko) 2009-07-07

Similar Documents

Publication Publication Date Title
US20030137934A1 (en) System and method for providing management of fabric links for a network element
US7827442B2 (en) Shelf management controller with hardware/software implemented dual redundant configuration
CN101207408B (zh) 一种用于主备倒换的综合故障检测装置和方法
US20050058063A1 (en) Method and system supporting real-time fail-over of network switches
CN105721546A (zh) 一种基于工业物联通讯的多数据集成服务平台
JP2002368769A (ja) ループ型ネットワークおよびその運用方法
CN100362481C (zh) 多处理器设备单元主备保护方法
WO2011137797A1 (zh) 以太网中的数据传输方法和系统
CN103428114A (zh) 一种atca万兆交换板及系统
CN101488101A (zh) Cpci冗余备份系统
US10298520B2 (en) Relay apparatus
CN102026042A (zh) 一种高级电信计算架构控制面的保活、自愈方法和装置
KR100950555B1 (ko) 스위치 보드 변경 방법
US7103504B1 (en) Method and system for monitoring events in storage area networks
US7489643B2 (en) Increased availability on routers through detection of data path failures and subsequent recovery
CN111628944B (zh) 交换机及交换机系统
CN116340058A (zh) 主备切换方法及装置
KR100690042B1 (ko) 듀얼 액티브를 이용한 아이피 인터페이스의 파이레벨이중화 장치
KR100617306B1 (ko) Atca 플랫폼에서 베이스 인터페이스를 통해 이중화를제어하는 장치 및 그 방법
JP2010245589A (ja) 通信システム、通信装置、被疑箇所の特定方法及びプログラム
CN101410808A (zh) 检查管理网络的潜在故障的方法
CN111880999B (zh) 用于高密度刀片服务器的高可用监控管理装置及冗余切换方法
JP2010136038A (ja) 伝送装置及び冗長構成部の系切替え方法
EP2621129B1 (en) Data forwarding method and router
KR100895463B1 (ko) Atca 플랫폼에서의 이중화 장치의 제어 방법 및 이를이용하여 구현된 atca 시스템

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
AMND Amendment
E601 Decision to refuse application
AMND Amendment
J201 Request for trial against refusal decision
B701 Decision to grant
GRNT Written decision to grant
LAPS Lapse due to unpaid annual fee