KR20230105959A - 클라우드 서비스를 위한 엣지 장치의 이중화 관리를 위한 장치 및 방법 - Google Patents

클라우드 서비스를 위한 엣지 장치의 이중화 관리를 위한 장치 및 방법 Download PDF

Info

Publication number
KR20230105959A
KR20230105959A KR1020220001624A KR20220001624A KR20230105959A KR 20230105959 A KR20230105959 A KR 20230105959A KR 1020220001624 A KR1020220001624 A KR 1020220001624A KR 20220001624 A KR20220001624 A KR 20220001624A KR 20230105959 A KR20230105959 A KR 20230105959A
Authority
KR
South Korea
Prior art keywords
edge
devices
state
edge device
edge devices
Prior art date
Application number
KR1020220001624A
Other languages
English (en)
Inventor
최일석
김기철
Original Assignee
주식회사 케이티
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 케이티 filed Critical 주식회사 케이티
Priority to KR1020220001624A priority Critical patent/KR20230105959A/ko
Publication of KR20230105959A publication Critical patent/KR20230105959A/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/3006Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system is distributed, e.g. networked systems, clusters, multiprocessor systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/202Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
    • G06F11/2023Failover techniques
    • G06F11/2033Failover techniques switching over of hardware resources
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/22Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing
    • G06F11/2294Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing by remote test
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/22Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing
    • G06F11/26Functional testing
    • G06F11/273Tester hardware, i.e. output processing circuits
    • G06F11/277Tester hardware, i.e. output processing circuits with comparison between actual response and known fault-free response
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3055Monitoring arrangements for monitoring the status of the computing system or of the computing system component, e.g. monitoring if the computing system is on, off, available, not available
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3065Monitoring arrangements determined by the means or processing involved in reporting the monitored data

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • General Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Computer Hardware Design (AREA)
  • Mathematical Physics (AREA)
  • Hardware Redundancy (AREA)

Abstract

중앙의 클라우드 시스템에서 엣지 장치들의 이중화를 관리하기 위한 장치 및 방법이 개시된다. 일 측면에 따른, 하위 장비들과 클라우드 서비스 시스템 사이에서 상기 하위 장비들로부터 수집한 수집 데이터를 상기 클라우드 서비스 시스템으로 전송하는 이중화된 액티브 상태의 제1엣지 장치와 스탠바이 상태의 제2엣지 장치를 관리하는 상기 클라우드 서비스 시스템의 관리 장치는, 상기 제1, 2엣지 장치와 통신하는 통신부; 상기 제1, 2 엣지 장치의 상태를 판단하는 판단부; 및 비정상 상태로 판단된 상기 제1엣지 장치로부터 정상 상태로 판단된 상기 제2엣지 장치로의 이중화 전환을 제어하는 제어부를 포함한다.

Description

클라우드 서비스를 위한 엣지 장치의 이중화 관리를 위한 장치 및 방법{Apparatus and method for managing dualization of edge devices for cloud services}
본 발명은 클라우드 기술에 관한 것으로, 보다 구체적으로, 클라우드 서비스를 위한 엣지 장치의 이중화 관리를 위한 장치 및 방법에 관한 것이다.
컴퓨터 네트워크의 기술 발전에 따라, 각 단말의 독립적인 하드웨어 성능에 의존하던 기존의 컴퓨팅 환경은, 네트워크 상의 모든 컴퓨팅 자원을 활용하여 단말의 요청에 따라 해당 서비스를 제공하는 클라우드 컴퓨팅(Cloud Computing) 형태로 진화하고 있다. 클라이언트는 어플리케이션(Application), 스토리지(Storage), 운영체제(Operation System, OS), 보안(Security)등의 필요한 컴퓨팅 자원을 각 클라이언트의 단말에 설치하여 사용하는 것이 아니라, 가상화 기술을 통해 생성된 가상의 컴퓨팅 환경 상의 서비스를 원하는 시점에 원하는 만큼 골라서 사용하게 된다. 클라이언트는 각 컴퓨팅 자원의 구입비용을 지불하는 것이 아니라 사용량에 기반하여 대가를 지불하게 된다.
이러한 클라우드 환경은 계층적 구조로 구성된다. 즉 중앙의 클라우드 시스템과, 가장 하위의 하위 장비들, 중앙의 클라우드 시스템과 하위 장비들 간의 데이터를 중계하는 게이트웨이인 엣지 장치들을 포함하여 구성된다. 이러한 클라우드 환경에서 엣지 장치의 통신에 문제가 발생하는 경우 원활한 서비스 제공이 불가하여 엣지 장치를 이중화하여 병렬로 구성하고 있다. 즉 두 개의 엣지 장치를 병렬로 구성하여 제1엣지 장치를 액티브 상태로 구동하고 제2엣지 장치를 스탠바이 상태로 구동한 후 제1엣지 장치에 장애 발생시 제2엣지 장치를 액티브 상태로 전환하여 장애를 해소한다.
이와 같은 이중화 구성을 위해 종래에는 엣지 장치들 간에 상호 통신을 하도록 한다. 엣지 장치들 간에 상호 통신을 하여 제1엣지 장치의 장애 발생시 제2엣지 장치가 액티브 상태로 전환하는 방식이다. 이와 같은 방식으로 이중화를 구현할 경우, 중앙의 클라우드 시스템과 엣지 장치 간, 또는 엣지 장치와 하위 장비들 간의 네트워크가 불안정한 상태일 때 대응이 어려운 문제점이 있다. 예를 들어, 엣지 장치들 간의 상호 통신은 정상이지만, 엣지 장치와 하위 장비들 간의 네트워크가 불안정한 상태일 때, 이중화 전환이 제대로 수행되지 않아 패킷 수신 누락, 통신 지연 등이 발생할 수 있다.
또한, 종래의 이중화 방식은 액티브 상태인 엣지 장치로부터 스탠바이 엣지 장치로의 전면 전환으로, 부하가 가중될 때 부하를 분산할 수 없고, 스탠바이 엣지 장치는 가용 가능함에도 스탠바이 상태로 운영되어 리소스의 낭비가 발생하는 문제점이 있다.
본 발명은, 중앙의 클라우드 시스템에서 엣지 장치들의 이중화를 관리하기 위한 장치 및 방법을 제공하는데 그 목적이 있다.
본 발명은, 중앙의 클라우드 시스템에서 이중화 구현된 엣지 장치들의 부하를 분산할 수 있는 장치 및 방법을 제공하는데 다른 목적이 있다.
일 측면에 따른, 하위 장비들과 클라우드 서비스 시스템 사이에서 상기 하위 장비들로부터 수집한 수집 데이터를 상기 클라우드 서비스 시스템으로 전송하는 이중화된 액티브 상태의 제1엣지 장치와 스탠바이 상태의 제2엣지 장치를 관리하는 상기 클라우드 서비스 시스템의 관리 장치는, 상기 제1, 2엣지 장치와 통신하는 통신부; 상기 제1, 2 엣지 장치의 상태를 판단하는 판단부; 및 비정상 상태로 판단된 상기 제1엣지 장치로부터 정상 상태로 판단된 상기 제2엣지 장치로의 이중화 전환을 제어하는 제어부를 포함한다.
상기 판단부는, 상기 제1, 2엣지 장치로부터의 수집 데이터의 수신 상태를 기초로 상기 제1, 2 엣지 장치의 상태를 판단하고, 상기 제2엣지 장치로부터 수신되는 수집 데이터는 더미 데이터일 수 있다.
상기 판단부는, 상기 제1, 2엣지 장치로 상태 체크 메시지를 전송하고 이에 대한 응답 수신 여부에 기초하여 상기 제1, 2 엣지 장치의 상태를 판단할 수 있다.
상기 판단부는, 상기 제1, 2엣지 장치로부터 수신되는, 상기 제1, 2엣지 장치 상호간 통신에 의해 체크한 상대 엣지 장치의 상태 체크 결과를 기초로, 상기 제1, 2 엣지 장치의 상태를 판단할 수 있다.
상기 판단부는, 상기 제1, 2엣지 장치 각각으로부터 동일한 태그를 포함하는 수집 데이터가 중복하여 수신되는 경우 원복을 결정하고, 상기 제어부는, 상기 원복 결정에 따라 상기 제1, 2엣지 장치 간의 이중화 전환을 원래 상태로 복귀시킬 수 있다.
상기 판단부는, 상기 제1, 2엣지 장치로부터의 수집 데이터의 수신 상태; 상기 제1, 2엣지 장치로 상태 체크 메시지를 전송하고 이에 대한 응답 수신 여부; 및 상기 제1, 2엣지 장치로부터 수신되는, 상기 제1, 2엣지 장치 상호간 통신에 의해 체크한 상대 엣지 장치의 상태 체크 결과;를 기초로, 상기 제1, 2 엣지 장치의 상태를 판단하고, 또한 상기 제1엣지 장치의 비정상 원인을 판단할 수 있다.
상기 판단부는, 상기 제2엣지 장치는 정상 상태이고, 상기 수집 데이터의 수신 상태에 의해서만 상기 제1엣지 장치가 비정상 상태로 판단될 경우, 상기 제1엣지 장치의 펌웨어 이상으로 판단할 수 있다.
상기 판단부는, 상기 제2엣지 장치는 정상 상태이고, 상기 수집 데이터의 수신 상태, 상기 응답 수신 여부 및 상기 상태 체크 결과 모두에 의해 상기 제1엣지 장치가 비정상 상태로 판단될 경우, 상기 제1엣지 장치의 고장으로 판단할 수 있다.
다른 측면에 따른, 하위 장비들과 클라우드 서비스 시스템 사이에서 상기 하위 장비들로부터 수집한 수집 데이터를 상기 클라우드 서비스 시스템으로 전송하는 이중화된 액티브 상태의 제1엣지 장치와 스탠바이 상태의 제2엣지 장치를 관리하는 상기 클라우드 서비스 시스템의 관리 장치는, 상기 제1, 2엣지 장치와 통신하는 통신부; 상기 하위 장비들 중 비정상 상태의 하위 장비를 판단하는 판단부; 및 상기 제2엣지 장치로 하여금 상기 비정상 상태의 하위 장비로부터 데이터를 수집하도록 부분 이중화 전환 제어를 하는 제어부를 포함한다.
상기 판단부는, 상기 제1엣지 장치로부터, 상기 하위 장비들에 대한 수집 타임아웃 횟수 및 기준 시간 이상의 수집 응답시간 횟수 중 적어도 하나를 기초로 추출된 하위 장비의 정보를 수신할 경우, 해당 하위 장비를 비정상 상태로 판단할 수 있다.
상기 판단부는, 상기 비정상 상태의 하위 장비가 상기 부분 이중화 전환 후에도 비정상 상태인 경우, 해당 하위 장비를 고장으로 판단할 수 있다.
또 다른 측면에 따른, 하위 장비들과 클라우드 서비스 시스템 사이에서 상기 하위 장비들로부터 수집한 수집 데이터를 상기 클라우드 서비스 시스템으로 전송하는 이중화된 액티브 상태의 제1엣지 장치와 스탠바이 상태의 제2엣지 장치를 관리하는 상기 클라우드 서비스 시스템에서 관리하는 방법은, 상기 제1, 2 엣지 장치의 상태를 판단하는 단계; 및 비정상 상태로 판단된 상기 제1엣지 장치로부터 정상 상태로 판단된 상기 제2엣지 장치로의 이중화 전환을 제어하는 단계를 포함한다.
상기 판단하는 단계는, 상기 제1, 2엣지 장치로부터의 상기 수집 데이터의 수신 상태를 기초로 상기 제1, 2 엣지 장치의 상태를 판단하고, 상기 제2엣지 장치로부터 수신되는 수집 데이터는 더미 데이터일 수 있다.
상기 판단하는 단계는, 상기 제1, 2엣지 장치로 상태 체크 메시지를 전송하고 이에 대한 응답 수신 여부에 기초하여 상기 제1, 2 엣지 장치의 상태를 판단할 수 있다.
상기 판단하는 단계는, 상기 제1, 2엣지 장치로부터 수신되는, 상기 제1, 2엣지 장치 상호간 통신에 의해 체크한 상대 엣지 장치의 상태 체크 결과를 기초로, 상기 제1, 2 엣지 장치의 상태를 판단할 수 있다.
상기 방법은, 상기 제1, 2엣지 장치 각각으로부터 동일한 태그를 포함하는 수집 데이터가 중복하여 수신하는 단계; 및 상기 제1, 2엣지 장치 간의 이중화 전환을 원래 상태로 복귀시키는 단계를 더 포함할 수 있다.
상기 판단하는 단계는, 상기 제1, 2엣지 장치로부터의 수집 데이터의 수신 상태; 상기 제1, 2엣지 장치로 상태 체크 메시지를 전송하고 이에 대한 응답 수신 여부; 및 상기 제1, 2엣지 장치로부터 수신되는, 상기 제1, 2엣지 장치 상호간 통신에 의해 체크한 상대 엣지 장치의 상태 체크 결과;를 기초로, 상기 제1, 2 엣지 장치의 상태를 판단하고, 또한 상기 제1엣지 장치의 비정상 원인을 판단하는 단계를 포함할 수 있다.
상기 비정상 원인을 판단하는 단계는, 상기 제2엣지 장치는 정상 상태이고, 상기 수집 데이터의 수신 상태에 의해서만 상기 제1엣지 장치가 비정상 상태로 판단될 경우, 상기 제1엣지 장치의 펌웨어 이상으로 판단할 수 있다.
상기 비정상 원인을 판단하는 단계는, 상기 제2엣지 장치는 정상 상태이고, 상기 수집 데이터의 수신 상태, 상기 응답 수신 여부 및 상기 상태 체크 결과 모두에 의해 상기 제1엣지 장치가 비정상 상태로 판단될 경우, 상기 제1엣지 장치의 고장으로 판단할 수 있다.
본 발명은, 클라우드 서비스를 제공하는데 있어서 중앙에서 엣지 장치들의 상태를 판단하여 엣지 장치들의 이중화를 제어함으로써 이중화 전환의 안정성, 하위 장비들의 데이터의 수집 안정성 및 무결성을 확보할 수 있다. 특히, 본 발명은 중앙에서 엣지 장치들의 비정상 상태의 구체적 원인을 파악할 수 있어 비정상 상태에 대한 빠른 대응을 가능하게 한다.
본 발명은, 액티브 상태의 엣지 장치를 통해 데이터가 수집되는 일부 하위 장비가 비정상 상태일 대, 해당 하위 장비에 대한 데이터 수집을 스탠바이 상태의 엣지 장치에서 수행하도록 부분 이중화 전환을 함으로써, 부하를 분산하면서 리소스 낭비를 줄일 수 있다.
본 발명은, 이상 상황에서 액티브 상태의 엣지 장치로부터 스탠바이 상태의 엣지 장치로의 전면 이중화을 수행한 후, 정상 상태로 복귀시 빠르게 원복을 하여 중복 데이터 수집을 방지할 수 있다.
도 1은 본 발명의 일 실시예에 따른 클라우드 서비스 환경을 나타낸 도면이다.
도 2는 본 발명의 일 실시예에 따른 수집 데이터를 기초로 엣지 장치들의 상태를 감시하는 방법을 설명하는 흐름도이다.
도 3은 본 발명의 일 실시예에 따른 상태 체크 메시지를 기초로 엣지 장치들의 상태를 감시하는 방법을 설명하는 흐름도이다.
도 4는 본 발명의 일 실시예에 따른 엣지 장치 상호간 통신을 이용하여 엣지 장치들의 상태를 감시하는 방법을 설명하는 흐름도이다.
도 5는 본 발명의 일 실시예에 따른 엣지 장치에서 비정상 하위 장비를 분석하는 방법을 설명하는 흐름도이다.
도 6은 본 발명의 일 실시예에 따른 이중화 원복을 위한 태그 매핑 테이블의 예를 나타낸 도면이다.
도 7은 본 발명의 일 실시예에 따른 관리 장치의 구성을 나타낸 도면이다.
이하, 첨부된 도면을 참조하여 본 명세서에 개시된 실시예를 상세히 설명하되, 도면 부호에 관계없이 동일하거나 유사한 구성요소는 동일한 참조 번호를 부여하고 이에 대한 중복되는 설명은 생략하기로 한다. 이하의 설명에서 사용되는 구성요소에 대한 접미사 "부"는 명세서 작성의 용이함만이 고려되어 부여되거나 혼용되는 것으로서, 그 자체로 서로 구별되는 의미 또는 역할을 갖는 것은 아니다. 또한, 본 명세서에 개시된 실시예를 설명함에 있어서 관련된 공지 기술에 대한 구체적인 설명이 본 명세서에 개시된 실시예의 요지를 흐릴 수 있다고 판단되는 경우 그 상세한 설명을 생략한다. 또한, 첨부된 도면은 본 명세서에 개시된 실시예를 쉽게 이해할 수 있도록 하기 위한 것일 뿐, 첨부된 도면에 의해 본 명세서에 개시된 기술적 사상이 제한되지 않으며, 본 발명의 사상 및 기술 범위에 포함되는 모든 변경, 균등물 내지 대체물을 포함하는 것으로 이해되어야 한다.
단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다. 본 출원에서, "포함한다" 또는 "가지다" 등의 용어는 명세서상에 기재된 특징, 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것이 존재함을 지정하려는 것이지, 하나 또는 그 이상의 다른 특징들이나 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.
본 발명을 구현함에 있어서 설명의 편의를 위하여 구성요소를 세분화하여 설명할 수 있으나, 이들 구성요소가 하나의 장치 또는 모듈 내에 구현될 수도 있고, 혹은 하나의 구성요소가 다수의 장치 또는 모듈들에 나뉘어져서 구현될 수도 있다.
도 1은 본 발명의 일 실시예에 따른 클라우드 서비스 환경을 나타낸 도면이다. 도 1을 참조한 본 실시예의 클라우드 서비스 환경은, 클라우드 시스템 내의 관리 장치(110), 엣지 장치들(120, 130), 및 하위 장비(140)들이 계층 구조를 이룬다.
클라우드 시스템은, 여러 곳에 분산되어 있는 데이터 센터를 가상화 기술로 통합하여 다양한 서비스를 제공한다. 서비스 사용자는 어플리케이션(Application), 스토리지(Storage), 운영체제(Operation System), 보안(Security) 등의 필요한 컴퓨팅 자원을 각 사용자 소유의 단말에 설치하여 사용하는 것이 아니라, 가상화 기술을 통해 생성된 가상공간 상의 서비스를 원하는 시점에 원하는 만큼 골라서 사용하게 된다. 예를 들어, 클라우드 시스템은, 가상 데스크탑 서비스나, 빌딩 관리 서비스, 또는 스토리지 서비스 등을 제공한다.
클라우드 시스템은, 하드웨어, 하이퍼바이저(hypervisor), 가상 CPU(Central Processor Unit), 가상 메모리, 가상 디스크, 가상 네트워크, 보안 하이퍼바이저(Secure Hypervisor), 가상 머신(Virtual Machine, VM), 가상 머신 입출력 관리 소프트웨어 및 사용자 소프트웨어 등을 포함할 수 있다. 본 실시예에서 클라우드 시스템은, 엣지 장치(120, 130)를 통해 계층상 가장 하위에 위치하는 하위 장비들(140)로부터 데이터를 수신하고, 또한 하위 장비들(140)을 제어할 수 있다.
클라우드 시스템은 도 1에 도시된 바와 같이 관리 장치(110)를 포함한다. 관리 장치(110)는 이중화된 엣지 장치들(120, 130)과 통신하여 이중화된 엣지 장치들(120, 130)의 상태를 관리하고, 이중화된 엣지 장치들(120, 130)의 이중화 전환을 제어한다. 관리 장치(110)는, 엣지 장치들(120, 130)로부터의 수집 데이터의 전송 상태를 기초로, 또는 엣지 장치들(120, 130)에 대한 상태 체크 메시지의 전송을 통해, 또는 엣지 장치들(120, 130) 상호간의 상태 체크 결과를 통해, 엣지 장치들(120, 130)의 상태를 관리한다.
관리 장치(110)는, 엣지 장치들(120, 130)의 상태를 기초로 엣지 장치들(120, 130)의 이중화 전환을 제어한다. 즉, 액티브 상태의 엣지 장치에 이상이 발생한 경우, 스탠바이 상태의 엣지 장치를 가동하여 액티브 상태의 엣지 장치에서 수행하던 임무를 스탠바이 상태였던 엣지 장치에서 수행하도록 제어한다. 또는 통신이 불안정한 하위 장비(140)에 대한 데이터 수집의 임무를 액티브 상태의 엣지 장치로부터 스탠바이 상태의 엣지 장치로 전환하는 제어를 할 수 있다.
엣지 장치들(120, 130)은, 하위 장비들(140)로부터 데이터를 수집하고, 수집된 데이터를 클라우드 시스템으로 전송하는 게이트웨이 역할을 수행한다. 엣지 장치들(120, 130) 중 하나는 액티브 상태로 동작하고 나머지 하나는 스탠바이 상태로 동작할 수 있다. 엣지 장치들(120, 130)은, 관리 장치(110)의 제어에 따라 액티브 상태에서 스탠바이 상태로, 또는 스탠바이 상태에서 액티브 상태로 전환할 수 있다. 본 실시예에서 엣지 장치(120)를 액티브 상태의 제1엣지 장치라 하고, 엣지 장치(130)를 스탠바이 상태의 제2엣지 장치라 한다.
엣지 장치들(120, 130)은 상호간에 상태 체크 메시지를 전송하여 상대 엣지 장치(120, 130)의 상태를 체크하고, 상대 엣지 장치(120, 130)의 상태 정보를 관리 장치(110)로 전송한다. 즉, 제1엣지 장치(120)는 제2엣지 장치(130)의 상태를 체크하여 관리 장치(110)로 보고하고, 제2엣지 장치(130)는 제1엣지 장치(120)의 상태를 체크하여 관리 장치(110)로 보고한다.
하위 장비들(140)은, 예를 들어 건물에 구비된 설비들과 같이, 데이터를 주기적으로 또는 비주기적으로 엣지 장치들(120, 130)을 통해 클라우드 시스템으로 전송하고, 엣지 장치들(120, 130)을 통해 클라우드 시스템으로부터 수신되는 제어 명령에 따라 동작하는 장비들이다. 예를 들어, 하위 장비들(140)은, 열원 설비(예컨대, 냉동기, 보일러), 기계 설비(예컨대, 공조기, 열교환기), 조명 설비, 전력 설비(예컨대, 수배전반), 수요 관리 설비, 수도 광역 설비(예컨대, 가스, 수도) 등을 포함할 수 있다.
도 1에 도시된 클라우드 서비스 환경의 각 구성요소들은 네트워크(미도시)를 통해 연결된다. 네트워크는 단말들 및 서버들과 같은 각각의 노드 상호 간에 정보 교환이 가능한 연결 구조를 의미하는 것으로, 근거리 통신망(LAN: Local Area Network), 광역 통신망(WAN: Wide Area Network), 인터넷 (WWW: World Wide Web), 유무선 데이터 통신망, 전화망, 유무선 텔레비전 통신망 등을 포함한다. 무선 데이터 통신망의 일례에는 3G, 4G, 5G, 3GPP(3rd Generation Partnership Project), LTE(Long Term Evolution), WIMAX(World Interoperability for Microwave Access), 와이파이(Wi-Fi), 블루투스 통신, 적외선 통신, 초음파 통신, 가시광 통신(VLC: Visible Light Communication), 라이파이(LiFi) 등이 포함되나 이에 한정되지는 않는다.
이하에서 도 2 내지 도 4를 참조하여 관리 장치(100)가 엣지 장치들(120, 130)의 상태를 감시하는 방법을 설명한다.
도 2는 본 발명의 일 실시예에 따른 수집 데이터를 기초로 엣지 장치들의 상태를 감시하는 방법을 설명하는 흐름도이다.
도 2를 참조하면, 관리 장치(110)는 엣지 장치들(120, 130)로부터 전송되는 수집 데이터가 정상적으로 수신되는지 여부를 기초로 엣지 장치들(120, 130)의 상태를 체크한다. 이때, 스탠바이 상태의 제2엣지 장치(130)는 하위 장비들(140)로부터 데이터를 수집하지 않으므로 자신의 정상 상태를 관리 장치(110)에 알리기 위해 더미 수집 데이터를 주기적으로 전송한다.
단계 S201에서, 제1엣지 장치(120)는 하위 장비들(140)로부터 수집된 수집 데이터를 정해진 주기에 관리 장치(110)로 전송한다. 단계 S202에서, 관리 장치(110)는 정해진 주기에 제1엣지 장치(120)로부터 수집 데이터가 수신되는 경우, 제1엣지 장치(120)는 정상 상태인 것으로 판단한다.
단계 S203에서, 제2엣지 장치(130)는 정해진 주기에 더미 수집 데이터를 생성하여 관리 장치(110)로 전송한다. 단계 S204에서, 관리 장치(110)는 정해진 주기에 제2엣지 장치(130)로부터 더미 수집 데이터가 수신되는 경우, 제2엣지 장치(130)는 정상 상태인 것으로 판단한다.
한편, 단계 S205에서, 관리 장치(110)는 정해진 주기에 제1엣지 장치(120)로부터 수집 데이터가 수신되지 않을 경우, 제1엣지 장치(120)는 비정상 상태인 것으로 판단한다. 그리고 단계 S206에서, 관리 장치(110)는 정해진 주기에 제2엣지 장치(130)로부터 더미 수집 데이터가 수신되는 경우, 제2엣지 장치(130)는 정상 상태인 것으로 판단한다.
이와 같이 제1엣지 장치(120)는 비정상 상태, 그리고 제2엣지 장치(130)는 정상 상태인 것으로 판단될 경우, 관리 장치(110)는 스탠바이 상태의 제2엣지 장치(130)로 가동 명령을 전송하여 제1엣지 장치(130)를 대신하여 제2엣지 장치(130)에서 데이터 수집 및 보고 동작을 수행하도록 제어할 수 있다.
도 3은 본 발명의 일 실시예에 따른 상태 체크 메시지를 기초로 엣지 장치들의 상태를 감시하는 방법을 설명하는 흐름도이다. 여기서 상태 체크 메시지는 alive 메시지를 예로 들어 설명한다.
도 3을 참조하면, 단계 S301에서, 관리 장치(110)는 alive 메시지를 제1엣지 장치(120)로 전송한다. 또한 단계 S302에서, 관리 장치(110)는 alive 메시지를 제2엣지 장치(130)로 전송한다.
단계 S303에서, 관리 장치(110)는 alive 메시지 전송 후 소정 시간 이내에 제1엣지 장치(120)로부터 응답이 수신되지 않으면, 제1엣지 장치(120)를 비정상 상태로 판단한다.
단계 S304에서, 관리 장치(110)는 alive 메시지 전송 후 소정 시간 이내에 제2엣지 장치(130)로부터 응답을 수신한다. 단계 S305에서, 관리 장치(110)는, 제2엣지 장치(130)를 정상 상태로 판단한다.
이와 같이 제1엣지 장치(120)는 비정상 상태, 제2엣지 장치(130)는 정상 상태인 것으로 판단될 경우, 관리 장치(110)는 스탠바이 상태의 제2엣지 장치(130)로 가동 명령을 전송하여 제1엣지 장치(130)를 대신하여 제2엣지 장치(130)에서 데이터 수집 및 보고 동작을 수행하도록 제어할 수 있다.
도 4는 본 발명의 일 실시예에 따른 엣지 장치 상호간 통신을 이용하여 엣지 장치들의 상태를 감시하는 방법을 설명하는 흐름도이다.
도 4를 참조하면, 단계 S401에서, 제1엣지 장치(120)는 상태 체크 메시지인 alive 메시지를 제2엣지 장치(130)로 전송한다. 단계 S402에서, 제1엣지 장치(120)는 alive 메시지 전송 후 소정 시간 이내에 제2엣지 장치(130)로부터 응답을 수신한다. 단계 S403에서, 제1엣지 장치(120)는 제2엣지 장치(130)로부터 응답이 수신되었으므로 응답 결과를 관리 장치(110)로 전송한다.
일 실시예에서, 제1엣지 장치(120)는, alive 메시지 전송 후 소정 시간 이내에 제2엣지 장치(130)로부터 응답이 수신되지 않으면, 미응답 결과를 관리 장치(110)로 전송한다.
단계 S404에서, 제2엣지 장치(130)는 상태 체크 메시지인 alive 메시지를 제1엣지 장치(120)로 전송한다. 단계 S405에서, 제2엣지 장치(130)는 alive 메시지 전송 후 소정 시간 이내에 제1엣지 장치(120)로부터 응답을 수신한다. 단계 S406에서, 제2엣지 장치(130)는 제1엣지 장치(120)로부터 응답이 수신되었으므로 응답 결과를 관리 장치(110)로 전송한다 .
일 실시예에서, 제2엣지 장치(130)는, alive 메시지 전송 후 소정 시간 이내에 제1엣지 장치(120)로부터 응답이 수신되지 않으면, 미응답 결과를 관리 장치(110)로 전송한다.
두 엣지 장치(120, 130) 상호간의 상태 체크는 주기적으로 수행될 수 있다. 관리 장치(110)는, 제1엣지 장치(120)로부터 제2엣지 장치(130)에 대한 미응답 결과가 수신되고, 제2엣지 장치(130)로부터 제1엣지 장치(120)에 대한 응답 또는 미응답 결과가 수신되지 않으면, 제2엣지 장치(130)를 비정상 상태로 판단하고, 스탠바이 상태의 제2엣지 장치(130)로 가동 명령을 전송하여 제1엣지 장치(130)를 대신하여 제2엣지 장치(130)에서 데이터 수집 및 보고 동작을 수행하도록 제어할 수 있다.
이상의 도 2 내지 도 4를 참조하여 설명한 각 실시예 중 어느 하나의 실시예만으로도 액티브 상태인 제1엣지 장치(120)의 비정상 상태를 판단할 수 있다. 다른 실시예로서, 도 2 내지 도 4를 참조하여 설명한 각 실시예의 조건을 모두 고려하여, 액티브 상태인 제1엣지 장치(120)의 구체적인 비정상 상태의 구체적인 원인을 파악할 수 있다.
예를 들어, 제2엣지 장치(130)는, 도 2 내지 도 4의 실시예에서 모두 정상 상태이고, 제1엣지 장치(120)는 도 2의 실시예에서 비정상 상태로 판단되면서 도 3 및 도 4의 실시예에서만 정상 상태로 판단될 경우, 관리 장치(110)는, 제1엣지 장치(120)를 펌웨어 이상으로 판단할 수 있다. 또는, 제2엣지 장치(130)는, 도 2 내지 도 4의 실시예에서 모두 정상 상태이고, 제1엣지 장치(120)는 도 2 내지 도 4의 실시예 모두에서 비정상 상태로 판단될 경우, 관리 장치(110)는, 제1엣지 장치(120)의 고장으로 판단할 수 있다. 또는, 관리 장치(110)는, 두 엣지 장치(120, 130) 모두 도 2 내지 도 4의 실시예에서 비정상 상태로 판단될 경우, 네트워크 장애로 판단할 수 있다.
한편, 이상의 도 2 내지 도 4를 참조하여 설명한 실시예는, 엣지 장치들(120, 130) 자체의 상태를 감시한다. 클라우드 서비스 환경에서의 문제는, 엣지 장치들(120, 130) 자체에만 있지 않고, 엣지 장치들(120, 130)과 하위 장비들(140) 간의 통신 구간에서 또는 하위 장비들(140) 자체에서 발생할 수도 있다. 즉, 하위 장비(140)의 비정상으로 발생할 수 있다. 이하에서는 도 5를 참조하여 비정상 하위 장비(140)를 분석하는 방법을 설명한다.
도 5는 본 발명의 일 실시예에 따른 엣지 장치에서 비정상 하위 장비를 분석하는 방법을 설명하는 흐름도이다.
도 5를 참조하면, 단계 S501에서, 액티브 상태인 제1엣지 장치(120)는, 하위 장비들(140)로부터 데이터를 수집한다. 제1엣지 장치(120)는, 하위 장비들(140)의 특성에 따라 폴링 방식(Polling), 요청/응답 방식(Request/Response), 폴링 방식과 요청/응답 방식을 결합한 혼합 방식(complex) 등을 이용하여 데이터를 수집할 수 있다.
단계 S502에서, 제1엣지 장치(120)는, 각 하위 장비(140)의 데이터 수집 응답시간을 산출한다. 예를 들어, 제1엣지 장치(120)는 하위 장비(140)로 데이터 요청을 전송하고 이에 대한 응답을 수신할 때까지의 시간을 측정하는 방식 또는 주기적으로 하위 장비(140)로부터 데이터를 수신할 경우 정해진 주기와 실제 수신 시간의 시간차를 측정하는 방식 등으로 데이터 수집 응답시간을 산출할 수 있다.
단계 S503에서, 제1엣지 장치(120)는, 기준 시간 이상의 수집 응답시간 횟수(C1)를 카운트한다. 제1엣지 장치(120)는 각 하위 장비(140)별로 기준 시간 이상의 수집 응답시간 횟수(C1)를 카운트할 수 있고, 전체 하위 장비(140)에 대한 기준 시간 이상의 수집 응답시간 횟수(C1)를 카운트할 수도 있다.
단계 S504에서, 제1엣지 장치(120)는, 수집 타임아웃 횟수(C2)를 카운트한다. 수집 타임아웃은 하위 장비(140)로부터 정해진 시간 이내에 데이터가 수신되지 않는 것을 의미하고, 수집 타임아웃 횟수란, 하위 장비(140)로부터 정해진 시간 이내에 데이터가 수신되지 않은 횟수를 의미한다. 예를 들어, 제1엣지 장치(120)는 하위 장비(140)로 데이터 요청을 전송하면서 타이머를 구동하고 소정의 정해진 시간 이내에 해당 하위 장비(140)로부터 응답이 수신되지 않으면 수집 타임아웃으로 판단한다. 제1엣지 장치(120)는 각 하위 장비(140)별로 수집 타임아웃 횟수(C2)를 카운트할 수 있고, 전체 하위 장비(140)에 대해 수집 타임아웃 횟수(C2)를 카운트할 수도 있다.
단계 S505에서, 제1엣지 장치(120)는, 상기 수집 응답시간 횟수(C1)가 제1임계 횟수 보다 큰지, 또는 상기 수집 타임아웃 횟수(C2)가 제2임계 횟수 보다 큰지 확인한다.
만약, 상기 수집 응답시간 횟수(C1)가 제1임계 횟수 보다 크거나, 또는 상기 수집 타임아웃 횟수(C2)가 제2임계 횟수 보다 큰 경우, 단계 S506에서, 제1엣지 장치(120)는, 상기 수집 응답시간 횟수(C1) 또는 상기 수집 타임아웃 횟수(C2)를 유발한 하위 장비(140)의 정보를 추출한다. 이때, 제1엣지 장치(120)는, 상기 수집 응답시간 횟수(C1) 또는 상기 수집 타임아웃 횟수(C2)를 가장 많이 유발한 하위 장비(140)를 선택할 수 있고, 또는 1회라도 유발한 하위 장비(140)를 선택할 수 있다.
단계 S507에서, 제1엣지 장치(120)는, 추출된 하위 장비(140)의 정보를 관리 장치(110)로 보고한다.
이상의 도 5를 참조하여 설명한 방법에 따라 관리 장치(110)로 보고된 하위 장비(140)는, 통신 불안 등의 비정상 상태이다. 즉 제1엣지 장치(120)와 하위 장비(140) 간의 네트워크 부하에 의해 지연이 발생하는 상황일 수 있고, 또는 하위 장비(140) 자체의 통신 이상이 발생한 상황일 수도 있다. 따라서, 먼저 관리 장치(110)는 스탠바이 상태의 제2엣지 장치(130)를 가동시키고, 상기 보고된 하위 장비(140)의 정보를 제2엣지 장치(130)로 전송하여, 제2엣지 장치(130)로 하여금 상기 보고된 하위 장비(140)로부터 데이터를 수집하도록 제어한다. 즉 부분 이중화가 수행된다.
제2엣지 장치(130)는 상기 보고된 하위 장비(140)로부터 데이터를 수집하여 클라우드 시스템으로 전송한다. 이때, 제2엣지 장치(130)는 도 5를 참조하여 설명한 방법에 따라 상기 보고된 하위 장비(140)를 비정상 상태로 판단하여 관리 장치(110)로 보고한다. 만약 제1엣지 장치(120)에서 판단된 결과와 마찬가지로 여전히 상기 보고된 하위 장비(140)가 비정상 상태로 판단될 경우, 관리 장치(110)는 엣지 장치(120, 130)와 하위 장비(140) 간의 통신 구간의 장애, 또는 하위 장비(140) 자체의 통신 이상이 아닌, 하위 장비(140) 자체의 고장으로 판단할 수 있다.
관리 장치(110)는, 액티브 상태의 제1엣지 장치(120)로부터 스탠바이 상태의 제2엣지 장치(130)로의 이중화 전환을 한 후, 다시 액티브 상태의 제1엣지 장치(120)로 이중화 전환을 원복(즉, 롤백(roll back))할 수 있다. 예를 들어, 제1엣지 장치(120)의 비정상으로 인해 스탠바이 상태의 제2엣지 장치(130)로 전면 이중화 전환이 된 후, 제1엣지 장치(120)가 정상 상태로 복귀되어 정상 동작이 가능해지면, 제2엣지 장치(130)를 스탠바이 상태로 다시 전환하고 제1엣지 장치(120)에서 원래대로 데이터를 수집하도록 제어할 수 있다.
관리 장치(110)는, 태그 맵 테이블을 구비한다. 태그 맵 테이블은, 하위 장비(140)의 주소, 장비 ID, 태그, 값, 시간 정보 등을 기록한다. 여기서 하위 장비(140)의 주소는 IP 주소를 의미하고, 장비 ID는 장비의 고유 식별번호를 의미하며, 태그는 관제점(Control Point)으로서 장비 입출력을 개별적으로 구분하는 논리적인 단위이며, 값은 관제점의 값을 의미한다. 관리 장치(110)는 이러한 태그 맵 테이블을 엣지 장치(120, 130) 각각에 대해 구비할 수 있다.
관리 장치(110)는, 특정 하위 장비(140)에 대한 제어 요청이나 모니터링 정보 요청 등이 수신되면, 상기 태그 맵 테이블에서 해당하는 하위 장비(140)를 식별하고, 그 식별된 하위 장비(140)에 대응하는 태그와 제어 명령을 엣지 장치(120, 130)로 전송할 수 있고, 엣지 장치(120, 130)로부터 수신되는 태그와 상태 정보의 값 등을 상기 태그 맵 테이블에 기록한다.
관리 장치(110)는, 제1엣지 장치(120)로부터 제2엣지 장치(130)로 전면 이중화 전환을 한 후, 제1엣지 장치(120)와 제2엣지 장치(130)로부터 중복하여 태그 데이터가 수신되면, 이중화 전환 전의 태그 매핑 테이블의 상태를 확인하여, 이중화 전환을 원복(즉, 롤백(roll back)할 수 있다. 즉, 관리 장치(110)는, 제2엣지 장치(130)를 스탠바이 상태로 원복시키기 위한 원복 명령을 전송할 수 있다. 예를 들어, 관리 장치(110)는 제2엣지 장치(130)로 태그 구성 정보를 전송할 수 있다.
도 6은 본 발명의 일 실시예에 따른 이중화 원복을 위한 태그 매핑 테이블의 예를 나타낸 도면이다. 도 6의 (a)는 관리 장치(110)에서 관리하는 제1엣지 장치(120)에 대한 태그 매핑 테이블이고 도 6의 (b)는 관리 장치(110)에서 관리하는 제2엣지 장치(130)에 대한 태그 매핑 테이블이다. 본 실시예에서 태그 매핑 테이블의 필드 중 데이터 수집 시간, 수집 값, 태그만을 도시한다.
도 6을 참조하면, 제1엣지 장치(120)는 액티브 상태로서 1분 주기로 태그1(TAG_1) 내지 태그6(TAG_6)에 대응하는 하위 장비(140)로부터 데이터를 수집하여 관리 장치(110)로 전송한다. 제2엣지 장치(130)는 스탠바이 상태로 대기 중이다. 1시 1분에 제1엣지 장치(120)는 정상 상태로 태그1(TAG_1) 내지 태그6(TAG_6)에 대응하는 하위 장비(140)로부터 데이터를 수집하여 관리 장치(110)로 전송한다.
관리 장치(110)는, 제1엣지 장치(120)의 태그 매핑 테이블에 1시 1분에 각 태그별로 수집된 데이터 값을 기록한다(601a). 이때 제2엣지 장치(130)는 스탠바이 상태이므로 제2엣지 장치(130)의 태그 매핑 테이블에는 1시 1분의 수집 데이터 값 그리고 태그가 기록되지 않는다(601a).
1시 2분 전에 제1엣지 장치(120)가 비정상 상태가 되어 제1엣지 장치(120)로부터 수집 데이터가 수신되지 않으면, 관리 장치(110)는 스탠바이 상태의 제2엣지 장치(130)를 이중화 가동시키고, 제2엣지 장치(130)로 태그1 내지 태그6의 구성 정보를 전송하여, 제2엣지 장치(130)를 통해 태그1 내지 태그6에 대응하는 하위 장비(140)로부터 수집 데이터를 수신한다. 관리 장치(110)는, 도 6에 도시된 바와 같이, 제1엣지 장치(120)의 태그 매핑 테이블에 1시 2분의 수집 데이터 값, 태그를 기록하지 않고(602a), 제2엣지 장치(130)의 태그 매핑 테이블에 1시 2분의 수집 데이터 값, 태그를 기록한다(602a).
이후 제1엣지 장치(120)가 정상 상태로 복구되어 통신 재개되면, 관리 장치(110)는 제1엣지 장치(120)와 제2엣지 장치(130)로부터 동시에 동일 태그의 수집 데이터를 수신한다. 즉, 도 6에 도시된 바와 같이, 제1엣지 장치(120)의 태그 매핑 테이블에 1시 3분의 수집 데이터 값, 태그가 기록되고(603a), 제2엣지 장치(130)의 태그 매핑 테이블에도 1시 3분의 수집 데이터 값, 태그가 기록한다(603a).
이와 같이 1시 3분에 중복 태그 데이터가 발생하므로, 관리 장치(110)는, 이중화 전환을 원복(즉, 롤백(roll back))한다. 관리 장치(110)는, 제2엣지 장치(130)를 스탠바이 상태로 원복시키기 위한 원복 명령을 전송할 수 있다.
도 7은 본 발명의 일 실시예에 따른 관리 장치의 구성을 나타낸 도면이다. 관리 장치(110)는, 메모리, 메모리 제어기, 하나 이상의 프로세서(CPU), 주변 인터페이스, 입출력(I/O) 서브시스템, 디스플레이 장치, 입력 장치 및 통신 모듈을 포함할 수 있다. 메모리는 고속 랜덤 액세스 메모리를 포함할 수 있고, 또한 하나 이상의 자기 디스크 저장 장치, 플래시 메모리 장치와 같은 불휘발성 메모리, 또는 다른 불휘발성 반도체 메모리 장치를 포함할 수 있다.
프로세서 및 주변 인터페이스와 같은 다른 구성요소에 의한 메모리로의 액세스는 메모리 제어기에 의하여 제어될 수 있다. 메모리는 각종 정보와 프로그램 명령어를 저장할 수 있고, 프로그램은 프로세서에 의해 실행된다. 주변 인터페이스는 입출력 주변 장치를 프로세서 및 메모리와 연결한다. 하나 이상의 프로세서는 다양한 소프트웨어 프로그램 및/또는 메모리에 저장되어 있는 명령어 세트를 실행하여 시스템을 위한 여러 기능을 수행하고 데이터를 처리한다.
I/O 서브시스템은 디스플레이 장치, 입력 장치와 같은 입출력 주변장치와 주변 인터페이스 사이에 인터페이스를 제공한다. 디스플레이 장치는 LCD/LPD/OLED 기술 등의 다양한 기술을 사용할 수 있다. 프로세서는 시스템에 연관된 동작을 수행하고 명령어들을 수행하도록 구성된 프로세서로서, 예를 들어, 메모리로부터 검색된 명령어들을 이용하여, 시스템의 컴포넌트 간의 입력 및 출력 데이터의 수신과 조작을 제어할 수 있다. 통신 모듈은 외부 포트를 통한 통신 또는 RF 신호에 의한 통신을 수행한다. 통신 모듈은 전기 신호를 RF 신호로 또는 그 반대로 변환하며 이 RF 신호를 통하여 통신 네트워크, 다른 이동형 게이트웨이 장치 및 통신 장치와 통신할 수 있다.
도 7에 도시된 바와 같이, 본 실시예에 따른 관리 장치(110)는, 통신부(710), 판단부(720), 제어부(730) 및 저장부(740)를 포함하고, 이 구성요소들은 프로그램으로 구현되어 메모리에 저장되어 프로세서에 의해 실행될 수 있고, 또는 하드웨어와 소프트웨어의 조합으로 구현되어 동작할 수 있다. 예를 들어, 이 구성요소들은 가상 머신으로 구현되어 동작할 수 있다.
통신부(710)는, 이중화된 엣지 장치들(120, 130)과 통신한다. 통신부(710)는 엣지 장치들(120, 130)로 제어 명령을 전송하고, 엣지 장치들(120, 130)로부터 제어 명령에 대한 응답, 하위 장비들(140)에 대한 수집 데이터, 및 엣지 장치들(120, 130)의 상태 관련 데이터를 수신할 수 있다.
판단부(720)는, 이중화된 엣지 장치들(120, 130)의 상태를 판단한다. 판단부(720)는, 엣지 장치들(120, 130)로부터의 수집 데이터의 전송 상태를 기초로, 또는 엣지 장치들(120, 130)에 대한 상태 체크 메시지의 전송을 통해, 또는 엣지 장치들(120, 130) 상호간의 상태 체크 결과를 통해, 엣지 장치들(120, 130)의 상태를 판단할 수 있다.
일 실시예에서, 판단부(720)는, 정해진 주기에 엣지 장치(120, 130)로부터 수집 데이터가 수신되면, 엣지 장치(120, 130)를 정상 상태로 판단하고, 정해진 주기에 엣지 장치(120, 130)로부터 수집 데이터가 미수신되면, 엣지 장치(120, 130)를 비정상 상태로 판단할 수 있다. 이때, 액티브 상태의 엣지 장치(120)로부터 수신되는 수집 데이터는 실제 수집 데이터이고, 스탠바이 상태의 엣지 장치(130)로부터 수신되는 수집 데이터는 더미 수집 데이터이다.
일 실시예에서, 판단부(720)는, 엣지 장치(120, 130)로 상태 체크 메시지(예, alive 메시지)를 전송하고, 소정 시간 이내에 응답이 수신되면 정상 상태로 판단하고, 소정 시간 이내에 응답이 수신되지 않으면, 비정상 상태로 판단할 수 있다.
일 실시예에서, 판단부(720)는, 엣지 장치(120, 130) 상호간에 상태를 체크한 결과를 각 엣지 장치(120, 130)로부터 수신한다. 즉, 판단부(720)는, 제1엣지 장치(120)로부터 제2엣지 장치(130)의 상태 체크 결과를 수신하고, 제2엣지 장치(130)로부터는 제1엣지 장치(120)의 상태 체크 결과를 수신한다. 판단부(720)는, 각 엣지 장치(120, 130)로부터 수신되는 상대 엣지 장치의 상태 체크 결과를 기초로, 각 엣지 장치(120, 130)의 정상 또는 비정상 상태를 판단할 수 있다.
구체적으로, 판단부(720)는, 제1엣지 장치(120)로부터 제2엣지 장치(130)에 대한 미응답 결과가 수신되고, 제2엣지 장치(130)로부터 제1엣지 장치(120)에 대한 응답 또는 미응답 결과가 전혀 수신되지 않으면, 제2엣지 장치(130)를 비정상 상태로 판단할 수 있다. 판단부(720)는, 제2엣지 장치(130)로부터 제1엣지 장치(120)에 대한 미응답 결과가 수신되고, 제1엣지 장치(120)로부터 제2엣지 장치(130)에 대한 응답 또는 미응답 결과가 전혀 수신되지 않으면, 제2엣지 장치(130)를 비정상 상태로 판단할 수 있다.
일 실시예에서, 판단부(720)는, 엣지 장치들(120, 130)의 자체 상태 뿐만 아니라, 하위 장비(140)의 상태를 판단할 수 있다. 여기서 하위 장비(140)의 상태는, 엣지 장치(120, 130)와 하위 장비(140) 간의 통신 구간의 불안 또는 하위 장비(140) 자체의 통신 불안일 수 있다. 구체적으로, 판단부(720)는, 엣지 장치(120, 130)로부터, 하위 장비들(140)에 대한 수집 타임아웃 횟수(C2) 및 기준 시간 이상의 수집 응답시간 횟수(C1)를 기초로 추출된 하위 장비(140)의 정보를 수신할 수 있다. 판단부(720)는, 수신된 하위 장비(140)의 정보에 대응하는 하위 장비(140)를 비정상 상태로 판단할 수 있다.
이때, 판단부(720)는, 수집 응답시간 횟수(C1)가 제1임계 횟수 보다 크거나, 또는 수집 타임아웃 횟수(C2)가 제2임계 횟수 보다 큰 경우에, 이에 기초하여 엣지 장치(120, 130)로부터 하위 장비(140)의 정보를 수신할 수 있다. 판단부(720)는, 상기 수집 응답시간 횟수(C1) 또는 상기 수집 타임아웃 횟수(C2)를 가장 많이 유발한 하위 장비(140) 또는, 1회라도 유발한 하위 장비(140)의 정보를 수신할 수 있다.
일 실시예에서, 판단부(720)는, 이중화된 엣지 장치(120, 130) 중 액티브 상태의 제1엣지 장치(120)가 비정상 상태일 경우, 그 구체적인 원인을 판단할 수 있다. 구체적으로, 판단부(720)는, 수집 데이터, 상태 체크 메시지 및, 엣지 장치(120, 130) 상호간의 상태 체크 결과 모두를 기초로 판단한 제2엣지 장치(130)의 상태는 정상이고, 수집 데이터를 기초로 판단한 제1엣지 장치(120)의 상태는 비정상인 경우, 제1엣지 장치(120)를 펌웨어 이상으로 판단할 수 있다.
판단부(720)는, 수집 데이터, 상태 체크 메시지 및, 엣지 장치(120, 130) 상호간의 상태 체크 결과 모두를 기초로 판단한 제2엣지 장치(130)의 상태는 정상이고, 반면 수집 데이터, 상태 체크 메시지 및, 엣지 장치(120, 130) 상호간의 상태 체크 결과 모두를 기초로 판단한 제1엣지 장치(120)의 상태는 비정상인 경우, 제1엣지 장치(120)의 고장으로 판단할 수 있다. 또는, 판단부(720)는, 수집 데이터, 상태 체크 메시지 및, 엣지 장치(120, 130) 상호간의 상태 체크 결과 모두를 기초로 판단할 때, 제1, 2엣지 장치(120, 130) 모두 비정상 상태로 판단될 경우, 네트워크 장애로 판단할 수 있다.
판단부(720)는 구체적인 원인을 디스플레이 장치 등을 통해 출력하거나 문자 메시지, 이메일, 또는 어플리케이션을 통한 푸시 메시지 등을 통해 관리자에게 알릴 수 있다.
제어부(730)는, 엣지 장치들(120, 130)의 상태를 기초로 엣지 장치들(120, 130)의 이중화 전환을 제어한다. 즉, 액티브 상태의 제1엣지 장치(120)가 비정상 상태인 경우, 스탠바이 상태의 제2엣지 장치(120)를 가동하여 액티브 상태의 제1엣지 장치(120)에서 수행하던 임무를 스탠바이 상태였던 제2엣지 장치(130)에서 수행하도록 제어한다.
또한, 제어부(730)는, 비정상 상태로 판단된 하위 장비(140)에 대한 데이터 수집의 임무를 액티브 상태의 제1엣지 장치(120)로부터 스탠바이 상태의 제2엣지 장치(130)로 전환하는 제어를 할 수 있다. 즉, 제어부(730)는, 전면 이중화 전환이 아닌 부분 이중화 전환을 수행한다.
일 실시예에서, 판단부(720)는, 부분 이중화 전환 후 제2엣지 장치(130)에서 데이터를 수집하는 하위 장비(140)가 여전히 비정상 상태로 판단될 경우, 하위 장비(140) 자체의 문제, 즉 하위 장비(140)의 고장으로 판단할 수 있다.
저장부(740)는, 태그 맵 테이블을 저장한다. 태그 맵 테이블은, 하위 장비(140)의 주소, 장비 ID, 태그, 값, 시간 정보 등을 기록한다. 여기서 하위 장비(140)의 주소는 IP 주소를 의미하고, 장비 ID는 장비의 고유 식별번호를 의미하며, 태그는 관제점(Control Point)으로서 장비 입출력을 개별적으로 구분하는 논리적인 단위이며, 값은 관제점의 값을 의미한다. 저장부(740)는, 태그 맵 테이블을 엣지 장치(120, 130) 각각에 대해 저장할 수 있다.
일 실시예에서, 판단부(720)는, 제1엣지 장치(120)의 비정상으로 인해 스탠바이 상태의 제2엣지 장치(130)로 전면 이중화 전환이 된 후, 다시 액티브 상태의 제1엣지 장치(120)로 이중화 전환을 원복할지 여부를 판단할 수 있다. 판단부(720)는, 제1엣지 장치(120)와 제2엣지 장치(130)로부터 중복하여 태그 데이터가 수신되면, 원복하는 것으로 결정할 수 있다.
제어부(730)는, 상기 판단부(720)에 의해 원복이 결정되면, 이중화 전환 전의 태그 매핑 테이블의 상태를 확인하여, 이중화 전환을 원복(즉, 롤백(roll back)할 수 있다. 즉, 제어부(730)는, 제2엣지 장치(130)를 스탠바이 상태로 원복시키기 위한 원복 명령을 전송할 수 있다. 예를 들어, 제어부(730)는, 통신부(710)를 통해 제2엣지 장치(130)로 태그 구성 정보를 전송할 수 있다.
본 명세서는 많은 특징을 포함하는 반면, 그러한 특징은 본 발명의 범위 또는 특허청구범위를 제한하는 것으로 해석되어서는 안 된다. 또한, 본 명세서에서 개별적인 실시예에서 설명된 특징들은 단일 실시예에서 결합되어 구현될 수 있다. 반대로, 본 명세서에서 단일 실시예에서 설명된 다양한 특징들은 개별적으로 다양한 실시예에서 구현되거나, 적절히 결합되어 구현될 수 있다.
도면에서 동작들이 특정한 순서로 설명되었으나, 그러한 동작들이 도시된 바와 같은 특정한 순서로 수행되는 것으로, 또는 일련의 연속된 순서, 또는 원하는 결과를 얻기 위해 모든 설명된 동작이 수행되는 것으로 이해되어서는 안 된다. 특정 환경에서 멀티태스킹 및 병렬 프로세싱이 유리할 수 있다. 아울러, 상술한 실시예에서 다양한 시스템 구성요소의 구분은 모든 실시예에서 그러한 구분을 요구하지 않는 것으로 이해되어야 한다. 상술한 프로그램 구성요소 및 시스템은 일반적으로 단일 소프트웨어 제품 또는 멀티플 소프트웨어 제품에 패키지로 구현될 수 있다.
상술한 바와 같은 본 발명의 방법은 프로그램으로 구현되어 컴퓨터로 읽을 수 있는 형태로 기록매체(시디롬, 램, 롬, 플로피 디스크, 하드 디스크, 광자기 디스크 등)에 저장될 수 있다. 이러한 과정은 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자가 용이하게 실시할 수 있으므로 더 이상 상세히 설명하지 않기로 한다.
이상에서 설명한 본 발명은, 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 있어 본 발명의 기술적 사상을 벗어나지 않는 범위 내에서 여러 가지 치환, 변형 및 변경이 가능하므로 전술한 실시예 및 첨부된 도면에 의해 한정되는 것이 아니다.
110 : 관리 장치
120, 130 : 엣지 장치
140 : 하위 장비
710 : 통신부
720 : 판단부
730 : 제어부
740 : 저장부

Claims (19)

  1. 하위 장비들과 클라우드 서비스 시스템 사이에서 상기 하위 장비들로부터 수집한 수집 데이터를 상기 클라우드 서비스 시스템으로 전송하는 이중화된 액티브 상태의 제1엣지 장치와 스탠바이 상태의 제2엣지 장치를 관리하는 상기 클라우드 서비스 시스템의 관리 장치에 있어서,
    상기 제1, 2엣지 장치와 통신하는 통신부;
    상기 제1, 2 엣지 장치의 상태를 판단하는 판단부; 및
    비정상 상태로 판단된 상기 제1엣지 장치로부터 정상 상태로 판단된 상기 제2엣지 장치로의 이중화 전환을 제어하는 제어부를 포함하는 관리 장치.
  2. 제1항에 있어서,
    상기 판단부는,
    상기 제1, 2엣지 장치로부터의 수집 데이터의 수신 상태를 기초로 상기 제1, 2 엣지 장치의 상태를 판단하고,
    상기 제2엣지 장치로부터 수신되는 수집 데이터는 더미 데이터인 것을 특징으로 하는 관리 장치.
  3. 제1항에 있어서,
    상기 판단부는,
    상기 제1, 2엣지 장치로 상태 체크 메시지를 전송하고 이에 대한 응답 수신 여부에 기초하여 상기 제1, 2 엣지 장치의 상태를 판단하는 것을 특징으로 하는 관리 장치.
  4. 제1항에 있어서,
    상기 판단부는,
    상기 제1, 2엣지 장치로부터 수신되는, 상기 제1, 2엣지 장치 상호간 통신에 의해 체크한 상대 엣지 장치의 상태 체크 결과를 기초로, 상기 제1, 2 엣지 장치의 상태를 판단하는 것을 특징으로 하는 관리 장치.
  5. 제2항 내지 제4항 중 어느 한 항에 있어서,
    상기 판단부는, 상기 제1, 2엣지 장치 각각으로부터 동일한 태그를 포함하는 수집 데이터가 중복하여 수신되는 경우 원복을 결정하고,
    상기 제어부는, 상기 원복 결정에 따라 상기 제1, 2엣지 장치 간의 이중화 전환을 원래 상태로 복귀시키는 것을 특징으로 하는 관리 장치.
  6. 제1항에 있어서,
    상기 판단부는,
    상기 제1, 2엣지 장치로부터의 수집 데이터의 수신 상태; 상기 제1, 2엣지 장치로 상태 체크 메시지를 전송하고 이에 대한 응답 수신 여부; 및 상기 제1, 2엣지 장치로부터 수신되는, 상기 제1, 2엣지 장치 상호간 통신에 의해 체크한 상대 엣지 장치의 상태 체크 결과;를 기초로, 상기 제1, 2 엣지 장치의 상태를 판단하고, 또한 상기 제1엣지 장치의 비정상 원인을 판단하는 것을 특징으로 하는 관리 장치.
  7. 제6항에 있어서,
    상기 판단부는,
    상기 제2엣지 장치는 정상 상태이고, 상기 수집 데이터의 수신 상태에 의해서만 상기 제1엣지 장치가 비정상 상태로 판단될 경우, 상기 제1엣지 장치의 펌웨어 이상으로 판단하는 것을 특징으로 하는 관리 장치.
  8. 제6항에 있어서,
    상기 판단부는,
    상기 제2엣지 장치는 정상 상태이고, 상기 수집 데이터의 수신 상태, 상기 응답 수신 여부 및 상기 상태 체크 결과 모두에 의해 상기 제1엣지 장치가 비정상 상태로 판단될 경우, 상기 제1엣지 장치의 고장으로 판단하는 것을 특징으로 하는 관리 장치.
  9. 하위 장비들과 클라우드 서비스 시스템 사이에서 상기 하위 장비들로부터 수집한 수집 데이터를 상기 클라우드 서비스 시스템으로 전송하는 이중화된 액티브 상태의 제1엣지 장치와 스탠바이 상태의 제2엣지 장치를 관리하는 상기 클라우드 서비스 시스템의 관리 장치에 있어서,
    상기 제1, 2엣지 장치와 통신하는 통신부;
    상기 하위 장비들 중 비정상 상태의 하위 장비를 판단하는 판단부; 및
    상기 제2엣지 장치로 하여금 상기 비정상 상태의 하위 장비로부터 데이터를 수집하도록 부분 이중화 전환 제어를 하는 제어부를 포함하는 관리 장치.
  10. 제9항에 있어서,
    상기 판단부는,
    상기 제1엣지 장치로부터, 상기 하위 장비들에 대한 수집 타임아웃 횟수 및 기준 시간 이상의 수집 응답시간 횟수 중 적어도 하나를 기초로 추출된 하위 장비의 정보를 수신할 경우, 해당 하위 장비를 비정상 상태로 판단하는 것을 특징으로 하는 관리 장치.
  11. 제10항에 있어서,
    상기 판단부는,
    상기 비정상 상태의 하위 장비가 상기 부분 이중화 전환 후에도 비정상 상태인 경우, 해당 하위 장비를 고장으로 판단하는 것을 특징으로 하는 관리 장치.
  12. 하위 장비들과 클라우드 서비스 시스템 사이에서 상기 하위 장비들로부터 수집한 수집 데이터를 상기 클라우드 서비스 시스템으로 전송하는 이중화된 액티브 상태의 제1엣지 장치와 스탠바이 상태의 제2엣지 장치를 관리하는 상기 클라우드 서비스 시스템에서 관리하는 방법으로서,
    상기 제1, 2 엣지 장치의 상태를 판단하는 단계; 및
    비정상 상태로 판단된 상기 제1엣지 장치로부터 정상 상태로 판단된 상기 제2엣지 장치로의 이중화 전환을 제어하는 단계를 포함하는 방법.
  13. 제12항에 있어서,
    상기 판단하는 단계는,
    상기 제1, 2엣지 장치로부터의 상기 수집 데이터의 수신 상태를 기초로 상기 제1, 2 엣지 장치의 상태를 판단하고,
    상기 제2엣지 장치로부터 수신되는 수집 데이터는 더미 데이터인 것을 특징으로 하는 방법.
  14. 제12항에 있어서,
    상기 판단하는 단계는,
    상기 제1, 2엣지 장치로 상태 체크 메시지를 전송하고 이에 대한 응답 수신 여부에 기초하여 상기 제1, 2 엣지 장치의 상태를 판단하는 것을 특징으로 하는 방법.
  15. 제12항에 있어서,
    상기 판단하는 단계는,
    상기 제1, 2엣지 장치로부터 수신되는, 상기 제1, 2엣지 장치 상호간 통신에 의해 체크한 상대 엣지 장치의 상태 체크 결과를 기초로, 상기 제1, 2 엣지 장치의 상태를 판단하는 것을 특징으로 하는 방법.
  16. 제13항 내지 제15항 중 어느 한 항에 있어서,
    상기 제1, 2엣지 장치 각각으로부터 동일한 태그를 포함하는 수집 데이터가 중복하여 수신하는 단계; 및
    상기 제1, 2엣지 장치 간의 이중화 전환을 원래 상태로 복귀시키는 단계를 더 포함하는 것을 특징으로 하는 방법.
  17. 제12항에 있어서,
    상기 판단하는 단계는,
    상기 제1, 2엣지 장치로부터의 수집 데이터의 수신 상태; 상기 제1, 2엣지 장치로 상태 체크 메시지를 전송하고 이에 대한 응답 수신 여부; 및 상기 제1, 2엣지 장치로부터 수신되는, 상기 제1, 2엣지 장치 상호간 통신에 의해 체크한 상대 엣지 장치의 상태 체크 결과;를 기초로, 상기 제1, 2 엣지 장치의 상태를 판단하고, 또한 상기 제1엣지 장치의 비정상 원인을 판단하는 단계를 포함하는 것을 특징으로 하는 방법.
  18. 제17항에 있어서,
    상기 비정상 원인을 판단하는 단계는,
    상기 제2엣지 장치는 정상 상태이고, 상기 수집 데이터의 수신 상태에 의해서만 상기 제1엣지 장치가 비정상 상태로 판단될 경우, 상기 제1엣지 장치의 펌웨어 이상으로 판단하는 것을 특징으로 하는 방법.
  19. 제18항에 있어서,
    상기 비정상 원인을 판단하는 단계는,
    상기 제2엣지 장치는 정상 상태이고, 상기 수집 데이터의 수신 상태, 상기 응답 수신 여부 및 상기 상태 체크 결과 모두에 의해 상기 제1엣지 장치가 비정상 상태로 판단될 경우, 상기 제1엣지 장치의 고장으로 판단하는 것을 특징으로 하는 방법.
KR1020220001624A 2022-01-05 2022-01-05 클라우드 서비스를 위한 엣지 장치의 이중화 관리를 위한 장치 및 방법 KR20230105959A (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020220001624A KR20230105959A (ko) 2022-01-05 2022-01-05 클라우드 서비스를 위한 엣지 장치의 이중화 관리를 위한 장치 및 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020220001624A KR20230105959A (ko) 2022-01-05 2022-01-05 클라우드 서비스를 위한 엣지 장치의 이중화 관리를 위한 장치 및 방법

Publications (1)

Publication Number Publication Date
KR20230105959A true KR20230105959A (ko) 2023-07-12

Family

ID=87163597

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020220001624A KR20230105959A (ko) 2022-01-05 2022-01-05 클라우드 서비스를 위한 엣지 장치의 이중화 관리를 위한 장치 및 방법

Country Status (1)

Country Link
KR (1) KR20230105959A (ko)

Similar Documents

Publication Publication Date Title
US10715411B1 (en) Altering networking switch priority responsive to compute node fitness
CN105607590B (zh) 用于在过程控制系统中提供冗余性的方法和装置
CN108923992B (zh) 一种nas集群高可用方法、系统及电子设备和存储介质
CN106330475B (zh) 一种通信系统中管理主备节点的方法和装置及高可用集群
CN103607297A (zh) 一种计算机集群系统的故障处理方法
JP2007072571A (ja) 計算機システム及び管理計算機ならびにアクセスパス管理方法
US20120284435A1 (en) Zone group manager virtual phy
JP2004021556A (ja) 記憶制御装置およびその制御方法
WO2013019339A1 (en) Hardware failure mitigation
CN102710457A (zh) 一种跨网段的n+1备份方法及装置
CN102591717A (zh) 外接设备和虚拟设备的业务信息处理方法、装置和系统
JP2010103695A (ja) クラスタシステム、クラスタサーバ及びクラスタ制御方法
CN103036701A (zh) 一种跨网段的n+1备用方法及装置
CN113254205B (zh) 负载均衡系统、方法、装置、电子设备及存储介质
JP7107789B2 (ja) 情報処理システム、情報処理方法、及び、プログラム
KR20230105959A (ko) 클라우드 서비스를 위한 엣지 장치의 이중화 관리를 위한 장치 및 방법
CN114124803B (zh) 设备管理方法、装置、电子设备及存储介质
JP2014048933A (ja) プラント監視システム、プラント監視方法およびプラント監視プログラム
JP4806382B2 (ja) 冗長化システム
JP2002344450A (ja) 高可用性処理方法及びその実施システム並びにその処理プログラム
JP2012168907A (ja) 相互監視システム
CN111510336B (zh) 一种网络设备状态管理方法及装置
CN116339902A (zh) 超融合基础设施环境中的事件消息管理
JP2008003731A (ja) 情報処理システム
JP2010087834A (ja) ネットワーク監視システム