KR20220075164A - IoT 디바이스를 포함하는 시스템의 이상 탐지 장치 및 방법 - Google Patents

IoT 디바이스를 포함하는 시스템의 이상 탐지 장치 및 방법 Download PDF

Info

Publication number
KR20220075164A
KR20220075164A KR1020200163453A KR20200163453A KR20220075164A KR 20220075164 A KR20220075164 A KR 20220075164A KR 1020200163453 A KR1020200163453 A KR 1020200163453A KR 20200163453 A KR20200163453 A KR 20200163453A KR 20220075164 A KR20220075164 A KR 20220075164A
Authority
KR
South Korea
Prior art keywords
iot device
system including
communication packet
time
operating time
Prior art date
Application number
KR1020200163453A
Other languages
English (en)
Inventor
조재화
김회영
Original Assignee
주식회사 카카오모빌리티
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 카카오모빌리티 filed Critical 주식회사 카카오모빌리티
Priority to KR1020200163453A priority Critical patent/KR20220075164A/ko
Publication of KR20220075164A publication Critical patent/KR20220075164A/ko

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/06Generation of reports
    • H04L43/065Generation of reports related to network devices
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/06Generation of reports
    • H04L43/067Generation of reports using time frame reporting
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/12Protocols specially adapted for proprietary or special-purpose networking environments, e.g. medical networks, sensor networks, networks in vehicles or remote metering networks
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16YINFORMATION AND COMMUNICATION TECHNOLOGY SPECIALLY ADAPTED FOR THE INTERNET OF THINGS [IoT]
    • G16Y40/00IoT characterised by the purpose of the information processing
    • G16Y40/10Detection; Monitoring

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Computing Systems (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

무선 네트워크를 통해 서버에 연결되어 작동하는 IoT (Internet of Things) 디바이스를 포함하는 시스템의 이상을 탐지하기 위한 장치는, 상기 IoT 디바이스의 운영 시간을 파악하는 운영 시간 파악부, 상기 IoT 디바이스로 소정의 시간마다 통신 패킷을 전송하는 통신 패킷 전송부, 상기 통신 패킷 전송부로부터 전송한 상기 통신 패킷에 대한 상기 IoT 디바이스로부터의 응답을 수신하는 응답 수신부, 상기 응답 수신부가 수신한 상기 IoT 디바이스로부터의 상기 통신 패킷에 대한 응답을 토대로 상기 IoT 디바이스의 업(Up)/다운(Down) 상태를 판단하는 상태 판단부, 및 상기 운영 시간 파악부가 파악한 상기 IoT 디바이스의 상기 운영 시간 및 상기 상태 판단부가 판단한 상기 IoT 디바이스의 상기 업(Up)/다운(Down) 상태를 토대로 상기 시스템의 이상을 판단하는 이상 판단부를 구비한다.

Description

IoT 디바이스를 포함하는 시스템의 이상 탐지 장치 및 방법 {Method and Apparatus for Detecting Abnormality of System Including IoT Device}
본 발명은 IoT 디바이스를 포함하는 시스템의 이상 탐지 장치 및 방법에 관한 것이다.
최근 인터넷을 통한 IoT (Internet of Things) 디바이스의 접속 및 제어가 표준화되어 감에 따라 이러한 디바이스를 관리하기 위한 시스템이 요구되고 있다. 이러한 IoT 디바이스의 예로 상업용 디스플레이로 사용되는 디지털 사이니지가 있다.
이러한 디바이스의 관리는 매장 내의 메뉴 보드 관리, 옥외 LED 디스플레이 관리, 택시 내부의 태블릿 관리 등을 예로 들 수 있으며, 대부분의 경우 디스플레이 주변에 셋톱박스가 설치되고 이 셋톱박스가 인터넷을 통해 서버에 접속된다.
셋톱박스를 사용하는 디지털 사이니지의 경우, 셋톱박스의 이상을 탐지하기 위해서는 셋톱박스가 서버와 통신 가능한 업(Up) 상태인지 서버와 통신 불가능한 다운(Down) 상태인지를 모니터링할 필요가 있다. 이러한 업타임(Uptime) 모니터링은 모든 IoT 연결 장비에 공통적으로 필요한 기능이라고 할 수 있다.
종래의 업타임 모니터링은 서버가 셋톱박스로 소정의 시간마다 통신 패킷을 전송하고 해당 셋톱박스로부터 응답이 수신되면 업 상태로 판단하는 방법으로 수행된다.
예를 들어, 운영 시간(시작 및 종료 시각)이 정해져 있는 디지털 사이니지의 경우, 운영 시간 내에서는 셋톱박스가 다운 상태이면 비정상 상태이고 운영 시간 외에서는 셋톱박스가 다운 상태이더라도 정상 상태라고 볼 수 있다.
즉, 출퇴근 또는 휴일 등으로 인해 고객이 셋톱박스의 전원을 끈 경우에는 운영 이상으로 False Positive가 되고, 네트워크 이상, 운영체제 이상, 또는 서버 이상으로 인한 시스템 이상은 True Positive가 된다.
종래에는 수동으로 지점마다 운영 시간을 지정하고 운영 시간 내에서만 다운 상태를 관찰하여 이상 탐지를 하였기에 운영 시작 시각과 종료 시각의 변동에 따른 False Positive가 발생하는 경우가 있다.
본 발명은 위와 같은 문제를 해결하기 위해 고안된 것으로, 본 발명이 이루고자 하는 하나의 기술적 과제는, 업타임 확인 시의 False Positive를 제거하여 신뢰할 수 있는 IoT 디바이스를 포함하는 시스템의 이상 탐지 장치를 제공하는 데 있다.
또한, 본 발명이 이루고자 하는 또 하나의 기술적 과제는, 업타임 확인 시의 False Positive를 제거하여 신뢰할 수 있는 IoT 디바이스를 포함하는 시스템의 이상 탐지 방법을 제공하는 데 있다.
본 발명의 해결과제는 이상에서 언급된 것들에 한정되지 않으며, 언급되지 아니한 다른 해결과제들은 아래의 기재로부터 당해 기술분야에 있어서의 통상의 지식을 가진 자에게 명확하게 이해될 수 있을 것이다.
본 발명의 최소한 하나의 실시예에 따르면, 무선 네트워크를 통해 서버에 연결되어 작동하는 IoT (Internet of Things) 디바이스를 포함하는 시스템의 이상을 탐지하기 위한 장치에 있어서, 상기 IoT 디바이스의 운영 시간을 파악하는 운영 시간 파악부, 상기 IoT 디바이스로 소정의 시간마다 통신 패킷을 전송하는 통신 패킷 전송부, 상기 통신 패킷 전송부로부터 전송한 상기 통신 패킷에 대한 상기 IoT 디바이스로부터의 응답을 수신하는 응답 수신부, 상기 응답 수신부가 수신한 상기 IoT 디바이스로부터의 상기 통신 패킷에 대한 응답을 토대로 상기 IoT 디바이스의 업(Up)/다운(Down) 상태를 판단하는 상태 판단부, 및 상기 운영 시간 파악부가 파악한 상기 IoT 디바이스의 상기 운영 시간 및 상기 상태 판단부가 판단한 상기 IoT 디바이스의 상기 업(Up)/다운(Down) 상태를 토대로 상기 시스템의 이상을 판단하는 이상 판단부를 구비하는, IoT 디바이스를 포함하는 시스템의 이상 탐지 장치를 제공한다.
본 발명의 최소한 하나의 실시예에 있어서, 상기 운영 시간 파악부는, 상기 IoT 디바이스의 과거의 업(Up)/다운(Down) 상태 관측 데이터를 바탕으로 한 상기 IoT 디바이스의 운영 시간 패턴과 시계열 예측 알고리즘을 통해 상기 IoT 디바이스의 상기 운영 시간을 학습 및 예측하도록 구성된다.
본 발명의 최소한 하나의 실시예에 있어서, 상기 운영 시간 파악부는, 트렌드, 계절, 및 휴일을 반영한 시계열 예측 알고리즘과 자체 예측치 조정 알고리즘을 바탕으로 과거에 측정된 네트워크 트래픽 관측 데이터로 시계열 예측 모델을 이용하여 상기 IoT 디바이스의 상기 운영 시간을 예측하도록 구성된다.
본 발명의 최소한 하나의 실시예에 따르면, 무선 네트워크를 통해 서버에 연결되어 작동하는 IoT (Internet of Things) 디바이스를 포함하는 시스템의 이상을 탐지하기 위한 방법에 있어서, 상기 IoT 디바이스의 운영 시간을 파악하는 운영 시간 파악 단계, 상기 IoT 디바이스로 소정의 시간마다 통신 패킷을 전송하는 통신 패킷 전송 단계, 상기 통신 패킷 전송 단계에서 전송한 상기 통신 패킷에 대한 상기 IoT 디바이스로부터의 응답을 수신하는 응답 수신 단계, 상기 응답 수신 단계에서 수신한 상기 IoT 디바이스로부터의 상기 통신 패킷에 대한 응답을 토대로 상기 IoT 디바이스의 업(Up)/다운(Down) 상태를 판단하는 상태 판단 단계, 및 상기 운영 시간 파악 단계에서 파악한 상기 IoT 디바이스의 상기 운영 시간 및 상기 상태 판단 단계에서 판단한 상기 IoT 디바이스의 상기 업(Up)/다운(Down) 상태를 토대로 상기 시스템의 이상을 판단하는 이상 판단 단계를 구비하는, IoT 디바이스를 포함하는 시스템의 이상 탐지 방법을 제공한다.
본 발명의 최소한 하나의 실시예에 있어서, 상기 운영 시간 파악 단계는, 상기 IoT 디바이스의 과거의 업(Up)/다운(Down) 상태 관측 데이터를 바탕으로 한 상기 IoT 디바이스의 운영 시간 패턴과 시계열 예측 알고리즘을 통해 상기 IoT 디바이스의 상기 운영 시간을 학습 및 예측하는 단계를 포함한다.
본 발명의 최소한 하나의 실시예에 있어서, 상기 운영 시간 파악 단계는, 트렌드, 계절, 및 휴일을 반영한 시계열 예측 알고리즘과 자체 예측치 조정 알고리즘을 바탕으로 과거에 측정된 네트워크 트래픽 관측 데이터로 시계열 예측 모델을 이용하여 상기 IoT 디바이스의 상기 운영 시간을 예측하는 단계를 포함한다.
본 발명의 최소한 하나의 실시예에 있어서, 상기 운영 시간 파악 단계는, 상기 IoT 디바이스의 네트워크 관측 데이터를 수집하는 데이터 수집 단계, 상기 데이터 수집 단계에서 수집한 데이터로부터 최근 소정 기간 내의 로그 데이터를 주기 데이터로 변환하는 데이터 변환 단계, 상기 데이터 변환 단계에서 변환된 상기 주기 데이터와 시계열 예측 알고리즘을 통한 학습 단계, 상기 학습 단계를 통해 얻은 향후 소정 기간의 예측치를 조정하는 단계를 포함한다.
본 명세서에서 각각의 실시예는 독립적으로 기재되어 있으나 각각의 실시예는 상호 조합이 가능하며 조합된 실시예도 본 발명의 권리 범위에 포함된다.
상술한 요약은 단지 설명을 위한 것이며 어떠한 방식으로도 제한을 의도하는 것은 아니다. 상술한 설명적 양태, 실시예 및 특징에 덧붙여 추가의 양태, 실시예 및 특징이 도면 및 아래의 상세한 설명을 참조함으로써 명백해질 것이다.
본 발명의 최소한 하나의 실시예에 따르면, 업타임 확인 시의 False Positive를 제거하여 신뢰할 수 있는 IoT 디바이스를 포함하는 시스템의 이상 탐지 장치를 제공할 수 있는 효과가 있다.
또한, 본 발명의 최소한 하나의 실시예에 따르면, 업타임 확인 시의 False Positive를 제거하여 신뢰할 수 있는 IoT 디바이스를 포함하는 시스템의 이상 탐지 방법을 제공할 수 있는 효과가 있다.
본 발명의 효과는 이상에서 언급된 것들에 한정되지 않으며, 언급되지 아니한 다른 효과들은 아래의 기재로부터 당해 기술분야에 있어서의 통상의 지식을 가진 자에게 명확하게 이해될 수 있을 것이다.
도 1은 무선 네트워크를 통해 서버에 연결되어 작동하는 IoT 디바이스를 포함하는 시스템의 개념도이다.
도 2는 본 발명의 최소한 하나의 실시예에 따른 IoT 디바이스를 포함하는 시스템의 이상 탐지 장치의 기능 블록도이다.
도 3 및 도 4는 본 발명의 최소한 하나의 실시예에 따른 클러스터링 기법을 사용한 머신러닝의 결과를 나타내는 그래프이다.
도 5는 본 발명의 최소한 하나의 실시예에 따른 IoT 디바이스를 포함하는 시스템의 이상 탐지 방법을 설명하기 위한 흐름도이다.
도 6은 본 발명의 최소한 하나의 실시예에 따른 IoT 디바이스의 운영 시간 파악 단계를 설명하기 위한 흐름도이다.
도 7은 시계열 예측 알고리즘을 통해 4주간의 데이터로 학습한 결과 그래프이다.
도 8은 도 7에 도시된 학습 결과에 조정 알고리즘을 적용한 결과 그래프이다.
도 9는 본 발명의 최소한 하나의 실시예에 따른 장애 판단 및 탐지를 위한 각 기능 블록을 나타내는 기능 블록도이다.
이하, 첨부도면을 참조하여 본 발명의 최소한 하나의 실시예에 따른 IoT 디바이스를 포함하는 시스템의 이상 탐지 장치 및 방법에 대해 설명한다.
도 1은 무선 네트워크를 통해 서버에 연결되어 작동하는 IoT 디바이스를 포함하는 시스템의 개념도이다.
도 1에 도시된 예에서, 서버(100)에 무선 네트워크(110)를 통해 연결된 IoT 디바이스(120)는 디스플레이(121)와 안드로이드(셋톱박스)(122)로 연결된다.
이러한 IoT 디바이스(120)는 매장 내의 메뉴 보드, 옥외 LED 디스플레이, 택시 내부의 태블릿 등을 포함하며, 대부분의 경우 디스플레이(121) 주변에 셋톱박스(122)가 설치되고 이 셋톱박스(122)가 인터넷을 통해 서버(100)에 접속된다.
셋톱박스(122)를 사용하는 IoT 디바이스(120)(예를 들어, 디지털 사이니지)의 경우, 셋톱박스(122)의 이상을 탐지하기 위해서는 셋톱박스(122)가 서버(100)와 통신 가능한 업(Up) 상태인지 서버(100)와 통신 불가능한 다운(Down) 상태인지를 모니터링할 필요가 있다. 이러한 업타임(Uptime) 모니터링은 모든 IoT 연결 장비에 공통적으로 필요한 기능이라고 할 수 있다.
업 상태란 셋톱박스(122)가 서버(100)와 통신 가능한 상태로 셋톱박스(122)의 원격 제어가 가능한 상태이다. 다운 상태란 셋톱박스(122)가 서버(100)와 통신 불가능한 상태로 원격 제어가 불가능한 상태이다.
도 2는 본 발명의 최소한 하나의 실시예에 따른 IoT 디바이스를 포함하는 시스템의 이상 탐지 장치(200)의 기능 블록도이다.
예를 들어, IoT 디바이스를 포함하는 시스템의 이상 탐지 장치(200)는 서버(100)에 구현될 수도 있고, 서버(100)에 연결된 앱(미 도시)에 구현될 수도 있다.
도 2에 도시된 바와 같이, 본 발명의 최소한 하나의 실시예에 따른 IoT 디바이스를 포함하는 시스템의 이상 탐지 장치(200)는, 무선 네트워크(110)를 통해 서버(100)에 연결되어 작동하는 IoT (Internet of Things) 디바이스(120)를 포함하는 시스템의 이상을 탐지하기 위한 장치로, IoT 디바이스(120)의 운영 시간을 파악하는 운영 시간 파악부(210), IoT 디바이스(120)로 소정의 시간마다 통신 패킷을 전송하는 통신 패킷 전송부(220), 통신 패킷 전송부(220)로부터 전송한 통신 패킷에 대한 IoT 디바이스(120)로부터의 응답을 수신하는 응답 수신부(230), 응답 수신부(230)가 수신한 IoT 디바이스(120)로부터의 통신 패킷에 대한 응답을 토대로 IoT 디바이스(120)의 업(Up)/다운(Down) 상태를 판단하는 상태 판단부(240), 및 운영 시간 파악부(210)가 파악한 IoT 디바이스(120)의 운영 시간 및 상태 판단부(240)가 판단한 IoT 디바이스(120)의 업(Up)/다운(Down) 상태를 토대로 시스템의 이상을 판단하는 이상 판단부(250)로 구성된다.
IoT 디바이스(120)의 다운 상태의 원인으로 IoT 디바이스(120)의 운영 이상과 시스템 이상의 두 가지를 들 수 있다.
출퇴근 또는 휴일 등으로 인해 사용자가 IoT 디바이스(120)의 전원을 끈 경우에는 IoT 디바이스(120)의 다운 상태가 탐지되더라도 False Positive라고 할 수 있다. 예를 들어, 운영 시간(시작 및 종료 시각)이 정해져 있는 디지털 사이니지의 경우, 운영 시간 내에서는 셋톱박스가 다운 상태이면 비정상 상태이고 운영 시간 외에서는 셋톱박스가 다운 상태이더라도 정상 상태라고 볼 수 있다.
시스템 이상의 원인은, 네트워크 이상, 셋톱박스 이상, 및 서버 이상을 예로 들 수 있으며, 여기서 네트워크 이상은 Wi-Fi 불안정 또는 Wi-Fi 비밀번호 변경 등을 예로 들 수 있다.
본 발명의 최소한 하나의 실시예에 있어서, 운영 시간 파악부(210)는, IoT 디바이스(120)의 과거의 업(Up)/다운(Down) 상태 관측 데이터를 바탕으로 한 IoT 디바이스(120)의 운영 시간 패턴과 시계열 예측 알고리즘을 통해 IoT 디바이스(120)의 운영 시간을 학습 및 예측하도록 구성할 수 있다.
본 발명의 최소한 하나의 실시예에 있어서, 운영 시간 파악부(210)는, 트렌드, 계절, 및 휴일을 반영한 시계열 예측 알고리즘과 자체 예측치 조정 알고리즘을 바탕으로 과거에 측정된 네트워크 트래픽 관측 데이터로 시계열 예측 모델을 이용하여 IoT 디바이스(120)의 운영 시간을 예측하도록 구성할 수 있다.
즉, 운영 시간 파악부(210)는 머신러닝(Machine Learning)을 통해 구현할 수 있으며, 예를 들어 클러스터링(Clustering) 기법을 사용한 머신 러닝 결과는 도 3 및 도 4에 도시된 그래프와 같다.
도 4는 IoT 디바이스(120)의 운영이 시작되었을 때는 나타내며, 정상 패턴과의 거리로 이상의 심각 정도를 판단한다. 도 5는 IoT 디바이스(120)의 운영이 종료되었을 때를 나타내며, 마찬가지로 정상 패턴과의 거리로 이상의 심각 정도를 판단한다.
도 5는 본 발명의 최소한 하나의 실시예에 따른 IoT 디바이스를 포함하는 시스템의 이상 탐지 방법을 설명하기 위한 흐름도이다.
본 발명의 최소한 하나의 실시예에 따른 IoT 디바이스를 포함하는 시스템의 이상 탐지 방법은, 무선 네트워크를 통해 서버에 연결되어 작동하는 IoT (Internet of Things) 디바이스를 포함하는 시스템의 이상을 탐지하기 위한 방법으로, 먼저 스텝 S510에서 IoT 디바이스의 운영 시간을 파악한다.
스텝 S520에서는 IoT 디바이스로 소정의 시간마다 통신 패킷을 전송하고, 스텝 S530에서는 스텝 S520에서 전송한 통신 패킷에 대한 해당 IoT 디바이스로부터의 응답을 수신한다.
스텝 S540에서는 스텝 S530에서 수신한 IoT 디바이스로부터의 통신 패킷에 대한 응답을 토대로 해당 IoT 디바이스의 업(Up)/다운(Down) 상태를 판단한다.
마지막으로 스텝 S550에서는 스텝 S520에서 파악한 IoT 디바이스의 운영 시간 및 스텝 S540에서 판단한 해당 IoT 디바이스의 업(Up)/다운(Down) 상태를 토대로 시스템의 이상을 판단한다.
본 발명의 최소한 하나의 실시예에 있어서, 스텝 S510의 운영 시간 파악 단계는, IoT 디바이스의 과거의 업(Up)/다운(Down) 상태 관측 데이터를 바탕으로 한 해당 IoT 디바이스의 운영 시간 패턴과 시계열 예측 알고리즘을 통해 해당 IoT 디바이스의 운영 시간을 학습 및 예측하는 단계를 포함한다.
본 발명의 최소한 하나의 실시예에 있어서, 스텝 S510의 운영 시간 파악 단계는, 트렌드, 계절, 및 휴일을 반영한 시계열 예측 알고리즘과 자체 예측치 조정 알고리즘을 바탕으로 과거에 측정된 네트워크 트래픽 관측 데이터로 시계열 예측 모델을 이용하여 해당 IoT 디바이스의 운영 시간을 예측하는 단계를 포함한다.
도 6은 본 발명의 최소한 하나의 실시예에 따른 IoT 디바이스의 운영 시간 파악 단계를 설명하기 위한 흐름도이다.
도 6에 도시된 바와 같이, 본 발명의 최소한 하나의 실시예에 있어서, 스텝 S510의 운영 시간 파악 단계는, 해당 IoT 디바이스의 네트워크 관측 데이터를 수집하는 데이터 수집 단계(스텝 S610), 데이터 수집 단계에서 수집한 데이터로부터 최근 소정 기간 내의 로그 데이터를 주기 데이터로 변환하는 데이터 변환 단계(스텝 S620), 데이터 변환 단계에서 변환된 주기 데이터와 시계열 예측 알고리즘을 통한 학습 단계(스텝 S630), 학습 단계를 통해 얻은 향후 소정 기간의 예측치를 조정하는 단계(스텝 S640)를 포함한다.
본 발명의 최소한 하나의 실시예에 따른 시계열 예측 모델을 이용한 장애 탐지 및 셋톱박스 가동 시간 예측 방법은 각 셋톱박스의 과거의 네트워크 트래픽 관측 자료들을 이용하여 각 셋톱박스의 미래의 가동 시간을 예측하고 예측된 결과를 바탕으로 이상탐지 알고리즘을 이용하여 장애 탐지를 판별할 수 있다.
본 발명의 최소한 하나의 실시예에 따른 시계열 예측 모델을 이용한 장애 탐지 및 셋톱박스 가동 시간 예측 방법은 트렌드, 계절성, 휴일을 반영한 시계열 예측 알고리즘과 그리고 자체 보조 알고리즘을 바탕으로 과거에 측정된 네트워크 트래픽 관측 자료로 예측 결과를 만들고 각 셋톱박스의 장애 유무를 자동으로 판별할 수 있는 예측 모델이다.
셋톱박스는 단일 CPU를 가진 모바일 기기로도 이해할 수 있으며 고객사의 각 매장의 디스플레이 단위로 공급이 된다. 셋톱박스를 단일 서버에서 통신을 하고 있으나 수천 개의 셋톱박스 클라이언트가 공급됨에 따라 콘텐츠 전달 등의 통신 외에도 장애 탐지, 동작 이상 유무에 대한 관리의 필요성이 대두되고 있다.
기존에는 고객사의 전화나 문의로 해당 장애를 인지하는 경우가 대부분이며 네트워크 트래픽의 유무로 해당 셋톱박스의 동작을 판단하려고 하여도 이것이 실제로 장애인지 아니면 휴무 또는 공휴일 등으로 해당 셋톱박스의 전원이 오프 된 것인지 알 수 있는 방법이 없었다.
즉, 단순히 네트워크 트래픽의 현재 유무로만 장애를 판단하면 긍정 오류 즉, 결함이 아닌데 결함을 판정하는 오류가 커 제대로 된 장애 대응이 어렵다. 특히 이러한 장애 및 이상 탐지는 전체 관측 자료에서 소수만 관측되는 사건이기에 긍정 오류가 많아지면 해당 비용이 더 발생할 가능성이 있다.
이러한 배경에서 과거의 관측 자료를 바탕으로 셋톱박스 가동시간의 패턴을 파악하면 보통의 영업 매장의 특성상 일주일의 기점으로 주기성을 가지고 있으며 해당 주기성을 바탕으로 실제 셋톱박스가 가동되는 날과 가동되지 않는 날을 시계열 예측 알고리즘을 통해 학습 및 예측이 가능하다.
또한, 네트워크 트래픽 주기를 이용한 규칙 기반의 예측치 조정 알고리즘으로 시간별 네트워크 트래픽의 상한과 하한을 설정할 수 있고 이러한 방법을 통해 긍정 오류를 최소화하고 실제 가동 시점에 가동이 되지 않는 셋톱박스를 탐지하여 고객사보다 미리 장애를 탐지하고 대응할 수 있다.
뿐만 아니라, 트렌드, 계절성, 휴일을 반영한 시계열 예측 알고리즘과 자체 예측치 조정 알고리즘을 바탕으로 과거에 측정된 네트워크 트래픽 관측 자료로 시계열 예측 모델을 이용한 장애 탐지 및 셋톱박스 가동 시간 예측이 가능하다.
이를 단계별로 예를 들어 설명하면 다음과 같다.
1 단계: 개별 셋톱박스 네트워크 트래픽 수집 단계
예를 들어, 분당 1 ping을 기준으로 1시간에 60 ping
2 단계: 4주간의 네트워크 로그 데이터를 시간당 주기 데이터로 변환
3 단계: 해당 주기 데이터를 바탕으로 시계열 예측 알고리즘과 보조 알고리즘 기반으로 모델 생성
4 단계: 모델에서 생성된 향후 1주간의 미래 시계열 예측 데이터 산출
5 단계: 해당 예측 데이터에 기초하여 이상 탐지 알고리즘을 이용하여 장애 유무를 판별
본 발명의 최소한 하나의 실시예에서 사용된 시계열 예측 알고리즘 학습 원리는 다음과 같다.
사용되는 시계열 예측 모델은 The Prophet Forecasting Model에 기초한다. 해당 모델은 트렌드(growth), 계절성(seasonality), 휴일(holidays) 3가지의 main components 로 구성된다.
Figure pat00001
(수식 1)
여기서, g(t)는 비주기적 변화를 반영하는 추세(트렌드) 함수이고, s(t)는 주기적인 변화 (주간)이고, h(t)는 휴일(불규칙 사건)이며, et는 잔차이면 정규분포로 가정한다.
네트워크 트래픽은 시간당 60개의 상한선과 전원이 꺼졌을 때 0개의 하한선이 정해져 있기 때문에 s(t)만을 이용하여 주기적인 변화만 예측하면 될 것으로 판단할 수 있다. 하지만 네트워크 환경은 외부 환경이며 셋톱박스 장애나 서버 장애가 아닌 네트워크 그 자체의 장애가 존재할 수 있기에 단순히 0, 60으로 이분법적으로 판단하는 것이 아닌 어느 정도의 상한과 하한선을 두고 유연하게 판단할 필요가 있다.
상한과 하한선을 계산해주는 g(t)는 growth model이며 상한과 하한이 존재하는 지금의 경우에는 Saturating Growth Model을 기반으로 사용한다.
g(t)는 다음과 같이 로지스틱 함수로써 나타낼 수 있다.
Figure pat00002
(수식 2)
대부분의 영업장은 1주일을 기준으로 요일 별 (또는 주중, 주말) 주기성을 띄고 있다.
해당 공식은 푸리에 급수 (Fourier Series) 이며, 푸리에 급수의 원리를 요약하면 다음과 같다.
복잡한 파동 = (단순한 파동1) + (단순한 파동2) + (단순한 파동3) + ....
즉, 관측치의 주기성을 하나의 복잡한 파동으로 가정하면 해당 파동은 여러가지 단순한 파동의 조합으로 나눌 수 있다. 그렇게 단순한 파동으로 일반화하면 새로운 미래의 데이터를 변수를 이용하여 예측할 수 있게 된다.
P는 시계열 모델에서 기대하는 정규 주기이며 해당 알고리즘에서 P=7 (주간) 이다.
여기서 N을 조정하여 모델을 만드는데 조금 더 장기간의 주기성 즉, 연도 기준으로 N이 10, 주단위라면 N은 3이다. N이 작으면 패턴이 느리게 변한다.
이를 행렬식으로 나타내면 다음과 같다.
Figure pat00003
(수식 3)
Figure pat00004
(수식 4)
h(t)는 Holiday, 즉, 불규칙한 이벤트/휴일을 얘기한다. 다만, 셋톱박스가 설치된 영업장마다 모두 휴일, 영업일이 다르기 때문에 명절 같은 휴일 같은 이벤트만 반영한다.
Figure pat00005
(수식 5)
Figure pat00006
(수식 6)
t로 나타내어지는 특정한 시간이 휴일 리스트 D에 포함되어 있음을 확인하고 이에 대한 조정이 들어간다. 단, h(t)는 모델링에 반영하기 보다 보조 알고리즘을 통해 예측 결과를 조정해준다.
도 7은 시계열 예측 알고리즘을 통해 4주간의 데이터로 학습한 결과 그래프이다.
도 7에 도시된 그래프에서, x축은 날짜, y축은 네트워크 트래픽 ping 개수 (시간당 60개 기준)를 나타내고, 연한 파란색 영역이 하한과 상한 영역을 나타내며, 검은색 점이 실제 관측자료를 나타낸다.
해당 알고리즘의 결과로 나온 데이터를 바탕으로 그대로 관측치 예측에 사용하지 않고 자체 보조 알고리즘을 활용하여 예측 데이터를 조정한다.
예측치 조정 알고리즘
Figure pat00007
(수식 7)
여기서, l_hat은 하한 예측치이며, u_hat은 상한 예측치이다.
특정 a(알파)값 이하의 예측 데이터는 0으로 변환한다.
해당 알고리즘이 정확도를 향상시키는 이유는 위에서 설명한 예측 모델링은 주기성의 유연성을 반영하기 때문에 하한 값의 추세가 유연하게 내려오는 경향이 있다. 알고리즘에서 예측한 예측치에서 해당 알파값 이하는 실제로는 데이터 트래픽이 0, 즉 가동 중지의 상태를 나타내기 때문에 해당 알고리즘을 통해 조금 더 정확한 가동 유무에 대한 판단이 가능해진다.
도 8은 도 7에 도시된 학습 결과에 조정 알고리즘을 적용한 결과 그래프이다.
도 8에 도시된 그래프에서 빨간색 yhat_lower 선 위에 파란색 y가 있다면 정상 가동으로 판단할 수 있다. 실제 해당 자료에 활용된 데이터의 정확도는 약 95%이다.
장애 탐지 및 판단 알고리즘
예를 들어, 최근 4주간의 관측치로 예측한 향후 주간 데이터를 활용하여 실시간으로 장애 탐지를 한다.
Figure pat00008
(수식 8)
이는 현재 관측되는 관측치인 y값과 시간 t에 해당하는 l_hat을 바탕으로 장애 유무를 판단하는 알고리즘이다. (0일때 장애)
기존의 예측 알고리즘이나 기계학습 모형에서는 하나의 관측 자료 집합에서의 학습 모델과 해당 학습 모델의 성능 최적화 및 하이퍼 파라미터 튜닝이 필요하다. 이러한 최적화를 위해 모델 개발자 즉, 연구자의 노력이 중요하며 해당 관측 자료가 아닌 다른 관측 자료가 제시되면 기존 모형의 성능이 현저하게 떨어질 수밖에 없는 구조를 가지고 있다.
N개의 셋톱박스는 N개의 독립된 관측 자료 집합을 가지고 있으며 이러한 N개의 셋톱박스가 가지고 있는 자료 분포의 형태는 N개의 형태가 있다. 즉, 기존의 예측 모형 방법으로는 N개의 셋톱박스의 예측 모형이 가지고 있는 각각의 관측 자료 집합에 대한 학습 모형을 만드는 것이 불가능하다.
본 발명의 최소한 하나의 실시예에 따른 장애 탐지 및 판단 방법은 네트워크 트래픽만의 시계열 주기 데이터를 활용하여 하한/상한 값이 명확한 특징, 알고리즘 자체의 유연성, 데이터 분석과 경험을 통한 추가 조정 알고리즘으로 바탕으로 높은 정확도를 가진 가동 시간 예측 모형을 만들어낼 수 있다. 이러한 과정은 기계적으로 자동화가 가능하며 N개의 자료 집합에 대한 N개의 예측 모형을 효율적으로 만들어낼 수 있다.
즉, 기존의 비용이 많이 들고 최적화를 위해 사람의 손이 들어가야 하는 방법들에 비해 본 발명의 최소한 하나의 실시예에 따른 장애 탐지 및 판단 방법은 비용적으로 경제적이며 성능이 뛰어나고 이러한 방법을 높은 정확도로 자동화할 수 있다는 장점이 있다.
이해를 돕기 위해 이상에서 설명한 장애 판단 및 탐지를 위한 각 기능 블록을 도 9에 도시한다.
이상에서 설명한 바와 같이, 본 발명의 최소한 하나의 실시예에 따르면, 업타임 확인 시의 False Positive를 제거하여 신뢰할 수 있는 IoT 디바이스를 포함하는 시스템의 이상 탐지 장치를 제공할 수 있다.
또한, 본 발명의 최소한 하나의 실시예에 따르면, 업타임 확인 시의 False Positive를 제거하여 신뢰할 수 있는 IoT 디바이스를 포함하는 시스템의 이상 탐지 방법을 제공할 수 있다.
본 명세서에서는 각각의 실시예를 독립적으로 기재되어 있으나, 각각의 실시예는 상호 조합이 가능하며, 가능한 조합 내에서의 조합된 실시예도 본 발명의 권리 범위에 포함된다.
이상의 설명은 본 발명에 따른 최소한 하나의 실시예의 기술 사상을 예시적으로 설명한 것에 불과한 것으로서, 본 발명에 따른 최소한 하나의 실시예가 속하는 기술 분야에서 통상의 지식을 가진 자라면 본 실시예의 본질적인 특성에서 벗어나지 않는 범위에서 다양한 수정 및 변형이 가능할 것이다. 따라서, 본 발명에 따른 실시예들은 본 실시예의 기술 사상을 한정하기 위한 것이 아니라 설명하기 위한 것이고, 이러한 실시예에 의하여 본 실시예의 기술 사상의 범위가 한정되는 것은 아니다. 본 발명에 따른 최소한 하나의 실시예의 보호 범위는 아래의 청구범위에 의하여 해석되어야 하며, 그와 동등한 범위 내에 있는 모든 기술 사상은 본 발명에 따른 최소한 하나의 실시예의 권리범위에 포함되는 것으로 해석되어야 할 것이다.
100: 서버
110: 무선 네트워크
120: IoT 디바이스
121: 디스플레이
122: 안드로이드(셋톱박스)
200: IoT 디바이스를 포함하는 시스템의 이상 탐지 장치
210: 운영 시간 파악부
220: 통신 패킷 전송부
230: 응답 수신부
240: 상태 판단부
250: 이상 판단부

Claims (7)

  1. 무선 네트워크를 통해 서버에 연결되어 작동하는 IoT (Internet of Things) 디바이스를 포함하는 시스템의 이상을 탐지하기 위한 장치에 있어서,
    상기 IoT 디바이스의 운영 시간을 파악하는 운영 시간 파악부;
    상기 IoT 디바이스로 소정의 시간마다 통신 패킷을 전송하는 통신 패킷 전송부;
    상기 통신 패킷 전송부로부터 전송한 상기 통신 패킷에 대한 상기 IoT 디바이스로부터의 응답을 수신하는 응답 수신부;
    상기 응답 수신부가 수신한 상기 IoT 디바이스로부터의 상기 통신 패킷에 대한 응답을 토대로 상기 IoT 디바이스의 업(Up)/다운(Down) 상태를 판단하는 상태 판단부; 및
    상기 운영 시간 파악부가 파악한 상기 IoT 디바이스의 상기 운영 시간 및 상기 상태 판단부가 판단한 상기 IoT 디바이스의 상기 업(Up)/다운(Down) 상태를 토대로 상기 시스템의 이상을 판단하는 이상 판단부
    를 구비하는,
    IoT 디바이스를 포함하는 시스템의 이상 탐지 장치.
  2. 제1항에 있어서,
    상기 운영 시간 파악부는, 상기 IoT 디바이스의 과거의 업(Up)/다운(Down) 상태 관측 데이터를 바탕으로 한 상기 IoT 디바이스의 운영 시간 패턴과 시계열 예측 알고리즘을 통해 상기 IoT 디바이스의 상기 운영 시간을 학습 및 예측하도록 구성된,
    IoT 디바이스를 포함하는 시스템의 이상 탐지 장치.
  3. 제1항에 있어서,
    상기 운영 시간 파악부는, 트렌드, 계절, 및 휴일을 반영한 시계열 예측 알고리즘과 자체 예측치 조정 알고리즘을 바탕으로 과거에 측정된 네트워크 트래픽 관측 데이터로 시계열 예측 모델을 이용하여 상기 IoT 디바이스의 상기 운영 시간을 예측하도록 구성된,
    IoT 디바이스를 포함하는 시스템의 이상 탐지 장치.
  4. 무선 네트워크를 통해 서버에 연결되어 작동하는 IoT (Internet of Things) 디바이스를 포함하는 시스템의 이상을 탐지하기 위한 방법에 있어서,
    상기 IoT 디바이스의 운영 시간을 파악하는 운영 시간 파악 단계;
    상기 IoT 디바이스로 소정의 시간마다 통신 패킷을 전송하는 통신 패킷 전송 단계;
    상기 통신 패킷 전송 단계에서 전송한 상기 통신 패킷에 대한 상기 IoT 디바이스로부터의 응답을 수신하는 응답 수신 단계;
    상기 응답 수신 단계에서 수신한 상기 IoT 디바이스로부터의 상기 통신 패킷에 대한 응답을 토대로 상기 IoT 디바이스의 업(Up)/다운(Down) 상태를 판단하는 상태 판단 단계; 및
    상기 운영 시간 파악 단계에서 파악한 상기 IoT 디바이스의 상기 운영 시간 및 상기 상태 판단 단계에서 판단한 상기 IoT 디바이스의 상기 업(Up)/다운(Down) 상태를 토대로 상기 시스템의 이상을 판단하는 이상 판단 단계
    를 구비하는,
    IoT 디바이스를 포함하는 시스템의 이상 탐지 방법.
  5. 제4항에 있어서,
    상기 운영 시간 파악 단계는, 상기 IoT 디바이스의 과거의 업(Up)/다운(Down) 상태 관측 데이터를 바탕으로 한 상기 IoT 디바이스의 운영 시간 패턴과 시계열 예측 알고리즘을 통해 상기 IoT 디바이스의 상기 운영 시간을 학습 및 예측하는 단계를 포함하는,
    IoT 디바이스를 포함하는 시스템의 이상 탐지 방법.
  6. 제4항에 있어서,
    상기 운영 시간 파악 단계는, 트렌드, 계절, 및 휴일을 반영한 시계열 예측 알고리즘과 자체 예측치 조정 알고리즘을 바탕으로 과거에 측정된 네트워크 트래픽 관측 데이터로 시계열 예측 모델을 이용하여 상기 IoT 디바이스의 상기 운영 시간을 예측하는 단계를 포함하는,
    IoT 디바이스를 포함하는 시스템의 이상 탐지 방법.
  7. 제4항에 있어서,
    상기 운영 시간 파악 단계는,
    상기 IoT 디바이스의 네트워크 관측 데이터를 수집하는 데이터 수집 단계,
    상기 데이터 수집 단계에서 수집한 데이터로부터 최근 소정 기간 내의 로그 데이터를 주기 데이터로 변환하는 데이터 변환 단계,
    상기 데이터 변환 단계에서 변환된 상기 주기 데이터와 시계열 예측 알고리즘을 통한 학습 단계,
    상기 학습 단계를 통해 얻은 향후 소정 기간의 예측치를 조정하는 단계
    를 포함하는,
    IoT 디바이스를 포함하는 시스템의 이상 탐지 방법.
KR1020200163453A 2020-11-28 2020-11-28 IoT 디바이스를 포함하는 시스템의 이상 탐지 장치 및 방법 KR20220075164A (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020200163453A KR20220075164A (ko) 2020-11-28 2020-11-28 IoT 디바이스를 포함하는 시스템의 이상 탐지 장치 및 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020200163453A KR20220075164A (ko) 2020-11-28 2020-11-28 IoT 디바이스를 포함하는 시스템의 이상 탐지 장치 및 방법

Publications (1)

Publication Number Publication Date
KR20220075164A true KR20220075164A (ko) 2022-06-07

Family

ID=81986910

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020200163453A KR20220075164A (ko) 2020-11-28 2020-11-28 IoT 디바이스를 포함하는 시스템의 이상 탐지 장치 및 방법

Country Status (1)

Country Link
KR (1) KR20220075164A (ko)

Similar Documents

Publication Publication Date Title
KR102085655B1 (ko) 전력선 통신 게이트웨이를 이용한 산업용 plc 연동 및 스마트 팩토리 설비 원격 모니터링 시스템 및 이를 이용한 a/s 유지보수 방법
US11842301B1 (en) Methods for monitoring distributed energy storage safety and internet of things systems thereof
CN116880412B (zh) 一种基于云的可视化生产管理平台
KR102128707B1 (ko) 지능형 원격단말장치를 이용한 사물인터넷 기반의 수리 시설물 자율 점검 및 고장 알림 시스템
CN105325023A (zh) 用于小区异常检测的方法和网络设备
KR102138340B1 (ko) 지능형 원격단말장치를 이용한 사물인터넷 기반의 관내 시설물 자율 점검 및 고장 알림 운영시스템
CN117176560B (zh) 一种基于物联网的监测设备监管系统及其方法
CN112270429A (zh) 基于云边协同的动力电池极片制造设备维护方法和系统
CN113074783A (zh) 一种灯塔式工业设备监测方法和装置
CN116307447A (zh) 用于燃气安全培训的燃气安全管理方法和物联网系统
US20230408996A1 (en) Monitoring laundry machine operation using machine learning analysis of acoustic transducer signal information
KR20220075164A (ko) IoT 디바이스를 포함하는 시스템의 이상 탐지 장치 및 방법
CN117175803A (zh) 一种配电线路的无线通信方法及系统
CN116506278A (zh) 一种基于zabbix的异常监控平台
KR101811532B1 (ko) 복수 설비 자주보전 시스템
CN115334560A (zh) 基站异常的监测方法、装置、设备及计算机可读存储介质
KR102097772B1 (ko) 풍력발전 종합관리용 플랫폼 시스템
CN117878821B (zh) 一种高压直流系统接地监测与保护分析方法
CN111123248A (zh) 终端实时位置定位方法和系统、终端全生命周期监控方法和系统
KR102504121B1 (ko) Qr코드를 이용한 위치기반의 태양광 발전시스템 운영유지보수 시스템 및 그 방법
CN118534829B (zh) 基于物联网的液流储能设备全生命周期监控方法和系统
CN117544985B (zh) 一种设备离线通信管理方法及系统
CN118487966A (zh) 基于大数据的工业物联网设备监控系统
KR102617618B1 (ko) 산업용 공장의 고효율 설비 교체를 위한 인공지능 기반 의사 결정 서비스 제공 장치, 방법 및 시스템
US20220353200A1 (en) Monitoring a Communication System That is Used for Control and/or Surveillance of an Industrial Process

Legal Events

Date Code Title Description
A201 Request for examination