KR102622027B1 - 머신러닝을 이용한 시설의 영업시간 정보 제공 방법 - Google Patents

머신러닝을 이용한 시설의 영업시간 정보 제공 방법 Download PDF

Info

Publication number
KR102622027B1
KR102622027B1 KR1020190118634A KR20190118634A KR102622027B1 KR 102622027 B1 KR102622027 B1 KR 102622027B1 KR 1020190118634 A KR1020190118634 A KR 1020190118634A KR 20190118634 A KR20190118634 A KR 20190118634A KR 102622027 B1 KR102622027 B1 KR 102622027B1
Authority
KR
South Korea
Prior art keywords
data
facility
business hours
machine learning
hours information
Prior art date
Application number
KR1020190118634A
Other languages
English (en)
Other versions
KR20210037040A (ko
Inventor
최문석
김충효
최인지
Original Assignee
한국전력공사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국전력공사 filed Critical 한국전력공사
Priority to KR1020190118634A priority Critical patent/KR102622027B1/ko
Publication of KR20210037040A publication Critical patent/KR20210037040A/ko
Application granted granted Critical
Publication of KR102622027B1 publication Critical patent/KR102622027B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0637Strategic management or analysis, e.g. setting a goal or target of an organisation; Planning actions based on goals; Analysis or evaluation of effectiveness of goals
    • G06Q10/06375Prediction of business process outcome or impact based on a proposed change
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0631Resource planning, allocation, distributing or scheduling for enterprises or organisations
    • G06Q10/06312Adjustment or analysis of established resource schedule, e.g. resource or task levelling, or dynamic rescheduling
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0631Resource planning, allocation, distributing or scheduling for enterprises or organisations
    • G06Q10/06314Calendaring for a resource
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management
    • G06Q10/109Time management, e.g. calendars, reminders, meetings or time accounting
    • G06Q10/1091Recording time for administrative or management purposes

Landscapes

  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Engineering & Computer Science (AREA)
  • Strategic Management (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Economics (AREA)
  • Educational Administration (AREA)
  • Operations Research (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Game Theory and Decision Science (AREA)
  • Development Economics (AREA)
  • Data Mining & Analysis (AREA)
  • Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)
  • Crystals, And After-Treatments Of Crystals (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

본 발명은 머신러닝을 이용한 시설의 영업시간 정보 제공 방법에 관한 것으로, 영업시간 정보 제공 서버가 시설의 전력 사용량 데이터를 수집하는 단계, 상기 영업시간 정보 제공 서버가 수집된 데이터를 전처리하는 단계, 상기 영업시간 정보 제공 서버가 전처리된 데이터를 제1 기계학습 모델에 입력하여 시설의 현재 영업여부를 예측하는 단계 및 상기 영업시간 정보 제공 서버가 예측된 시설의 현재 영업여부에 기반하여 산출된 시설의 영업시간 정보를 제공하는 단계를 포함하는 것을 특징으로 한다.

Description

머신러닝을 이용한 시설의 영업시간 정보 제공 방법{METHOD OF PROVIDING BUSINESS HOURS INFORMATION OF FACILITIES USING MACHINE LEARNING}
본 발명은 머신러닝을 이용한 시설 영업시간 정보 제공 방법에 관한 것으로, 보다 상세하게는 전력 사용량을 기반으로 머신러닝을 이용하여 시설의 영업시간을 예측하고, 이를 제공하는 방법에 관한 것이다.
인터넷, 스마트폰 등의 보급으로 인터넷을 이용한 정보 획득이 일상화된 시점에서, 검색 포털 사이트(예: 네이버, 구글)에서는 사용자 주변이나 사용자가 원하는 지역의 시설(슈퍼마켓, 대중음식점, 미용실, 세탁소, 한의원, 헬스클럽, 금융업소, 당구장, 독서실 등)의 정보를 제공한다.
그러나 기존의 포털 사이트는 시설의 상호명, 업종, 위치, 연락처와 같은 기초 자료는 간단히 그리고 비교적 정확하게 제공하나, 해당 시설의 영업 여부에 대한 정보를 제공하지 못하는 경우가 많다.
다만, 시설의 업주 또는 관리자가 요일별 영업시간을 직접 입력하는 경우에는, 소비자들이 포털 사이트를 통해 영업시간을 검색할 수 있도록 제공하고 있으나, 영업시간에 대한 정보가 입력되지 않거나 실제 상황과 다르게 운영되는 경우가 많다. 특히, 휴일이나 주말에는 제한된 시간만 서비스를 제공하는 병원, 약국 등의 경우, 영업 여부에 대한 확인이 필수적이다. 또한 현재 영업 여부를 확인한 경우에도, 영업 종료 시각에 대한 정보가 없는 경우 물리적 이동에 따른 소요시간 동안 영업이 종료될 수도 있으므로, 이와 같은 상황을 고려할 필요가 있다.
이에, 종래에는 전력사용량의 절대적인 임계치 또는 변화량을 기준으로 영업여부를 판단하는 방법을 제시하고 있으나, 업종, 업태 및 사업장 규모에 따라 사업장에서 사용하는 전력사용 패턴의 차이가 너무 커서 획일화된 기준(임계값)으로 영업여부를 판단하기 어렵기 때문에 그 정확성을 담보하기 어렵다는 문제점이 존재하였다.
한편 본 발명의 배경기술은 대한민국 등록특허 10-1696219호(2017.01.09)에 개시되어 있다.
본 발명은 상기와 같은 시설의 영업시간 예측 방법의 문제점을 해결하기 위한 것으로, 지도학습(supervised learning) 기법을 이용하여 시설의 영업시간을 예측하고 이에 대한 정보를 제공하는 머신러닝을 이용한 시설의 영업시간 정보 제공 방법을 제공하는데 그 목적이 있다.
본 발명에 따른 머신러닝을 이용한 시설의 영업시간 정보 제공 방법은 영업시간 정보 제공 서버가 시설의 전력 사용량 데이터를 수집하는 단계; 상기 영업시간 정보 제공 서버가 수집된 데이터를 전처리하는 단계; 상기 영업시간 정보 제공 서버가 전처리된 데이터를 제1 기계학습 모델에 입력하여 시설의 현재 영업여부를 예측하는 단계; 및 상기 영업시간 정보 제공 서버가 예측된 시설의 현재 영업여부에 기반하여 산출된 시설의 영업시간 정보를 제공하는 단계를 포함하는 것을 특징으로 한다.
본 발명은 상기 시설의 현재 영업여부를 예측하는 단계 이후, 상기 영업시간 정보 제공 서버가 상기 예측된 시설의 현재 영업여부 및 기 축적된 레이블 데이터를 제2 기계학습 모델에 입력하여 시설의 장래 영업여부를 예측하는 단계를 더 포함하고, 상기 시설의 영업시간 정보를 제공하는 단계에서 상기 영업시간 정보 제공 서버는 예측된 시설의 장래 영업여부를 더 고려하여 상기 시설의 영업시간 정보를 산출하는 것을 특징으로 한다.
본 발명의 상기 수집된 데이터를 전처리하는 단계는, 상기 영업시간 정보 제공 서버가 상기 수집된 데이터를 정규화 하는 단계; 및 상기 영업시간 정보 제공 서버가 정규화 처리된 데이터를 필터링 하는 단계를 포함하는 것을 특징으로 한다.
본 발명의 상기 수집된 데이터를 정규화 하는 단계에서, 상기 영업시간 정보 제공 서버는 상기 수집된 데이터의 표준화(standardization) 및 최대-최소 스케일링(Max-Min scaling)을 수행하는 것을 특징으로 한다.
본 발명의 상기 정규화 처리된 데이터를 필터링 하는 단계에서, 상기 영업시간 정보 제공 서버는 임계치를 초과하는 데이터의 비율과 피크(peak) 값의 개수에 근거하여 필터링을 수행하는 것을 특징으로 한다.
본 발명에서 상기 제1 기계학습 모델 및 상기 제2 기계학습 모델은 CNN(Convolution Neural Network) 기반의 기계학습 모델인 것을 특징으로 한다.
본 발명은 상기 영업시간 정보 제공 서버가 사용자 피드백 및 관리자 피드백을 통해 상기 레이블 데이터를 수집하는 단계를 더 포함하는 것을 특징으로 한다.
본 발명에 따른 머신러닝을 이용한 시설의 영업시간 정보 제공 방법은 CNN 기반의 지도학습을 이용하여 시설의 영업시간을 예측할 수 있도록 하되, 준지도학습을 기법을 병용하여 레이블 부족 현상을 해결할 수 있도록 하는 효과가 있다.
또한 본 발명에 따른 머신러닝을 이용한 시설의 영업시간 정보 제공 방법은 시설의 현재 영업여부뿐만 아니라 장래 영업여부까지 예측하여 정보를 제공할 수 있도록 함으로써, 사용자 편의성을 높여주는 효과가 있다.
또한 본 발명에 따른 머신러닝을 이용한 시설의 영업시간 정보 제공 방법은 시설의 전력 사용량 데이터를 전처리하여 머신러닝의 정확도를 보다 향상시켜줄 수 있도록 하는 효과가 있다.
도 1은 본 발명의 일 실시예에 따른 머신러닝을 이용한 시설의 영업시간 정보 제공 방법이 수행되는 장치의 구성을 나타낸 블록구성도이다.
도 2 및 도 3은 본 발명의 일 실시예에 따른 머신러닝을 이용한 시설의 영업시간 정보 제공 방법에서의 단기 예측과 장기 예측을 설명하기 위한 예시도이다.
도 4는 본 발명의 일 실시예에 따른 머신러닝을 이용한 시설의 영업시간 정보 제공 방법을 설명하기 위한 흐름도이다.
이하, 첨부된 도면을 참조하여 본 발명에 따른 머신러닝을 이용한 시설의 영업시간 정보 제공 방법의 일 실시예를 설명한다. 이 과정에서 도면에 도시된 선들의 두께나 구성요소의 크기 등은 설명의 명료성과 편의상 과장되게 도시되어 있을 수 있다. 또한, 후술되는 용어들은 본 발명에서의 기능을 고려하여 정의된 용어들로서 이는 사용자, 운용자의 의도 또는 관례에 따라 달라질 수 있다. 그러므로, 이러한 용어들에 대한 정의는 본 명세서 전반에 걸친 내용을 토대로 내려져야 할 것이다.
도 1은 본 발명의 일 실시예에 따른 머신러닝을 이용한 시설의 영업시간 정보 제공 방법이 수행되는 장치의 구성을 나타낸 블록구성도이다. 도 1에 도시된 것과 같이, 머신러닝을 이용한 시설의 영업시간 정보 제공 방법이 수행되는 장치는 데이터 수집부(10), 전처리부(11), 제1 기계학습 모델(12), 레이블 축적부(13), 제2 기계학습 모델(14) 및 정보 제공부(15)를 포함할 수 있다.
데이터 수집부(10)는 시설의 전력 사용량 데이터(AMI 데이터)를 수집할 수 있다. 데이터 수집부(10)는 각 시설의 전력량계와 연결되어 전력 사용량 데이터를 수집하도록 구성될 수 있으며, 또는 전력 사용량 데이터를 수집하는 별도의 DB(미도시)로부터 시설의 전력 사용량 데이터를 수집하도록 구성될 수 있다. 전력 사용량 데이터에는 요일, 시간 등의 부가적인 정보가 포함될 수 있다.
이러한 전력 사용량 데이터는 주기적(예: 15분 또는 1시간) 단위로 수집될 수 있으며, 이러한 각 주기별 데이터를 하나의 세트로 하여 데이터 처리를 수행할 수 있다. 즉, 예를 들어 15분 간격으로 데이터가 수집되는 경우 해당 15분간의 전력 사용량 데이터가 하나의 세트로 구성될 수 있다.
데이터 수집부(10)는 전력 사용량 데이터 이외에도 후술할 것과 같은 레이블을 생성하기 위한 데이터(사용자 피드백, 관리자 피드백) 정보를 수집하도록 구성될 수도 있다.
이를 위해 데이터 수집부(10)는 인터넷을 통한 네트워크망에 연결될 수 있다.
전처리부(11)는 데이터 수집부(10)에서 수집된 전력 사용량 데이터를 전처리하여 기계학습의 정확도를 향상시킬 수 있다.
시설의 영업 여부 예측을 위해서는 각 업장이 사용하는 전력 사용량의 절대 크기보다는 상대적인 크기의 변화나 패턴의 변화가 중요하기 때문에, 업장에 따른 전력 사용량의 절대값의 크기나 시간에 따른 전력 사용량의 변화 등의 요인을 제거해야 한다. 또한, 전력량계의 에러로 인한 전력 사용량의 오류, 통신망의 고장으로 인한 데이터의 누락 등 비정상적인 데이터도 제거할 필요가 있다.
전처리부(11)는 정규화(Normalization)와 필터링(Filtering)과정을 통해 수집된 데이터를 전처리 할 수 있다.
본 발명에서는 시간의 흐름에 따른 전력 사용량의 추세 변화와 업장별 전력 사용량의 절대 크기의 차이를 상쇄시키기 위해 정규화 기법을 사용한다. 전처리부(11)는 먼저 학습에 필요한 입력데이터의 평균(m)을 0, 분산을 1로 맞추는 표준화(standardization)를 수행하며, 이는 아래의 수학식 1에 따라 계산될 수 있다.
위와 같은 표준화를 적용한다 하더라도 전력량계 오류로 인해 일반적으로 사용하는 전력량보다 굉장히 큰 데이터가 들어올 경우 전처리된 데이터의 분포가 0 근처가 아닌 다른 값의 근처에 분포하는 문제가 발생하게 된다. 이와 같은 특이점 데이터를 처리하기 위해 본 발명에서는 다음의 수학식 2를 활용하여 각 세트별로 최대-최소 스케일링(Max-Min scaling)을 수행한다.
이는 스케일링된 데이터의 평균(m)보다 큰 데이터 셋의 평균을 1로, 평균보다 값이 작은 데이터 셋의 평균을 0으로 변환함으로써 평균보다 큰 데이터 셋에서 발생하는 특이점 데이터가 평균보다 작은 데이터 셋에 미치는 영향을 최소화 할 수 있다.
한편 기계학습 모델의 정확한 학습을 위해서는 잡음이 많은 데이터(계량기 또는 통신망의 오류로 인한 데이터 누락 및 비주기적 특성을 가진 데이터)를 제거해야 한다. 이를 위해서 본 발명에서 전처리부(11)는 정규화 과정을 거친 데이터를 다시 필터링함으로써 오류 데이터를 제거할 수 있도록 한다.
구체적으로 전처리부(11)는 전력 사용량 데이터를 고속푸리에변환(FFT)으로 변환한 후, 임계치를 초과하는 데이터의 비율과 피크(peak) 값의 개수를 바탕으로 오류 데이터를 제거할 수 있다.
예를 들어, 전처리부(11)는 미리 설정된 임계치를 초과하는 데이터의 비율이 설정비율(예: 10%) 이상인 경우에 해당 데이터는 비정상 데이터인 것으로 판단하여 제거할 수 있다. 또한 전처리부(11)는 피크 값의 개수가 미리 설정된 설정개수 이상인 경우에 해당 데이터는 비정상 데이터인 것으로 판단하여 제거할 수 있다.
본 발명에서 이러한 필터링은 주기적으로 수집된 데이터의 세트별로 수행될 수 있다.
제1 기계학습 모델(12)은 전처리부(11)에서 전처리된 데이터를 학습하여 시설의 현재 영업 여부를 판단할 수 있도록 한다.
제1 기계학습 모델(12)은 최적의 학습 데이터량을 선정하도록 구성될 수 있다. 학습에 사용되는 전력 사용량 데이터량이 너무 작은 경우, 학습에 필요한 정보가 부족하여 머신러닝 모델의 구현이 어려우며 신뢰성 있는 결과를 도출하기 어렵다. 반대로, 학습에 사용되는 전력 사용량의 데이터량이 지나치게 많을 경우, 머신러닝 모델의 학습에 소요되는 시간이 실시간 서비스를 운영하기 어려울 정도로 학습 시간이 길어질 수 있으며, 학습 데이터의 샘플 수가 감소하여 성능 저하가 발생할 수 있다. 따라서, 제1 기계학습 모델(12)은 실시간 예측 서비스를 제공하기 위해서는 학습에 사용되는 데이터의 양을 최적화하도록 구성될 수 있다. 예를 들어, 최적모델을 산정하는데 걸리는 시간의 역함수를 성능함수 f(x)라고 한다면, 제1 기계학습 모델(12)은 을 만족하는 중 최소값을 최적의 데이터량으로 산정한다. 여기서 는 학습에 입력되는 데이터량이다.
본 발명과 같이, 시계열 데이터의 분석에는 일반적으로 RNN(Recursive Neural Network)이 적합한 것으로 알려져 있다. 그러나, RNN의 경우 시계열 데이터 분석에는 적합하지만, 데이터의 양이 많아질 경우 예측 결과를 생성하는데 시간이 많이 걸린다는 단점이 있어 본 발명이 대상으로 하는 대용량 데이터 분석에는 적합하지 않다. 이에, 본 발명에서는 이러한 문제점을 해결하기 위해 CNN(Convolution Neural Network)을 이용하여 영업여부를 예측하는 방식을 사용한다. CNN의 경우 인접한 데이터의 상관관계를 반영하여 학습하는 머신러닝 기법이며, 전력 사용량의 패턴 역시 인접 시계열 데이터와 상관관계가 있으므로 CNN의 특성을 이용하면 RNN에 비해 예측시간을 단축하며 보다 효율적으로 영업예측이 가능하다.
동일한 입력데이터에 대한 머신러닝 모델을 변경하면서 학습한 결과, FC(Fully connected neural network) 모델에 비해 RNN과 CNN 모델이 학습 정확도가 높은 것으로 분석되었다. 또한, 정확도는 유사한 반면 CNN 모델이 RNN 모델에 비해 학습시간이 67배 정도 차이가 발생하는 것으로 확인되었다.
도 2는 단기 예측을 위한 제1 기계학습 모델(12)의 동작을 좀 더 구체적으로 설명하기 위한 예시도이다.
제1 기계학습 모델(12)은 전처리된 전력 사용량 데이터를 입력으로 하여, 영업여부에 대한 결과값(Close, Open)을 출력 데이터로 출력하는 기계학습 모델이다. T1시점의 영업여부를 판단하기 위해 사용하는 학습 데이터는 T0시점으로부터 최적의 학습데이터량(예.:6주)에 해당하는 과거 데이터를 이용하며, T2 시점의 영업여부를 판단하는데 필요한 학습데이터는 T1 시점으로부터 과거의 데이터를 이용한다.
제1 기계학습 모델(12)에서 출력된 결과값은 정보 제공부(15)로 전달되어 현재의 영업여부에 대한 정보를 사용자에게 제공하는데 활용된다.
또한 제1 기계학습 모델(12)에서 출력된 결과값은 후술할 레이블 축적부(13) 전달되어 제2 기계학습 모델(14)의 입력 데이터로 활용될 수 있다.
레이블 축적부(13)는 제2 기계학습 모델(14)에서 출력 장기 예측 결과를 생성하기 위한 입력 데이터를 축적한다.
즉, 현재의 영업여부의 경우 최근의 전력 사용량을 기반으로 정확한 판단이 가능하나 장래(예: 72시간)까지의 영업여부의 경우, 현재 시점의 영업여부를 포함하는 다양한 형태의 입력 데이터가 필요하다.
이에 본 발명에서는 레이블 부족 현상을 해결하기 위해 준지도학습(semi-supervised learning) 기법을 사용한다.
머신러닝의 학습을 위해서는 학습으로 활용되는 레이블 데이터(Ground Truth, 실측 데이터)가 필요하다. 그러나, 본 발명이 영업시산 예측 대상으로 하는 시설의 경우 전국에 분포되어 있으며 그 수가 매우 많으므로 실측이 현실적으로 불가능하다. 레이블이 없는 경우 페이크레이블을 생성하여 학습을 시키는 방법도 있지만 실측 정보가 아닌 페이크레이블로 학습한 경우 80% 이상의 예측 정확도를 확보하기 어렵다. 이에 본 발명에서는 준지도 학습기법을 적용하여 레이블 부족 문제를 해결하고자 한다.
먼저 본 발명에서는 관리자 피드백을 활용하여 준지도학습을 위한 초기 레이블 데이터를 생성할 수 있도록 한다.
예를 들어, 시설의 관리자를 대상으로 시설의 영업시간 정보(즉, 참값)를 조사를 하여 초기의 레이블 데이터(Ground Truth, 실측 데이터)를 생성한다.
또한, 전체 데이터의 일부인 레이블 데이터를 이용하여 레이블이 없는 데이터에 레이블을 생성한다. 먼저 레이블 데이터(Groundtruth, 실측데이터)의 학습을 통해 머신러닝 모델을 생성한 후, 생성된 모델에 레이블이 없는 데이터를 입력하여 출력으로 예측결과를 생성한다.(이와 같이 레이블을 생성하는데 사용되는 머신러닝 모델을 레이블러라고 한다.) 예측결과가 요구하는 수준이상의 신뢰도를 가지면 이 결과를 다시 레이블이 없는 데이터의 레이블로 활용하며, 요구수준이하의 신뢰도를 출력한 입력데이터는 다시 레이블러에 입력으로 활용하여 요구수준을 만족할 때까지 반복한다. 레이블 데이터(Groundtruth, 실측데이터)와 레이블러에 의해 레이블이 추가된 데이터(Labled unlabled data)를 입력으로 하여 실제 서비스에 사용될 머신러닝 모델을 학습시킨다.
본 발명에서는 또한 서비스 사용자의 피드백을 통해 레이블 데이터를 획득할 수 있도록 한다. 본 발명에서 제안하는 준지도학습기법은 기존의 데이터량이 일정한 off-line 준지도학습기법이 아니라 시간이 흐를수록 데이터량이 변하는 On-line 준지도학습기법이다. 최초로 서비스를 시작할 때 예측 정확도가 확보된 상태의 머신러닝 모델이라 하더라도 시간이 지나면서 데이터량과 레이블 값이 달라질 수 있으며 이로 인해 예측 정확도에 부정적인 영향을 줄 수 있다. 따라서, 시간이 지남에 따라 레이블 데이터를 업데이트해야 예측 정확도를 유지할 수 있다. 본 발명에서는 레이블 데이터를 업데이트하는 방법을 다음과 같이 사용한다.
정보 제공부(15)에서 제공하는 서비스 UI에 사용자가 예측 결과에 대한 피드백을 줄 수 있는 기능을 추가할 수 있다. 이를 통해, 예측 결과가 맞을 경우 "맞아요", 결과가 맞지 않을 경우 "틀려요"를 클릭하여 레이블 데이터를 확보할 수 있도록 한다. "틀려요"의 경우 사용자의 불편사항을 반영하는 항목으로 사용자 피드백을 신뢰할 수 있으므로 레이블에 바로 적용하여 해당시간의 실측 데이터로 활용한다. 반면에, 예측 결과가 맞을 경우 사용자가 피드백을 제공하지 않을 확률이 높아 레이블 확보가 어렵다. 따라서, 사용자가 서비스를 사용한 이력(전체 사용자의 상업시설 영업현황 검색결과, 동일 사용자의 특정 시간 내에 재검색 여부 등)을 반영하여 "틀려요"를 클릭한 사용자를 제외한 나머지 사용자의 피드백에 레이블을 생성한다.
한편 이렇게 축적된 레이블 데이터는 제1 기계학습 모델(12)로 피드백되어, 기계학습의 정확도를 계속해서 유지할 수 있도록 한다.
제2 기계학습 모델(14)은 제1 기계학습 모델(12)의 출력 데이터와 레이블 축적부(13)의 데이터를 입력값으로 하여 장래의 영업여부 정보를 출력하는 기계학습 모델이다.
즉, 제2 기계학습 모델(14)은 도 3에 도시된 것과 같이, 현재 상태(예: Open)에서 다른 상태(예: Close)로 변화되는 시점까지의 시간과 다시 현재 상태(예: Open)로 복귀까지의 시간을 예측하여 제공할 수 있다. 도 3은 현재는 Open 상태이지만 1시간 후에는 Close로 상태가 바뀌고 다시 4시간이 지나면 Open으로 바뀌는 상점에 대한 예측 결과를 도식화한 것이다.
이와 같이, 제2 기계학습 모델(14)은 현재시점으로부터 장래(예: 72시간동안)의 영업예측 결과를 출력으로 생성한다. 이때, 출력 데이터는 다음 상태변화까지의 시간과 현재의 상태로 복귀하는데 걸리는 시간을 포함할 수 있다.
정보 제공부(15)는 제1 기계학습 모델(12) 및 제2 기계학습 모델(14)을 통해 예측된 시설의 현재 및 장래 영업여부에 대한 정보를 사용자에게 제공할 수 있다.
예를 들어, 정보 제공부(15)는 검색 포털 사이트 등과 연계하여, 사용자가 시설을 검색하였을 때, 해당 시설의 현재 영업 여부, 장래의 영업 여부, 영업시간 등을 제공하도록 구성될 수 있다. 또는 정보 제공부(15)는 사용자에게 직접 정보를 제공하는 대신, 이러한 검색 포털 사이트에 각 시설의 현재 및 장래의 영업시간 정보를 제공하도록 구성될 수 있다.
한편 본 발명에서 이러한 데이터 수집부(10), 전처리부(11), 제1 기계학습 모델(12), 레이블 축적부(13), 제2 기계학습 모델(14) 및 정보 제공부(15)의 구성은 범용 컴퓨팅 장치(예: 서버)로 구성될 수 있으며, 각 구성이 하나의 서버로 구현되거나, 여러 기능이 하나의 서버에 구현되거나, 하나의 기능이 여러 서버에 분산 구현되는 형태로 구성될 수 있다. 이러한 단일의 서버 또는 복수의 서버 집합을 영업시간 정보 제공 서버로 통칭할 수 있을 것이다.
도 4는 본 발명의 일 실시예에 따른 머신러닝을 이용한 시설의 영업시간 정보 제공 방법을 설명하기 위한 흐름도이다.
도 4에 도시된 것과 같이, 영업시간 정보 제공 서버는 먼저 시설의 전력 사용량 데이터를 수집한다(S20). 영업시간 정보 제공 서버는 각 시설의 전력량계와 연결되어 전력 사용량 데이터를 수집하도록 구성될 수 있으며, 또는 전력 사용량 데이터를 수집하는 별도의 DB(미도시)로부터 시설의 전력 사용량 데이터를 수집하도록 구성될 수 있다. 전력 사용량 데이터에는 요일, 시간 등의 부가적인 정보가 포함될 수 있다.
이러한 전력 사용량 데이터는 주기적(예: 15분 또는 1시간) 단위로 수집될 수 있으며, 이러한 각 주기별 데이터를 하나의 세트로 하여 데이터 처리를 수행할 수 있다. 즉, 예를 들어 15분 간격으로 데이터가 수집되는 경우 해당 15분간의 전력 사용량 데이터가 하나의 세트로 구성될 수 있다.
이어서 영업시간 정보 제공 서버는 상기 단계에서 수집된 데이터에 대한 전처리를 수행한다(S21). 영업시간 정보 제공 서버는 정규화(Normalization)와 필터링(Filtering)과정을 통해 수집된 데이터를 전처리 할 수 있으며, 그 구체적인 방식은 전술한 것과 같다.
상기 단계(S21) 이후, 영업시간 정보 제공 서버는 제1 기계학습 모델을 이용하여 전처리된 데이터를 바탕으로 시설의 단기(즉, 현재) 영업여부를 예측한다(S22). 제1 기계학습 모델은 전처리된 전력 사용량 데이터를 입력으로 하여, 영업여부에 대한 결과값(Close, Open)을 출력 데이터로 출력하는 기계학습 모델이다. 전술한 도 2에 도시된 것과 같이, 영업시간 정보 제공 서버는 T1시점의 영업여부를 판단하기 위해 사용하는 학습 데이터는 T0시점으로부터 최적의 학습데이터량(예.:6주)에 해당하는 과거 데이터를 이용하며, T2 시점의 영업여부를 판단하는데 필요한 학습데이터는 T1 시점으로부터 과거의 데이터를 이용한다.
이후, 영업시간 정보 제공 서버는 상기 단계(S22)의 예측 결과 및 미리 축적되어 저장된 레이블 데이터에 기반하여 제2 기계학습 모델을 이용하여 시설의 장기(즉, 장래)의 영업여부 정보를 예측한다(S23). 제2 기계학습 모델은 제1 기계학습 모델(12)의 출력 데이터와 레이블 축적부(13)의 데이터를 입력값으로 하여 장래의 영업여부 정보를 출력하는 기계학습 모델이다.
즉, 제2 기계학습 모델은 도 3에 도시된 것과 같이, 현재 상태(예: Open)에서 다른 상태(예: Close)로 변화되는 시점까지의 시간과 다시 현재 상태(예: Open)로 복귀까지의 시간을 예측하여 제공할 수 있다.
이어서 영업시간 정보 제공 서버는 상기 단계(S22) 및 단계(S23)에서 예측된 정보를 바탕으로 시설의 영업시간 정보를 제공한다(S24). 즉, 영업시간 정보 제공 서버는 검색 포털 사이트 등과 연계하여, 사용자가 시설을 검색하였을 때, 해당 시설의 현재 영업 여부, 장래의 영업 여부, 영업시간 등을 제공하도록 구성될 수 있다. 또는 영업시간 정보 제공 서버는 사용자에게 직접 정보를 제공하는 대신, 이러한 검색 포털 사이트에 각 시설의 현재 및 장래의 영업시간 정보를 제공하도록 구성될 수 있다.
본 실시예에서는 하나의 시설에 대해 영업시간 정보를 산출하는 것으로 설명하였으나, 각각의 시설에 대해 동일한 방식의 동작이 가능할 것이다.
한편 본 발명에서 영업시간 정보 제공 서버는 이러한 예측 동작과 더불어 준지도학습기법을 활용하여 레이블 데이터를 축적하는 동작을 수행할 수 있으며, 이는 전술한 방식과 같다.
또한 본 발명의 일부 실시예에서는 시설을 복수의 카테고리(업종별)로 분류하여 각 업종별로 별도의 기계학습 모델을 별도로 구축하여 사용할 수도 있다.
본 발명은 도면에 도시된 실시예를 참고로 하여 설명되었으나, 이는 예시적인 것에 불과하며, 당해 기술이 속하는 분야에서 통상의 지식을 가진 자라면 이로부터 다양한 변형 및 균등한 타 실시예가 가능하다는 점을 이해할 것이다. 따라서 본 발명의 기술적 보호범위는 아래의 특허청구범위에 의해서 정하여져야 할 것이다.
10: 데이터 수집부
11: 전처리부
12: 제1 기계학습 모델
13: 레이블 축적부
14: 제2 기계학습 모델
15: 정보 제공부

Claims (7)

  1. 영업시간 정보 제공 서버가 시설의 전력 사용량 데이터를 수집하는 단계;
    상기 영업시간 정보 제공 서버가 수집된 데이터를 전처리하는 단계;
    상기 영업시간 정보 제공 서버가 전처리된 데이터를 제1 기계학습 모델에 입력하여 시설의 현재 영업여부를 예측하는 단계; 및
    상기 영업시간 정보 제공 서버가 예측된 시설의 현재 영업여부에 기반하여 산출된 시설의 영업시간 정보를 제공하는 단계를 포함하며,
    상기 시설의 현재 영업여부를 예측하는 단계 이후,
    상기 영업시간 정보 제공 서버가 상기 예측된 시설의 현재 영업여부 및 기 축적된 레이블 데이터를 제2 기계학습 모델에 입력하여 시설의 장래 영업여부를 예측하는 단계를 더 포함하고,
    상기 시설의 영업시간 정보를 제공하는 단계에서 상기 영업시간 정보 제공 서버는 예측된 시설의 장래 영업여부를 더 고려하여 상기 시설의 영업시간 정보를 산출하며,
    상기 수집된 데이터를 전처리하는 단계는,
    상기 영업시간 정보 제공 서버가 상기 수집된 데이터를 정규화 하는 단계; 및
    상기 영업시간 정보 제공 서버가 정규화 처리된 데이터를 필터링 하는 단계를 포함하고,
    상기 수집된 데이터를 정규화 하는 단계에서, 상기 영업시간 정보 제공 서버는 상기 수집된 데이터의 표준화(standardization) 및 최대-최소 스케일링(Max-Min scaling)을 수행하되, 상기 최대-최소 스케일링은 스케일링된 데이터의 평균보다 큰 데이터 셋의 평균을 1로, 상기 평균보다 값이 작은 데이터 셋의 평균을 0으로 변환하는 것이고,
    상기 정규화 처리된 데이터를 필터링 하는 단계에서, 상기 영업시간 정보 제공 서버는 임계치를 초과하는 데이터의 비율과 피크(peak) 값의 개수에 근거하여 필터링을 수행하되, 미리 설정된 임계치를 초과하는 데이터의 비율이 설정비율 이상인 경우의 데이터나 피크 값의 개수가 미리 설정된 설정개수 이상인 경우의 데이터를 제거하는 것을 특징으로 하는 머신러닝을 이용한 시설의 영업시간 정보 제공 방법.
  2. 삭제
  3. 삭제
  4. 삭제
  5. 삭제
  6. 제1항에 있어서,
    상기 제1 기계학습 모델 및 상기 제2 기계학습 모델은 CNN(Convolution Neural Network) 기반의 기계학습 모델인 것을 특징으로 하는 머신러닝을 이용한 시설의 영업시간 정보 제공 방법.
  7. 제1항에 있어서,
    상기 영업시간 정보 제공 서버가 사용자 피드백 및 관리자 피드백을 통해 상기 레이블 데이터를 수집하는 단계를 더 포함하는 것을 특징으로 하는 머신러닝을 이용한 시설의 영업시간 정보 제공 방법.
KR1020190118634A 2019-09-26 2019-09-26 머신러닝을 이용한 시설의 영업시간 정보 제공 방법 KR102622027B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020190118634A KR102622027B1 (ko) 2019-09-26 2019-09-26 머신러닝을 이용한 시설의 영업시간 정보 제공 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020190118634A KR102622027B1 (ko) 2019-09-26 2019-09-26 머신러닝을 이용한 시설의 영업시간 정보 제공 방법

Publications (2)

Publication Number Publication Date
KR20210037040A KR20210037040A (ko) 2021-04-06
KR102622027B1 true KR102622027B1 (ko) 2024-01-11

Family

ID=75472820

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020190118634A KR102622027B1 (ko) 2019-09-26 2019-09-26 머신러닝을 이용한 시설의 영업시간 정보 제공 방법

Country Status (1)

Country Link
KR (1) KR102622027B1 (ko)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101696219B1 (ko) * 2015-08-20 2017-01-13 한국전력공사 근린생활시설 영업 현황 정보 제공 시스템 및 방법

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20110022171A (ko) * 2009-08-27 2011-03-07 한국전기연구원 독거노인의 생활 상태를 모니터링하기 위한 시스템 및 그 방법
KR101917375B1 (ko) * 2016-11-22 2018-11-12 한국에너지기술연구원 기계학습을 활용한 에너지관리시스템 및 에너지관리방법
KR20180060317A (ko) * 2016-11-28 2018-06-07 한국전력공사 심층 신경망 기반 수용가 전력 수요 예측 장치 및 방법

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101696219B1 (ko) * 2015-08-20 2017-01-13 한국전력공사 근린생활시설 영업 현황 정보 제공 시스템 및 방법

Also Published As

Publication number Publication date
KR20210037040A (ko) 2021-04-06

Similar Documents

Publication Publication Date Title
US20220131770A1 (en) System and method for predicting and reducing subscriber churn
CN105677538B (zh) 一种基于故障预测的云计算系统自适应监测方法
US20170109657A1 (en) Machine Learning-Based Model for Identifying Executions of a Business Process
US20170371757A1 (en) System monitoring method and apparatus
CN108647891A (zh) 数据异常归因分析方法及装置
US20170109676A1 (en) Generation of Candidate Sequences Using Links Between Nonconsecutively Performed Steps of a Business Process
US20170109668A1 (en) Model for Linking Between Nonconsecutively Performed Steps in a Business Process
US20150294246A1 (en) Selecting optimal training data set for service contract prediction
US20170109667A1 (en) Automaton-Based Identification of Executions of a Business Process
US20050216793A1 (en) Method and apparatus for detecting abnormal behavior of enterprise software applications
US20170109636A1 (en) Crowd-Based Model for Identifying Executions of a Business Process
CN101996385A (zh) 索赔分析引擎
CN102082703A (zh) 业务支撑系统设备性能监控的方法及装置
US11301351B2 (en) Machine learning based data monitoring
CN114785666B (zh) 一种网络故障排查方法与系统
KR102330423B1 (ko) 이미지 인식 딥러닝 알고리즘을 이용한 온라인 부도 예측 시스템
CN108228428A (zh) 用于输出信息的方法和装置
US20220292074A1 (en) Facilitating efficient and effective anomaly detection via minimal human interaction
EP2920747A1 (en) Identifying operability failure in dr assets
US11935077B2 (en) Operational predictive scoring of components and services of an information technology system
CN113780329A (zh) 用于识别数据异常的方法、装置、服务器和介质
CN115705406A (zh) 关联干扰事件与事故或凭单
Barrela et al. Data reconstruction of flow time series in water distribution systems–a new method that accommodates multiple seasonality
Ilonen et al. Toward automatic forecasts for diffusion of innovations
US20170109640A1 (en) Generation of Candidate Sequences Using Crowd-Based Seeds of Commonly-Performed Steps of a Business Process

Legal Events

Date Code Title Description
E902 Notification of reason for refusal
AMND Amendment
E601 Decision to refuse application
X091 Application refused [patent]
AMND Amendment
X701 Decision to grant (after re-examination)