KR102441135B1 - 딥러닝 기반 발전소의 다중 출력 값 예측 방법 및 이를 수행하는 시스템 - Google Patents

딥러닝 기반 발전소의 다중 출력 값 예측 방법 및 이를 수행하는 시스템 Download PDF

Info

Publication number
KR102441135B1
KR102441135B1 KR1020190178228A KR20190178228A KR102441135B1 KR 102441135 B1 KR102441135 B1 KR 102441135B1 KR 1020190178228 A KR1020190178228 A KR 1020190178228A KR 20190178228 A KR20190178228 A KR 20190178228A KR 102441135 B1 KR102441135 B1 KR 102441135B1
Authority
KR
South Korea
Prior art keywords
power plant
time
sensor
output value
power generation
Prior art date
Application number
KR1020190178228A
Other languages
English (en)
Other versions
KR20210085316A (ko
Inventor
김익재
최희승
임현기
최예지
Original Assignee
한국과학기술연구원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국과학기술연구원 filed Critical 한국과학기술연구원
Priority to KR1020190178228A priority Critical patent/KR102441135B1/ko
Publication of KR20210085316A publication Critical patent/KR20210085316A/ko
Application granted granted Critical
Publication of KR102441135B1 publication Critical patent/KR102441135B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/08Construction
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • HELECTRICITY
    • H02GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
    • H02JCIRCUIT ARRANGEMENTS OR SYSTEMS FOR SUPPLYING OR DISTRIBUTING ELECTRIC POWER; SYSTEMS FOR STORING ELECTRIC ENERGY
    • H02J3/00Circuit arrangements for ac mains or ac distribution networks
    • H02J3/004Generation forecast, e.g. methods or systems for forecasting future energy generation
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y04INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
    • Y04SSYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
    • Y04S10/00Systems supporting electrical power generation, transmission or distribution
    • Y04S10/50Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y04INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
    • Y04SSYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
    • Y04S40/00Systems for electrical power generation, transmission, distribution or end-user application management characterised by the use of communication or information technologies, or communication or information technology specific aspects supporting them
    • Y04S40/20Information technology specific aspects, e.g. CAD, simulation, modelling, system security

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Power Engineering (AREA)
  • Evolutionary Computation (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Economics (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Feedback Control In General (AREA)
  • Testing And Monitoring For Control Systems (AREA)

Abstract

실시예들은, 발전소에 설치된 센서의 적어도 일부로부터 센서 데이터를 수신하는 단계; 및 특정의 시간에서의 발전소의 예측 출력 값을 얻기 위해 수신된 센서 데이터를 미리 학습된 예측 모델에 적용하는 단계를 포함하되, 상기 예측 모델은 상기 특정 시간을 포함한 복수의 시간에서의 발전소의 발전량을 각각 출력하도록 구성된 것을 특징으로 하는 복수의 시점에서의 발전소의 다중 출력 값을 예측하는 방법 및 이를 수행하는 시스템에 관한 것이다.

Description

딥러닝 기반 발전소의 다중 출력 값 예측 방법 및 이를 수행하는 시스템{DEEP LEARNING BASED METHOD FOR ESTIMATING MULTI-OUTPUT VALUE OF POWER PLANT AND SYSTEM FOR PERMOING THE SAME}
본 발명의 실시예들은 발전소의 상태를 예측하는 기술에 관한 것으로서, 보다 상세하게는 딥러닝 기반 예측 모델을 사용하여 다수의 시간에서의 발전소의 다중 출력 값을 예측하는 방법 및 이를 수행하는 시스템에 관련된다.
화력 발전소, 원자력 발전소 등과 같은, 대규모의 전력을 발전하는 발전소는 현대 사회에 있어서 필수적인 기간 시설이다. 이러한 발전소의 사고는, 사고 발생으로부터 직접적으로 발생하는 인적, 물적 자원의 손실은 물론, 사고 이후 전력 공급 실패에 따른 간접적인 인적, 물적 자원의 손실을 포함한, 엄청난 사회적 손실을 야기한다. 따라서, 발전소는 운영의 안정성의 확보가 매우 중요하다.
이를 위해, 발전소에는 수백 내지 수만개의 센서를 통해 발전소의 상태를 수집하고, 사고 발생 시 즉각적인 대응을 하도록 운영된다.
그러나, 센서를 통해 수집된 데이터는 과거 내지 현재까지의 시간 구간(duration)의 상태만을 파악할 수 있어, 미래 시간에서의 사고에 선지적으로 대응하는데 한계가 있다.
특허공개공보 제10-2015-0043076호 (2015.04.22.)
본 발명의 실시예들은 딥러닝 기반 예측 모델을 사용하여 다수의 시간에서의 발전소의 다중 출력 값을 예측하는 방법 및 이를 수행하는 시스템을 제공하고자 한다.
본 발명의 일 측면에 따른 프로세서를 포함한 컴퓨팅 장치에 의해 수행되는, 복수의 시점에서의 발전소의 다중 출력 값을 예측하는 방법은: 발전소에 설치된 센서의 적어도 일부로부터 센서 데이터를 수신하는 단계; 및 사용자가 예측을 원하는 특정의 시간에서의 발전소의 출력 값을 얻기 위해, 수신된 센서 데이터 및 상기 특정 시간의 시간 정보를 미리 학습된 예측 모델에 적용하는 단계를 포함하되, 상기 예측 모델은 상기 특정 시간을 포함한 복수의 시간에서의 발전소의 발전량을 각각 출력하도록 구성된다.
일 실시예에서, 상기 수신된 센서 데이터를 예측 모델에 적용하는 단계는, 상기 예측 모델에 적용하기 이전에, 획득된 시계열 센서 데이터를 적층하여 입력 데이터 세트를 형성하는 단계; 및 상기 입력 데이터 세트를 상기 예측 모델에 적용하는 단계를 포함할 수 있다.
일 실시예에서, 상기 예측 모델은 입력된 센서 데이터로부터 특징을 추출하는 컨볼루션 레이어; 및 추출된 특징에 기초하여 특정 시간을 포함한 복수의 시간에서의 발전소의 발전량을 산출하도록 구성된 완전 연결 레이어를 포함할 수 있다.
일 실시예에서, 상기 예측 모델은, 훈련 데이터 세트(train dataset)에 기초하여 출력 값의 오차가 감소하도록 상기 예측 모델의 파라미터를 훈련하여 학습된 모델이며, 상기 출력 값의 오차는 입력에 따른 발전소의 예측 발전량으로서 목표 값(target value)과 상기 입력에 따른 예측 모델에 의해 산출된 출력 값(output value)의 차이이다.
일 실시예에서, 상기 예측 모델의 파라미터는, 상기 훈련 데이터 세트에 기초하여 상기 특정 시간과 복수의 시간에 포함된 주변 시간의 상관관계의 정도가 증가하도록 더 훈련될 수 있다.
일 실시예에서, 상기 예측 모델의 파라미터는 출력 값의 오차 및 상관관계의 정도에 기초한 손실함수(Ltrain)를 감소하도록 학습되며, 상기 손실함수(Ltrain)는 다음의 수학식으로 표현된다.
[수학식]
Figure 112019135643534-pat00001
여기서, Lerror는 상기 출력 값의 오차에 대응하는 함수이고, LDSSIM은 상관관계의 정도에 대응하는 함수를 각각 나타내며, λ는 상기 수학식에서 상대적으로 학습이 진행되지 않는 함수의 가중치를 증가하도록 조절된다.
일 실시예에서, 상기 LDSSIM은 다음의 수학식으로 표현된다.
[수학식]
Figure 112019135643534-pat00002
여기서, 입력이 센서 데이터 xi인 경우, yi는 입력에 따른 목표 값,
Figure 112019135643534-pat00003
는 상기 입력에 따른 예측 모델로부터 산출된 출력 값을 각각 나타내고, 상기 SSIM은 yi의 데이터와
Figure 112019135643534-pat00004
의 데이터의 왜곡 정도를 나타낸다.
일 실시예에서, 상기 SSIM은 다음의 수학식으로 표현된다.
[수학식]
Figure 112019135643534-pat00005
여기서, μyi는 yi의 평균,
Figure 112019135643534-pat00006
Figure 112019135643534-pat00007
의 평균, σyi는 yi의 분산,
Figure 112019135643534-pat00008
Figure 112019135643534-pat00009
의 분산,
Figure 112019135643534-pat00010
는 yi,
Figure 112019135643534-pat00011
의 공분산을 각각 나타낸다.
일 실시예에서, 상기 특정 시간을 포함한 복수의 시간은, 미리 설정된 타임 윈도우 및 상기 특정 시간에 기초하여 결정된다.
일 실시예에서, 상기 방법은: 상기 발전소에 설치된 센서에서 출력 값인 발전량과 상관관계를 갖는 센서를 추출하는 단계를 더 포함할 수 있다.
일 실시예에서, 상기 발전량과 상관관계를 갖는 센서를 추출하는 단계는,
발전소의 발전량이 최소 값을 보인 시간 보다 소정의 이전 시간 또는 동일한 시간에 최대 또는 최소의 센서 값을 갖는 센서를 상관관계를 갖는 센서로 추출하는 단계를 포함할 수 있다.
본 발명의 일 측면에 따른 컴퓨터 판독가능 기록매체는: 컴퓨팅 장치에 의해 판독가능하고, 상기 컴퓨팅 장치에 의해 동작 가능한 프로그램 명령어를 저장할 수 있다. 여기서, 상기 프로그램 명령어가 상기 컴퓨팅 장치의 프로세서에 의해 실행되는 경우 상기 프로세서가 상기 실시예들 중 하나에 따른 방법을 수행하게 한다.
본 발명의 또 다른 일 측면에 따른 시스템은: 발전소에 설치되어 발전소의 발전량 및 상기 발전소의 출력과 상이한 정보를 획득하는 복수의 센서; 및 상기 복수의 센서의 적어도 일부로부터 센서 데이터를 수신하고, 특정 시간에서의 발전소의 예측 출력 값을 얻기 위해 수신된 센서 데이터를 미리 학습된 예측 모델에 적용하도록 구성된 데이터 처리 장치를 포함할 수 있다. 여기서 상기 예측 모델은 상기 특정 시간을 포함한 복수의 시간에서의 발전소의 다수의 예측 출력 값을 각각 출력하도록 구성된다.
본 발명의 일 측면에 따른 시스템은 센서 데이터를 기반으로 학습된 CNN 기반의 (예컨대, DenseNet 기반의) 예측 모델을 통해 발전소의 출력 값인 발전량을 다중으로 산출할 수 있다. 특히, 현재 시간 보다 미래의 특정 시간에서의 발전량 또한 산출할 수 있어, 발전소의 발전량을 예측할 수 있다.
상기 예측 모델은 사용자가 원하는 단일 시간 및 그 주변 시간에서의 발전소의 발전량의 상관관계에 기초하여 발전소의 발전량의 절대적인 크기를 추론하도록 구성되어, 발전소의 발전량에 대해 높은 예측 정확도를 가진다.
또한, 발전소에 설치되어 대용량 센서 데이터를 제공하는 수많은 센서 중에서 발전소의 발전량인 발전량과 높은 상관관계를 갖는 센서를 추출하여, 보다 효율적인 예측이 가능하다.
본 발명의 효과들은 이상에서 언급한 효과들로 제한되지 않으며, 언급되지 않은 또 다른 효과들은 청구범위의 기재로부터 당업자에게 명확하게 이해될 수 있을 것이다.
본 발명 또는 종래 기술의 실시예의 기술적 해결책을 보다 명확하게 설명하기 위해, 실시예에 대한 설명에서 필요한 도면이 아래에서 간단히 소개된다. 아래의 도면들은 본 명세서의 실시예를 설명하기 목적일 뿐 한정의 목적이 아니라는 것으로 이해되어야 한다. 또한, 설명의 명료성을 위해 아래의 도면들에서 과장, 생략 등 다양한 변형이 적용된 일부 요소들이 도시될 수 있다.
도 1은, 본 발명의 일 실시예에 따른, 예측 시스템의 개념도이다.
도 2a 및 도 2b는, 본 발명의 일 실시예에 따른, 센서의 센서 값과 발전소의 발전량 간의 관계를 설명하기 위한 그래프이다.
도 3은, 본 발명의 일 실시예에 따른, 예측 모델의 입출력 데이터를 설명하기 위한 개념도다.
도 4는, 본 발명의 일 실시예에 따른, 예측 모델의 개념적인 네트워크 아키텍처(network architecture) 도면이다.
도 5는, 본 발명의 일 실시예에 따른, 딥러닝 기반 발전소의 다중 출력 값 예측 방법의 흐름도이다.
도 6은, 본 발명의 일 실시예에 따른, 예측 모델에 의한 출력을 설명하기 위한 도면이다.
여기서 사용되는 전문 용어는 단지 특정 실시예를 언급하기 위한 것이며, 본 발명을 한정하는 것을 의도하지 않는다. 여기서 사용되는 단수 형태들은 문구들이 이와 명백히 반대의 의미를 나타내지 않는 한 복수 형태들도 포함한다. 명세서에서 사용되는 "포함하는"의 의미는 특정 특성, 영역, 정수, 단계, 동작, 요소 및/또는 성분을 구체화하며, 다른 특성, 영역, 정수, 단계, 동작, 요소 및/또는 성분의 존재나 부가를 제외시키는 것은 아니다.
다르게 정의하지는 않았지만, 여기에 사용되는 기술용어 및 과학용어를 포함하는 모든 용어들은 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자가 일반적으로 이해하는 의미와 동일한 의미를 가진다. 보통 사용되는 사전에 정의된 용어들은 관련기술문헌과 현재 개시된 내용에 부합하는 의미를 가지는 것으로 추가 해석되고, 정의되지 않는 한 이상적이거나 매우 공식적인 의미로 해석되지 않는다.
이하에서, 도면을 참조하여 본 발명의 실시예들에 대하여 상세히 살펴본다.
발전소의 다중 출력 값 예측 방법을 수행하는 시스템(이하, "예측 시스템")(1)은 발전소에서 출력 값인 발전량을 임의의 시점에서 산출하도록 구성된다. 상기 임의의 시간이 현재 시간 보다 미래의 특정 시간인 경우, 예측 시스템(1)은 미래의 특정 시점에서의 발전소의 발전량을 예측할 수 있다. 상기 시스템(1)은 미래의 특정 시간을 포함한 다수의 시간에서의 발전소의 발전량을 다중 예측 출력 값으로 산출하여 사용자에게 제공한다.
본 명세서의 다중 출력 값 예측 방법 및 이를 수행하는 시스템은 전력을 발전하는 발전소의 발전량을 예측하는 발명이나, 출력 값의 대상이 발전소에 제한되지 않는 다는 것이 통상의 기술자에게 명백할 것이다. 본 발명의 출력 값은 발전소 이외의 다른 대상으로서, 공장 등과 같은 공간적 대상, 또는 특정 데이터, 데이터 값을 출력하는 장치 등에 대해서도 적용될 수 있다. 이하, 발전소의 발전량을 대표로 본 발명을 보다 상세하게 서술한다.
도 1은, 본 발명의 일 실시예에 따른, 예측 방법을 수행 가능한 시스템의 개념도이다.
도 1을 참조하면, 본 발명의 일 측면에 따른 예측 시스템(1)은 발전소의 상태를 분석하기 위한 센서 데이터를 획득하는 센서(미도시) 및 상기 센서로부터 센서 데이터를 수신하여 발전소의 예측 출력 값을 산출하는 데이터 처리 장치(10)를 포함한다.
실시예들에 따른 예측 시스템(1)은 전적으로 하드웨어이거나, 전적으로 소프트웨어이거나, 또는 부분적으로 하드웨어이고 부분적으로 소프트웨어인 측면을 가질 수 있다. 예컨대, 시스템은 데이터 처리 능력이 구비된 하드웨어 및 이를 구동시키기 위한 운용 소프트웨어를 통칭할 수 있다. 본 명세서에서 "부(unit)", "모듈(module)", "장치", 또는 "시스템" 등의 용어는 하드웨어 및 해당 하드웨어에 의해 구동되는 소프트웨어의 조합을 지칭하는 것으로 의도된다. 예를 들어, 하드웨어는 CPU(Central Processing Unit), GPU(Graphic Processing Unit) 또는 다른 프로세서(processor)를 포함하는 데이터 처리 기기일 수 있다. 또한, 소프트웨어는 실행중인 프로세스, 객체(object), 실행파일(executable), 실행 스레드(thread of execution), 프로그램(program) 등을 지칭할 수 있다.
센서는 발전소의 발전 상태 및/또는 발전소 내부/외부의 환경 상태에 대한 정보를 얻을 수 있는 데이터 획득 장치이다. 센서는 주변 환경의 물리적 데이터를 감지하여 해당 물리적 데이터의 크기를 센서 값으로 획득할 수 있다.
상기 예측 시스템(1)은 하나 이상의 센서를 통해 하나 이상의 유형의 정보를 획득할 수 있다. 상기 센서는, 예를 들어, 전류 센서, 전기 센서, 전력 센서, 온도 센서, 압력 센서, 수분 센서, 중력 센서, 지자기 센서, 모션 센서, 자이로 센서, 가속도 센서, 기울임 센서, 밝기 센서, 후각 센서, 뎁스 센서, 밴딩 센서, 오디오 센서, 이미지 센서, 및 이들의 조합 중 하나 이상을 포함할 수 있다.
일 실시예에서, 예측 시스템(1)은 발전소의 발전량을 획득하는 전력 센서 및 발전소의 환경 정보와 같은 다른 센서 데이터를 획득하는 환경 센서 중 하나 이상을 포함할 수 있다.
센서는 센서 값 및 해당 센서 값이 획득된 감지 시간을 포함한 센서 데이터를 데이터 처리 장치(10)에 제공한다. 이러한 센서 데이터의 제공으로 인해, 데이터 처리 장치(10)는 과거의 연속적인 시간 구간에 대한 센서 데이터를 보유할 수 있다.
데이터 처리 장치(10)는 센서 데이터를 수신하고, 수신된 센서 데이터를 처리하도록 구성된다. 데이터 처리 장치(10)가 수신한 센서 데이터는 시간-센서 값 그래프로 표현될 수 있다.
데이터 처리 장치(10)는 센서의 설치 상태를 포함한 센서 테이블을 미리 저장하도록 구성될 수 있다. 상기 센서 테이블은 센서 식별자, 센서 세부 정보(예컨대, 유형 등), 연관된 설비, 센서 설치 위치 중 하나 이상을 포함한다. 상기 세부 정보의 유형은 센서 값이 의미하는 물리적 데이터를 표현한 항목이다. 이 경우, 예측 시스템(1)은 획득된 센서 데이터를 해당 센서에 대한 항목에 반영하도록 더 구성된다.
데이터 처리 장치(10)는 수신된 센서 데이터에 기초해서 임의의 시간에서의 발전소의 발전량을 산출하도록 구성된다. 데이터 처리 장치(10)는 현재 시간 보다 미래의 특정 시간에서의 발전소의 발전량을 산출할 수 있어, 발전소의 발전량을 예측할 수 있다.
이하, 설명이 명료성을 위해서, 특정 시간은 현재 시간 보다 미래의 임의의 시간으로, 그리고 데이터 처리 장치(10)가 상기 특정 시간에서의 발전소의 발전량을 산출하는 동작을 발전소의 발전량을 예측하는 동작으로 지칭하여 본 발명을 보다 상세하게 서술한다.
데이터 처리 장치(10)는 발전소에 설치된 복수의 센서 중 적어도 일부 센서로부터 수신한 센서 데이터에 기초하여 예측 동작을 수행할 수 있다. 예측 동작에 발전소에 설치된 모든 센서의 센서 데이터가 요구되지 않을 수 있기 때문이다.
일 실시예에서, 데이터 처리 장치(10)로 센서 데이터를 제공하는 센서는 발전소의 발전량과 상대적으로 높은 상관관계를 갖는 센서로 설정될 수 있다.
통상적으로 발전소에 설치되는 센서의 수는 수십 내지 수만개이다. 예측 대상인 발전소의 발전량과 높은 상관관계를 갖는 센서의 센서 데이터를 사용하여 발전소의 예측 출력 값을 산출할 경우, 데이터 처리의 부담이 경감될 수 있다.
상기 제공하는 센서는 발전소의 발전량이 하강하는 경향과 높은 상관관계를 갖는 센서로 설정될 수 있다. 발전소에서 긴급한 상황이 발생하는 대부분이 경우는 발전소의 발전량이 감소하는 경우이다. 예를 들어, 발전기에 고장이 발생하는 경우 발전량은 감소한다. 따라서, 발전소의 하강하는 출력 값과 높은 상관관계를 갖는 센서의 센서 데이터가 발전소의 발전량을 예측하는데 효율적일 수 있다.
일 실시예에서, 사용자는 데이터 처리 장치(10)를 통해 발전소의 발전량과 높은 상관관계를 갖는 센서는: 발전소의 발전량이 최소 또는 최대 값을 보인 시간 보다 소정의 이전 시간 또는 동일한 시간에 최대 또는 최소의 센서 값을 갖는 센서를 상관관계를 갖는 센서로 설정할 수 있다. 일부 실시예에서, 센서 데이터를 제공하는 센서는: 발전소의 발전량이 최소 값을 보인 시간 보다 소정의 이전 시간 또는 동일한 시간에 최대 또는 최소의 센서 값을 갖는 센서로 설정되어, 발전소의 하강하는 출력 값과 상대적으로 높은 상관관계를 갖는 센서의 센서 데이터가 예측을 위해 사용된다. 여기서, 발전소의 발전량이 최소 값을 보인 시간 보다 이후에 최대 또는 최소 값을 갖거나, 소정의 이전 시간 보다 더 이전에 최대 또는 최소 값을 갖는 센서가 상대적으로 낮은 상관관계를 갖는 센서이다.
발전소의 발전량의 최소가 되는 시간으로부터 상기 소정의 이전 시간까지의 시간 간격(duration)은 발전소의 예측 출력 값에 영향을 미치는 센서 데이터의 범위로서, 예를 들어 10분일 수 있으나, 이에 제한되진 않는다.
도 2a 및 도 2b는, 본 발명의 일 실시예에 따른, 센서의 센서 값과 발전소의 발전량 간의 관계를 설명하기 위한 그래프이다.
도 2a를 참조하면, 그래프 상단에 표시된 발전소의 발전량(즉, 전력량)이 최소가 되는 시간은 Tp,min이다. 한편, 도 2a에 도시된 센서 데이터를 획득한 제1 내지 제9 센서 중에서 Tp,min 보다 소정의 이전 시간(예컨대, 10분)에 최소 센서 값을 갖는 센서는 제9 센서를 포함한다.
도 2b를 참조하면, 그래프 상단에 표시된 발전소의 발전량(즉, 전력량)이 최소가 되는 시간은 Tp,min이다. 한편, 도 2b에 도시된 센서 데이터를 획득한 제181, 182 센서 중에서 Tp,min 보다 소정의 이전 시간(예컨대, 10분)에 최대 센서 값을 갖는 센서는 제182 센서를 포함한다.
그러면, 예측 시스템(1)은 상기 제9 센서 및 제182 센서를 높은 상관관계를 갖는 센서로 설정하고, 데이터 처리 장치(10)는 상기 제9 센서 및 제182 센서의 센서 데이터를 수신하여 발전소의 예측 출력 값을 산출하는데 사용한다.
데이터 처리 장치(10)의 예측 동작은 사용자 요청에 응답하여 수행될 수 있다. 상기 사용자 요청이 입력되면, 데이터 처리 장치(10)는 입력된 시간으로부터 미래의 시간에서의 발전소의 발전량을 산출하고, 산출된 발전량을 예측 발전량으로 사용자에게 제공할 수 있다. 사용자 요청이 입력된 시간과 현재 시간은 일치하므로, 본 명세서에서 두 용어는 혼용된다.
예측될 미래의 특정 시간은 미리 설정될 수 있다. 예를 들어, 사용자 요청이 수신된 시간으로부터 5분뒤와 같은, 고정된 시간에서의 발전소의 예측 출력 값이 산출될 수 있다. 이 경우, 사용자 입력은 예측 시간과 관련된 정보를 포함할 필요가 없다.
또는, 사용자 요청이 예측을 원하는 특정 시간의 시간 정보를 포함한 경우, 데이터 처리 장치(10)는 해당 특정 시간에서의 발전소의 발전량을 산출하도록 구성된다. 이 경우, 요청에 포함된 시간 정보는 사용자가 예측하길 원하는 미래의 임의의 시간이다.
상기 사용자 요청의 시간 정보는 상대적인 시간으로 표현될 수 있다. 일 예에서, 상기 사용자 요청의 시간 정보는 현재 시간을 기준으로 상대적인 미래 시간(예컨대, 현재 시간으로부터 5분)으로 표현될 수 있다.
일부 실시예에서, 사용자 요청의 시간 정보는 현재 시간과 특징 시간 사이의 간격 정보만으로 표현될 수 있다. 예를 들어, 사용자 요청이 간격 정보 t를 포함하는 경우, 데이터 처리 장치(10)는 자동으로 현재 시간으로부터 t이후의 시간에서의 발전소의 발전량을 산출하도록 구성된다.
다른 일 실시예에서, 상기 시간 정보는 절대적인 시간으로 표현될 수 있다. 이 경우, 데이터 처리 장치(10)는 사용자 입력의 절대적인 시간 정보 및 현재 시간에 기초하여 사용자 입력의 시간 정보에 대응하는 상대적인 미래 시간을 산출할 수 있다.
위에서는 시간 정보를 표현하는 기준으로 현재 시간을 사용하였지만, 상이한 시간이 기준으로 활용될 수 있다. 예를 들어, 센서 데이터가 획득된 최종 시간과 현재 시간 사이에 다소의 시간 간격(예컨대, 1ms 이상)이 있는 경우에는 센서 데이터가 획득된 최종 시간에 기초하여 발전소의 발전량을 예측할 수 있다. 이하, 설명이 명료성을 위해서, 데이터가 획득된 최종 시간과 현재 시간이 일치하는, 실시간 데이터 획득 시스템을 기준으로 본 발명을 보다 상세하게 서술한다.
데이터 처리 장치(10)가, 특정 시간의 시간 정보를 포함한 사용자 요청을 수신한 경우, 해당 특정 시간에서의 발전소의 발전량을 산출한다.
데이터 처리 장치(10)는 복수의 센서 중 적어도 일부로부터 획득된 센서 데이터 및 상기 특정 시간의 시간 정보를 예측 모델에 적용하여 해당 특정 시간에서의 발전소의 발전량을 산출하도록 구성된다.
일 실시예에서, 데이터 처리 장치(10)는 예측을 위해 사용될 센서 데이터를 예측 모델에 입력하기 이전에, 센서 데이터를 적층하여 입력 데이터 세트를 형성할 수 있다.
도 3은, 본 발명의 일 실시예에 따른, 예측 모델의 입출력 데이터를 설명하기 위한 개념도다.
도 3을 참조하면, 데이터 처리 장치(10)는, 복수의 센서에서 획득된 시계열 센서 데이터를 적층하여 예측 모델을 위한 입력 데이터 세트를 형성한다. 일 실시예에서, 상기 복수의 센서는 상관관계를 갖는 것으로 설정된 센서로 이루어질 수 있다.
예를 들어, 데이터 처리 장치(10)가, 높은 상관관계를 갖는 것으로 설정된, 13개의 센서로부터 센서 데이터를 수신한 경우, 데이터 처리 장치(10)는 각 센서에 대한 시계열 센서 데이터를 적층하여, 도 3의 입력 데이터 세트를 형성한다.
예측 모델에서 특징을 추출하는 필터 등의 레이어 구조에 따라서 상기 적층되는 센서 데이터의 시간 범위는 수신된 센서 데이터의 적어도 일부로 설정된다. 예를 들어, 도 3에 도시된 바와 같이, 적층된 시계열 데이터는 수평 축이 224 points로 구성될 수 있다. 이를 위해, 데이터 처리 장치(10)는 예측 모델에서 적층을 위해 미리 설정된 타임 윈도우(time window)로 센서 데이터를 분할(segment)하도록 더 구성될 수 있다.
예측 모델은 적층을 통해 형성된 입력 데이터 세트를 수신하여 특정 시간을 포함한 복수의 시간에서의 발전소의 발전량을 산출하도록 구성된다. 특정 시간을 비롯한, 복수의 시간에 포함된 다른 시간 또한 현재 시간 보다 미래의 시간이다. 즉, 예측 모델은 센서 데이터로부터 다중 예측 값을 산출하도록 구성된다.
예측 모델은 다수의 시간에서의 센서 데이터를 입력으로 수신하고 다수의 시간에 대한 값을 출력하는, 다중 입력/다중 출력 구조를 가진다.
일 실시예에서, 복수의 시간은 특정 시간에 인접한 시간일 수 있다. 사용자가 예측을 원하는 시간은 특정 시간이므로, 상기 특정 시간으로부터 먼 시간은 발전량 산출의 필요성이 없기 때문이다. 상기 인접한 시간은 미리 설정된 예측 시간 간격에 의존한다. 상기 예측 시간 간격은 시간 단위(예컨대, 분/초/밀리초 등)로 연속된 시간 범위일 수 있다.
일 예에서, 특정 시간이 현재 시간(t)으로부터 x분 이후인 경우, 상기 복수의 시간은 상기 특정 시간(t+x(단위:분))을 중간 값으로 가지며 미리 설정된 주변 시간(neighbourhood time)의 범위(M)에 따라 설정될 수 있다. 그러면, 상기 복수의 시간은 다음의 수학식으로 표현된다.
Figure 112019135643534-pat00012
도 3에 도시된 바와 같이, M=2, x=5분인 경우, 예측 모델이 발전소의 발전량을 산출하는 복수의 시간은, 사용자가 원하는 특정 시간 t+5 및 그 주변의 다른 시간 t+3, t+4, t+6, t+7을 포함한다.
그러나, 상기 특정 시간 및 주변 시간을 포함한 복수의 시간은 특정 시간이 중간 값인 경우에 제한되지 않는다. 예를 들어, 특정 시간이 주변 시간 보다 가장 빠른 시간, 또는 주변 시간 보다 가장 느린 시간을 갖도록 복수의 시간이 설정될 수도 있다.
또 다른 일 예에서, 특정 시간이 현재 시간으로부터 t분 이후인 경우, 상기 시간 범위는 현재 시간으로부터 상기 t분까지의 시간 범위일 수 있다.
도 3에 도시된 바와 같이, 특정 시간이 현재 시간(t)으로부터 5분 이후인 경우, 예측 모델이 발전소의 발전량을 산출하는 복수의 시간은, t+1, t+2, t+3, t+4, t+5를 포함한다.
이와 같은 다중 출력을 위해, 예측 모델은 적층을 통해 형성된 입력 데이터 세트에서 특징을 추출하고, 추출된 특징에 기초해서 특정 시간을 포함한 복수의 시간에서의 발전소의 발전량을 다중 예측 값으로 산출하도록 구성된다.
도 4는, 본 발명의 일 실시예에 따른, 예측 모델의 개념적인 네트워크 아키텍처(network architecture) 도면이다.
도 4를 참조하면, 상기 예측 모델은 입력된 센서 데이터로부터 특징을 추출하는 컨볼루션 레이어; 및 추출된 특징에 기초하여 특정 시간에서의 출력 값을 산출하기 위한, 완전 연결 레이어를 포함한다. 도 4에 도시된 바와 같이, 입력되는 센서 데이터는 적층된 입력 데이터 세트일 수 있다.
일 예에서, 상기 예측 모델은, 컨볼루션 레이어; 댄스블록(denseblock) 및 맥스 풀링 레이어를 포함하는, DesenNet 기반으로 구성될 수 있다.
DesenNet 기반의 예측 모델은 이전 레이어들의 특징 맵을 계속해서 다음 레이어의 입력과 연결하는, 댄스 연결(dense connectivity)을 가진다. 여기서 댄스 연결은 특징맵 간의 결합(concatenation)을 수행하게 한다.
상기 예측 모델은 하나 이상의 댄스 블록을 포함한다. 상기 댄스 블록은 낮은 레이어의 특징 맵의 채널의 개수(k)를 갖도록 구성된다. 여기서 k는 grow rate로 지칭된다. DenseNet 기반의 예측 모델에서는 각 특징맵이 서로 밀도있게(densely) 연결되는 구조이므로, 특징 맵의 채널 개수가 많은 경우 channel-wise로 인해 채널의 수가 증가할 가능성이 있다. 이로 인해, k는 낮은 값(예컨대, 도 4에 도시된 "1")을 가진다.
상기 예측 모델은 댄스 블록에서 출력되는 데이터(예컨대, 특징맵)을 샘플링하는 레이어를 더 포함할 수 있다. 예를 들어, 도 4에 도시된 바와 같이, 맥스-풀링 레이어를 더 포함할 수 있다. 또한, 다른 풀링 레이어, 배치 정규화 레이어(batch normalization layer), 드롭 아웃(drop-out) 레이어 등과 같은, 기계학습 모델의 성능을 개선할 수 있는 다른 레이어를 더 포함할 수 있다.
일 실시예에서, 상기 예측 모델은, 추출된 특징을 완전 연결 레이어에 제공하기 이전에, 추출된 특징을 시간 축에 대해서 전체 평균 풀링(Global Average Pooling) 처리를 하도록 더 구성될 수 있다.
완전 연결 레이어는 다수의 노드 및 파라미터(예컨대, 가중치)를 포함하며, 완전 연결 레이어의 파라미터는 현재 시간 보다 미래의 임의의 시간에서의 발전소의 발전량 값을 산출하도록 학습된다. 그 결과, 완전 연결 레이어는 미래의 특정 시간을 포함한 복수의 시간에서의 예측 출력 값에 대응하는 복수의 값에 대한 회귀(regression) 연산을 수행할 수 있다.
회귀 연산을 통해 산출된 다수의 출력 값은 특정 시간을 포함한 다수의 시간에서의 발전소의 발전량 값으로서, 발전소의 다중 예측 출력 값으로 산출된다. 각 예측 출력 값은 시간-센서 값의 그래프에서 지점(points)에 대응한다.
상기 예측 모델의 파라미터는 특정 시간을 포함한 복수의 시간에서의 발전소의 발전량을 산출하도록 학습된다. 이러한 예측 모델의 학습은 훈련 데이터 세트에 기초하여 수행된다.
상기 훈련 데이터 세트에 포함된 각 훈련 샘플(training sample)은 복수의 센서에서 획득된 센서 값 및 획득 시간을 포함한 센서 데이터를 각각 포함한다. 상기 복수의 센서는 발전소의 발전량을 감지하여 발전소의 발전량을 획득하는 전력 센서를 포함한다.
일부 실시예에서, 상기 훈련 샘플의 센서 데이터는 발전소의 발전량과 높은 상관관계를 갖는 것으로 결정된, 센서로부터 획득된 데이터일 수 있다.
상기 파라미터는 예측 모델을 모델링하는 과정에서 만들어진 모델 파라미터를 포함하며, 예를 들어, 가중치(weight) 또는 편향(bias) 파라미터 등을 포함한다.
예측 모델의 파라미터는, 훈련 데이터 세트(train dataset)에 기초하여 출력 값의 오차가 감소하도록 상기 예측 모델의 파라미터를 훈련함으로써, 학습된다. 출력 값의 오차는 학습을 위한 손실 함수(loss function)의 성분으로서, 입력에 대한 예측 모델의 출력 값(output value)과 목표 값(target value) 간의 차이의 함수이다. 예를 들어, 입력이 센서 데이터 xi이고, 입력에 따른 목표 값(예컨대, 실제 발전소 출력 값)이 yi이며, 해당 입력이 모델에 적용되어 획득된 결과 값(예컨대, 예측 모델에 의해 산출된 발전소 출력 값)이
Figure 112019135643534-pat00013
인 경우, 출력 값의 오차는 yi,
Figure 112019135643534-pat00014
의 함수로 표현된다.
기계학습 분야에서 파라미터를 학습하기 위한 대표적인 손실 함수는 MSE(Mean Squred Error)이다. 이 경우 출력 값의 오차는 다음의 수학식으로 표현된다.
Figure 112019135643534-pat00015
여기서, xi는 훈련 샘플에 포함된 센서 데이터(
Figure 112019135643534-pat00016
; T는 시계열 간격, n은 센서의 개수)를 나타내며, xi는 훈련을 위한 입력 데이터이다. yi는 입력에 따른 목표 값(예컨대, 실제 발전소 출력 값)이며,
Figure 112019135643534-pat00017
는 해당 입력을 예측 모델(f(x))에 적용한 결과 값(예컨대, 예측 모델에 의해 산출된 발전소 출력 값;
Figure 112019135643534-pat00018
)을 각각 나타낸다.
그러나, 상기 예측 모델의 파라미터는, MSE와 같이 출력 값의 오차가 감소하는 방향으로만 학습되지 않는다. 상기 예측 모델이 발전 출력값의 주변 값과의 상관관계를 고려하여 발전 출력값의 절대적인 크기를 추론할 수 있도록, 상기 예측 모델은 특정 시간에서의 발전소의 발전량의 주변 시간에서의 값과의 상관관계에 더 기초하여 학습된다.
일 실시예에서, 예측 모델의 파라미터는 상기 훈련 데이터 세트에 기초하여 입력에 따른 데이터(예컨대, 실제 데이터)와 상기 예측 모델에서 출력된 값에 따른 데이터(예컨대, 예측된 데이터)의 상관관계의 정도가 증가하도록 더 훈련된다.
일 실시예에서, 예측 모델의 파라미터는 출력 값의 오차 및 데이터의 상관관계의 정도에 기초한 손실함수(Ltrain)를 감소하도록 학습된다. 상기 손실함수(Ltrain)는 다음의 수학식으로 표현된다.
Figure 112019135643534-pat00019
여기서, Lerror는 출력 값의 오차를 나타내는 함수이다. 상기 Lerror는 종래에 레이어 내 연결선에 가중치가 할당된 네트워크 아키텍처의 파라미터를 훈련하는데 활용되는 다양한 손실함수일 수 있다. 예를 들어, Lerror는 MSE, MAE(Mean Absolute Error) 등으로 표현될 수 있다.
LDSSIM은 두 데이터 간의 상관관계의 정도를 나타내는 함수로서, 데이터 구조의 차이점(Structural Dissimilarity)을 의미한다. 데이터의 상관관계는 예측 모델에 의한 데이터와 실제 데이터 사이의 왜곡 정도가 적을수록 상관관계가 높아지고, 반대로 이 왜곡 정도가 클수록 상관관계가 낮아진다.
일 실시예에서, 상관관계의 정도 LDSSIM는 다음의 수학식으로 표현될 수 있다.
Figure 112019135643534-pat00020
여기서, SSIM은 데이터의 왜곡 정도를 나타낸다. yi는 원본 데이터로서 입력 데이터에 따른 목표 값을 나타낸다. 예를 들어, yi는 실제 센서 데이터에 따른 실제 발전소의 발전량일 수 있다. 한편,
Figure 112019135643534-pat00021
는 왜곡된 데이터로서 입력이 예측 모델에 적용되어 획득된 출력 값을 나타낸다. 예를 들어,
Figure 112019135643534-pat00022
는 동일한 입력 데이터를 예측 모델에 적용하여 산출된 발전소의 발전량으로서 예측 출력 값이다.
일 실시예에서, 상기 데이터의 왜곡 정도는 다음의 수학식으로 표현된다.
Figure 112019135643534-pat00023
여기서, 여기서, μyi는 yi의 평균,
Figure 112019135643534-pat00024
Figure 112019135643534-pat00025
의 평균, σyi는 yi의 분산,
Figure 112019135643534-pat00026
Figure 112019135643534-pat00027
의 분산,
Figure 112019135643534-pat00028
는 yi,
Figure 112019135643534-pat00029
의 공분산을 각각 나타낸다. 한편, c1, c2는 0에 가까운 분모로 수학식 5의 분수를 안정화시키는 변수로서 k1L, k2L로 각각 표현될 수 있다. 여기서, L는 데이터 범위(예컨대, 데이터 데이터가 나타난 픽셀의 동적 범위)를 나타내고, k1, k2는 임의의 상수(예컨대, k1=0.01, k2= 0.03)로서 디폴트 값일 수 있다. 입력 데이터 세트가 특정 세그먼트로 분할되는 경우, L 값이 입력 데이터 세트의 픽셀 범위(예컨대, 도 4의 224 픽셀)로 고정되므로 C1, C2 값은 상수일 수 있다.
상기 수학식 4 및 5에 따르면, 데이터의 왜곡 정도가 감소할수록 상관관계의 정도가 증가한다. 예측 모델의 파라미터는 출력 값의 오차는 감소하고 상관관계의 정도가 증가하는 (즉, 왜곡 정도가 감소하는) 방향으로 학습된다.
λ는 사용자의 입력에 따라 조절되는 변수이다. λ는 상기 수학식 4에서 모델의 파라미터를 훈련하는데 있어서, 출력 크기의 오차 및 상관관계의 정도의 영향을 조절한다.
λ는 파라미터를 위한 손실함수(예컨대, 수학식 4)에 포함된 서브 함수 중에서 상대적으로 학습이 진행되지 않는 서브 함수에 대한 가중치를 증가시키도록 조절된다.
예를 들어, 훈련 초기에는 두 서브 함수의 가중치가 각각 0.5가 되도록 λ가 설정된다. 경우에 따라서, 훈련 도중에 서브 함수 Lerror의 값은 감소 방향으로 잘 학습이 되는데 서브 함수LDSSIM의 값은 증가 방향으로 잘 학습되지 않을 수 있다. 그러면, λ는 상대적으로 학습이 진행되지 않는 서브 함수LDSSIM의 가중치를 증가시키도록 조절된다. 즉, λ값이 줄어든다.
이러한 훈련 데이터 세트에 기초하여 훈련이 완료되면, 수학식 3의 손실 함수가 최소가될 때의 파라미터가 예측 모델의 파라미터로 결정된다. 그러면 학습이 완료된다.
훈련 데이터 세트에 기초하여 학습이 완료되면, 예측 모델은 훈련 데이터에 대응하는 입력 데이터(예컨대, T*n)를 수신하면, 특정 지점을 포함한 다수의 지점에 대한 회귀 예측을 수행할 수 있다.
이와 같이 학습된 예측 모델은 사용자가 원하는 특정 시간에서의 출력 값과 그 주변 시간에서의 출력 값이 산출되므로, 특정 시간에서의 출력 값과 그 주변 시간에서의 출력 값 사이의 관계에 기초하여 특정 시간에서의 출력 값이 감소하는지 또는 증가하는지 등과 같은 상태 변화 또한 획득될 수 있다.
일 실시예에서, 예측 모델에 학습에 사용되는 센서 데이터를 적용하기 이전에, 예측 모델에 입력될 센서 데이터를 증강 처리하여 학습이 진행될 수 있다. 상기 증강 처리는, 예를 들어, Jittering, Random scaling, Magnitude warping 등을 포함하나, 이에 제한되지 않으며 다양한 데이터 증강(Data Augmentation) 방식이 적용될 수 있다. 이로 인해, 예측 모델은 다양한 데이터에 대해 학습될 수 있다.
위에서는 DenseNet 구조로서 본 발명의 예측 모델을 설명하였으나, 상기 예측 모델은 이에 제한되지 않는다. 상기 예측 모델은, 예를 들어, ResNet 등과 같은, 입력 데이터로부터 특징을 추출하여 특정 지점에서의 값을 산출할 수 있는 다양한 CNN(Convolution Nerual Network) 구조의 기계학습 모델일 수 있다.
상기 예측 모델은 데이터 처리 장치(10)에 의해 생성된 모델일 수 있다. 또는, 상기 예측 모델은 예측 시스템(1)의 외부 구성요소에 의해 생성된 모델일 수 있다. 이 경우, 상기 예측 모델은 데이터 처리 장치(10)에 원격 위치한 외부 컴퓨팅 장치에 의해 미리 생성된 예측 모델을 예측 동작 이전에 수신하여 저장하고 발전소의 예측 출력 값을 산출하기 위해 사용할 수 있다. 이를 위해, 데이터 처리 장치(10)는 예측 모델을 저장하기 위한 저장 장치(미도시)를 더 포함할 수 있다. 상기 저장 장치는 휘발성 메모리(미도시), 비휘발성 메모리(미도시) 및 외장형 메모리(미도시) 중 적어도 하나를 포함하여 구성될 수 있다. 예를 들어, 휘발성 메모리는 읽기 전용 메모리(RAM) 또는 동기 동적 읽기 전용 메모리(synchronous DRAM, SDRAM), 2배속(DDR) SDRAM, 또는 램버스 DRAM(RDRAM) 등과 같은 동적 임의 접근 메모리 중 어느 하나일 수도 있고, 비휘발성 메모리는 읽기 전용 메모리(ROM), 플래시 메모리 중 어느 하나일 수도 있으며, 외장형 메모리는 MMC형, SD형, 및 CF형 메모리 카드 중 어느 하나일 수도 있다.
일 실시예에서, 데이터 처리 장치(10)는 전원 공급의 차단 등으로 인해 리셋이 수행되더라도 저장된 데이터가 소실되지 않는 비휘말성 메모리에 미리 학습된 모델을 다시 전원 공급이 시작된 이후에도 활용할 수 있도록 비휘말성 메모리에 미리 학습된 모델을 저장할 수 있다.
이와 같이, 예측 시스템(1)은 예측 모델에 기반하여 특정 시간을 포함한 복수의 시간에서의 발전소의 발전량 값을 산출할 수 있다. 상기 복수의 시간이 현재 시간 보다 미래의 시간인 경우, 산출된 발전량 값은 예측 발전량 값이다.
상기 예측 시스템(1)은 데이터 처리 장치(10)에 의해 산출된 예측 출력 값을 사용자에게 제공할 수 있다. 일 실시예에서, 예측 출력 값은 데이터 처리 장치(10)와 전기적으로 연결된 디스플레이 장치를 통해 제공될 수 있다. 다른 일 실시예에서, 예측 출력 값은 유/무선 전기 통신을 통해 연결된 사용자 단말을 통해 제공될 수도 있다.
상기 예측 시스템(1) 또는 일부 구성요소가 본 명세서에 서술되지 않은 다른 구성요소를 포함할 수도 있다는 것이 통상의 기술자에게 명백할 것이다. 예를 들어, 상기 예측 시스템(1)는 네트워크 인터페이스, 데이터 엔트리를 위한 입력 장치, 및 디스플레이, 인쇄 또는 다른 데이터 표시를 위한 출력 장치를 포함하는, 본 명세서에 서술된 동작에 필요한 다른 하드웨어 요소를 포함할 수도 있다.
본 발명의 다른 일 측면에 따른 딥러닝(예컨대, 예측 모델) 기반 발전소의 다중 출력 값 예측 방법은 프로세서를 포함한 컴퓨팅 장치에 의해 수행된다. 상기 프로세서를 포함한 컴퓨팅 장치는, 예를 들어 예측 시스템(1) 또는 일부 구성요소(예컨대, 데이터 처리 장치(10))에 의해 수행되거나, 또는 다른 컴퓨팅 장치에 의해 수행될 수도 있다. 이하, 설명의 명료성을 위해서 데이터 처리 장치(10)에 의해 수행되는 실시예로 예측 방법을 보다 상세하게 서술한다.
도 5는, 본 발명의 일 실시예에 따른, 발전소의 다중 출력 값 예측 방법의 흐름도이다.
도 5를 참조하면, 데이터 처리 장치(10)는 센서로부터 센서 데이터를 수신한다(S10). 상기 센서 데이터는 발전소의 내부/외부 환경을 나타내는 물리적 데이터의 크기인 센서 값 및 획득 시간(즉, 감지 시간)을 포함한다.
데이터 처리 장치(10)에 센서 데이터를 제공하는 센서는 발전소에 설치된 센서 중 적어도 일부일 수 있다. 일 실시예에서, 적어도 일부 센서는 발전소의 발전량과 상대적으로 높은 상관관계를 갖는 센서를 포함한다.
데이터 처리 장치(10)는 사용자가 발전소의 예측 출력 값을 제공해달라는 사용자 요청을 수신하면, 상기 사용자 요청에 응답하여 예측 출력 값을 제공한다(S100). 상기 예측 출력 값은 사용자가 예측을 원하는 특정 시간을 포함한 복수의 시간에서의 발전소의 발전량이다.
일 실시예에서, 복수의 시간은 상기 특정 시간 및 그 주변 시간을 포함한다. 그 주변 시간은 미리 설정된 예측 시간 간격에 포함되는 시간일 수 있다. 상기 예측 시간 간격은 시간 단위(예컨대, 분/초/밀리초 등)로 연속된 시간 범위일 수 있다. 이러한 복수의 시간에 대해서는 도 3을 참조하여 위에서 서술하였는바, 자세한 설명은 생략한다.
일 실시예에서, 데이터 처리 장치(10)는 단계(S10)에서 획득된 시계열 센서 데이터를 적층하여 입력 데이터 세트를 형성한다(S110). 데이터 처리 장치(10)는 형성된 입력 데이터 세트 및/또는 해당 특정 시간의 시간 정보를 미리 학습된 예측 모델에 적용한다.
상기 예측 모델은 출력 값 오차 및 상관관계 정도에 기초하여 미리 학습된 파라미터를 가진다. 파라미터의 학습에 대해서는 수학식 4 및 5를 참조하여 위에서 서술하였는바, 자세한 설명은 생략한다.
이와 같이 학습된 파라미터를 갖는 예측 모델은: 복수의 시간에서의 발전소의 발전량을 산출하는데 사용되는 특징을 입력 데이터 세트로부터 추출하고(S130), 추출된 특징에 기초해서 각 시간에서의 발전소의 발전량을 산출한다(S150).
이와 같이 산출된 특정 시간에서의 발전량은 해당 특정 시간 및 그 주변 시간에서의 발전량의 상관관계가 반영된 값이므로, 보다 높은 정확도를 가진다. 산출된 발전소의 발전량은 다중 예측 값으로 사용자에게 제공된다.
도 6은, 본 발명의 일 실시예에 따른, 예측 모델에 의한 출력을 설명하기 위한 도면이다.
도 6을 참조하면, 예측 모델은 특정 시점(도 6의 노란색 지점)을 포함한 다중 발전량 값을 제공한다. 도 6에 도시된 바와 같이, 특정 시점에서의 단일 발전량 값만을 제공하는 것이 아니다.
이와 같이, 다중 발전량 값을 제공하면, 동일한 예측 값이 나오는 경우에도 사용자는 발전소의 상태를 보다 정확하게 알 수 있다. 예를 들어, 도 6에서 서로 다른 제1 및 제2 시점에서의 발전소의 발전량은 800으로 동일한 값을 가진다. 만약 단일 출력 값을 제공하면, 이 제공 결과는 사용자가 제1 및 제2 시점의 발전소의 상태가 동일한 상황으로 오판을 하게 할 수 있다. 그러나, 다중 출력 값을 제공하기 때문에, 사용자는 제1 시점에서의 발전소의 발전량은 800이며 감소하는 상태라는 정보를 확인할 수 있는 반면, 제2 시점에서의 발전소의 발전량은 800이며 증가하는 상태라는 정보를 확인할 수 있다.
또한, 사용자에게 제공되는 정보는 각 시간에서의 발전소의 발전량은 물론, 복수의 시간 중 적어도 일부 시간에서의 발전소의 발전량의 상태 변화를 더 포함할 수 있다. 이러한 상태 변화 정보는 복수의 시간에서의 발전소의 예측된 발전량에 기초하여 산출될 수 있다.
이상에서 설명한 실시예들에 따른 딥러닝 기반 발전소의 발전량 예측 방법 및 이를 수행하는 시스템에 의한 동작은 적어도 부분적으로 컴퓨터 프로그램으로 구현되어, 컴퓨터로 읽을 수 있는 기록매체에 기록될 수 있다. 예를 들어, 프로그램 코드를 포함하는 컴퓨터-판독가능 매체로 구성되는 프로그램 제품과 함께 구현되고, 이는 기술된 임의의 또는 모든 단계, 동작, 또는 과정을 수행하기 위한 프로세서에 의해 실행될 수 있다.
상기 컴퓨터는 데스크탑 컴퓨터, 랩탑 컴퓨터, 노트북, 스마트 폰, 또는 이와 유사한 것과 같은 컴퓨팅 장치일 수도 있고 통합될 수도 있는 임의의 장치일 수 있다. 컴퓨터는 하나 이상의 대체적이고 특별한 목적의 프로세서, 메모리, 저장공간, 및 네트워킹 구성요소(무선 또는 유선 중 어느 하나)를 가지는 장치다. 상기 컴퓨터는 예를 들어, 마이크로소프트의 윈도우와 호환되는 운영 체제, 애플 OS X 또는 iOS, 리눅스 배포판(Linux distribution), 또는 구글의 안드로이드 OS와 같은 운영체제(operating system)를 실행할 수 있다.
상기 컴퓨터가 읽을 수 있는 기록매체는 컴퓨터에 의하여 읽혀질 수 있는 데이터가 저장되는 모든 종류의 기록신원확인 장치를 포함한다. 컴퓨터가 읽을 수 있는 기록매체의 예로는 ROM, RAM, CD-ROM, 자기 테이프, 플로피디스크, 광 데이터 저장신원확인 장치 등을 포함한다. 또한 컴퓨터가 읽을 수 있는 기록매체는 네트워크로 연결된 컴퓨터 시스템에 분산되어, 분산 방식으로 컴퓨터가 읽을 수 있는 코드가 저장되고 실행될 수도 있다. 또한, 본 실시예를 구현하기 위한 기능적인 프로그램, 코드 및 코드 세그먼트(segment)들은 본 실시예가 속하는 기술 분야의 통상의 기술자에 의해 용이하게 이해될 수 있을 것이다.
이상에서 살펴본 본 발명은 도면에 도시된 실시예들을 참고로 하여 설명하였으나 이는 예시적인 것에 불과하며 당해 분야에서 통상의 지식을 가진 자라면 이로부터 다양한 변형 및 실시예의 변형이 가능하다는 점을 이해할 것이다. 그러나, 이와 같은 변형은 본 발명의 기술적 보호범위 내에 있다고 보아야 한다. 따라서, 본 발명의 진정한 기술적 보호범위는 첨부된 특허청구범위의 기술적 사상에 의해서 정해져야 할 것이다.
본 발명의 일 측면에 따른 예측 시스템은 4차 산업 기술 중 하나인 기계학습 기술에 기초하여 미래의 특정 시간을 포함한 다수의 시간에서의 발전소의 발전량을 예측할 수 있다. 따라서, 화력, 원자력 발전소 등과 같은 다양한 발전소에서 이용될 가능성이 매우 높다.
특히, 상기 특정 시간과 그 주변 시간에서의 발전소의 발전량 사이의 상관관계에 기초하여 각 시간에서의 발전소의 발전량을 추론할 수 있다.

Claims (13)

  1. 프로세서를 포함한 컴퓨팅 장치에 의해 수행되는, 복수의 시점에서의 발전소의 다중 출력 값을 예측하는 방법에 있어서,
    발전소에 설치된 센서의 적어도 일부로부터 센서 데이터를 수신하는 단계; 및
    사용자가 예측을 원하는 특정의 시간에서의 발전소의 출력 값을 얻기 위해, 수신된 센서 데이터 및 상기 특정 시간의 시간 정보를 미리 학습된 예측 모델에 적용하는 단계를 포함하되,
    상기 예측 모델은 상기 특정 시간을 포함한 복수의 시간에서의 발전소의 발전량을 각각 출력하도록 구성된 것으로서, 입력된 센서 데이터로부터 특징을 추출하는 컨볼루션 레이어; 및 추출된 특징에 기초하여 특정 시간을 포함한 복수의 시간에서의 발전소의 발전량을 산출하도록 구성된 완전 연결 레이어를 포함하고,
    상기 예측 모델의 파라미터는, 상기 예측 모델이 상기 특정 시간에서의 발전량과 상기 특정 시간의 주변 시간에서의 발전량 간의 상관관계를 고려하여 상기 특정 시간에서의 발전량 출력 값의 절대적 크기를 추론할 수 있도록, 훈련 데이터 세트(train dataset)에 기초하여 출력 값의 오차가 감소하도록 그리고 상기 특정 시간에서의 발전량 출력 값과 주변 시간에서의 발전량 출력 값과의 상관관계의 정도가 증가하도록 훈련된 것을 특징으로 하는 방법.

  2. 제1항에 있어서, 상기 수신된 센서 데이터를 예측 모델에 적용하는 단계는,
    상기 예측 모델에 적용하기 이전에, 획득된 시계열 센서 데이터를 적층하여 입력 데이터 세트를 형성하는 단계; 및
    상기 입력 데이터 세트를 상기 예측 모델에 적용하는 단계를 포함하는 방법.
  3. 삭제
  4. 제1항에 있어서,
    상기 출력 값의 오차는 입력에 따른 발전소의 예측 발전량으로서 목표 값(target value)과 상기 입력에 따른 예측 모델에 의해 산출된 출력 값(output value)의 차이인 것을 특징으로 하는 방법.
  5. 삭제
  6. 제1항에 있어서,
    상기 예측 모델의 파라미터는 출력 값의 오차 및 상관관계의 정도에 기초한 손실함수(Ltrain)를 감소하도록 학습되며,
    상기 손실함수(Ltrain)는 다음의 수학식으로 표현되고,
    [수학식]
    Figure 112022022151863-pat00030

    여기서, Lerror는 상기 출력 값의 오차에 대응하는 함수이고, LDSSIM은 상관관계의 정도에 대응하는 함수를 각각 나타내며,
    λ는 상기 수학식에서 상대적으로 학습이 진행되지 않는 함수의 가중치를 증가하도록 조절되는 것을 특징으로 하는 방법.
  7. 제6항에 있어서,
    상기 LDSSIM은 다음의 수학식으로 표현되고,
    [수학식]
    Figure 112019135643534-pat00031

    여기서, 입력이 센서 데이터 xi인 경우, yi는 입력에 따른 목표 값,
    Figure 112019135643534-pat00032
    는 상기 입력에 따른 예측 모델로부터 산출된 출력 값을 각각 나타내고,
    상기 SSIM은 yi의 데이터와
    Figure 112019135643534-pat00033
    의 데이터의 왜곡 정도를 나타내는 것을 특징으로 하는 방법.
  8. 제7항에 있어서, 상기 SSIM은 다음의 수학식으로 표현되며,
    [수학식]
    Figure 112022022151863-pat00034

    여기서, μyi는 y의i 평균,
    Figure 112022022151863-pat00035
    Figure 112022022151863-pat00036
    의 평균, σyi는 yi의 분산,
    Figure 112022022151863-pat00037
    Figure 112022022151863-pat00038
    의 분산,
    Figure 112022022151863-pat00039
    는 yi,
    Figure 112022022151863-pat00040
    의 공분산을 각각 나타내며,
    C1, C2는 입력 데이터 세트의 범위에 기초한 것을 특징으로 하는 방법
  9. 제1항에 있어서, 상기 특정 시간을 포함한 복수의 시간은,
    미리 설정된 타임 윈도우 및 상기 특정 시간에 기초하여 결정되는 것을 특징으로 하는 방법.
  10. 제1항에 있어서,
    상기 발전소에 설치된 센서에서 출력 값인 발전량과 상관관계를 갖는 센서를 추출하는 단계를 더 포함하는 방법.
  11. 제10항에 있어서, 상기 발전량과 상관관계를 갖는 센서를 추출하는 단계는,
    발전소의 발전량이 최소 값을 보인 시간 보다 소정의 이전 시간 또는 동일한 시간에 최대 또는 최소의 센서 값을 갖는 센서를 상관관계를 갖는 센서로 추출하는 단계를 포함하는 방법.
  12. 컴퓨팅 장치에 의해 판독가능하고, 상기 컴퓨팅 장치에 의해 동작 가능한 프로그램 명령어를 저장하는 컴퓨터 판독가능 기록매체로서, 상기 프로그램 명령어가 상기 컴퓨팅 장치의 프로세서에 의해 실행되는 경우 상기 프로세서가 제1항, 제2항, 제4항, 제6항 내지 제11항 중 어느 하나의 항에 따른 방법을 수행하게 하는 컴퓨터 판독가능 기록매체.
  13. 발전소에 설치되어 발전소의 발전량 및 상기 발전소의 출력과 상이한 정보를 획득하는 복수의 센서; 및
    상기 복수의 센서의 적어도 일부로부터 센서 데이터를 수신하고, 특정 시간에서의 발전소의 예측 출력 값을 얻기 위해 수신된 센서 데이터를 미리 학습된 예측 모델에 적용하도록 구성된 데이터 처리 장치를 포함하며,
    상기 예측 모델은 상기 특정 시간을 포함한 복수의 시간에서의 발전소의 다수의 예측 출력 값을 각각 출력하도록 구성된 것으로서, 입력된 센서 데이터로부터 특징을 추출하는 컨볼루션 레이어; 및 추출된 특징에 기초하여 특정 시간을 포함한 복수의 시간에서의 발전소의 발전량을 산출하도록 구성된 완전 연결 레이어를 포함하고,
    상기 예측 모델의 파라미터는, 상기 예측 모델이 상기 특정 시간에서의 발전량과 상기 특정 시간의 주변 시간에서의 발전량 간의 상관관계를 고려하여 상기 특정 시간에서의 발전량 출력 값의 절대적 크기를 추론할 수 있도록, 훈련 데이터 세트(train dataset)에 기초하여 출력 값의 오차가 감소하도록 그리고 상기 특정 시간에서의 발전량 출력 값과 주변 시간에서의 발전량 출력 값과의 상관관계의 정도가 증가하도록 훈련된 것을 특징으로 하는 시스템.
KR1020190178228A 2019-12-30 2019-12-30 딥러닝 기반 발전소의 다중 출력 값 예측 방법 및 이를 수행하는 시스템 KR102441135B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020190178228A KR102441135B1 (ko) 2019-12-30 2019-12-30 딥러닝 기반 발전소의 다중 출력 값 예측 방법 및 이를 수행하는 시스템

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020190178228A KR102441135B1 (ko) 2019-12-30 2019-12-30 딥러닝 기반 발전소의 다중 출력 값 예측 방법 및 이를 수행하는 시스템

Publications (2)

Publication Number Publication Date
KR20210085316A KR20210085316A (ko) 2021-07-08
KR102441135B1 true KR102441135B1 (ko) 2022-09-08

Family

ID=76894546

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020190178228A KR102441135B1 (ko) 2019-12-30 2019-12-30 딥러닝 기반 발전소의 다중 출력 값 예측 방법 및 이를 수행하는 시스템

Country Status (1)

Country Link
KR (1) KR102441135B1 (ko)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102612280B1 (ko) * 2022-08-11 2023-12-08 (주)넥스톰 인공지능을 이용한 가상 센싱장치 및 방법

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101737968B1 (ko) * 2016-02-24 2017-05-19 호서대학교 산학협력단 발전플랜트 성능데이터 학습에 의한 발전기 출력 추정 방법

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20150043076A (ko) 2013-10-14 2015-04-22 두산중공업 주식회사 발전소 관리 시스템 및 그의 제어방법
KR101948604B1 (ko) * 2017-07-31 2019-02-15 고려대학교 산학협력단 센서 군집화 기반의 설비 건강 모니터링 방법 및 장치
KR20190065780A (ko) * 2017-12-04 2019-06-12 한국전기연구원 단독 태양광시스템 및 복합 태양광시스템의 수익 산정 방법 및 그 장치

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101737968B1 (ko) * 2016-02-24 2017-05-19 호서대학교 산학협력단 발전플랜트 성능데이터 학습에 의한 발전기 출력 추정 방법

Also Published As

Publication number Publication date
KR20210085316A (ko) 2021-07-08

Similar Documents

Publication Publication Date Title
KR102455722B1 (ko) 딥러닝 기반 발전소의 출력 값 예측 방법 및 이를 수행하는 시스템
CN113420073A (zh) 基于改进的孤立森林的异常样本检测方法及相关设备
CN114580263A (zh) 基于知识图谱的信息系统故障预测方法及相关设备
JP6718500B2 (ja) 生産システムにおける出力効率の最適化
KR20110034828A (ko) 세미 마르코프 조건부 랜덤 필드 모델 기반의 행동 인식 방법
CN112749758A (zh) 图像处理方法、神经网络的训练方法、装置、设备和介质
US20160357886A1 (en) System for analytic model development
CN111797861A (zh) 信息处理方法、装置、存储介质及电子设备
US20230316720A1 (en) Anomaly detection apparatus, anomaly detection method, and program
KR102441135B1 (ko) 딥러닝 기반 발전소의 다중 출력 값 예측 방법 및 이를 수행하는 시스템
KR20220059194A (ko) 대상 객체에 적응적인 객체 추적 방법 및 장치
CN113810765A (zh) 视频处理方法、装置、设备和介质
KR102131029B1 (ko) 사물인터넷 디바이스 식별 방법 및 시스템
KR20220073464A (ko) 설명 가능한 인공지능 제공 방법
JP2024507602A (ja) データ処理方法及び予測モデルをトレーニングするための方法
CN112784165A (zh) 关联关系预估模型的训练方法以及预估文件热度的方法
CN112036504A (zh) 温度测量模型的训练方法、装置、设备及存储介质
CN114140851B (zh) 图像检测方法和用于训练图像检测模型的方法
KR102493171B1 (ko) 센서 데이터 융합 기반 IoT 기상센서기기 이상감지 방법 및 시스템
CN115511779B (zh) 图像检测方法、装置、电子设备和存储介质
KR20200089450A (ko) 발전 설비의 상황을 모니터링하기 위한 이미지 생성 장치 및 방법
CN116821638B (zh) Ai芯片应用优化设计的数据分析方法及系统
CN114140852B (zh) 图像检测方法和装置
CN118132625A (zh) 应用于智慧电力系统的数据挖掘方法及系统
KR20220079426A (ko) 동적 fov를 이용한 객체 추적 방법 및 그 장치

Legal Events

Date Code Title Description
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant