KR101727434B1 - 랜덤 포레스트 모델을 이용한 냉동기의 성능 판단 방법 - Google Patents

랜덤 포레스트 모델을 이용한 냉동기의 성능 판단 방법 Download PDF

Info

Publication number
KR101727434B1
KR101727434B1 KR1020160098519A KR20160098519A KR101727434B1 KR 101727434 B1 KR101727434 B1 KR 101727434B1 KR 1020160098519 A KR1020160098519 A KR 1020160098519A KR 20160098519 A KR20160098519 A KR 20160098519A KR 101727434 B1 KR101727434 B1 KR 101727434B1
Authority
KR
South Korea
Prior art keywords
random forest
refrigerator
variable
forest model
performance
Prior art date
Application number
KR1020160098519A
Other languages
English (en)
Inventor
박철수
신한솔
서원준
추한경
Original Assignee
성균관대학교산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 성균관대학교산학협력단 filed Critical 성균관대학교산학협력단
Priority to KR1020160098519A priority Critical patent/KR101727434B1/ko
Application granted granted Critical
Publication of KR101727434B1 publication Critical patent/KR101727434B1/ko
Priority to PCT/KR2017/007133 priority patent/WO2018016776A1/ko

Links

Images

Classifications

    • FMECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
    • F24HEATING; RANGES; VENTILATING
    • F24FAIR-CONDITIONING; AIR-HUMIDIFICATION; VENTILATION; USE OF AIR CURRENTS FOR SCREENING
    • F24F11/00Control or safety arrangements
    • F24F11/30Control or safety arrangements for purposes related to the operation of the system, e.g. for safety or monitoring
    • F24F11/006
    • F24F11/0086
    • FMECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
    • F24HEATING; RANGES; VENTILATING
    • F24FAIR-CONDITIONING; AIR-HUMIDIFICATION; VENTILATION; USE OF AIR CURRENTS FOR SCREENING
    • F24F11/00Control or safety arrangements
    • F24F11/62Control or safety arrangements characterised by the type of control or by internal processing, e.g. using fuzzy logic, adaptive control or estimation of values
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B13/00Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
    • G05B13/02Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
    • G05B13/04Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators
    • FMECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
    • F24HEATING; RANGES; VENTILATING
    • F24FAIR-CONDITIONING; AIR-HUMIDIFICATION; VENTILATION; USE OF AIR CURRENTS FOR SCREENING
    • F24F2221/00Details or features not otherwise provided for
    • F24F2221/50HVAC for high buildings, e.g. thermal or pressure differences

Abstract

본 발명은 랜덤 포레스트 모델을 이용한 냉동기의 성능 판단 방법에 관한 것으로서, 본 발명에 따른 랜덤 포레스트 모델을 이용한 냉동기의 성능 판단 방법은 냉동기와 관련된 건물 에너지 관리 시스템(BEMS: building energy management system) 데이터를 수집하는 단계, BEMS 데이터를 입력 변수로 하고 냉동기의 성능을 나타내는 출력 변수를 설정하여 랜덤 포레스트(random forest) 모델을 구축하는 단계, 랜덤 포레스트 모델을 구축하는 과정에서 입력 변수의 중요도를 판단하는 단계, 입력 변수 중 중요도가 높은 순서로 있는 입력 변수의 일부를 입력 변수로 선택하는 단계 및 선택된 입력 변수로 랜덤 포레스트 모델을 다시 구축하는 단계를 포함하는 것을 특징으로 한다.

Description

랜덤 포레스트 모델을 이용한 냉동기의 성능 판단 방법{METHOD FOR ESTIMATING EFFICIENCY OF REFRIGERATOR USING RANDOM FOREST MODEL}
본 발명은 랜덤 포레스트(random forest) 모델을 이용한 냉동기의 성능 판단 방법에 관한 것으로서, 보다 상세하게는 건물 에너지 관리 시스템(BEMS: building energy management system)을 통해 냉동기의 성능 판단에 필요한 BEMS 데이터를 수집하여 이로부터 랜덤 포레스트 모델을 구축하여 냉동기의 성능을 판단할 수 있도록 하는 랜덤 포레스트 모델을 이용한 냉동기의 성능 판단 방법에 관한 것이다.
건물에서 소비되는 에너지는 국가 에너지의 40% 이상을 차지하는 것으로 알려져 있으며, 건물 내 에너지 사용량을 절감시키기 위한 방법으로 건물 에너지 관리 시스템(BEMS: building energy management system)이 주목 받고 있다.
BEMS는 각종 센서를 이용하여 건물 운영정보, 실내외 환경정보, 요소별 에너지 사용량 등을 실시간으로 계측하고, 이를 바탕으로 에너지 절감이 가능한 최적 운전 수행을 하도록 건물 내 장치들을 동작시키도록 한다. 하지만, BEMS 데이터를 활용하여 건물의 상태를 예측하고 이를 기반으로 건물을 제어하도록 하기보다는, 운영자의 경험, 지식과 같은 주관적인 판단으로 운영되고 있는 것이 실정이다. BEMS를 통해 건물을 제어하기 위해서는 건물 내 동적 시스템의 특성을 파악하는 것이 필요한데, 건물 내 동적 시스템의 특성을 모사하는 모델을 개발하는 것이 상당히 전문적인 지식을 필요로 하고 비용 및 시간이 소요되기 때문이다.
종래에 건물 내 냉동기의 성능을 예측하는 방법으로 물리적 법칙(예를 들어, 열역학 제 1 법칙 등)을 기반으로 냉동기의 상태를 파악할 수 있도록 하는 동적 시뮬레이션 툴(예를 들어, EnergyPlus)을 사용하는 방법이 알려져 있다. 하지만, 이러한 동적 시뮬레이션 툴을 이용하여 냉동기의 상태를 정확하게 예측하기 위해서는 실제 냉동기가 정확하게 모사되어야 하며, 이를 위해서는 냉동기를 모델링하기 위해 필요한 관련 입력 변수들을 모두 정확하게 입력하여야 한다. 따라서, 동적 시뮬레이션 툴 기반의 냉동기 모델을 구축하기 위해서는 많은 시간과 노력 및 전문적 지식이 요구되어 만족스러운 결과를 얻는 것이 힘들다. 더욱이, 사용에 따른 냉동기의 노후화가 진행되면 냉동기의 상태도 변화하므로, 변화하는 상태에 맞추어서 시뮬레이션 모델을 지속적으로 보정 및 갱신하여 모델링을 수행하여야 하는 문제점도 있다.
이에, BEMS 데이터를 이용하여 데이터 기반의 기계학습 모델을 이용하여 냉동기의 성능을 판단하는 것을 고려할 수 있으나, BEMS 데이터에는 이상치(outier), 결측치(missing value), 잡음(noise)이 포함되어 있어, 기계학습 모델의 성능이 저하될 수가 있다. 또한, 상관성이 없는 입력 변수는 기계학습 모델의 구축 및 연산에 있어서 많은 시간이 소요되도록 한다.
따라서, 본 발명의 목적은 이와 같은 종래의 문제점을 해결하기 위한 것으로서, BEMS 데이터를 입력 변수로 하고 랜덤 포레스트 알고리즘을 이용하여 냉동기의 성능을 판단하도록 하는 냉동기의 성능 판단을 위한 랜덤 포레스트 모델을 구축하되, 입력 변수의 전처리를 통해 랜덤 포레스트 모델의 성능을 향상시키도록 하는 랜덤 포레스트 모델을 이용한 냉동기의 성능 판단 방법을 제공함에 있다.
본 발명이 해결하고자 하는 과제들은 이상에서 언급한 과제들로 제한되지 않으며, 언급되지 않은 또 다른 과제들은 아래의 기재로부터 당업자에게 명확하게 이해될 수 있을 것이다.
상기 목적은, 본 발명에 따라, (a) 냉동기와 관련된 건물 에너지 관리 시스템(BEMS: building energy management system) 데이터를 수집하는 단계; (b) 상기 BEMS 데이터를 입력 변수로 하고 상기 냉동기의 성능을 나타내는 출력 변수를 설정하여 랜덤 포레스트(random forest) 모델을 구축하는 단계; (c) 상기 랜덤 포레스트 모델을 구축하는 과정에서 입력 변수의 중요도를 판단하는 단계; (d) 상기 입력 변수 중 상기 중요도가 높은 순서로 있는 입력 변수의 일부를 입력 변수로 선택하는 단계; 및 (e) 상기 선택된 입력 변수로 랜덤 포레스트 모델을 다시 구축하는 단계를 포함하는 랜덤 포레스트 모델을 이용한 냉동기의 성능 판단 방법에 의해 달성될 수가 있다.
여기서, 상기 출력 변수는 냉동기의 전력 사용량 또는 냉동기 효율(COP: coefficient of performance)일 수가 있다.
여기서, 상기 (a) 단계 이후에, 상기 BEMS 데이터로부터 입력 변수의 수를 늘리도록 변수 구축을 수행하든 단계를 더 포함하고, 상기 (b) 단계에서 변수 구축된 데이터를 입력 변수로 추가시킬 수가 있다.
여기서, 상기 출력 변수와 상관 관계가 있는 관계식을 기초로 변수 구축을 수행할 수가 있다.
여기서, 상기 (c) 단계에서, 상기 입력 변수 중 어느 하나의 입력 변수의 값을 바꾸었을 때 상기 출력 변수의 값에 미치는 영향을 고려하여 상기 중요도를 판단할 수가 있다.
여기서, 상기 (e) 단계에서 구축된 상기 랜덤 포레스트 모델을 이용하여 상기 냉동기의 성능을 판단할 수가 있다.
상기한 바와 같은 본 발명의 랜덤 포레스트 모델을 이용한 냉동기의 성능 판단 방법에 따르면 BEMS 데이터를 입력 변수로 하여 냉동기의 성능을 판단하기 위한 랜덤 포레스트 모델을 구축할 때 중요도가 높은 입력 변수를 선택하여 구축하도록 함으로써 랜덤 포레스트 모델을 구축하는데 소요되는 시간 및 냉동기의 성능 판단을 위한 연산 시간을 줄일 수 있다는 장점이 있다.
또한, BEMS 데이터로부터 새로운 입력 변수를 변수 구축하도록 하여 이를 입력 변수에 추가시켜 랜덤 포레스트 모델을 구축함으로써 정확하게 냉동기의 성능을 예측할 수 있다는 장점도 있다.
또한, 변수 구축을 수행할 때 출력 변수와 상관 관계가 있는 관계식을 기초로 변수 구축을 수행함으로써 예측된 결과의 정확성을 더욱 향상시킬 수 있다는 장점도 있다.
또한, 정확하고 빠르게 예측된 냉동기의 성능에 따라서 냉동기를 최적 제어하도록 하여 냉동기 운전을 위한 에너지를 절감시킬 수 있다는 장점도 있다.
도 1은 본 발명에 따라 성능 판단을 하려고 하는 냉동기를 포함하는 냉방 장치의 구조를 개략적으로 도시하는 도면이다.
도 2는 본 발명의 일 실시예에 따른 랜덤 포레스트 모델을 이용한 냉동기의 성능 판단 방법의 순서도이다.
도 3은 랜덤 포레스트 알고리즘에 따라 모델링하는 과정을 도시하는 도면이다.
도 4는 본 발명에 따른 입력 변수의 중요도를 판단하는 방법을 설명하기 위한 비교표이다.
도 5는 데이터 전처리 없이 BEMS 데이터로부터 랜덤 포레스트 모델을 구축하여 이로부터 예측된 냉동기의 전력 소비량과 실제 측정된 전력 소비량을 비교하여 도시하는 그래프이다.
도 6은 BEMS 데이터와 이로부터 임의 생성된 데이터인 입력 변수에 대해서 본 발명에 따라 판단된 중요도를 도시하는 그래프이다.
도 7은 도 6의 입력 변수에 대해서 중요도가 낮은 순서로 입력 변수를 제거하였을 때의 RMSE와 CVRMSE의 분포를 도시하는 그래프이다.
도 8은 BEMS 데이터와 이로부터 출력 변수와 상관 관계가 있는 관계식을 기초로 생성된 데이터인 입력 변수에 대해서 본 발명에 따라 판단된 중요도를 도시하는 그래프이다.
도 9는 도 8의 입력 변수에 대해서 중요도가 낮은 순서로 입력 변수를 제거하였을 때의 RMSE와 CVRMSE의 분포를 도시하는 그래프이다.
실시예들의 구체적인 사항들은 상세한 설명 및 도면들에 포함되어 있다.
본 발명의 이점 및 특징, 그리고 그것들을 달성하는 방법은 첨부되는 도면과 함께 상세하게 후술되어 있는 실시예들을 참조하면 명확해질 것이다. 그러나 본 발명은 이하에서 개시되는 실시예들에 한정되는 것이 아니라 서로 다른 다양한 형태로 구현될 수 있으며, 단지 본 실시예들은 본 발명의 개시가 완전하도록 하고, 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 발명의 범주를 완전하게 알려주기 위해 제공되는 것이며, 본 발명은 청구항의 범주에 의해 정의될 뿐이다. 명세서 전체에 걸쳐 동일 참조 부호는 동일 구성 요소를 지칭한다
이하, 본 발명의 실시예들에 의하여 랜덤 포레스트 모델을 이용한 냉동기의 성능 판단 방법을 설명하기 위한 도면들을 참고하여 본 발명에 대해 설명하도록 한다.
본 발명의 일 실시예에 따른 랜덤 포레스트 모델을 이용한 냉동기의 성능 판단 방법을 설명하기에 앞서, 본 발명에서의 다루는 냉동기를 포함하는 건물 내 냉방 장치에 대해서 설명하기로 한다.
도 1은 본 발명에 따라 성능 판단을 하려고 하는 냉동기를 포함하는 냉방 장치의 구조를 개략적으로 도시하는 도면이다.
건물 내 사용하는 냉방 장치는 건물의 규모나 송풍 방식에 따라서 중앙식과 개별식으로 구분될 수 있다. 그 중에서 대형 건물이나 지하철 역사와 같이 규모가 큰 공간에 냉각된 공기를 공급하기 위해서는 대형 냉동기(10)의 제어를 통해 건물의 각 실내로 냉기를 공급하도록 하는 중앙식 냉방 장치가 많이 사용되고 있다.
이러한 중앙식 냉방 장치에 있어서도 냉매를 팽참시킴으로써 냉각되는 공기를 송풍수단을 이용하여 직접 실내로 공급하는 직접 냉각방식과, 도 1에 도시되어 있는 것과 같이 냉각수단이 구비된 냉동기(10)와 급기팬 및 냉수코일이 구비된 송풍 케이스를 분리하여 별도의 공간에 각각 위치시키고, 냉각수의 순환에 의해 냉수를 간접 냉각시키도록 하고 냉각된 냉수가 냉각코일을 지나는 동안 실내로 공급되는 공기가 냉각되어 급기팬에 의해 실내로 공급되도록 하는 간접 냉각방식이 사용되고 있는데, 본 실시예에서는 도 1에 도시된 간접 냉각방식의 냉방 장치를 기초로 본 발명의 일 실시예에 따른 랜덤 포레스트 모델을 이용한 냉동기(10)의 성능 판단 방법을 설명하기로 한다.
도 2는 본 발명의 일 실시예에 따른 랜덤 포레스트 모델을 이용한 냉동기의 성능 판단 방법의 순서도이고, 도 3은 랜덤 포레스트 알고리즘에 따라 모델링하는 과정을 도시하는 도면이고, 도 4는 본 발명에 따른 입력 변수의 중요도를 판단하는 방법을 설명하기 위한 비교표이다.
본 발명의 일 실시예에 따른 랜덤 포레스트 모델을 이용한 냉동기(10)의 성능 판단 방법은 BEMS 데이터를 수집하는 단계(S110), BEMS 데이터로부터 입력 변수의 수를 늘리기 위해 변수 구축을 수행하는 단계(S120), 입력 변수를 기초로 냉동기(10)의 성능 판단을 위한 랜덤 포레스트 모델을 구축하는 단계(S130), 랜덤 포레스트 모델을 구축하는 과정에서 입력 변수의 중요도를 판단하는 단계(S140), 입력 변수의 중요도에 따라서 입력 변수를 중요도가 높을 입력 변수를 다시 선택하는 단계(S150), 선택된 입력 변수로 다시 냉동기(10)의 성능 판단을 위한 랜덤 포레스트 모델을 구축하는 단계(S160) 및 최종 구축된 랜덤 포레스트 모델을 이용하여 냉동기(10)의 성능을 판단하는 단계(S170)를 포함할 수가 있다.
먼저, 건물 에너지 관리 시스템 서버로부터 BEMS 데이터를 수집한다(S110). 건물 에너지 관리 시스템은 빌딩과 같은 건물 내 에너지 관리 설비의 다양한 정보를 실시간으로 수집 및 분석하여 에어지 사용 효율을 개선하도록 하는 목적의 건물 내 시스템이다. 특히, 본 발명은 도 1을 참조로 전술한 바와 같은 건물 내 냉동기(10)의 성능 판단을 위한 것으로 BEMS 데이터 중에서 냉동기(10)와 관련된 BEMS 데이터를 수집할 수가 있다. 여기서, 냉동기(10)와 관련된 BEMS 데이터의 일 예로 냉동기(10)의 냉수 입수 온도, 냉동기(10)의 냉수 출수 온도, 냉수의 유량, 냉각수의 입수 온도, 냉각수의 출수 온도, 냉각수의 유량, 냉동기(10)의 용량 및 냉동기(10)의 전력 사용량 등을 포함할 수가 있는데, 이에 한정되는 것은 아니다.
본 발명에서는 기계학습 모델의 일 예인 랜덤 포레스트(random forest)를 냉동기(10)에 적용한다. 기계학습 모델은 입력 변수와 출력 변수 사이의 관계를 학습하여 입력 변수에 따른 출력 변수를 예측하도록 하는 데이터 처리 알고리즘이다. 이 때, 학습을 위해 입력 변수가 필요하며 상기 BEMS 데이터가 입력 변수가 되고, 출력 변수는 냉동기(10)의 성능을 나타내는 것으로 냉동기(10)의 전력 사용량 또는 냉동기(10)의 효율(COP: coefficient of performance)일 수가 있다. 본 발명에서 적용되는 기계학습 알고리즘인 랜덤 포레스트에 관한 내용은 도 3을 참조로 후술하기로 한다.
이때, 수집된 BEMS 데이터 값은 불완전하고 잡음(noise)이 있을 수 있으며 수집된 BEMS 데이터 중 일부는 냉동기(10)의 성능 판단에 중요하지가 않아서 랜덤 포레스트 모델의 성능을 오히려 저하시킬 수도 있다. 여기서, 성능 저하라고 하면 랜덤 포레스트 모델을 구축하는데 소요되는 모델링 시간, 성능 판단을 위한 연산 시간, 또는 랜덤 포레스트 모델에 의해 판단된 출력 변수의 정확성일 수가 있다.
이에, 본 발명에서는 입력 변수인 BEMS 데이터에 대해 데이터 전처리를 수행하도록 하여 랜덤 포레스트 모델의 성능을 향상시키도록 할 수가 있다.
본 발명에서 데이터 전처리를 수행하는 방법으로 수집된 BEMS 데이터로부터 입력 변수의 수를 늘리도록 변수 구축을 수행할 수가 있다(S120). 변수 구축은 기존의 입력 변수로부터 모델의 성능을 발전시킬 수 있는 새로운 변수를 생성하는 것이다. 예측하고자 하는 출력 변수와 상관성이 있는 입력 변수를 추가하여 랜덤 포레스트 모델을 구축하는 경우 예측되는 결과의 정확성을 높일 수가 있다.
변수 구축을 수행할 때, 아래의 <표 1>에서와 같이 임의로 변수를 선택하여 임의의 사칙연산을 수행하도록 하는 방법이 있다.
변수 임의 관계식 변수 임의 관계식
x13 x5 × x6 ― x4 x22 x8 × x9 ― x11
x14 x6 ÷ x3 ― x3 x23 x3 × x3 × x8
x15 x4 ― x2 + x6 x24 x2 ― x4 ÷ x3
x16 x8 ― x1 × x2 x25 x10 ― x1 × x3
x17 x6 × x13 ― x5 x26 x10 + x4 × x3
x18 x11 + x9 ÷ x6 x27 x8 + x11 ÷ x1
x19 x12 × x8 + x8 x28 x6 ― x12 ― x2
x20 x8 ÷ x7 × x11 x29 x12 + x5 ÷ x2
x21 x11 + x8 × x10 x30 x7 × x10 + x5
여기서, x1 내지 x12는 수집된 BEMS 데이터이고, x13 내지 x30은 각각 BEMS 데이터로부터 임의 관계식으로 변수 구축되어 새롭게 생성되는 입력 변수이다.
상기와 같은 방법으로 변수 구축을 수행할 수도 있으나, 출력 변수와 상관 관계가 있는 관계식을 기초로 변수 구축을 수행하는 것이 바람직하다. 예를 들어, 열역학 제 1 법칙에 따르면 냉동기(10)의 전력 사용량은 냉동기(10)에서 제거된 열량(Q)과 강한 상관 관계를 갖는다. 따라서,
Figure 112016075213593-pat00001
의 식(여기서, Q는 열량, C는 냉수의 비열,
Figure 112016075213593-pat00002
은 냉수의 유량,
Figure 112016075213593-pat00003
는 냉수의 입출수 온도차이다.)에서 BEMS 데이터인 냉수의 입수 온도와 냉수의 출수 온도로부터
Figure 112016075213593-pat00004
값을 새로운 입력 변수로 구축할 수가 있고,
Figure 112016075213593-pat00005
값을 새로운 입력 변수로 구축할 수도 있다. 상기와 같이 출력 변수와 상관 관계가 있는 관계식을 기초로 변수 구축을 수행한 경우 랜덤 포레스트 모델의 성능을 더욱 향상시킬 수가 있다. 이에 대한 비교 결과는 후술하기로 한다.
다음, 수집된 BEMS 데이터 및 이로부터 변수 구축되어 새롭게 생성된 데이터를 입력 변수로 하여 랜덤 포레스트 모델을 구축한다(S130).
이하, 랜덤 포레스트 알고리즘에 대해서 설명하기로 한다.
Breiman은 Amit et al에 의해 처음 제안된 무작위 입력변수 선택(Random Input Selection)을 배깅(Bagging: Bootstrap Aggregating)과 결합한 랜덤 포레스트 알고리즘을 제안했다. 여러 의사결정나무들을 조합하여 시스템의 상(state)을 예측하는 기계학습 방법인 앙상블 방법(Ensemble Method)은 각 의사결정나무의 예측결과를 회귀의 경우에는 평균으로, 분류의 경우에는 투표로 최종 결과를 산출한다. 그렇기 때문에 단일의 의사결정나무에 비해 일반화 성능이 뛰어난 것으로 알려져 있다. 랜덤 포레스트의 특징으로는 배깅, 무작위 입력변수 선택, Out-of-bags 오차율 등이 있다.
- 배깅: Breiman에 의해 제안된 배깅 방법은 앙상블 방법의 하나로써, 무작위 복원추출 방법인 부트스트랩(Bootstrap)을 이용하여 의사결정나무의 불안전성을 보완한다. 배깅의 학습에 사용되는 전체 훈련데이터는 부트스트랩 방법으로 추출되어 n개의 부트스트랩 샘플로 나뉘며, 조금씩 다른 훈련데이터에 대해 훈련된 n개의 모델을 결합(aggregating)한다. 일반적인 의사결정나무는 작은 편차와 큰 분산을 갖기 때문에, 매우 깊이 성장한 의사결정나무는 훈련 데이터에 대해 과적합된다. 부트스트랩은 각 나무들의 편차는 유지하면서, 분산을 감소시키기 때문에 전체 모델의 성능을 향상시킨다. 즉, 하나의 의사결정나무는 훈련 데이터의 잡음에 대해 매우 민감하게 반응하나, 나무 간의 상관성이 적을 경우, 여러 나무들의 평균은 잡음에 대해 강해진다. 따라서 배깅은 각 의사결정나무를 서로 다른 데이터 집합으로 훈련시킴으로서 각 나무들을 비상관화시키는 방법이다.
- 무작위 입력변수 선택: 의사결정나무의 노드 분할시, 전체 입력 변수 중에서 무작위로 m개의 입력 변수를 선택하고 선택된 입력 변수 중에서 최적의 노드 분할 기준을 찾는 방법이다. 결과적으로 각기 다른 구조를 가지지만 성능이 뛰어난 의사결정나무의 집합이 구축된다. 이 기법은 무작위로 선택하는 변수의 수(m)를 정하는 것이 중요하다. m이 1에 가까울수록, 각 의사결정나무의 편차와 분산이 커지므로 앙상블 방법의 특징인 평균 혹은 투표 방법에 효과적으로 된다. m이 전체 입력 변수 수(M)에 가까울수록, 각 나무의 편차와 분산이 작아지며, 앙상블 방법의 효과가 적어지게 된다.
- OOB 오차율: 전체 데이터 중 약 37%가 부트스트랩 샘플에 포함되지 않는다. 부트스트랩 샘플에 포함되지 않은 관측값은 모델의 일반화 성능을 평가하는 Out-of-bags(OOB) 데이터로써 사용되며, OOB 오차율은 랜덤 포레스트 모델의 성능을 검증하는 기본적인 지표로서 활용된다. 또한, 랜덤 포레스트는 출력변수의 예측에 대한 입력변수의 영향력을 변수중요도로 평가 가능하며 이는 모델 해석능력 향상에 도움이 된다.
도 3을 참조로 더욱 자세히 설명을 하면 다음과 같다.
(1) 부트스트랩(bootstrap): BEMS 데이터 및 이로부터 새롭게 변수 구축된 데이터 중에서 n개의 부트스트랩 샘플을 무작위 복원추출한다. 각 샘플은 의사 결정 나무의 훈련 데이터로 이용된다. 또한, 훈련 데이터에 포함되지 않는 37%의 데이터는 OOB 샘플로 추출된다
(2) 의사결정나무 성장: 무작위로 선택한 m개의 입력 변수 중에서 최적의 분할기준을 찾아 하위노드로 나눈다. 나무는 최대로 자랄 때까지 성장하며, 각 노드에 대한 가지치기는 수행되지 않는다.
(3) 앙상블: n개의 의사결정나무를 모아서 하나의 랜덤 포레스트 모델로 구축한다. 새로운 데이터가 모델에 입력되면 각 의사결정나무에서 예측값을 산출하여 모든 예측값의 평균으로 최종 예측값을 출력한다.
(4) OOB 샘플: 랜덤 포레스트 모델의 일반화 성능지표인 OOB 오차율을 계산한다. 사용자는 오차율을 기반으로 적절한 수(n)의 의사결정나무가 생성되었는지 검증도 가능하다. 또한, OOB 샘플을 이용하여 후술할 변수 중요도를 계산할 수도 있다.
상기와 같은 방법으로 변수 구축에 의해 입력 변수의 수를 늘리면 모델의 정확성은 향상시킬 수 있지만 랜덤 포레스트 모델의 구축과 성능 판단을 위한 연산에 걸리는 시간이 증가할 수가 있다. 이에, 본 발명에서는 BEMS 데이터 및/또는 BEMS 데이터로부터 변수 구축에 의해 새롭게 생성된 데이터를 입력 변수로 하여 랜덤 포레스트 모델을 구축할 때, 입력 변수의 중요도를 판단하도록 하여 랜덤 포레스트 모델의 성능을 더욱 향상시키도록 한다(S140).
이때, 중요도는 입력 변수 중 어느 하나의 입력 변수 값을 바꾸었을 때 출력 변수 값에 미치는 영향을 고려하여 중요도를 판단한다. 즉, 어느 하나의 입력 변수 값을 바꾸었을 때 출력 변수 값의 변화가 크면 상기 입력 변수는 중요도가 높다고 판단할 수 있고, 반대로 어느 하나의 입력 변수 값을 바꾸었을 때 출력 변수 값의 변화가 작으면 상기 입력 변수의 중요도가 낮다고 판단할 수가 있다.
도 4를 참조로 예를 들어 설명하면, 입력 변수인 X1, X2를 이용하여 구축된 랜덤 포레스트 모델을 이용하여 출력 변수인 Y를 예측할 때, 모델에 사용되지 않은 3 가지의 OOB 샘플을 순환시켜 입력 변수의 중요도를 판단할 수가 있다. 도 4의 (b)는 기준 데이터인 도 4의 (a)와 비교하여 X1값이 순환되었고, 이 데이터로 예측한 모델의 오차율은 1/3이다. 또한, 도 4의 (c)는 도 4의 (a)와 비교하여 X2 값이 순환되었고, 이 데이터로 예측한 모델의 오차율은 2/3이다. 따라서, X1은 X2와 비교하여 출력변수의 예측에 큰 영향을 미치지 않는 입력 변수로, X2는 X1과 비교하여 출력 변수의 예측에 큰 영향을 미치는 입력 변수로 판단할 수가 있다.
다음, 상기와 같이 입력 변수의 중요도를 판단한 후 중요도가 높은 순서로 있는 입력 변수의 일부를 새로운 입력 변수로 선택할 수가 있다(S150). 예를 들어, 입력 변수가 30개 있다고 하였을 때, 이를 상기와 같은 방법으로 중요도 판단을 하여 중요도 순으로 일렬로 배열하였을 때, 중요도가 높은 순으로 상위 5개를 입력 변수로 변수 선택을 할 수가 있다. 이때, 선택하는 입력 변수의 개수를 결정하는 방법은 후술하기로 한다.
다음, 중요도가 높은 순으로 소정의 개수로 선택된 입력 변수를 이용하여 다시 랜덤 포레스트 모델을 구축한다(S160). 따라서, 랜덤 포레스트 모델을 구축하는데 필요한 입력 변수의 개수가 줄어들었기 때문에 랜덤 포레스트 모델을 구축하는데 소요되는 시간을 줄일 수가 있다. 또한, 중요도가 높은 입력 변수들이 고려되었기 때문에 예측 정확성을 높일 수가 있다.
상기와 같은 과정으로 랜덤 포레스트 모델을 최종적으로 구축한 이후에, 상기 랜덤 포레스트 모델을 구축하는데 사용한 입력 변수 데이터를 다시 수집하여 냉동기(10)의 성능을 판단할 수가 있다(S170). 판단된 냉동기(10)의 성능에 따라서 냉동기(10)의 운전을 제어하도록 하여 냉동기(10)를 최적 효율로 운전시킬 수가 있다.
이하, 도 5 내지 도 9를 참조로 본 발명에 따른 랜덤 포레스트를 이용한 냉동기(10)의 성능 판단의 결과를 설명하기로 한다.
도 5는 데이터 전처리 없이 BEMS 데이터로부터 랜덤 포레스트 모델을 구축하여 이로부터 예측된 냉동기(10)의 전력 소비량과 실제 측정된 전력 소비량을 비교하여 도시하는 그래프이고, 도 6은 BEMS 데이터와 이로부터 임의 생성된 데이터인 입력 변수에 대해서 본 발명에 따라 판단된 중요도를 도시하는 그래프이고, 도 7은 도 6의 입력 변수에 대해서 중요도가 낮은 순서로 입력 변수를 제거하였을 때의 RMSE와 CVRMSE의 분포를 도시하는 그래프이고, 도 8은 BEMS 데이터와 이로부터 출력 변수와 상관 관계가 있는 관계식을 기초로 생성된 데이터인 입력 변수에 대해서 본 발명에 따라 판단된 중요도를 도시하는 그래프이고, 도 9는 도 8의 입력 변수에 대해서 중요도가 낮은 순서로 입력 변수를 제거하였을 때의 RMSE와 CVRMSE의 분포를 도시하는 그래프이다.
도 5는 전술한 데이터의 전처리 없이 BEMS 데이터로부터 랜덤 포레스트 모델을 구축하여 이로부터 예측된 냉동기(10)의 전력 소비량과 실제 측정된 전력 소비량을 도시한다. 이때, RMSE(Root Mean Square Error)와 CVRMSE(Cumulative Variation of Root Mean Square Error)는 각각 6.21kW, 8.56%로 조사되어 랜덤 포레스트로 구축한 모델의 정확성이 상당히 뛰어남을 알 수가 있다.
도시되어 있지 않지만, 표 1과 같이 X1 내지 X12의 BEMS 데이터와 BEMS 데이터로부터 임의로 생성한 X13 내지 X30의 총 30개의 입력 변수로 랜덤 포레스트 모델을 구축하였을 때에 RMSE와 CVRMSE는 각가 3.74kW, 5.16%로 조사되어 BEMS 데이터로만 랜덤 포레스트 모델을 구축한 경우와 비교하여 정확도가 향상되었음을 알 수가 있다.
도 6은 표 1과 같이 총 30개의 입력 변수에 대해서 본 발명에 따라 입력 변수의 중요도를 판단하여 나타낸 그래프이다. 이에, 입력 변수의 중요도를 고려하여 입력 변수 중 중요도가 높은 변수를 새로운 입력 변수로 선택한다. 이때, 중요도가 가장 낮은 입력 변수를 하나씩 제거해가면서 모델을 구축했고, 그 결과가 도 7에 도시되어 있다. 모델의 CVRMSE와 RMSE 값은 25개의 입력 변수가 제거된 순간(즉, 중요도가 높은 5개의 입력 변수를 사용하는 순간) 급격하게 변하여 커지기 시작한다. 즉, 변수 중요도가 높은 X10, X11, X14, X27, X28, X30으로도 정확한 모델의 구축이 가능하며, 이때 RMSE와 CVRMSE는 각각 3.95kW, 5.44%로 정확도가 높음을 알 수가 있다.
또한, 전술한 바와 같이 X1 내지 X12의 BEMS 데이터와 이로부터 출력 변수와 상관 관계가 있는 관계식(예를 들어,
Figure 112016075213593-pat00006
)을 기초로 새롭게 X31 내지 X36의 6개의 입력 변수를 구축하여 총 18개의 입력 변수로 랜덤 포레스트 모델을 구축하였을 때에 RMSE와 CVRMSE는 각각 2.45kW, 3.37%로 조사되어 임의로 변수 구축을 수행하였을 경우와 비교하여 정확도가 더욱 향상되었음을 알 수가 있다.
도 8은 상기와 같이 BEMS 데이터와 이로부터 출력 변수와 상관 관계가 있는 관계식을 기초로 새롭게 구축한 데이터인 총 18개의 입력 변수에 대해서 본 발명에 따라 입력 변수의 중요도를 판단하여 나타낸 그래프이다. 이에, 전술한 바와 같이 입력 변수의 중요도를 고려하여 입력 변수 중 중요도가 높은 변수를 새로운 입력 변수로 선택한다. 이때, 중요도가 가장 낮은 입력 변수를 하나씩 제거해가면서 모델을 구축했고, 그 결과가 도 9에 도시되어 있다. 이때, 변수 중요도가 높은 X3, X4, X6, X9, X31, X36만으로 랜덤 포레스트 모델을 구축하였을 때에 RMSE와 CVRMSE는 각각 3.11kW, 4.28%로 정확도가 높음을 알 수가 있다.
본 발명의 권리범위는 상술한 실시예에 한정되는 것이 아니라 첨부된 특허청구범위 내에서 다양한 형태의 실시예로 구현될 수 있다. 특허청구범위에서 청구하는 본 발명의 요지를 벗어남이 없이 당해 발명이 속하는 기술 분야에서 통상의 지식을 가진 자라면 누구든지 변형 가능한 다양한 범위까지 본 발명의 청구범위 기재의 범위 내에 있는 것으로 본다.
10: 냉동기

Claims (6)

  1. (a) 냉동기와 관련된 건물 에너지 관리 시스템(BEMS: building energy management system) 데이터를 수집하는 단계;
    (b) 상기 BEMS 데이터를 입력 변수로 하고 상기 냉동기의 성능을 나타내는 출력 변수를 설정하여 랜덤 포레스트(random forest) 모델을 구축하는 단계;
    (c) 상기 랜덤 포레스트 모델을 구축하는 과정에서 입력 변수의 중요도를 판단하는 단계;
    (d) 상기 입력 변수 중 상기 중요도가 높은 순서로 있는 입력 변수의 일부를 입력 변수로 선택하는 단계; 및
    (e) 상기 선택된 입력 변수로 랜덤 포레스트 모델을 다시 구축하는 단계를 포함하는 랜덤 포레스트 모델을 이용한 냉동기의 성능 판단 방법.
  2. 제 1 항에 있어서,
    상기 출력 변수는 냉동기의 전력 사용량 또는 냉동기 효율(COP: coefficient of performance)인 랜덤 포레스트 모델을 이용한 냉동기의 성능 판단 방법.
  3. 제 1 항에 있어서,
    상기 (a) 단계 이후에,
    상기 BEMS 데이터로부터 입력 변수의 수를 늘리도록 변수 구축을 수행하는 단계를 더 포함하고,
    상기 (b) 단계에서 변수 구축된 데이터를 입력 변수로 추가시키는 랜덤 포레스트 모델을 이용한 냉동기의 성능 판단 방법.
  4. 제 3 항에 있어서,
    상기 출력 변수와 상관 관계가 있는 관계식을 기초로 변수 구축을 수행하는 랜덤 포레스트 모델을 이용한 냉동기의 성능 판단 방법.
  5. 제 1 항에 있어서,
    상기 (c) 단계에서,
    상기 입력 변수 중 어느 하나의 입력 변수의 값을 바꾸었을 때 상기 출력 변수의 값에 미치는 영향을 고려하여 상기 중요도를 판단하는 랜덤 포레스트 모델을 이용한 냉동기의 성능 판단 방법.
  6. 제 1 항에 있어서,
    상기 (e) 단계에서 구축된 상기 랜덤 포레스트 모델을 이용하여 상기 냉동기의 성능을 판단하는 랜덤 포레스트 모델을 이용한 냉동기의 성능 판단 방법.
KR1020160098519A 2016-07-21 2016-08-02 랜덤 포레스트 모델을 이용한 냉동기의 성능 판단 방법 KR101727434B1 (ko)

Priority Applications (2)

Application Number Priority Date Filing Date Title
KR1020160098519A KR101727434B1 (ko) 2016-08-02 2016-08-02 랜덤 포레스트 모델을 이용한 냉동기의 성능 판단 방법
PCT/KR2017/007133 WO2018016776A1 (ko) 2016-07-21 2017-07-05 건물 에너지 관리 시스템을 통한 냉동기의 최적 제어 방법 및 장치

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020160098519A KR101727434B1 (ko) 2016-08-02 2016-08-02 랜덤 포레스트 모델을 이용한 냉동기의 성능 판단 방법

Publications (1)

Publication Number Publication Date
KR101727434B1 true KR101727434B1 (ko) 2017-04-26

Family

ID=58705169

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020160098519A KR101727434B1 (ko) 2016-07-21 2016-08-02 랜덤 포레스트 모델을 이용한 냉동기의 성능 판단 방법

Country Status (1)

Country Link
KR (1) KR101727434B1 (ko)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102004948B1 (ko) * 2018-12-18 2019-07-29 이지지아이에스 주식회사 빅데이터 기계 학습을 활용한 위치기반 입지 예측 분석 장치 및 그 방법
CN110503566A (zh) * 2019-07-08 2019-11-26 中国平安人寿保险股份有限公司 风控模型建立方法、装置、计算机设备及存储介质
KR20200039964A (ko) * 2018-10-08 2020-04-17 에스케이텔레콤 주식회사 기계학습모델 기반 설비 기기의 최적 운전 방법 및 장치
CN111325286A (zh) * 2020-03-13 2020-06-23 河海大学 一种基于随机森林的防洪系统显效工程智能辨识方法
KR20210097492A (ko) * 2020-01-30 2021-08-09 엘지전자 주식회사 실시간 성능 추정 장치

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20200039964A (ko) * 2018-10-08 2020-04-17 에스케이텔레콤 주식회사 기계학습모델 기반 설비 기기의 최적 운전 방법 및 장치
KR102103006B1 (ko) * 2018-10-08 2020-05-29 에스케이 텔레콤주식회사 기계학습모델 기반 설비 기기의 최적 운전 방법 및 장치
KR102004948B1 (ko) * 2018-12-18 2019-07-29 이지지아이에스 주식회사 빅데이터 기계 학습을 활용한 위치기반 입지 예측 분석 장치 및 그 방법
CN110503566A (zh) * 2019-07-08 2019-11-26 中国平安人寿保险股份有限公司 风控模型建立方法、装置、计算机设备及存储介质
CN110503566B (zh) * 2019-07-08 2024-02-09 中国平安人寿保险股份有限公司 风控模型建立方法、装置、计算机设备及存储介质
KR20210097492A (ko) * 2020-01-30 2021-08-09 엘지전자 주식회사 실시간 성능 추정 장치
KR102431508B1 (ko) 2020-01-30 2022-08-11 엘지전자 주식회사 실시간 성능 추정 장치
CN111325286A (zh) * 2020-03-13 2020-06-23 河海大学 一种基于随机森林的防洪系统显效工程智能辨识方法
CN111325286B (zh) * 2020-03-13 2022-07-29 河海大学 一种基于随机森林的防洪系统显效工程智能辨识方法

Similar Documents

Publication Publication Date Title
KR101727434B1 (ko) 랜덤 포레스트 모델을 이용한 냉동기의 성능 판단 방법
CN112577161B (zh) 空调能耗模型训练方法与空调系统控制方法
US11385607B2 (en) Variable air volume modeling for an hvac system
JP7016407B2 (ja) スマートな供給空気温度設定点制御を介する冷却ユニットのエネルギー最適化
CN109800066B (zh) 一种数据中心节能调度方法及系统
KR101754536B1 (ko) 건물 에너지 관리 시스템을 통한 냉동기의 최적 제어 방법 및 장치
Huang et al. HVAC system design under peak load prediction uncertainty using multiple-criterion decision making technique
US20140229146A1 (en) In-situ optimization of chilled water plants
US20130190930A1 (en) Energy Saving Control for Data Center
Raustad A variable refrigerant flow heat pump computer model in EnergyPlus
Wang et al. Evaluation of operation performance of a multi-chiller system using a data-based chiller model
CN104423531A (zh) 数据中心能耗调度处理方法及装置
JP5799224B2 (ja) 消費エネルギー算出装置、消費エネルギー算出方法およびプログラム
US20150269293A1 (en) Diagnostic model generating apparatus and method, and abnormality diagnostic apparatus
CN113685962A (zh) 一种基于相关性分析的机房温度高效控制方法及其系统
Wang et al. Online chiller loading strategy based on the near-optimal performance map for energy conservation
KR20120080406A (ko) 빌딩 운영 방안 도출 장치 및 방법
CN114970358A (zh) 一种基于强化学习的数据中心能效优化方法和系统
CN114838470A (zh) 一种暖通空调的控制方法和系统
WO2019227273A1 (en) Hierarchical concept based neural network model for data center power usage effectiveness prediction
CN113268913A (zh) 一种基于pso-elm算法的智能建筑空调冷机系统运行优化方法
CN112543852B (zh) 用于使用基于聚类的规则挖掘方法来优化结构的能量使用的系统和方法
CN116954329A (zh) 制冷系统的状态调节方法、装置、设备、介质及程序产品
Xue et al. A novel method of minimizing power consumption for existing chiller plant
JP5997671B2 (ja) 空調制御方法および空調制御システム

Legal Events

Date Code Title Description
GRNT Written decision to grant