KR20200065386A - 통계적 학습을 통한 가스 배관망 운영정보 제공방법 - Google Patents

통계적 학습을 통한 가스 배관망 운영정보 제공방법 Download PDF

Info

Publication number
KR20200065386A
KR20200065386A KR1020180151785A KR20180151785A KR20200065386A KR 20200065386 A KR20200065386 A KR 20200065386A KR 1020180151785 A KR1020180151785 A KR 1020180151785A KR 20180151785 A KR20180151785 A KR 20180151785A KR 20200065386 A KR20200065386 A KR 20200065386A
Authority
KR
South Korea
Prior art keywords
gas
regression model
regression
model
information
Prior art date
Application number
KR1020180151785A
Other languages
English (en)
Other versions
KR102139706B1 (ko
Inventor
심규하
김순재
이혁
김상수
김무현
Original Assignee
한국가스공사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국가스공사 filed Critical 한국가스공사
Priority to KR1020180151785A priority Critical patent/KR102139706B1/ko
Publication of KR20200065386A publication Critical patent/KR20200065386A/ko
Application granted granted Critical
Publication of KR102139706B1 publication Critical patent/KR102139706B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/06Electricity, gas or water supply
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"

Abstract

본 발명의 일실시예는, 가스 배관망의 복수의 지점에서 측정된 상태정보를 수집하여 데이터베이스화하는 상태정보 수집단계, 상기 상태정보에 기초하여, 입력변수를 선택하고 회귀계수를 추정하여 회귀모형을 수립하는 모형수립단계, 및 상기 회귀모형을 이용하여 상기 가스 배관망의 운영에 필요한 운영정보를 제공하는 정보제공단계를 포함하는, 가스 배관망 운영정보 제공방법을 제공하여, 가스 배관망 운영의 안전성, 안정성 및 경제성을 향상시킬 수 있다.

Description

통계적 학습을 통한 가스 배관망 운영정보 제공방법{Method for providing gas pipeline control information through statistical learning}
본 발명은 통계적 학습을 통한 가스 배관망 운영정보 제공방법에 관한 것이다.
천연가스는 LNG선 등을 통하여 수입되고, 배관망을 통하여 각지의 수요처로 공급된다. 천연가스를 공급하는 배관망을 효율적이고 안전하게 운영하기 위해서는 가스수요를 예측하여 주배관의 압력을 적절히 유지하여야 한다. 만약 수요대비 압력이 높거나 낮으면 배관망 운영의 안전성, 안정성 및 경제성이 저하되는 문제가 발생할 수 있다.
주배관 압력의 적정 수준을 판단하고 조정하는 배관망 운영은 다양한 변수에 의해 영향을 받는다. 특히 연중 대부분의 기간에 발생하는 각종 배관망 변경 작업으로 주배관 압력분포가 수시로 변하기 때문에, 주배관 압력이 지나치게 높아지거나 낮아지는 문제가 발생한다. 주배관 압력의 급격한 변동은 배관망 운영의 안전성 또는 안정성을 저하시키며, 압력변화에 대응하기 위해 가스 송출량을 급감, 급증시키는 과정에서 가동단가가 높은 기기들을 추가 가동하게 되어 경제성까지 저하되는 문제가 발생한다.
한편, 가스 직도입 사업자들이 배관망을 함께 이용하는 과정에서, 배관망에 가스를 인입하려면 관련 시설이 필요한데, 가스 인입 시설 중 보령기지가 연결된 배관망의 지역 압력이 과도하게 상승하는 문제가 발생한다. 이는 가스 직도입 사업자들의 가스 인출 지점은 전국에 분산되어 있으나, 인입 지점은 보령기지에 집중되어 있어 배관망의 수용력 대비 과도한 가스의 인입으로 병목현상이 발생하기 때문이다.
가스 직도입이 증가하면 인입 시설이 연결된 배관망 지역의 병목현상 및 압력상승은 더욱 심해질 것이다. 가스 인입에 의해 주배관의 압력이 한계에 도달하면 가스 직도입 사업자들의 가스인입을 제한하고, 제한된 가스는 병목현상이 심하지 않을 때, 추가인입을 통해 반환해야하는 과정이 수시로 발생할 것으로 예상된다. 따라서 가스 인입 시설의 이용을 위한 계약은 인입제한과 반환이 연중 원활히 시행 될 수 있는 범위에서 체결되어야 하나 이러한 범위에 대한 추정값이 없어 유관기관에서 계약 관련 의사결정을 하기 어려운 문제가 있다.
JP 2000-265184 A
본 발명의 일실시예에 따른 목적은, 주배관의 평균압력을 예측하고 주배관의 평균압력을 조정하기 위하여 주배관에 공급해야 하는 가스 인입량을 예측할 수 있는 회귀모형을 수립하고 이용하여, 가스 배관망의 운영에 필요한 정보를 제공하는 방법 및 장치를 제공하기 위한 것이다.
또한, 본 발명의 일실시예에 따른 목적은, 가스 배관망에 연결된 가스 공급 지점의 수용능력, 가스 배관망의 연간 수요, 및 가스 직도입 사업자의 연간 시설이용률을 예측할 수 있는 회귀모형을 수립하고 이용하여, 가스 직도입 사업에 관련한 의사결정 및 가스 배관망의 운영에 필요한 정보를 제공하는 방법 및 장치를 제공하기 위한 것이다.
본 발명의 일실시예에 따른 가스 배관망 운영정보 제공방법은, 가스 배관망의 복수의 지점에서 측정된 상태정보를 수집하여 데이터베이스화하는 상태정보 수집단계, 상기 상태정보에 기초하여, 입력변수를 선택하고 회귀계수를 추정하여 회귀모형을 수립하는 모형수립단계, 및 상기 회귀모형을 이용하여 상기 가스 배관망의 운영에 필요한 운영정보를 제공하는 정보제공단계를 포함할 수 있다.
또한, 상기 상태정보는 상기 가스 배관망의 복수의 지점에서 시간대별 압력, 수요, 최대수요, 최소수요, 가스 인입량, 상기 복수의 지점에서의 평균압력, 기온 중에서 적어도 하나 이상의 항목을 포함할 수 있다.
또한, 상기 모형수립단계는 특정 시점에서 상기 복수의 지점들의 평균압력을 예측하는 제1 회귀모형을 수립하기 위하여, 상기 상태정보에 포함된 개별 항목 또는 서로 선형관계가 있는 항목들의 조합을 예비입력변수로 하고 모든 가능한 회귀(All Possible Regression) 방법을 이용하여 상기 예비입력변수 중에서 입력변수를 선정하고 최소제곱법을 이용하여 회귀계수를 추정하여 상기 제1 회귀모형을 수립하는 제1 회귀모형 수립단계, 및 상기 제1 회귀모형에 의해 예측되는 상기 특정 시점의 평균압력을 달성하기 위하여 상기 가스 배관망에 공급해야 하는 가스 인입량을 예측하는 제2 회귀모형을 수립하기 위하여, 상기 상태정보에 포함된 시간대별 평균압력 변화를 입력변수로 하고 가스 충진량 변화를 종속변수로 하는 회귀모형을 수립하는 제2 회귀모형 수립단계를 포함할 수 있다.
또한, 상기 정보제공단계는 상기 제1 회귀모형에서 상기 입력변수가 종속변수에 미치는 영향의 정도가 비교되도록, 상기 입력변수로 선택된 항목들을 표준화하여 제공하는 변환정보 제공단계, 및 상기 특정 시점에서 상기 제1 회귀모형에 의해 예측된 평균압력을 달성하기 위하여, 상기 제2 회귀모형을 이용하여 상기 가스 충진량 변화를 예측하여 제공하는 공급정보 제공단계를 포함할 수 있다.
또한, 상기 제1 회귀모형 수립단계는 관리자의 근무교대시와 하루 중 평균압력 최고시를 기준시점으로 하루를 적어도 두개 이상의 구간으로 구분하고, 상기 구간마다 상기 제1 회귀모형을 수립하여 상기 구간을 구분하는 기준시점에서 상기 평균압력을 예측할 수 있다.
또한, 상기 모형수립단계는 상기 가스 배관망의 연간 수요를 예측하는 제3 회귀모형을 수립하기 위하여, 기온을 입력변수로 하고 베이즈 정리를 이용하여 회귀계수를 추정하여 상기 제3 회귀모형을 수립하는 제3 회귀모형 수립단계, 상기 가스 배관망의 가스 공급 지점의 수용능력을 예측하는 제4 회귀모형을 수립하기 위하여, 가스 수요를 입력변수로 하고 베이즈 정리를 이용하여 회귀계수를 추정하여 상기 제4 회귀모형을 수립하는 제4 회귀모형 수립단계, 및 가스 직도입 사업자의 연간 시설이용률을 예측하는 제5 회귀모형을 수립하기 위하여, 가스 수요를 입력변수로 하고 베이즈 정리를 이용하여 회귀계수를 추정하여 상기 제5 회귀모형을 수립하는 제5 회귀모형 수립단계를 포함할 수 있다.
또한, 상기 정보제공단계는 상기 제4 회귀모형을 이용하여 예측된 상기 가스 배관망의 가스 공급 지점의 수용능력과, 상기 가스 직도입 사업자의 계약용량에 상기 제5 회귀모형을 이용하여 예측된 상기 시설이용률을 곱하여 산출되는 인입예상량을 비교하여, 가스 인입 제한일 및 가스 추가인입 가능일을 산출하여 장기정보를 제공하는 것일 수 있다.
또한, 상기 제3 회귀모형 수립단계 및 제5 회귀모형 수립단계는 평일, 토요일, 일요일(공휴일 포함)로 구간을 구분하고, 구간마다 회귀모형을 각각 수립하며, 상기 제4 회귀모형 수립단계는 하절기와 동절기로 구간을 구분하고, 구간마다 회귀모형을 각각 수립할 수 있다.
본 발명의 특징 및 이점들은 첨부도면에 의거한 다음의 상세한 설명으로 더욱 명백해질 것이다.
이에 앞서 본 명세서 및 청구범위에 사용된 용어나 단어는 통상적이고 사전적인 의미로 해석되어서는 아니 되며, 발명자가 그 자신의 발명을 가장 최선의 방법으로 설명하기 위해 용어의 개념을 적절하게 정의할 수 있다는 원칙에 입각하여 본 발명의 기술적 사상에 부합되는 의미와 개념으로 해석되어야만 한다.
본 발명의 일실시예에 따르면, 가스 배관망의 계통변경 작업과 무관하게 주배관의 평균압력을 예측하고 주배관의 평균압력을 조정하기 위하여 주배관에 공급해야 하는 가스 인입량을 예측하여 가스 배관망의 운영정보를 제공하므로, 가스 배관망의 안전성, 안정성 및 경제성이 향상될 수 있다.
또한, 본 발명의 일실시예에 따르면, 가스 직도입 사업자가 가스 배관망 시설을 이용할 때, 가스를 인출한 양보다 적은 양의 가스를 인입하고 나머지를 인입하는 것이 제한되는 가스 인입 제한일과 인입할 수 없었던 나머지 가스를 추가로 인입할 수 있는 가스 추가인입 가능일과 같은 운영정보를 신뢰성 있게 예측하여 제공할 수 있다.
도 1은 가스 배관망을 개략적으로 나타낸 도면이다.
도 2는 본 발명의 일실시예에 따른 가스 배관망 운영정보 제공방법의 단계를 나타낸 흐름도이다.
도 3은 본 발명의 일실시예에 따른 가스 배관망 운영정보 제공방법의 세부 단계를 나타낸 흐름도이다.
도 4는 본 발명의 일실시예에 따른 제1 회귀모형의 오전구간 잔차도이다.
도 5는 본 발명의 일실시예에 따른 제1 회귀모형의 오후구간 잔차도이다.
도 6은 본 발명의 일실시예에 따른 제1 회귀모형의 새벽구간 잔차도이다.
도 7은 본 발명의 일실시예에 따른 가스 배관망 운영정보 제공방법의 세부 단계를 나타낸 흐름도이다.
도 8은 본 발명의 일실시예에 따른 하절기 구간의 제4 회귀모형의 회귀계수 추정을 나타낸 도면이다.
도 9는 본 발명의 일실시예에 따른 가스 배관망에 연결된 가스 공급 지점의 시기별 예상 여유수용력을 나타낸 도면이다.
본 발명의 일실시예의 목적, 특정한 장점들 및 신규한 특징들은 첨부된 도면들과 연관되어지는 이하의 상세한 설명과 바람직한 실시예들로부터 더욱 명백해질 것이다. 본 명세서에서 각 도면의 구성요소들에 참조번호를 부가함에 있어서, 동일한 구성 요소들에 한해서는 비록 다른 도면상에 표시되더라도 가능한 한 동일한 번호를 가지도록 하고 있음에 유의하여야 한다. 또한, "일면", "타면", "제1", "제2" 등의 용어는 하나의 구성요소를 다른 구성요소로부터 구별하기 위해 사용되는 것으로, 구성요소가 상기 용어들에 의해 제한되는 것은 아니다. 이하, 본 발명의 일실시예를 설명함에 있어서, 본 발명의 일실시예의 요지를 불필요하게 흐릴 수 있는 관련된 공지 기술에 대한 상세한 설명은 생략한다.
이하, 첨부된 도면을 참조하여, 본 발명의 일실시예를 상세히 설명한다.
도 1은 가스 배관망(10)을 개략적으로 나타낸 도면이며, 도 2는 본 발명의 일실시예에 따른 가스 배관망(10) 운영정보 제공방법의 단계를 나타낸 흐름도이고, 도 3은 본 발명의 일실시예에 따른 가스 배관망(10) 운영정보 제공방법의 세부 단계를 나타낸 흐름도이다.
도 1에 도시된 바와 같이, 가스 배관망(10)(Gas Pipeline)은 천연가스(Natural Gas)를 가정이나 기업 등의 수용가(Fout)로 수송하는 공급망을 말한다. 가스 배관망(10)은 주배관(Main Pileline, Pm)과 부배관(Sub Pipeline, Ps)으로 구분할 수 있다. 주배관(Pm)은 가스 인입 시설(Fin)이 연결되어 가스가 배관망으로 주입되는 비감압구간을 말하며, 부배관(Ps)은 고압인 주배관(Pm)으로부터 분기되어 가스를 저압으로 감압하여 수용가(Fout)로 공급하는 감압구간을 말한다. 이러한 가스 배관망(10)을 안정적이고 경제적으로 운영하기 위하여 본 발명의 일실시예는 입력변수와 추정하고자 하는 종속변수의 데이터가 있는 지도학습 방식의 통계학습을 이용하여 회귀모형을 수립하고, 수립된 회귀모형을 이용하여 가스 배관망(10)의 운영에 필요한 운영정보를 제공할 수 있다.
도 2에 도시된 바와 같이, 본 발명의 일실시예에 따른 가스 배관망(10) 운영정보 제공방법은, 가스 배관망(10)의 복수의 지점에서 측정된 상태정보를 수집하여 데이터베이스화하는 상태정보 수집단계(S100), 상태정보에 기초하여 입력변수를 선택하고 회귀계수를 추정하여 회귀모형을 수립하는 모형수립단계(S200), 및 회귀모형을 이용하여 상기 가스 배관망(10)의 운영에 필요한 운영정보를 제공하는 정보제공단계(S300)를 포함할 수 있다.
상태정보 수집단계(S100)는 가스 배관망(10)의 주배관(Pm) 또는 부배관(Ps)의 각 지점마다 설치되는 압력계, 유량계, 온도계 등의 각종 측정장치들이 실시간으로 측정한 값을 수집하여 데이터베이스화할 수 있다. 가스 배관망(10)의 각 지점은 가스 인입 시설(Fin), 주배관(Pm)과 부배관(Ps)의 분기점, 수용가(Fout) 등 가스 배관망(10)의 상태측정이 필요한 지점들을 포함한다. 상태정보는 가스 배관망(10)의 복수의 지점에서 시간대별 압력, 수요, 최대수요, 최소수요, 가스 인입량, 상기 복수의 지점에서의 평균압력, 기온 중에서 적어도 하나 이상의 항목을 포함할 수 있다. 상태정보는 상기 열거한 항목들 이외에 다양한 항목들을 더 포함할 수 있다. 상태정보 수집단계(S100)는 가스 배관망(10)의 지점별 시간대별 기온을 기상청으로부터 수집하여 데이터베이스화 할 수도 있다.
모형수립단계(S200)는 상태정보에 기초하여 입력변수를 선택하고 회귀계수를 추정하여 회귀모형을 수립하는 단계이며, 단기 회귀모형(S200a)과 장기 회귀모형(S200b)을 수립할 수 있다. 먼저 단기 회귀모형 수립(S200a)을 설명한다.
가스 배관망(10) 운영은 통상 교대근무로 운영되므로, 가스 배관망(10)을 제어하는 관리자의 근무교대시와 하루 중 평균압력 최고시를 기준시점으로 하루를 적어도 두개 이상의 구간으로 구분할 수 있다. 예를 들어, 주배관(Pm)의 하루 중 평균압력 최고시가 06시이고 근무교대시가 08시, 15시, 21시 경우, 하루를 오전(08시~15시), 오후(15시~21시), 새벽(21시~06시)의 3개의 구간으로 구분할 수 있다. 근무교대시와 하루 중 평균압력 최고시가 다른 경우, 가스 배관망(10)의 최고 압력 한계를 초과하지 않기 위하여 하루 중 새벽 구간의 종료시점을 평균압력 최고시로 구분하는 것이 바람직할 수 있다. 이때, 06시부터 08시까지를 별도의 구간으로 구분하여 회귀모형을 수립할 수도 있고, 회귀모형을 수립하지 않고 평균압력 피크를 관리하는 구간으로 운영할 수도 있다. 또는, 새벽 구간의 종료시점을 06시로 구분한 경우, 오전 구간의 시작시점을 06시로 설정하여 오전(06시~15시), 오후(15시~21시), 새벽(21시~06시)의 3개의 구간으로 구분할 수도 있다.
가스 배관망(10)은 일부 구간의 신설이나 폐쇄 또는 노후 배관의 교체 등의 이유로 배관망의 일부를 차단, 폐쇄, 우회 또는 신설하는 등의 변경작업이 이루어진다. 이러한 각종 배관망 변경 작업은 주배관(Pm)의 압력분포를 수시로 변화시키고 주배관(Pm) 압력이 지나치게 높아지거나 낮아지는 문제를 발생시킬 수 있다.
이러한 배관망 변경이 가스 배관망(10) 운영에 미치는 영향을 최소화하기 위해 주배관(Pm)의 평균압력(MPa)을 예측하는 모형을 수립한다. 평균압력은 개별지점 압력과 달리 배관망 변경의 영향을 받지 않고 전국 가스 수요(ton/hour, t/h) 예측만 정확하다면, 전국 가스인입량(t/h)을 조정하여 약 99% 이상의 정확도로 조정가능하기 때문이다. 또한, 평균압력과 가스인입량의 관계는 다양한 유형의 배관망 변경에도 불구하고 신뢰할 수 있는 경향성을 가지므로 적정압력 지표로 적합하다.
본 발명의 일실시예는 주배관(Pm)의 적정 평균압력을 실시간으로 예측하기 위하여 지도학습의 선형회귀모형과 실시간 예측에 적합한 최소제곱법을 사용한다.
도 3에 도시된 바와 같이, 모형수립단계는 특정 시점에서 가스 배관망(10)의 복수의 지점들의 평균압력을 예측하는 제1 회귀모형을 수립하기 위하여, 상태정보에 포함된 개별 항목 또는 서로 선형관계가 있는 항목들의 조합을 예비입력변수로 하고 모든 가능한 회귀(All Possible Regression) 방법을 이용하여 예비입력변수 중에서 입력변수를 선정하고 최소제곱법을 이용하여 회귀계수를 추정하여 제1 회귀모형을 수립하는 제1 회귀모형 수립단계(S210), 및 제1 회귀모형에 의해 예측되는 특정 시점의 평균압력을 달성하기 위하여 가스 배관망(10)에 공급해야 하는 가스 인입량을 예측하는 제2 회귀모형을 수립하기 위하여, 상태정보에 포함된 시간대별 평균압력 변화를 입력변수로 하고 가스 인입량 변화를 종속변수로 하는 회귀모형을 수립하는 제2 회귀모형 수립단계(S220)를 포함할 수 있다. 여기에서 특정 시점은 하루를 적어도 둘 이상으로 구분하는 구간의 종료시일 수 있다.
제1 회귀모형 수립단계(S210)는, 모든 가능한 회귀방법을 이용하여 다양한 예비입력변수 중에서 다양한 입력변수 조합의 회귀모형들을 생성하고 회귀모형들마다 최소제곱법을 이용하여 회귀계수를 추정하며 조정된 결정계수 지표를 이용하여 하나의 회귀모형을 선정하는 모형선정 단계(S211), 선정된 회귀모형을 수립하기 위하여 가정한 가설이 성립하는지 진단하는 모형진단 단계(S212), 회귀모형이 예측하는 값의 정확성을 평가하는 예측력 검정 단계(S213)를 포함할 수 있다. 제1 회귀모형 수립단계(S210)는, 하루를 두 개 이상의 구간으로 구분한 구간마다 제1 회귀모형을 수립할 수 있다. 따라서 오전구간, 오후구간 및 새벽구간마다 제1 회귀모형이 하나씩 수립될 수 있다.
이하에서, 모형선정 단계(S211)를 설명한다.
모형선정 단계(S211)에서, 모든 가능한 회귀방법을 이용하여 예비입력변수 중에서 조정된 결정계수 지표를 기준으로 간결성과 정확성을 동시에 고려한 입력변수 조합을 찾는다. 회귀모형 수립시 입력변수가 과도하게 많아질 경우 모형이 과거 종속변수는 잘 설명하나 향후 종속변수에 대한 예측력은 감소하는 경향이 발생한다. 이러한 과적합의 문제를 해결하기 위해 모형의 적합도와 간결성을 동시에 고려할 수 있는 방법 중 하나가 모든 가능한 회귀(all possible regression)이다. 이는 예비 입력변수들의 모든 가능한 조합으로 복수의 회귀모형들을 수립한 후 정확성과 간결성을 동시에 평가할 수 있는 지표들을 통해 최적의 입력변수 조합을 갖는 하나의 회귀모형을 선정하는 것이다.
선형회귀모형이란 수학식 1과 같이 종속변수 y를 k개의 입력변수
Figure pat00001
와 오차항 i의 선형결합으로 나타낼 수 있는 모형이다. i는 i번째 측정자료를 의미한다.
Figure pat00002
모형수립을 위해 가스 배관망(10)의 복수의 지점에서 시간대별로 과거 가스 배관망(10) 운영 압력, 유량자료 등의 상태정보를 취득하고, 이를 가공하여 예비변수를 만든다. 표 1은 이러한 상태정보의 일부를 예시한 것이다. 예비입력변수는 평균압력, 시간대별 전국 가스 인입량, 전국 가스 인입량의 최대값, 최저값 등일 수 있다. 먼저 예비입력변수들을 이용하여 모든 가능한 입력변수들의 조합을 갖는 복수의 회귀모형을 생성하고, 각 회귀모형들마다 회귀계수를 추정하여 회귀모델을 수립한다.
일시 평균압력(MPa) 전국 가스 인입량(t/h)
10~19시 최저값 36~48시 최대값
Figure pat00003
2015.01.01 00:00 5.77 4,180 6,738
Figure pat00004
Figure pat00005
Figure pat00006
Figure pat00007
Figure pat00008
Figure pat00009
2018.06.29 00:00 5.50 4,297 3,681
Figure pat00010
다양한 입력변수 조합을 갖는 복수의 회귀모형을 생성한 후 회귀모형들마다 회귀계수
Figure pat00011
를 추정하기 위한 방법으로 최소제곱법을 활용한다. 최소제곱법이란 아래의 수학식 2의 오차항
Figure pat00012
제곱의 합을 최소로 만드는 회귀계수를 찾는 방법이다.
Figure pat00013
위 수학식 2를 최소화하기 위해
Figure pat00014
각각에 대해 편미분하면 아래 수학식 3과 같다.
Figure pat00015
Figure pat00016
위 수학식 3을 최소화하는
Figure pat00017
는 위 수학식 3을 0으로 만드는 값에서 발생하므로 위 수학식 3을 0으로 하는
Figure pat00018
를 각각
Figure pat00019
라 하면 아래 수학식 4와 같은 정규방정식을 얻을 수 있다.
Figure pat00020
Figure pat00021
위 수학식 4의 정규방정식을 전개하면 아래 수학식 5와 같은데 이후의 전개는 행렬을 이용하면 편리하다.
Figure pat00022
Figure pat00023
Figure pat00024
Figure pat00025
Figure pat00026
Figure pat00027
Figure pat00028
Figure pat00029
위 수학식 5의 입력변수, 종속변수, 회귀계수 및 오차를 행렬로 표현하면 아래 수학식 6과 같다.
Figure pat00030
수학식 1은 아래 수학식 7로 표현할 수 있고, 수학식 4의 정규방적식을 전개한 수학식 5는 아래 수학식 8로 표현할 수 있다.
Figure pat00031
Figure pat00032
수학식 8의 양변에
Figure pat00033
의 역행렬
Figure pat00034
를 곱하면 회귀계수들은 수학식 9와 같이 추정할 수 있다.
Figure pat00035
종속변수
Figure pat00036
에 대한 예측값
Figure pat00037
는 수학식 10이다.
Figure pat00038
Figure pat00039
또한,
Figure pat00040
Figure pat00041
의 차이인 잔차
Figure pat00042
Figure pat00043
이다.
이러한 과정을 수행하여 다양한 입력변수 조합을 갖는 복수의 회귀모형마다 회귀계수를 추정하여 복수의 회귀모형을 수립할 수 있다. 모든 가능한 회귀방법에 따라 복수의 회귀모형을 수립한 후 조정된 결정계수를 기준으로 최선의 회귀모형을 선정한다. 이하에서 회귀모형을 선정하는 과정을 설명한다.
회귀계수를 추정하는 방법으로 최소제곱법을 사용하는 경우 잔차와 관련된 몇 가지 특성이 있는데 우선 수학식 4의 정규방정식에서 수학식 11, 12, 및 13을 얻을 수 있다.
Figure pat00044
Figure pat00045
Figure pat00046
최소제곱법 적용시 발생하는 이러한 잔차의 특성을 이용하면, 회귀모형의 종속변수에 대한 설명력, 즉 정도를 측정할 수 있는 결정계수지표를 산출 할 수 있다. 먼저 종속변수
Figure pat00047
와 종속변수 평균
Figure pat00048
와의 편차를 아래 수학식 14와 같이 둘로 나눈다.
Figure pat00049
여기서
Figure pat00050
를 총편차라하고,
Figure pat00051
는 잔차로서 회귀모형에 의해 설명되지 않는 편차이며
Figure pat00052
는 회귀모형에 의해 설명되는 편차이다. 양변을 제곱하고 모든 i에 대한 합을 구하면 수학식 15가 된다.
Figure pat00053
수학식 15에서 오른쪽 마지막 항은 수학식 16과 같은데 수학식 11, 및 13으로부터 0이 됨을 알 수 있다.
Figure pat00054
따라서 총편차의 제곱합은 아래와 같이 두 변동 합으로 분해된다
Figure pat00055
수학식 17에서 각각의 항을 SST(total sum of squares), SSE(sum of squares due to residual errors), SSR(sum of squares due to regression)이라 하고 결정계수(R2)는
Figure pat00056
이고 종속변수의 총변동 중 모형에 의하여 설명되는 부분의 비율을 의미한다. 결정계수는 입력변수가 추가되면 항상 증가하는 성질을 갖고 있어 결정계수를 그대로 판단기준으로 사용하는 경우 과적합한 모형이 선정될 수 있으므로 입력변수의 개수를 반영할 수 있는 조정된 결정계수가 자주 이용된다.
Figure pat00057
위 수학식 18에서, 조정된 결정계수
Figure pat00058
는 입력변수의 수 k가 적고 결정계수
Figure pat00059
가 높을수록 좋은 성질이 있으므로 모든 가능한 회귀시 조정된 결정계수를 지표로 삼아 모형의 정도와 간결성을 동시에 고려할 수 있다.
오전모형을 예로 들면 입력변수의 개수에 따라 조정된 결정계수는 0.5087→0.6367→0.8157→0.8324→0.8331→0.8351→0.8353→0.8354→0.8353→0.8353→0.8352로 입력변수 개수가 8개일 때 0.8354로 가장 크다. 그러나, 입력변수의 개수가 많아지는 경우 실시간으로 모형을 설립하고 이용하는데 복잡도가 증가하는 문제가 있다. 본 실시예에서는 조정된 결정계수의 변화를 기준으로 입력변수 개수 증가에 따라 조정된 결정계수의 증가정도가 직전 증가정도의 20% 이하로 급감할 때의 회귀모형을 선정할 수 있다. 예를 들어, 본 실시예에서 입력변수가 1개에서 2개로 증가한 경우 조정된 결정계수는 0.1280만큼 증가하고, 입력변수가 2개에서 3개로 증가한 경우 조정된 결정계수는 0.1790만큼 증가하며, 입력변수가 3개에서 4개로 증가한 경우 조정된 결정계수는 0.0167만큼 증가하므로, 조정된 결정계수의 증가정도가 직전 증가정도의 20% 이하로 급감할 때인 입력변수가 3개인 회귀모형을 선정할 수 있다. 입력변수가 3개인 회귀모형을 선정하면 수학식 19와 같다.
Figure pat00060
Figure pat00061
: 15시 압력,
Figure pat00062
: 8시 압력,
Figure pat00063
: 10시~19시 최저수요,
Figure pat00064
: 36~48시 최대수요,
Figure pat00065
: 평균이 0이고 분산이
Figure pat00066
: 인 정규분포
Figure pat00067
을 따르는 오차항이며 e-15는 10-15, e-04는 10-4를 의미하고 조정된 결정계수는 0.8157이다. 위에서 산출한 회귀계수들은 본 발명의 일실시예를 설명하기 위하여 예시적으로 상태정보를 이용하여 산출한 것이다.
이러한 과정을 수행하여 다양한 입력변수 조합을 갖는 복수의 회귀모형들 중에서 하나의 회귀모형을 선정할 수 있다(S211). 회귀모형을 선정한 후, 선정된 회귀모형을 수립하기 위하여 가정한 가설이 성립하는지 진단하는 모형진단 단계(S212)를 수행한다. 이하에서 모형진단 단계(S212)를 설명한다.
만일 동일 모집단에서 무한개의 표본을 수집할 수 있다면 각각의 표본에 의해 산출된 회귀계수 등의 각종 통계량들 역시 무한개일 것이고, 이러한 통계량들은 각각 확률분포를 갖게 되는데, 이를 표본분포라 한다.
표본분포를 얻기 위해 동일한 모집단에서 무한개의 표본을 얻기는 불가능하나, 회귀모형에 대해 몇 가지 가정과 행렬연산의 기본특성을 활용하면 한 개의 표본으로도 표본분포의 특성에 대해 알 수 있다.
행렬의 기본특성은 행렬
Figure pat00068
가 상수행렬이고
Figure pat00069
는 확률벡터일 때 기댓값
Figure pat00070
와 분산
Figure pat00071
에 대해서 아래 수학식 20이 성립한다는 것이다.
Figure pat00072
Figure pat00073
Figure pat00074
수학식 9에서 입력변수가 고정 값이고 오차항의 평균이 0, 즉
Figure pat00075
이라는 가정을 하면 아래 수학식 21의 전개를 통해
Figure pat00076
는 표본에 따라 달라지더라도 표본에 따라 다른
Figure pat00077
들의 평균값은 결국 미지의 고정된 모수값
Figure pat00078
와 같아짐을 알 수 있고 이러한 성질을 불편성이라고 한다.
Figure pat00079
Figure pat00080
또한, 서로다른 오차항끼리는 독립이고, 모든 i에 대해 오차항
Figure pat00081
의 분산은
Figure pat00082
으로 일정한 등분산이며 입력변수는 고정값이라 가정하면
Figure pat00083
의 표본분포의 분산에 대해 추정 할 수 있다. 먼저, 서로 다른 오차항끼리 독립일 경우 확률변수의 기본특성에 의해 공분산은 수학식 22와 같고,
Figure pat00084
등분산 가정에 의해 분산은 수학식 23이 되며,
Figure pat00085
입력변수를 고정값이라 가정하면 수학식 24 가 성립하므로
Figure pat00086
아래 수학식 25와 같이
Figure pat00087
가 성립한다. 이 때
Figure pat00088
는 대각행렬로서 행과 열의 수가 같으며 행과 열이 같은 대각원소는 1이고 그 외의 원소는 0인 행렬이다.
Figure pat00089
따라서
Figure pat00090
표본분포의 분산은 수학식 26 과 같다.
Figure pat00091
Figure pat00092
Figure pat00093
는 모회귀모형 오차항의 분산으로 실제로는 알 수 없으므로, 수학식 27과 같이
Figure pat00094
를 통해 추정하고 이는
Figure pat00095
에 대한 불편추정량임이 알려져 있다.
Figure pat00096
Figure pat00097
따라서
Figure pat00098
의 j행 j열의 원소를 로 정의하면
Figure pat00099
표본분포 분산의 추정값은
Figure pat00100
이다.
이상의 가정에 추가로 오차항이 정규분포를 따른다고 가정하면 각종 통계량의 표본분포의 형태까지 추정할 수 있고, 이를 통해 각종 통계량에 대한 신뢰구간 추정과 가설검정을 시행할 할 수 있다.
다음 수학식 28의 통계량
Figure pat00101
의 표본분포는 자유도
Figure pat00102
Figure pat00103
분포를 따른다고 알려져 있다.
Figure pat00104
Figure pat00105
가 발생할
Figure pat00106
범위는
Figure pat00107
이므로 통계량
Figure pat00108
에 수학식 28을 대입하여 전개하면
Figure pat00109
의 신뢰구간을 수학식 29와 같이 산출할 수 있다.
Figure pat00110
위 수학식 29의 의미는 무한개의 표본을 수집하고 각 표본에 대해서 위의 범위를 각각 구하면 범위의 폭과 위치는 표본에 따라 다르지만, 이 범위들이 미지의 모수
Figure pat00111
를 포함하는 빈도는
Figure pat00112
라는 것이다.
통계적 가설검정은 귀무가설 H0와 대립가설 H1을 설정하고, 어느 가설이 적당한지 파악하는 것으로 확실한 근거가 있기 전에는 대립가설을 선택하지 않고 귀무가설을 받아들인다. 선형회귀계수에 대해 중요한 가설검정은 입력변수와 종속변수간에 선형관계가 있는지 즉, j번째 회귀계수가 0과 유의미하게 다른지 검정하는 것으로 아래 수학식 30과 같이 가설을 설정한다.
Figure pat00113
귀무가설이 옳다고 가정시 다음 수학식 31의 통계량 t0는 확률분포 tn-k-1를 따른다.
Figure pat00114
오전모형의 회귀계수에 대한 추정값, 표준편차, t0값은 아래 표 2와 같다.
회귀계수 추정값 표준편차 t0 유의확률
Figure pat00115
1.87E-15 1.21E-02 0 1
Figure pat00116
6.85E-01 1.40E-02 49.05 <2e-16
Figure pat00117
-1.80E+00 4.29E-02 -41.89 <2e-16
Figure pat00118
1.93E+00 4.23E-02 45.65 <2e-16
입력변수
Figure pat00119
의 회귀계수
Figure pat00120
Figure pat00121
값은 49.05로서 귀무가설
Figure pat00122
이 옳다고 가정할 경우
Figure pat00123
분포에서 49.05값이 발생할 확률, 즉 유의확률은 2e-16으로 0에 가까우므로 귀무가설을 기각할 수 있고
Figure pat00124
는 0과 유의미하게 다른 회귀계수라고 결론 내릴 수 있다. 통상 가설검정이 양측검정인지 단측검정인지에 따라 유의확률이 0.025~0.05보다 작으면 귀무가설을 기각한다.
앞서 적용한 모든 가정이 성립하고, 조정된 결정계수를 통해 모형을 간결하게 하여도 입력변수간에 선형관계가 있으면 회귀계수의 분산이 커지는 다중공선성이 발생한다. 이 경우 새로운 표본을 적용시 예측력이 크게 감소할 수 있다. 회귀계수
Figure pat00125
의 다중공선성 측정은 다음 수학식 32의 분산팽창인자를 활용한다
Figure pat00126
이 때,
Figure pat00127
는 입력변수
Figure pat00128
를 기타 입력변수로 회귀분석하여 얻은 결정계수이다.
Figure pat00129
가 1이면 다중공선성이 없는 직교상태로 보고, 5~10 이상이면 다중공선성이 발생하는 것으로 본다.
오전모형의 분산팽창인자는
Figure pat00130
: 1.334,
Figure pat00131
: 12.563,
Figure pat00132
: 12.236으로
Figure pat00133
: 10시~19시 최저수요 와
Figure pat00134
: 36~48시 최대수요 입력변수간에 선형관계가 있다. 이를 완화하기 위해 두 변수는 모형에서 제외하고 두 변수를 조합한 새로운 변수
Figure pat00135
를 모형에 포함하면 오전구간의 제1 회귀모형은 수학식 33과 같다.
Figure pat00136
분산팽창인자는
Figure pat00137
: 1.003,
Figure pat00138
: 1.003으로 다중공선성이 제거되었고 조정된 결정계수는 0.8187로 약간 향상되었다.
이상에서와 같이 회귀모형을 수립하고 회귀계수의 불편성 증명, 분산 및 신뢰구간 산출, 가설 검정 등을 시행하려면 앞서 적용한 가정들이 실제 성립하는지 분석해야한다..
도 4는 본 발명의 일실시예에 따른 제1 회귀모형의 오전구간 잔차도이고, 도 5은 본 발명의 일실시예에 따른 제1 회귀모형의 오후구간 잔차도이며, 도 6은 본 발명의 일실시예에 따른 제1 회귀모형의 새벽구간 잔차도이다.
우선 오차항의 독립성, 등분산성, 정규성 및 평균은 0이라는 가정은 측정값과 예측값의 차이인 잔차의 분포를 통해 확인할 수 있다. 관측순서대로 잔차를 나타낸 그림에서 패턴이 없으면 오차항의 독립성 가정이 성립한다 보고, 예측값대 잔차 그림에서 잔차의 폭이 전구간에서 비슷하면 오차항의 등분산성이 성립한다고 보며 잔차 히스토그램이 정규분포 모양이면 오차항의 정규성이 성립한다고 본다. 또한 세 그림에서 잔차 평균이 0에 가까우면 오차항 평균은 0 이라는 가정이 성립한다 볼 수 있다.
입력값이 고정이라는 가정의 경우 입력변수가 확률변수라해도 서로독립이고, 확률분포가 회귀계수와 오차항의 분산에 의존하지 않으면 위에서 전개한 모든 과정은 성립하는 것으로 알려져 있다. 분석결과 도 4 내지 6과 같이 오차의 독립성, 등분산성, 정규성 가정적용에 큰 무리가 없는 것을 알 수 있다. 모형진단 단계(S212)에서 가정한 가설이 성립하지 않는다거나 또는 다중공선성이 존재하는 경우 변수의 조합을 이용하더라도 극복할 수 없는 경우에는 해당 모형을 제외하고 모형선정 단계(S211)로 되돌아가서 다른 모형을 선택할 수 있다. 모형진단(S212)을 수행한 후 회귀모형이 예측하는 값의 정확성을 평가하는 예측력 검정 단계(S213)를 수행한다. 이하에서 예측력 검정 단계(S213)를 설명한다.
예측력 검정은 상태정보를 훈련자료와 테스트자료로 분리하고, 훈련자료를 이용하여 상술한 과정을 통해 회귀모형을 수립하고, 수립된 회귀모형에 테스트 자료의 입력변수를 입력하여 산출한 종속변수 값과 테스트 자료의 실제 종속변수 값을 비교하여 회귀모형의 예측력을 검정하는 과정이다. 제1 회귀모형을 수립하기 위하여 사용된 상태정보를 훈련자료와 테스트자료로 나누고, 모형 수립을 위한 훈련자료(2015.1.1 ~ 2017.6.30)에서의 잔차의 평균제곱오차 0.1825와 비교하여, 예측력 점검을 위한 테스트자료(2017.7.1 ~ 2018.6.30)에서의 잔차의 평균제곱오차 0.1778의 차이가 크지 않으므로 충분한 예측력을 갖는 것으로 평가할 수 있다.
상술한 과정을 통하여 제1 회귀모형 수립단계(S210)를 오전, 오후, 새벽 구간에 적용하면 각 구간마다 제1 회귀모형을 수립할 수 있다.
오전(08:00~15:00) 구간의 제1 회귀모형은 수학식 34와 같다.
Figure pat00139
Figure pat00140
: 15시 압력,
Figure pat00141
: 8시 압력 ,
Figure pat00142
: 10시~19시 최저수요 / 36~48시 최대수요,
Figure pat00143
: 평균이 0이고 분산이
Figure pat00144
인 정규분포
Figure pat00145
을 따르는 오차항이다. 분산팽창인자는
Figure pat00146
: 1.003 이고 회귀계수 관련 통계량은 아래 표 3과 같다.
회귀계수 추정값 표준편차 t 값 유의확률
Figure pat00147
2.09E-15 1.20E-02 0 1
Figure pat00148
6.85E-01 1.20E-02 56.98 <2e-16
Figure pat00149
-5.57E-01 1.20E-02 -46.4 <2e-16
결정계수는 전체자료 0.819, 훈련자료 0.822이고 평균제곱오차는 전체자료 0.1810, 훈련자료 0.1825 테스트자료 0.1778 이다.
오후(15:00~21:00) 구간의 제1 회귀모형은 수학식 35와 같다.
Figure pat00150
Figure pat00151
: 21시 압력,
Figure pat00152
: 15시 압력,
Figure pat00153
: 0시 압력-8시 압력,
Figure pat00154
:6~12시 최대수요 - 12~24시 최대수요,
Figure pat00155
: 평균이 0이고 분산이
Figure pat00156
인 정규분포
Figure pat00157
을 따르는 오차항이다. 분산팽창인자는
Figure pat00158
: 1.043,
Figure pat00159
: 1.023,
Figure pat00160
: 1.059이고 회귀계수 관련 통계량은 아래 표 4와 같다.
회귀계수 추정값 표준편차 t 값 유의확률
Figure pat00161
3.00E-16 9.86E-03 0 1
Figure pat00162
8.81E-01 1.01E-02 87.521 <2e-16
Figure pat00163
1.88E-01 9.97E-03 18.888 <2e-16
Figure pat00164
8.84E-02 1.02E-02 8.715 <2e-16
결정계수는 전체자료 0.879, 훈련자료 0.888이며 평균제곱오차는 전체자료 0.1207, 훈련자료 0.1154, 테스트자료 0.1383 이다.
새벽(21:00~06:00) 구간의 제1 회귀모형은 수학식 36와 같다.
Figure pat00165
Figure pat00166
: 30시 압력,
Figure pat00167
: 21시 압력,
Figure pat00168
: 10~19시 최저수요,
Figure pat00169
: 24~30시 최저수요 / 30~36시 최대수요,
Figure pat00170
: 8시 압력,
Figure pat00171
: 평균이 0이고 분산이
Figure pat00172
인 정규분포
Figure pat00173
을 따르는 오차항이다. 분산팽창인자는
Figure pat00174
: 1.630,
Figure pat00175
: 1.624,
Figure pat00176
: 1.366,
Figure pat00177
: 1.826이고 회귀계수 관련 통계량은 아래 표 5와 같다.
회귀계수 추정값 표준편차 t 값 유의확률
Figure pat00178
-0.00073 0.018787 -0.039 0.969168
Figure pat00179
0.675628 0.017423 38.779 < 2.2e-16
Figure pat00180
0.394126 0.01902 20.722 < 2.2e-16
Figure pat00181
-0.46968 0.017626 -26.647 < 2.2e-16
Figure pat00182
0.057794 0.015757 3.668 0.000255
결정계수는 전체자료 0.670, 훈련자료 0.701이고 평균제곱오차는 전체자료 0.2635, 훈련자료 0.2596, 테스트자료 0.2898이다.
제2 회귀모형 수립단계(S220)를 설명하기 위하여, 가스 배관망에 공급되는 가스량을 가스 인입량이라 하고, 가스 배관망에서 인출되는 가스량을 가스 인출량이라 한다. 가스 충진량 변화는 가스 인입량에서 가스 인출량을 차감한 값이다.
제2 회귀모형 수립단계(S220)는, 상태정보에 포함된 시간대별 평균압력 변화를 입력변수로 하고 가스 충진량 변화를 종속변수로 하는 회귀모형을 수립할 수 있다. 제2 회귀모형은 제1 회귀모형에 의해 예측되는 특정 시점의 평균압력을 달성하기 위하여 필요한 가스 충진량 변화를 예측하므로 가스 인입량을 얼마로 설정하면 될 것인지 예측할 수 있다. 평균압력과 가스 충진량은 다양한 가스 배관망(10) 변경에도 신뢰할 수 있는 경향성을 제공하므로, 제2 회귀모형을 수립함에 있어서 모든 가능한 회귀방법을 이용하지 않고도 입력변수를 평균압력으로 설정할 수 있다.
평균압력 조정에 필요한 총 가스 송출량을 산출하기 위해서 특정 기간동안의 주배관(Pm)망 가스 충진량 변화를 종속변수로 하고 특정 기간동안의 평균압력 변화를 입력변수로하여 두 변수를 표준화한 후 회귀모형을 수립한다. 예를 들어, 6시간 동안의 주배관(Pm)의 평균압력 변화를 입력변수로, 6시간동안 가스 배관망(10)의 충진량 변화를 종속변수로 하는 제2 회귀모형은 다음 수학식 37과 같이 수립될 수 있다.
Figure pat00183
위 수학식 37의 제2 회귀모형은 평균압력을 1 증감시키기 위해서는 특정 기간동안 가스 배관망(10)에 공급되는 가스 충진량을 0.9983을 증감시켜야 함을 의미하며, 이는 예상 가스 인출량보다 가스 인입량을 0.9983만큼 높게 하여 달성할 수 있다. 적합도는 0.997이고 입력변수와 종속변수는 물리적 관계이며 실무에 활용할 수 있는 충분한 정확도를 갖는다. 따라서 모형진단과 예측력 검정을 생략할 수 있다.
이상의 과정을 통하여 제1 회귀모형과 제2 회귀모형을 수립할 수 있다(S210 및 S220). 다음으로, 정보제공단계(S300)에서, 제1 회귀모형과 제2 회귀모형을 이용하여 가스 배관망(10)의 운영에 필요한 단기 운영정보를 제공(S300a)할 수 있다.
정보제공단계는 단기 운영정보를 제공(S300a)함에 있어서, 제1 회귀모형에서 입력변수가 종속변수에 미치는 영향의 정도가 비교되도록, 입력변수로 선택된 항목들을 표준화하여 제공하는 변환정보 제공단계(S310), 및 특정 시점에서 제1 회귀모형에 의해 예측된 평균압력(S320)을 달성하기 위하여, 제2 회귀모형을 이용하여 예측되는 가스 인입량 변화를 예측하여 제공하는 공급정보 제공단계(S330)를 포함할 수 있다.
변환정보 제공단계(S310)는, 제1 회귀모형에서 선정된 입력변수들을 표준화하여 제공할 수 있다. 입력변수들은 서로 다른 물리량이고 서로 다른 스케일의 값을 가지므로, 입력변수들 각각이 종속변수인 주배관(Pm)의 평균압력에 미치는 영향을 직관적으로 인식하기 어렵다. 따라서, 제1 회귀모형에서 선정된 입력변수들을 표준화하여 관리자에게 제공함으로써 관리자가 입력변수를 조정하는 경우 평균압력에 미치는 영향을 직관적으로 인식할 수 있도록 하여, 관리자의 편리한 의사결정에 도움을 줄 수 있다.
또한, 제1 회귀모형에 기초하여 평균압력 예측단계(S320)를 수행할 수 있다. 제1 회귀모형을 이용하여 하루를 구분하는 각 구간의 종료시 평균압력을 추정할 수 있다. 예를 들어, 오전 구간(08시~15시)의 시작시인 08시에, 종료시인 15시의 주배관(Pm) 평균압력을 예측할 수 있다. 즉, 오전 구간 관리자는 업무를 시작할 때 오전 구간의 종료시인 15시 평균압력 예측을 제공받을 수 있다. 동일하게, 오후 구간 관리자는 업무를 시작할 때 오후 구간의 종료시인 21시 평균압력 예측 제공받을 수 있다.
다음으로, 공급정보 제공단계(S330)는 특정 시점에서 제1 회귀모형에 의해 예측된 평균압력을 달성하기 위하여, 제2 회귀모형을 이용하여 예측되는 가스 충진량 변화를 예측하여 관리자에게 제공할 수 있다. 상술한 평균압력 예측단계에서 구간의 종료시 평균압력을 예측하였으므로, 제2 회귀모형을 이용하여 구간의 종료시 평균압력을 달성하기 위하여 필요한 가스 인입량(예측된 가스 충진량 변화+가스 인출량)을 예측할 수 있다. 예를 들어, 오전 구간(08시~15시)의 종료시인 15시의 주배관(Pm) 평균압력 예측값을 달성하기 위하여 필요한 가스 인입량을 오전 구간의 시작시에 예측할 수 있으므로, 관리자는 필요한 가스 인입량만큼 가스가 공급되도록 가스 배관망(10)을 제어할 수 있다.
다음으로, 상태정보 수집단계(S100) 후에 모형수립단계(S200)에서 장기 회귀모형을 수립하는 과정(S200b)을 설명한다.
도 7은 본 발명의 일실시예에 따른 가스 배관망(10) 운영정보 제공방법의 세부 단계를 나타낸 흐름도이다.
가스 직도입 사업자는 가스 배관망(10)을 운영하는 운영주체 이외의 개인 또는 법인 등일 수 있다. 가스 직도입 사업자는 가스 배관망(10)으로부터 인출 계약용량 범위(t/h)내에서 가스를 인출하여 사용할 수 있고, 인입계약용량(t/h) 범위 내에서 가스를 인출한 만큼, 가스 인입 시설(Fin)을 이용하여 가스 배관망(10)에 가스를 인입하여야 한다.
하지만 인입해야 하는 가스의 양이 배관의 수용력보다 커서 가스 인입을 제한해야 하는 경우가 발생하는 문제가 있다. 이러한 문제는 가스 직도입 사업자의 가스 인출지점(Fout)은 전국에 분산되어 있으나, 가스 인입 지점은 가스 인입 시설(Fin)들 중 하나인 보령기지에 집중되어 보령기지 연결지점에서 병목현상이 발생하기 때문이다.
가스 직도입 사업자가 가스를 인출한 것보다 가스를 적게 인입하는 경우를 인입제한이라 하고 가스를 적게 인입한 만큼 가스 배관망 운영주체(즉, 가스 배관망에 가스를 공급하는 운영자, 예를 들어 한국가스공사)로부터 가스 직도입 사업자에게로 가스대여가 발생한다. 따라서 가스 직도입 사업자는 가스를 적게 인입한 만큼 추후 가스를 추가로 인입해야 하는데 이를 가스반환이라 한다. 본 명세서에서는 가스 인입제한 및 반환이 발생하는 날을 각각 가스 인입 제한일, 가스 추가 인입 가능일이라 한다.
가스 직도입 사업자가 보령기지를 이용한 가스 인입 계약을 체결하기 위해서는, 가스 인입 시설(Fin, 예를 들어 보령기지)의 인입권역 압력상승과 이에 따른 가스 인입 제한일 및 가스 추가인입 가능일을 예측하여 제공하고, 유관부서 및 관련기관은 가스 인입 계약이 관리가능한 수준인지 검토하여야 한다. 하지만 상술한 단기 회귀모형은 가스 인입 시설 권역의 국부적 압력증가와 가스 인입 제한 및 가스 추가인입 가능기간을 예측 할 수 없다. 이러한 문제를 해결하기 위하여, 본 발명의 일실시예에 따른 가스 배관망(10) 운영정보 제공방법은 가스 인입 제한일과 가스 추가인입 가능일과 같은 운영정보를 제3 내지 5 회귀모형을 통해 신뢰성 있게 예측하여 제공할 수 있다.
제3 내지 제5 회귀모형을 설명함에 있어서, 배관의 수용력이란 가스 인입 가능량과 같은 의미로서 가스 인입 시설 연결지점(Fin)에서 배관의 허용압력 범위 내에서 가스를 최대로 인입할 수 있는 양이다. 또한 가스 인입 예상량 이란 가스 인출 예상량과 같은 의미로서 향후 직도입 사업자가 가스를 배관망으로부터 인출한 만큼 인입해야하는 양이다.
향후 가스 인입 시설(Fin)의 가스 인입 제한일 및 가스 추가인입 가능일은 가스 인입 시설(Fin)의 가스 인입예상량과 이에 대한 배관의 예상 수용력을 비교하여 예측할 수 있다. 임의의 날의 보령기지의 가스 인입예상량이 이에 대한 배관의 예상 수용력(인입가능량)보다 큰 경우 그 차이만큼 가스 인입을 제한해야 하는 가스 인입 제한일로 예상할 수 있고, 인입예상량이 예상 수용력보다 작은 경우 그 차이만큼 가스를 추가로 인입할 수 있는 가스 인입 가능일로 예상할 수 있다.
따라서 가스 인입 제한일 및 가스 추가인입 가능일을 예측하기 위해서는 우선 가스 인입예상량과 배관망의 수용력 예측모형을 수립해야 한다. 이 때, 인입예상량은 인출예상량과 같고 인출예상량은 계약으로 정해지는 인출계약용량에 예상 시설이용률을 곱한 값이다. 따라서 가스 인입예상량 대신 시설이용률 모형을 수립하면 모형의 산출값에 인출계약용량을 곱함으로써 계약용량별로 인입예상량을 산출 할 수 있어 유용하다. 시설이용률은 인출계약용량 대비 실제 가스를 인출하는 비율을 의미한다.
시설이용률과 배관의 수용력은 모두 가스수요에 영향을 받고 가스수요는 기온에 영향을 받는다. 따라서 기온-수요 모형, 수요-수용력 모형, 수요-시설이용률 모형을 수립하면 시기별 평년기온을 이용해 시기별 가스인입 제한일, 가스 추가인입 가능일 및 인입가능량 등의 각종 통계량을 추정할 수 있고, 가스 직도입 사업자와 가스 배관망(10) 운영주체 사이에서 가스 직도입 계약이 가능한 용량이 얼마인지, 또는 천연가스 배관망(10) 운영에 필요한 의사결정을 하는데 필요한 다양한 값을 추정할 수 있다.
도 7에 도시된 바와 같이, 본 발명의 일실시예에 따른 모형수립단계(S200b)는 가스 배관망(10)의 연간 수요를 예측하는 제3 회귀모형을 수립하기 위하여 기온을 입력변수로 하고 베이즈 정리를 이용하여 회귀계수를 추정하여 제3 회귀모형을 수립하는 제3 회귀모형 수립단계(S230), 가스 배관망(10)의 가스 공급 지점의 수용능력을 예측하는 제4 회귀모형을 수립하기 위하여 가스 수요를 입력변수로 하고 베이즈 정리를 이용하여 회귀계수를 추정하여 제4 회귀모형을 수립하는 제4 회귀모형 수립단계(S240), 및 가스 직도입 사업자의 연간 시설이용률을 예측하는 제5 회귀모형을 수립하기 위하여 가스 수요를 입력변수로 하고 베이즈 정리를 이용하여 회귀계수를 추정하여 제5 회귀모형을 수립하는 제5 회귀모형 수립단계(S250)를 포함할 수 있다.
제3, 제4, 및 제5 회귀모형을 수립하기 위한 상태정보는 일별 가스 수요, 일별 시설이용률, 일별 수용력 등을 사용할 수 있다. 표 6에서 예시적으로 설명하는 바와 같이, 일별 수요는 최근 1년 수요를 활용하였고, 가스 인입 시설(Fin)의 가스 인입 예상량은 인출계약용량(t/h) × 시설이용률이므로 최근 시설이용률 자료를 활용하였다. 수용력은 배관망해석 프로그램(Synergi Gas)을 이용하여 모의실험을 시행하여 취득하였고, 이는 영업자료이므로 예시적으로 기재하였다.
일시 수요(톤/일) 시설이용률 수용력(t/h)
2017.6.28 88,957 0.847 557
Figure pat00184
Figure pat00185
Figure pat00186
Figure pat00187
2018.6.27 97,847 0.801 577
제3 회귀모형 수립(S230), 제4 회귀모형 수립(S240), 및 제5 회귀모형 수립(S250)단계에서, 회귀모형을 수립함에 있어서 오차항의 이분산성, 비정규성 및 분석자의 주관을 반영할 수 있는 베이즈 정리를 이용한다. 시설이용률은 0~1의 값을 갖기 때문에 오차항이 정규분포보다는 베타분포를 따른다고 가정하는 것이 적합하고, 수용력의 경우 입력변수에 따라 오차항의 표준편차가 선형적으로 증감하는 이분산형태가 나타나므로 이를 적절히 반영하기 위하여 베이즈 정리를 이용한다. 또한, 가스 인입 가능일 및 제한일 예측이 필요한 기간은 향후 5~10년에 해당하여 불확실성이 크므로, 베이즈 정리를 이용하면 관측 및 모의실험을 통한 자료는 물론 가스계통운영 경험 등에 기반한 분석자의 판단을 반영할 수 있어, 추정하고자 하는 통계량의 불확실성을 보완할 수 있다.
또한, 제3 회귀모형 수립단계(S230) 및 제5 회귀모형 수립단계(S250)는 평일, 토요일, 일요일(공휴일 포함)로 구간을 구분하고, 구간마다 회귀모형을 각각 수립하며, 제4 회귀모형 수립단계(S240)는 가스 배관망(10) 운영방식이 변화하는 하절기(4~10월)와 동절기(11~3월)로 구간을 구분하고, 구간마다 회귀모형을 각각 수립할 수 있다.
제3, 제4, 및 제5 회귀모형 수립단계(S230, S240 및 S250)는 각각 가능도함수 수립(S201), 사전분포 부여(S202), 사후분포 산출(S203)단계를 포함할 수 있다.
먼저 가능도함수를 수립(S201)하는 과정에서, 제3 회귀모형(기온-수요) 및 제4 회귀모형(수요-수용력)의 가능도함수는 정규분포로 설정하고, 제5 회귀모형(수요-시설이용률)의 경우 이용률은 0~1의 값을 취하므로 베타분포로 설정할 수 있다. 또한 각 분포의 평균은 입력변수의 2~3차 직교다항회귀모형으로 설정하고, 표준편차는 입력변수에 대해 단순선형모형을 따르되, 0보다 큰 값을 갖게 설정할 수 있다.
다음으로, 사전분포를 부여(S202)하는 과정에서, 다항회귀모형의 회귀계수에 대한 사전분포는 정규분포로 가정하고 사전분포의 평균과 표준편차는 직교다항회귀모형에 최소제곱법을 적용하여 산출한 회귀계수의 추정값 그대로와 표준편차를 100배한 값을 각각 적용한다. 단순선형모형의 경우 자료를 입력변수 크기순으로 15~20그룹으로 나누고 각 그룹의 입력변수의 평균을 입력변수로 하고 그룹의 표준편차를 반응변수로 하는 선형모형을 수립한다.
다음으로, 사후분포를 추정(S203)하는 과정에서, 베이즈 정리는 사전분포, 가능도함수, 주변부 분포를 통해 사후분포를 산출하는 것이 목적인데, 주변부 분포의 직접적인 계산이 어려우므로 본 발명에서는 마코프 사슬 몬테카를로 방법을 통해 사후분포를 추정한다.
이하에서 베이즈 정리를 이용하여 회귀모형을 수립하는 과정을 더 상세히 설명한다.
베이즈 정리는 아래 수학식 38의 조건부 확률(conditional probability)의 정의로부터 유도 될 수 있다. 조건부 확률이란 어떤 사건 D가 일어난 조건하에서 다른 사건 H가 일어날 확률을 말한다.
Figure pat00188
Figure pat00189
는 사건 D가 발생할 확률이고
Figure pat00190
는 사건 H와 D가 동시에 발생할 확률이다. 또한 반대로
Figure pat00191
이므로
Figure pat00192
이 성립하고 이를 위의 식에 대입하면 아래 수학식 39의 베이즈 정리를 얻을 수 있다.
Figure pat00193
통상 D는 관측자료를 의미하고 H는 추정 또는 검정하고자 하는 가설(Hypothesis)이나 모형의 회귀계수를 의미한다.
베이즈 정리를 통해 최종적으로 구하고자 하는 것은
Figure pat00194
로서 사후분포(posterior distribution)라 하고 관측자료를 고려했을 때, 회귀계수 H가 가질 수 있는 각각의 값에 대해 부여된 확신의 정도, 즉 확률분포를 의미한다.
Figure pat00195
는 사전분포(prior distribution)로서 자료를 고려하기 전에 회귀계수 H가 가질 수 있는 각각의 값에 대한 확신의 정도 또는 확률분포이다.
Figure pat00196
는 가능도함수(likelyhood function)로서 회귀계수 H가 사실이라 가정할 때 D를 관측할 확률이다.
Figure pat00197
는 주변부분포(marginal distribution)으로 모든 H에 대해 D가 발생할 확률로서 상수값을 갖는다.
예를 들어 제4 회귀모형 수립단계에서 가스수요(x) 에 따른 배관의 수용력(y) 모형을 다음 수학식 40과 같이 수립하려고 할 때,
Figure pat00198
베이즈정리를 이용하여 회귀계수를 추정하고자 하면 사전분포, 가능도함수, 주변부분포를 계산해야 한다. 만일 모든 회귀계수의 사전분포는 서로독립이고 모두 균일분포
Figure pat00199
를 따른다고 가정하고 가능도 함수에는 위 모형을 대입하면 균일분포와 정규분포의 정의를 통해 사전분포는 다음 수학식 41과 같이(S202), 가능도함수는 다음 수학식 42와 같이(S201) 계산할 수 있다.
Figure pat00200
Figure pat00201
주변부분포를 직접 계산하기 위해서는 아래 수학식 43과 같이 추정하고자 하는 모든 회귀계수들에 대해 적분을 계산해야 하는데 이는 통상 매우 어려운 것으로 알려져 있다.
Figure pat00202
따라서, 주변부분포에 대한 직접계산 없이 간접적으로라도 사후분포를 구할 방법이 필요한데 대표적인 방법은 마코프 사슬 몬테카를로(Markov Chain Monte Carlo, MCMC)이다(S203).
마코프과정(Markov Process)이란 마코프 성질(Markov Property)을 갖는 확률과정(Stochastic Process)을 의미한다. 이때 확률과정에서
Figure pat00203
가 취하는 값을 상태(state)라고 하고, 상태들의 전체모임을 상태공간(state space)라 한다. 만일 아래 수학식 44와 같이
Figure pat00204
은 오로직
Figure pat00205
에만 의존하고
Figure pat00206
에 의존하지 않을 때 이 성질을 마코프 성질이라 하고 이런 성질을 갖는 확률과정을 마코프과정이라 하며 상태공간이 이산형인 마코프과정을 마코프 사슬(Markov chain)이라 부른다.
Figure pat00207
즉, 마코프 성질은 “과거와 현재의 정보가 주어질 때 미래에 관한 조건부분포는 현재의 정보에만 의존하며, 과거의 정보와는 무관하다.”는 것이다. 또한, 위에서 상태 i에서 상태 j로 변화될 확률을 추이확률(transition probability)이라 하고 상태변화에 소요되는 기간에 따라 아래 수학식 45와 구분하여 같이 정의한다.
Figure pat00208
Figure pat00209
상태 i
Figure pat00210
에서 1단계 후에 상태 j로 변화될 확률을 원소로 나타낸 아래 수학식 46의 행렬 P를 추이확률행렬(transition probability matrix)이라고 한다.
Figure pat00211
만일 상태 i에서 상태 j로 변화할 수 있고, 그 반대 역시 가능하면 두 상태는 서로도달가능(communicate)라고 하며, 모든 상태가 서로도달 가능할 수 있는 마코프 사슬을 약분불능(irreducible)이라고 한다. 또한, 상태 i에서 시작한 마코프 연쇄 확률과정 중 결국 다시 상태 i로 돌아올 확률이 1이면 재귀적(recurrent)이라고 한다.
상태 i가 재귀적이면서 j와 서로도달가능하면 i에서 출발한 마코프 사슬이 j에 도달할 확률은 1이다. 이는 i가 재귀적이면 마코프 사슬은 시간이 지남에 따라 i를 지속방문하고 그 때마다
Figure pat00212
의 확률로 j에 도달할 기회를 갖기 때문에 결국 j를 유한번의 시간내에 방문하게 된다. 이를 통해 마코프 체인이 약분불가, 즉 모든 상태가 서로도달가능할 때, 이 중 한 상태가 재귀적이면 결국 모든 상태가 재귀적이 됨을 알 수 있다.
마코프 체인이 약분불가이고 재귀적이며 j를 떠났다가 j로 다시 돌아올 때까지 걸리는 평균 시간을
Figure pat00213
이라고 하면 극한의 시간에서 마코프 사슬이 j상태에 머무르는 비율(Long run proportion)
Figure pat00214
를 불변확률분포(invariant probability distribution)라 부르고 초기상태에 관계없이
Figure pat00215
이다.
위의 관계가 성립하는 이유는 다음과 같다. 마코프 사슬이 임의의 초기 상태 i에서 출발하여 j로 돌아올 시간을
Figure pat00216
이라하고, j에서 출발하여 j까지 돌아오는데 걸리는 추가시간을
Figure pat00217
라고 하며 또 다시 j에서 출발하여 j까지 돌아오는데 걸리는 추가시간을
Figure pat00218
라고 한다면 장기적으로 j를 n번 방문하는데 소요된 시간은
Figure pat00219
이다. 이때
Figure pat00220
Figure pat00221
에 소요된 유한의 시간이고,
Figure pat00222
Figure pat00223
에 소요된 유한의 시간들로 평균은
Figure pat00224
이며, 결국
Figure pat00225
는 j를 방문한 횟수 n을, n번 방문하는데 걸린시간
Figure pat00226
로 나눈 값이므로 다음 수학식 47과 같이 장기적으로
Figure pat00227
이 성립함을 알 수 있다.
Figure pat00228
Figure pat00229
이 때,
Figure pat00230
즉,
Figure pat00231
이면 양의 재귀(positive recurrent)상태라 하고
Figure pat00232
즉,
Figure pat00233
이면 영의 재귀상태(null recurrent)라 하며 다음의 정리가 성립한다.
마코프 연쇄에서 상태 i가 양의 재귀이고 이고 j와 서로도달가능하면 j도 양의 재귀상태이다. 왜냐하면 상태 i가 양의 재귀이므로
Figure pat00234
이고, i와 j가 서로도달 가능하므로
Figure pat00235
인 n이 있다. 0보다 큰 두 수를 곱하면 0보다 크므로
Figure pat00236
이다.
Figure pat00237
는 마코프 사슬이 장기적으로 상태 i에서 n번의 시간후에 상태 j에 도달할 비율이므로 마코프 사슬이 장기적으로 상태 j에 머물 비율보다 클 수 없다. 즉, 아래 수학식 48이 성립하므로 상태 j역시 양의 재귀적이다.
Figure pat00238
이를 통해 마코프 사슬이 약분불가이고 이 중 한 상태가 양의 재귀이면 결국 모든 상태가 양의 재귀적이 됨을 알 수 있다.
또한,
Figure pat00239
는 장기적으로 상태 i에서 상태 j로 변화할 비율이므로 아래 수학식 49와 같이 모든 i에 대해서
Figure pat00240
를 각각 더해준다면 이는 장기적으로 마코프 사슬이 상태 j에 머무를 비율이 된다.
Figure pat00241
만일 마코프 연쇄가 약분불능이고 양의 재귀라면 불변확률분포
Figure pat00242
는 다음 수학식 50의 방정식을 만족하는 유일한 해로 알려져 있다.
Figure pat00243
Figure pat00244
위의 결과를 이용하면 다음의 수학식 51의 방정식을 만족하는
Figure pat00245
Figure pat00246
임을 알 수 있다.
Figure pat00247
왜냐하면 위의 두 식을 각각 모든 i에 대해 더해줄 경우 아래의 수학식 52가 성립하여 상기 수학식 50과 같은 형태가 되기 때문이다.
Figure pat00248
베이즈 정리를 통해 구하고자 하는 사후분포
Figure pat00249
의 총합은 1이므로 아래의 수학식 53과 같은 추이행렬 P를 구성할 수 있다면 상기 수학식 51에 의해 이 마코프 사슬이 장기적으로 상태 i에 머무는 비율이 곧 사후확률분포
Figure pat00250
이다.
Figure pat00251
상기 수학식 53을 만족 할 수 있는 추이행렬을 구성하는 방법 중 하나가 메트로폴리스-헤이스팅스 알고리즘(Metropolis-Hastings algorithm)이다. 우선 약분불가 마코프 추이행렬 Q를 구성한다. 이는 제안분포라고 불리는데, qij의 확률로 상태 i를 상태 j로 변화시킬 것을 제안하기 때문이다. 이 제안은
Figure pat00252
의 확률로 수락되므로 상기 수학식 53은 아래 수학식 54와 같다.
Figure pat00253
Figure pat00254
를 다음 수학식 55와 같이 정의한다면 수학식 54는 아래와 같이 항상 성립함을 알 수 있다.
Figure pat00255
만일
Figure pat00256
이면,
Figure pat00257
이고 따라서 수학식 54는 성립한다.
반대로
Figure pat00258
이면,
Figure pat00259
이므로 역시 수학식 54가 성립한다.
추이확률 계산시 주변부 분포
Figure pat00260
는 약분되어 없어지므로 실제
Figure pat00261
계산은 다음 수학식 56과 같이 사전확률
Figure pat00262
과 가능도함수
Figure pat00263
만을 활용한다.
Figure pat00264
만일
Figure pat00265
와 같이 추정하고자 하는 확률변수가 여러개인 경우 효율적 마코프사슬을 구성하는 것이 중요하다. 예를 들어 마코프 사슬이 10,000회가 진행되는 동안, 대부분의 경우 제안분포가 거절되면 확률변수가 가질 수 있는 다양한 범위와 확률을 충분히 탐색할 수 없기 때문이다. 따라서 거절될 수 없는 제안분포를 생성하는 방법을 많이 쓰는데 이를 깁스 샘플링이라 한다.
확률벡터
Figure pat00266
는 사후분포
Figure pat00267
를 따른다고 할 때, 깁스샘플링은 우선
Figure pat00268
중 임의의 수를 선택한다. 선택한 수가 i라 하면 이후 확률변수 X를 다음 수학식 57과 같이 생성한다.
Figure pat00269
즉,
Figure pat00270
를 제외한 나머지 확률변수들은 현재상태로 고정한 상태에서의 조건부 확률을 통해
Figure pat00271
를 현상태
Figure pat00272
에서 다음상태
Figure pat00273
로 옮길 것을 제안한다. 즉, 현재상태가
Figure pat00274
일 때, 제안분포는
Figure pat00275
를 다음상태로 제안한다. 이상의 깁스 샘플러에 의한 제안분포는 다음 수학식 58과 같이 쓸 수 있다.
Figure pat00276
Figure pat00277
따라서 이 제안을 수락할 확률
Figure pat00278
에 수학식 58을 대입하면 아래 수학식 59와 같으므로 언제나 제안을 수락한다.
Figure pat00279
이상의 내용을 적용하여 동절기(11~3월) 구간의 제4 회귀모형(수요-수용력)의 회귀계수의 사후분포를 추정하기 위하여, 먼저 가능도 함수를 아래 수학식 60과 같이 설정한다(S201).
Figure pat00280
이때, 실제 계산시에는 소프트웨어 r의 poly함수를 이용하여 입력변수
Figure pat00281
,
Figure pat00282
,
Figure pat00283
를 직교화하여 사용하였다. 이는 다항회귀모형에서 발생할 수 있는 계산의 불안정성과 다중공선성을 해결하기 위함이다. 만일 입력변수 원값을 사용하면 마코프 사슬 몬테카를로 과정중 계산오류가 발생할 수 있고, 이를 해결하기 위해 입력변수를 표준화하여도 다중공선성은 남아 있어 회귀계수 사후분포가 여러 개의 피크값을 갖는 경우가 발생하여 추정값의 불확실성이 커진다.
각 회귀계수에 대한 사전분포는 서로 독립인 정규분포로 하여 아래 수학식 61과 같이 설정한다(S202).
Figure pat00284
Figure pat00285
Figure pat00286
Figure pat00287
,
Figure pat00288
에 대한 대략적인 값을 부여하기 위해 가능도함수를 최소제곱법으로 추정하면 아래 표 7과 같고,
Figure pat00289
에는
Figure pat00290
추정값을
Figure pat00291
에는
Figure pat00292
표준편차의 100배를 한 값을 부여한다.
회귀계수 추정값 표준편차 t 값 유의확률
Figure pat00293
8.55E-17 2.85E-02 0 1
Figure pat00294
1.03E+01 3.48E-01 29.466 <2e-16
Figure pat00295
4.88E+00 3.48E-01 13.992 <2e-16
Figure pat00296
-1.11E+00 3.48E-01 -3.197 0.0017
Figure pat00297
,
Figure pat00298
에 적절한 값을 부여하기 위해 입력변수를 크기순으로 15그룹으로 나누고 그룹별 입력변수의 평균을 입력변수로 하고 그룹별 표준편차를 반응변수로 하여 단순선형회귀 모형을 수립하고 이를 최소제곱법을 구하면 아래 표 8과 같고,
Figure pat00299
에는
Figure pat00300
추정값을
Figure pat00301
에는
Figure pat00302
표준편차의 100배를 한 값을 부여한다.
회귀계수 추정값 표준편차 t 값 유의확률
Figure pat00303
0.36132 0.03838 9.415 3.61E-07
Figure pat00304
1.68752 0.51537 3.274 0.00604
이후 마코프 사슬 몬테카를로 방법을 시행하되 처음 5,000회는 burn-in 기간으로 하여 버리고 이 후 30,000회의 표본추출을 통해 각 회귀변수의 사후분포를 추정한다(S203).
이렇게 추출한 제3 회귀모형(기온-수요), 제4 회귀모형(수요-수용력), 제5 회귀모형(수요-시설이용률) 회귀계수들을 이용하여 난수를 발생시키고 시기별로 수용력과 시설이용률을 비교하여 필요한 각종 통계량을 산출한다.
상술한 과정을 따르면, 제3 회귀모형(기온-수요) 및 제4 회귀모형(수요-수용력)의 가능도함수는 아래 수학식 62와 같이 설정하고, 각 회귀계수에 대한 사전분포는 아래 수학식 63과 같이 서로 독립인 정규분포를 부여한다.
Figure pat00305
Figure pat00306
Figure pat00307
Figure pat00308
이 때,
Figure pat00309
은 정규분포,
Figure pat00310
,
Figure pat00311
는 제3 회귀모형(기온-수요)에서는 기온과 수요, 제4 회귀모형(수요-수용력)에서는 수요와 수용력을 의미하고
Figure pat00312
는 모두 직교화하여 사용한다.
또한, 제5 회귀모형(수요-시설이용률)의 가능도함수는 아래 수학식 64와 같이 설정하고, 각 회귀계수에 대한 사전분포는 아래 수학식 65과 같이 서로 독립인 정규분포를 부여한다.
Figure pat00313
Figure pat00314
는 베타분포이고
Figure pat00315
는 가능도 함수의 평균으로
Figure pat00316
이며
Figure pat00317
는 가능도 함수의 표준편차로
Figure pat00318
이다.
Figure pat00319
Figure pat00320
Figure pat00321
도 8은 본 발명의 일실시예에 따른 하절기 구간의 제4 회귀모형의 회귀계수 추정을 나타낸 도면이다.
마코프 사슬 몬테카를로 시행시 burn-in 5,000회를 시행한 후 30,000개의 표본을 발생시켜 회귀계수를 추정한다. 회귀계수는 단일값이 아닌 사후분포로 구해진다. 반응변수를 표준화하여 마코프 사슬 몬테카를로를 시행하고 제3 회귀모형(기온-수요) 및 제4 회귀모형(수요-수용력)의 회귀계수 사후분포의 평균을 구하면 아래 표 7와 같고 좀 더 구체적으로 하절기(4~11월) 구간의 제4 회귀모형(수요-수용력)의 회귀계수
Figure pat00322
를 추정하는 과정은 도 8과 같다. 제5 회귀모형(수요-시설이용률)의 회귀모형은 가스 직도입 사업자의 영업비밀에 속하는 것으로 구체적인 모형은 미기재한다.
계수명 기온-수요모형 수요-수용력모형
평일 토요일 휴일 4~11월 12~3월
Figure pat00323
0 0 0 0 0
Figure pat00324
-14.490 -6.487 -7.494 12.767 10.265
Figure pat00325
3.443 1.629 1.762 -3.313 4.962
Figure pat00326
1.954 0.711 0.592 해당없음 -0.601
Figure pat00327
0.279 -0.302 -0.391 0.441 0.354
Figure pat00328
0.280 0.309 -0.095 0.011 0.854
상술한 과정(S230, S240 및 S250)을 이용하여 제3, 제4, 및 제5 회귀모형을 수립한 후, 가스 배관망(10)의 장기 운영에 필요한 장기정보를 제공하는 정보제공단계를 수행한다(S300b). 정보제공단계(S300b)에서, 제3 회귀모형에 향후 장기간의 기온을 대표할 수 있는 지난 30년간의 평년기온을 대입하여 수요를 예측하고, 제3 회귀모형을 이용하여 예측한 수요를 제4 및 제5 회귀모형에 입력해 수용력과 시설이용률을 예측할 수 있다. 정보제공단계(S300b)는 제4 회귀모형을 이용하여 예측된 가스 배관망(10)의 가스 공급 지점의 수용능력과, 가스 직도입 사업자의 계약용량에 상기 제5 회귀모형을 이용하여 예측된 시설이용률을 곱하여 산출되는 인입예상량을 비교하여, 가스 인입 제한일 및 가스 추가인입 가능일을 산출하여 장기정보를 제공할 수 있다.
제3 회귀모형(기온-수요), 제4 회귀모형(수요-수용력), 제5 회귀모형(수요-시설이용률)모형의 사후분포를 이용하여 10,000개의 난수를 발생시키고 시설이용률과 계약용량을 이용하여 가스 인입 예상량을 산출하고, 가스 인입 예상량과 수용력을 비교하면 현재 계약용량에서의 가스 인입 제한일 및 가스 추가인입 가능일 소요기간의 95%신뢰구간은 17~43일로 산출된다. 회귀모형을 통해 예측한 가스 인입 가능일 및 제한일과 실제 가스 인입 가능일 및 제한일을 비교하면, 실제 2018.1~2018.9까지 가스 인입 제한일은 20일이므로 모형은 적용 가능해 보인다. 따라서, 가스 배관망(10) 운영주체와 가스 직도입 사업자는 연간 가스 인입 가능일 및 제한일 예측값을 제공받아 의사결정에 참조할 수 있다.
또한, 수요, 시설이용률, 수용력은 변화할 수 있으므로 변화의 수준 및 이에 대한 확신의 정도를 사전분포로 표현하면 이에 따라 가스 인입 가능일 및 제한일이 어떻게 변화하는지 분석할 수 있다. 예를 들어 시설이용률이 5% 증가한다고 강하게 믿는 경우 가스 인입 가능일 및 제한일은 20~47일 소요된다. 여기에서 시설이용률 5% 증가는 다항회귀모형의 절편계수에 0.05를 더하고, 강하게 믿는 정도는 사전분포의 표준편차를 다시 100으로 나눔으로써 반영하였다.
향후 계약용량 증가시 영향은 예측한 시설이용률에 해당 계약용량을 곱하여 위의 과정을 반복하면 95% 신뢰도로 연중 반 이상인 154~222일이 인입제한 및 반환일로 소요되는 1.74까지(표준화값)가 계약용량의 한계로 추정된다.
도 9는 본 발명의 일실시예에 따른 가스 배관망(10)에 연결된 가스 공급 지점의 시기별 예상 여유수용력을 나타낸 도면이다.
시기별로 가스수용여유(수용력-인입예상량)를 예측하면 도 9과 같다. 도 8에서 곡선형태의 실선은 평균여유수용력, 수평실선은 원자료 기준 여유수용력 0에 해당하고 상, 하한 점섬은 각각 신뢰도 95%, 5% 구간을 의미한다. 이러한 가스수용여유를 예측한 운영정보는 민간 가스 직도입 사업자가 LNG 계약, 입항시기 관련 의사결정을 내리는데 도움이 된다.
상술한 본 발명의 일실시예에 따른 가스 배관망(10) 운영정보 제공방법은, 단기적으로 몇시간 이후의 가스 배관망(10)의 적정 평균압력을 예측하고, 적정 평균압력에 도달하기 위한 가스 인입량에 관한 정보를 제공할 수 있으므로, 관리자가 가스 배관망(10)을 관리하는데 도움을 준다. 또한, 장기적으로 연간 가스 수요와 배관망의 수용력과 가스 직도입 사업자의 시설이용률을 예측하고 이를 이용하여 가스 인입 가능일과 제한일에 관한 정보를 제공할 수 있으므로, 가스 배관망(10) 운영주체와 가스 직도입 사업자가 가스 직도입에 관한 의사결정을 하는데 도움을 준다.
상술한 본 발명의 일실시예에 따른 가스 배관망(10) 운영정보 제공방법은, 컴퓨터 프로그램 코드로 작성되어 저장장치에 저장될 수 있고 프로세서에 의해 실행되어 운영정보를 생성하고 디스플레이 등의 표시장치를 통하여 관리자에게 운영정보를 제공할 수 있다.
이상 본 발명을 구체적인 실시예를 통하여 상세히 설명하였으나, 이는 본 발명을 구체적으로 설명하기 위한 것으로, 본 발명은 이에 한정되지 않으며, 본 발명의 기술적 사상 내에서 당해 분야의 통상의 지식을 가진 자에 의해 그 변형이나 개량이 가능함은 명백하다고 할 것이다.
본 발명의 단순한 변형 내지 변경은 모두 본 발명의 영역에 속하는 것으로 본 발명의 구체적인 보호 범위는 첨부된 특허청구범위에 의하여 명확해질 것이다.
10: 가스 배관망
Pm: 주배관
Ps: 부배관
Fout: 수용가
Fin: 가스 인입 시설

Claims (8)

  1. 가스 배관망의 복수의 지점에서 측정된 상태정보를 수집하여 데이터베이스화하는 상태정보 수집단계;
    상기 상태정보에 기초하여, 입력변수를 선택하고 회귀계수를 추정하여 회귀모형을 수립하는 모형수립단계; 및
    상기 회귀모형을 이용하여 상기 가스 배관망의 운영에 필요한 운영정보를 제공하는 정보제공단계를 포함하는, 가스 배관망 운영정보 제공방법.
  2. 청구항 1에 있어서,
    상기 상태정보는
    상기 가스 배관망의 복수의 지점에서 시간대별 압력, 수요, 최대수요, 최소수요, 가스 인입량, 상기 복수의 지점에서의 평균압력, 기온 중에서 적어도 하나 이상의 항목을 포함하는, 가스 배관망 운영정보 제공방법.
  3. 청구항 1에 있어서,
    상기 모형수립단계는
    특정 시점에서 상기 복수의 지점들의 평균압력을 예측하는 제1 회귀모형을 수립하기 위하여, 상기 상태정보에 포함된 개별 항목 또는 서로 선형관계가 있는 항목들의 조합을 예비입력변수로 하고 모든 가능한 회귀(All Possible Regression) 방법을 이용하여 상기 예비입력변수 중에서 입력변수를 선정하고 최소제곱법을 이용하여 회귀계수를 추정하여 상기 제1 회귀모형을 수립하는 제1 회귀모형 수립단계; 및
    상기 제1 회귀모형에 의해 예측되는 상기 특정 시점의 평균압력을 달성하기 위하여 상기 가스 배관망에 공급해야 하는 가스 인입량을 예측하는 제2 회귀모형을 수립하기 위하여, 상기 상태정보에 포함된 시간대별 평균압력 변화를 입력변수로 하고 가스 충진량 변화를 종속변수로 하는 회귀모형을 수립하는 제2 회귀모형 수립단계를 포함하는, 가스 배관망 운영정보 제공방법.
  4. 청구항 3에 있어서,
    상기 정보제공단계는
    상기 제1 회귀모형에서 상기 입력변수가 종속변수에 미치는 영향의 정도가 비교되도록, 상기 입력변수로 선택된 항목들을 표준화하여 제공하는 변환정보 제공단계; 및
    상기 특정 시점에서 상기 제1 회귀모형에 의해 예측된 평균압력을 달성하기 위하여, 상기 제2 회귀모형을 이용하여 상기 가스 충진량 변화를 예측하여 제공하는 공급정보 제공단계를 포함하는, 가스 배관망 운영정보 제공방법.
  5. 청구항 3에 있어서,
    상기 제1 회귀모형 수립단계는
    관리자의 근무교대시와 하루 중 평균압력 최고시를 기준시점으로 하루를 적어도 두개 이상의 구간으로 구분하고, 상기 구간마다 상기 제1 회귀모형을 수립하여 상기 구간을 구분하는 기준시점에서 상기 평균압력을 예측하는, 가스 배관망 운영정보 제공방법.
  6. 청구항 2에 있어서,
    상기 모형수립단계는
    상기 가스 배관망의 연간 수요를 예측하는 제3 회귀모형을 수립하기 위하여, 기온을 입력변수로 하고 베이즈 정리를 이용하여 회귀계수를 추정하여 상기 제3 회귀모형을 수립하는 제3 회귀모형 수립단계;
    상기 가스 배관망의 가스 공급 지점의 수용능력을 예측하는 제4 회귀모형을 수립하기 위하여, 가스 수요를 입력변수로 하고 베이즈 정리를 이용하여 회귀계수를 추정하여 상기 제4 회귀모형을 수립하는 제4 회귀모형 수립단계; 및
    가스 직도입 사업자의 연간 시설이용률을 예측하는 제5 회귀모형을 수립하기 위하여, 가스 수요를 입력변수로 하고 베이즈 정리를 이용하여 회귀계수를 추정하여 상기 제5 회귀모형을 수립하는 제5 회귀모형 수립단계를 포함하는, 가스 배관망 운영정보 제공방법.
  7. 청구항 6에 있어서,
    상기 정보제공단계는
    상기 제4 회귀모형을 이용하여 예측된 상기 가스 배관망의 가스 공급 지점의 수용능력과, 상기 가스 직도입 사업자의 계약용량에 상기 제5 회귀모형을 이용하여 예측된 상기 시설이용률을 곱하여 산출되는 인입예상량을 비교하여, 가스 인입 제한일 및 가스 추가인입 가능일을 산출하여 장기정보를 제공하는 것인, 가스 배관망 운영정보 제공방법.
  8. 청구항 6에 있어서,
    상기 제3 회귀모형 수립단계 및 제5 회귀모형 수립단계는
    평일, 토요일, 일요일(공휴일 포함)로 구간을 구분하고, 구간마다 회귀모형을 각각 수립하며,
    상기 제4 회귀모형 수립단계는
    하절기와 동절기로 구간을 구분하고, 구간마다 회귀모형을 각각 수립하는, 가스 배관망 운영정보 제공방법.
KR1020180151785A 2018-11-30 2018-11-30 통계적 학습을 통한 가스 배관망 운영정보 제공방법 KR102139706B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020180151785A KR102139706B1 (ko) 2018-11-30 2018-11-30 통계적 학습을 통한 가스 배관망 운영정보 제공방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020180151785A KR102139706B1 (ko) 2018-11-30 2018-11-30 통계적 학습을 통한 가스 배관망 운영정보 제공방법

Publications (2)

Publication Number Publication Date
KR20200065386A true KR20200065386A (ko) 2020-06-09
KR102139706B1 KR102139706B1 (ko) 2020-07-31

Family

ID=71082680

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020180151785A KR102139706B1 (ko) 2018-11-30 2018-11-30 통계적 학습을 통한 가스 배관망 운영정보 제공방법

Country Status (1)

Country Link
KR (1) KR102139706B1 (ko)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113129164A (zh) * 2021-04-13 2021-07-16 中海石油气电集团有限责任公司 一种天然气管网天然气流量压力调度决策指标的计算方法
KR20220120893A (ko) * 2021-02-24 2022-08-31 한국가스공사 확률론적 분석방법을 이용한 천연가스 공급 안정성 평가방법
KR20230081202A (ko) 2021-11-30 2023-06-07 한국가스공사 동적계획법과 실물옵션을 활용한 국내 lng 터미널 저장가치 측정방법

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2752147B2 (ja) * 1989-04-11 1998-05-18 株式会社東芝 配水管網制御装置
JP2000265184A (ja) 1999-03-15 2000-09-26 Yokogawa Electric Corp 都市ガスの安定供給装置
KR20120036569A (ko) * 2010-10-08 2012-04-18 주식회사 케이디파워 최소자승법을 적용한 에너지 예측 방법
KR20180006094A (ko) * 2016-07-08 2018-01-17 코오롱엔솔루션 주식회사 상수관망에서 회귀분석을 통한 최적 운전모드 제시방법

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2752147B2 (ja) * 1989-04-11 1998-05-18 株式会社東芝 配水管網制御装置
JP2000265184A (ja) 1999-03-15 2000-09-26 Yokogawa Electric Corp 都市ガスの安定供給装置
KR20120036569A (ko) * 2010-10-08 2012-04-18 주식회사 케이디파워 최소자승법을 적용한 에너지 예측 방법
KR20180006094A (ko) * 2016-07-08 2018-01-17 코오롱엔솔루션 주식회사 상수관망에서 회귀분석을 통한 최적 운전모드 제시방법

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20220120893A (ko) * 2021-02-24 2022-08-31 한국가스공사 확률론적 분석방법을 이용한 천연가스 공급 안정성 평가방법
CN113129164A (zh) * 2021-04-13 2021-07-16 中海石油气电集团有限责任公司 一种天然气管网天然气流量压力调度决策指标的计算方法
CN113129164B (zh) * 2021-04-13 2024-02-02 中海石油气电集团有限责任公司 一种天然气管网天然气流量压力调度决策指标的计算方法
KR20230081202A (ko) 2021-11-30 2023-06-07 한국가스공사 동적계획법과 실물옵션을 활용한 국내 lng 터미널 저장가치 측정방법

Also Published As

Publication number Publication date
KR102139706B1 (ko) 2020-07-31

Similar Documents

Publication Publication Date Title
US10739741B2 (en) Systems and methods for detecting changes in energy usage in a building
US10325331B2 (en) Systems and methods for measuring and verifying energy usage in a building
US9575475B2 (en) Systems and methods for generating an energy usage model for a building
Kang et al. Real-time demand estimation and confidence limit analysis for water distribution systems
US9196009B2 (en) Systems and methods for detecting changes in energy usage in a building
Palau et al. Burst detection in water networks using principal component analysis
KR102139706B1 (ko) 통계적 학습을 통한 가스 배관망 운영정보 제공방법
Xu et al. Multivariate degradation modeling of smart electricity meter with multiple performance characteristics via vine copulas
Kang et al. Optimal meter placement for water distribution system state estimation
CN111476441A (zh) 一种电动汽车充电设备负荷预测方法及相关装置
CN109271319A (zh) 一种基于面板数据分析的软件故障的预测方法
Rocha et al. Forecasting emergency department admissions
CN116091118A (zh) 电价预测方法、装置、设备、介质及产品
Hosseini et al. A flexible forecasting model for production systems
Eckman et al. Plausible screening using functional properties for simulations with large solution spaces
CN110222905A (zh) 一种预测人流量的方法及装置
JP2004023114A (ja) 通信トラヒック予測方法およびその装置
CN116401601B (zh) 基于逻辑回归模型的停电敏感用户处置方法
Garratt et al. Real time representation of the UK output gap in the presence of model uncertainty
He et al. Sequential Bayesian planning for accelerated degradation tests considering sensor degradation
CN117827593A (zh) 一种基于异常识别结果确定异常原因的方法和系统
Grenyer et al. An Uncertainty Quantification and Aggregation Framework for System Performance Assessment in Industrial Maintenance
Lewitschnig et al. Quality control of lifetime drift effects
Currie Analysing output from stochastic computer simulations: An overview
Reade et al. Modelling household electricity consumption in eThekwini municipality

Legal Events

Date Code Title Description
E90F Notification of reason for final refusal
E701 Decision to grant or registration of patent right