KR102139706B1 - Method for providing gas pipeline control information through statistical learning - Google Patents

Method for providing gas pipeline control information through statistical learning Download PDF

Info

Publication number
KR102139706B1
KR102139706B1 KR1020180151785A KR20180151785A KR102139706B1 KR 102139706 B1 KR102139706 B1 KR 102139706B1 KR 1020180151785 A KR1020180151785 A KR 1020180151785A KR 20180151785 A KR20180151785 A KR 20180151785A KR 102139706 B1 KR102139706 B1 KR 102139706B1
Authority
KR
South Korea
Prior art keywords
gas
regression model
regression
model
demand
Prior art date
Application number
KR1020180151785A
Other languages
Korean (ko)
Other versions
KR20200065386A (en
Inventor
심규하
김순재
이혁
김상수
김무현
Original Assignee
한국가스공사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국가스공사 filed Critical 한국가스공사
Priority to KR1020180151785A priority Critical patent/KR102139706B1/en
Publication of KR20200065386A publication Critical patent/KR20200065386A/en
Application granted granted Critical
Publication of KR102139706B1 publication Critical patent/KR102139706B1/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/06Electricity, gas or water supply
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"

Abstract

본 발명의 일실시예는, 가스 배관망의 복수의 지점에서 측정된 상태정보를 수집하여 데이터베이스화하는 상태정보 수집단계, 상기 상태정보에 기초하여, 입력변수를 선택하고 회귀계수를 추정하여 회귀모형을 수립하는 모형수립단계, 및 상기 회귀모형을 이용하여 상기 가스 배관망의 운영에 필요한 운영정보를 제공하는 정보제공단계를 포함하는, 가스 배관망 운영정보 제공방법을 제공하여, 가스 배관망 운영의 안전성, 안정성 및 경제성을 향상시킬 수 있다.According to an embodiment of the present invention, a state information collection step of collecting and database state information measured at a plurality of points in a gas pipeline network, based on the state information, selecting an input variable and estimating a regression coefficient to obtain a regression model. Providing a method for providing gas pipeline network operation information, including a model establishment step for establishing, and an information providing step for providing operation information necessary for operation of the gas pipeline network using the regression model. Economics can be improved.

Description

통계적 학습을 통한 가스 배관망 운영정보 제공방법{Method for providing gas pipeline control information through statistical learning}Method for providing gas pipeline control information through statistical learning}

본 발명은 통계적 학습을 통한 가스 배관망 운영정보 제공방법에 관한 것이다. The present invention relates to a method for providing gas pipeline network operation information through statistical learning.

천연가스는 LNG선 등을 통하여 수입되고, 배관망을 통하여 각지의 수요처로 공급된다. 천연가스를 공급하는 배관망을 효율적이고 안전하게 운영하기 위해서는 가스수요를 예측하여 주배관의 압력을 적절히 유지하여야 한다. 만약 수요대비 압력이 높거나 낮으면 배관망 운영의 안전성, 안정성 및 경제성이 저하되는 문제가 발생할 수 있다. Natural gas is imported through LNG carriers, etc., and is supplied to various customers through pipe networks. In order to efficiently and safely operate the pipe network supplying natural gas, it is necessary to predict the gas demand and maintain the pressure of the main pipe properly. If the pressure is high or low compared to demand, the safety, stability, and economics of pipe network operation may be deteriorated.

주배관 압력의 적정 수준을 판단하고 조정하는 배관망 운영은 다양한 변수에 의해 영향을 받는다. 특히 연중 대부분의 기간에 발생하는 각종 배관망 변경 작업으로 주배관 압력분포가 수시로 변하기 때문에, 주배관 압력이 지나치게 높아지거나 낮아지는 문제가 발생한다. 주배관 압력의 급격한 변동은 배관망 운영의 안전성 또는 안정성을 저하시키며, 압력변화에 대응하기 위해 가스 송출량을 급감, 급증시키는 과정에서 가동단가가 높은 기기들을 추가 가동하게 되어 경제성까지 저하되는 문제가 발생한다.The operation of the pipe network to determine and adjust the appropriate level of main pipe pressure is influenced by various variables. In particular, the pressure distribution of the main pipe changes frequently due to various pipe network changes that occur in most periods of the year, resulting in a problem that the main pipe pressure becomes excessively high or low. Sudden fluctuations in the main pipe pressure deteriorate the safety or stability of the pipe network operation, and in order to cope with the pressure change, there is a problem in that the equipment with high operation cost is additionally operated in the process of rapidly reducing and rapidly increasing the gas delivery amount, thereby lowering economic efficiency.

한편, 가스 직도입 사업자들이 배관망을 함께 이용하는 과정에서, 배관망에 가스를 인입하려면 관련 시설이 필요한데, 가스 인입 시설 중 보령기지가 연결된 배관망의 지역 압력이 과도하게 상승하는 문제가 발생한다. 이는 가스 직도입 사업자들의 가스 인출 지점은 전국에 분산되어 있으나, 인입 지점은 보령기지에 집중되어 있어 배관망의 수용력 대비 과도한 가스의 인입으로 병목현상이 발생하기 때문이다.On the other hand, in the process of gas direct introduction operators using the pipe network together, related facilities are required to draw gas into the pipe network, and a problem arises in that the local pressure of the pipe network connected to the Boryeong base is excessively increased. This is because the gas withdrawal points of gas direct import operators are distributed throughout the country, but the inflow point is concentrated in Boryeong base, causing bottlenecks due to excessive gas inflow compared to the capacity of the pipe network.

가스 직도입이 증가하면 인입 시설이 연결된 배관망 지역의 병목현상 및 압력상승은 더욱 심해질 것이다. 가스 인입에 의해 주배관의 압력이 한계에 도달하면 가스 직도입 사업자들의 가스인입을 제한하고, 제한된 가스는 병목현상이 심하지 않을 때, 추가인입을 통해 반환해야하는 과정이 수시로 발생할 것으로 예상된다. 따라서 가스 인입 시설의 이용을 위한 계약은 인입제한과 반환이 연중 원활히 시행 될 수 있는 범위에서 체결되어야 하나 이러한 범위에 대한 추정값이 없어 유관기관에서 계약 관련 의사결정을 하기 어려운 문제가 있다. As gas direct introduction increases, bottlenecks and pressure rises in the pipeline network where the incoming facilities are connected will become more severe. When the pressure of the main pipe reaches the limit due to gas inlet, it is expected that the process of requiring gas to be returned through additional intake will occur frequently when the gas intake of gas direct import operators is limited and the limited gas is not a bottleneck. Therefore, the contract for the use of the gas inlet facility should be concluded within the range in which the restriction and return of the gas can be smoothly implemented throughout the year, but there is no problem in making decisions regarding the contract by the related agencies because there is no estimate for this range.

JP 2000-265184 AJP 2000-265184 A

본 발명의 일실시예에 따른 목적은, 주배관의 평균압력을 예측하고 주배관의 평균압력을 조정하기 위하여 주배관에 공급해야 하는 가스 인입량을 예측할 수 있는 회귀모형을 수립하고 이용하여, 가스 배관망의 운영에 필요한 정보를 제공하는 방법 및 장치를 제공하기 위한 것이다.An object according to an embodiment of the present invention is to establish and use a regression model that can predict the average gas pressure to be supplied to the main pipe in order to predict the average pressure of the main pipe and to adjust the average pressure of the main pipe, to operate the gas pipeline network It is intended to provide a method and apparatus for providing necessary information.

또한, 본 발명의 일실시예에 따른 목적은, 가스 배관망에 연결된 가스 공급 지점의 수용능력, 가스 배관망의 연간 수요, 및 가스 직도입 사업자의 연간 시설이용률을 예측할 수 있는 회귀모형을 수립하고 이용하여, 가스 직도입 사업에 관련한 의사결정 및 가스 배관망의 운영에 필요한 정보를 제공하는 방법 및 장치를 제공하기 위한 것이다. In addition, the object according to an embodiment of the present invention, establishing and using a regression model that can predict the capacity of the gas supply point connected to the gas pipeline network, the annual demand of the gas pipeline network, and the annual facility utilization rate of the direct gas operator, It is intended to provide a method and apparatus for providing information necessary for decision-making related to the direct gas import business and operation of the gas pipeline network.

본 발명의 일실시예에 따른 가스 배관망 운영정보 제공방법은, 가스 배관망의 복수의 지점에서 측정된 상태정보를 수집하여 데이터베이스화하는 상태정보 수집단계, 상기 상태정보에 기초하여, 입력변수를 선택하고 회귀계수를 추정하여 회귀모형을 수립하는 모형수립단계, 및 상기 회귀모형을 이용하여 상기 가스 배관망의 운영에 필요한 운영정보를 제공하는 정보제공단계를 포함할 수 있다. According to an embodiment of the present invention, a method for providing operation information of a gas piping network is a state information collection step of collecting and databaseting state information measured at a plurality of points in a gas piping network, and selecting an input variable based on the state information. A model establishment step of establishing a regression model by estimating a regression coefficient, and an information providing step of providing operation information necessary for the operation of the gas pipeline network using the regression model may be included.

또한, 상기 상태정보는 상기 가스 배관망의 복수의 지점에서 시간대별 압력, 수요, 최대수요, 최소수요, 가스 인입량, 상기 복수의 지점에서의 평균압력, 기온 중에서 적어도 하나 이상의 항목을 포함할 수 있다. In addition, the status information may include at least one item of pressure, demand, maximum demand, minimum demand, gas intake amount, average pressure at the plurality of points, and temperature at a plurality of points in the gas pipe network. .

또한, 상기 모형수립단계는 특정 시점에서 상기 복수의 지점들의 평균압력을 예측하는 제1 회귀모형을 수립하기 위하여, 상기 상태정보에 포함된 개별 항목 또는 서로 선형관계가 있는 항목들의 조합을 예비입력변수로 하고 모든 가능한 회귀(All Possible Regression) 방법을 이용하여 상기 예비입력변수 중에서 입력변수를 선정하고 최소제곱법을 이용하여 회귀계수를 추정하여 상기 제1 회귀모형을 수립하는 제1 회귀모형 수립단계, 및 상기 제1 회귀모형에 의해 예측되는 상기 특정 시점의 평균압력을 달성하기 위하여 상기 가스 배관망에 공급해야 하는 가스 인입량을 예측하는 제2 회귀모형을 수립하기 위하여, 상기 상태정보에 포함된 시간대별 평균압력 변화를 입력변수로 하고 가스 충진량 변화를 종속변수로 하는 회귀모형을 수립하는 제2 회귀모형 수립단계를 포함할 수 있다. In addition, the model establishing step is a preliminary input variable of a combination of individual items included in the state information or items having a linear relationship with each other in order to establish a first regression model predicting the average pressure of the plurality of points at a specific time point. A first regression model establishment step of establishing the first regression model by selecting an input variable from the preliminary input variables using all possible regression methods and estimating a regression coefficient using a least squares method, And time series included in the status information to establish a second regression model that predicts the amount of gas input to be supplied to the gas piping network in order to achieve the average pressure at the specific time point predicted by the first regression model. It may include a second regression model establishment step of establishing a regression model with an average pressure change as an input variable and a gas filling amount change as a dependent variable.

또한, 상기 정보제공단계는 상기 제1 회귀모형에서 상기 입력변수가 종속변수에 미치는 영향의 정도가 비교되도록, 상기 입력변수로 선택된 항목들을 표준화하여 제공하는 변환정보 제공단계, 및 상기 특정 시점에서 상기 제1 회귀모형에 의해 예측된 평균압력을 달성하기 위하여, 상기 제2 회귀모형을 이용하여 상기 가스 충진량 변화를 예측하여 제공하는 공급정보 제공단계를 포함할 수 있다. In addition, the information providing step is a conversion information providing step of standardizing and providing items selected as the input variable so that the degree of the effect of the input variable on the dependent variable in the first regression model is compared, and at the specific point in time In order to achieve the average pressure predicted by the first regression model, it may include a supply information provision step of predicting and providing a change in the gas filling amount using the second regression model.

또한, 상기 제1 회귀모형 수립단계는 관리자의 근무교대시와 하루 중 평균압력 최고시를 기준시점으로 하루를 적어도 두개 이상의 구간으로 구분하고, 상기 구간마다 상기 제1 회귀모형을 수립하여 상기 구간을 구분하는 기준시점에서 상기 평균압력을 예측할 수 있다. In addition, the first regression model establishment step divides the day into at least two or more sections based on the shift of the manager's work shift and the highest average pressure of the day, and establishes the first regression model for each section. The average pressure can be predicted at the reference point of division.

또한, 상기 모형수립단계는 상기 가스 배관망의 연간 수요를 예측하는 제3 회귀모형을 수립하기 위하여, 기온을 입력변수로 하고 베이즈 정리를 이용하여 회귀계수를 추정하여 상기 제3 회귀모형을 수립하는 제3 회귀모형 수립단계, 상기 가스 배관망의 가스 공급 지점의 수용능력을 예측하는 제4 회귀모형을 수립하기 위하여, 가스 수요를 입력변수로 하고 베이즈 정리를 이용하여 회귀계수를 추정하여 상기 제4 회귀모형을 수립하는 제4 회귀모형 수립단계, 및 가스 직도입 사업자의 연간 시설이용률을 예측하는 제5 회귀모형을 수립하기 위하여, 가스 수요를 입력변수로 하고 베이즈 정리를 이용하여 회귀계수를 추정하여 상기 제5 회귀모형을 수립하는 제5 회귀모형 수립단계를 포함할 수 있다. In addition, the model establishing step establishes the third regression model by estimating a regression coefficient using Bayes' theorem and temperature as an input variable to establish a third regression model for predicting the annual demand of the gas pipeline network. The third regression model establishment step, in order to establish a fourth regression model for predicting the capacity of the gas supply point of the gas piping network, the gas demand is used as an input variable and the Bayes' theorem is used to estimate the regression coefficient to obtain the fourth In order to establish the fourth regression model establishment step of establishing the regression model and the fifth regression model predicting the annual facility utilization rate of gas direct import operators, the gas demand is used as an input variable and the Bayes' theorem is used to estimate the regression coefficient. And a fifth regression model establishment step of establishing the fifth regression model.

또한, 상기 정보제공단계는 상기 제4 회귀모형을 이용하여 예측된 상기 가스 배관망의 가스 공급 지점의 수용능력과, 상기 가스 직도입 사업자의 계약용량에 상기 제5 회귀모형을 이용하여 예측된 상기 시설이용률을 곱하여 산출되는 인입예상량을 비교하여, 가스 인입 제한일 및 가스 추가인입 가능일을 산출하여 장기정보를 제공하는 것일 수 있다. In addition, the information provision step includes the capacity of the gas supply point of the gas pipeline network predicted using the fourth regression model, and the facility utilization rate predicted using the fifth regression model in the contract capacity of the direct gas supplier. It may be to provide long-term information by comparing the expected amount of input calculated by multiplying by and calculating the restriction date of gas input and the possible additional gas input date.

또한, 상기 제3 회귀모형 수립단계 및 제5 회귀모형 수립단계는 평일, 토요일, 일요일(공휴일 포함)로 구간을 구분하고, 구간마다 회귀모형을 각각 수립하며, 상기 제4 회귀모형 수립단계는 하절기와 동절기로 구간을 구분하고, 구간마다 회귀모형을 각각 수립할 수 있다. In addition, the third regression model establishment step and the fifth regression model establishment step are divided into sections on weekdays, Saturdays, and Sundays (including holidays), and each regression model is established for each section, and the fourth regression model establishment step is in the summer. In the winter season, sections can be divided, and regression models can be established for each section.

본 발명의 특징 및 이점들은 첨부도면에 의거한 다음의 상세한 설명으로 더욱 명백해질 것이다.Features and advantages of the present invention will become more apparent from the following detailed description based on the accompanying drawings.

이에 앞서 본 명세서 및 청구범위에 사용된 용어나 단어는 통상적이고 사전적인 의미로 해석되어서는 아니 되며, 발명자가 그 자신의 발명을 가장 최선의 방법으로 설명하기 위해 용어의 개념을 적절하게 정의할 수 있다는 원칙에 입각하여 본 발명의 기술적 사상에 부합되는 의미와 개념으로 해석되어야만 한다.Prior to this, the terms or words used in the specification and claims should not be interpreted in a conventional and lexical sense, and the inventor can appropriately define the concept of terms in order to best describe his or her invention. It should be interpreted as meaning and concept consistent with the technical idea of the present invention based on the principle of being there.

본 발명의 일실시예에 따르면, 가스 배관망의 계통변경 작업과 무관하게 주배관의 평균압력을 예측하고 주배관의 평균압력을 조정하기 위하여 주배관에 공급해야 하는 가스 인입량을 예측하여 가스 배관망의 운영정보를 제공하므로, 가스 배관망의 안전성, 안정성 및 경제성이 향상될 수 있다. According to an embodiment of the present invention, regardless of the system change operation of the gas piping network, predict the average pressure of the main piping and predict the amount of gas input to be supplied to the main piping to adjust the average pressure of the main piping, thereby operating information of the gas piping network. Since it provides, the safety, stability and economics of the gas pipeline network can be improved.

또한, 본 발명의 일실시예에 따르면, 가스 직도입 사업자가 가스 배관망 시설을 이용할 때, 가스를 인출한 양보다 적은 양의 가스를 인입하고 나머지를 인입하는 것이 제한되는 가스 인입 제한일과 인입할 수 없었던 나머지 가스를 추가로 인입할 수 있는 가스 추가인입 가능일과 같은 운영정보를 신뢰성 있게 예측하여 제공할 수 있다. In addition, according to an embodiment of the present invention, when a gas direct import operator uses a gas piping network facility, a gas intake limit date and a time limit in which gas is drawn in and less than the amount in which the gas is drawn out are restricted and the rest of the gas could not be introduced It is possible to reliably predict and provide operational information, such as the date when additional gas can be added, which can additionally draw in the remaining gas.

도 1은 가스 배관망을 개략적으로 나타낸 도면이다.
도 2는 본 발명의 일실시예에 따른 가스 배관망 운영정보 제공방법의 단계를 나타낸 흐름도이다.
도 3은 본 발명의 일실시예에 따른 가스 배관망 운영정보 제공방법의 세부 단계를 나타낸 흐름도이다.
도 4는 본 발명의 일실시예에 따른 제1 회귀모형의 오전구간 잔차도이다.
도 5는 본 발명의 일실시예에 따른 제1 회귀모형의 오후구간 잔차도이다.
도 6은 본 발명의 일실시예에 따른 제1 회귀모형의 새벽구간 잔차도이다.
도 7은 본 발명의 일실시예에 따른 가스 배관망 운영정보 제공방법의 세부 단계를 나타낸 흐름도이다.
도 8은 본 발명의 일실시예에 따른 하절기 구간의 제4 회귀모형의 회귀계수 추정을 나타낸 도면이다.
도 9는 본 발명의 일실시예에 따른 가스 배관망에 연결된 가스 공급 지점의 시기별 예상 여유수용력을 나타낸 도면이다.
1 is a view schematically showing a gas piping network.
2 is a flow chart showing the steps of the gas pipe network operating information providing method according to an embodiment of the present invention.
Figure 3 is a flow chart showing the detailed steps of the gas pipe network operating information providing method according to an embodiment of the present invention.
4 is a residual diagram of the morning section of the first regression model according to an embodiment of the present invention.
5 is a residual diagram of an afternoon section of a first regression model according to an embodiment of the present invention.
6 is a residual diagram of a dawn section of a first regression model according to an embodiment of the present invention.
7 is a flowchart illustrating detailed steps of a method for providing operation information of a gas piping network according to an embodiment of the present invention.
8 is a view showing an estimation of a regression coefficient of a fourth regression model in a summer section according to an embodiment of the present invention.
9 is a view showing estimated spare capacity for each time of a gas supply point connected to a gas piping network according to an embodiment of the present invention.

본 발명의 일실시예의 목적, 특정한 장점들 및 신규한 특징들은 첨부된 도면들과 연관되어지는 이하의 상세한 설명과 바람직한 실시예들로부터 더욱 명백해질 것이다. 본 명세서에서 각 도면의 구성요소들에 참조번호를 부가함에 있어서, 동일한 구성 요소들에 한해서는 비록 다른 도면상에 표시되더라도 가능한 한 동일한 번호를 가지도록 하고 있음에 유의하여야 한다. 또한, "일면", "타면", "제1", "제2" 등의 용어는 하나의 구성요소를 다른 구성요소로부터 구별하기 위해 사용되는 것으로, 구성요소가 상기 용어들에 의해 제한되는 것은 아니다. 이하, 본 발명의 일실시예를 설명함에 있어서, 본 발명의 일실시예의 요지를 불필요하게 흐릴 수 있는 관련된 공지 기술에 대한 상세한 설명은 생략한다. The objects, specific advantages and novel features of an embodiment of the present invention will become more apparent from the following detailed description and preferred embodiments associated with the accompanying drawings. In addition, it should be noted that, in addition to reference numerals to the components of each drawing in the present specification, the same components have the same numbers as possible, even if they are displayed on different drawings. In addition, the terms "one side", "other side", "first", "second", etc. are used to distinguish one component from another component, and the component is limited by the terms no. Hereinafter, in describing one embodiment of the present invention, detailed descriptions of related well-known technologies that may unnecessarily obscure the subject matter of one embodiment of the present invention are omitted.

이하, 첨부된 도면을 참조하여, 본 발명의 일실시예를 상세히 설명한다.Hereinafter, an embodiment of the present invention will be described in detail with reference to the accompanying drawings.

도 1은 가스 배관망(10)을 개략적으로 나타낸 도면이며, 도 2는 본 발명의 일실시예에 따른 가스 배관망(10) 운영정보 제공방법의 단계를 나타낸 흐름도이고, 도 3은 본 발명의 일실시예에 따른 가스 배관망(10) 운영정보 제공방법의 세부 단계를 나타낸 흐름도이다. 1 is a view schematically showing a gas piping network 10, and FIG. 2 is a flow chart showing steps of a method for providing operation information of a gas piping network 10 according to an embodiment of the present invention, and FIG. 3 is an embodiment of the present invention. It is a flow chart showing the detailed steps of the method for providing operation information of the gas piping network 10 according to an example.

도 1에 도시된 바와 같이, 가스 배관망(10)(Gas Pipeline)은 천연가스(Natural Gas)를 가정이나 기업 등의 수용가(Fout)로 수송하는 공급망을 말한다. 가스 배관망(10)은 주배관(Main Pileline, Pm)과 부배관(Sub Pipeline, Ps)으로 구분할 수 있다. 주배관(Pm)은 가스 인입 시설(Fin)이 연결되어 가스가 배관망으로 주입되는 비감압구간을 말하며, 부배관(Ps)은 고압인 주배관(Pm)으로부터 분기되어 가스를 저압으로 감압하여 수용가(Fout)로 공급하는 감압구간을 말한다. 이러한 가스 배관망(10)을 안정적이고 경제적으로 운영하기 위하여 본 발명의 일실시예는 입력변수와 추정하고자 하는 종속변수의 데이터가 있는 지도학습 방식의 통계학습을 이용하여 회귀모형을 수립하고, 수립된 회귀모형을 이용하여 가스 배관망(10)의 운영에 필요한 운영정보를 제공할 수 있다. As shown in FIG. 1, the gas pipeline 10 (Gas Pipeline) refers to a supply chain that transports natural gas (Natural Gas) to a consumer (Fout) of a home or business. The gas piping network 10 may be divided into a main pile (Main Pileline, Pm) and a sub-pipe (Sub Pipeline, Ps). The main pipe (Pm) refers to the non-decompression section where the gas inlet facility (Fin) is connected and the gas is injected into the pipe network, and the sub-pipe (Ps) is branched from the high-pressure main pipe (Pm) to decompress the gas to low pressure to accommodate the gas (Fout) It means the decompression section supplied by ). In order to operate the gas piping network 10 stably and economically, an embodiment of the present invention establishes a regression model using statistical learning of a supervised learning method having data of input variables and dependent variables to be estimated. Using the regression model, it is possible to provide operation information necessary for the operation of the gas piping network 10.

도 2에 도시된 바와 같이, 본 발명의 일실시예에 따른 가스 배관망(10) 운영정보 제공방법은, 가스 배관망(10)의 복수의 지점에서 측정된 상태정보를 수집하여 데이터베이스화하는 상태정보 수집단계(S100), 상태정보에 기초하여 입력변수를 선택하고 회귀계수를 추정하여 회귀모형을 수립하는 모형수립단계(S200), 및 회귀모형을 이용하여 상기 가스 배관망(10)의 운영에 필요한 운영정보를 제공하는 정보제공단계(S300)를 포함할 수 있다. As illustrated in FIG. 2, the method for providing operation information of the gas piping network 10 according to an embodiment of the present invention collects state information collected from a plurality of points of the gas piping network 10 and databased Step (S100), a model establishment step (S200) of selecting an input variable based on state information and estimating a regression coefficient to establish a regression model, and operation information required to operate the gas piping network 10 using the regression model It may include an information providing step (S300) for providing.

상태정보 수집단계(S100)는 가스 배관망(10)의 주배관(Pm) 또는 부배관(Ps)의 각 지점마다 설치되는 압력계, 유량계, 온도계 등의 각종 측정장치들이 실시간으로 측정한 값을 수집하여 데이터베이스화할 수 있다. 가스 배관망(10)의 각 지점은 가스 인입 시설(Fin), 주배관(Pm)과 부배관(Ps)의 분기점, 수용가(Fout) 등 가스 배관망(10)의 상태측정이 필요한 지점들을 포함한다. 상태정보는 가스 배관망(10)의 복수의 지점에서 시간대별 압력, 수요, 최대수요, 최소수요, 가스 인입량, 상기 복수의 지점에서의 평균압력, 기온 중에서 적어도 하나 이상의 항목을 포함할 수 있다. 상태정보는 상기 열거한 항목들 이외에 다양한 항목들을 더 포함할 수 있다. 상태정보 수집단계(S100)는 가스 배관망(10)의 지점별 시간대별 기온을 기상청으로부터 수집하여 데이터베이스화 할 수도 있다. In the state information collection step (S100), various measurement devices such as pressure gauges, flowmeters, and thermometers installed at each point of the main pipe (Pm) or sub-pipe (Ps) of the gas pipe network (10) collect and measure the data in real time. Can be angry. Each point of the gas piping network 10 includes points that require state measurement of the gas piping network 10, such as a gas inlet facility (Fin), a main pipe (Pm) and a sub-pipe (Ps) branching point, and an acceptor (Fout). The status information may include at least one item of pressure, demand, maximum demand, minimum demand, gas intake amount, average pressure at the plurality of points, and temperature at a plurality of points in the gas piping network 10. The status information may further include various items in addition to the items listed above. In the state information collection step (S100), the temperature of each gas pipeline network 10 can be collected and databased from the Korea Meteorological Administration.

모형수립단계(S200)는 상태정보에 기초하여 입력변수를 선택하고 회귀계수를 추정하여 회귀모형을 수립하는 단계이며, 단기 회귀모형(S200a)과 장기 회귀모형(S200b)을 수립할 수 있다. 먼저 단기 회귀모형 수립(S200a)을 설명한다. The model establishment step (S200) is a step of selecting an input variable based on state information and estimating a regression coefficient to establish a regression model, and may establish a short-term regression model (S200a) and a long-term regression model (S200b). First, the short-term regression model establishment (S200a) will be described.

가스 배관망(10) 운영은 통상 교대근무로 운영되므로, 가스 배관망(10)을 제어하는 관리자의 근무교대시와 하루 중 평균압력 최고시를 기준시점으로 하루를 적어도 두개 이상의 구간으로 구분할 수 있다. 예를 들어, 주배관(Pm)의 하루 중 평균압력 최고시가 06시이고 근무교대시가 08시, 15시, 21시 경우, 하루를 오전(08시~15시), 오후(15시~21시), 새벽(21시~06시)의 3개의 구간으로 구분할 수 있다. 근무교대시와 하루 중 평균압력 최고시가 다른 경우, 가스 배관망(10)의 최고 압력 한계를 초과하지 않기 위하여 하루 중 새벽 구간의 종료시점을 평균압력 최고시로 구분하는 것이 바람직할 수 있다. 이때, 06시부터 08시까지를 별도의 구간으로 구분하여 회귀모형을 수립할 수도 있고, 회귀모형을 수립하지 않고 평균압력 피크를 관리하는 구간으로 운영할 수도 있다. 또는, 새벽 구간의 종료시점을 06시로 구분한 경우, 오전 구간의 시작시점을 06시로 설정하여 오전(06시~15시), 오후(15시~21시), 새벽(21시~06시)의 3개의 구간으로 구분할 수도 있다.Since the operation of the gas piping network 10 is usually operated by shift work, it is possible to divide the day into at least two or more sections based on the shift of the manager who controls the gas piping network 10 and the highest average pressure during the day. For example, if the peak pressure of the main pipe (Pm) is at the highest average hour of the day at 06 o'clock and the shift time is at 8 o'clock, 15 o'clock, and 21 o'clock, the day is morning (08 a.m.-5 p.m.) City), and can be divided into three sections: early morning (21 o'clock to 6 o'clock). When the shift work and the maximum pressure during the day are different, it may be desirable to classify the end point of the dawn section of the day as the highest average pressure in order not to exceed the maximum pressure limit of the gas piping network 10. At this time, the regression model can be established by dividing the period from 06 to 08 into separate sections, or it can be operated as a section for managing the average pressure peak without establishing the regression model. Or, if the end point of the early morning section is divided into 06:00, the start time of the morning section is set to 06:00, and the morning (from 6:00 to 15:00), the afternoon (from 15:00 to 21:00), and the morning (from 21:00 to 06:00) It can also be divided into three sections.

가스 배관망(10)은 일부 구간의 신설이나 폐쇄 또는 노후 배관의 교체 등의 이유로 배관망의 일부를 차단, 폐쇄, 우회 또는 신설하는 등의 변경작업이 이루어진다. 이러한 각종 배관망 변경 작업은 주배관(Pm)의 압력분포를 수시로 변화시키고 주배관(Pm) 압력이 지나치게 높아지거나 낮아지는 문제를 발생시킬 수 있다. The gas piping network 10 is modified such as blocking, closing, bypassing, or establishing a part of the piping network due to the establishment or closing of some sections or replacement of old piping. Such various pipe network changes may cause a problem in which the pressure distribution of the main pipe (Pm) is frequently changed and the pressure of the main pipe (Pm) becomes too high or low.

이러한 배관망 변경이 가스 배관망(10) 운영에 미치는 영향을 최소화하기 위해 주배관(Pm)의 평균압력(MPa)을 예측하는 모형을 수립한다. 평균압력은 개별지점 압력과 달리 배관망 변경의 영향을 받지 않고 전국 가스 수요(ton/hour, t/h) 예측만 정확하다면, 전국 가스인입량(t/h)을 조정하여 약 99% 이상의 정확도로 조정가능하기 때문이다. 또한, 평균압력과 가스인입량의 관계는 다양한 유형의 배관망 변경에도 불구하고 신뢰할 수 있는 경향성을 가지므로 적정압력 지표로 적합하다.In order to minimize the effect of such a change on the pipe network on the operation of the gas pipe network 10, a model for predicting the average pressure (MPa) of the main pipe (Pm) is established. If the average pressure is not affected by changes in the pipe network and the national gas demand (ton/hour, t/h) prediction is accurate, unlike the individual point pressure, the national gas intake (t/h) is adjusted to achieve an accuracy of about 99% or more. Because it is adjustable. In addition, the relationship between the average pressure and the amount of gas input is suitable as an appropriate pressure index because it has a reliable tendency despite various types of pipe network changes.

본 발명의 일실시예는 주배관(Pm)의 적정 평균압력을 실시간으로 예측하기 위하여 지도학습의 선형회귀모형과 실시간 예측에 적합한 최소제곱법을 사용한다. One embodiment of the present invention uses a linear regression model of supervised learning and a least-squares method suitable for real-time prediction to predict in real time the appropriate average pressure of the main pipe (Pm).

도 3에 도시된 바와 같이, 모형수립단계는 특정 시점에서 가스 배관망(10)의 복수의 지점들의 평균압력을 예측하는 제1 회귀모형을 수립하기 위하여, 상태정보에 포함된 개별 항목 또는 서로 선형관계가 있는 항목들의 조합을 예비입력변수로 하고 모든 가능한 회귀(All Possible Regression) 방법을 이용하여 예비입력변수 중에서 입력변수를 선정하고 최소제곱법을 이용하여 회귀계수를 추정하여 제1 회귀모형을 수립하는 제1 회귀모형 수립단계(S210), 및 제1 회귀모형에 의해 예측되는 특정 시점의 평균압력을 달성하기 위하여 가스 배관망(10)에 공급해야 하는 가스 인입량을 예측하는 제2 회귀모형을 수립하기 위하여, 상태정보에 포함된 시간대별 평균압력 변화를 입력변수로 하고 가스 인입량 변화를 종속변수로 하는 회귀모형을 수립하는 제2 회귀모형 수립단계(S220)를 포함할 수 있다. 여기에서 특정 시점은 하루를 적어도 둘 이상으로 구분하는 구간의 종료시일 수 있다. As shown in FIG. 3, in the model establishment step, in order to establish a first regression model for predicting the average pressure of a plurality of points of the gas piping network 10 at a specific time point, individual items included in the state information or linear relationships with each other The first regression model is established by selecting the input variable from the preliminary input variables using all possible regression methods, and using the least squares method to estimate the regression coefficients. Establishing a first regression model (S210), and establishing a second regression model predicting the amount of gas input to be supplied to the gas piping network 10 in order to achieve an average pressure at a specific time point predicted by the first regression model To this end, a second regression model establishment step (S220) of establishing a regression model having a change in average pressure for each time period included in the state information as an input variable and a change in gas inflow as a dependent variable may be included. Here, the specific time point may be the end time of a section dividing the day into at least two or more.

제1 회귀모형 수립단계(S210)는, 모든 가능한 회귀방법을 이용하여 다양한 예비입력변수 중에서 다양한 입력변수 조합의 회귀모형들을 생성하고 회귀모형들마다 최소제곱법을 이용하여 회귀계수를 추정하며 조정된 결정계수 지표를 이용하여 하나의 회귀모형을 선정하는 모형선정 단계(S211), 선정된 회귀모형을 수립하기 위하여 가정한 가설이 성립하는지 진단하는 모형진단 단계(S212), 회귀모형이 예측하는 값의 정확성을 평가하는 예측력 검정 단계(S213)를 포함할 수 있다. 제1 회귀모형 수립단계(S210)는, 하루를 두 개 이상의 구간으로 구분한 구간마다 제1 회귀모형을 수립할 수 있다. 따라서 오전구간, 오후구간 및 새벽구간마다 제1 회귀모형이 하나씩 수립될 수 있다. In the first regression model establishment step (S210), regression models of various input variable combinations among various preliminary input variables are generated using all possible regression methods, and regression coefficients are estimated and adjusted using the least square method for each regression model. A model selection step (S211) of selecting a regression model using a determination coefficient index, a model diagnosis step (S212) of diagnosing whether a hypothesis hypothesized to establish a selected regression model is established, and a value of a value predicted by the regression model. It may include a predictive power test step (S213) for evaluating the accuracy. In the first regression model establishment step (S210 ), a first regression model may be established for each section in which a day is divided into two or more sections. Therefore, one first regression model may be established for each morning section, afternoon section, and dawn section.

이하에서, 모형선정 단계(S211)를 설명한다.In the following, the model selection step (S211) will be described.

모형선정 단계(S211)에서, 모든 가능한 회귀방법을 이용하여 예비입력변수 중에서 조정된 결정계수 지표를 기준으로 간결성과 정확성을 동시에 고려한 입력변수 조합을 찾는다. 회귀모형 수립시 입력변수가 과도하게 많아질 경우 모형이 과거 종속변수는 잘 설명하나 향후 종속변수에 대한 예측력은 감소하는 경향이 발생한다. 이러한 과적합의 문제를 해결하기 위해 모형의 적합도와 간결성을 동시에 고려할 수 있는 방법 중 하나가 모든 가능한 회귀(all possible regression)이다. 이는 예비 입력변수들의 모든 가능한 조합으로 복수의 회귀모형들을 수립한 후 정확성과 간결성을 동시에 평가할 수 있는 지표들을 통해 최적의 입력변수 조합을 갖는 하나의 회귀모형을 선정하는 것이다.In the model selection step (S211), all possible regression methods are used to find a combination of input variables considering simplicity and accuracy at the same time based on the adjusted coefficient of determination index among the preliminary input variables. When establishing a regression model, if the input variable is excessively large, the model explains the past dependent variable well, but the predictive power of the dependent variable tends to decrease in the future. In order to solve the problem of overfitting, one of the methods that can simultaneously consider the fit and the simplicity of the model is all possible regression. This is to establish a plurality of regression models with all possible combinations of preliminary input variables, and then select one regression model with the optimal combination of input variables through indicators that can simultaneously evaluate accuracy and simplicity.

선형회귀모형이란 수학식 1과 같이 종속변수 y를 k개의 입력변수

Figure 112018119947295-pat00001
와 오차항 i의 선형결합으로 나타낼 수 있는 모형이다. i는 i번째 측정자료를 의미한다.The linear regression model is the input variable k of k as in Equation 1.
Figure 112018119947295-pat00001
And a model of error term i. i means i-th measurement data.

Figure 112018119947295-pat00002
Figure 112018119947295-pat00002

모형수립을 위해 가스 배관망(10)의 복수의 지점에서 시간대별로 과거 가스 배관망(10) 운영 압력, 유량자료 등의 상태정보를 취득하고, 이를 가공하여 예비변수를 만든다. 표 1은 이러한 상태정보의 일부를 예시한 것이다. 예비입력변수는 평균압력, 시간대별 전국 가스 인입량, 전국 가스 인입량의 최대값, 최저값 등일 수 있다. 먼저 예비입력변수들을 이용하여 모든 가능한 입력변수들의 조합을 갖는 복수의 회귀모형을 생성하고, 각 회귀모형들마다 회귀계수를 추정하여 회귀모델을 수립한다. To establish a model, state information such as the operating pressure and flow rate data of the past gas piping network 10 is acquired for each time zone at a plurality of points in the gas piping network 10 and processed to make a preliminary variable. Table 1 illustrates some of the status information. The preliminary input variables may be the average pressure, the national gas intake amount by time, and the maximum and minimum values of the national gas intake amount. First, a plurality of regression models having a combination of all possible input variables are generated using preliminary input variables, and a regression model is established by estimating a regression coefficient for each regression model.

일시Pause 평균압력(MPa)Average pressure (MPa) 전국 가스 인입량(t/h)National gas intake (t/h) 10~19시 최저값10-19 o'clock minimum 36~48시 최대값36~48 o'clock maximum

Figure 112018119947295-pat00003
Figure 112018119947295-pat00003
2015.01.01 00:002015.01.01 00:00 5.775.77 4,1804,180 6,7386,738
Figure 112018119947295-pat00004
Figure 112018119947295-pat00004
Figure 112018119947295-pat00005
Figure 112018119947295-pat00005
Figure 112018119947295-pat00006
Figure 112018119947295-pat00006
Figure 112018119947295-pat00007
Figure 112018119947295-pat00007
Figure 112018119947295-pat00008
Figure 112018119947295-pat00008
Figure 112018119947295-pat00009
Figure 112018119947295-pat00009
2018.06.29 00:002018.06.29 00:00 5.505.50 4,2974,297 3,6813,681
Figure 112018119947295-pat00010
Figure 112018119947295-pat00010

다양한 입력변수 조합을 갖는 복수의 회귀모형을 생성한 후 회귀모형들마다 회귀계수

Figure 112018119947295-pat00011
를 추정하기 위한 방법으로 최소제곱법을 활용한다. 최소제곱법이란 아래의 수학식 2의 오차항
Figure 112018119947295-pat00012
제곱의 합을 최소로 만드는 회귀계수를 찾는 방법이다. After generating multiple regression models with various input variable combinations, regression coefficients for each regression model
Figure 112018119947295-pat00011
Least square method is used to estimate. Least squares error term in Equation 2 below
Figure 112018119947295-pat00012
This is a method to find the regression coefficient that makes the sum of squares to the minimum.

Figure 112018119947295-pat00013
Figure 112018119947295-pat00013

위 수학식 2를 최소화하기 위해

Figure 112018119947295-pat00014
각각에 대해 편미분하면 아래 수학식 3과 같다.To minimize Equation 2 above
Figure 112018119947295-pat00014
The partial differential for each is as shown in Equation 3 below.

Figure 112018119947295-pat00015
Figure 112018119947295-pat00015

Figure 112018119947295-pat00016
Figure 112018119947295-pat00016

위 수학식 3을 최소화하는

Figure 112018119947295-pat00017
는 위 수학식 3을 0으로 만드는 값에서 발생하므로 위 수학식 3을 0으로 하는
Figure 112018119947295-pat00018
를 각각
Figure 112018119947295-pat00019
라 하면 아래 수학식 4와 같은 정규방정식을 얻을 수 있다.To minimize Equation 3 above
Figure 112018119947295-pat00017
Since it occurs at the value that makes Equation 3 above 0,
Figure 112018119947295-pat00018
Each
Figure 112018119947295-pat00019
Then, the regular equation as in Equation 4 below can be obtained.

Figure 112018119947295-pat00020
Figure 112018119947295-pat00020

Figure 112018119947295-pat00021
Figure 112018119947295-pat00021

위 수학식 4의 정규방정식을 전개하면 아래 수학식 5와 같은데 이후의 전개는 행렬을 이용하면 편리하다.If the regular equation of Equation 4 above is developed, it is the same as Equation 5 below, but the subsequent development is convenient by using a matrix.

Figure 112018119947295-pat00022
Figure 112018119947295-pat00022

Figure 112018119947295-pat00023
Figure 112018119947295-pat00023

Figure 112018119947295-pat00024
Figure 112018119947295-pat00025
Figure 112018119947295-pat00026
Figure 112018119947295-pat00027
Figure 112018119947295-pat00028
Figure 112018119947295-pat00024
Figure 112018119947295-pat00025
Figure 112018119947295-pat00026
Figure 112018119947295-pat00027
Figure 112018119947295-pat00028

Figure 112018119947295-pat00029
Figure 112018119947295-pat00029

위 수학식 5의 입력변수, 종속변수, 회귀계수 및 오차를 행렬로 표현하면 아래 수학식 6과 같다. If the input variables, dependent variables, regression coefficients and errors of Equation 5 above are expressed as matrices, they are as shown in Equation 6.

Figure 112018119947295-pat00030
Figure 112018119947295-pat00030

수학식 1은 아래 수학식 7로 표현할 수 있고, 수학식 4의 정규방적식을 전개한 수학식 5는 아래 수학식 8로 표현할 수 있다.Equation 1 can be expressed by Equation 7 below, and Equation 5, which is a regular expression of Equation 4, can be expressed by Equation 8 below.

Figure 112018119947295-pat00031
Figure 112018119947295-pat00031

Figure 112018119947295-pat00032
Figure 112018119947295-pat00032

수학식 8의 양변에

Figure 112018119947295-pat00033
의 역행렬
Figure 112018119947295-pat00034
를 곱하면 회귀계수들은 수학식 9와 같이 추정할 수 있다.On both sides of equation (8)
Figure 112018119947295-pat00033
Inverse matrix
Figure 112018119947295-pat00034
Multiply by and the regression coefficients can be estimated as in Equation 9.

Figure 112018119947295-pat00035
Figure 112018119947295-pat00035

종속변수

Figure 112018119947295-pat00036
에 대한 예측값
Figure 112018119947295-pat00037
는 수학식 10이다.Dependent variable
Figure 112018119947295-pat00036
Predicted value for
Figure 112018119947295-pat00037
Is Equation 10.

Figure 112018119947295-pat00038
Figure 112018119947295-pat00038

Figure 112018119947295-pat00039
Figure 112018119947295-pat00039

또한,

Figure 112018119947295-pat00040
Figure 112018119947295-pat00041
의 차이인 잔차
Figure 112018119947295-pat00042
Figure 112018119947295-pat00043
이다.Also,
Figure 112018119947295-pat00040
Wow
Figure 112018119947295-pat00041
Difference, the residual
Figure 112018119947295-pat00042
The
Figure 112018119947295-pat00043
to be.

이러한 과정을 수행하여 다양한 입력변수 조합을 갖는 복수의 회귀모형마다 회귀계수를 추정하여 복수의 회귀모형을 수립할 수 있다. 모든 가능한 회귀방법에 따라 복수의 회귀모형을 수립한 후 조정된 결정계수를 기준으로 최선의 회귀모형을 선정한다. 이하에서 회귀모형을 선정하는 과정을 설명한다. By performing this process, it is possible to establish a plurality of regression models by estimating a regression coefficient for each of the plurality of regression models having various input variable combinations. After establishing multiple regression models according to all possible regression methods, the best regression model is selected based on the adjusted coefficient of determination. The process of selecting a regression model will be described below.

회귀계수를 추정하는 방법으로 최소제곱법을 사용하는 경우 잔차와 관련된 몇 가지 특성이 있는데 우선 수학식 4의 정규방정식에서 수학식 11, 12, 및 13을 얻을 수 있다. When using the least squares method to estimate the regression coefficient, there are some characteristics related to the residuals. First, the equations 11, 12, and 13 can be obtained from the regular equation of equation (4).

Figure 112018119947295-pat00044
Figure 112018119947295-pat00044

Figure 112018119947295-pat00045
Figure 112018119947295-pat00045

Figure 112018119947295-pat00046
Figure 112018119947295-pat00046

최소제곱법 적용시 발생하는 이러한 잔차의 특성을 이용하면, 회귀모형의 종속변수에 대한 설명력, 즉 정도를 측정할 수 있는 결정계수지표를 산출 할 수 있다. 먼저 종속변수

Figure 112018119947295-pat00047
와 종속변수 평균
Figure 112018119947295-pat00048
와의 편차를 아래 수학식 14와 같이 둘로 나눈다. Using the characteristics of these residuals that occur when the least-squares method is applied, it is possible to calculate the explanatory power for the dependent variable of the regression model, that is, the coefficient of determination that can measure the degree. First, dependent variable
Figure 112018119947295-pat00047
And dependent variable mean
Figure 112018119947295-pat00048
Divide the deviation between and two as shown in Equation 14 below.

Figure 112018119947295-pat00049
Figure 112018119947295-pat00049

여기서

Figure 112018119947295-pat00050
를 총편차라하고,
Figure 112018119947295-pat00051
는 잔차로서 회귀모형에 의해 설명되지 않는 편차이며
Figure 112018119947295-pat00052
는 회귀모형에 의해 설명되는 편차이다. 양변을 제곱하고 모든 i에 대한 합을 구하면 수학식 15가 된다.here
Figure 112018119947295-pat00050
Is the total deviation,
Figure 112018119947295-pat00051
Is the residual, which is a deviation that is not explained by the regression model
Figure 112018119947295-pat00052
Is the deviation described by the regression model. Equation 15 is obtained by squaring both sides and summing all i.

Figure 112018119947295-pat00053
Figure 112018119947295-pat00053

수학식 15에서 오른쪽 마지막 항은 수학식 16과 같은데 수학식 11, 및 13으로부터 0이 됨을 알 수 있다.The last term on the right in Equation 15 is the same as Equation 16, and it can be seen that Equation 11 and 13 become 0.

Figure 112018119947295-pat00054
Figure 112018119947295-pat00054

따라서 총편차의 제곱합은 아래와 같이 두 변동 합으로 분해된다Therefore, the sum of squares of the total deviation is decomposed into two sums

Figure 112018119947295-pat00055
Figure 112018119947295-pat00055

수학식 17에서 각각의 항을 SST(total sum of squares), SSE(sum of squares due to residual errors), SSR(sum of squares due to regression)이라 하고 결정계수(R2)는

Figure 112018119947295-pat00056
이고 종속변수의 총변동 중 모형에 의하여 설명되는 부분의 비율을 의미한다. 결정계수는 입력변수가 추가되면 항상 증가하는 성질을 갖고 있어 결정계수를 그대로 판단기준으로 사용하는 경우 과적합한 모형이 선정될 수 있으므로 입력변수의 개수를 반영할 수 있는 조정된 결정계수가 자주 이용된다.In Equation 17, each term is called total sum of squares (SST), sum of squares due to residual errors (SSE), and sum of squares due to regression (SSR), and the coefficient of determination (R 2 ) is
Figure 112018119947295-pat00056
Is the ratio of the portion of the total variation of the dependent variable explained by the model. Since the coefficient of determination always increases when an input variable is added, an appropriate model can be selected when the coefficient of determination is used as a judgment criterion, so the adjusted coefficient of determination that reflects the number of input variables is often used. .

Figure 112018119947295-pat00057
Figure 112018119947295-pat00057

위 수학식 18에서, 조정된 결정계수

Figure 112018119947295-pat00058
는 입력변수의 수 k가 적고 결정계수
Figure 112018119947295-pat00059
가 높을수록 좋은 성질이 있으므로 모든 가능한 회귀시 조정된 결정계수를 지표로 삼아 모형의 정도와 간결성을 동시에 고려할 수 있다. In Equation 18 above, the adjusted coefficient of determination
Figure 112018119947295-pat00058
The number of input variables k is small and the coefficient of determination
Figure 112018119947295-pat00059
The higher the value, the better the property, so it is possible to consider the degree and simplicity of the model at the same time by using the adjusted coefficient of determination as an indicator in all possible regressions.

오전모형을 예로 들면 입력변수의 개수에 따라 조정된 결정계수는 0.5087→0.6367→0.8157→0.8324→0.8331→0.8351→0.8353→0.8354→0.8353→0.8353→0.8352로 입력변수 개수가 8개일 때 0.8354로 가장 크다. 그러나, 입력변수의 개수가 많아지는 경우 실시간으로 모형을 설립하고 이용하는데 복잡도가 증가하는 문제가 있다. 본 실시예에서는 조정된 결정계수의 변화를 기준으로 입력변수 개수 증가에 따라 조정된 결정계수의 증가정도가 직전 증가정도의 20% 이하로 급감할 때의 회귀모형을 선정할 수 있다. 예를 들어, 본 실시예에서 입력변수가 1개에서 2개로 증가한 경우 조정된 결정계수는 0.1280만큼 증가하고, 입력변수가 2개에서 3개로 증가한 경우 조정된 결정계수는 0.1790만큼 증가하며, 입력변수가 3개에서 4개로 증가한 경우 조정된 결정계수는 0.0167만큼 증가하므로, 조정된 결정계수의 증가정도가 직전 증가정도의 20% 이하로 급감할 때인 입력변수가 3개인 회귀모형을 선정할 수 있다. 입력변수가 3개인 회귀모형을 선정하면 수학식 19와 같다.For example, in the morning model, the coefficient of determination adjusted according to the number of input variables is 0.5087→0.6367→0.8157→0.8324→0.8331→0.8351→0.8353→0.8354→0.8353→0.8353→0.8352, which is the largest with 0.8354 when the number of input variables is 8. However, when the number of input variables increases, there is a problem of increasing complexity in establishing and using a model in real time. In this embodiment, a regression model can be selected when the degree of increase of the adjusted coefficient of determination decreases to 20% or less of the level of the previous increase based on the increase in the number of input variables based on the change of the adjusted coefficient of determination. For example, in the present embodiment, if the input variable increases from 1 to 2, the adjusted coefficient of determination increases by 0.1280, and when the input variable increases from 2 to 3, the adjusted coefficient of determination increases by 0.1790, and the input variable If is increased from 3 to 4, the adjusted crystal coefficient increases by 0.0167. Therefore, a regression model with 3 input variables, which is when the adjusted crystal coefficient increase rate decreases to 20% or less of the previous increase, can be selected. If a regression model with three input variables is selected, Equation 19 is given.

Figure 112018119947295-pat00060
Figure 112018119947295-pat00060

Figure 112018119947295-pat00061
: 15시 압력,
Figure 112018119947295-pat00062
: 8시 압력,
Figure 112018119947295-pat00063
: 10시~19시 최저수요,
Figure 112018119947295-pat00064
: 36~48시 최대수요,
Figure 112018119947295-pat00065
: 평균이 0이고 분산이
Figure 112018119947295-pat00066
: 인 정규분포
Figure 112018119947295-pat00067
을 따르는 오차항이며 e-15는 10-15, e-04는 10-4를 의미하고 조정된 결정계수는 0.8157이다. 위에서 산출한 회귀계수들은 본 발명의 일실시예를 설명하기 위하여 예시적으로 상태정보를 이용하여 산출한 것이다.
Figure 112018119947295-pat00061
: 15 o'clock pressure,
Figure 112018119947295-pat00062
: 8 o'clock pressure,
Figure 112018119947295-pat00063
: Minimum demand from 10:00 to 19:00,
Figure 112018119947295-pat00064
: 36~48 o'clock demand,
Figure 112018119947295-pat00065
: Mean is 0 and variance is
Figure 112018119947295-pat00066
: Normal distribution
Figure 112018119947295-pat00067
Is an error term, e-15 means 10 -15 , e-04 means 10 -4 and the adjusted coefficient of determination is 0.8157. The regression coefficients calculated above are calculated by using state information as an example to describe an embodiment of the present invention.

이러한 과정을 수행하여 다양한 입력변수 조합을 갖는 복수의 회귀모형들 중에서 하나의 회귀모형을 선정할 수 있다(S211). 회귀모형을 선정한 후, 선정된 회귀모형을 수립하기 위하여 가정한 가설이 성립하는지 진단하는 모형진단 단계(S212)를 수행한다. 이하에서 모형진단 단계(S212)를 설명한다. By performing such a process, one regression model may be selected from a plurality of regression models having various combinations of input variables (S211). After selecting the regression model, a model diagnosis step (S212) is performed to diagnose whether the hypothesis assumed is established to establish the selected regression model. The model diagnosis step (S212) will be described below.

만일 동일 모집단에서 무한개의 표본을 수집할 수 있다면 각각의 표본에 의해 산출된 회귀계수 등의 각종 통계량들 역시 무한개일 것이고, 이러한 통계량들은 각각 확률분포를 갖게 되는데, 이를 표본분포라 한다. If it is possible to collect an infinite number of samples from the same population, various statistics such as the regression coefficient calculated by each sample will also be infinite, and these statistics have a probability distribution, which is called a sample distribution.

표본분포를 얻기 위해 동일한 모집단에서 무한개의 표본을 얻기는 불가능하나, 회귀모형에 대해 몇 가지 가정과 행렬연산의 기본특성을 활용하면 한 개의 표본으로도 표본분포의 특성에 대해 알 수 있다. It is impossible to obtain an infinite number of samples from the same population to obtain a sample distribution, but if you use some assumptions about the regression model and the basic characteristics of the matrix operation, you can know the characteristics of the sample distribution with just one sample.

행렬의 기본특성은 행렬

Figure 112018119947295-pat00068
가 상수행렬이고
Figure 112018119947295-pat00069
는 확률벡터일 때 기댓값
Figure 112018119947295-pat00070
와 분산
Figure 112018119947295-pat00071
에 대해서 아래 수학식 20이 성립한다는 것이다.The basic characteristics of the matrix are
Figure 112018119947295-pat00068
Is a constant matrix
Figure 112018119947295-pat00069
Is expected value when probability vector
Figure 112018119947295-pat00070
And dispersion
Figure 112018119947295-pat00071
Equation 20 below is established.

Figure 112018119947295-pat00072
Figure 112018119947295-pat00072

Figure 112018119947295-pat00073
Figure 112018119947295-pat00073

Figure 112018119947295-pat00074
Figure 112018119947295-pat00074

수학식 9에서 입력변수가 고정 값이고 오차항의 평균이 0, 즉

Figure 112018119947295-pat00075
이라는 가정을 하면 아래 수학식 21의 전개를 통해
Figure 112018119947295-pat00076
는 표본에 따라 달라지더라도 표본에 따라 다른
Figure 112018119947295-pat00077
들의 평균값은 결국 미지의 고정된 모수값
Figure 112018119947295-pat00078
와 같아짐을 알 수 있고 이러한 성질을 불편성이라고 한다.In Equation 9, the input variable is a fixed value and the mean of the error term is 0, that is,
Figure 112018119947295-pat00075
Assuming that is through the development of Equation 21 below
Figure 112018119947295-pat00076
Although it depends on the sample, it depends on the sample.
Figure 112018119947295-pat00077
The average value of the is ultimately an unknown fixed parameter value
Figure 112018119947295-pat00078
You can see that it is equal to and this property is called discomfort.

Figure 112018119947295-pat00079
Figure 112018119947295-pat00079

Figure 112018119947295-pat00080
Figure 112018119947295-pat00080

또한, 서로다른 오차항끼리는 독립이고, 모든 i에 대해 오차항

Figure 112018119947295-pat00081
의 분산은
Figure 112018119947295-pat00082
으로 일정한 등분산이며 입력변수는 고정값이라 가정하면
Figure 112018119947295-pat00083
의 표본분포의 분산에 대해 추정 할 수 있다. 먼저, 서로 다른 오차항끼리 독립일 경우 확률변수의 기본특성에 의해 공분산은 수학식 22와 같고,Also, the different error terms are independent, and the error term for all i
Figure 112018119947295-pat00081
The dispersion of
Figure 112018119947295-pat00082
Is constant constant variance and input variable is fixed value
Figure 112018119947295-pat00083
You can estimate the variance of the sample distribution. First, when different error terms are independent, the covariance is equal to Equation 22 by the basic characteristics of random variables.

Figure 112018119947295-pat00084
Figure 112018119947295-pat00084

등분산 가정에 의해 분산은 수학식 23이 되며,The variance is equal to Equation 23 by the equal variance assumption.

Figure 112018119947295-pat00085
Figure 112018119947295-pat00085

입력변수를 고정값이라 가정하면 수학식 24 가 성립하므로Assuming that the input variable is a fixed value, Equation (24) holds

Figure 112018119947295-pat00086
Figure 112018119947295-pat00086

아래 수학식 25와 같이

Figure 112018119947295-pat00087
가 성립한다. 이 때
Figure 112018119947295-pat00088
는 대각행렬로서 행과 열의 수가 같으며 행과 열이 같은 대각원소는 1이고 그 외의 원소는 0인 행렬이다. Equation 25 below
Figure 112018119947295-pat00087
Is established. At this time
Figure 112018119947295-pat00088
Is a diagonal matrix, which has the same number of rows and columns, a diagonal element with the same row and column, and 0 for all other elements.

Figure 112018119947295-pat00089
Figure 112018119947295-pat00089

따라서

Figure 112018119947295-pat00090
표본분포의 분산은 수학식 26 과 같다.therefore
Figure 112018119947295-pat00090
The variance of the sample distribution is given by Equation 26.

Figure 112018119947295-pat00091
Figure 112018119947295-pat00091

Figure 112018119947295-pat00092
Figure 112018119947295-pat00092

Figure 112018119947295-pat00093
는 모회귀모형 오차항의 분산으로 실제로는 알 수 없으므로, 수학식 27과 같이
Figure 112018119947295-pat00094
를 통해 추정하고 이는
Figure 112018119947295-pat00095
에 대한 불편추정량임이 알려져 있다.
Figure 112018119947295-pat00093
Is actually unknown due to the variance of the error term of the parent regression model.
Figure 112018119947295-pat00094
Estimated through
Figure 112018119947295-pat00095
It is known that this is an estimate of discomfort for.

Figure 112018119947295-pat00096
Figure 112018119947295-pat00096

Figure 112018119947295-pat00097
Figure 112018119947295-pat00097

따라서

Figure 112018119947295-pat00098
의 j행 j열의 원소를 로 정의하면
Figure 112018119947295-pat00099
표본분포 분산의 추정값은
Figure 112018119947295-pat00100
이다.therefore
Figure 112018119947295-pat00098
If you define the elements of j rows and j columns of
Figure 112018119947295-pat00099
The estimate of the variance of the sample distribution is
Figure 112018119947295-pat00100
to be.

이상의 가정에 추가로 오차항이 정규분포를 따른다고 가정하면 각종 통계량의 표본분포의 형태까지 추정할 수 있고, 이를 통해 각종 통계량에 대한 신뢰구간 추정과 가설검정을 시행할 할 수 있다.In addition to the above assumptions, assuming that the error term follows a normal distribution, it is possible to estimate the form of the sample distribution of various statistics, and through this, it is possible to perform a confidence interval estimation and hypothesis test for various statistics.

다음 수학식 28의 통계량

Figure 112018119947295-pat00101
의 표본분포는 자유도
Figure 112018119947295-pat00102
Figure 112018119947295-pat00103
분포를 따른다고 알려져 있다. Statistics of the following equation (28)
Figure 112018119947295-pat00101
The degree of freedom is
Figure 112018119947295-pat00102
sign
Figure 112018119947295-pat00103
It is said to follow the distribution.

Figure 112018119947295-pat00104
Figure 112018119947295-pat00104

Figure 112018119947295-pat00105
가 발생할
Figure 112018119947295-pat00106
범위는
Figure 112018119947295-pat00107
이므로 통계량
Figure 112018119947295-pat00108
에 수학식 28을 대입하여 전개하면
Figure 112018119947295-pat00109
의 신뢰구간을 수학식 29와 같이 산출할 수 있다.
Figure 112018119947295-pat00105
Cause
Figure 112018119947295-pat00106
The range
Figure 112018119947295-pat00107
Statistic
Figure 112018119947295-pat00108
Substituting Equation 28 into and expanding
Figure 112018119947295-pat00109
The confidence interval of can be calculated as in Equation 29.

Figure 112018119947295-pat00110
Figure 112018119947295-pat00110

위 수학식 29의 의미는 무한개의 표본을 수집하고 각 표본에 대해서 위의 범위를 각각 구하면 범위의 폭과 위치는 표본에 따라 다르지만, 이 범위들이 미지의 모수

Figure 112018119947295-pat00111
를 포함하는 빈도는
Figure 112018119947295-pat00112
라는 것이다.The meaning of Equation 29 above is that if you collect an infinite number of samples and obtain the above range for each sample, the width and position of the range vary depending on the sample, but these ranges are unknown parameters.
Figure 112018119947295-pat00111
The frequency that includes
Figure 112018119947295-pat00112
It is called.

통계적 가설검정은 귀무가설 H0와 대립가설 H1을 설정하고, 어느 가설이 적당한지 파악하는 것으로 확실한 근거가 있기 전에는 대립가설을 선택하지 않고 귀무가설을 받아들인다. 선형회귀계수에 대해 중요한 가설검정은 입력변수와 종속변수간에 선형관계가 있는지 즉, j번째 회귀계수가 0과 유의미하게 다른지 검정하는 것으로 아래 수학식 30과 같이 가설을 설정한다.The statistical hypothesis test sets the null hypothesis H 0 and the alternative hypothesis H 1 and grasps which hypothesis is appropriate, and accepts the null hypothesis without choosing an alternative hypothesis until there is clear evidence. An important hypothesis test for the linear regression coefficient is to test whether there is a linear relationship between the input variable and the dependent variable, that is, the j-th regression coefficient is significantly different from 0.

Figure 112018119947295-pat00113
Figure 112018119947295-pat00113

귀무가설이 옳다고 가정시 다음 수학식 31의 통계량 t0는 확률분포 tn-k-1를 따른다.Assuming that the null hypothesis is correct, the statistical t 0 in the following equation 31 follows the probability distribution t nk-1 .

Figure 112018119947295-pat00114
Figure 112018119947295-pat00114

오전모형의 회귀계수에 대한 추정값, 표준편차, t0값은 아래 표 2와 같다. The estimated values, standard deviation, and t 0 values for the regression coefficient of the morning model are shown in Table 2 below.

회귀계수Regression coefficient 추정값Estimate 표준편차Standard Deviation t0 t 0 유의확률Significant probability

Figure 112018119947295-pat00115
Figure 112018119947295-pat00115
1.87E-151.87E-15 1.21E-021.21E-02 00 1One
Figure 112018119947295-pat00116
Figure 112018119947295-pat00116
6.85E-016.85E-01 1.40E-021.40E-02 49.0549.05 <2e-16<2e-16
Figure 112018119947295-pat00117
Figure 112018119947295-pat00117
-1.80E+00-1.80E+00 4.29E-024.29E-02 -41.89-41.89 <2e-16<2e-16
Figure 112018119947295-pat00118
Figure 112018119947295-pat00118
1.93E+001.93E+00 4.23E-024.23E-02 45.6545.65 <2e-16<2e-16

입력변수

Figure 112018119947295-pat00119
의 회귀계수
Figure 112018119947295-pat00120
Figure 112018119947295-pat00121
값은 49.05로서 귀무가설
Figure 112018119947295-pat00122
이 옳다고 가정할 경우
Figure 112018119947295-pat00123
분포에서 49.05값이 발생할 확률, 즉 유의확률은 2e-16으로 0에 가까우므로 귀무가설을 기각할 수 있고
Figure 112018119947295-pat00124
는 0과 유의미하게 다른 회귀계수라고 결론 내릴 수 있다. 통상 가설검정이 양측검정인지 단측검정인지에 따라 유의확률이 0.025~0.05보다 작으면 귀무가설을 기각한다.Input variable
Figure 112018119947295-pat00119
Regression coefficient
Figure 112018119947295-pat00120
of
Figure 112018119947295-pat00121
The value is 49.05.
Figure 112018119947295-pat00122
Assuming this is right
Figure 112018119947295-pat00123
The probability of a 49.05 value in the distribution, that is, the probability of significance is 2e-16, which is close to 0, so we can reject the null hypothesis.
Figure 112018119947295-pat00124
It can be concluded that is a regression coefficient that is significantly different from zero. Normally, the null hypothesis is rejected if the probability of significance is less than 0.025 to 0.05, depending on whether the hypothesis test is a two-sided test or a one-sided test.

앞서 적용한 모든 가정이 성립하고, 조정된 결정계수를 통해 모형을 간결하게 하여도 입력변수간에 선형관계가 있으면 회귀계수의 분산이 커지는 다중공선성이 발생한다. 이 경우 새로운 표본을 적용시 예측력이 크게 감소할 수 있다. 회귀계수

Figure 112018119947295-pat00125
의 다중공선성 측정은 다음 수학식 32의 분산팽창인자를 활용한다Even if all the assumptions previously applied are established and the model is concise through the adjusted coefficient of determination, if there is a linear relationship between the input variables, multicollinearity occurs in which the variance of the regression coefficient increases. In this case, when applying a new sample, the predictive power can be greatly reduced. Regression coefficient
Figure 112018119947295-pat00125
To measure the multicollinearity of, use the variance expansion factor of Equation 32 below.

Figure 112018119947295-pat00126
Figure 112018119947295-pat00126

이 때,

Figure 112018119947295-pat00127
는 입력변수
Figure 112018119947295-pat00128
를 기타 입력변수로 회귀분석하여 얻은 결정계수이다.
Figure 112018119947295-pat00129
가 1이면 다중공선성이 없는 직교상태로 보고, 5~10 이상이면 다중공선성이 발생하는 것으로 본다. At this time,
Figure 112018119947295-pat00127
Is an input variable
Figure 112018119947295-pat00128
Is the coefficient of determination obtained by regression analysis with other input variables.
Figure 112018119947295-pat00129
If is 1, it is regarded as an orthogonal state without multicollinearity, and if it is 5~10, it is considered that multicollinearity occurs.

오전모형의 분산팽창인자는

Figure 112018119947295-pat00130
: 1.334,
Figure 112018119947295-pat00131
: 12.563,
Figure 112018119947295-pat00132
: 12.236으로
Figure 112018119947295-pat00133
: 10시~19시 최저수요 와
Figure 112018119947295-pat00134
: 36~48시 최대수요 입력변수간에 선형관계가 있다. 이를 완화하기 위해 두 변수는 모형에서 제외하고 두 변수를 조합한 새로운 변수
Figure 112018119947295-pat00135
를 모형에 포함하면 오전구간의 제1 회귀모형은 수학식 33과 같다.The distributed expansion factor of the morning model
Figure 112018119947295-pat00130
: 1.334,
Figure 112018119947295-pat00131
: 12.563,
Figure 112018119947295-pat00132
: 12.236
Figure 112018119947295-pat00133
: Minimum demand from 10:00 to 19:00
Figure 112018119947295-pat00134
: 36~48 hours There is a linear relationship between the maximum demand input variables. To alleviate this, the two variables are excluded from the model and a new variable combining the two variables.
Figure 112018119947295-pat00135
If is included in the model, the first regression model of the morning section is shown in Equation 33.

Figure 112018119947295-pat00136
Figure 112018119947295-pat00136

분산팽창인자는

Figure 112018119947295-pat00137
: 1.003,
Figure 112018119947295-pat00138
: 1.003으로 다중공선성이 제거되었고 조정된 결정계수는 0.8187로 약간 향상되었다. Dispersion expansion factor
Figure 112018119947295-pat00137
: 1.003,
Figure 112018119947295-pat00138
: The multicollinearity was removed to 1.003, and the adjusted crystal coefficient was slightly improved to 0.8187.

이상에서와 같이 회귀모형을 수립하고 회귀계수의 불편성 증명, 분산 및 신뢰구간 산출, 가설 검정 등을 시행하려면 앞서 적용한 가정들이 실제 성립하는지 분석해야한다..In order to establish a regression model as described above, and to prove the inconvenience of regression coefficients, calculate variance and confidence intervals, and test hypotheses, it is necessary to analyze whether the previously applied assumptions actually hold.

도 4는 본 발명의 일실시예에 따른 제1 회귀모형의 오전구간 잔차도이고, 도 5은 본 발명의 일실시예에 따른 제1 회귀모형의 오후구간 잔차도이며, 도 6은 본 발명의 일실시예에 따른 제1 회귀모형의 새벽구간 잔차도이다.4 is a residual diagram of the morning interval of the first regression model according to an embodiment of the present invention, FIG. 5 is a residual diagram of the afternoon interval of the first regression model according to an embodiment of the present invention, and FIG. 6 is It is a residual diagram of the dawn section of the first regression model according to an embodiment.

우선 오차항의 독립성, 등분산성, 정규성 및 평균은 0이라는 가정은 측정값과 예측값의 차이인 잔차의 분포를 통해 확인할 수 있다. 관측순서대로 잔차를 나타낸 그림에서 패턴이 없으면 오차항의 독립성 가정이 성립한다 보고, 예측값대 잔차 그림에서 잔차의 폭이 전구간에서 비슷하면 오차항의 등분산성이 성립한다고 보며 잔차 히스토그램이 정규분포 모양이면 오차항의 정규성이 성립한다고 본다. 또한 세 그림에서 잔차 평균이 0에 가까우면 오차항 평균은 0 이라는 가정이 성립한다 볼 수 있다.First, the assumption that the independence, equivariance, normality, and mean of the error term is 0 can be confirmed through the distribution of residuals, which is the difference between the measured value and the predicted value. In the figure showing the residuals in the order of observation, if there is no pattern, the assumption of independence of the error term is established.If the width of the residuals in the predicted versus residual plot is similar across all regions, it is assumed that the variance of the error term is true. I think normality holds. Also, in the three plots, if the residual mean is close to 0, the assumption that the error term mean is 0 holds.

입력값이 고정이라는 가정의 경우 입력변수가 확률변수라해도 서로독립이고, 확률분포가 회귀계수와 오차항의 분산에 의존하지 않으면 위에서 전개한 모든 과정은 성립하는 것으로 알려져 있다. 분석결과 도 4 내지 6과 같이 오차의 독립성, 등분산성, 정규성 가정적용에 큰 무리가 없는 것을 알 수 있다. 모형진단 단계(S212)에서 가정한 가설이 성립하지 않는다거나 또는 다중공선성이 존재하는 경우 변수의 조합을 이용하더라도 극복할 수 없는 경우에는 해당 모형을 제외하고 모형선정 단계(S211)로 되돌아가서 다른 모형을 선택할 수 있다. 모형진단(S212)을 수행한 후 회귀모형이 예측하는 값의 정확성을 평가하는 예측력 검정 단계(S213)를 수행한다. 이하에서 예측력 검정 단계(S213)를 설명한다. In the case of the assumption that the input values are fixed, even if the input variables are random variables, they are independent of each other, and if the probability distribution does not depend on the variance of the regression coefficients and error terms, it is known that all the processes developed above are established. As a result of the analysis, it can be seen that there is not much difficulty in applying the independence of errors, equivariance, and normality assumptions as shown in FIGS. If the hypothesis assumed in the model diagnosis step (S212) does not hold, or if multicollinearity exists, and the combination of variables cannot be overcome, then the model is returned to the model selection step (S211) except for the corresponding model. Models can be selected. After performing the model diagnosis (S212), a predictive power test step (S213) for evaluating the accuracy of the value predicted by the regression model is performed. The prediction power test step (S213) will be described below.

예측력 검정은 상태정보를 훈련자료와 테스트자료로 분리하고, 훈련자료를 이용하여 상술한 과정을 통해 회귀모형을 수립하고, 수립된 회귀모형에 테스트 자료의 입력변수를 입력하여 산출한 종속변수 값과 테스트 자료의 실제 종속변수 값을 비교하여 회귀모형의 예측력을 검정하는 과정이다. 제1 회귀모형을 수립하기 위하여 사용된 상태정보를 훈련자료와 테스트자료로 나누고, 모형 수립을 위한 훈련자료(2015.1.1 ~ 2017.6.30)에서의 잔차의 평균제곱오차 0.1825와 비교하여, 예측력 점검을 위한 테스트자료(2017.7.1 ~ 2018.6.30)에서의 잔차의 평균제곱오차 0.1778의 차이가 크지 않으므로 충분한 예측력을 갖는 것으로 평가할 수 있다. The predictive power test separates the state information into training data and test data, establishes a regression model through the above-described process using the training data, and inputs the input variables of the test data into the established regression model, and This is the process of testing the predictive power of the regression model by comparing the actual dependent variable values of the test data. The state information used to establish the first regression model is divided into training data and test data, and the predictive power is checked by comparing it with the mean square error of 0.1825 in the training data for model establishment (2015.1.1 ~ 2017.6.30). The difference between the mean square error of 0.1778 in the test data (2017.7.1 ~ 2018.6.30) is not large, so it can be evaluated as having sufficient predictive power.

상술한 과정을 통하여 제1 회귀모형 수립단계(S210)를 오전, 오후, 새벽 구간에 적용하면 각 구간마다 제1 회귀모형을 수립할 수 있다. If the first regression model establishment step (S210) is applied to the morning, afternoon, and dawn sections through the above-described process, the first regression model can be established for each section.

오전(08:00~15:00) 구간의 제1 회귀모형은 수학식 34와 같다.The first regression model in the morning (08:00~15:00) section is as shown in Equation 34.

Figure 112018119947295-pat00139
Figure 112018119947295-pat00139

Figure 112018119947295-pat00140
: 15시 압력,
Figure 112018119947295-pat00141
: 8시 압력 ,
Figure 112018119947295-pat00142
: 10시~19시 최저수요 / 36~48시 최대수요,
Figure 112018119947295-pat00143
: 평균이 0이고 분산이
Figure 112018119947295-pat00144
인 정규분포
Figure 112018119947295-pat00145
을 따르는 오차항이다. 분산팽창인자는
Figure 112018119947295-pat00146
: 1.003 이고 회귀계수 관련 통계량은 아래 표 3과 같다.
Figure 112018119947295-pat00140
: 15 o'clock pressure,
Figure 112018119947295-pat00141
: 8 o'clock pressure,
Figure 112018119947295-pat00142
: Minimum demand from 10:00 to 19:00 / Maximum demand from 36 to 48,
Figure 112018119947295-pat00143
: Mean is 0 and variance is
Figure 112018119947295-pat00144
Phosphorus Normal Distribution
Figure 112018119947295-pat00145
Is the error term that follows. Dispersion expansion factor
Figure 112018119947295-pat00146
: 1.003 and the statistics related to the regression coefficient are shown in Table 3 below.

회귀계수Regression coefficient 추정값Estimate 표준편차Standard Deviation t 값t value 유의확률Significant probability

Figure 112018119947295-pat00147
Figure 112018119947295-pat00147
2.09E-152.09E-15 1.20E-021.20E-02 00 1One
Figure 112018119947295-pat00148
Figure 112018119947295-pat00148
6.85E-016.85E-01 1.20E-021.20E-02 56.9856.98 <2e-16<2e-16
Figure 112018119947295-pat00149
Figure 112018119947295-pat00149
-5.57E-01-5.57E-01 1.20E-021.20E-02 -46.4-46.4 <2e-16<2e-16

결정계수는 전체자료 0.819, 훈련자료 0.822이고 평균제곱오차는 전체자료 0.1810, 훈련자료 0.1825 테스트자료 0.1778 이다.The coefficient of determination is 0.819 for all data, 0.822 for training data, and the mean square error is 0.1810 for all data and 0.1778 for training data.

오후(15:00~21:00) 구간의 제1 회귀모형은 수학식 35와 같다.The first regression model in the afternoon (15:00~21:00) section is as shown in Equation 35.

Figure 112018119947295-pat00150
Figure 112018119947295-pat00150

Figure 112018119947295-pat00151
: 21시 압력,
Figure 112018119947295-pat00152
: 15시 압력,
Figure 112018119947295-pat00153
: 0시 압력-8시 압력,
Figure 112018119947295-pat00154
:6~12시 최대수요 - 12~24시 최대수요,
Figure 112018119947295-pat00155
: 평균이 0이고 분산이
Figure 112018119947295-pat00156
인 정규분포
Figure 112018119947295-pat00157
을 따르는 오차항이다. 분산팽창인자는
Figure 112018119947295-pat00158
: 1.043,
Figure 112018119947295-pat00159
: 1.023,
Figure 112018119947295-pat00160
: 1.059이고 회귀계수 관련 통계량은 아래 표 4와 같다.
Figure 112018119947295-pat00151
: 21 o'clock pressure,
Figure 112018119947295-pat00152
: 15 o'clock pressure,
Figure 112018119947295-pat00153
: 0 hour pressure-8 hour pressure,
Figure 112018119947295-pat00154
: Maximum demand from 6 to 12-Maximum demand from 12 to 24,
Figure 112018119947295-pat00155
: Mean is 0 and variance is
Figure 112018119947295-pat00156
Phosphorus Normal Distribution
Figure 112018119947295-pat00157
Is the error term that follows. Dispersion expansion factor
Figure 112018119947295-pat00158
: 1.043,
Figure 112018119947295-pat00159
: 1.023,
Figure 112018119947295-pat00160
: 1.059 and the statistics related to the regression coefficient are shown in Table 4 below.

회귀계수Regression coefficient 추정값Estimate 표준편차Standard Deviation t 값t value 유의확률Significant probability

Figure 112018119947295-pat00161
Figure 112018119947295-pat00161
3.00E-163.00E-16 9.86E-039.86E-03 00 1One
Figure 112018119947295-pat00162
Figure 112018119947295-pat00162
8.81E-018.81E-01 1.01E-021.01E-02 87.52187.521 <2e-16<2e-16
Figure 112018119947295-pat00163
Figure 112018119947295-pat00163
1.88E-011.88E-01 9.97E-039.97E-03 18.88818.888 <2e-16<2e-16
Figure 112018119947295-pat00164
Figure 112018119947295-pat00164
8.84E-028.84E-02 1.02E-021.02E-02 8.7158.715 <2e-16<2e-16

결정계수는 전체자료 0.879, 훈련자료 0.888이며 평균제곱오차는 전체자료 0.1207, 훈련자료 0.1154, 테스트자료 0.1383 이다.The determination coefficient is 0.879 for all data, 0.888 for training data, and the mean square error is 0.1207 for all data, 0.1154 for training data, and 0.1383 for test data.

새벽(21:00~06:00) 구간의 제1 회귀모형은 수학식 36와 같다.The first regression model in the early morning (21:00~06:00) section is as shown in Equation 36.

Figure 112018119947295-pat00165
Figure 112018119947295-pat00165

Figure 112018119947295-pat00166
: 30시 압력,
Figure 112018119947295-pat00167
: 21시 압력,
Figure 112018119947295-pat00168
: 10~19시 최저수요,
Figure 112018119947295-pat00169
: 24~30시 최저수요 / 30~36시 최대수요,
Figure 112018119947295-pat00170
: 8시 압력,
Figure 112018119947295-pat00171
: 평균이 0이고 분산이
Figure 112018119947295-pat00172
인 정규분포
Figure 112018119947295-pat00173
을 따르는 오차항이다. 분산팽창인자는
Figure 112018119947295-pat00174
: 1.630,
Figure 112018119947295-pat00175
: 1.624,
Figure 112018119947295-pat00176
: 1.366,
Figure 112018119947295-pat00177
: 1.826이고 회귀계수 관련 통계량은 아래 표 5와 같다.
Figure 112018119947295-pat00166
: 30 o'clock pressure,
Figure 112018119947295-pat00167
: 21 o'clock pressure,
Figure 112018119947295-pat00168
: Minimum demand from 10 to 19:00,
Figure 112018119947295-pat00169
: Minimum demand from 24 to 30 / maximum demand from 30 to 36,
Figure 112018119947295-pat00170
: 8 o'clock pressure,
Figure 112018119947295-pat00171
: Mean is 0 and variance is
Figure 112018119947295-pat00172
Phosphorus Normal Distribution
Figure 112018119947295-pat00173
Is the error term that follows. Dispersion expansion factor
Figure 112018119947295-pat00174
: 1.630,
Figure 112018119947295-pat00175
: 1.624,
Figure 112018119947295-pat00176
: 1.366,
Figure 112018119947295-pat00177
: 1.826 and statistics related to the regression coefficient are shown in Table 5 below.

회귀계수Regression coefficient 추정값Estimate 표준편차Standard Deviation t 값t value 유의확률Significant probability

Figure 112018119947295-pat00178
Figure 112018119947295-pat00178
-0.00073-0.00073 0.0187870.018787 -0.039-0.039 0.9691680.969168
Figure 112018119947295-pat00179
Figure 112018119947295-pat00179
0.6756280.675628 0.0174230.017423 38.77938.779 < 2.2e-16<2.2e-16
Figure 112018119947295-pat00180
Figure 112018119947295-pat00180
0.3941260.394126 0.019020.01902 20.72220.722 < 2.2e-16<2.2e-16
Figure 112018119947295-pat00181
Figure 112018119947295-pat00181
-0.46968-0.46968 0.0176260.017626 -26.647-26.647 < 2.2e-16<2.2e-16
Figure 112018119947295-pat00182
Figure 112018119947295-pat00182
0.0577940.057794 0.0157570.015757 3.6683.668 0.0002550.000255

결정계수는 전체자료 0.670, 훈련자료 0.701이고 평균제곱오차는 전체자료 0.2635, 훈련자료 0.2596, 테스트자료 0.2898이다.The coefficient of determination is 0.670 for all data, 0.701 for training data, and the mean square error is 0.2635 for all data, 0.2596 for training data, and 0.2898 for test data.

제2 회귀모형 수립단계(S220)를 설명하기 위하여, 가스 배관망에 공급되는 가스량을 가스 인입량이라 하고, 가스 배관망에서 인출되는 가스량을 가스 인출량이라 한다. 가스 충진량 변화는 가스 인입량에서 가스 인출량을 차감한 값이다.To describe the second regression model establishment step (S220), the amount of gas supplied to the gas piping network is referred to as a gas inflow amount, and the amount of gas drawn out of the gas piping network is referred to as a gas extraction amount. The change in the gas filling amount is a value obtained by subtracting the gas drawing amount from the gas drawing amount.

제2 회귀모형 수립단계(S220)는, 상태정보에 포함된 시간대별 평균압력 변화를 입력변수로 하고 가스 충진량 변화를 종속변수로 하는 회귀모형을 수립할 수 있다. 제2 회귀모형은 제1 회귀모형에 의해 예측되는 특정 시점의 평균압력을 달성하기 위하여 필요한 가스 충진량 변화를 예측하므로 가스 인입량을 얼마로 설정하면 될 것인지 예측할 수 있다. 평균압력과 가스 충진량은 다양한 가스 배관망(10) 변경에도 신뢰할 수 있는 경향성을 제공하므로, 제2 회귀모형을 수립함에 있어서 모든 가능한 회귀방법을 이용하지 않고도 입력변수를 평균압력으로 설정할 수 있다. In the second regression model establishment step (S220), a regression model having a change in average pressure for each time period included in the state information as an input variable and a change in gas filling amount as a dependent variable may be established. Since the second regression model predicts a change in the gas filling amount required to achieve the average pressure at a specific time point predicted by the first regression model, it is possible to predict how much the gas input amount should be set. Since the average pressure and the gas filling amount provide a reliable tendency to various gas piping network 10 changes, the input variable can be set to the average pressure without using all possible regression methods in establishing the second regression model.

평균압력 조정에 필요한 총 가스 송출량을 산출하기 위해서 특정 기간동안의 주배관(Pm)망 가스 충진량 변화를 종속변수로 하고 특정 기간동안의 평균압력 변화를 입력변수로하여 두 변수를 표준화한 후 회귀모형을 수립한다. 예를 들어, 6시간 동안의 주배관(Pm)의 평균압력 변화를 입력변수로, 6시간동안 가스 배관망(10)의 충진량 변화를 종속변수로 하는 제2 회귀모형은 다음 수학식 37과 같이 수립될 수 있다.In order to calculate the total amount of gas discharge required to adjust the average pressure, normalize the two variables using the main pipe (Pm) network gas filling change during a certain period as a dependent variable, and the average pressure change during a specific period as an input variable, and then standardize the regression model. Establish. For example, the second regression model using the change in the average pressure of the main pipe (Pm) for 6 hours as an input variable and the change in the filling amount of the gas pipe network (10) for 6 hours as a dependent variable can be established as in Equation 37 below. Can.

Figure 112018119947295-pat00183
Figure 112018119947295-pat00183

위 수학식 37의 제2 회귀모형은 평균압력을 1 증감시키기 위해서는 특정 기간동안 가스 배관망(10)에 공급되는 가스 충진량을 0.9983을 증감시켜야 함을 의미하며, 이는 예상 가스 인출량보다 가스 인입량을 0.9983만큼 높게 하여 달성할 수 있다. 적합도는 0.997이고 입력변수와 종속변수는 물리적 관계이며 실무에 활용할 수 있는 충분한 정확도를 갖는다. 따라서 모형진단과 예측력 검정을 생략할 수 있다. The second regression model of Equation 37 above means that in order to increase or decrease the average pressure by 1, the gas filling amount supplied to the gas piping network 10 must be increased or decreased by 0.9983 for a specific period. It can be achieved by making it as high as 0.9983. The goodness of fit is 0.997, and the input and dependent variables are physically related and have sufficient accuracy to be used in practice. Therefore, model diagnosis and predictive power test can be omitted.

이상의 과정을 통하여 제1 회귀모형과 제2 회귀모형을 수립할 수 있다(S210 및 S220). 다음으로, 정보제공단계(S300)에서, 제1 회귀모형과 제2 회귀모형을 이용하여 가스 배관망(10)의 운영에 필요한 단기 운영정보를 제공(S300a)할 수 있다. Through the above process, a first regression model and a second regression model may be established (S210 and S220). Next, in the information providing step (S300), using the first regression model and the second regression model, short-term operation information necessary for the operation of the gas piping network 10 may be provided (S300a).

정보제공단계는 단기 운영정보를 제공(S300a)함에 있어서, 제1 회귀모형에서 입력변수가 종속변수에 미치는 영향의 정도가 비교되도록, 입력변수로 선택된 항목들을 표준화하여 제공하는 변환정보 제공단계(S310), 및 특정 시점에서 제1 회귀모형에 의해 예측된 평균압력(S320)을 달성하기 위하여, 제2 회귀모형을 이용하여 예측되는 가스 인입량 변화를 예측하여 제공하는 공급정보 제공단계(S330)를 포함할 수 있다. In the information providing step, in providing the short-term operation information (S300a), in the first regression model, the conversion information providing step of standardizing and providing items selected as the input variable so that the degree of the effect of the input variable on the dependent variable is compared (S310) ), and in order to achieve the average pressure (S320) predicted by the first regression model at a specific time point, the supply information provision step (S330) for predicting and providing a change in the expected gas inflow amount using the second regression model It can contain.

변환정보 제공단계(S310)는, 제1 회귀모형에서 선정된 입력변수들을 표준화하여 제공할 수 있다. 입력변수들은 서로 다른 물리량이고 서로 다른 스케일의 값을 가지므로, 입력변수들 각각이 종속변수인 주배관(Pm)의 평균압력에 미치는 영향을 직관적으로 인식하기 어렵다. 따라서, 제1 회귀모형에서 선정된 입력변수들을 표준화하여 관리자에게 제공함으로써 관리자가 입력변수를 조정하는 경우 평균압력에 미치는 영향을 직관적으로 인식할 수 있도록 하여, 관리자의 편리한 의사결정에 도움을 줄 수 있다. In the conversion information providing step (S310 ), the input variables selected in the first regression model may be standardized and provided. Since the input variables are different physical quantities and have different scale values, it is difficult to intuitively recognize the effect of each of the input variables on the average pressure of the main pipe Pm, which is a dependent variable. Therefore, by standardizing the input variables selected in the first regression model and providing them to the manager, when the manager adjusts the input variables, the influence on the average pressure can be intuitively recognized, thereby helping the manager to make convenient decisions. have.

또한, 제1 회귀모형에 기초하여 평균압력 예측단계(S320)를 수행할 수 있다. 제1 회귀모형을 이용하여 하루를 구분하는 각 구간의 종료시 평균압력을 추정할 수 있다. 예를 들어, 오전 구간(08시~15시)의 시작시인 08시에, 종료시인 15시의 주배관(Pm) 평균압력을 예측할 수 있다. 즉, 오전 구간 관리자는 업무를 시작할 때 오전 구간의 종료시인 15시 평균압력 예측을 제공받을 수 있다. 동일하게, 오후 구간 관리자는 업무를 시작할 때 오후 구간의 종료시인 21시 평균압력 예측 제공받을 수 있다. Also, an average pressure prediction step (S320) may be performed based on the first regression model. Using the first regression model, the average pressure at the end of each section that divides the day can be estimated. For example, the average pressure of the main pipe (Pm) at 8 o'clock at the start of the morning section (08:00 to 15:00) and at 15:00 at the end can be predicted. That is, the morning section manager can be provided with an average pressure forecast at 15:00, which is the end of the morning section when starting work. Equally, the afternoon section manager can be provided with an average pressure forecast at 21 o'clock at the end of the afternoon section when starting work.

다음으로, 공급정보 제공단계(S330)는 특정 시점에서 제1 회귀모형에 의해 예측된 평균압력을 달성하기 위하여, 제2 회귀모형을 이용하여 예측되는 가스 충진량 변화를 예측하여 관리자에게 제공할 수 있다. 상술한 평균압력 예측단계에서 구간의 종료시 평균압력을 예측하였으므로, 제2 회귀모형을 이용하여 구간의 종료시 평균압력을 달성하기 위하여 필요한 가스 인입량(예측된 가스 충진량 변화+가스 인출량)을 예측할 수 있다. 예를 들어, 오전 구간(08시~15시)의 종료시인 15시의 주배관(Pm) 평균압력 예측값을 달성하기 위하여 필요한 가스 인입량을 오전 구간의 시작시에 예측할 수 있으므로, 관리자는 필요한 가스 인입량만큼 가스가 공급되도록 가스 배관망(10)을 제어할 수 있다. Next, in the supply information providing step (S330), in order to achieve the average pressure predicted by the first regression model at a specific time point, the predicted gas filling amount change using the second regression model can be predicted and provided to the manager. . Since the average pressure at the end of the section was predicted in the above-described average pressure prediction step, the second gas flow model can be used to predict the required gas inlet amount (expected gas filling amount change + gas withdrawal amount) to achieve the average pressure at the end of the section. have. For example, the amount of gas input required to achieve the main pipe (Pm) average pressure predicted value at 15 o'clock at the end of the morning section (from 8 am to 15 o'clock) can be predicted at the start of the morning section, so the manager needs the gas input. It is possible to control the gas piping network 10 so that the gas is supplied by the amount.

다음으로, 상태정보 수집단계(S100) 후에 모형수립단계(S200)에서 장기 회귀모형을 수립하는 과정(S200b)을 설명한다. Next, a process (S200b) of establishing a long-term regression model in the model establishment step (S200) after the state information collection step (S100) will be described.

도 7은 본 발명의 일실시예에 따른 가스 배관망(10) 운영정보 제공방법의 세부 단계를 나타낸 흐름도이다.7 is a flowchart illustrating detailed steps of a method for providing operation information of a gas piping network 10 according to an embodiment of the present invention.

가스 직도입 사업자는 가스 배관망(10)을 운영하는 운영주체 이외의 개인 또는 법인 등일 수 있다. 가스 직도입 사업자는 가스 배관망(10)으로부터 인출 계약용량 범위(t/h)내에서 가스를 인출하여 사용할 수 있고, 인입계약용량(t/h) 범위 내에서 가스를 인출한 만큼, 가스 인입 시설(Fin)을 이용하여 가스 배관망(10)에 가스를 인입하여야 한다.Gas direct import operators may be individuals or corporations other than the operating entity operating the gas piping network 10. Gas direct import operators can withdraw gas from the gas piping network 10 within the withdrawal contract capacity range (t/h), and withdraw the gas within the withdrawal contract capacity (t/h) range. Fin) to inject gas into the gas piping network (10).

하지만 인입해야 하는 가스의 양이 배관의 수용력보다 커서 가스 인입을 제한해야 하는 경우가 발생하는 문제가 있다. 이러한 문제는 가스 직도입 사업자의 가스 인출지점(Fout)은 전국에 분산되어 있으나, 가스 인입 지점은 가스 인입 시설(Fin)들 중 하나인 보령기지에 집중되어 보령기지 연결지점에서 병목현상이 발생하기 때문이다.However, there is a problem in that the amount of gas to be drawn in is greater than the capacity of the piping, and thus, the gas input needs to be restricted. This problem is due to the fact that gas outlets of gas direct import operators are distributed throughout the country, but gas injection points are concentrated in Boryeong, one of the gas inlets, leading to bottlenecks at Boryeong base connection points. to be.

가스 직도입 사업자가 가스를 인출한 것보다 가스를 적게 인입하는 경우를 인입제한이라 하고 가스를 적게 인입한 만큼 가스 배관망 운영주체(즉, 가스 배관망에 가스를 공급하는 운영자, 예를 들어 한국가스공사)로부터 가스 직도입 사업자에게로 가스대여가 발생한다. 따라서 가스 직도입 사업자는 가스를 적게 인입한 만큼 추후 가스를 추가로 인입해야 하는데 이를 가스반환이라 한다. 본 명세서에서는 가스 인입제한 및 반환이 발생하는 날을 각각 가스 인입 제한일, 가스 추가 인입 가능일이라 한다.When a gas direct import operator draws less gas than the gas is drawn out, it is called a draw-in limit, and the operating entity of the gas pipeline network (ie, an operator who supplies gas to the gas pipeline network, for example, Korea Gas Corporation) Gas rental is generated from the company to the direct gas supplier. Therefore, as a direct gas importer draws less gas, additional gas must be drawn in later. This is called gas return. In the present specification, the days when gas intake restrictions and returns occur are referred to as gas intake restriction dates and gas additional ingestion dates, respectively.

가스 직도입 사업자가 보령기지를 이용한 가스 인입 계약을 체결하기 위해서는, 가스 인입 시설(Fin, 예를 들어 보령기지)의 인입권역 압력상승과 이에 따른 가스 인입 제한일 및 가스 추가인입 가능일을 예측하여 제공하고, 유관부서 및 관련기관은 가스 인입 계약이 관리가능한 수준인지 검토하여야 한다. 하지만 상술한 단기 회귀모형은 가스 인입 시설 권역의 국부적 압력증가와 가스 인입 제한 및 가스 추가인입 가능기간을 예측 할 수 없다. 이러한 문제를 해결하기 위하여, 본 발명의 일실시예에 따른 가스 배관망(10) 운영정보 제공방법은 가스 인입 제한일과 가스 추가인입 가능일과 같은 운영정보를 제3 내지 5 회귀모형을 통해 신뢰성 있게 예측하여 제공할 수 있다.In order for gas direct import operators to enter into a gas intake contract using Boryeong base, it is expected to provide a gas intake facility (Fin, for example, Boryeong base) with an increase in pressure in the intake area, and accordingly the gas intake restriction date and the additional gas availability date. In addition, relevant departments and related organizations should review whether the gas inflow contract is manageable. However, the above-mentioned short-term regression model cannot predict the local pressure increase in the gas inlet facility area, gas inlet restriction, and the period during which gas can be added. In order to solve this problem, the method for providing operation information of the gas piping network 10 according to an embodiment of the present invention reliably predicts operation information such as a gas entry restriction date and a gas additional entry possible date through 3 to 5 regression models. Can provide.

제3 내지 제5 회귀모형을 설명함에 있어서, 배관의 수용력이란 가스 인입 가능량과 같은 의미로서 가스 인입 시설 연결지점(Fin)에서 배관의 허용압력 범위 내에서 가스를 최대로 인입할 수 있는 양이다. 또한 가스 인입 예상량 이란 가스 인출 예상량과 같은 의미로서 향후 직도입 사업자가 가스를 배관망으로부터 인출한 만큼 인입해야하는 양이다.In describing the 3rd to 5th regression models, the capacity of the pipe is the same as the amount of gas input, and is the amount at which the gas can be drawn at the maximum within the allowable pressure range of the pipe at the connection point (Fin) of the gas supply facility. Also, the expected amount of gas inflow is the same as the expected amount of gas withdrawal.

향후 가스 인입 시설(Fin)의 가스 인입 제한일 및 가스 추가인입 가능일은 가스 인입 시설(Fin)의 가스 인입예상량과 이에 대한 배관의 예상 수용력을 비교하여 예측할 수 있다. 임의의 날의 보령기지의 가스 인입예상량이 이에 대한 배관의 예상 수용력(인입가능량)보다 큰 경우 그 차이만큼 가스 인입을 제한해야 하는 가스 인입 제한일로 예상할 수 있고, 인입예상량이 예상 수용력보다 작은 경우 그 차이만큼 가스를 추가로 인입할 수 있는 가스 인입 가능일로 예상할 수 있다.In the future, the gas intake facility (Fin)'s gas intake restriction date and the possible additional gas intake date can be estimated by comparing the expected gas intake capacity of the gas intake facility (Fin) with the expected capacity of the pipe. If the expected amount of gas inflow from Boryeong Station on any day is greater than the expected capacity of the pipe (capable of entering), it can be expected to be the gas inflow limiting date, which must limit the gas inflow by the difference, and the expected intake amount is less than the expected capacity By the difference, it can be expected that it is a possible gas inflow date that can additionally draw gas.

따라서 가스 인입 제한일 및 가스 추가인입 가능일을 예측하기 위해서는 우선 가스 인입예상량과 배관망의 수용력 예측모형을 수립해야 한다. 이 때, 인입예상량은 인출예상량과 같고 인출예상량은 계약으로 정해지는 인출계약용량에 예상 시설이용률을 곱한 값이다. 따라서 가스 인입예상량 대신 시설이용률 모형을 수립하면 모형의 산출값에 인출계약용량을 곱함으로써 계약용량별로 인입예상량을 산출 할 수 있어 유용하다. 시설이용률은 인출계약용량 대비 실제 가스를 인출하는 비율을 의미한다.Therefore, in order to predict the gas intake restriction date and the possible gas intake date, it is necessary to first establish a predicted model of gas intake and the capacity of the pipe network. At this time, the expected amount of withdrawal is the same as the expected amount of withdrawal, and the estimated amount of withdrawal is the amount of the withdrawal contract determined by the contract multiplied by the expected facility utilization rate. Therefore, it is useful to establish the facility utilization rate model instead of the expected amount of gas input, so that the estimated value of each model can be calculated by multiplying the output value of the model by the withdrawal contract capacity. The facility utilization rate refers to the ratio of actual gas withdrawal to the withdrawal contract capacity.

시설이용률과 배관의 수용력은 모두 가스수요에 영향을 받고 가스수요는 기온에 영향을 받는다. 따라서 기온-수요 모형, 수요-수용력 모형, 수요-시설이용률 모형을 수립하면 시기별 평년기온을 이용해 시기별 가스인입 제한일, 가스 추가인입 가능일 및 인입가능량 등의 각종 통계량을 추정할 수 있고, 가스 직도입 사업자와 가스 배관망(10) 운영주체 사이에서 가스 직도입 계약이 가능한 용량이 얼마인지, 또는 천연가스 배관망(10) 운영에 필요한 의사결정을 하는데 필요한 다양한 값을 추정할 수 있다. Both facility utilization rate and piping capacity are affected by gas demand, and gas demand is affected by temperature. Therefore, by establishing a temperature-demand model, a demand-capacity model, and a demand-facility utilization model, you can estimate various statistics such as the limit of gas inflow by period, the date of additional gas intake, and the amount of inflow available by using average temperature by period. It is possible to estimate various values necessary for making a decision necessary for operating the gas pipeline network 10 or the capacity of the gas pipeline network 10 between the direct-introducing operator and the operating entity of the gas pipeline network 10.

도 7에 도시된 바와 같이, 본 발명의 일실시예에 따른 모형수립단계(S200b)는 가스 배관망(10)의 연간 수요를 예측하는 제3 회귀모형을 수립하기 위하여 기온을 입력변수로 하고 베이즈 정리를 이용하여 회귀계수를 추정하여 제3 회귀모형을 수립하는 제3 회귀모형 수립단계(S230), 가스 배관망(10)의 가스 공급 지점의 수용능력을 예측하는 제4 회귀모형을 수립하기 위하여 가스 수요를 입력변수로 하고 베이즈 정리를 이용하여 회귀계수를 추정하여 제4 회귀모형을 수립하는 제4 회귀모형 수립단계(S240), 및 가스 직도입 사업자의 연간 시설이용률을 예측하는 제5 회귀모형을 수립하기 위하여 가스 수요를 입력변수로 하고 베이즈 정리를 이용하여 회귀계수를 추정하여 제5 회귀모형을 수립하는 제5 회귀모형 수립단계(S250)를 포함할 수 있다. As shown in FIG. 7, the model establishment step (S200b) according to an embodiment of the present invention uses the temperature as an input variable and Bayes to establish a third regression model for predicting the annual demand of the gas piping network 10. The third regression model establishment step (S230) of estimating the regression coefficient using theorem to establish the third regression model, and the gas to establish the fourth regression model predicting the capacity of the gas supply point of the gas piping network 10 The fourth regression model establishment step (S240) of establishing the fourth regression model by estimating the regression coefficient using Bayes' theorem as the input variable and the fifth regression model predicting the annual facility utilization rate of gas direct import operators In order to establish, a fifth regression model establishment step (S250) of establishing a fifth regression model by using gas demand as an input variable and estimating a regression coefficient using Bayes' theorem may be included.

제3, 제4, 및 제5 회귀모형을 수립하기 위한 상태정보는 일별 가스 수요, 일별 시설이용률, 일별 수용력 등을 사용할 수 있다. 표 6에서 예시적으로 설명하는 바와 같이, 일별 수요는 최근 1년 수요를 활용하였고, 가스 인입 시설(Fin)의 가스 인입 예상량은 인출계약용량(t/h) × 시설이용률이므로 최근 시설이용률 자료를 활용하였다. 수용력은 배관망해석 프로그램(Synergi Gas)을 이용하여 모의실험을 시행하여 취득하였고, 이는 영업자료이므로 예시적으로 기재하였다.The state information for establishing the third, fourth, and fifth regression models may use daily gas demand, daily facility utilization rate, daily capacity, and the like. As exemplarily illustrated in Table 6, daily demand utilized demand for the past year, and the expected amount of gas inflow from the gas intake facility (Fin) is the contract amount of withdrawal (t/h) × facility utilization. Was utilized. The capacity was obtained by conducting a simulation experiment using the pipe network analysis program (Synergi Gas).

일시Pause 수요(톤/일)Demand (ton/day) 시설이용률Facility utilization rate 수용력(t/h)Carrying capacity (t/h) 2017.6.282017.6.28 88,95788,957 0.8470.847 557557

Figure 112018119947295-pat00184
Figure 112018119947295-pat00184
Figure 112018119947295-pat00185
Figure 112018119947295-pat00185
Figure 112018119947295-pat00186
Figure 112018119947295-pat00186
Figure 112018119947295-pat00187
Figure 112018119947295-pat00187
2018.6.272018.6.27 97,84797,847 0.8010.801 577577

제3 회귀모형 수립(S230), 제4 회귀모형 수립(S240), 및 제5 회귀모형 수립(S250)단계에서, 회귀모형을 수립함에 있어서 오차항의 이분산성, 비정규성 및 분석자의 주관을 반영할 수 있는 베이즈 정리를 이용한다. 시설이용률은 0~1의 값을 갖기 때문에 오차항이 정규분포보다는 베타분포를 따른다고 가정하는 것이 적합하고, 수용력의 경우 입력변수에 따라 오차항의 표준편차가 선형적으로 증감하는 이분산형태가 나타나므로 이를 적절히 반영하기 위하여 베이즈 정리를 이용한다. 또한, 가스 인입 가능일 및 제한일 예측이 필요한 기간은 향후 5~10년에 해당하여 불확실성이 크므로, 베이즈 정리를 이용하면 관측 및 모의실험을 통한 자료는 물론 가스계통운영 경험 등에 기반한 분석자의 판단을 반영할 수 있어, 추정하고자 하는 통계량의 불확실성을 보완할 수 있다. In the steps of establishing the third regression model (S230), establishing the fourth regression model (S240), and establishing the fifth regression model (S250), in establishing the regression model, it is possible to reflect the heteroscedasticity, irregularity of the error term and subjectivity of the analyst. Use Bayes' theorem. Since the facility utilization rate has a value from 0 to 1, it is appropriate to assume that the error term follows the beta distribution rather than the normal distribution. In the case of capacity, the standard deviation of the error term linearly increases or decreases depending on the input variable. Bayes' theorem is used to properly reflect this. In addition, since the uncertainty is large for the next 5 to 10 years, the period for which the forecast of the available gas and the expiration date is required is large, so using Bayes' theorem, the analyst's judgment based on the experience of gas system operation as well as data through observation and simulation Can reflect the uncertainty in the statistics to be estimated.

또한, 제3 회귀모형 수립단계(S230) 및 제5 회귀모형 수립단계(S250)는 평일, 토요일, 일요일(공휴일 포함)로 구간을 구분하고, 구간마다 회귀모형을 각각 수립하며, 제4 회귀모형 수립단계(S240)는 가스 배관망(10) 운영방식이 변화하는 하절기(4~10월)와 동절기(11~3월)로 구간을 구분하고, 구간마다 회귀모형을 각각 수립할 수 있다. In addition, in the third regression model establishment step (S230) and the fifth regression model establishment step (S250), sections are divided into weekdays, Saturdays, and Sundays (including holidays), and regression models are established for each section, respectively. In the establishment phase (S240), a section is divided into a summer season (April to October) and a winter season (November to March) in which the operation method of the gas piping network 10 changes, and a regression model can be established for each section.

제3, 제4, 및 제5 회귀모형 수립단계(S230, S240 및 S250)는 각각 가능도함수 수립(S201), 사전분포 부여(S202), 사후분포 산출(S203)단계를 포함할 수 있다.The third, fourth, and fifth regression model establishment steps (S230, S240, and S250) may include establishment of a likelihood function (S201), pre-distribution grant (S202), and post-distribution calculation (S203), respectively.

먼저 가능도함수를 수립(S201)하는 과정에서, 제3 회귀모형(기온-수요) 및 제4 회귀모형(수요-수용력)의 가능도함수는 정규분포로 설정하고, 제5 회귀모형(수요-시설이용률)의 경우 이용률은 0~1의 값을 취하므로 베타분포로 설정할 수 있다. 또한 각 분포의 평균은 입력변수의 2~3차 직교다항회귀모형으로 설정하고, 표준편차는 입력변수에 대해 단순선형모형을 따르되, 0보다 큰 값을 갖게 설정할 수 있다. First, in the process of establishing the likelihood function (S201), the likelihood function of the third regression model (at temperature-demand) and the fourth regression model (demand-acceptance) is set to a normal distribution, and the fifth regression model (demand-facility utilization rate) In the case of ), the utilization rate takes a value from 0 to 1, so it can be set as a beta distribution. Also, the average of each distribution is set to the 2nd to 3rd orthogonal polynomial regression model of the input variable, and the standard deviation follows the simple linear model for the input variable, but can be set to have a value greater than 0.

다음으로, 사전분포를 부여(S202)하는 과정에서, 다항회귀모형의 회귀계수에 대한 사전분포는 정규분포로 가정하고 사전분포의 평균과 표준편차는 직교다항회귀모형에 최소제곱법을 적용하여 산출한 회귀계수의 추정값 그대로와 표준편차를 100배한 값을 각각 적용한다. 단순선형모형의 경우 자료를 입력변수 크기순으로 15~20그룹으로 나누고 각 그룹의 입력변수의 평균을 입력변수로 하고 그룹의 표준편차를 반응변수로 하는 선형모형을 수립한다. Next, in the process of assigning the prior distribution (S202), the prior distribution for the regression coefficient of the polynomial regression model is assumed to be a normal distribution, and the mean and standard deviation of the prior distribution are calculated by applying the least squares method to the orthogonal polynomial regression model. Apply the value of 100 times the standard deviation and the estimated value of one regression coefficient. In the case of the simple linear model, the data are divided into 15-20 groups in the order of input variable size, and a linear model is established with the average of the input variables of each group as the input variable and the standard deviation of the group as the response variable.

다음으로, 사후분포를 추정(S203)하는 과정에서, 베이즈 정리는 사전분포, 가능도함수, 주변부 분포를 통해 사후분포를 산출하는 것이 목적인데, 주변부 분포의 직접적인 계산이 어려우므로 본 발명에서는 마코프 사슬 몬테카를로 방법을 통해 사후분포를 추정한다. Next, in the process of estimating the posterior distribution (S203), Bayes' theorem aims to calculate the posterior distribution through a pre-distribution, likelihood function, and peripheral distribution. Since the direct calculation of the peripheral distribution is difficult, the Markov chain in the present invention The posterior distribution is estimated using the Monte Carlo method.

이하에서 베이즈 정리를 이용하여 회귀모형을 수립하는 과정을 더 상세히 설명한다. Hereinafter, a process of establishing a regression model using Bayes' theorem will be described in more detail.

베이즈 정리는 아래 수학식 38의 조건부 확률(conditional probability)의 정의로부터 유도 될 수 있다. 조건부 확률이란 어떤 사건 D가 일어난 조건하에서 다른 사건 H가 일어날 확률을 말한다. Bayes' theorem can be derived from the definition of conditional probability in Equation 38 below. The conditional probability is the probability that another event H will occur under the condition that an event D has occurred.

Figure 112018119947295-pat00188
Figure 112018119947295-pat00188

Figure 112018119947295-pat00189
는 사건 D가 발생할 확률이고
Figure 112018119947295-pat00190
는 사건 H와 D가 동시에 발생할 확률이다. 또한 반대로
Figure 112018119947295-pat00191
이므로
Figure 112018119947295-pat00192
이 성립하고 이를 위의 식에 대입하면 아래 수학식 39의 베이즈 정리를 얻을 수 있다.
Figure 112018119947295-pat00189
Is the probability that event D will occur
Figure 112018119947295-pat00190
Is the probability that events H and D will occur simultaneously. Also on the contrary
Figure 112018119947295-pat00191
Because of
Figure 112018119947295-pat00192
By establishing this and substituting it into the above equation, the Bayes theorem of Equation 39 below can be obtained.

Figure 112018119947295-pat00193
Figure 112018119947295-pat00193

통상 D는 관측자료를 의미하고 H는 추정 또는 검정하고자 하는 가설(Hypothesis)이나 모형의 회귀계수를 의미한다.D usually means observation data, and H means the hypothesis to be estimated or tested or the regression coefficient of the model.

베이즈 정리를 통해 최종적으로 구하고자 하는 것은

Figure 112018119947295-pat00194
로서 사후분포(posterior distribution)라 하고 관측자료를 고려했을 때, 회귀계수 H가 가질 수 있는 각각의 값에 대해 부여된 확신의 정도, 즉 확률분포를 의미한다.
Figure 112018119947295-pat00195
는 사전분포(prior distribution)로서 자료를 고려하기 전에 회귀계수 H가 가질 수 있는 각각의 값에 대한 확신의 정도 또는 확률분포이다.
Figure 112018119947295-pat00196
는 가능도함수(likelyhood function)로서 회귀계수 H가 사실이라 가정할 때 D를 관측할 확률이다.
Figure 112018119947295-pat00197
는 주변부분포(marginal distribution)으로 모든 H에 대해 D가 발생할 확률로서 상수값을 갖는다. The final thing we want to get through Bayes' theorem
Figure 112018119947295-pat00194
It is called the posterior distribution, and when considering the observation data, it means the degree of confidence given to each value of the regression coefficient H, that is, the probability distribution.
Figure 112018119947295-pat00195
Is the degree of confidence or probability distribution for each value that the regression coefficient H can have before considering the data as a prior distribution.
Figure 112018119947295-pat00196
Is the likelihood function, which is the probability of observing D assuming that the regression coefficient H is true.
Figure 112018119947295-pat00197
Is the marginal distribution, and has a constant value as the probability that D will occur for all Hs.

예를 들어 제4 회귀모형 수립단계에서 가스수요(x) 에 따른 배관의 수용력(y) 모형을 다음 수학식 40과 같이 수립하려고 할 때,For example, in the fourth regression model establishment stage, when trying to establish a model of pipe capacity (y) according to gas demand (x) as shown in Equation 40 below,

Figure 112018119947295-pat00198
Figure 112018119947295-pat00198

베이즈정리를 이용하여 회귀계수를 추정하고자 하면 사전분포, 가능도함수, 주변부분포를 계산해야 한다. 만일 모든 회귀계수의 사전분포는 서로독립이고 모두 균일분포

Figure 112018119947295-pat00199
를 따른다고 가정하고 가능도 함수에는 위 모형을 대입하면 균일분포와 정규분포의 정의를 통해 사전분포는 다음 수학식 41과 같이(S202), 가능도함수는 다음 수학식 42와 같이(S201) 계산할 수 있다.To estimate the regression coefficients using Bayes' theorem, you must calculate the prior distribution, likelihood function, and marginal distribution. If all the regression coefficients have a prior distribution, they are independent of each other and all are uniformly distributed.
Figure 112018119947295-pat00199
Assuming that the following model is substituted for the likelihood function, the pre-distribution can be calculated as in Equation 41 (S202), and the likelihood function can be calculated as in Equation 42 (S201) by defining the uniform distribution and the normal distribution. have.

Figure 112018119947295-pat00200
Figure 112018119947295-pat00200

Figure 112018119947295-pat00201
Figure 112018119947295-pat00201

주변부분포를 직접 계산하기 위해서는 아래 수학식 43과 같이 추정하고자 하는 모든 회귀계수들에 대해 적분을 계산해야 하는데 이는 통상 매우 어려운 것으로 알려져 있다. In order to directly calculate the marginal distribution, the integral must be calculated for all regression coefficients to be estimated as shown in Equation 43 below, which is generally known to be very difficult.

Figure 112018119947295-pat00202
Figure 112018119947295-pat00202

따라서, 주변부분포에 대한 직접계산 없이 간접적으로라도 사후분포를 구할 방법이 필요한데 대표적인 방법은 마코프 사슬 몬테카를로(Markov Chain Monte Carlo, MCMC)이다(S203). Therefore, a method of obtaining a posterior distribution is required even indirectly without directly calculating the peripheral distribution. The representative method is Markov Chain Monte Carlo (MCMC) (S203).

마코프과정(Markov Process)이란 마코프 성질(Markov Property)을 갖는 확률과정(Stochastic Process)을 의미한다. 이때 확률과정에서

Figure 112018119947295-pat00203
가 취하는 값을 상태(state)라고 하고, 상태들의 전체모임을 상태공간(state space)라 한다. 만일 아래 수학식 44와 같이
Figure 112018119947295-pat00204
은 오로직
Figure 112018119947295-pat00205
에만 의존하고
Figure 112018119947295-pat00206
에 의존하지 않을 때 이 성질을 마코프 성질이라 하고 이런 성질을 갖는 확률과정을 마코프과정이라 하며 상태공간이 이산형인 마코프과정을 마코프 사슬(Markov chain)이라 부른다.The Markov Process means a stochastic process with Markov Property. At this time, in the probability process
Figure 112018119947295-pat00203
The value it takes is called a state, and the entire gathering of states is called a state space. If Equation 44 below
Figure 112018119947295-pat00204
Silver only
Figure 112018119947295-pat00205
Rely only on
Figure 112018119947295-pat00206
When not dependent on, this property is called the Markov property, the probability process having this property is called the Markov process, and the Markov process in which the state space is discrete is called the Markov chain.

Figure 112018119947295-pat00207
Figure 112018119947295-pat00207

즉, 마코프 성질은 “과거와 현재의 정보가 주어질 때 미래에 관한 조건부분포는 현재의 정보에만 의존하며, 과거의 정보와는 무관하다.”는 것이다. 또한, 위에서 상태 i에서 상태 j로 변화될 확률을 추이확률(transition probability)이라 하고 상태변화에 소요되는 기간에 따라 아래 수학식 45와 구분하여 같이 정의한다.In other words, Markov's nature is that, given past and present information, the conditional distribution of the future depends only on the current information and is independent of past information.” In addition, the probability of change from state i to state j above is referred to as transition probability, and is defined separately from Equation 45 below according to the period required for the state change.

Figure 112018119947295-pat00208
Figure 112018119947295-pat00208

Figure 112018119947295-pat00209
Figure 112018119947295-pat00209

상태 i

Figure 112018119947295-pat00210
에서 1단계 후에 상태 j로 변화될 확률을 원소로 나타낸 아래 수학식 46의 행렬 P를 추이확률행렬(transition probability matrix)이라고 한다. State i
Figure 112018119947295-pat00210
The matrix P of Equation (46) below, which represents the probability that it will change to state j after step 1 in an element, is called a transition probability matrix.

Figure 112018119947295-pat00211
Figure 112018119947295-pat00211

만일 상태 i에서 상태 j로 변화할 수 있고, 그 반대 역시 가능하면 두 상태는 서로도달가능(communicate)라고 하며, 모든 상태가 서로도달 가능할 수 있는 마코프 사슬을 약분불능(irreducible)이라고 한다. 또한, 상태 i에서 시작한 마코프 연쇄 확률과정 중 결국 다시 상태 i로 돌아올 확률이 1이면 재귀적(recurrent)이라고 한다. If the state i can change from state j to vice versa, and vice versa, then the two states are said to be communicative, and the Markov chains in which all states are reachable are called irreducible. In addition, if the probability of eventually returning to state i again during the Markov chain probability process starting from state i is 1, it is said to be recurrent.

상태 i가 재귀적이면서 j와 서로도달가능하면 i에서 출발한 마코프 사슬이 j에 도달할 확률은 1이다. 이는 i가 재귀적이면 마코프 사슬은 시간이 지남에 따라 i를 지속방문하고 그 때마다

Figure 112018119947295-pat00212
의 확률로 j에 도달할 기회를 갖기 때문에 결국 j를 유한번의 시간내에 방문하게 된다. 이를 통해 마코프 체인이 약분불가, 즉 모든 상태가 서로도달가능할 때, 이 중 한 상태가 재귀적이면 결국 모든 상태가 재귀적이 됨을 알 수 있다.If the state i is recursive and can reach j, the probability that the Markov chain starting at i will reach j is 1. This means that if i is recursive, the Markov chain continues to visit i over time and every time
Figure 112018119947295-pat00212
Since we have a chance to reach j with probability of, we eventually visit j within a finite number of times. Through this, it can be seen that when the Markov chain is weak, that is, when all states can reach each other, if one of these states is recursive, eventually all states become recursive.

마코프 체인이 약분불가이고 재귀적이며 j를 떠났다가 j로 다시 돌아올 때까지 걸리는 평균 시간을

Figure 112018119947295-pat00213
이라고 하면 극한의 시간에서 마코프 사슬이 j상태에 머무르는 비율(Long run proportion)
Figure 112018119947295-pat00214
를 불변확률분포(invariant probability distribution)라 부르고 초기상태에 관계없이
Figure 112018119947295-pat00215
이다.The average time it takes for the Markov chain to be weak and recursive, to leave j and back to j
Figure 112018119947295-pat00213
Is the rate at which the Markov chain stays in the j state at extreme times (Long run proportion)
Figure 112018119947295-pat00214
Is called the invariant probability distribution and regardless of the initial state
Figure 112018119947295-pat00215
to be.

위의 관계가 성립하는 이유는 다음과 같다. 마코프 사슬이 임의의 초기 상태 i에서 출발하여 j로 돌아올 시간을

Figure 112018119947295-pat00216
이라하고, j에서 출발하여 j까지 돌아오는데 걸리는 추가시간을
Figure 112018119947295-pat00217
라고 하며 또 다시 j에서 출발하여 j까지 돌아오는데 걸리는 추가시간을
Figure 112018119947295-pat00218
라고 한다면 장기적으로 j를 n번 방문하는데 소요된 시간은
Figure 112018119947295-pat00219
이다. 이때
Figure 112018119947295-pat00220
Figure 112018119947295-pat00221
에 소요된 유한의 시간이고,
Figure 112018119947295-pat00222
Figure 112018119947295-pat00223
에 소요된 유한의 시간들로 평균은
Figure 112018119947295-pat00224
이며, 결국
Figure 112018119947295-pat00225
는 j를 방문한 횟수 n을, n번 방문하는데 걸린시간
Figure 112018119947295-pat00226
로 나눈 값이므로 다음 수학식 47과 같이 장기적으로
Figure 112018119947295-pat00227
이 성립함을 알 수 있다.The reasons for the above relationship are as follows. The time for the Markov chain to start at any initial state i and return to j
Figure 112018119947295-pat00216
And the extra time it takes to depart from j and return to j
Figure 112018119947295-pat00217
The additional time it takes to depart from j and return to j
Figure 112018119947295-pat00218
In the long run, the time taken to visit j n times is
Figure 112018119947295-pat00219
to be. At this time
Figure 112018119947295-pat00220
silver
Figure 112018119947295-pat00221
Is the finite time spent on,
Figure 112018119947295-pat00222
The
Figure 112018119947295-pat00223
The finite time spent on the average
Figure 112018119947295-pat00224
And eventually
Figure 112018119947295-pat00225
Is the number of times n visited j, the time taken to visit n times
Figure 112018119947295-pat00226
Since it is divided by, the following equation (47)
Figure 112018119947295-pat00227
You can see that this is true.

Figure 112018119947295-pat00228
Figure 112018119947295-pat00228

Figure 112018119947295-pat00229
Figure 112018119947295-pat00229

이 때,

Figure 112018119947295-pat00230
즉,
Figure 112018119947295-pat00231
이면 양의 재귀(positive recurrent)상태라 하고
Figure 112018119947295-pat00232
즉,
Figure 112018119947295-pat00233
이면 영의 재귀상태(null recurrent)라 하며 다음의 정리가 성립한다.At this time,
Figure 112018119947295-pat00230
In other words,
Figure 112018119947295-pat00231
It is called positive recurrent state.
Figure 112018119947295-pat00232
In other words,
Figure 112018119947295-pat00233
It is called null recurrent and the following theorem holds.

마코프 연쇄에서 상태 i가 양의 재귀이고 이고 j와 서로도달가능하면 j도 양의 재귀상태이다. 왜냐하면 상태 i가 양의 재귀이므로

Figure 112018119947295-pat00234
이고, i와 j가 서로도달 가능하므로
Figure 112018119947295-pat00235
인 n이 있다. 0보다 큰 두 수를 곱하면 0보다 크므로
Figure 112018119947295-pat00236
이다.
Figure 112018119947295-pat00237
는 마코프 사슬이 장기적으로 상태 i에서 n번의 시간후에 상태 j에 도달할 비율이므로 마코프 사슬이 장기적으로 상태 j에 머물 비율보다 클 수 없다. 즉, 아래 수학식 48이 성립하므로 상태 j역시 양의 재귀적이다.In the Markov chain, state i is positive recursion and j is positive recursion if it can reach each other. Because state i is positive recursion
Figure 112018119947295-pat00234
And i and j can reach each other.
Figure 112018119947295-pat00235
There is n. Multiplying two numbers greater than zero is greater than zero, so
Figure 112018119947295-pat00236
to be.
Figure 112018119947295-pat00237
Is the rate at which the Markov chain will reach state j after n to n times in the long term, and therefore cannot be greater than the rate at which the Markov chain will remain at state j in the long term. That is, since the following equation (48) holds, the state j is also positively recursive.

Figure 112018119947295-pat00238
Figure 112018119947295-pat00238

이를 통해 마코프 사슬이 약분불가이고 이 중 한 상태가 양의 재귀이면 결국 모든 상태가 양의 재귀적이 됨을 알 수 있다.Through this, it can be seen that if the Markov chain is weak and one of them is positively recursive, eventually all states become positively recursive.

또한,

Figure 112018119947295-pat00239
는 장기적으로 상태 i에서 상태 j로 변화할 비율이므로 아래 수학식 49와 같이 모든 i에 대해서
Figure 112018119947295-pat00240
를 각각 더해준다면 이는 장기적으로 마코프 사슬이 상태 j에 머무를 비율이 된다.Also,
Figure 112018119947295-pat00239
Is the ratio that changes from state i to state j in the long run, so for all i as shown in Equation 49 below,
Figure 112018119947295-pat00240
If each is added, this is the rate at which the Markov chain will stay in state j in the long run.

Figure 112018119947295-pat00241
Figure 112018119947295-pat00241

만일 마코프 연쇄가 약분불능이고 양의 재귀라면 불변확률분포

Figure 112018119947295-pat00242
는 다음 수학식 50의 방정식을 만족하는 유일한 해로 알려져 있다.If the Markov chain is weak and recursive, a positive probability distribution
Figure 112018119947295-pat00242
Is known as the only solution that satisfies the equation (50).

Figure 112018119947295-pat00243
Figure 112018119947295-pat00243

Figure 112018119947295-pat00244
Figure 112018119947295-pat00244

위의 결과를 이용하면 다음의 수학식 51의 방정식을 만족하는

Figure 112018119947295-pat00245
Figure 112018119947295-pat00246
임을 알 수 있다.Using the above result, the equation in Equation 51 below is satisfied.
Figure 112018119947295-pat00245
The
Figure 112018119947295-pat00246
You can see that

Figure 112018119947295-pat00247
Figure 112018119947295-pat00247

왜냐하면 위의 두 식을 각각 모든 i에 대해 더해줄 경우 아래의 수학식 52가 성립하여 상기 수학식 50과 같은 형태가 되기 때문이다. This is because when the above two expressions are added to all i, the following Equation 52 is established to form the same as Equation 50 above.

Figure 112018119947295-pat00248
Figure 112018119947295-pat00248

베이즈 정리를 통해 구하고자 하는 사후분포

Figure 112018119947295-pat00249
의 총합은 1이므로 아래의 수학식 53과 같은 추이행렬 P를 구성할 수 있다면 상기 수학식 51에 의해 이 마코프 사슬이 장기적으로 상태 i에 머무는 비율이 곧 사후확률분포
Figure 112018119947295-pat00250
이다.Post distribution to obtain through Bayes' theorem
Figure 112018119947295-pat00249
Since the sum of is 1, if the transition matrix P as shown in Equation 53 below can be constructed, the rate at which this Markov chain stays in the state i in the long term by Equation 51 is the posterior probability distribution.
Figure 112018119947295-pat00250
to be.

Figure 112018119947295-pat00251
Figure 112018119947295-pat00251

상기 수학식 53을 만족 할 수 있는 추이행렬을 구성하는 방법 중 하나가 메트로폴리스-헤이스팅스 알고리즘(Metropolis-Hastings algorithm)이다. 우선 약분불가 마코프 추이행렬 Q를 구성한다. 이는 제안분포라고 불리는데, qij의 확률로 상태 i를 상태 j로 변화시킬 것을 제안하기 때문이다. 이 제안은

Figure 112018119947295-pat00252
의 확률로 수락되므로 상기 수학식 53은 아래 수학식 54와 같다.One of methods for constructing a transition matrix that can satisfy Equation 53 is the Metropolis-Hastings algorithm. First, we construct the Markov trend matrix Q which is not weak. This is called the proposed distribution because it proposes to change state i to state j with the probability of q ij . This offer
Figure 112018119947295-pat00252
Since it is accepted as a probability of Equation 53, Equation 54 is as follows.

Figure 112018119947295-pat00253
Figure 112018119947295-pat00253

Figure 112018119947295-pat00254
를 다음 수학식 55와 같이 정의한다면 수학식 54는 아래와 같이 항상 성립함을 알 수 있다.
Figure 112018119947295-pat00254
If is defined as the following Equation 55, it can be seen that Equation 54 always holds as shown below.

Figure 112018119947295-pat00255
Figure 112018119947295-pat00255

만일

Figure 112018119947295-pat00256
이면,
Figure 112018119947295-pat00257
이고 따라서 수학식 54는 성립한다. if
Figure 112018119947295-pat00256
If it is,
Figure 112018119947295-pat00257
Therefore, Equation 54 is established.

반대로

Figure 112018119947295-pat00258
이면,
Figure 112018119947295-pat00259
이므로 역시 수학식 54가 성립한다.Contrary
Figure 112018119947295-pat00258
If it is,
Figure 112018119947295-pat00259
Therefore, Equation 54 holds.

추이확률 계산시 주변부 분포

Figure 112018119947295-pat00260
는 약분되어 없어지므로 실제
Figure 112018119947295-pat00261
계산은 다음 수학식 56과 같이 사전확률
Figure 112018119947295-pat00262
과 가능도함수
Figure 112018119947295-pat00263
만을 활용한다.Peripheral distribution in trend probability calculation
Figure 112018119947295-pat00260
Is weak and disappears.
Figure 112018119947295-pat00261
Calculation is as follows:
Figure 112018119947295-pat00262
And likelihood function
Figure 112018119947295-pat00263
Use only.

Figure 112018119947295-pat00264
Figure 112018119947295-pat00264

만일

Figure 112018119947295-pat00265
와 같이 추정하고자 하는 확률변수가 여러개인 경우 효율적 마코프사슬을 구성하는 것이 중요하다. 예를 들어 마코프 사슬이 10,000회가 진행되는 동안, 대부분의 경우 제안분포가 거절되면 확률변수가 가질 수 있는 다양한 범위와 확률을 충분히 탐색할 수 없기 때문이다. 따라서 거절될 수 없는 제안분포를 생성하는 방법을 많이 쓰는데 이를 깁스 샘플링이라 한다.if
Figure 112018119947295-pat00265
As described above, it is important to construct an efficient Markov chain when there are multiple random variables to be estimated. This is because, for example, while the Markov chain is 10,000 times in progress, in most cases, if the proposed distribution is rejected, the various ranges and probability that the random variable can have cannot be sufficiently explored. Therefore, many methods are used to generate a proposal distribution that cannot be rejected. This is called Gibbs sampling.

확률벡터

Figure 112018119947295-pat00266
는 사후분포
Figure 112018119947295-pat00267
를 따른다고 할 때, 깁스샘플링은 우선
Figure 112018119947295-pat00268
중 임의의 수를 선택한다. 선택한 수가 i라 하면 이후 확률변수 X를 다음 수학식 57과 같이 생성한다.Probability vector
Figure 112018119947295-pat00266
Is post-distribution
Figure 112018119947295-pat00267
When you follow, Gibbs sampling is first
Figure 112018119947295-pat00268
Choose any number. If the selected number is i, then random variable X is generated as shown in Equation 57 below.

Figure 112018119947295-pat00269
Figure 112018119947295-pat00269

즉,

Figure 112018119947295-pat00270
를 제외한 나머지 확률변수들은 현재상태로 고정한 상태에서의 조건부 확률을 통해
Figure 112018119947295-pat00271
를 현상태
Figure 112018119947295-pat00272
에서 다음상태
Figure 112018119947295-pat00273
로 옮길 것을 제안한다. 즉, 현재상태가
Figure 112018119947295-pat00274
일 때, 제안분포는
Figure 112018119947295-pat00275
를 다음상태로 제안한다. 이상의 깁스 샘플러에 의한 제안분포는 다음 수학식 58과 같이 쓸 수 있다.In other words,
Figure 112018119947295-pat00270
The rest of the random variables, except for
Figure 112018119947295-pat00271
The status quo
Figure 112018119947295-pat00272
In the next state
Figure 112018119947295-pat00273
Suggest to move to. In other words, the current state
Figure 112018119947295-pat00274
When the distribution is
Figure 112018119947295-pat00275
Propose to the next state. The proposed distribution by the Gibbs sampler can be written as in Equation 58 below.

Figure 112018119947295-pat00276
Figure 112018119947295-pat00276

Figure 112018119947295-pat00277
Figure 112018119947295-pat00277

따라서 이 제안을 수락할 확률

Figure 112018119947295-pat00278
에 수학식 58을 대입하면 아래 수학식 59와 같으므로 언제나 제안을 수락한다.So the probability of accepting this offer
Figure 112018119947295-pat00278
Substituting equation (58) into equation (59) below always accepts the offer.

Figure 112018119947295-pat00279
Figure 112018119947295-pat00279

이상의 내용을 적용하여 동절기(11~3월) 구간의 제4 회귀모형(수요-수용력)의 회귀계수의 사후분포를 추정하기 위하여, 먼저 가능도 함수를 아래 수학식 60과 같이 설정한다(S201).In order to estimate the posterior distribution of the regression coefficient of the fourth regression model (demand-acceptance) in the winter season (November to March) by applying the above, the likelihood function is first set as in Equation 60 below (S201): .

Figure 112018119947295-pat00280
Figure 112018119947295-pat00280

이때, 실제 계산시에는 소프트웨어 r의 poly함수를 이용하여 입력변수

Figure 112018119947295-pat00281
,
Figure 112018119947295-pat00282
,
Figure 112018119947295-pat00283
를 직교화하여 사용하였다. 이는 다항회귀모형에서 발생할 수 있는 계산의 불안정성과 다중공선성을 해결하기 위함이다. 만일 입력변수 원값을 사용하면 마코프 사슬 몬테카를로 과정중 계산오류가 발생할 수 있고, 이를 해결하기 위해 입력변수를 표준화하여도 다중공선성은 남아 있어 회귀계수 사후분포가 여러 개의 피크값을 갖는 경우가 발생하여 추정값의 불확실성이 커진다. At this time, in the actual calculation, the input variable using the poly function of software r
Figure 112018119947295-pat00281
,
Figure 112018119947295-pat00282
,
Figure 112018119947295-pat00283
Was orthogonalized. This is to solve the computational instability and multicollinearity that can occur in the polynomial regression model. If the original value of the input variable is used, a calculation error may occur during the process of Markov chain Monte Carlo, and the multicollinearity remains even if the input variable is normalized to solve this, and the posterior distribution of the regression coefficient has multiple peak values. Uncertainty increases.

각 회귀계수에 대한 사전분포는 서로 독립인 정규분포로 하여 아래 수학식 61과 같이 설정한다(S202).The dictionary distribution for each regression coefficient is set as Equation 61 below as a normal distribution independent of each other (S202).

Figure 112018119947295-pat00284
Figure 112018119947295-pat00284

Figure 112018119947295-pat00285
Figure 112018119947295-pat00285

Figure 112018119947295-pat00286
Figure 112018119947295-pat00286

Figure 112018119947295-pat00287
,
Figure 112018119947295-pat00288
에 대한 대략적인 값을 부여하기 위해 가능도함수를 최소제곱법으로 추정하면 아래 표 7과 같고,
Figure 112018119947295-pat00289
에는
Figure 112018119947295-pat00290
추정값을
Figure 112018119947295-pat00291
에는
Figure 112018119947295-pat00292
표준편차의 100배를 한 값을 부여한다.
Figure 112018119947295-pat00287
,
Figure 112018119947295-pat00288
In order to give an approximate value for, the likelihood function is estimated by the least square method, as shown in Table 7 below,
Figure 112018119947295-pat00289
In
Figure 112018119947295-pat00290
Estimate
Figure 112018119947295-pat00291
In
Figure 112018119947295-pat00292
Assign a value that is 100 times the standard deviation.

회귀계수Regression coefficient 추정값Estimate 표준편차Standard Deviation t 값t value 유의확률Significant probability

Figure 112018119947295-pat00293
Figure 112018119947295-pat00293
8.55E-178.55E-17 2.85E-022.85E-02 00 1One
Figure 112018119947295-pat00294
Figure 112018119947295-pat00294
1.03E+011.03E+01 3.48E-013.48E-01 29.46629.466 <2e-16<2e-16
Figure 112018119947295-pat00295
Figure 112018119947295-pat00295
4.88E+004.88E+00 3.48E-013.48E-01 13.99213.992 <2e-16<2e-16
Figure 112018119947295-pat00296
Figure 112018119947295-pat00296
-1.11E+00-1.11E+00 3.48E-013.48E-01 -3.197-3.197 0.00170.0017

Figure 112018119947295-pat00297
,
Figure 112018119947295-pat00298
에 적절한 값을 부여하기 위해 입력변수를 크기순으로 15그룹으로 나누고 그룹별 입력변수의 평균을 입력변수로 하고 그룹별 표준편차를 반응변수로 하여 단순선형회귀 모형을 수립하고 이를 최소제곱법을 구하면 아래 표 8과 같고,
Figure 112018119947295-pat00299
에는
Figure 112018119947295-pat00300
추정값을
Figure 112018119947295-pat00301
에는
Figure 112018119947295-pat00302
표준편차의 100배를 한 값을 부여한다.
Figure 112018119947295-pat00297
,
Figure 112018119947295-pat00298
To give an appropriate value to the data, divide the input variable into 15 groups in size order, set the simple linear regression model with the average of the input variables for each group as the input variable, and the standard deviation for each group as the response variable. Table 8 below,
Figure 112018119947295-pat00299
In
Figure 112018119947295-pat00300
Estimate
Figure 112018119947295-pat00301
In
Figure 112018119947295-pat00302
Assign a value that is 100 times the standard deviation.

회귀계수Regression coefficient 추정값Estimate 표준편차Standard Deviation t 값t value 유의확률Significant probability

Figure 112018119947295-pat00303
Figure 112018119947295-pat00303
0.361320.36132 0.038380.03838 9.4159.415 3.61E-073.61E-07
Figure 112018119947295-pat00304
Figure 112018119947295-pat00304
1.687521.68752 0.515370.51537 3.2743.274 0.006040.00604

이후 마코프 사슬 몬테카를로 방법을 시행하되 처음 5,000회는 burn-in 기간으로 하여 버리고 이 후 30,000회의 표본추출을 통해 각 회귀변수의 사후분포를 추정한다(S203).Thereafter, the Markov chain Monte Carlo method was implemented, but the first 5,000 times were used as burn-in periods, and then the posterior distribution of each regression variable was estimated through 30,000 samplings (S203).

이렇게 추출한 제3 회귀모형(기온-수요), 제4 회귀모형(수요-수용력), 제5 회귀모형(수요-시설이용률) 회귀계수들을 이용하여 난수를 발생시키고 시기별로 수용력과 시설이용률을 비교하여 필요한 각종 통계량을 산출한다.Generates random numbers using the extracted 3rd regression model (at temperature-demand), 4th regression model (demand-capacity), and the 5th regression model (demand-facility utilization ratio). Calculate various statistics required.

상술한 과정을 따르면, 제3 회귀모형(기온-수요) 및 제4 회귀모형(수요-수용력)의 가능도함수는 아래 수학식 62와 같이 설정하고, 각 회귀계수에 대한 사전분포는 아래 수학식 63과 같이 서로 독립인 정규분포를 부여한다.According to the above-described process, the likelihood functions of the third regression model (at temperature-demand) and the fourth regression model (demand-acceptance) are set as in Equation 62 below, and the prior distribution for each regression coefficient is Equation 63 below: As shown in the figure, a normal distribution independent of each other is given.

Figure 112018119947295-pat00305
Figure 112018119947295-pat00305

Figure 112018119947295-pat00306
Figure 112018119947295-pat00306

Figure 112018119947295-pat00307
Figure 112018119947295-pat00307

Figure 112018119947295-pat00308
Figure 112018119947295-pat00308

이 때,

Figure 112018119947295-pat00309
은 정규분포,
Figure 112018119947295-pat00310
,
Figure 112018119947295-pat00311
는 제3 회귀모형(기온-수요)에서는 기온과 수요, 제4 회귀모형(수요-수용력)에서는 수요와 수용력을 의미하고
Figure 112018119947295-pat00312
는 모두 직교화하여 사용한다. At this time,
Figure 112018119947295-pat00309
Is the normal distribution,
Figure 112018119947295-pat00310
,
Figure 112018119947295-pat00311
Means temperature and demand in the third regression model (at temperature-demand), and demand and capacity in the fourth regression model (demand-acceptance).
Figure 112018119947295-pat00312
All orthogonally used.

또한, 제5 회귀모형(수요-시설이용률)의 가능도함수는 아래 수학식 64와 같이 설정하고, 각 회귀계수에 대한 사전분포는 아래 수학식 65과 같이 서로 독립인 정규분포를 부여한다.In addition, the likelihood function of the fifth regression model (demand-facility utilization rate) is set as in Equation 64 below, and the prior distribution for each regression coefficient is given an independent normal distribution as in Equation 65 below.

Figure 112018119947295-pat00313
Figure 112018119947295-pat00313

Figure 112018119947295-pat00314
는 베타분포이고
Figure 112018119947295-pat00315
는 가능도 함수의 평균으로
Figure 112018119947295-pat00316
이며
Figure 112018119947295-pat00317
는 가능도 함수의 표준편차로
Figure 112018119947295-pat00318
이다.
Figure 112018119947295-pat00314
Is the beta distribution
Figure 112018119947295-pat00315
Is the average of the likelihood functions
Figure 112018119947295-pat00316
Is
Figure 112018119947295-pat00317
Is the standard deviation of the likelihood function
Figure 112018119947295-pat00318
to be.

Figure 112018119947295-pat00319
Figure 112018119947295-pat00319

Figure 112018119947295-pat00320
Figure 112018119947295-pat00320

Figure 112018119947295-pat00321
Figure 112018119947295-pat00321

도 8은 본 발명의 일실시예에 따른 하절기 구간의 제4 회귀모형의 회귀계수 추정을 나타낸 도면이다. 8 is a view showing an estimation of a regression coefficient of a fourth regression model in a summer section according to an embodiment of the present invention.

마코프 사슬 몬테카를로 시행시 burn-in 5,000회를 시행한 후 30,000개의 표본을 발생시켜 회귀계수를 추정한다. 회귀계수는 단일값이 아닌 사후분포로 구해진다. 반응변수를 표준화하여 마코프 사슬 몬테카를로를 시행하고 제3 회귀모형(기온-수요) 및 제4 회귀모형(수요-수용력)의 회귀계수 사후분포의 평균을 구하면 아래 표 7와 같고 좀 더 구체적으로 하절기(4~11월) 구간의 제4 회귀모형(수요-수용력)의 회귀계수

Figure 112018119947295-pat00322
를 추정하는 과정은 도 8과 같다. 제5 회귀모형(수요-시설이용률)의 회귀모형은 가스 직도입 사업자의 영업비밀에 속하는 것으로 구체적인 모형은 미기재한다.In the case of the Monte Carlo chain in Markov, 5,000 burn-in runs were performed, and then 30,000 samples were generated to estimate the regression coefficient. The regression coefficients are obtained from the posterior distribution rather than from a single value. The standardized response variable is used to perform Markov chain Monte Carlo, and the average of the posterior distributions of the regression coefficients of the 3rd regression model (at temperature-demand) and the 4th regression model (demand-acceptance) is shown in Table 7 below. Regression coefficient of the 4th regression model (demand-acceptance) of the section from April to November)
Figure 112018119947295-pat00322
The process of estimating is as shown in FIG. 8. The regression model of the fifth regression model (demand-facility utilization rate) belongs to the trade secret of gas direct import operators, and a specific model is not listed.

계수명Counting 기온-수요모형Temperature-demand model 수요-수용력모형Demand-capacity model 평일weekday 토요일Saturday 휴일holiday 4~11월April-November 12~3월December to March

Figure 112018119947295-pat00323
Figure 112018119947295-pat00323
00 00 00 00 00
Figure 112018119947295-pat00324
Figure 112018119947295-pat00324
-14.490-14.490 -6.487-6.487 -7.494-7.494 12.76712.767 10.26510.265
Figure 112018119947295-pat00325
Figure 112018119947295-pat00325
3.4433.443 1.6291.629 1.7621.762 -3.313-3.313 4.9624.962
Figure 112018119947295-pat00326
Figure 112018119947295-pat00326
1.9541.954 0.7110.711 0.5920.592 해당없음Not applicable -0.601-0.601
Figure 112018119947295-pat00327
Figure 112018119947295-pat00327
0.2790.279 -0.302-0.302 -0.391-0.391 0.4410.441 0.3540.354
Figure 112018119947295-pat00328
Figure 112018119947295-pat00328
0.2800.280 0.3090.309 -0.095-0.095 0.0110.011 0.8540.854

상술한 과정(S230, S240 및 S250)을 이용하여 제3, 제4, 및 제5 회귀모형을 수립한 후, 가스 배관망(10)의 장기 운영에 필요한 장기정보를 제공하는 정보제공단계를 수행한다(S300b). 정보제공단계(S300b)에서, 제3 회귀모형에 향후 장기간의 기온을 대표할 수 있는 지난 30년간의 평년기온을 대입하여 수요를 예측하고, 제3 회귀모형을 이용하여 예측한 수요를 제4 및 제5 회귀모형에 입력해 수용력과 시설이용률을 예측할 수 있다. 정보제공단계(S300b)는 제4 회귀모형을 이용하여 예측된 가스 배관망(10)의 가스 공급 지점의 수용능력과, 가스 직도입 사업자의 계약용량에 상기 제5 회귀모형을 이용하여 예측된 시설이용률을 곱하여 산출되는 인입예상량을 비교하여, 가스 인입 제한일 및 가스 추가인입 가능일을 산출하여 장기정보를 제공할 수 있다. After establishing the third, fourth, and fifth regression models using the above-described processes (S230, S240, and S250), an information provision step is provided to provide long-term information necessary for long-term operation of the gas piping network 10. (S300b). In the information providing step (S300b), the demand is predicted by substituting the third regression model for the average temperature for the past 30 years, which can represent the long-term temperature in the future, and using the third regression model to predict the demand. The capacity and facility utilization rate can be predicted by entering the fifth regression model. In the information providing step (S300b), the capacity of the gas supply point of the gas piping network 10 predicted by using the fourth regression model and the facility utilization rate predicted by using the fifth regression model in the contract capacity of the gas direct import operator By comparing the expected amount of input calculated by multiplying, it is possible to provide long-term information by calculating a restriction date of gas input and a possible date of additional gas input.

제3 회귀모형(기온-수요), 제4 회귀모형(수요-수용력), 제5 회귀모형(수요-시설이용률)모형의 사후분포를 이용하여 10,000개의 난수를 발생시키고 시설이용률과 계약용량을 이용하여 가스 인입 예상량을 산출하고, 가스 인입 예상량과 수용력을 비교하면 현재 계약용량에서의 가스 인입 제한일 및 가스 추가인입 가능일 소요기간의 95%신뢰구간은 17~43일로 산출된다. 회귀모형을 통해 예측한 가스 인입 가능일 및 제한일과 실제 가스 인입 가능일 및 제한일을 비교하면, 실제 2018.1~2018.9까지 가스 인입 제한일은 20일이므로 모형은 적용 가능해 보인다. 따라서, 가스 배관망(10) 운영주체와 가스 직도입 사업자는 연간 가스 인입 가능일 및 제한일 예측값을 제공받아 의사결정에 참조할 수 있다. Generates 10,000 random numbers using the posterior distribution of the 3rd regression model (at temperature-demand), the 4th regression model (demand-capacity), and the 5th regression model (demand-facility utilization) model, and uses the facility utilization rate and contract capacity By calculating the expected amount of gas inflow, and comparing the expected amount of gas inflow with the capacity, the 95% confidence interval of the period for the restriction on gas inflow and the allowable period for additional gas in the current contracted capacity is calculated to be 17 to 43 days. If you compare the gas intake and restriction dates predicted by the regression model with the actual gas intake and restriction dates, the actual gas intake restriction date from 2018.1 to 2018.9 is 20 days, so the model seems applicable. Therefore, the gas pipeline network 10 operating entity and the gas direct import operator can refer to the decision making by receiving the predicted values for the annual gas inflow and outgoing dates.

또한, 수요, 시설이용률, 수용력은 변화할 수 있으므로 변화의 수준 및 이에 대한 확신의 정도를 사전분포로 표현하면 이에 따라 가스 인입 가능일 및 제한일이 어떻게 변화하는지 분석할 수 있다. 예를 들어 시설이용률이 5% 증가한다고 강하게 믿는 경우 가스 인입 가능일 및 제한일은 20~47일 소요된다. 여기에서 시설이용률 5% 증가는 다항회귀모형의 절편계수에 0.05를 더하고, 강하게 믿는 정도는 사전분포의 표준편차를 다시 100으로 나눔으로써 반영하였다.In addition, demand, facility utilization rate, and capacity can change, so if the level of change and the degree of confidence in it are expressed in advance, it is possible to analyze how the available and restricted dates of gas change accordingly. For example, if you strongly believe that the facility utilization rate will increase by 5%, the allowable and limiting days for gas entry will take 20 to 47 days. Here, a 5% increase in facility utilization rate was reflected by adding 0.05 to the section coefficient of the polynomial regression model, and the degree of strong belief was reflected by dividing the standard deviation of the prior distribution by 100 again.

향후 계약용량 증가시 영향은 예측한 시설이용률에 해당 계약용량을 곱하여 위의 과정을 반복하면 95% 신뢰도로 연중 반 이상인 154~222일이 인입제한 및 반환일로 소요되는 1.74까지(표준화값)가 계약용량의 한계로 추정된다.If the contract capacity is multiplied by the estimated facility utilization rate and the contract capacity is repeated, the effect of the increase in contract capacity in the future is 95% confidence. It is estimated that the capacity is limited.

도 9는 본 발명의 일실시예에 따른 가스 배관망(10)에 연결된 가스 공급 지점의 시기별 예상 여유수용력을 나타낸 도면이다. 9 is a view showing the estimated spare capacity of each gas supply point connected to the gas pipe network 10 according to an embodiment of the present invention.

시기별로 가스수용여유(수용력-인입예상량)를 예측하면 도 9과 같다. 도 8에서 곡선형태의 실선은 평균여유수용력, 수평실선은 원자료 기준 여유수용력 0에 해당하고 상, 하한 점섬은 각각 신뢰도 95%, 5% 구간을 의미한다. 이러한 가스수용여유를 예측한 운영정보는 민간 가스 직도입 사업자가 LNG 계약, 입항시기 관련 의사결정을 내리는데 도움이 된다.Forecast of gas acceptance margin (acceptable capacity-expected amount of intake) by period is shown in FIG. 9. In FIG. 8, the solid line in the curved form corresponds to the average free capacity, and the horizontal solid line corresponds to the free capacity 0 based on the original data, and the upper and lower point sums indicate the 95% and 5% intervals, respectively. The operational information that predicts the margin of gas acceptance will help private gas direct import operators to make decisions regarding LNG contracts and arrival times.

상술한 본 발명의 일실시예에 따른 가스 배관망(10) 운영정보 제공방법은, 단기적으로 몇시간 이후의 가스 배관망(10)의 적정 평균압력을 예측하고, 적정 평균압력에 도달하기 위한 가스 인입량에 관한 정보를 제공할 수 있으므로, 관리자가 가스 배관망(10)을 관리하는데 도움을 준다. 또한, 장기적으로 연간 가스 수요와 배관망의 수용력과 가스 직도입 사업자의 시설이용률을 예측하고 이를 이용하여 가스 인입 가능일과 제한일에 관한 정보를 제공할 수 있으므로, 가스 배관망(10) 운영주체와 가스 직도입 사업자가 가스 직도입에 관한 의사결정을 하는데 도움을 준다. The above-described method for providing operation information of the gas piping network 10 according to an embodiment of the present invention predicts an appropriate average pressure of the gas piping network 10 after a few hours in the short term, and the amount of gas drawn to reach the appropriate average pressure. Since it can provide information about, it helps the administrator to manage the gas piping network 10. In addition, it is possible to predict the annual gas demand, the capacity of the pipe network, the facility utilization rate of gas direct import operators, and use it to provide information on the possible and restricted dates for gas introduction, so that the gas pipeline network 10 operators and gas direct import operators Helps to make decisions about direct gas introduction.

상술한 본 발명의 일실시예에 따른 가스 배관망(10) 운영정보 제공방법은, 컴퓨터 프로그램 코드로 작성되어 저장장치에 저장될 수 있고 프로세서에 의해 실행되어 운영정보를 생성하고 디스플레이 등의 표시장치를 통하여 관리자에게 운영정보를 제공할 수 있다. The gas piping network 10 operating information providing method according to an embodiment of the present invention described above may be written in computer program code and stored in a storage device, and executed by a processor to generate operating information and display devices such as a display. Through this, operation information can be provided to the administrator.

이상 본 발명을 구체적인 실시예를 통하여 상세히 설명하였으나, 이는 본 발명을 구체적으로 설명하기 위한 것으로, 본 발명은 이에 한정되지 않으며, 본 발명의 기술적 사상 내에서 당해 분야의 통상의 지식을 가진 자에 의해 그 변형이나 개량이 가능함은 명백하다고 할 것이다. Although the present invention has been described in detail through specific examples, the present invention is specifically for describing the present invention, and the present invention is not limited to this, and by those skilled in the art within the technical spirit of the present invention. It will be apparent that the modification and improvement are possible.

본 발명의 단순한 변형 내지 변경은 모두 본 발명의 영역에 속하는 것으로 본 발명의 구체적인 보호 범위는 첨부된 특허청구범위에 의하여 명확해질 것이다.All simple modifications or changes of the present invention belong to the scope of the present invention, and the specific protection scope of the present invention will be clarified by the appended claims.

10: 가스 배관망
Pm: 주배관
Ps: 부배관
Fout: 수용가
Fin: 가스 인입 시설
10: gas pipeline network
Pm: Main piping
Ps: Assistant piping
Fout: Consumer
Fin: Gas Inlet Facility

Claims (8)

가스 배관망의 복수의 지점에서 측정된 상태정보를 수집하여 데이터베이스화하는 상태정보 수집단계;
상기 상태정보에 기초하여, 입력변수를 선택하고 회귀계수를 추정하여 회귀모형을 수립하는 모형수립단계; 및
상기 회귀모형을 이용하여 상기 가스 배관망의 운영에 필요한 운영정보를 제공하는 정보제공단계를 포함하며,
상기 상태정보는
상기 가스 배관망의 복수의 지점에서 시간대별 압력, 수요, 최대수요, 최소수요, 가스 인입량, 상기 복수의 지점에서의 평균압력, 기온 중에서 적어도 하나 이상의 항목을 포함하고,
상기 모형수립단계는
상기 가스 배관망의 연간 수요를 예측하는 제3 회귀모형을 수립하기 위하여, 기온을 입력변수로 하고 베이즈 정리를 이용하여 회귀계수를 추정하여 상기 제3 회귀모형을 수립하는 제3 회귀모형 수립단계;
상기 가스 배관망의 가스 공급 지점의 수용능력을 예측하는 제4 회귀모형을 수립하기 위하여, 가스 수요를 입력변수로 하고 베이즈 정리를 이용하여 회귀계수를 추정하여 상기 제4 회귀모형을 수립하는 제4 회귀모형 수립단계; 및
가스 직도입 사업자의 연간 시설이용률을 예측하는 제5 회귀모형을 수립하기 위하여, 가스 수요를 입력변수로 하고 베이즈 정리를 이용하여 회귀계수를 추정하여 상기 제5 회귀모형을 수립하는 제5 회귀모형 수립단계를 포함하며,
상기 단계들은 컴퓨터 프로그램 코드로 작성되어 프로세서에 의해 실행되는 것인, 가스 배관망 운영정보 제공방법.
A state information collection step of collecting and converting the state information measured at a plurality of points in the gas pipeline network into a database;
A model establishment step of selecting an input variable and estimating a regression coefficient to establish a regression model based on the state information; And
And an information providing step of providing operation information necessary for the operation of the gas piping network using the regression model.
The status information
It includes at least one item of pressure, demand, maximum demand, minimum demand, gas intake amount, average pressure at the plurality of points, and temperature at a plurality of points in the gas piping network,
The model building step
A third regression model establishment step of establishing the third regression model by estimating a regression coefficient using Bayes' theorem as the temperature as an input variable and establishing a third regression model for predicting the annual demand of the gas pipeline network;
In order to establish a fourth regression model for predicting the capacity of a gas supply point of the gas piping network, a fourth regression model is established by estimating a regression coefficient using Bayes' theorem with gas demand as an input variable. Regression model establishment stage; And
In order to establish a fifth regression model that predicts annual facility utilization rate of gas direct import operators, a fifth regression model is established that establishes the fifth regression model by estimating the regression coefficient using Bayes' theorem as gas demand. Including steps,
The above steps are written in computer program code and executed by a processor.
삭제delete 청구항 1에 있어서,
상기 모형수립단계는
특정 시점에서 상기 복수의 지점들의 평균압력을 예측하는 제1 회귀모형을 수립하기 위하여, 상기 상태정보에 포함된 개별 항목 또는 서로 선형관계가 있는 항목들의 조합을 예비입력변수로 하고 모든 가능한 회귀(All Possible Regression) 방법을 이용하여 상기 예비입력변수 중에서 입력변수를 선정하고 최소제곱법을 이용하여 회귀계수를 추정하여 상기 제1 회귀모형을 수립하는 제1 회귀모형 수립단계; 및
상기 제1 회귀모형에 의해 예측되는 상기 특정 시점의 평균압력을 달성하기 위하여 상기 가스 배관망에 공급해야 하는 가스 인입량을 예측하는 제2 회귀모형을 수립하기 위하여, 상기 상태정보에 포함된 시간대별 평균압력 변화를 입력변수로 하고 가스 충진량 변화를 종속변수로 하는 회귀모형을 수립하는 제2 회귀모형 수립단계를 더 포함하는, 가스 배관망 운영정보 제공방법.
The method according to claim 1,
The model building step
In order to establish a first regression model for predicting the average pressure of the plurality of points at a specific time point, all possible regressions (All items) included in the state information or a combination of items that are linearly related to each other are preliminary input variables (All A first regression model establishment step of selecting an input variable from the preliminary input variables using a possible regression method and estimating a regression coefficient using a least squares method to establish the first regression model; And
In order to establish a second regression model for predicting the amount of gas input to be supplied to the gas piping network in order to achieve the average pressure at the specific time point predicted by the first regression model, the average over time included in the state information A method of providing operation information of a gas piping network, further comprising a second regression model establishment step of establishing a regression model having a pressure change as an input variable and a gas filling amount change as a dependent variable.
청구항 3에 있어서,
상기 정보제공단계는
상기 제1 회귀모형에서 상기 입력변수가 종속변수에 미치는 영향의 정도가 비교되도록, 상기 입력변수로 선택된 항목들을 표준화하여 제공하는 변환정보 제공단계; 및
상기 특정 시점에서 상기 제1 회귀모형에 의해 예측된 평균압력을 달성하기 위하여, 상기 제2 회귀모형을 이용하여 상기 가스 충진량 변화를 예측하여 제공하는 공급정보 제공단계를 포함하는, 가스 배관망 운영정보 제공방법.
The method according to claim 3,
The above information providing step
A conversion information providing step of standardizing and providing items selected as the input variable so that the degree of influence of the input variable on the dependent variable in the first regression model is compared; And
In order to achieve the average pressure predicted by the first regression model at the specific point in time, using the second regression model, providing supply information providing and predicting the change in the gas filling amount, providing gas pipeline network operation information Way.
청구항 3에 있어서,
상기 제1 회귀모형 수립단계는
관리자의 근무교대시와 하루 중 평균압력 최고시를 기준시점으로 하루를 적어도 두개 이상의 구간으로 구분하고, 상기 구간마다 상기 제1 회귀모형을 수립하여 상기 구간을 구분하는 기준시점에서 상기 평균압력을 예측하는, 가스 배관망 운영정보 제공방법.
The method according to claim 3,
The first regression model establishment step
Predict the average pressure at a reference point that divides the section by dividing the day into at least two or more sections based on the manager's shift shift and the highest average pressure during the day, and establishing the first regression model for each section. How to provide gas pipeline network operation information.
삭제delete 청구항 1에 있어서,
상기 정보제공단계는
상기 제4 회귀모형을 이용하여 예측된 상기 가스 배관망의 가스 공급 지점의 수용능력과, 상기 가스 직도입 사업자의 계약용량에 상기 제5 회귀모형을 이용하여 예측된 상기 시설이용률을 곱하여 산출되는 인입예상량을 비교하여, 가스 인입 제한일 및 가스 추가인입 가능일을 산출하여 장기정보를 제공하는 것인, 가스 배관망 운영정보 제공방법.
The method according to claim 1,
The above information providing step
Estimation of the incoming capacity calculated by multiplying the capacity of the gas supply point of the gas piping network predicted using the fourth regression model and the contract capacity of the gas direct import operator by the facility utilization rate predicted using the fifth regression model In comparison, a method for providing operation information of a gas piping network is to provide long-term information by calculating a restriction date for a gas input and a possible date for additional gas.
청구항 1에 있어서,
상기 제3 회귀모형 수립단계 및 제5 회귀모형 수립단계는
평일, 토요일, 일요일(공휴일 포함)로 구간을 구분하고, 구간마다 회귀모형을 각각 수립하며,
상기 제4 회귀모형 수립단계는
하절기와 동절기로 구간을 구분하고, 구간마다 회귀모형을 각각 수립하는, 가스 배관망 운영정보 제공방법.
The method according to claim 1,
The third regression model establishment step and the fifth regression model establishment step are
Sections are divided into weekdays, Saturdays, and Sundays (including holidays), and regression models are established for each section.
The fourth regression model establishment step
Gas pipeline network operation information provision method that divides sections in summer and winter and establishes regression models for each section.
KR1020180151785A 2018-11-30 2018-11-30 Method for providing gas pipeline control information through statistical learning KR102139706B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020180151785A KR102139706B1 (en) 2018-11-30 2018-11-30 Method for providing gas pipeline control information through statistical learning

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020180151785A KR102139706B1 (en) 2018-11-30 2018-11-30 Method for providing gas pipeline control information through statistical learning

Publications (2)

Publication Number Publication Date
KR20200065386A KR20200065386A (en) 2020-06-09
KR102139706B1 true KR102139706B1 (en) 2020-07-31

Family

ID=71082680

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020180151785A KR102139706B1 (en) 2018-11-30 2018-11-30 Method for providing gas pipeline control information through statistical learning

Country Status (1)

Country Link
KR (1) KR102139706B1 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20220120893A (en) * 2021-02-24 2022-08-31 한국가스공사 Natural gas supply security evaluation method using probability models

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113129164B (en) * 2021-04-13 2024-02-02 中海石油气电集团有限责任公司 Calculation method of natural gas flow pressure scheduling decision index of natural gas pipe network
KR20230081202A (en) 2021-11-30 2023-06-07 한국가스공사 Method Of Measuring The Storage Value Of Domestic LNG Terminals Using Dynamic Programming And Real Options

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2752147B2 (en) * 1989-04-11 1998-05-18 株式会社東芝 Water distribution network controller

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000265184A (en) 1999-03-15 2000-09-26 Yokogawa Electric Corp Stable feeder of city gas
KR20120036569A (en) * 2010-10-08 2012-04-18 주식회사 케이디파워 A method of energy demand forecast using the least square method
KR20180006094A (en) * 2016-07-08 2018-01-17 코오롱엔솔루션 주식회사 Optimal operation mode suggest method using regression analysis in water distribution network

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2752147B2 (en) * 1989-04-11 1998-05-18 株式会社東芝 Water distribution network controller

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20220120893A (en) * 2021-02-24 2022-08-31 한국가스공사 Natural gas supply security evaluation method using probability models
KR102572085B1 (en) 2021-02-24 2023-08-30 한국가스공사 Natural gas supply security evaluation method using probability models

Also Published As

Publication number Publication date
KR20200065386A (en) 2020-06-09

Similar Documents

Publication Publication Date Title
US10739741B2 (en) Systems and methods for detecting changes in energy usage in a building
KR102139706B1 (en) Method for providing gas pipeline control information through statistical learning
US10325331B2 (en) Systems and methods for measuring and verifying energy usage in a building
Palau et al. Burst detection in water networks using principal component analysis
Kang et al. Real-time demand estimation and confidence limit analysis for water distribution systems
EP2885725B1 (en) Updating cached database query results
US20160041541A1 (en) Systems and methods for detecting changes in energy usage in a building
Kim et al. Statistical analysis with little's law
Kang et al. Optimal meter placement for water distribution system state estimation
CN114285728B (en) Predictive model training method, traffic prediction device and storage medium
CN111476441A (en) Load prediction method for electric vehicle charging equipment and related device
CN109271319A (en) A kind of prediction technique of the software fault based on panel Data Analyses
Wu et al. A variable-type skip-lot sampling plan for products with a unilateral specification limit
CN116091118A (en) Electricity price prediction method, device, equipment, medium and product
Haridy et al. An optimisation design of the combined np-CUSUM scheme for attributes
Liu et al. Dynamic traffic demand uncertainty prediction using radio‐frequency identification data and link volume data
Eckman et al. Plausible screening using functional properties for simulations with large solution spaces
JP2004023114A (en) Method and system for predicting communication traffic
CN116401601B (en) Power failure sensitive user handling method based on logistic regression model
He et al. Sequential Bayesian planning for accelerated degradation tests considering sensor degradation
CN108376300A (en) A kind of user power utilization behavior prediction method based on probability graph model
CN117827593A (en) Method and system for determining abnormality cause based on abnormality recognition result
Borgonovo Sensitivity analysis of model output with input constraints: A generalized rationale for local methods
Peng et al. Profile optimum planning for degradation analysis
Grenyer et al. An Uncertainty Quantification and Aggregation Framework for System Performance Assessment in Industrial Maintenance

Legal Events

Date Code Title Description
E90F Notification of reason for final refusal
E701 Decision to grant or registration of patent right