WO2019103472A1 - 성향점수 잔차항을 최소자승회귀분석에 활용하는 처리효과 추정 방법 및 장치 - Google Patents

성향점수 잔차항을 최소자승회귀분석에 활용하는 처리효과 추정 방법 및 장치 Download PDF

Info

Publication number
WO2019103472A1
WO2019103472A1 PCT/KR2018/014395 KR2018014395W WO2019103472A1 WO 2019103472 A1 WO2019103472 A1 WO 2019103472A1 KR 2018014395 W KR2018014395 W KR 2018014395W WO 2019103472 A1 WO2019103472 A1 WO 2019103472A1
Authority
WO
WIPO (PCT)
Prior art keywords
parameter
residual
model
variable
processing
Prior art date
Application number
PCT/KR2018/014395
Other languages
English (en)
French (fr)
Inventor
이명재
김종원
Original Assignee
고려대학교 산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 고려대학교 산학협력단 filed Critical 고려대학교 산학협력단
Publication of WO2019103472A1 publication Critical patent/WO2019103472A1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis

Definitions

  • the present invention relates to a method and an apparatus for estimating a processing effect by utilizing a tendency score residual term in least squares regression analysis.
  • Treatment refers to variables that can be selectively changed, such as government policies and vocational education programs, and that can affect outcomes. For example, if processing is a "vocational education program" . ≪ / RTI >
  • a matching method has been used to estimate the treatment effect, and the matching is based on a group of people who are “treated” and a group of people who are not “treated” And comparing the results between them to estimate the effect of the treatment.
  • Personality variables are factors that can influence the outcome, and may include personal factors such as gender, academic background, and so on.
  • An object of the present invention is to solve the above problems, and it is an object of the present invention to calculate a first parameter value and a propensity score based on a processing model for a processing variable and a distribution model for a first error included in the processing model, Calculating at least one second parameter value included in the approximate model of the conditional average value of the result variable based on the first parameter value and applying the parameter to the approximate model by calculating the first residual value, We generate the approximate model, calculate the second residual by subtracting the approximated model from the resultant variable, and estimate the processing effect parameters of the process variable on the resultant variables based on the first and second residuals.
  • the method of estimating the processing effect utilizing the tendency score residual term according to the embodiment of the present invention in the least squares regression analysis is characterized in that the first residual calculating section is included in the processing variable model and the processing variable model for the processing variable Calculating a first parameter value and a propensity score based on a distribution model for the first error and calculating a first residual that is obtained by subtracting the propensity score from the processing variable;
  • a parameter applying approximate model is generated by calculating at least one second parameter value included in the approximate model for the conditional average value of the result variable and applying the parameter to the approximate model, and a second residual is subtracted from the parameter applying approximate model in the result variable , And estimating a processing effect parameter of the processing variable on the result variable based on the first and second residuals And a system.
  • the step of calculating the first residual may include: determining a likelihood function corresponding to the processing model and the distribution model; calculating a sample likelihood function by multiplying all of the individual likelihood functions; Determining a first parameter value such that the sample likelihood function is a maximum value, calculating a propensity score based on the first parameter value and the distribution model, and calculating a first residual, which is obtained by subtracting the propensity score from the processing parameter .
  • the step of determining the first parameter value may include calculating a logarithmic sample likelihood function by taking a log in the sample likelihood function, and calculating a value for differentiating the logarithmic sample likelihood function with respect to the first parameter to zero 1 < / RTI > parameter value.
  • the step of calculating a second residual may comprise generating a first parameter application approximation model by applying a first parameter value to the approximation model, subtracting the first parameter application approximation model from the result variable, Determining an error term; determining a value of a second parameter such that a square of a second error is minimized as a second parameter value; applying a second parameter value to the first parameter application approximation model, And generating a second residual term by subtracting the parameter application approximation model from the resultant variable.
  • the step of estimating the processing effect parameter may include multiplying the first residual by the processing effect parameter, subtracting the result of multiplying the first residual by the processing effect parameter in the second residual, and squaring the subtracted result And estimating a processing effect parameter value to be minimized.
  • the processing effect estimating apparatus utilizing the tendency point residual term according to the embodiment of the present invention for least squares regression analysis is characterized in that a processing error model Calculating a first parameter value and a propensity score based on the distribution model for the first parameter and calculating a first residual of the processing parameter by subtracting the propensity score from the first parameter and calculating a conditional average value of the result variable based on the first parameter value; Calculating at least one second parameter value included in the approximate model for the model and applying the model parameter to the approximate model to generate a parameter application approximate model and calculating a second residual, And a processing effect parameter estimating unit that estimates a processing effect parameter whose processing variable affects an outcome variable based on the first and second residuals, It includes.
  • the first residual-error calculating unit determines a likelihood function corresponding to the processing variable model and the distribution model, calculates a sample likelihood function by multiplying the individual likelihood function by all, Determining a first parameter value such that the function has a maximum value, calculating a tendency score based on the first parameter value and the distribution model, and calculating a first residual term in which the tendency score is subtracted from the processing variable.
  • the first residue calculator calculates a logarithmic sample likelihood function by taking a log in the sample likelihood function, and sets a value that makes the result of differentiating the logarithmic sample likelihood function with respect to the first parameter zero as a first parameter value .
  • the second residual calculating section may generate the first parameter applying approximate model by applying the first parameter value to the approximate model, and subtract the first parameter applying approximate model from the result variable to determine the second error term , The value of the second parameter that minimizes the square of the second error term is determined as the second parameter value, and the second residual obtained by subtracting the second parameter application approximation model from the result variable is calculated.
  • the processing effect estimation unit may multiply the first residual by the processing effect parameter, subtract the result of multiplying the first residual by the processing effect parameter in the second residual, and minimize the result of squaring the subtracted result And estimates the processing effect parameter value.
  • a first parameter value and a propensity score are calculated based on a processing model for a processing variable and a distribution model for a first error included in the processing model, and the propensity score
  • a parameter applying approximate model is generated by calculating at least one second parameter value included in the approximate model of the conditional average value of the result variable based on the first parameter value and applying the calculated at least one second parameter value to the approximate model , It is easy to use and statistical significance is obtained by calculating the second residual by subtracting the parameter applying approximation from the result variable and estimating the processing effect parameter of the processing variable on the result variable based on the first and second residuals It is possible to provide a method and an apparatus for estimating a processing effect that can be easily discriminated.
  • FIG. 1 is a block diagram for explaining a processing effect estimating apparatus that utilizes a tendency score residual term in least squares regression analysis according to an embodiment of the present invention.
  • FIG. 2 is a flowchart for explaining a process effect estimation method using a tendency score residual term in least squares regression analysis according to an embodiment of the present invention.
  • FIG. 3 is a flowchart for explaining a step of calculating a first residual in a process effect estimation method using a tendency point residual term in least squares regression analysis according to an embodiment of the present invention.
  • FIG. 4 is a flowchart for explaining a step of calculating a second residual in a process effect estimation method using a tendency score residual term in least squares regression analysis according to an embodiment of the present invention.
  • Treatment can mean variables that can be selectively changed, such as government policy and vocational education programs, and affect the outcome variable (Y).
  • the treatment may refer to the unemployed vocational education policy of the government.
  • the processing variable (D) is a binary variable, indicating whether or not a particular individual has been treated.
  • the meaning of D i is 1 means that treatment i
  • D j is 0, which means that the j-th individual of the group to be analyzed has not received treatment.
  • treatment is the government's unemployed vocational education policy
  • D i the i-th person in the analysis group means that he or she has received vocational education for the unemployed. If D i is 0, Individuals may mean that they have not received job training for the unemployed.
  • the personality variable (H) is the control variable among the variables that can affect the outcome variable (Y), and the control variable that can affect the outcome variable (Y) such as personality, It can mean.
  • the outcome variable (Y) is a dependent variable on the treatment variable (D), and the outcome variable (Y) can mean "unemployment duration" if the treatment is government unemployment vocational education policy .
  • the method and apparatus for estimating the effect of applying the residuals to the least squares regression analysis can estimate the treatment effect parameter ( ⁇ ) which is the effect of the vocational education on the unemployment period.
  • FIG. 1 is a block diagram for explaining a processing effect estimating apparatus that utilizes a tendency score residual term in least squares regression analysis according to an embodiment of the present invention.
  • the processing effect estimating apparatus 100 which utilizes the tendency score residual term in least squares regression analysis, includes a first residual calculating unit 110, a second residual calculating unit 120 and a processing effect estimating unit 130.
  • the first residual-error calculating unit 110 calculates the first parameter value (D) based on the processing parameter model for the processing variable (D) and the distribution model for the first error term (v) included in the processing- ) And a propensity score (P (H i )) are calculated, and a first residual is calculated by subtracting the propensity score (P (H i )) from the processing variable (D).
  • the first residue calculator 110 calculates a logarithmic sample likelihood function by taking a log in the sample likelihood function, and sets a value for differentiating the logarithmic sample likelihood function with respect to the first parameter to be zero 1 Parameter value ( ).
  • the second residual-error calculating unit 120 calculates the first parameter value ), The conditional average value of the result variable (Y) At least one second parameter value included in the approximate model for ) Is applied to the approximate model to generate the parameter approximation model, and the second residual is subtracted from the parameter application approximation model in the result variable (Y).
  • the second residual-error calculating unit may calculate the first parameter value ( ) To generate a first parameter application approximation model, subtracting the first parameter application approximation model from the result variable Y to determine a second error term, and a second parameter to minimize the square of the second error term beta) to the second parameter value ( ), And the first parameter application approximation model is determined as the second parameter value ( ) To generate a parameter approximation model, and the second residual is subtracted from the parameter application approximation model in the result variable (Y).
  • the processing effect estimating unit 130 estimates the processing effect parameter y that the processing variable D has on the result variable Y based on the first and second residuals.
  • the processing effect estimating unit 130 may multiply the first residual and the processing effect parameter ⁇ , subtract the result of multiplying the first residual by the processing effect parameter ⁇ in the second residual, The processing-effect parameter value is minimized.
  • FIG. 2 is a flowchart for explaining a process effect estimation method using a tendency score residual term in least squares regression analysis according to an embodiment of the present invention.
  • the method of estimating the processing effect utilizing the tendency point residual term according to the embodiment of the present invention in the least squares regression analysis includes calculating a first residual (S210), calculating a second residual S220) and estimating a processing effect parameter based on the first and second residuals (S230).
  • the first residual calculating unit 110 calculates a first parameter value (D) based on the processing model for the processing variable D and the distribution model for the first error term v included in the processing model ) And a propensity score (P (H i )), and calculating a first residual by subtracting the propensity score (P (H i )) from the processing variable (D).
  • the process variable model for the process variable (D) includes a regression model, a model used for regression analysis on a binomial variable ranging from 0 to 1, with at least one of the various previously known models . ≪ / RTI >
  • the model may mean at least one of various models for ordinal or categorical multiple treatment.
  • the process variable model is a model for regression analysis of the process variable (D) to the personality variable (H).
  • the process variable (D) , And personality variable (H) can mean various variables such as age and sex of the individual.
  • the process variable model is a model for logistic regression
  • the process variable model can be generated as shown in Equation 1 below, but the present invention is not limited to this, Probit) as well as other process variable models.
  • D i * is a latent variable for the i-th person
  • H i ' is a personality vector containing at least one personality variable (H) for the i-th person
  • a first parameter vector v i is the first error term for the ith individual
  • D i is the processing variable for the ith person
  • i is the ith person in a given data range of 1 to N
  • H i ' This is a regression model of the latent variable (D i * ).
  • the personality vector H i ' is a [M by 1] vector
  • the first parameter vector ⁇ may be a [M by 1] vector
  • H i ' ⁇ may have a scalar value
  • the latent variables (D i *) if equal to or greater than 0, process parameters (D i) is 1, if the latent variables (D i *) is less than 0 processing parameters (D i) will be zero have.
  • the first parameter vector ⁇ is a parameter to be estimated in logistic regression, and the degree of influence of the personality variable H i indicating the personality of the person on the potential variable D i .
  • the first error term (v i ) represents a part of the latent variable (D i * ) that the personality variable (H i ) can not explain.
  • the first error term (v i) In this case, according to the logistic distribution, distribution model to the first error term (v i) will however be the same as the equation (2) below, the present invention provides a first error term (v i) is
  • the first error term (v i ) may follow various distributions including the normal distribution in addition to the logistic distribution.
  • G (v) denotes a distribution function of the first error term (v i ), and the logistic distribution is symmetric about 0.
  • Equation (1) The model described in Equation (1) and the distribution model described in Equation (2) are examples, and the present invention is not limited to Equations (1) and (2).
  • step S210 will be continued with reference to Fig.
  • FIG. 3 is a flowchart for explaining a step of calculating a first residual in a process effect estimation method using a tendency point residual term in least squares regression analysis according to an embodiment of the present invention.
  • step S210 includes a step S211 of determining a personal likelihood function, a step S213 of calculating a sample likelihood function, a step of determining a first parameter value S215, Step S217 and calculating the first residual.
  • Step S211 may refer to a step of determining a personal likelihood function corresponding to the processing variable model and the distribution model.
  • Equation 3 the individual likelihood function
  • the individual likelihood function can follow various likelihood function determination methods determined by a known maximum likelihood estimator ,
  • the individual likelihood function according to the present invention is not limited to the following Equation (3).
  • G () is a first error term (v i) distribution function, H i 'is i nature including at least one or more character variable (H) for the second individual vector, ⁇ is a first parameter vector, D i of the i is the processing variable for the individual i.
  • Step S213 may be a step of calculating a sample likelihood function by multiplying all the likelihood functions by the individual likelihood function.
  • the sample likelihood function is determined by the following equation (4).
  • L ( ⁇ ) denotes a sample likelihood function
  • Step S215 may refer to a step of determining the value of the first parameter alpha so that the sample likelihood function has a maximum value.
  • a logarithmic sample likelihood function is obtained by taking a log in the sample likelihood function, and a value for differentiating the logarithmic sample likelihood function with respect to the first parameter to 0 is referred to as a first parameter value And a step of determining the number
  • the steps S211 to S215 may be a maximum likelihood estimator, and when the error term of the processing variable (D) model follows the logistic distribution, (Maximum Likelihood Estimator), and if the error term of the process variable (D) model follows the normal distribution, it can mean the maximum likelihood estimator for the binomial variable based on the normal distribution. have.
  • the first parameter value (?), which is the value of the first parameter? ) May be a logistic regression result, but the present invention is not limited thereto.
  • logarithmic sample likelihood function utilized in step S215 may be expressed as Equation (5) below.
  • the value of the first parameter (alpha) for making Equation (6) to be 0 is the first parameter value ). ≪ / RTI >
  • step S217 the first parameter value ) And a process variable model to calculate the tendency score.
  • step S217 the feature vector (H i ' ) and the first parameter value (H i ' ) for making the sample likelihood function have a maximum value are added to the distribution function of the above- ) May be substituted to calculate the propensity score, and this process may be as shown in Equation (7) below, but the present invention is not limited thereto.
  • P (H i ) is the propensity score
  • H i is the personality variable for the ith person
  • G () is the distribution function of the first error term (v i )
  • H i ' Means a first parameter value that allows the sample likelihood function to be a maximum value.
  • Propensity Score can be defined as the probability that each person has been treated (the probability that the treatment variable (D) is 1).
  • Propensity Score is the probability that each individual will receive vocational education .
  • Step S219 is the step of calculating processing parameters (D i) a first janchahang (D i -P (H i) ) less the propensity score (P (H i)) for each individual in each of the individual It can mean.
  • a Probit regression analysis method may be used in addition to the logistic regression analysis described above.
  • the least square method for regression analysis of D to H and P (H) Various methods can be used, and the above-described logistic regression analysis method is merely an embodiment.
  • step S220 will be continued.
  • step S220 the second residual-value calculating unit 120 calculates a first parameter value ), The conditional average value of the result variable (Y) At least one second parameter value included in the approximate model for ) Is applied to the approximate model to generate the parameter approximation model, and the second residual term, which is obtained by subtracting the parameter application approximation model from the result variable (Y), may be calculated.
  • the approximate model may mean various models used to approximate the conditional average value of the result variable Y, and the present invention is not limited to the specific approximate model.
  • the approximate model when the approximate model is in the form of a polynomial, the approximate model can be represented by Equation 8 below, but the present invention is not limited thereto.
  • Conditional mean value ⁇ 0, ⁇ 1, ⁇ 2, ⁇ n each is the second parameter
  • Y i is the result variable
  • H i 'for the i-th person is the nature of the i-th individual outcome variable (Y) vector
  • alpha is a first parameter
  • n is an arbitrary natural number determined to generate an approximate model.
  • step S220 is the result variable (Y) for 1, H ' ⁇ , (H ' ⁇ ) 2, ..., (H ' ⁇ ) n to apply the least square regression analysis (Least Squares Estimation) of the Step, but the present invention is not limited thereto.
  • step S220 will be described in more detail with reference to FIG.
  • step S220 includes a step S221 of generating a first parameter application approximation model, a step S223 of determining a second error term, a step S225 of determining a second parameter value, Generating an approximate model (S227), and calculating a second residual (S229).
  • step S221 the first parameter value ( ) May be applied to generate the first parameter application approximate model.
  • the first parameter applied approximate model can be generated as Equation (9) below, but the present invention is not limited thereto.
  • the first parameter value ( ) The conditional average value of the result variable Y, ⁇ 0 , ⁇ 1 , ⁇ 2 , ⁇ n is the second parameter, Y i is the result variable for the ith individual, H i '
  • Step S223 may refer to determining a second error term (u i) by subtracting the first parameter approximation model applied in the outcome variable (Y).
  • step S223 may refer to a step of determining a second error term u i by subtracting the first parameter applying approximate model from each individual result variable Y i .
  • Equation (10) the second error term u i can be calculated as Equation (10) below, but the present invention is not limited thereto.
  • u i is the individual error term
  • Y i is the individual result variable
  • step S225 the value of the second parameter (beta) that makes the square of the second error term (u i ) minimum becomes the second parameter value ). ≪ / RTI >
  • step S225 the value of the second parameter (?) Is set such that the sum of the squares of the individual second error terms (u i ) becomes a minimum, ). ≪ / RTI >
  • Equation (9) ⁇ 0 , ⁇ 1 , ⁇ 2 and ⁇ n are parameters to be estimated in the least squares method, 1, H' ⁇ , (H' ⁇ ) 2 , (H' ⁇ ) n represents the degree of impact on the outcome variable (Y i), the second error term (u i) is the result variable (Y i) is 1, H' ⁇ , (H' ⁇ ) 2 , (H' ⁇ ) n May refer to the remainder not described by < / RTI >
  • Equation (11) the sum of the squares of the second error terms u i used in step S225 may be expressed by Equation (11) below, but the present invention is not limited thereto.
  • Equation (11) the method for obtaining each of the second parameters (? 0 ,? 1 ,? 2 ,? N ) for minimizing the Equation (11) is the same as the known least squares method,
  • the second parameter value that minimizes one equation (11) is <
  • the above-described equation may be expressed for each of the second parameters (? 0 ,? 1 ,? 2 ,? N ) After differentiating, a value for making all the derived 1 gradation levels 0 be the second parameter value ( , , , ), But the present invention is not limited thereto.
  • Step S227 may refer to a step of generating a parameter application approximation model by applying a second parameter value to the first parameter application approximation model.
  • Equation (12) Equation (12) below, but the present invention is not limited thereto.
  • Step S229 may be a step of calculating a second residual, which is obtained by subtracting the parameter applying approximate model from the result variable (Y i ).
  • Equation (13) the second residual term can be calculated by Equation (13) below.
  • Step S230 will now be described with reference to FIG.
  • Step S230 may mean that the processing effect estimating unit 130 estimates the processing effect parameter y that the processing variable D has on the result variable Y based on the first and second residuals have.
  • step S230 the first residual is multiplied by the process effect parameter, the result of multiplying the first residual by the process effect parameter is subtracted from the second residual, and the process effect parameter value that minimizes the squared result And a step of estimating.
  • the processing effect parameter gamma may be estimated by applying a least squares method that performs a simple regression analysis of the second residual to the first residual, and the processing effect parameter gamma is used to control the personality variable H (D) on the outcome variable (Y).
  • step S230 may be a least squares method in which the second residual, which is the residual term of the result variable Y, is the dependent variable and the second residual, which is the residual term of the processing variable D, is the explanatory variable.
  • step S230 may be expressed as Equation (14) below, but the present invention is not limited thereto.
  • Bi is the second residual for the ith individual
  • Ai is the first residual for the ith person
  • is the treatment effect parameter
  • the step S230 may mean estimating the value of the processing effect parameter? That minimizes the above-described expression (14).
  • Y i 1 is a potential result variable when treatment is performed on the i-th person
  • Y i 0 is an i-th individual Which is a potential outcome variable when no treatment has been performed with respect to the target.
  • Y i 1 is the unemployment period when the i-th individual receives vocational education
  • Y i 0 is the time when the i-th individual has not received vocational education It means the period of unemployment.
  • step S230 is created by utilizing the least square method, according to one embodiment [P (H) ⁇ ⁇ 1 -P (H) ⁇ ] the weighted least squares method (weighted least squares estimator) that utilize -0.5 In this case, it is also possible to exclude data in which P (H) is close to 0 or 1 so that the weight approaches infinity.
  • D is a binary variable
  • the probability P1 (H), P2 (H), ..., PJ (H) that D becomes 1, 2, ..., J in step S210 can be obtained by various probability- (X), which is similar to the equation (13), is applied to the D1-P1 (X), ..., DJ-PJ J may have an effect on Y, respectively, and the present invention is not limited to the case where the processing variable D is a binary variable.
  • Table 1 shows a method of estimating a processing effect by the present invention (OLS-ps) and 16 other methods of estimating processing effects (for example, matching-M, regression adjustment method-RI, , Dual robustness estimation method (DR), etc.) using actual data.
  • OLS-ps a method of estimating a processing effect by the present invention
  • 16 other methods of estimating processing effects for example, matching-M, regression adjustment method-RI, , Dual robustness estimation method (DR), etc.

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Operations Research (AREA)
  • Probability & Statistics with Applications (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Algebra (AREA)
  • Evolutionary Biology (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Complex Calculations (AREA)

Abstract

제1 잔차항 산출부가, 처리변수에 대한 처리변수모형 및 처리변수모형에 포함된 제1 오차항에 대한 분포모형에 기초하여 제1 파라미터 값 및 성향점수를 산출하고, 처리변수에서 성향점수를 차감한 제1 잔차항을 산출하는 단계, 제2 잔차항 산출부가, 제1 파라미터 값에 기초하여 결과변수의 조건부평균값에 대한 근사모형에 포함된 적어도 하나의 제2 파라미터 값을 산출하여 근사모형에 적용함으로써 파라미터 적용 근사모형을 생성하고, 결과변수에서 파라미터 적용 근사모형을 차감한 제2 잔차항을 산출하는 단계 및 처리효과 추정부가, 제1 잔차항 및 제2 잔차항에 기초하여 처리변수가 결과변수에 미치는 처리효과 파라미터를 추정하는 단계를 포함하는, 성향점수 잔차항을 최소자승회귀분석에 활용하는 처리효과 추정 방법 및 이를 위한 장치에 관한 것이다.

Description

성향점수 잔차항을 최소자승회귀분석에 활용하는 처리효과 추정 방법 및 장치
본 발명은 성향점수 잔차항을 최소자승회귀분석에 활용하여 처리효과를 추정하기 위한 방법 및 장치에 관한 것이다.
처리(Treatment)는 정부정책, 직업교육 프로그램 등과 같이 선택적으로 변경이 가능하며 결과에 영향을 줄 수 있는 변수들을 지칭하는 것으로, 예를 들어 처리가 “직업교육 프로그램”인 경우 결과는 “실업기간”을 의미할 수 있다.
종래에 처리 효과(Treatment Effect)를 추정하기 위해서는 매칭(Matching) 방법을 활용하였으며, 매칭은 “처리”를 받는 사람들의 그룹과 “처리”를 받지 않는 사람들의 그룹에서 성격변수(H)가 비슷한 사람들을 뽑아 그들 사이에서 결과를 비교하여 처리의 효과를 추정하는 방법이다.
이때, 성격변수란 결과에 영향을 미칠 수 있는 요소들로, 예컨대 성별, 학력 등과 같은 개인적인 요소가 포함될 수 있다.
그러나, 종래의 매칭 방법은 활용 시에 “가장 비슷한” 것이 얼마나 비슷해야 하는지, 몇 명의 사람들을 비교해야 하는지 등의 선택 문제가 많고, 통계적 유의성을 판별하기 어려운 문제점이 있다.
[선행기술문헌]
한국 등록특허공보 제10-0557476호(2006.02.24.)
본 발명의 목적은, 상기 문제점을 해결하기 위한 것으로, 처리변수에 대한 처리변수모형 및 처리변수모형에 포함된 제1 오차항에 대한 분포모형에 기초하여 제1 파라미터 값 및 성향점수를 산출하고, 처리변수에서 성향점수를 차감한 제1 잔차항을 산출하고, 제1 파라미터 값에 기초하여 결과변수의 조건부평균값에 대한 근사모형에 포함된 적어도 하나의 제2 파라미터 값을 산출하여 근사모형에 적용함으로써 파라미터 적용 근사모형을 생성하고, 결과변수에서 파라미터 적용 근사모형을 차감한 제2 잔차항을 산출하고, 제1 잔차항 및 제2 잔차항에 기초하여 처리변수가 결과변수에 미치는 처리효과 파라미터를 추정하기 위함이다.
본 발명이 해결하고자 하는 과제는 이상에서 언급한 과제(들)로 제한되지 않으며, 언급되지 않은 또 다른 과제(들)은 아래의 기재로부터 당업자에게 명확하게 이해될 수 있을 것이다.
상기한 목적을 달성하기 위하여 본 발명의 실시예에 따른 성향점수 잔차항을 최소자승회귀분석에 활용하는 처리효과 추정 방법은 제1 잔차항 산출부가, 처리변수에 대한 처리변수모형 및 처리변수모형에 포함된 제1 오차항에 대한 분포모형에 기초하여 제1 파라미터 값 및 성향점수를 산출하고, 처리변수에서 성향점수를 차감한 제1 잔차항을 산출하는 단계, 제2 잔차항 산출부가, 제1 파라미터 값에 기초하여 결과변수의 조건부평균값에 대한 근사모형에 포함된 적어도 하나의 제2 파라미터 값을 산출하여 근사모형에 적용함으로써 파라미터 적용 근사모형을 생성하고, 결과변수에서 파라미터 적용 근사모형을 차감한 제2 잔차항을 산출하는 단계 및, 제1 잔차항 및 제2 잔차항에 기초하여 처리변수가 결과변수에 미치는 처리효과 파라미터를 추정하는 단계를 포함한다.
예컨대, 제1 잔차항을 산출하는 단계는, 처리변수모형 및 분포모형에 대응되는 개인별 우도 함수(likelihood function)를 결정하는 단계, 개인별 우도 함수를 모두 곱하여 샘플 우도 함수(sample likelihood function)를 산출하는 단계, 샘플 우도 함수가 최대값이 되도록 제1 파라미터 값을 결정하는 단계, 제1 파라미터 값 및 분포모형에 기초하여 성향점수를 산출하는 단계 및 처리변수에서 성향점수를 차감한 제1 잔차항을 산출하는 단계를 포함한다.
예컨대, 제1 파라미터 값을 결정하는 단계는, 샘플 우도 함수에 로그를 취하여 로그화 샘플 우도 함수를 산출하고, 로그화 샘플 우도 함수를 제1 파라미터에 대해 미분한 결과가 0이 되도록 하는 값을 제1 파라미터 값으로 결정하는 단계를 포함한다.
일 실시예에 따라, 제2 잔차항을 산출하는 단계는, 근사모형에 제1 파라미터 값을 적용하여 제1 파라미터 적용 근사모형을 생성하는 단계, 결과변수에서 제1 파라미터 적용 근사모형을 차감하여 제2 오차항을 결정하는 단계, 제2 오차항의 제곱이 최소가 되도록 하는 제2 파라미터의 값을 제2 파라미터 값으로 결정하는 단계, 제1 파라미터 적용 근사모형에 제2 파라미터 값을 적용하여 파라미터 적용 근사모형을 생성하는 단계 및 결과변수에서 파라미터 적용 근사모형을 차감한 제2 잔차항을 산출하는 단계를 포함한다.
예를 들어, 처리효과 파라미터를 추정하는 단계는, 제1 잔차항과 처리효과 파라미터를 곱한 뒤, 제2 잔차항에서 제1 잔차항과 처리효과 파라미터를 곱한 결과를 차감하고, 차감한 결과를 제곱한 결과를 최소로 하는 처리효과 파라미터 값을 추정하는 단계를 포함한다.
상기한 목적을 달성하기 위하여, 본 발명의 실시예에 따른 성향점수 잔차항을 최소자승회귀분석에 활용하는 처리효과 추정 장치는, 처리변수에 대한 처리변수모형 및 처리변수모형에 포함된 제1 오차항에 대한 분포모형에 기초하여 제1 파라미터 값 및 성향점수를 산출하고, 처리변수에서 성향점수를 차감한 제1 잔차항을 산출하는 제1 잔차항 산출부, 제1 파라미터 값에 기초하여 결과변수의 조건부평균값에 대한 근사모형에 포함된 적어도 하나의 제2 파라미터 값을 산출하여 근사모형에 적용함으로써 파라미터 적용 근사모형을 생성하고, 결과변수에서 파라미터 적용 근사모형을 차감한 제2 잔차항을 산출하는 제2 잔차항 산출부 및 제1 잔차항 및 제2 잔차항에 기초하여 처리변수가 결과변수에 미치는 처리효과 파라미터를 추정하는 처리효과 추정부를 포함한다.
예를 들어, 제1 잔차항 산출부는, 처리변수모형 및 분포모형에 대응되는 개인별 우도 함수(likelihood function)를 결정하고, 개인별 우도 함수를 모두 곱하여 샘플 우도 함수(sample likelihood function)를 산출하고, 샘플 우도 함수가 최대값이 되도록 제1 파라미터 값을 결정하고, 제1 파라미터 값 및 분포모형에 기초하여 성향점수를 산출하고, 처리변수에서 성향점수를 차감한 제1 잔차항을 산출한다.
예컨대, 제1 잔차항 산출부는, 샘플 우도 함수에 로그를 취하여 로그화 샘플 우도 함수를 산출하고, 로그화 샘플 우도 함수를 제1 파라미터에 대해 미분한 결과가 0이 되도록 하는 값을 제1 파라미터 값으로 결정한다.
일 실시예에 따라, 제2 잔차항 산출부는, 근사모형에 제1 파라미터 값을 적용하여 제1 파라미터 적용 근사모형을 생성하고, 결과변수에서 제1 파라미터 적용 근사모형을 차감하여 제2 오차항을 결정하고, 제2 오차항의 제곱이 최소가 되도록 하는 제2 파라미터의 값을 제2 파라미터 값으로 결정하고, 결과변수에서 제 2 파라미터 적용 근사모형을 차감한 제2 잔차항을 산출한다.
일 실시예에 따라, 처리효과 추정부는, 제1 잔차항과 처리효과 파라미터를 곱한 뒤, 제2 잔차항에서 제1 잔차항과 처리효과 파라미터를 곱한 결과를 차감하고, 차감한 결과를 제곱한 결과를 최소로 하는 상기 처리효과 파라미터 값을 추정한다.
본 발명의 일 실시예에 따르면, 처리변수에 대한 처리변수모형 및 처리변수모형에 포함된 제1 오차항에 대한 분포모형에 기초하여 제1 파라미터 값 및 성향점수를 산출하고, 처리변수에서 성향점수를 차감한 제1 잔차항을 산출하고, 제1 파라미터 값에 기초하여 결과변수의 조건부평균값에 대한 근사모형에 포함된 적어도 하나의 제2 파라미터 값을 산출하여 근사모형에 적용함으로써 파라미터 적용 근사모형을 생성하고, 결과변수에서 파라미터 적용 근사모형을 차감한 제2 잔차항을 산출하고, 제1 잔차항 및 제2 잔차항에 기초하여 처리변수가 결과변수에 미치는 처리효과 파라미터를 추정함으로써, 사용하기가 간단하고 통계적 유의성을 쉽게 판별할 수 있는 처리효과 추정 방법 및 장치를 제공할 수 있다.
도 1은 본 발명의 실시예에 따른, 성향점수 잔차항을 최소자승회귀분석에 활용하는 처리효과 추정 장치를 설명하기 위한 구성도이다.
도 2는 본 발명의 실시예에 따른, 성향점수 잔차항을 최소자승회귀분석에 활용하는 처리효과 추정 방법을 설명하기 위한 순서도이다.
도 3은 본 발명의 실시예에 따른, 성향점수 잔차항을 최소자승회귀분석에 활용하는 처리효과 추정 방법에서 제1 잔차항을 산출하는 단계를 설명하기 위한 순서도이다.
도 4는 본 발명의 실시예에 따른, 성향점수 잔차항을 최소자승회귀분석에 활용하는 처리효과 추정 방법에서 제2 잔차항을 산출하는 단계를 설명하기 위한 순서도이다.
이하, 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자가 본 발명의 기술적 사상을 용이하게 실시할 수 있을 정도로 상세히 설명하기 위하여, 본 발명의 가장 바람직한 실시예를 첨부 도면을 참조하여 설명하기로 한다. 우선 각 도면의 구성요소들에 참조부호를 부가함에 있어서, 동일한 구성요소들에 대해서는 비록 다른 도면상에 표시되더라도 가능한 한 동일한 부호를 가지도록 하고 있음에 유의해야 한다. 또한, 본 발명을 설명함에 있어, 관련된 공지 구성 또는 기능에 대한 구체적인 설명이 본 발명의 요지를 흐릴 수 있다고 판단되는 경우에는 그 상세한 설명은 생략한다.
이하, 본 발명의 실시예에 따른 성향점수 잔차항을 최소자승회귀분석에 활용하는 처리효과 추정 방법 및 장치를 첨부된 도면을 참조하여 상세하게 설명하면 아래와 같다.
우선, 본 발명의 실시예에 따른 성향점수 잔차항을 최소자승회귀분석에 활용하는 처리효과 추정 방법 및 장치에서 활용하는 처리(Treatment), 처리변수(D), 성격변수(H) 및 결과변수(Y)에 대하여 정의한다.
예를 들어, 처리(Treatment)는 정부정책 및 직업교육 프로그램 등과 같이 선택적으로 변경이 가능하며 결과변수(Y)에 영향을 줄 수 있는 변수들을 의미할 수 있다.
예컨대, 결과변수(Y)가 실업 기간인 경우 처리(Treatment)는 정부의 실업자 직업교육 정책을 의미할 수 있다.
예를 들어, 처리변수(D)는 이항변수로써, 특정 개인이 처리(Treatment)를 받았는지의 유무를 나타내며, Di가 1이라는 것의 의미는 분석 대상 그룹의 i번째 개인은 처리(Treatment)를 받았음을 의미하며, Dj가 0이라는 것의 의미는 분석 대상 그룹의 j번째 개인은 처리(Treatment)를 받지 않았음을 의미할 수 있다.
예를 들어, 처리(Treatment)가 정부의 실업자 직업교육 정책인 경우 Di가 1이라면 분석 대상 그룹의 i번째 개인은 실업자 직업교육을 받았음을 의미하고, Di가 0이라면 분석 대상 그룹의 i번째 개인은 실업자 직업교육을 받지 않았음을 의미할 수 있다.
예컨대, 성격변수(H)는 결과변수(Y)에 영향을 줄 수 있는 변수들 중 통제 변수를 의미하며, 개인의 성격, 성별, 나이 등 결과변수(Y)에 영향을 줄 수 있는 통제변수를 의미할 수 있다.
예를 들어, 결과변수(Y)는 처리변수(D)에 대한 종속변수로써, 처리(Treatment)가 정부의 실업자 직업교육 정책인 경우, 결과변수(Y)는 “실업기간”을 의미할 수 있다.
예컨대, 처리(Treatment)가 정부의 실업자 직업교육 정책이고, 처리변수(D)가 정부의 실업자 직업교육을 받았는지 여부이며, 결과변수(Y)가 실업기간을 의미한다면, 본 발명의 실시예에 따른 성향점수 잔차항을 최소자승회귀분석에 활용하는 처리효과 추정 방법 및 장치는 직업교육이 실업기간에 미치는 영향인 처리효과 파라미터(γ)를 추정할 수 있다.
이하, 도 1을 참조하여 본 발명의 실시예에 따른 성향점수 잔차항을 최소자승회귀분석에 활용하는 처리효과 추정 장치(100)를 설명한다.
도 1은 본 발명의 실시예에 따른, 성향점수 잔차항을 최소자승회귀분석에 활용하는 처리효과 추정 장치를 설명하기 위한 구성도이다.
도 1에 도시된 바와 같이, 본 발명의 실시예에 따른, 성향점수 잔차항을 최소자승회귀분석에 활용하는 처리효과 추정 장치(100)는 제1 잔차항 산출부(110), 제2 잔차항 산출부(120) 및 처리효과 추정부(130)를 포함한다.
제1 잔차항 산출부(110)는 처리변수(D)에 대한 처리변수모형 및 처리변수모형에 포함된 제1 오차항(v)에 대한 분포모형에 기초하여 제1 파라미터 값(
Figure PCTKR2018014395-appb-I000001
) 및 성향점수(P(Hi))를 산출하고, 처리변수(D)에서 성향점수(P(Hi))를 차감한 제1 잔차항을 산출한다.
예컨대, 제1 잔차항 산출부(110)는, 처리변수모형 및 분포모형에 대응되는 개인별 우도 함수(likelihood function)를 결정하고, 개인별 우도 함수를 모두 곱하여 샘플 우도 함수(sample likelihood function)를 산출하고, 샘플 우도 함수가 최대값이 되도록 제1 파라미터 값(
Figure PCTKR2018014395-appb-I000002
)을 결정하고, 제1 파라미터 값(
Figure PCTKR2018014395-appb-I000003
) 및 분포모형에 기초하여 성향점수(P(Hi))를 산출하고, 처리변수(D)에서 상기 성향점수(P(Hi))를 차감한 제1 잔차항을 산출할 수 있다.
예컨대, 제1 잔차항 산출부(110)는, 샘플 우도 함수에 로그를 취하여 로그화 샘플 우도 함수를 산출하고, 로그화 샘플 우도 함수를 제1 파라미터에 대해 미분한 결과가 0이 되도록 하는 값을 제1 파라미터 값(
Figure PCTKR2018014395-appb-I000004
)으로 결정한다.
제2 잔차항 산출부(120)는 제1 파라미터 값(
Figure PCTKR2018014395-appb-I000005
)에 기초하여 결과변수(Y)의 조건부평균값(
Figure PCTKR2018014395-appb-I000006
)에 대한 근사모형에 포함된 적어도 하나의 제2 파라미터 값(
Figure PCTKR2018014395-appb-I000007
)을 산출하여 근사모형에 적용함으로써 파라미터 적용 근사모형을 생성하고, 결과변수(Y)에서 파라미터 적용 근사모형을 차감한 제2 잔차항을 산출한다.
예컨대, 제2 잔차항 산출부는, 근사모형에 제1 파라미터 값(
Figure PCTKR2018014395-appb-I000008
)을 적용하여 제1 파라미터 적용 근사모형을 생성하고, 결과변수(Y)에서 제1 파라미터 적용 근사모형을 차감하여 제2 오차항을 결정하고, 제2 오차항의 제곱이 최소가 되도록 하는 제2 파라미터(β)의 값을 상기 제2 파라미터 값(
Figure PCTKR2018014395-appb-I000009
)으로 결정하고, 제1 파라미터 적용 근사모형에 제2 파라미터 값(
Figure PCTKR2018014395-appb-I000010
)을 적용하여 파라미터 적용 근사모형을 생성하고, 결과변수(Y)에서 파라미터 적용 근사모형을 차감한 제2 잔차항을 산출한다.
처리효과 추정부(130)는 제1 잔차항 및 제2 잔차항에 기초하여 처리변수(D)가 결과변수(Y)에 미치는 처리효과 파라미터(γ)를 추정한다.
예컨대, 처리효과 추정부(130)는, 제1 잔차항과 처리효과 파라미터(γ)를 곱한 뒤, 제2 잔차항에서 제1 잔차항과 처리효과 파라미터(γ)를 곱한 결과를 차감하고, 그 제곱한 결과를 최소로 하는 처리효과 파라미터 값을 추정한다.
본 발명의 실시예에 따른, 성향점수 잔차항을 최소자승회귀분석에 활용하는 처리효과 추정 장치(100)에 대한 보다 구체적인 설명은 이하 도 2 내지 도 4를 참조하여 후술하도록 하며, 중복되는 설명은 생략한다.
이하, 도 2를 참조하여, 본 발명의 실시예에 따른 성향점수 잔차항을 최소자승회귀분석에 활용하는 처리효과 추정 방법을 설명한다.
도 2는 본 발명의 실시예에 따른, 성향점수 잔차항을 최소자승회귀분석에 활용하는 처리효과 추정 방법을 설명하기 위한 순서도이다.
도 2에 도시된 바와 같이, 본 발명의 실시예에 따른 성향점수 잔차항을 최소자승회귀분석에 활용하는 처리효과 추정 방법은 제1 잔차항을 산출하는 단계(S210), 제2 잔차항을 산출하는 단계(S220) 및 제1 잔차항과 제2 잔차항에 기초하여 처리효과 파라미터를 추정하는 단계(S230)를 포함한다.
S210 단계는, 제1 잔차항 산출부(110)가, 처리변수(D)에 대한 처리변수모형 및 처리변수모형에 포함된 제1 오차항(v)에 대한 분포모형에 기초하여 제1 파라미터 값(
Figure PCTKR2018014395-appb-I000011
) 및 성향점수(P(Hi))를 산출하고, 처리변수(D)에서 성향점수(P(Hi))를 차감한 제1 잔차항을 산출하는 단계를 의미할 수 있다.
예를 들어, 처리변수(D)에 대한 처리변수모형은 회귀모형을 포함하되, 0 내지 1 사이의 범위를 가지는 이항 변수에 대하여 회귀 분석을 위해 활용되는 모형으로 기존에 공지된 각종 모형 중 적어도 하나를 의미할 수 있다.
예를 들어, 처리변수(D)가 이항 변수가 아니라 0,1,2,...,J의 값을 가지는 순서적(ordinal) 또는 범주형(categorical) 다항처리(multiple treatment)인 경우, 회귀 모형은 순서적(ordinal) 또는 범주형(categorical) 다항처리(multiple treatment)를 위한 각종 모형 중 적어도 하나를 의미할 수도 있다.
다시 말해, 처리변수모형은 처리변수(D)를 성격변수(H)에 대해 회귀 분석하기 위한 모형으로, 처리(Treatment)가 정부의 실업자 직업교육 정책인 경우, 처리변수(D)는 직업교육 여부를 의미하고, 성격변수(H)는 개인의 나이, 성별 등 각종 변수를 의미할 수 있다.
예를 들어, 처리변수모형이 로지스틱 회귀 분석(Logistic Regression)을 위한 모형인 경우, 처리변수모형은 아래 수학식 1과 같이 생성될 수 있으나, 본 발명은 이에 한정되지 않으며, 본 발명은 프로빗(Probit)을 비롯하여 다른 처리변수모형을 활용할 수 있다.
[수학식 1]
Figure PCTKR2018014395-appb-I000012
이때, Di *는 i번째 개인에 대한 잠재변수(latent variable)로 연속 변수의 성질을 나타내며, Hi '는 i번째 개인에 대한 적어도 하나 이상의 성격변수(H)를 포함하는 성격벡터, α는 제1 파라미터 벡터, vi는 i번째 개인에 대한 제1 오차항, Di는 i번째 개인에 대한 처리변수, i는 1 내지 N의 범위를 가지는 주어진 자료 내에서 i번째 개인, Hi 'α은 잠재변수(Di *)의 회귀 모형을 의미한다.
예를 들어, 성격벡터(Hi ')가 [M by 1] 벡터인 경우, 제1 파라미터 벡터(α)는 [M by 1] 벡터를 의미할 수 있으며, 이 경우, 벡터의 내적 연산에 의하여 Hi 'α는 스칼라(scalar) 값을 가질 수 있다.
여기서, 잠재변수(Di *)가 0 보다 크거나 같은 경우 처리변수(Di)는 1이 되고, 잠재변수(Di *)가 0 보다 작은 경우 처리변수(Di)는 0이 될 수 있다.
한편, 제1 파라미터 벡터(α)는 로지스틱 회귀 분석(Logistic Regression)에서 추정하고자 하는 모수(parameter)로서 개인의 성격을 의미하는 성격변수(Hi)가 잠재변수(Di)에 미치는 영향의 정도를 나타낸다.
한편, 제1 오차항(error term, vi)은 잠재변수(Di *)에서 성격변수(Hi)가 설명하지 못하는 부분을 나타낸다.
예를 들어, 제1 오차항(vi)이 로지스틱 분포를 따르는 경우, 제1 오차항(vi)에 대한 분포모형은 아래 수학식 2와 같을 수 있으나, 본 발명은 제1 오차항(vi)이 로지스틱 분포를 따르는 경우에 한정되지 않고, 제1 오차항(vi)은 로지스틱 분포 외에도 정규분포를 비롯한 각종 분포를 따를 수도 있다.
[수학식 2]
Figure PCTKR2018014395-appb-I000013
이때, G(v)는 제1 오차항(vi)의 분포함수를 의미하며, 이러한 로지스틱 분포는 0을 중심으로 대칭이다.
이때, 수학식 1에 기재된 모형 및 수학식 2에 기재된 분포모형은 일 실시예로써, 본 발명은 수학식 1 및 수학식 2로 한정되지 않는다.
이제, 도 3을 참조하여 S210 단계를 계속 설명한다.
도 3은 본 발명의 실시예에 따른, 성향점수 잔차항을 최소자승회귀분석에 활용하는 처리효과 추정 방법에서 제1 잔차항을 산출하는 단계를 설명하기 위한 순서도이다.
도 3에 도시된 바와 같이, S210 단계는 개인별 우도 함수를 결정하는 단계(S211), 샘플 우도 함수를 산출하는 단계(S213), 제1 파라미터 값을 결정하는 단계(S215), 성향점수를 산출하는 단계(S217) 및 제1 잔차항을 산출하는 단계를 포함한다.
S211 단계는, 처리변수모형 및 분포모형에 대응되는 개인별 우도 함수(likelihood function)를 결정하는 단계를 의미할 수 있다.
예를 들어, 처리변수모형이 상술한 수학식 1과 같고 분포모형이 상술한 수학식 2와 같은 경우, 개인별 우도 함수는 아래 수학식 3과 같이 산출될 수 있다.
한편, 처리변수모형 및 분포모형이 상술한 수학식 1 및 수학식 2와 다른 경우, 개인별 우도 함수는 기 공지된 최대 우도 추정 알고리즘(Maximum Likelihood Estimator)에서 결정하는 각종 우도 함수 결정 방식을 따를 수 있으며, 본 발명에 따른 개인별 우도 함수는 아래 수학식 3에 한정되지 않는다.
[수학식 3]
Figure PCTKR2018014395-appb-I000014
이때, G()는 제1 오차항(vi)의 분포함수, Hi '는 i번째 개인에 대한 적어도 하나 이상의 성격변수(H)를 포함하는 성격벡터, α는 제1 파라미터 벡터, Di는 i번째 개인에 대한 처리변수를 의미한다.
S213 단계는, 개인별 우도 함수를 모두 곱하여 샘플 우도 함수(sample likelihood function)를 산출하는 단계를 의미할 수 있다.
이때, 샘플 우도 함수(sample likelihood function)는 아래 수학식 4에 의해 결정된다.
[수학식 4]
Figure PCTKR2018014395-appb-I000015
이때, L(α)는 샘플 우도 함수를 의미한다.
S215 단계는, 샘플 우도 함수가 최대값이 되도록 제1 파라미터(α) 값을 결정하는 단계를 의미할 수 있다.
예를 들어, S215 단계는, 샘플 우도 함수에 로그를 취하여 로그화 샘플 우도 함수를 산출하고, 로그화 샘플 우도 함수를 제1 파라미터에 대해 미분한 결과가 0이 되도록 하는 값을 제1 파라미터 값으로 결정하는 단계를 포함할 수 있다.
예를 들어, 상술한 S211 단계 내지 S215 단계는 일종의 최대 우도 추정 알고리즘(Maximum Likelihood Estimator)을 의미할 수 있으며, 처리변수(D)모형의 오차항이 로지스틱 분포를 따르는 경우 로지스틱 분포에 기반한 이항변수에 대한 최대 우도 추정 알고리즘(Maximum Likelihood Estimator)을 의미할 수 있고, 처리변수(D)모형의 오차항이 정규 분포를 따르는 경우 정규 분포에 기반한 이항변수에 대한 최대 우도 추정 알고리즘(Maximum Likelihood Estimator)을 의미할 수 있다.
이때, 샘플 우도 함수가 최대값이 되도록 하는 제1 파라미터(α)의 값인 제1 파라미터 값(
Figure PCTKR2018014395-appb-I000016
)을 추정하는 과정은 로지스틱 회귀 분석(logistic regression)결과를 의미할 수 있으나, 본 발명은 이에 한정되지 않는다.
예컨대, S215 단계에서 활용되는 로그화 샘플 우도 함수는 아래 수학식 5와 같이 표현될 수 있다.
[수학식 5]
Figure PCTKR2018014395-appb-I000017
한편, 로그화 샘플 우도 함수를 제1 파라미터(α)에 대해 미분한 결과는 아래 수학식 6과 같이 표현될 수 있다.
[수학식 6]
Figure PCTKR2018014395-appb-I000018
이때, 수학식 6을 0으로 만드는 제1 파라미터(α)의 값은 샘플 우도 함수가 최대값이 되도록 하는 제1 파라미터 값(
Figure PCTKR2018014395-appb-I000019
)을 의미할 수 있다.
S217 단계는, 제1 파라미터 값(
Figure PCTKR2018014395-appb-I000020
) 및 처리변수모형에 기초하여 성향점수를 산출하는 단계를 의미할 수 있다.
예를 들어, S217 단계는 상술한 수학식 2의 분포함수에 성격벡터(Hi ')와 샘플 우도 함수가 최대값이 되도록 하는 제1 파라미터 값(
Figure PCTKR2018014395-appb-I000021
)을 대입하여, 성향점수를 산출하는 단계를 의미할 수 있으며 이러한 과정은 하기의 수학식 7과 같을 수 있으나, 본 발명은 이에 한정되지 않는다.
[수학식 7]
Figure PCTKR2018014395-appb-I000022
이때, P(Hi)는 성향 점수, Hi는 i번째 개인에 대한 성격변수, G( )는 제1 오차항(vi)의 분포함수, Hi '는 i번째 개인에 대한 성격벡터,
Figure PCTKR2018014395-appb-I000023
는 샘플 우도 함수가 최대값이 되도록 하는 제1 파라미터 값을 의미한다.
예를 들어, 성향 점수(Propensity Score)는 각 개인이 처리(Treatment)를 받았을 확률(처리변수(D)가 1인 확률)로 정의할 수 있다.
예를 들어, 처리(Treatment)가 정부의 실업자 직업교육 정책인 경우, 성향 점수(Propensity Score)는 각 개인이 직업 교육을 받을 확률인
Figure PCTKR2018014395-appb-I000024
로 정의할 수 있다.
S219 단계는, 각각의 개인에 대한 처리변수(Di)에서 각 개인에 대한 성향점수(P(Hi))를 차감한 제1 잔차항(Di-P(Hi))을 산출하는 단계를 의미할 수 있다.
예를 들어, S211 내지 S219 단계에서는 상술한 로지스틱 회귀 분석 외에도 프로빗(Probit) 회귀 분석 방식을 사용할 수도 있으며, D를 H에 회귀분석하는 최소자승법 및 기타 H를 예측하기 위하여 P(H)를 구하는 각종 방법이 활용가능하며, 상술한 로지스틱 회귀 분석 방식은 일 실시예에 불과하다.
다시 도 2를 참조하여, S220 단계를 계속 설명한다.
S220 단계는, 제2 잔차항 산출부(120)가, 제1 파라미터 값(
Figure PCTKR2018014395-appb-I000025
)에 기초하여 결과변수(Y)의 조건부평균값(
Figure PCTKR2018014395-appb-I000026
)에 대한 근사모형에 포함된 적어도 하나의 제2 파라미터 값(
Figure PCTKR2018014395-appb-I000027
)을 산출하여 근사모형에 적용함으로써 파라미터 적용 근사모형을 생성하고, 결과변수(Y)에서 파라미터 적용 근사모형을 차감한 제2 잔차항을 산출하는 단계를 의미할 수 있다.
이때, 근사모형은 결과변수(Y)의 조건부평균값을 근사하기 위해 활용되는 각종 모형을 의미할 수 있으며, 본 발명은 특정 근사모형으로 한정되지 않는다.
예를 들어, 근사모형이 다항식의 형태인 경우, 근사모형은 아래 수학식 8과 같이 도시될 수 있으나, 본 발명은 이에 한정되지 않는다.
[수학식 8]
Figure PCTKR2018014395-appb-I000028
이때,
Figure PCTKR2018014395-appb-I000029
는 결과변수(Y)의 조건부평균값, β0, β1, β2, βn 각각은 제2 파라미터, Yi는 i번째 개인에 대한 결과변수, Hi '는 i번째 개인에 대한 성격벡터, α는 제1 파라미터, n은 근사모형을 생성하기 위해 결정된 임의의 자연수를 의미한다.
예를 들어, S220 단계는 결과변수(Y)를 1, H'α, (H'α)2, ... , (H'α)n에 회귀분석하는 최소자승법(Least Squares Estimation)을 적용하는 단계를 의미할 수 있으나, 본 발명은 이에 한정되지 않는다.
이하, 도 4를 참조하여, S220 단계에 대하여 보다 구체적으로 설명한다.
도 4에 도시된 바와 같이, S220 단계는 제1 파라미터 적용 근사모형을 생성하는 단계(S221), 제2 오차항을 결정하는 단계(S223), 제2 파라미터 값을 결정하는 단계(S225), 파라미터 적용 근사모형을 생성하는 단계(S227) 및 제2 잔차항을 산출하는 단계(S229)를 포함한다.
S221 단계는, 근사모형에 제1 파라미터 값(
Figure PCTKR2018014395-appb-I000030
)을 적용하여 제1 파라미터 적용 근사모형을 생성하는 단계를 의미할 수 있다.
이때, 근사모형이 상술한 수학식 8과 같은 경우, 제1 파라미터 적용 근사모형은 아래 수학식 9와 같이 생성될 수 있으나, 본 발명은 이에 한정되지 않는다.
[수학식 9]
Figure PCTKR2018014395-appb-I000031
이때,
Figure PCTKR2018014395-appb-I000032
는 제1 파라미터 값(
Figure PCTKR2018014395-appb-I000033
)을 적용했을 때, 결과변수(Y)의 조건부 평균값, β0, β1, β2, βn 각각은 제2 파라미터, Yi는 i번째 개인에 대한 결과변수, Hi '는 i번째 개인에 대한 성격벡터,
Figure PCTKR2018014395-appb-I000034
는 샘플 우도 함수가 최대값이 되도록 하는 제1 파라미터 값, n은 근사모형을 생성하기 위해 결정된 임의의 자연수를 의미한다.
S223 단계는 결과변수(Y)에서 제1 파라미터 적용 근사모형을 차감하여 제2 오차항(ui)을 결정하는 단계를 의미할 수 있다.
예를 들어, S223 단계는 각각의 개인별 결과변수(Yi)에서 제1 파라미터 적용 근사모형을 차감하여 제2 오차항(ui)을 결정하는 단계를 의미할 수 있다.
예컨대, 제1 파라미터 적용 근사모형이 상술한 수학식 9와 같은 경우, 제2 오차항(ui)은 아래 수학식 10과 같이 산출될 수 있으나, 본 발명은 이에 한정되지 않는다.
[수학식 10]
Figure PCTKR2018014395-appb-I000035
이때, ui는 각각의 개인별 오차항, Yi는 각각의 개인별 결과변수,
Figure PCTKR2018014395-appb-I000036
는 각각의 개인별 제1 파라미터 적용 근사모형을 의미한다.
S225 단계는, 제2 오차항(ui)의 제곱이 최소가 되도록 하는 제2 파라미터(β)의 값을 제2 파라미터 값(
Figure PCTKR2018014395-appb-I000037
)으로 결정하는 단계를 의미할 수 있다.
보다 구체적으로, S225 단계는 각각의 개인별 제2 오차항(ui)의 제곱의 총합이 최소가 되도록 하는 제2 파라미터(β)의 값을 제2 파라미터 값(
Figure PCTKR2018014395-appb-I000038
)으로 결정하는 단계를 의미할 수 있다.
상술한 수학식 9에서, β0, β1, β2, βn 각각은 최소자승법에서 추정하고자 하는 모수(parameter)로써, 1, H'α, (H'α)2, (H'α)n이 결과변수(Yi)에 미치는 영향의 정도를 나타내고, 제2 오차항(ui)은 결과변수(Yi)가 1, H'α, (H'α)2, (H'α)n에 의하여 설명되지 않는 나머지 부분을 의미할 수 있다.
예를 들어, S225 단계에서 활용되는 개인별 제2 오차항(ui)의 제곱의 총합은 아래 수학식 11과 같이 나타날 수 있으나, 본 발명은 이에 한정되지 않는다.
[수학식 11]
Figure PCTKR2018014395-appb-I000039
이때, 상술한 수학식 11이 최소가 되도록 하는 제2 파라미터(β0, β1, β2, βn) 각각을 구하는 방법은 기존에 공지된 최소자승법과 동일하므로 그 구체적인 설명을 생략하며, 상술한 수학식 11이 최소가 되도록 하는 제2 파라미터 값은
Figure PCTKR2018014395-appb-I000040
,
Figure PCTKR2018014395-appb-I000041
,
Figure PCTKR2018014395-appb-I000042
,
Figure PCTKR2018014395-appb-I000043
과 같이 표현될 수 있다.
예를 들어, 상술한 수학식 11이 최소가 되도록 하는 적어도 하나의 제2 파라미터 값을 산출하기 위하여, 상술한 수학식을 제2 파라미터(β0, β1, β2, βn) 각각에 대하여 미분한 뒤, 도출된 1계조건을 모두 0으로 만드는 값을 제2 파라미터 값(
Figure PCTKR2018014395-appb-I000044
,
Figure PCTKR2018014395-appb-I000045
,
Figure PCTKR2018014395-appb-I000046
,
Figure PCTKR2018014395-appb-I000047
)으로 산출할 수 있으나, 본 발명은 이에 한정되지 않는다.
S227 단계는, 제1 파라미터 적용 근사모형에 제2 파라미터 값을 적용하여 파라미터 적용 근사모형을 생성하는 단계를 의미할 수 있다.
예를 들어, 제1 파라미터 적용 근사모형이 상기한 수학식 9와 같고 제2 파라미터 값이 (
Figure PCTKR2018014395-appb-I000048
,
Figure PCTKR2018014395-appb-I000049
,
Figure PCTKR2018014395-appb-I000050
,
Figure PCTKR2018014395-appb-I000051
)인 경우, 파라미터 적용 근사모형은 아래 수학식 12와 같이 산출될 수 있으나, 본 발명은 이에 한정되지 않는다.
[수학식 12]
Figure PCTKR2018014395-appb-I000052
S229 단계는, 결과변수(Yi)에서 파라미터 적용 근사모형을 차감한 제2 잔차항을 산출하는 단계를 의미할 수 있다.
이때, 제2 잔차항은 아래 수학식 13과 같이 산출될 수 있다.
[수학식 13]
Figure PCTKR2018014395-appb-I000053
계속, 도 2를 참조하여 S230 단계를 설명한다.
S230 단계는, 처리효과 추정부(130)가, 제1 잔차항 및 제2 잔차항에 기초하여 처리변수(D)가 결과변수(Y)에 미치는 처리효과 파라미터(γ)를 추정하는 단계를 의미할 수 있다.
예를 들어, S230 단계는 제1 잔차항과 처리효과 파라미터를 곱한 뒤, 제2 잔차항에서 제1 잔차항과 처리효과 파라미터를 곱한 결과를 차감하고, 이를 제곱한 결과를 최소로 하는 상기 처리효과 파라미터 값을 추정하는 단계를 포함할 수 있다.
예컨대, S230 단계는 제2 잔차항을 제1 잔차항에 단순 회귀 분석하는 최소자승법을 적용함으로써, 처리효과 파라미터(γ)를 추정할 수 있으며, 그 처리효과 파라미터(γ)는 성격변수(H)를 통제한 상태에서 처리변수(D)가 결과변수(Y)에 미치는 효과를 의미할 수 있다.
예컨대, S230 단계는 결과변수(Y)의 잔차항인 제2 잔차항을 종속 변수로하고 처리변수(D)의 잔차항인 제2 잔차항을 설명 변수로 하는 최소자승법을 의미할 수 도 있다.
이때, S230 단계는 아래 수학식 14와 같이 표현될 수 있으나, 본 발명은 이에 한정되지 않는다.
[수학식 14]
Figure PCTKR2018014395-appb-I000054
이때 Bi는 i번째 개인에 대한 제2 잔차항, Ai는 i번째 개인에 대한 제1 잔차항, γ는 처리효과 파라미터를 의미한다.
예를 들어, S230 단계는 상술한 수학식 14를 최소로 하는 처리효과 파라미터(γ)의 값을 추정하는 단계를 의미할 수 있다.
이때, 처리효과 파라미터(γ)의 의미는 아래 수학식 15와 같이 설명될 수 있다.
[수학식 15]
Figure PCTKR2018014395-appb-I000055
이때, γ는 처리효과 파라미터, N은 분석 대상 그룹에 포함되는 전체 개인의 수, Yi 1은 i번째 개인에 대하여 처리(treatment)가 수행되었을 때의 잠재적 결과변수, Yi 0는 i 번째 개인에 대하여 처리(treatment)가 수행되지 않았을 때의 잠재적 결과변수를 의미한다.
예를 들어, 처리(Treatment)가 정부의 실업자 직업교육 정책인 경우, Yi 1은 i번째 개인이 직업교육을 받았을 때의 실업기간, Yi 0는 i 번째 개인이 직업교육을 받지 않았을 때의 실업기간을 의미한다.
상술한 S230 단계의 예시는 최소자승법을 활용하는 것으로 작성되었으나, 일 실시예에 따르면 [P(H)×{1-P(H)}]-0.5를 활용하는 가중최소자승법(weighted least squares estimator)를 활용할 수도 있으며, 이 경우, P(H)가 0 또는 1에 가까워 가중치가 무한대에 가까워지는 자료들을 제외하는 것도 가능하다.
예를 들어, 본 발명의 실시예에 따른 회귀분석을 활용하는 처리효과 추정 방법 및 장치는, 처리변수(D)가 이항변수인 경우로 설명되었으나, 처리변수(D)가 이항변수가 아니라, 0,1,2,...,J의 값을 갖는 순서적(ordinal) 혹은 범주형(categorical) 다항처리(multiple treatment)인 경우, 이항더미변수 Dj를 D=j의 경우로 정의(즉, D=j이면 Dj=1이며 아니면 Dj=0)하여 적용될 수도 있다.
이 경우, S210 단계에서 D가 1,2,...,J가 될 확률 P1(H), P2(H),...,PJ(H)를 다양한 확률기반 연산 기법으로 구할 수 있으며, 최종적으로 수학식 13과 유사한 종속변수를 D1-P1(X),...,DJ-PJ(X)에 회귀분석 하는 최소자승법을 적용하면, 그 추정계수들은 D=1,2,...,J가 각각 Y에 주는 효과가 될 수 있으며, 본 발명은 처리변수(D)가 이항변수인 경우로 한정되지 않는다.
본 발명의 우수성을 나타내기 위하여, 표 1은 본 발명(OLS-ps)에 의한 처리효과 추정방법과 기존 16개의 다른 처리효과 추정방법 (예컨대 매칭-M, 회귀조정방법-RI, 완전페어링-CP, 이중견고추정방법-DR 등)을 실제 자료를 사용하여 비교한 결과를 보여준다. 여기서 사용된 자료는 유럽의 “Survey of Health, Ageing and Retirement in Europe (SHARE)” 에서 추출된 은퇴와 소비에 대한 2004-2015 자료이다.
먼저, 복잡하고 시간이 많이 소요되는 비모수 추정방법을 사용하여 은퇴가 소비에 주는 영향을 정교하게 추정한 다음, 위의 17개 처리효과 추정방법들을 사용하여 은퇴가 소비에 주는 영향을 추정한 후, 그 17개의 추정값들이 비모수추정의 정교한 값과 얼마나 다른지를 비교하는 실험을 하였다. 그 결과, 표 1에서 볼 수 있듯이 본 발명(표1에서 OLS-ps열)이 압도적으로 작은 편차(bias)를 보였다는 것을 확인할 수 있다.
처리효과 추정 방법 종류 Bias
RI2-ps 0.89
M1-ps 1.26
M5-ps 1.00
MT1-ps 0.77
CP1-ps 1.06
OLS-ps 0.29
RI-lin 0.51
RI2-pgs 0.66
M1-pgs 0.70
M5-pgs 0.50
MT1-pgs 0.48
CP1-pgs 0.65
RI2-ppgs 0.99
M1-ppgs 1.17
MT1-ppgs 0.98
DR-c 0.39
CP1-ppgs 0.94
이상에서 본 발명에 따른 바람직한 실시예에 대해 설명하였으나, 다양한 형태로 변형이 가능하며, 본 기술분야에서 통상의 지식을 가진 자라면 본 발명의 특허청구범위를 벗어남이 없이 다양한 변형예 및 수정예를 실시할 수 있을 것으로 이해된다.
[부호의 설명]
100: 회귀분석을 활용하는 처리효과 추정 장치
110: 제1 잔차항 산출부
120: 제2 잔차항 산출부
130: 처리효과 추정부

Claims (10)

  1. 제1 잔차항 산출부가, 처리변수에 대한 처리변수모형 및 상기 처리변수모형에 포함된 제1 오차항에 대한 분포모형에 기초하여 제1 파라미터 값 및 성향점수를 산출하고, 상기 처리변수에서 상기 성향점수를 차감한 제1 잔차항을 산출하는 단계;
    제2 잔차항 산출부가, 상기 제1 파라미터 값에 기초하여 결과변수의 조건부평균값에 대한 근사모형에 포함된 적어도 하나의 제2 파라미터 값을 산출하여 상기 근사모형에 적용함으로써 파라미터 적용 근사모형을 생성하고, 상기 결과변수에서 상기 파라미터 적용 근사모형을 차감한 제2 잔차항을 산출하는 단계; 및
    처리효과 추정부가, 상기 제1 잔차항 및 상기 제2 잔차항에 기초하여 상기 처리변수가 상기 결과변수에 미치는 처리효과 파라미터를 추정하는 단계를 포함하는, 성향점수 잔차항을 최소자승회귀분석에 활용하는 처리효과 추정 방법.
  2. 제1항에 있어서,
    상기 제1 잔차항을 산출하는 단계는,
    상기 처리변수모형 및 상기 분포모형에 대응되는 개인별 우도 함수(likelihood function)를 결정하는 단계;
    상기 개인별 우도 함수를 모두 곱하여 샘플 우도 함수(sample likelihood function)를 산출하는 단계;
    상기 샘플 우도 함수가 최대값이 되도록 상기 제1 파라미터 값을 결정하는 단계;
    상기 제1 파라미터 값 및 상기 분포모형에 기초하여 상기 성향점수를 산출하는 단계; 및
    상기 처리변수에서 상기 성향점수를 차감한 상기 제1 잔차항을 산출하는 단계를 포함하는, 성향점수 잔차항을 최소자승회귀분석에 활용하는 처리효과 추정 방법.
  3. 제2항에 있어서,
    상기 제1 파라미터 값을 결정하는 단계는,
    상기 샘플 우도 함수에 로그를 취하여 로그화 샘플 우도 함수를 산출하고, 상기 로그화 샘플 우도 함수를 상기 제1 파라미터에 대해 미분한 결과가 0이 되도록 하는 값을 상기 제1 파라미터 값으로 결정하는 단계를 포함하는, 성향점수 잔차항을 최소자승회귀분석에 활용하는 처리효과 추정 방법.
  4. 제1항에 있어서,
    상기 제2 잔차항을 산출하는 단계는,
    상기 근사모형에 상기 제1 파라미터 값을 적용하여 제1 파라미터 적용 근사모형을 생성하는 단계;
    상기 결과변수에서 상기 제1 파라미터 적용 근사모형을 차감하여 제2 오차항을 결정하는 단계;
    상기 제2 오차항의 제곱이 최소가 되도록 하는 제2 파라미터의 값을 상기 제2 파라미터 값으로 결정하는 단계;
    상기 제1 파라미터 적용 근사모형에 상기 제2 파라미터 값을 적용하여 상기 파라미터 적용 근사모형을 생성하는 단계; 및
    상기 결과변수에서 상기 파라미터 적용 근사모형을 차감한 상기 제2 잔차항을 산출하는 단계를 포함하는, 성향점수 잔차항을 최소자승회귀분석에 활용하는 처리효과 추정 방법.
  5. 제1항에 있어서,
    상기 처리효과 파라미터를 추정하는 단계는,
    상기 제1 잔차항과 상기 처리효과 파라미터를 곱한 뒤, 상기 제2 잔차항에서 상기 제1 잔차항과 상기 처리효과 파라미터를 곱한 결과를 차감하고, 상기 차감한 결과를 제곱한 결과를 최소로 하는 상기 처리효과 파라미터 값을 추정하는 단계를 포함하는, 성향점수 잔차항을 최소자승회귀분석에 활용하는 처리효과 추정 방법.
  6. 처리변수에 대한 처리변수모형 및 상기 처리변수모형에 포함된 제1 오차항에 대한 분포모형에 기초하여 제1 파라미터 값 및 성향점수를 산출하고, 상기 처리변수에서 상기 성향점수를 차감한 제1 잔차항을 산출하는 제1 잔차항 산출부;
    상기 제1 파라미터 값에 기초하여 결과변수의 조건부평균값에 대한 근사모형에 포함된 적어도 하나의 제2 파라미터 값을 산출하여 상기 근사모형에 적용함으로써 파라미터 적용 근사모형을 생성하고, 상기 결과변수에서 상기 파라미터 적용 근사모형을 차감한 제2 잔차항을 산출하는 제2 잔차항 산출부; 및
    상기 제1 잔차항 및 상기 제2 잔차항에 기초하여 상기 처리변수가 상기 결과변수에 미치는 처리효과 파라미터를 추정하는 처리효과 추정부를 포함하는, 성향점수 잔차항을 최소자승회귀분석에 활용하는 처리효과 추정 장치.
  7. 제6항에 있어서,
    상기 제1 잔차항 산출부는,
    상기 처리변수모형 및 상기 분포모형에 대응되는 개인별 우도 함수(likelihood function)를 결정하고,
    상기 개인별 우도 함수를 모두 곱하여 샘플 우도 함수(sample likelihood function)를 산출하고,
    상기 샘플 우도 함수가 최대값이 되도록 상기 제1 파라미터 값을 결정하고,
    상기 제1 파라미터 값 및 상기 분포모형에 기초하여 상기 성향점수를 산출하고,
    상기 처리변수에서 상기 성향점수를 차감한 상기 제1 잔차항을 산출하는, 성향점수 잔차항을 최소자승회귀분석에 활용하는 처리효과 추정 장치.
  8. 제7항에 있어서,
    상기 제1 잔차항 산출부는,
    상기 샘플 우도 함수에 로그를 취하여 로그화 샘플 우도 함수를 산출하고, 상기 로그화 샘플 우도 함수를 상기 제1 파라미터에 대해 미분한 결과가 0이 되도록 하는 값을 상기 제1 파라미터 값으로 결정하는, 성향점수 잔차항을 최소자승회귀분석에 활용하는 처리효과 추정 장치.
  9. 제6항에 있어서,
    상기 제2 잔차항 산출부는,
    상기 근사모형에 상기 제1 파라미터 값을 적용하여 제1 파라미터 적용 근사모형을 생성하고,
    상기 결과변수에서 상기 제1 파라미터 적용 근사모형을 차감하여 제2 오차항을 결정하고,
    상기 제2 오차항의 제곱이 최소가 되도록 하는 제2 파라미터의 값을 상기 제2 파라미터 값으로 결정하고,
    상기 제1 파라미터 적용 근사모형에 상기 제2 파라미터 값을 적용하여 상기 파라미터 적용 근사모형을 생성하고,
    상기 결과변수에서 상기 파라미터 적용 근사모형을 차감한 상기 제2 잔차항을 산출하는, 성향점수 잔차항을 최소자승회귀분석에 활용하는 처리효과 추정 장치.
  10. 제6항에 있어서,
    상기 처리효과 추정부는,
    상기 제1 잔차항과 상기 처리효과 파라미터를 곱한 뒤, 상기 제2 잔차항에서 상기 제1 잔차항과 상기 처리효과 파라미터를 곱한 결과를 차감하고, 상기 차감한 결과를 제곱한 결과를 최소로 하는 상기 처리효과 파라미터 값을 추정하는, 성향점수 잔차항을 최소자승회귀분석에 활용하는 처리효과 추정 장치.
PCT/KR2018/014395 2017-11-24 2018-11-22 성향점수 잔차항을 최소자승회귀분석에 활용하는 처리효과 추정 방법 및 장치 WO2019103472A1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR10-2017-0158959 2017-11-24
KR1020170158959A KR102028511B1 (ko) 2017-11-24 2017-11-24 성향점수 잔차항을 최소자승회귀분석에 활용하는 처리효과 추정 방법 및 장치

Publications (1)

Publication Number Publication Date
WO2019103472A1 true WO2019103472A1 (ko) 2019-05-31

Family

ID=66632092

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/KR2018/014395 WO2019103472A1 (ko) 2017-11-24 2018-11-22 성향점수 잔차항을 최소자승회귀분석에 활용하는 처리효과 추정 방법 및 장치

Country Status (2)

Country Link
KR (1) KR102028511B1 (ko)
WO (1) WO2019103472A1 (ko)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8438126B2 (en) * 2007-07-13 2013-05-07 The Regents Of The University Of California Targeted maximum likelihood estimation
KR101264873B1 (ko) * 2012-08-07 2013-05-15 한국에너지기술연구원 단계적 회귀 분석을 이용한 풍력 밀도 예측 방법
KR20150001002A (ko) * 2013-06-26 2015-01-06 주식회사 맥스포 회귀분석모델을 통한 에너지 소비량 측정 방법

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100557476B1 (ko) 2003-12-06 2006-03-07 학교법인 고황재단 다중회귀분석 방법을 이용한 주가예측방법
KR100901082B1 (ko) * 2007-05-22 2009-06-03 엔에이치엔(주) 경쟁결과 분석 시스템 및 방법

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8438126B2 (en) * 2007-07-13 2013-05-07 The Regents Of The University Of California Targeted maximum likelihood estimation
KR101264873B1 (ko) * 2012-08-07 2013-05-15 한국에너지기술연구원 단계적 회귀 분석을 이용한 풍력 밀도 예측 방법
KR20150001002A (ko) * 2013-06-26 2015-01-06 주식회사 맥스포 회귀분석모델을 통한 에너지 소비량 측정 방법

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
MISOL LEE: "Latent causal inference using the propensity score from latent class regression model", THE KOREAN JOURNAL OF APPLIED STATISTICS, 31 October 2017 (2017-10-31), pages 615 - 632 *
YOUNATHAN ABDIA: "Propensity score based methods for estimating the treatment effects based on observational studies", ELECTRONIC THESES AND DISSERTATIONS, August 2016 (2016-08-01), pages 1 - 100, XP055617378, Retrieved from the Internet <URL:https://pdfs.semanticscholar.org/8397/17e9da6c4e314e6b224075dbc67b80ec18e9.pdf> *

Also Published As

Publication number Publication date
KR102028511B1 (ko) 2019-10-04
KR20190060603A (ko) 2019-06-03

Similar Documents

Publication Publication Date Title
WO2015115681A1 (ko) 표정 동작사전을 이용한 표정인식 방법 및 장치
WO2020022639A1 (ko) 딥러닝 기반의 가치 평가 방법 및 그 장치
WO2018048118A1 (en) Server and method for controlling external device
WO2022045425A1 (ko) 역강화학습 기반 배달 수단 탐지 장치 및 방법
WO2014040501A1 (zh) 一种动态口令的生成及认证方法与系统
WO2020168606A1 (zh) 广告视频优化方法、装置、设备及计算机可读存储介质
WO2022211326A1 (ko) 복수의 시험 도메인에 적용되는 전이요소로 학습된 인공지능 모델을 통해 사용자의 실력을 평가하는 장치, 시스템 및 그것의 동작방법
WO2010041836A2 (en) Method of detecting skin-colored area using variable skin color model
WO2020186787A1 (zh) 智能任务调度方法、装置、设备及存储介质
WO2018201638A1 (zh) 基于图像识别的信息采集方法、移动终端及存储介质
WO2019083227A1 (en) MEDICAL IMAGE PROCESSING METHOD, AND MEDICAL IMAGE PROCESSING APPARATUS IMPLEMENTING THE METHOD
WO2022004971A1 (ko) 영상 생성을 위한 학습 장치 및 방법
WO2018076844A1 (zh) 数据备份的方法、装置、存储介质及电子设备
WO2020017871A1 (ko) 영상 처리 장치 및 그 동작방법
WO2020233055A1 (zh) 基于活体检测的产品推广方法、装置、设备及存储介质
WO2023033329A1 (ko) 질환 연관 유전자 변이 분석을 통한 질환별 위험 유전자 변이 정보 생성 장치 및 그 방법
WO2022146050A1 (ko) 우울증 진단을 위한 인공지능 연합학습 방법 및 시스템
WO2022050719A1 (ko) 사용자의 치매 정도 결정 방법 및 장치
WO2019103472A1 (ko) 성향점수 잔차항을 최소자승회귀분석에 활용하는 처리효과 추정 방법 및 장치
WO2020062615A1 (zh) 显示面板的伽马值调节方法、装置及显示设备
WO2022164299A1 (en) Framework for causal learning of neural networks
WO2021246812A1 (ko) 딥러닝 nlp 모델을 활용한 뉴스 긍정도 분석 솔루션 및 장치
WO2022145999A1 (ko) 인공지능 기반의 자궁경부암 검진 서비스 시스템
WO2021167344A1 (ko) 기록된 데이터에서 인과성을 식별하는 강화학습 방법, 장치 및 프로그램
WO2023177150A1 (ko) 딥러닝 모델의 분산 훈련을 위한 전체 슬라이드 이미지 분배 방법 및 이를 수행하는 컴퓨팅 시스템

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 18880694

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 18880694

Country of ref document: EP

Kind code of ref document: A1