WO2017073446A1 - 説明変数値を算出する装置、方法及びプログラム - Google Patents

説明変数値を算出する装置、方法及びプログラム Download PDF

Info

Publication number
WO2017073446A1
WO2017073446A1 PCT/JP2016/081072 JP2016081072W WO2017073446A1 WO 2017073446 A1 WO2017073446 A1 WO 2017073446A1 JP 2016081072 W JP2016081072 W JP 2016081072W WO 2017073446 A1 WO2017073446 A1 WO 2017073446A1
Authority
WO
WIPO (PCT)
Prior art keywords
variable
value
original
explanatory
original variable
Prior art date
Application number
PCT/JP2016/081072
Other languages
English (en)
French (fr)
Inventor
康 高野
佐藤 隆一
辰郎 石島
一慶 吉野
Original Assignee
みずほ第一フィナンシャルテクノロジー株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by みずほ第一フィナンシャルテクノロジー株式会社 filed Critical みずほ第一フィナンシャルテクノロジー株式会社
Priority to US15/771,790 priority Critical patent/US20190050373A1/en
Publication of WO2017073446A1 publication Critical patent/WO2017073446A1/ja

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N7/00Computing arrangements based on specific mathematical models
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/04Inference or reasoning models
    • G06N5/045Explanation of inference; Explainable artificial intelligence [XAI]; Interpretable artificial intelligence

Definitions

  • the present invention relates to an apparatus, a method and a program for calculating an explanatory variable value.
  • Statistical models are used to elucidate and predict various phenomena such as natural and social phenomena. For example, there are the following statistical models.
  • x 1, x 2, ⁇ is a variable called the explanatory variables.
  • ... ⁇ 1 , ⁇ 2 ,... are coefficients corresponding to the explanatory variables x 1 , x 2 ,.
  • Z represented by the sum of a linear combination of explanatory variables and coefficients and a constant term ⁇ is called a linear predictor.
  • Y is a variable called a response variable.
  • Expression (2) the relationship between the expected value E [Y] of the response variable Y and the linear predictor Z is expressed by a function F.
  • weight can be used as a response variable
  • height, waist, etc. can be used as explanatory variables.
  • An example of such a statistical model is a generalized linear model.
  • examples of the generalized linear model include a linear regression model, a binomial logit model, and an order logit model.
  • Non-Patent Document 1 describes logarithmic conversion.
  • Statistic models can also be constructed using neural networks and other techniques, but such complicated techniques lose the intelligibility of statistical models. For this reason, in practice, a statistical model is often used that provides an easy-to-understand model equation as described above. On the other hand, since such a simple statistical analysis method has a low degree of freedom in analysis, in order to improve accuracy, it is important to devise contrivances when calculating explanatory variable values used for analysis.
  • the present invention has been made in view of such a situation, and an object thereof is to calculate an explanatory variable value for achieving both the accuracy and the easy understanding of the statistical model.
  • a program for calculating an explanatory variable value in a statistical model whose response variable is a binary variable from the value of the original variable includes a response probability estimation data acquisition step for acquiring response probability estimation data defining a relationship between the value of the original variable and an estimated value of the response probability, which is a probability that the response variable takes a specific value;
  • the original variable data acquisition step for acquiring original variable data including the realized value of the original variable, the realized value of the original variable, and the response probability estimation data, and the response from the realized value of the original variable
  • a program for calculating an explanatory variable value in a statistical model in which a response variable is a binary variable from a value of an original variable, wherein a relationship between the value of the original variable and an original variable score is defined.
  • the original variable score calculation data acquisition step for acquiring the original variable score calculation data, wherein the original variable score is a probability that the response variable takes a specific value estimated from the value of the original variable.
  • the original variable score calculation data acquisition step which is calculated by substituting the response probability into the inverse function of the distribution function of a predetermined probability distribution, and acquires the original variable data including the actual value of the original variable Using the original variable data acquisition step, the actual value of the original variable, and the original variable score calculation data, the original variable score obtained from the actual value of the original variable is calculated as the explanatory variable value.
  • Program for executing a bright variable value calculation step to the computer is provided.
  • An explanatory variable value calculation data acquisition step that is calculated by converting an original variable score calculated by substituting a certain response probability into an inverse function of a distribution function of a predetermined probability distribution by a linear expression.
  • financial indicators calculated from the balance sheet and income statement are often used as explanatory variables.
  • financial indicators in this case include the capital adequacy ratio, debt repayment years, current account balance ratio, and receivable turnover days.
  • information on individual attributes is often used as explanatory variables. Examples of such information include an individual's age, the number of households, annual income, years of service, and the like.
  • a binary variable that takes 1 if it defaults within a certain period after settlement and 0 if it does not default is called a default flag.
  • This default flag is often used as a response variable in the credit evaluation model. This is regardless of whether the target of the credit evaluation model is a company or an individual.
  • a credit evaluation model is constructed by statistical analysis such as logistic regression analysis using the explanatory variables and response variables as described above.
  • the output of the credit evaluation model is information representing the creditworthiness of a company or an individual, such as a credit score, a default rate, and a rating, although it varies depending on a statistical analysis method used.
  • a credit scoring model and a default rate estimation model depending on the output. In this specification, these are collectively referred to as a credit evaluation model.
  • logistic regression analysis In building a credit evaluation model, an analysis method called logistic regression analysis is often used.
  • the relationship between the explanatory variable and the response variable, that is, the probability p that the default flag is 1 (also called the default rate p) is expressed by the following equation.
  • ⁇ k is a coefficient corresponding to each explanatory variable X k
  • is a constant term.
  • logit (p) is called logit with default rate p.
  • an explanatory variable value X i k related to the k-th index of the company i is expressed as follows: Calculate as follows.
  • p i k is the default rate of company i estimated from the k-th index value of company i.
  • F is a distribution function of some probability distribution.
  • F ⁇ 1 is an inverse function of the function F.
  • a credit evaluation model with higher accuracy can be constructed by calculating the explanatory variable value X i k so that the relationship between the explanatory variable X k and the default rate p follows the assumption of the credit evaluation model. There is expected.
  • the explanatory variable value X i k calculated in this way is obtained by quantifying the creditworthiness of the company i by the k-th original variable value. By looking at the explanatory variable values calculated from the various original variable values of the company, it becomes possible to easily grasp the level of creditworthiness evaluated by each index. Any method can be used as a method of calculating the estimated default rate p i k . In this embodiment, a method using discretization is used as described later.
  • Z score A linear combination Z of explanatory variables calculated by the following equation is called a Z score. This Z score represents the creditworthiness of a company when all explanatory variables taken into the credit evaluation model are taken into consideration.
  • Response probability estimation data creation is performed by the response probability estimation data creation device 1 shown in FIG.
  • the response probability estimation data creation device 1 includes a model construction data acquisition unit 12 and a response probability estimation data creation unit 14. Details of each functional unit will be described later.
  • FIG. 2 shows a computer hardware configuration example of the response probability estimation data creation device 1.
  • the response probability estimation data creation device 1 includes a CPU 51, an interface device 52, a display device 53, an input device 54, a drive device 55, an auxiliary storage device 56, and a memory device 57.
  • the buses 58 are connected to each other.
  • a program for realizing the function of the response probability estimation data creation device 1 is provided by a recording medium 59 such as a CD-ROM.
  • a recording medium 59 such as a CD-ROM.
  • the program is installed from the recording medium 59 to the auxiliary storage device 56 via the drive device 55.
  • the program does not necessarily have to be installed by the recording medium 59, and can be downloaded from another computer via a network.
  • the auxiliary storage device 56 stores the installed program and also stores necessary files and data.
  • the memory device 57 reads the program from the auxiliary storage device 56 and stores it when there is an instruction to start the program.
  • the CPU 51 implements the function of the response probability estimation data creation device 1 in accordance with a program stored in the memory device 57.
  • the interface device 52 is used as an interface for connecting to another computer through a network.
  • the display device 53 displays a GUI (Graphical User Interface) or the like by a program.
  • the input device 54 is a keyboard and a mouse.
  • FIG. 3 shows processing performed by the response probability estimation data creation device 1.
  • the model construction data acquisition unit 12 reads model construction data.
  • An example of model construction data is shown in Table 1.
  • the model building data has multiple samples. Each sample represents information about one company. Further, as described above, the “default flag” is a binary variable that takes 1 if defaulted within a certain period after settlement, and takes 0 if not defaulted.
  • “Financial indicators” in Table 1 are calculated from financial statements such as each company's balance sheet and income statement. For example, “sales / logarithm” is information obtained by logarithmically converting the sales calculated from the settlement information. “Equity ratio”, “Debt repayment years”, “Current ratio”, and “Rate of sales interest rate” are each calculated from the settlement information. These indexes are the original variables that are the basis of the explanatory variables to be calculated. “K” is the number of the original variable.
  • Table 1 has a plurality of samples, and each sample includes a plurality of real values of original variables and real values of response variables. Note that the number of original variables is not limited and may be plural.
  • the response probability the probability that the response variable takes a specific value
  • the response probability estimation data is also referred to as default rate estimation data.
  • “Class number” in Table 2 is a class number obtained by discretizing the existence range of the capital ratio value, which is a continuous index, into a plurality of classes. “Lower limit value” and “Upper limit value” of “Equity ratio” indicate the lower limit value and the upper limit value of each class.
  • the “non-default number” in the “number of samples” is the number of samples in which “default flag” in Table 1 is 0 in each class.
  • the “default number” in the “number of samples” is the number of samples in which “default flag” in Table 1 is 1 in each class.
  • the “non-default number” and the “default number” are obtained by the response probability estimation data creation unit 14 referring to the model construction data in Table 1 and counting up.
  • Estimatimated default rate (default number) / ((non-default number) + (default number))
  • the estimated default rate is also referred to as “estimated response probability”.
  • response probability estimation data related to the original variable “capital ratio” is created.
  • Response probability estimation data can be created in the same manner for the original variables other than “capital ratio”.
  • the response probability estimation data is data that defines the relationship between the value of the original variable and the estimated value of the response probability (estimated default rate).
  • the explanatory variable value calculation device 2 includes a response probability estimation data acquisition unit 22, an original variable data acquisition unit 24, an original variable score calculation unit 26, and an explanatory variable value calculation unit 28. Details of each functional unit will be described later.
  • the explanatory variable value calculation device 2 also has a computer hardware configuration as shown in FIG. The flow of processing performed by the explanatory variable value calculation device 2 is shown in FIG.
  • step S201 the response probability estimation data acquisition unit 22 reads response probability estimation data as shown in Table 2 from the response probability estimation data creation device 1.
  • step S202 the original variable data acquisition unit 24 reads the model construction data shown in Table 1 from the response probability estimation data creation device 1.
  • the model construction data since the model construction data includes the actual value of the original variable, in this embodiment, the model construction data is used as the original variable data.
  • the original variable data does not necessarily have to be the same as the model construction data, and may be data that includes the actual value of the original variable.
  • step S204 the original variable score calculation unit 26 calculates a value called an original variable score from the estimated default rate p i k calculated in step S203 by the following equation.
  • the function F is a distribution function of a logistic distribution.
  • step S205 the explanatory variable value calculation unit 28 calculates the explanatory variable value X i k .
  • the explanatory variable value X i k is calculated by the following equation.
  • the explanatory variable value is a value obtained by multiplying the original variable score by -1.
  • the present invention is not limited to this, and the explanatory variable value can be a value obtained by converting the original variable score by a linear expression. The above is the flow up to the calculation of explanatory variable values for capital adequacy ratio.
  • a statistical model can be constructed by logistic regression analysis using the explanatory variable values for all the original variables and the default flag which is a response variable (step S206). In constructing the statistical model, any explanatory variable selection method can be used.
  • Table 3 is an example of the parameter estimation results in the statistical model construction.
  • the parameter is a general term for the constant term and the coefficient in Equation (3).
  • the coefficient represents "how many points the Z score is different if the explanatory variable value is different by one point". The larger the value of the coefficient, the greater the evaluation of the index corresponding to the coefficient, that is, the influence of the original variable.
  • the debt repayment period and the capital adequacy ratio are influential indicators.
  • the magnitude of the influence of the index can be immediately read from the parameter value for the explanatory variable value calculated from the index value (original variable value).
  • Table 4 shows the result of credit evaluation of a certain company (referred to as company A) using the credit evaluation model obtained in the present embodiment.
  • “Parameter estimated values” in Table 4 are those already shown in Table 3.
  • the “explanatory variable value” is an explanatory variable value calculated from the index value of company A by the above-described method.
  • “Score contribution” is the product of the parameter and explanatory variable value for each index. The sum of the constant term and the score contribution for all the indices becomes the Z score of company A.
  • the estimated PD of company A can be calculated from the Z score.
  • the estimated PD is an estimated default rate based on the Z score.
  • FIG. 6 is a graph showing the explanatory variable values of each index for company A. From this graph, it can be seen that Company A may have a problem with the number of days of inventory rotation. Thus, in the present embodiment, not only the final evaluation but also the evaluation based on each index can be easily grasped, and they can be compared.
  • the capital ratio which is a continuous index, has mainly been explained.
  • the estimated default rate for each category is calculated by aggregating the number of default samples and the number of non-default samples for each category. Can be obtained. For samples with missing values or singular values (such as when the denominator of the index is 0), an estimated default rate for such samples can be obtained by a similar method.
  • a default rate can be calculated from a cross table of two indexes, and an intersection variable can be created.
  • Explanation variable value in Table 5 is the index value itself. However, logarithmic conversion is performed for sales and inventory turnover. “Score contribution” is the product of the parameter for each index and the explanatory variable value.
  • index value Since the level of index value varies greatly from index to index, it is not possible to know which index is important by looking at the parameters in Table 5. Moreover, even if there is an index with a high score contribution, it is not known whether the “index value” is a good value or because the parameter is large (emphasized). For example, the score contribution of “sales / logarithm” is relatively large. This is because the evaluation of sales is good. Although the evaluation of sales is standard, the score contribution is large because it is an important indicator. It cannot be distinguished immediately because it is. Thus, in the case of a normal credit evaluation model, it is difficult to interpret the evaluation result.
  • the original variable score is obtained from the response probability estimation data (Table 2) by the equation (7), and the explanatory variable value is obtained from the original variable score by the equation (8). Therefore, instead of the response probability estimation data, original variable score calculation data that defines the relationship between the value of the original variable and the original variable score may be used.
  • the original variable score calculation data is created by an original variable score calculation data creation device (not shown) similar to the response probability estimation data creation device 1.
  • the original variable score calculation data creation device has an original variable score calculation data creation unit (not shown) instead of the response probability estimation data creation unit 14.
  • the original variable score calculation data creation unit creates original variable score calculation data that defines the relationship between the value of the original variable and the original variable score.
  • the original variable score calculation data is acquired by an original variable score calculation data acquisition unit (not shown) instead of the response probability estimation data acquisition unit 22 in the explanatory variable value calculation device 2. Then, the original variable score calculation unit 26 calculates the original variable score using the original variable score calculation data.
  • explanatory variable value calculation data that defines the relationship between the value of the original variable and the explanatory variable value may be used instead of the response probability estimation data.
  • the explanatory variable value calculation data is created by an explanatory variable value calculation data creation device (not shown) similar to the response probability estimation data creation device 1.
  • the explanatory variable value calculation data creation device has an explanatory variable value calculation data creation unit (not shown) instead of the response probability estimation data creation unit 14.
  • the explanatory variable value calculation data creation unit creates explanatory variable value calculation data that defines the relationship between the value of the original variable and the explanatory variable value.
  • the explanatory variable value calculation data is acquired by an explanatory variable value calculation data acquisition unit (not shown) in place of the response probability estimation data acquisition unit 22 in the explanatory variable value calculation device 2.
  • the original variable score calculation unit 26 is not provided, and the explanatory variable value calculation unit 28 calculates the explanatory variable value using the explanatory variable value calculation data.
  • Piecewise linear regression is a method of dividing the existence range of the original variable into several sections and approximating the relationship between the original variable and the estimated default rate in each section in a linear format. Since the relationship between the values of raw variables such as financial indicators and the estimated default rate is complex, errors are often very large in simple linear regression, but the use of piecewise linear regression is expected to improve approximation accuracy. it can.
  • Fig. 7 is an approximate line graph showing the relationship between the value of the underlying variable and the estimated default rate by piecewise linear regression for the interest-bearing debt interest rate, which is one of the underlying variables.
  • Each point indicated by a rectangle indicates an estimated default rate calculated by discretizing the original variable.
  • the solid line is an approximate broken line obtained by piecewise linear regression. By calculating the estimated default rate using this approximate broken line, a continuous estimated default rate can be obtained. As a result, continuous explanatory variable values are obtained.
  • Table 6 is an example in which an approximate expression representing the relationship between the interest-bearing debt interest rate and the estimated default rate is calculated by piecewise linear regression.
  • threshold values (maximum value and minimum value of the original variable) of each section, and information on the slope and intercept of each section are obtained.
  • the slope and intercept are also called function parameters.
  • the maximum value and the minimum value of the estimated default rate of each section are obtained from the threshold value and the function parameter.
  • the maximum value and minimum value of the original variable score are obtained by converting the maximum value and minimum value of the estimated default rate using the inverse function F ⁇ 1 of the function F according to Equation (7).
  • the maximum value and the minimum value of the explanatory variable value can be obtained by converting the maximum value and the minimum value of the original variable score by a linear expression using Expression (8).
  • the maximum value and the minimum value of the original variable score are omitted.
  • response probability estimation data in Table 6, data composed of “section No.”, “interest-bearing debt interest rate”, and “function parameters” is response probability estimation data in the present embodiment.
  • This response probability estimation data defines the relationship between the value of the “interest-bearing debt interest rate”, which is the original variable, and the estimated default rate.
  • the response probability estimation data is created by the response probability estimation data creation device 1 as in the first embodiment (FIGS. 1 and 3).
  • step S201 the response probability estimation data is read.
  • step S202 model construction data (Table 1) is read.
  • step S203 it is read from the response probability estimation data and model construction data which section the actual value of the original variable of each sample is included in the response probability estimation data.
  • the function parameters of the corresponding section are read.
  • step S204 the original variable score is calculated by equation (7).
  • step S205 the explanatory variable value is calculated by equation (8).
  • the interest-bearing debt interest rate cannot be calculated. In some cases, the interest-bearing debt rate is a deficit.
  • an ad hoc correspondence such as “assign the worst value” to a sample such as a missing value is taken.
  • the estimated default rates of these samples are calculated by counting non-default samples and default samples for the samples for which the actual value of interest-bearing debt interest rate cannot be obtained.
  • the explanatory variable value is calculated from the estimated default rate. In this way, even for samples for which the real value of interest-bearing debt interest rate cannot be obtained, an explanatory variable value corresponding to the estimated default rate can be obtained in the same way as a normal sample, so that an improvement in the accuracy of the statistical model can be expected.
  • the explanatory variable values are calculated in the same manner as described above, and the parameters (constant terms and coefficients) are estimated using them as explanatory variables and the default flag as the response variable.
  • a credit evaluation model possessed can be constructed (step S206). Even when a model is constructed with continuous variables, it is possible to perform evaluation for each index as in the case of discretized variables.
  • the method for obtaining the approximate expression is not limited to piecewise linear regression, and any method can be used. Examples include polynomial regression, logarithmic regression, and B-spline.
  • the explanatory variable value can be calculated by various methods.
  • original variable score calculation data that defines the relationship between the value of the original variable and the original variable score
  • explanatory variable value calculation data that defines the relationship between the value of the original variable and the explanatory variable value
  • Probit regression like logistic regression, is a technique often used in the construction of credit evaluation models, and the relationship between explanatory variables and default rates is expressed by the following equation.
  • is a distribution function of a standard normal distribution. This ⁇ is the function F in the first embodiment.
  • the original variable score can be calculated by Equation (7) using the inverse function ⁇ ⁇ 1 of the function ⁇ .
  • This embodiment is the same as the first embodiment except for the function F.
  • the statistical analysis method used for parameter estimation and the distribution function used when calculating the index score are not necessarily limited to a specific combination. For example, it is possible to estimate the parameters by logistic regression analysis using the standard variable distribution function for calculating the explanatory variable values and using the obtained explanatory variable values.
  • step S101 model construction data is read.
  • the model construction data at this time also includes information “business type”.
  • step S102 response probability estimation data representing the relationship between the value of the variable and the estimated value of the response probability (estimated default rate) can be created for each industry. For example, when piecewise linear regression is used, a table as shown in Table 6 is created for each industry. Then, after performing steps S201 to S205 for each business type, a credit evaluation model for each business type can be constructed in step S206.
  • segment information is information that is referred to when the population that is the analysis target of the statistical model is divided. Each group obtained by dividing the population based on the segment information is called a segment.
  • the population is often divided into several segments that are considered to share financial characteristics, and a model is constructed for each segment.
  • evaluation by index can be compared between different industries. For example, since the level of operating profit margin is different depending on the industry, “Company A in the retail industry with an 11% operating profit margin” and “Company B in the service industry with 17%” are both creditworthiness. I don't know immediately whether I think it is expensive.
  • the value of the explanatory variable obtained by the present invention represents the level of the default rate estimated from the value of the original variable, it can be compared even between different industries. In the previous example, by comparing the value of the explanatory variable corresponding to the operating profit margin of both companies, the question of which creditworthiness is considered higher from the perspective of the operating profit ratio of sales? Can answer easily.
  • the creditworthiness and index values are not monotonous, they can be incorporated into the statistical model without problems. For example, some indicators have low creditworthiness (high default rate) whether they are too large or too small. According to the first or second embodiment, such an index is a small value when the index value is large or small, and a large value when the index value is moderate. As a result, the relationship between the value of the explanatory variable and creditworthiness becomes monotonous, making it easier to incorporate into various statistical models.
  • the calculation method of the estimated default rate from the index value is not particularly limited, it is possible to process the index flexibly. As mentioned earlier, it is possible to create cross variables using the cross tabulation table of two or more indicators, or to change the method of calculating the estimated default rate depending on the denominator value of the indicator It is.
  • the distribution function F used when calculating the original variable score the use of a probability distribution that matches the statistical analysis method used for model construction is expected to improve the model accuracy.
  • a statistical model assumes that an explanatory variable and a response variable satisfy a certain relationship, and if the relationship between the two does not satisfy the assumption, a highly accurate model cannot be obtained.
  • the log rate of the default rate is expressed by a linear expression of explanatory variables (formula (3)).
  • an explanatory variable value that satisfies the assumption of the model is obtained for each explanatory variable.
  • an explanatory variable value that conforms to the assumption of the model can be obtained.
  • both a discretized variable obtained by discretization and a continuous variable obtained by using an approximate expression can be used. Regardless of whether the explanatory variable is a discretization variable or a continuous variable, the meaning of the calculated explanatory variable value is the same, so that comparative evaluation between the explanatory variable values is possible.
  • the response probability estimation data can be stored in the auxiliary storage device 56 in the response probability estimation data creation device 1 or any external storage device. The same applies to the original variable score calculation data and the explanatory variable value calculation data.
  • the explanatory variable value calculated by the explanatory variable value calculation device 2 can be stored in an auxiliary storage device in the explanatory variable value calculation device 2 or an arbitrary external storage device.
  • the response probability estimation data creation device 1 and the explanatory variable value calculation device 2 may be integrated.
  • the model construction data read in step S101 may be different from the model construction data read in step S202.
  • the original variable score may be used as an explanatory variable value as it is without being converted into a linear expression.
  • the present invention can be widely applied not only to the statistical model represented by the equations (1) and (2) but also to a statistical model in which the response variable is a binary variable.

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Pure & Applied Mathematics (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • General Engineering & Computer Science (AREA)
  • Algebra (AREA)
  • Operations Research (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Computing Systems (AREA)
  • Business, Economics & Management (AREA)
  • Probability & Statistics with Applications (AREA)
  • Evolutionary Biology (AREA)
  • Databases & Information Systems (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Medical Informatics (AREA)
  • Human Resources & Organizations (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Economics (AREA)
  • Strategic Management (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Game Theory and Decision Science (AREA)
  • Development Economics (AREA)
  • Marketing (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Complex Calculations (AREA)

Abstract

統計モデルの精度と分かり易さを両立させるための説明変数値を算出する。 応答変数が2値変数である統計モデルにおける説明変数値を、原変数の値から算出するプログラムは、前記原変数の値と、前記応答変数が特定の値をとる確率である応答確率の推定値との関係を定めた応答確率推定用データを取得する応答確率推定用データ取得ステップ(S201)と、前記原変数の実現値を含む原変数データを取得する原変数データ取得ステップ(S202)と、前記原変数の実現値と、前記応答確率推定用データとを用いて、前記原変数の実現値から前記応答確率の推定値を算出し、該推定値を所定の確率分布の分布関数の逆関数に代入することによって得られる値である原変数スコアを説明変数値として算出する説明変数値算出ステップ(S203,S204)とをコンピュータに実行させる。

Description

説明変数値を算出する装置、方法及びプログラム
 本発明は、説明変数値を算出する装置、方法及びプログラムに関する。
 自然現象、社会現象といった様々な現象の解明及び予測を行うために統計モデルが用いられる。例えば、以下のような統計モデルがある。
Figure JPOXMLDOC01-appb-M000001
 ただし、x、x、・・・は、説明変数と呼ばれる変数である。β、β、・・・は、説明変数x、x、・・・にそれぞれ対応する係数であり、αは定数項である。式(1)において、説明変数と係数との線形結合と定数項αとの和により表されるZは、線形予測子と呼ばれる。Yは応答変数と呼ばれる変数である。式(2)に示したように、応答変数Yの期待値E[Y]と線形予測子Zとの関係は、関数Fにより表される。
 例えば、体重を応答変数とし、身長、ウエストなどを説明変数とすることができる。
 このような統計モデルの例として、一般化線形モデル(generalized linear model)が挙げられる。さらに、一般化線形モデルの例として、線形回帰モデル、二項ロジットモデル、順序ロジットモデルが挙げられる。
 統計モデルにおける説明変数となり得るデータ(財務指標、個人属性など)は、分布が大きく偏っている場合がある。また、単調性のないデータも多い。分布が大きく偏ったデータ又は単調性のないデータをそのまま説明変数値として用いると、精度の高い統計モデルが得られないことが多い。
 そのため、説明変数となり得るデータに何らかの加工を行い、その加工後のデータを説明変数値とすることが行われる。このような加工の例として、非特許文献1には対数変換が記載されている。
竹内啓ら編、「統計学辞典」、東洋経済新報社、1989年12月、p.419
 ニューラルネットワーク等の手法でも統計モデルの構築は可能だが、このような複雑な手法では、統計モデルの分かり易さが失われる。そのため、実務上は、分かり易い上記のようなモデル式が得られる統計モデルを利用することが多い。その一方で、このような単純な統計分析手法は分析の自由度が低いことから、精度を向上させるためには、分析に用いる説明変数値を算出する際に工夫を凝らすことが重要である。
 本発明はこのような実状に鑑みてなされたものであって、その目的は、統計モデルの精度と分かり易さを両立させるための説明変数値を算出することにある。
 上記目的を達成するために、本発明によれば、応答変数が2値変数である統計モデルにおける説明変数値を、原変数の値から算出するプログラムが提供される。本プログラムは、前記原変数の値と、前記応答変数が特定の値をとる確率である応答確率の推定値との関係を定めた応答確率推定用データを取得する応答確率推定用データ取得ステップと、前記原変数の実現値を含む原変数データを取得する原変数データ取得ステップと、前記原変数の実現値と、前記応答確率推定用データとを用いて、前記原変数の実現値から前記応答確率の推定値を算出し、該推定値を所定の確率分布の分布関数の逆関数に代入することによって得られる値である原変数スコアを説明変数値として算出する説明変数値算出ステップとをコンピュータに実行させる。
 別の実施形態によれば、応答変数が2値変数である統計モデルにおける説明変数値を、原変数の値から算出するプログラムであって、前記原変数の値と原変数スコアとの関係を定めた原変数スコア算出用データを取得する原変数スコア算出用データ取得ステップであって、前記原変数スコアは、前記原変数の値から推定される、前記応答変数が特定の値をとる確率である応答確率を、所定の確率分布の分布関数の逆関数に代入することによって算出されたものである、原変数スコア算出用データ取得ステップと、前記原変数の実現値を含む原変数データを取得する原変数データ取得ステップと、前記原変数の実現値と、前記原変数スコア算出用データとを用いて、前記原変数の実現値から得られる原変数スコアを説明変数値として算出する説明変数値算出ステップとをコンピュータに実行させるプログラムが提供される。
 さらに別の実施形態によれば、応答変数が2値変数である統計モデルにおける説明変数値を、原変数の値から算出するプログラムであって、前記原変数の値と説明変数値との関係を定めた説明変数値算出用データを取得する説明変数値算出用データ取得ステップであって、前記説明変数値は、前記原変数の値から推定される、前記応答変数が特定の値をとる確率である応答確率を、所定の確率分布の分布関数の逆関数に代入することによって算出される原変数スコアを、一次式で変換することによって算出されたものである、説明変数値算出用データ取得ステップと、前記原変数の実現値を含む原変数データを取得する原変数データ取得ステップと、前記原変数の実現値と、前記説明変数値算出用データとを用いて、前記原変数の実現値から説明変数値を算出する説明変数値算出ステップとをコンピュータに実行させるプログラムが提供される。
 上述の如く、本発明によれば、統計モデルの精度と分かり易さを両立させるための説明変数値を算出することができる。
応答確率推定用データ作成装置の機能構成例を示す説明図である。 応答確率推定用データ作成装置のハードウェア構成例を示す説明図である。 応答確率推定用データ作成装置が行う処理のフローチャートの一例である。 説明変数値算出装置の機能構成例を示す説明図である。 説明変数値算出装置が行う処理のフローチャートの一例である。 説明変数値のグラフである。 近似折線グラフである。
 以下に本発明の実施形態を説明する。ただし、本発明は、以下に説明する実施の形態によって限定されるものではない。
 [第1の実施形態: ロジスティック回帰分析による信用評価モデルの構築]
 企業又は個人のデフォルトすなわち債務不履行のしやすさを評価する統計モデルを信用評価モデルと呼ぶ。デフォルトしにくいと評価されれば、当該企業又は個人は信用力が高いといえる。
 企業を対象とした信用評価モデルにおいては、貸借対照表、損益計算書から計算される財務指標を説明変数として用いることが多い。この場合の財務指標の例としては、自己資本比率、債務償還年数、経常収支比率、売上債権回転日数などが挙げられる。
 また、個人を対象とした信用評価モデルにおいては、個人の属性に関する情報を説明変数として用いることが多い。このような情報の例として、個人の年齢、世帯人数、年収、勤続年数などが挙げられる。
 以下、企業の財務指標、個人の属性といった、信用力に関係する情報を「指標」とも呼ぶ。この指標が、説明変数を算出する元となる原変数である。
 また、決算後一定期間内にデフォルトしていれば1、デフォルトしていなければ0をとる2値変数をデフォルトフラグと呼ぶ。このデフォルトフラグを、信用評価モデルにおける応答変数として用いることが多い。これは、信用評価モデルの対象が企業であるか個人であるかを問わない。
 以上のような説明変数及び応答変数を用いて、ロジスティック回帰分析等の統計分析により、信用評価モデルを構築する。信用評価モデルのアウトプットは、用いる統計分析手法によって異なるが、信用スコア、デフォルト率、格付などの、企業又は個人の信用力を表象する情報である。アウトプットに応じて、信用スコアリングモデル、デフォルト率推定モデルなどの様々な呼び方があるが、本明細書においてはこれらをまとめて信用評価モデルと呼ぶ。
 信用評価モデルの構築においては、ロジスティック回帰分析と呼ばれる分析手法が多く使われる。このロジスティック回帰分析においては、説明変数と、応答変数すなわちデフォルトフラグが1となる確率p(デフォルト率pとも呼ぶ)との関係を次式で表現する。
Figure JPOXMLDOC01-appb-M000002
ただし、X(k=1,2,・・・)は、説明変数である。βは、説明変数Xにそれぞれ対応する係数であり、αは定数項である。logit(p)は、デフォルト率pのロジットと呼ばれる。
 そして、企業i(iは企業IDである)の第k番目の指標値(第k番目の原変数値とも呼ぶ)から、企業iの第k番目の指標に関する説明変数値X を以下のように算出する。
ただし、p は、企業iの第k番目の指標値から推定された企業iのデフォルト率である。Fは、何らかの確率分布の分布関数である。F-1は、関数Fの逆関数である。
 関数Fを次式のようにロジスティック分布の分布関数とすることによって、説明変数値X とlogit(p )は、式(3)の関係を満たすこととなる。
Figure JPOXMLDOC01-appb-M000004
 このように、説明変数Xとデフォルト率pとの関係が信用評価モデルの仮定に従うものとなるように、説明変数値X を算出することにより、より精度の高い信用評価モデルを構築できることが期待される。
 このようにして算出される説明変数値X は、第k番目の原変数値により企業iの信用力を数値化したものである。企業の様々な原変数値から算出される説明変数値を見ることにより、それぞれの指標で評価した信用力の高低が容易に把握できるようになる。推定デフォルト率p を算出する方法としては任意の方法を用いることができる。本実施形態では、後述するように離散化による方法を用いる。
 なお、次式で計算される説明変数の線形結合Zを、Zスコアと呼ぶ。
Figure JPOXMLDOC01-appb-M000005
このZスコアは、信用評価モデルに取り込まれている説明変数を全て考慮した場合の企業の信用力を表している。
 以下、説明変数値X を算出するために必要となる応答確率推定用データ作成について説明する。続いて、応答確率推定用データを用いた説明変数値X の算出について説明する。
 [応答確率推定用データ作成]
 応答確率推定用データの作成は、図1に示す応答確率推定用データ作成装置1が行う。応答確率推定用データ作成装置1は、モデル構築用データ取得部12と、応答確率推定用データ作成部14とを備えている。各機能部の詳細は後述する。
 図2は、応答確率推定用データ作成装置1のコンピュータハードウェア構成例を示している。応答確率推定用データ作成装置1は、CPU51と、インタフェース装置52と、表示装置53と、入力装置54と、ドライブ装置55と、補助記憶装置56と、メモリ装置57とを備えており、これらがバス58により相互に接続されている。
 応答確率推定用データ作成装置1の機能を実現するプログラムは、CD-ROM等の記録媒体59によって提供される。プログラムを記録した記録媒体59がドライブ装置55にセットされると、プログラムが記録媒体59からドライブ装置55を介して補助記憶装置56にインストールされる。あるいは、プログラムのインストールは必ずしも記録媒体59により行う必要はなく、ネットワークを介して他のコンピュータからダウンロードすることもできる。補助記憶装置56は、インストールされたプログラムを格納すると共に、必要なファイルやデータ等を格納する。
 メモリ装置57は、プログラムの起動指示があった場合に、補助記憶装置56からプログラムを読み出して格納する。CPU51は、メモリ装置57に格納されたプログラムにしたがって応答確率推定用データ作成装置1の機能を実現する。インタフェース装置52は、ネットワークを通して他のコンピュータに接続するためのインタフェースとして用いられる。表示装置53はプログラムによるGUI(Graphical User Interface)等を表示する。入力装置54はキーボード及びマウス等である。
 図3は、応答確率推定用データ作成装置1が行う処理を示している。まず、ステップS101において、モデル構築用データ取得部12がモデル構築用データを読み込む。モデル構築用データの例を表1に示す。
Figure JPOXMLDOC01-appb-T000006
 モデル構築用データは、複数のサンプルを有している。各サンプルが一つの企業に関する情報を表している。また、「デフォルトフラグ」とは、先に述べたように、決算後一定期間内にデフォルトしていれば1、デフォルトしていなければ0をとる2値変数である。
 表1における「財務指標」は、各企業の貸借対照表、損益計算書等といった決算情報から算出される。例えば、「売上高・対数」は、決算情報から算出される売上高を対数変換した情報である。「自己資本比率」、「債務償還年数」、「流動比率」、「売上高金利負担率」は、それぞれ、決算情報から算出されるものである。これらの指標が、算出対象である説明変数の元になる原変数である。なお、「k」は、原変数の番号である。
 例えば、企業IDが「1」である「企業A」の「自己資本比率」の値は「46.82%」である。この値を、「自己資本比率」という原変数の実現値と呼ぶ。そして、「デフォルトフラグ」という応答変数の実現値は「0」である。このように、表1は、複数のサンプルを有し、各サンプルは、複数の原変数の実現値と応答変数の実現値とを含んでいる。なお、原変数の個数に制限はなく、複数あればよい。
 ステップS102において、応答確率推定用データ作成部14が、「自己資本比率」(k=2)という原変数に関して、表2に示すような応答確率推定用データを作成する。本実施形態では、応答確率(応答変数が特定の値をとる確率のこと)がデフォルト率であるため、応答確率推定用データをデフォルト率推定用データとも呼ぶ。
Figure JPOXMLDOC01-appb-T000007
 表2の「階級番号」は、連続的な指標である自己資本比率の値の存在範囲を複数の階級に離散化したことにより得られる階級の番号である。「自己資本比率」の「下限値」及び「上限値」は、各階級の下限値及び上限値を示している。そして、「サンプル数」における「非デフォルト数」は、各階級において、表1の「デフォルトフラグ」が0となっているサンプルの数である。また、「サンプル数」における「デフォルト数」は、各階級において、表1の「デフォルトフラグ」が1となっているサンプルの数である。「非デフォルト数」及び「デフォルト数」は、応答確率推定用データ作成部14が表1のモデル構築用データを参照して数え上げることにより得られる。
 さらに、表2の「推定デフォルト率」は、応答確率推定用データ作成部14により、階級毎に以下のようにして計算される。
  (推定デフォルト率)=(デフォルト数)/((非デフォルト数)+(デフォルト数))
なお、推定デフォルト率を「応答確率の推定値」とも呼ぶ。
 以上のようにして、「自己資本比率」という原変数に関する応答確率推定用データが作成される。「自己資本比率」以外の原変数についても同様に応答確率推定用データを作成することができる。
 このように、応答確率推定用データは、原変数の値と応答確率の推定値(推定デフォルト率)との関係を定めたデータである。
 [説明変数値の算出]
 続いて、応答確率推定用データを用いた説明変数値X の算出と、それに続く統計モデルの構築とについて説明する。説明変数値の算出は、図4に示す説明変数値算出装置2により行われる。説明変数値算出装置2は、応答確率推定用データ取得部22と、原変数データ取得部24と、原変数スコア算出部26と、説明変数値算出部28とを備えている。各機能部の詳細は後述する。説明変数値算出装置2も、図2に示したようなコンピュータハードウェア構成を有している。説明変数値算出装置2が行う処理の流れを図5に示している。
 まず、ステップS201において、応答確率推定用データ取得部22は、表2に示したような応答確率推定用データを応答確率推定用データ作成装置1から読み込む。
 ステップS202において、原変数データ取得部24は、表1に示したモデル構築用データを応答確率推定用データ作成装置1から読み込む。上述したように、モデル構築用データは原変数の実現値を含んでいることから、本実施例では、モデル構築用データを原変数データとして使用する。ただし、原変数データは必ずしもモデル構築用データと同じである必要はなく、原変数の実現値が含まれているデータであればよい。
 ステップS203において、原変数スコア算出部26は、応答確率推定用データ(表2)及び原変数データ(表1)を用いて、「自己資本比率」という原変数(k=2)に関する推定デフォルト率を算出する。例えば、「企業A」(i=1)であれば、自己資本比率の実現値は「46.82%」であることから、表2の階級番号8を参照することにより、推定デフォルト率p が「0.96%」と算出される。このような自己資本比率に関する推定デフォルト率の算出を全ての企業について行う。
 ステップS204において、原変数スコア算出部26は、ステップS203で算出された推定デフォルト率p から、次式により原変数スコアと呼ばれる値を算出する。
Figure JPOXMLDOC01-appb-M000008
先に述べたように、関数Fはロジスティック分布の分布関数である。
 ステップS205では、説明変数値算出部28が説明変数値X を算出する。説明変数値X の算出は次式により行われる。
Figure JPOXMLDOC01-appb-M000009
 このように、説明変数値は、原変数スコアを-1倍した値である。もちろん、これに限られず、説明変数値は、原変数スコアを一次式により変換した値とすることができる。以上が、自己資本比率に関する説明変数値算出までの流れである。
 その後、自己資本比率(k=2)以外の原変数についても同様に説明変数値を算出することができる。そして、全ての原変数に関する説明変数値と、応答変数であるデフォルトフラグを用いて、ロジスティック回帰分析による統計モデル構築を行うことができる(ステップS206)。なお、統計モデル構築にあたっては、任意の説明変数の選択方法を用いることができる。
 表3は、統計モデル構築におけるパラメータの推定結果の例である。パラメータとは、式(3)の定数項及び係数の総称である。
Figure JPOXMLDOC01-appb-T000010
 係数は、「説明変数値が1点違うと、Zスコアが何点異なるか」を表している。係数の値が大きいほど、その係数に対応する指標すなわち原変数の影響が大きく評価されていることになる。
 表3の例では、債務償還年数と自己資本比率が、影響の大きな指標であることがわかる。このように、本実施形態によれば、指標値(原変数値)から算出された説明変数値に対するパラメータの値から、当該指標の影響の大きさをすぐに読み取ることができる。
 表4は、本実施形態で得られた信用評価モデルを用いて、ある企業(A社とする)の信用評価を実施した結果を示したものである。
Figure JPOXMLDOC01-appb-T000011
 表4における「パラメータ推定値」は、表3に既に示したものである。「説明変数値」は、A社の指標値から上述の方法により算出された説明変数値である。「スコア寄与」は、各指標に対するパラメータと説明変数値の積である。定数項と、全ての指標についてのスコア寄与との和が、A社のZスコアとなる。A社の推定PDは、Zスコアから算出することができる。推定PDとは、Zスコアに基づく推定デフォルト率のことである。
 図6は、A社に対する各指標の説明変数値を示したグラフである。このグラフから、A社は、棚卸資産回転日数に問題がある可能性が見てとれる。このように、本実施形態では、最終的な評価だけでなく、各指標による評価も容易に把握でき、それらを比較することもできる。
 また、連続的な指標である自己資本比率について主に説明したが、カテゴリカルな指標についても同様に、カテゴリーごとにデフォルトサンプル数と非デフォルトサンプル数を集計することにより、カテゴリーごとの推定デフォルト率を得ることができる。欠損値や特異値(指標の分母が0になる場合など)を伴うサンプルについても、同様な方法により、そうしたサンプルの推定デフォルト率を得ることができる。さらに、2つの指標のクロス表からデフォルト率を算出し、交差変数を作成することもできる。
 [参考例]
 以下に、通常の信用評価モデルによる評価結果の例を示す。通常の信用評価モデルでは、原変数の値をそのまま説明変数値とするか、又は原変数の値を対数変換した値を説明変数値とすることが多い。表5は、通常の信用評価モデルで企業を評価した結果を示している。
Figure JPOXMLDOC01-appb-T000012
 表5の「説明変数値」は、指標値そのものである。ただし、売上高及び棚卸資産回転日数について対数変換を行っている。「スコア寄与」とは、各指標に対するパラメータと説明変数値との積である。
 指標値の水準は指標毎に大きく異なるため、表5のパラメータを見ただけでは、どの指標が重視されているのか分からない。また、スコア寄与が高い指標があったとしても、「指標値」が良い値であるからなのか、パラメータが大きい(重視されている)からなのかが分からない。例えば、「売上高・対数」のスコア寄与が比較的大きいが、これは売上高の評価が良いためなのか、売上高の評価は標準的であるものの、重要な指標であるためスコア寄与が大きくなっているからなのかは、すぐには峻別できない。このように、通常の信用評価モデルの場合は、評価結果の解釈が難しくなる。
 [変形例]
 上述したように、応答確率推定用データ(表2)から、式(7)により原変数スコアが得られ、その原変数スコアから式(8)により説明変数値が得られる。そこで、上記応答確率推定用データに代えて、原変数の値と原変数スコアとの関係を定めた原変数スコア算出用データを用いてもよい。この原変数スコア算出用データは、応答確率推定用データ作成装置1に類似する原変数スコア算出用データ作成装置(不図示)により作成される。原変数スコア算出用データ作成装置は、応答確率推定用データ作成部14に代えて、原変数スコア算出用データ作成部(不図示)を有している。この原変数スコア算出用データ作成部は、原変数の値と原変数スコアとの関係を定めた原変数スコア算出用データを作成する。
 続いて、原変数スコア算出用データは、説明変数値算出装置2内の応答確率推定用データ取得部22に代わる原変数スコア算出用データ取得部(不図示)により取得される。そして、原変数スコア算出部26が原変数スコア算出用データを用いて原変数スコアを算出する。
 あるいは、上記応答確率推定用データに代えて、原変数の値と説明変数値との関係を定めた説明変数値算出用データを用いてもよい。この説明変数値算出用データは、応答確率推定用データ作成装置1に類似する説明変数値算出用データ作成装置(不図示)により作成される。説明変数値算出用データ作成装置は、応答確率推定用データ作成部14に代えて、説明変数値算出用データ作成部(不図示)を有している。この説明変数値算出用データ作成部は、原変数の値と説明変数値との関係を定めた説明変数値算出用データを作成する。
 続いて、説明変数値算出用データは、説明変数値算出装置2内の応答確率推定用データ取得部22に代わる説明変数値算出用データ取得部(不図示)により取得される。この場合、原変数スコア算出部26は設けられておらず、説明変数値算出部28が説明変数値算出用データを用いて説明変数値を算出する。
 [第2の実施形態: 近似式を用いる場合]
 本実施形態では、原変数値から推定デフォルト率p を算出するにあたり、原変数値と推定デフォルト率p との関係を表す近似式を用いる。
 近似式の構築方法は様々なものが考えられるが、本実施形態では、区分線形回帰(segmented linear regression)を用いる。区分線形回帰とは、原変数の存在範囲をいくつかの区間に分割し、各区間内で原変数と推定デフォルト率との関係を線形式で近似する方法である。財務指標などの原変数の値と推定デフォルト率との関係は複雑であるため、単純な線形回帰では誤差が非常に大きくなることが多いが、区分線形回帰を用いることにより近似精度の向上が期待できる。
 図7は、原変数の一つである有利子負債利子率について、区分線形回帰によって原変数の値と推定デフォルト率との関係を表す近似折線グラフである。四角形で示した各点は、原変数を離散化して算出した推定デフォルト率を示している。また、実線は、区分線形回帰によって得られた近似折線である。この近似折線を用いて推定デフォルト率を算出することにより、連続的な推定デフォルト率が得られる。その結果、連続的な説明変数値が得られる。
 表6は、有利子負債利子率と推定デフォルト率との関係を表す近似式を、区分線形回帰によって計算した例である。
Figure JPOXMLDOC01-appb-T000013
 区分線形回帰では、表6に示したように、各区間の閾値(原変数の値の最大値及び最小値)と、各区間の傾き及び切片の情報が得られる。傾き及び切片を関数のパラメータとも呼ぶ。そして、閾値と関数のパラメータから、各区間の推定デフォルト率の最大値及び最小値が得られる。この推定デフォルト率の最大値及び最小値を、式(7)により関数Fの逆関数F-1を用いて変換することにより、原変数スコアの最大値及び最小値が得られる。さらに、式(8)により原変数スコアの最大値及び最小値を一次式で変換することにより、説明変数値の最大値及び最小値が得られる。なお、表6においては、原変数スコアの最大値及び最小値を省略している。
 表6のうち、「区間No.」と「有利子負債利子率」と「関数のパラメータ」とからなるデータが、本実施形態における応答確率推定用データである。この応答確率推定用データは、原変数である「有利子負債利子率」の値と、推定デフォルト率との関係を定めたものである。応答確率推定用データは、第1の実施形態と同様に、応答確率推定用データ作成装置1により作成される(図1及び図3)。
 本実施形態における説明変数値の算出も、図5に示したような流れで行われる。すなわち、ステップS201にて上記応答確率推定用データが読み込まれる。ステップS202では、モデル構築用データ(表1)が読み込まれる。ステップS203では、上記応答確率推定用データと、モデル構築用データとから、各サンプルの原変数の実現値が上記応答確率推定用データどの区間に含まれるかが読み取られる。続いて、該当する区間の関数のパラメータが読み取られる。同ステップではさらに、推定デフォルト率が次式により算出される。
  (推定デフォルト率)=(傾き)×(原変数の実現値)+(切片)
 ステップS204では、式(7)により原変数スコアが算出される。ステップS205では、式(8)により説明変数値が算出される。
 有利子負債がゼロの場合、有利子負債利子率を算出することができない。また、有利子負債利子率が欠損値である場合もある。従来のモデル構築では、説明変数を連続変数とする場合には、欠損値等のサンプルには「最悪値を割り当てる」といったアドホックな対応がとられていた。
 このような有利子負債利子率の実現値を得ることができないサンプルについても、本実施形態では、実施形態1と同様に、非デフォルトサンプルとデフォルトサンプルを数え上げることによってそれらのサンプルの推定デフォルト率を算出し、その推定デフォルト率から説明変数値を算出する。このように、有利子負債利子率の実現値を得ることができないサンプルについても、通常のサンプルと同じ考え方で推定デフォルト率に見合った説明変数値が得られるため、統計モデルの精度向上が期待できる。
 有利子負債利子率以外の指標も上述と同様に説明変数値を算出し、それらを説明変数、デフォルトフラグを応答変数としてパラメータ(定数項及び係数)の推定を行うことで、連続的な説明変数を持つ信用評価モデルを構築することができる(ステップS206)。連続変数でモデルを構築した場合にも、離散化変数の場合と同様に指標別の評価等を実施することができる。
 近似式を得るための方法として、区分線形回帰に限らず、任意の方法を用いることができる。例えば、多項式回帰、対数回帰、B-スプラインが挙げられる。
 また、指標の分母が正の領域ではB-スプライン、分母が負の領域では分母と分子の指標のクロス集計表で推定デフォルト率を与えることも可能である。このように、説明変数値算出を様々な方法で行うことができる。
 本実施形態においても、応答確率推定用データに代えて、原変数の値と原変数スコアとの関係を定めた原変数スコア算出用データを用いてもよい。あるいは、応答確率推定用データに代えて、原変数の値と説明変数値との関係を定めた説明変数値算出用データを用いてもよい。
 [第3の実施形態: プロビット回帰による信用評価モデルの構築]
 プロビット回帰は、ロジスティック回帰と同様に、信用評価モデルの構築に良く用いられる手法であり、説明変数とデフォルト率との関係を以下の式で表現する。
Figure JPOXMLDOC01-appb-M000014
ただし、Φは、標準正規分布の分布関数である。このΦは、上記第1の実施形態における関数Fである。そして、関数Φの逆関数Φ-1を用いて式(7)により原変数スコアを算出することができる。
 本実施形態は、関数Fを除いて上記第1の実施形態と同様である。
 パラメータ推定に用いる統計分析手法と指標スコア算出時に用いる分布関数は必ずしも特定の組み合わせに限られるものではない。例えば、説明変数値の算出にあたって標準正規分布の分布関数を用い、得られた説明変数値を用いてロジスティック回帰分析でパラメータを推定することも可能である。
 [第4の実施形態: 業種別に信用評価モデルを構築]
 業種によって財務上の特徴は異なるため、信用評価の実務では業種別に信用評価モデルを構築することがしばしば行われる。本実施形態では、業種別に信用評価モデルを構築する。
 まずステップS101において、モデル構築用データが読み込まれる。このときのモデル構築用データは、表1に示しているように、「業種」という情報をも含んでいる。そして、ステップS102において、変数の値と応答確率の推定値(推定デフォルト率)との関係を表す応答確率推定用データを業種毎に作成することができる。例えば、区分線形回帰を用いる場合は、表6のようなテーブルが、業種毎に作られることとなる。そして、ステップS201~S205を業種毎に行った上で、ステップS206において、業種別の信用評価モデルを構築することができる。
 なお、業種はセグメント情報の一種である。セグメント情報とは、統計モデルの分析対象である母集団を分割する際に参照される情報である。セグメント情報に基づいて母集団を分割して得られる各々の集団をセグメントと呼ぶ。信用評価モデルの構築では、本実施形態のように、財務的な特徴を共有すると考えられるいくつかのセグメントに母集団を分割し、セグメント毎にモデルを構築することがしばしば行われる。
 [効果]
 上記のように算出された説明変数値を用いて信用評価モデルを構築することにより、評価プロセスが非常に分かり易く、かつ精度の高いモデルを構築することができる。また、算出された説明変数値は、全ての指標で「単一指標で評価した信用力の絶対水準」という共通の意味を持つため、指標毎の評価の高低が容易に把握できるとともに、指標ごとの評価の比較も行える。
 さらに、第4の実施形態のように、業種別にモデル化する場合には、異なる業種間で指標別の評価を比較することができる。例えば、売上高営業利益率の水準は業種によって異なるため、「売上高営業利益率が11%の小売業のA社」と、「同17%のサービス業のB社」とで、どちらが信用力が高いと考えられるかはすぐには分からない。これに対し、本発明によって得られる説明変数の値は、原変数の値から推定したデフォルト率の水準を表わしているため、異なる業種間であっても比較が可能である。先程の例では、売上高営業利益率に対応する説明変数の値を両社で比較することにより、売上高営業利益率という視点から見た場合、どちらの信用力が高いと考えられるか、という疑問に容易に答えることができる。
 信用力と指標値が単調でない指標でも、問題なく統計モデルに取り入れることができる。例えば、指標によっては、大きすぎても小さすぎても信用力が低く(デフォルト率が高く)なるものがある。第1もしくは第2の実施形態によれば、こうした指標は、指標値が大きい場合や小さい場合に説明変数が小さい値となり、中庸な場合に大きい値となる。その結果、説明変数の値と信用力の関係は単調になり、様々な統計モデルに取り込みやすくなる。
 また、指標値からの推定デフォルト率の算出方法は特に限定されないことから、柔軟に指標を加工することが可能である。先に述べたように、2つ以上の指標のクロス集計表を用いて交差変数を作成したり、指標の分母の値に応じて、推定デフォルト率の算出方法を異なるものとしたりすることが可能である。
 原変数スコア算出時に用いる分布関数Fとして、モデル構築に用いる統計分析手法に合わせた確率分布を用いることにより、モデル精度の向上が見込まれる。一般に統計モデルでは、説明変数と応答変数が一定の関係性を満たすことを仮定しており、両者の関係がその仮定を満たさなければ、精度の高いモデルは得られない。例えば、ロジスティック回帰分析によるデフォルト率のモデル化では、デフォルト率のロジットが、説明変数の一次式で表されることが仮定されている(式(3))。モデル構築に用いる統計分析手法に合わせた確率分布を用いることにより、説明変数ごとにモデルの仮定が満たされる説明変数値が得られるため、精度向上が見込まれる。プロビットモデルによるデフォルト率のモデル化では、関数Fとして標準正規分布の分布関数を用いることにより、モデルの仮定に適合した説明変数値が得られる。
 一つの統計モデルの中で、離散化によって得られる離散化変数と、近似式を用いて得られる連続変数の両者を用いることもできる。説明変数が離散化変数であるか連続変数であるかに関わらず、算出される説明変数値の意味が同じであるため、説明変数値間での比較評価が可能である。
 [その他]
 本明細書に開示した実施形態は、装置としての側面だけではなく、方法としての側面及びコンピュータプログラムとしての側面をも有している。
 応答確率推定用データは、応答確率推定用データ作成装置1内の補助記憶装置56又は外部の任意の記憶装置に記憶することができる。原変数スコア算出用データ及び説明変数値算出用データについても同様である。
 説明変数値算出装置2により算出された説明変数値は、説明変数値算出装置2内の補助記憶装置又は外部の任意の記憶装置に記憶することができる。
 応答確率推定用データ作成装置1と説明変数値算出装置2とを一体の装置としてもよい。
 ステップS101において読み込まれるモデル構築用データと、ステップS202において読み込まれるモデル構築用データとが異なっていてもよい。
 原変数スコアを一次式で変換することなく、そのまま説明変数値としてもよい。
 本発明は、式(1)及び(2)で表されるような統計モデルだけでなく、応答変数が2値変数である統計モデルに対して、幅広く適用することができる。
 以上、本発明の実施の形態につき述べたが、本発明は既述の実施の形態に限定されるものではなく、本発明の技術的思想に基づいて各種の変形及び変更が可能である。
1   応答確率推定用データ装置
12  モデル構築用データ取得部
14  応答確率推定用データ作成部
 
2   説明変数値算出装置
22  応答確率推定用データ取得部
24  原変数データ取得部
26  原変数スコア算出部
28  説明変数値算出部
 
51  CPU
52  インタフェース装置
53  表示装置
54  入力装置
55  ドライブ装置
56  補助記憶装置
57  メモリ装置
58  バス
59  記録媒体
 

Claims (23)

  1.  応答変数が2値変数である統計モデルにおける説明変数値を、原変数の値から算出するプログラムであって、
     前記原変数の値と、前記応答変数が特定の値をとる確率である応答確率の推定値との関係を定めた応答確率推定用データを取得する応答確率推定用データ取得ステップと、
     前記原変数の実現値を含む原変数データを取得する原変数データ取得ステップと、
     前記原変数の実現値と、前記応答確率推定用データとを用いて、前記原変数の実現値から前記応答確率の推定値を算出し、該推定値を所定の確率分布の分布関数の逆関数に代入することによって得られる値である原変数スコアを説明変数値として算出する説明変数値算出ステップと
     をコンピュータに実行させるプログラム。
  2.  前記応答確率推定用データが、前記関係を表す連続的な関数のパラメータを含むものである、請求項1に記載のプログラム。
  3.  前記応答確率推定用データが、前記原変数の値の存在範囲を離散化することにより得られる複数の階級と、前記複数の階級の各々に関係付けられた応答確率の推定値とを含むものである、請求項1に記載のプログラム。
  4.  前記応答確率推定用データが、セグメント毎に、前記原変数の値と前記応答確率の推定値との関係を定めたものであり、
     前記原変数データが、セグメント情報をさらに含むものであり、
     前記説明変数値算出ステップが、前記セグメント情報と前記原変数の実現値と前記応答確率推定用データとを用いて、前記応答確率の推定値を算出し、該推定値を前記所定の確率分布の分布関数の逆関数に代入することによって得られる値である原変数スコアを説明変数値として算出するステップである、請求項1~3のいずれか一項に記載のプログラム。
  5.  応答変数が2値変数である統計モデルにおける説明変数値を、原変数の値から算出するプログラムであって、
     前記原変数の値と原変数スコアとの関係を定めた原変数スコア算出用データを取得する原変数スコア算出用データ取得ステップであって、前記原変数スコアは、前記原変数の値から推定される、前記応答変数が特定の値をとる確率である応答確率を、所定の確率分布の分布関数の逆関数に代入することによって算出されたものである、原変数スコア算出用データ取得ステップと、
     前記原変数の実現値を含む原変数データを取得する原変数データ取得ステップと、
     前記原変数の実現値と、前記原変数スコア算出用データとを用いて、前記原変数の実現値から得られる原変数スコアを説明変数値として算出する説明変数値算出ステップと
     をコンピュータに実行させるプログラム。
  6.  前記原変数スコア算出用データが、前記関係を表す連続的な関数のパラメータを含むものである、請求項5に記載のプログラム。
  7.  前記原変数スコア算出用データが、前記原変数の値の存在範囲を離散化することにより得られる複数の階級と、前記複数の階級の各々に関係付けられた原変数スコアとを含むものである、請求項5に記載のプログラム。
  8.  前記原変数スコア算出用データが、セグメント毎に、前記原変数の値と前記原変数スコアとの関係を定めたものであり、
     前記原変数データが、セグメント情報をさらに含むものであり、
     前記説明変数値算出ステップが、前記セグメント情報と前記原変数の実現値と前記原変数スコア算出用データとを用いて得られる前記原変数スコアを説明変数値として算出するステップである、請求項5~7のいずれか一項に記載のプログラム。
  9.  前記説明変数値算出ステップが、前記原変数スコアを一次式で変換した値を説明変数値として算出するステップである、請求項1~8のいずれか一項に記載のプログラム。
  10.  応答変数が2値変数である統計モデルにおける説明変数値を、原変数の値から算出するプログラムであって、
     前記原変数の値と説明変数値との関係を定めた説明変数値算出用データを取得する説明変数値算出用データ取得ステップであって、前記説明変数値は、前記原変数の値から推定される、前記応答変数が特定の値をとる確率である応答確率を、所定の確率分布の分布関数の逆関数に代入することによって算出される原変数スコアを、一次式で変換することによって算出されたものである、説明変数値算出用データ取得ステップと、
     前記原変数の実現値を含む原変数データを取得する原変数データ取得ステップと、
     前記原変数の実現値と、前記説明変数値算出用データとを用いて、前記原変数の実現値から説明変数値を算出する説明変数値算出ステップと
     をコンピュータに実行させるプログラム。
  11.  前記説明変数値算出用データが、前記関係を表す連続的な関数のパラメータを含むものである、請求項10に記載のプログラム。
  12.  前記説明変数値算出用データが、前記原変数の値の存在範囲を離散化することにより得られる複数の階級と、前記複数の階級の各々に関係付けられた説明変数値とを含むものである、請求項10に記載のプログラム。
  13.  前記説明変数値算出用データが、セグメント毎に、前記原変数の値と前記説明変数値との関係を定めたものであり、
     前記原変数データが、セグメント情報をさらに含むものであり、
     前記説明変数値算出ステップが、前記セグメント情報と前記原変数の実現値と前記説明変数値算出用データとを用いて前記説明変数値を算出するステップである、請求項10~12のいずれか一項に記載のプログラム。
  14.  前記所定の確率分布がロジスティック分布である、請求項1~13のいずれか一項に記載のプログラム。
  15.  前記所定の確率分布が標準正規分布である、請求項1~13のいずれか一項に記載のプログラム。
  16.  応答変数が2値変数である統計モデルにおける説明変数値を、原変数の値から算出する装置であって、
     前記原変数の値と、前記応答変数が特定の値をとる確率である応答確率の推定値との関係を定めた応答確率推定用データを取得する応答確率推定用データ取得部と、
     前記原変数の実現値を含む原変数データを取得する原変数データ取得部と、
     前記原変数の実現値と、前記応答確率推定用データとを用いて、前記原変数の実現値から前記応答確率の推定値を算出し、該推定値を所定の確率分布の分布関数の逆関数に代入することによって得られる値である原変数スコアを説明変数値として算出する説明変数値算出部と
     を備えた装置。
  17.  応答変数が2値変数である統計モデルにおける説明変数値を、原変数の値から算出する装置であって、
     前記原変数の値と原変数スコアとの関係を定めた原変数スコア算出用データを取得する原変数スコア算出用データ取得部であって、前記原変数スコアは、前記原変数の値から推定される、前記応答変数が特定の値をとる確率である応答確率を、所定の確率分布の分布関数の逆関数に代入することによって算出されたものである、原変数スコア算出用データ取得部と、
     前記原変数の実現値を含む原変数データを取得する原変数データ取得部と、
     前記原変数の実現値と、前記原変数スコア算出用データとを用いて、前記原変数の実現値から得られる原変数スコアを説明変数値として算出する説明変数値算出部と
     を備えた装置。
  18.  前記説明変数値算出部が、前記原変数スコアを一次式で変換した値を説明変数値として算出する、請求項16又は17に記載の装置。
  19.  応答変数が2値変数である統計モデルにおける説明変数値を、原変数の値から算出する装置であって、
     前記原変数の値と説明変数値との関係を定めた説明変数値算出用データを取得する説明変数値算出用データ取得部であって、前記説明変数値は、前記原変数の値から推定される、前記応答変数が特定の値をとる確率である応答確率を、所定の確率分布の分布関数の逆関数に代入することによって算出される原変数スコアを、一次式で変換することによって算出されたものである、説明変数値算出用データ取得部と、
     前記原変数の実現値を含む原変数データを取得する原変数データ取得部と、
     前記原変数の実現値と、前記説明変数値算出用データとを用いて、前記原変数の実現値から説明変数値を算出する説明変数値算出部と
     を備えた装置。
  20.  応答変数が2値変数である統計モデルにおける説明変数値を、原変数の値から算出する方法であって、
     前記原変数の値と、前記応答変数が特定の値をとる確率である応答確率の推定値との関係を定めた応答確率推定用データを取得する応答確率推定用データ取得ステップと、
     前記原変数の実現値を含む原変数データを取得する原変数データ取得ステップと、
     前記原変数の実現値と、前記応答確率推定用データとを用いて、前記原変数の実現値から前記応答確率の推定値を算出し、該推定値を所定の確率分布の分布関数の逆関数に代入することによって得られる値である原変数スコアを説明変数値として算出する説明変数値ステップと
     を含む方法。
  21.  応答変数が2値変数である統計モデルにおける説明変数値を、原変数の値から算出する方法であって、
     前記原変数の値と原変数スコアとの関係を定めた原変数スコア算出用データを取得する原変数スコア算出用データ取得ステップであって、前記原変数スコアは、前記原変数の値から推定される、前記応答変数が特定の値をとる確率である応答確率を、所定の確率分布の分布関数の逆関数に代入することによって算出されたものである、原変数スコア算出用データ取得ステップと、
     前記原変数の実現値を含む原変数データを取得する原変数データ取得ステップと、
     前記原変数の実現値と、前記原変数スコア算出用データとを用いて、前記原変数の実現値から得られる原変数スコアを説明変数値として算出する説明変数値算出ステップと
     を含む方法。
  22.  前記説明変数値算出ステップが、前記原変数スコアを一次式で変換した値を説明変数値として算出するステップである、請求項20又は21に記載の方法。
  23.  応答変数が2値変数である統計モデルにおける説明変数値を、原変数の値から算出する方法であって、
     前記原変数の値と説明変数値との関係を定めた説明変数値算出用データを取得する説明変数値算出用データ取得ステップであって、前記説明変数値は、前記原変数の値から推定される、前記応答変数が特定の値をとる確率である応答確率を、所定の確率分布の分布関数の逆関数に代入することによって算出される原変数スコアを、一次式で変換することによって算出されたものである、説明変数値算出用データ取得ステップと、
     前記原変数の実現値を含む原変数データを取得する原変数データ取得ステップと、
     前記原変数の実現値と、前記説明変数値算出用データとを用いて、前記原変数の実現値から説明変数値を算出する説明変数値算出ステップと
     を含む方法。
PCT/JP2016/081072 2015-10-30 2016-10-20 説明変数値を算出する装置、方法及びプログラム WO2017073446A1 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
US15/771,790 US20190050373A1 (en) 2015-10-30 2016-10-20 Apparatus, method, and program for calculating explanatory variable values

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2015214654A JP6063544B1 (ja) 2015-10-30 2015-10-30 説明変数値を算出する装置、方法及びプログラム
JP2015-214654 2015-10-30

Publications (1)

Publication Number Publication Date
WO2017073446A1 true WO2017073446A1 (ja) 2017-05-04

Family

ID=57800081

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2016/081072 WO2017073446A1 (ja) 2015-10-30 2016-10-20 説明変数値を算出する装置、方法及びプログラム

Country Status (3)

Country Link
US (1) US20190050373A1 (ja)
JP (1) JP6063544B1 (ja)
WO (1) WO2017073446A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019073557A1 (ja) * 2017-10-11 2019-04-18 三菱電機株式会社 サンプルデータ生成装置、サンプルデータ生成方法およびサンプルデータ生成プログラム

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6300251B1 (ja) * 2017-09-25 2018-03-28 株式会社エス・エム・エス 信用格付けシステムおよびプログラム
US11308411B2 (en) 2018-05-04 2022-04-19 Wisconsin Alumni Research Foundation Systems methods and media for automatically identifying entrepreneurial individuals in a population using individual and population level data
CN117808576B (zh) * 2024-01-08 2024-05-28 深度(山东)数字科技集团有限公司 一种用于企业融资额度估算的商业汇票大数据分析方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
TATSUYA KURAMOTO ET AL.: "Fault-prone Module Prediction Across Software Development Projects", THE TRANSACTIONS OF THE INSTITUTE OF ELECTRONICS, INFORMATION AND COMMUNICATION ENGINEERS, vol. J95-D, no. 3, 1 March 2012 (2012-03-01), pages 425 - 436, ISSN: 1880-4535 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019073557A1 (ja) * 2017-10-11 2019-04-18 三菱電機株式会社 サンプルデータ生成装置、サンプルデータ生成方法およびサンプルデータ生成プログラム

Also Published As

Publication number Publication date
JP6063544B1 (ja) 2017-01-18
JP2017084273A (ja) 2017-05-18
US20190050373A1 (en) 2019-02-14

Similar Documents

Publication Publication Date Title
Olive et al. Multiple linear regression
AU2021232839B2 (en) Updating Attribute Data Structures to Indicate Trends in Attribute Data Provided to Automated Modelling Systems
Arribas-Gil et al. Shape outlier detection and visualization for functional data: the outliergram
Chen et al. Seasonal ARIMA forecasting of inbound air travel arrivals to Taiwan
Siskos et al. New trends in aggregation-disaggregation approaches
WO2017073446A1 (ja) 説明変数値を算出する装置、方法及びプログラム
Karas et al. Predicting the bankruptcy of construction companies: a CART-based model
WO2018124170A1 (ja) 説明変数を選択する装置、方法及びプログラム
Ramezanian et al. Forecasting health expenditures in Iran using the ARIMA model (2016-2020)
CN113449046A (zh) 基于企业知识图谱的模型训练方法、系统及相关装置
Popli et al. Educational attainment and wage inequality in Turkey
Momparler et al. Banking failure prediction: a boosting classification tree approach
Gan et al. Fat-tailed regression modeling with spliced distributions
CN111179055B (zh) 授信额度调整方法、装置和电子设备
Lohmann et al. Nonlinear relationships and their effect on the bankruptcy prediction
JP6069460B1 (ja) 説明変数を選択する装置、方法及びプログラム
Albuquerque et al. Geographically weighted logistic regression applied to credit scoring models
Mansolf et al. Case diagnostics for factor analysis of ordered categorical data with applications to person-fit measurement
Justice et al. Using fiscal indicator systems to predict municipal bankruptcies
Hwang et al. A two-stage probit model for predicting recovery rates
Văidean On financial performance and capital structure of Romanian companies
Norman et al. Estimating detailed distributions from grouped sociodemographic data:‘get me started in’curve fitting using nonlinear models
Benito et al. Assessing the importance of the choice threshold in quantifying market risk under the POT approach (EVT)
KR102053595B1 (ko) 토픽 간 m&a 활성도 생성에 기반한 유망아이템 식별 방법
Vnukova et al. Identifying changes in insurance companies’ competitiveness on the travel services market

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 16859676

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 16859676

Country of ref document: EP

Kind code of ref document: A1